Новый МИТ-разработанная методика позволяет роботам быстро идентифицировать объекты, скрытые в трехмерном облаке данных, напоминает, как некоторые люди могут найти смысл в густо рисунком «волшебный глаз» изображения, если они видят его в нужное образом.

Роботы, как правило, «видит» свое окружение через сенсоры, которые собирают и переводить визуальную сцену в матрицу точек. Подумайте о мире, ну, «Матрица», за исключением того, что 1S и 0s видел вымышленный персонаж Нео заменяются точек-много точек — моделей и плотностей наметить объекты в той или иной сцене.

Обычные методы, которые пытаются выделить объекты из таких облаков точек, или облака точек, можно сделать с любой скоростью и точностью, но не оба.

С их новой техникой, исследователи говорят, что робот может точно выделить объект, такой как небольшое животное, что в противном случае скрыты в густом облаке точек, через несколько секунд после получения визуальных данных. Команда говорит, что методика может быть использована для улучшения множество ситуаций, в которых восприятие машины должно быть как быстрый и точный, в том числе водителя машины и робототехнические помощники на заводе и дома.

«Удивительная вещь об этой работе, если я попрошу тебя найти кролик в это облако из тысячи точек, нет никакого способа, вы могли бы сделать это», — говорит Лука Карлоне, доцент кафедры аэронавтики и астронавтики и членом МИТ лаборатории информация и решение системы (крышками). «Но наш алгоритм способен видеть объект через весь этот беспорядок. Так мы добрались до уровня сверхчеловеческой производительности в локализации объектов».

Карлоне и аспирант Хэн Ян будут предоставлять сведения о технике позже в этом месяце в робототехника: Наука и конференц-систем в Германии.

«В противном случае, не зная»

В настоящее время роботы попытка идентификации объектов в виде облака точек путем сравнения объект шаблона-3-х мерная точка представления объекта, таких как кролик, … с точки представительства облако реальном мире, что может содержать этот объект. Изображения шаблона включает в себя «функции», или наборы точек, которые указывают на характерные изгибы или углы этого объекта, такого кролика уха или хвост. Существующие алгоритмы первого экстракта похожие объекты из реальной жизни, облако точек, а затем попытаться соответствовать те характеристики и особенности шаблона, и, в конечном счете, повернуть и выровнять объекты в шаблон, чтобы определить, если облако точек содержит объект в вопрос.

Но данные облака точек, что потоки в сенсорном неизменно включает в себя ошибки, в виде точек, что находятся в неправильном положении или неправильно расположенными, которые могут существенно затруднить процесс извлечения объекта и соответствия. Как следствие, роботы могут делать огромное количество неправильных ассоциаций, или то, что исследователи называют «останцы» между облаками точек, и в конечном счете объекты неправильное или совсем пропустить их.

Карлоне говорит государство-оф-искусство алгоритмов, способных отсеивать плохие ассоциации, от хорошо, как только были согласованы, но они делают это в «экспоненциальное время», подразумевая, что даже кластер переработки тяжелых компьютеры, просеивая сквозь плотные облака точек данных с существующими алгоритмами, не смогут решить проблему в разумные сроки. Такие методы, в то время как точный, являются невыполнимыми для анализа больших, реальных наборов данных, содержащих плотные облака точек.

Другие алгоритмы, которые могут быстро идентифицировать объекты и ассоциации, не так поспешно, создавая огромное количество выпадающих или misdetections в процессе, не сознавая эти ошибки.

«Это ужасно, если это работает на самостоятельного вождения автомобиля, или каких-либо безопасности критически важных приложений,» говорит Карлоне. «В противном случае, не зная, что ты не самое худшее алгоритм может сделать».

Непринужденный вид

Ян и Карлоны вместо того, чтобы разработать технику, которая чернослива от выбросов в «полиномиальное время», подразумевая, что он может делать это быстро, даже для более плотного облака точек. Таким образом, методика позволяет быстро и точно идентифицировать объекты, скрытые в загроможденной сцены.

Исследователи сначала использовали обычные методы извлечения характеристик объектов шаблона из облака точек. Затем они разработали трехступенчатый процесс, чтобы соответствовать размер, положение и ориентацию объекта в виде облака точек с объектом шаблона, при одновременном выявлении хорошее от плохого характеристика организаций.

Команда разработала «схема адаптивного алгоритма голосования», чтобы сократить выбросы и соответствия размера и положения объекта. Для размера, алгоритм делает ассоциации между шаблоном и имеется облако точек, а затем сравнивает относительные расстояния между объектами в шаблоне и соответствующих объектов в облаке точек. Если, скажем, расстояние между двумя объектами в облако точек в пять раз, что соответствующего пункта в шаблоне, алгоритм присваивает «голос» к гипотезе, что объект в пять раз больше, чем объект шаблон.

Алгоритм делает это для каждой функции ассоциации. Затем алгоритм выбирает тех организаций, которые подпадают под гипотезу размер с наибольшим количеством голосов, и указывает в качестве правильного объединения, а избавляемся от остальных. Таким образом, метод одновременно показывает правильные ассоциации и относительный размер объекта в лице этих организаций. Тот же процесс используется для определения положения объекта.

Исследователи разработали отдельный алгоритм вращения, который считает ориентацию объекта шаблон в трехмерном пространстве.

Сделать это невероятно сложные вычислительные задачи. Представьте себе, держа кружку и пытаясь наклонить ее так, чтобы соответствовать размытое изображение чего-то, что может быть та же самая кружка. Есть любое количество углов вы могли опрокинуть эту кружку, и каждый из этих углов имеет определенную вероятность одинаковых размытых изображения.

Существующие методы решения этой проблемы путем рассмотрения каждого возможного наклона или поворота объекта в качестве «затрат» — чем меньше стоимость, тем больше вероятность, что вращение создает точные соответствия между объектами. Каждое вращение и связанные с этим расходы представлены в топографическая карта рода, состоит из нескольких холмов и долин, с более низких высотах, связанных с более низкой ценой.

Но Карлоне говорит, что это может легко запутать алгоритм, особенно если есть несколько долин и никакого заметного низкой точки, представляющей правда, точного соответствия между конкретным вращения объекта и объекта в виде облака точек. Вместо этого команда разработала «выпуклые релаксации» алгоритм, который упрощает топографической карте, с одной-единственной долины, представляющие оптимальное вращение. Таким образом, алгоритм способен быстро определить ротацию, которая определяет ориентацию объекта в облаке точек.

С их подходом, команда смогла быстро и точно определить три различных объектов, кролика, дракона, и Будды — скрыто в облаках точек увеличения плотности. Они также были в состоянии идентифицировать объекты в реальной жизни сцен, в том числе гостиной, в которой алгоритм быстро удалось обнаружить коробку с хлопьями и бейсбольной кепке.

Карлоне говорит, что за подход способен работать в «полиномиальное время», он может быть легко масштабированы для анализа даже плотные облака точек, напоминающих сложность данных датчиков для беспилотных автомобилей, например.

«Навигация, совместного производства домашних роботов, поиск и спасение, и самостоятельного вождения автомобилей, где мы надеемся добиться эффекта», — говорит Карлоне.

Это исследование было частично поддержана исследовательская лаборатория Армии, Управление военно-морских исследований, и Google заставка программы исследований.

сделать разницу: спонсорские возможности

0 ответы

Ответить

Хотите присоединиться к обсуждению?
Не стесняйтесь вносить свой вклад!

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *