Специалисты МФТИ совместно с зарубежными коллегами создали систему компьютерного стереозрения, позволяющую оценивать расстояние до объектов с помощью видеокамеры без использования дополнительных сенсоров. Ее главное преимущество — стабильная работа в сложных условиях, например в тумане или густой листве.
Стереосистемы роботов и беспилотных автомобилей строят трехмерную карту мира подобно зрительному восприятию человека. Только вместо глаз они используют камеры, а вместо мозга — алгоритмы.
Для повышения точности ученые использовали «наставника» — модель Depth Anything V2, способную оценивать относительную глубину по изображению с одной камеры. Она не измеряет расстояния в метрах, но почти безошибочно определяет, какие объекты находятся ближе, а какие дальше, учитывая тени, перспективу и перекрытия. Алгоритм обучения отбирает только те предсказания стереосистемы, которые совпадают с подсказками «наставника», и на их основе повышает точность нейросети.
По мнению эксперта рынка НТИ «Нейронет», разработка может найти широкое применение — от беспилотного транспорта, сельского хозяйства, складской робототехники до систем мониторинга, безопасности и БПЛА.
Эксперт в области ИИ «Университета 2035» Ярослав Селиверстов добавил, что такое стереозрение снижает зависимость отрасли от дорогостоящих лидаров и трудоемкой разметки данных. При этом замдиректора Центра компетенций НТИ «Технологии доверенного взаимодействия на базе ТУСУР» Руслан Пермяков отметил, что несмотря на это, решение не не устраняет полностью потребность в метрически точных источниках данных и остается чувствительным к особенностям обучающих выборок.
Свежие комментарии