Машина зрения

Источник: Известия
Российские специалисты создали уникального робота-поводыря, рассказали «Известиям» авторы проекта. Кроме машинного зрения устройство использует языковую модель для чтения указателей, надписей на упаковках в магазинах. По словам разработчиков, уже собран прототип и протестированы все основные механики. Целевая аудитория — люди с нарушениями зрения. Эксперты полагают, что задумка выглядит интересной, но для ее реализации понадобится гораздо больше средств, чем планируют создатели.

Специалисты Невиномысского технологического института (филиал Северо-Кавказского федерального университета), разработали уникального робота-поводыря. Об этом «Известиям» рассказали авторы проекта.

— Робот предназначен для помощи людям с ограниченными возможностями — с нарушениями зрения. Он представляет собой решение, способное анализировать визуальные данные, полученные от машинного зрения, и использовать языковые модели GPT для интерпретации и генерации соответствующих команд или предупреждений, — сообщил «Известиям» автор проекта Богдан Колесник.

Робот представляет собой подвижную платформу высотой около 1 м на шести колесах. Сверху расположено несколько камер, благодаря которым он может «видеть» мир вокруг себя, и динамик, предназначенный для коммуникации с человеком. Незрячий человек ведет робота на специальном «поводке».

— На данный момент использование языковых моделей GPT и машинного зрения — совершенно точно перспективное решение, поскольку это очевидный тренд развития IT-сферы и микроэлектроники. Единственное, если говорить конкретно про такого робота-поводыря, то здесь нужно понимать, что это должна быть система, работающая в режиме реального времени, которая тут же реагирует на события, препятствия и объекты, — сообщил эксперт рынка НТИ Нейронет, директор Лаборатории «Сенсор-Тех» Денис Кулешов.

Языковые модели GPT работают с существенной задержкой — 5–10 секунд, которые требуются для формирования ответа или интерпретации ситуации, добавил он. Поэтому основная сложность сейчас заключается в том, что подобный подход достаточно сложно будет применить в роботе-поводыре, поскольку это должна быть система реального времени, и все реакции должны работать незамедлительно, сказал Денис Кулешов.

Автор: Danil Serbin