Пару лет назад мы делали интервью с Михаилом Бурцевым из МФТИ — создателем системы разговорного ИИ iPavlov. Очень интересный человек, который в 2015 году удачно скрестил свой талант с программами госфинансирования через «Сбер» и НТИ (АСИ). Все началось с библиотеки DeepPavlov, которую в итоге скачали больше миллиона раз. Затем проект расползся по соседним нишам, причем мне кажется, что скоро появится целая корпорация iPavlov с целым пакетом ИИ-продуктов федерального масштаба. Насколько это хорошо или плохо, не могу сказать. Иногда случается так, что быстрый успех может вскружить голову.
Под катом — интервью с нынешним директором iPavlov Лораном Акопяном про то, какое место российские технологии занимают в мировой ИИ-индустрии, изменится ли что-то из-за сложностей с поставками «железа» и в каком направлении развивается сам iPavlov.
Если все пойдет по плану, самый массовый и функциональный голосовой помощник в стране будет в приложении Госуслуг.
— Михаил Бурцев нам уже рассказывал, с чего все начиналось. Что происходит сейчас?
Как компания iPavlov существует с конца 2020 года. Ранее с 2017 года мы развивались как одноименный open-source-проект Московского физико-технического института (МФТИ). В результате появилась бесплатная библиотека DeepPavlov с открытым исходным кодом, которая занимается обработкой запросов на естественном языке (NLP, natural language processing), благодаря которой iPavlov и стал знаменит как бренд.
Сегодня количество скачиваний этой библиотеки по всему миру перевалило за миллион.
С 2020-го мы продолжаем работать уже в рамках спин-офф-компании НТИ и МФТИ в области искусственного интеллекта, разрабатывая платформенные решения на базе обработки естественного языка, изображений и промышленных данных. Мы делаем продукты для промышленности, медицины и государственных структур. В общей сложности с нашими ИИ-инструментами сегодня взаимодействуют около 1,5 млн человек.
Сейчас у нас три технологические платформы:
— IVA (платформа цифровых помощников);
— EYE (платформа машинного зрения);
— ABI (платформа предиктивной аналитики).
А также две продуктовые гиперплатформы: Smart City и Smart Clinic.
— Где их применяют?
Кейсов множество. Например, наш искусственный интеллект хорошо работает на проектах цифровизации производства. Та же платформа EYE установлена на нескольких крупных заводах. Распознавая изображение, она может, например, контролировать дефекты выпускаемой продукции.
Дефекты можно классифицировать по типу и размеру, а ту продукцию, где дефект трактуется как брак, возвращать обратно, чтобы она не попала клиенту. Это существенная экономия на логистике, учитывая масштаб производства. Клиенты в любом случае вернули бы такой товар, а за доставку пришлось бы заплатить.
И суть тут не только в экономии. С таким инструментом контролер качества не осматривает стальные листы в пыльном цеху, а сидит в офисе, попивает чай, определяя дальнейший путь продукции через визуальный интерфейс и голосовое управление.
Технологии распознавания изображений используют в медицинских системах, например для анализа снимков пациентов. Проекты диагностики по медицинским снимкам и картам делаем на базе национального медицинского центра им. Алмазова.
Система скрининга iPavlov CDSS Rare Diseases Neuroscanner помогает выявлять орфанные (редкие) генетические заболевания у детей до 7 лет: мукополисахаридоз, болезнь Фабри, болезнь Помпе, болезнь Ниманна — Пика тип A/B (ASMD).
Это сокращает среднее время постановки диагноза с 7 до 2 лет и снижает детскую смертность на 50%.
Ниже снимок КТ органов грудной клетки, обработанный модулем для диагностики COVID-19 системы iPavlov CDSS Neuro-Imager:
А еще в рамках программы «Приоритет 2030» совместно с КамАЗом мы разрабатываем грузовые беспилотники. Обкатку системы начнем на трассе М11. За рулем все еще будет сидеть водитель, который выведет автомобиль на магистраль. Но в дальнейшем автомобили будут возить грузы по выделенной полосе полностью автономно с помощью компьютерного зрения, распознавания погодных условий и других технологий. Думаю, что полноценно эта система заработает уже с 2027 года.
— Что касается разработки ИИ в целом, отстаем ли мы от других стран и насколько?
В целом Россия входит в пятерку стран-лидеров. Искусственный интеллект основывается на предыдущих технологических и научных достижениях, и у России их достаточно.
Мировым лидером в области развития ИИ, пожалуй, можно назвать США — как с точки зрения технологий, так и с точки зрения качества моделей. На уровень ниже Китай. Он лидер не столько по качеству технологий, сколько по масштабу цифровизации и количеству внедрений. На мой взгляд, сегодня в Китае максимально цифровое общество. А вот на следующем уровне мы и Европейский союз.
У нас есть отдельные направления, где мы среди лидеров. В частности, у нас очень хорошо цифровизованы банковский сегмент, розница и госуслуги.
Еще одна конкурентная точка — чат-боты и цифровые помощники. Наш ассистент в свое время побил Google DialogFlow в банковском секторе. Многие финансовые корпорации и компании из розничного сектора начали переходить на нашу систему IVA по проектированию цифровых ассистентов, поскольку, в отличие от Google, мы предоставляем им лицензию, по которой заказчик может самостоятельно развивать продукт для своих потребителей.
Кроме того, клиенты могут использовать разработанный нами умный интерфейс, чтобы создавать и редактировать сценарии обслуживания потребителя без знаний программирования (zero-code programming). У конкурентов все это тоже есть, но они сильно ограничивали коммерческий потенциал ИИ и искусственно завышали стоимость его внедрения и развития.
— Влияет ли на это распределение по позициям тот факт, что русский язык сложный?
Это распространенное заблуждение. Дело не в языке. Большинство алгоритмов и моделей, которые разрабатывают для распознавания естественного языка, мультиязыковые. Возможно, бывают некоторые особенности с китайским и корейским. Но для европейских языков — русского, английского и прочих — нет никакой разницы. И нет никаких сложностей с переносом проекта с одного языка на другой.
Например, наш Deep Pavlov работает на огромном количестве языков, больше всего его скачивают в Америке и Китае.
Кроме того, у нас есть проекты внедрения цифровых ассистентов в странах Совета сотрудничества арабских стран Персидского залива (GCC, это ОАЭ, Саудовская Аравия, Катар, Бахрейн и других).
Гораздо большую роль играет объем инвестиций в этот сектор. США и Китай дольше и больше инвестируют, поэтому они на вершине. В США среди крупных компаний настоящая гонка голосовых ассистентов.
— Что-то изменилось с последними событиями? Нам же фактически не поставляют «железо». Будут ли проблемы в секторе машинного обучения?
Для компаний, специализирующихся на технологиях искусственного интеллекта, критично наличие суперкомпьютеров. Но в стране они уже есть. В частности, у одного из наших ключевых акционеров — МФТИ — есть собственный ЦОД, который одно время занимал пятое место в российском рейтинге именно по машинному обучению. И он очень помог нам в становлении компании.
Имеющихся мощностей в принципе на несколько лет хватит. Конечно, объем задач и обрабатываемых данных растет каждый день, что увеличивает нагрузку на вычислительные кластеры. Поэтому в какой-то момент действительно может сложиться ситуация, что темпы внедрения продуктов с машинным обучением замедлятся из-за нехватки вычислительных мощностей. И это принципиальная трудность.
Чтобы компенсировать возможный дефицит — чтобы его в принципе не возникало, — сейчас развивается много механизмов, в том числе параллельный импорт. К сожалению, мы (как компания) мало что можем сделать в этом направлении. В глобальном плане это не наша задача: софтверный бизнес не может быстро построить собственный ЦОД. Но мы видим реальную поддержку государства и его заинтересованность в решении проблемы.
— Но у вас ведь есть «план Б»?
Конкретно мы в неплохом положении, потому что изначально строили бизнес на организации партнерств с заводами, предприятиями городской инфраструктуры, с МФТИ и т. п. Мы работаем с десятью ключевыми партнерами из числа крупных промышленных групп, у которых есть свои ЦОДы. Соответственно, рассчитываем на выделение мощностей с их стороны.
В целом мы видим перспективы в международной кооперации и ставим акценты на страны вышеупомянутого Совета сотрудничества Персидского залива, с которыми у России хорошие отношения. Они вполне готовы опираться на российские софтверные продукты, особенно в области цифровизации и автономного транспорта (V-to-V и V-to-X), в частности для обновления дорожной инфраструктуры.
С той же Саудовской Аравией мы подписали соглашение еще в 2019 году. И сотрудничество продолжается. Мне кажется, выход на мировой рынок не с экспортом, а в роли полноценной международной компании, поможет решить вопрос с вычислительными мощностями для машинного обучения. Если компании есть что предложить и ее продукт действительно значим для B2B или B2G по всему миру, проблема с обучением и размещением данных решаема. Главное — быть специалистом в востребованной области.
— «Иван Павлов» — это что за продукт?
Это будет умный цифровой помощник для обычного потребителя. Любой желающий сможет скачать его из российских магазинов в виде автономного приложения и настроить под себя с помощью нашей платформы IVA (Intelligent Virtual Assistants).
По сути, «Иван Павлов» следует мировому тренду на взаимную интеграцию используемых потребителем приложений и систем. И в отличие от существующих голосовых помощников крупных компаний, у него будет не развлекательный, а функциональный характер. Вместо того чтобы каждый день заходить в несколько социальных сетей, разные государственные сервисы и приложения, можно будет обращаться по любым вопросам к персональному ассистенту. Эдакое единое окно для управления всеми остальными инструментами решения персональных задач, например для организации поездок, получения государственных и муниципальных услуг.
— Как это будет работать?
Взаимодействуя с пользователем через мессенджеры или голосовые интерфейсы, помощник будет выполнять рутинные задачи, например оформлять загранпаспорт через Госуслуги, заказывать еду или принимать посылки.
Сегодня для решения всех этих задач приходится заполнять формы, выбирать пункты в веб-меню, созваниваться и встречаться с курьерами, договариваться с охраной в собственном доме. Иными словами, приходится решать огромный пласт рутинных задач. Цифровой ассистент сможет взять на себя всю эту рутину. Достаточно будет сказать ему голосом: «Я хочу суши», — он уточнит всё, что нужно, в ходе живой беседы и займется организацией.
А про загранпаспорт ассистент напомнит и сам — ведь у него будут сохранены данные всех документов, а значит, он будет знать, когда закончится срок действия. От пользователя потребуется только дать согласие искусственному интеллекту на обращение за услугой от его имени. Дальше цифровой ассистент сможет запросить данные из ПФР о работе за последние 10 лет, заполнить заявление, правильно сфотографировать пользователя через веб-камеру и верифицировать данные с разными агентствами с помощью платформ IVA и EYE.
— Сколько это будет стоить для конечного потребителя?
Идея в том, чтобы платформа была внедрена на уровне государства, а каждый гражданин получил своего цифрового помощника. Наше видение — что этот сервис должен быть для граждан бесплатным (или предлагаться за те же самые госпошлины, которые мы платим сейчас за услуги).
Дальнейшим развитием проекта займется iPavlov. Конечно, для этого развития нужны субсидии. Государство при этом сможет сократить свои издержки на обслуживание граждан — по нашим подсчетам, минимум на 40%, уменьшив время оказания услуг раза в три.
Поскольку субсидии на развитие таких проектов обычно единоразовые, монетизировать платформу планируем, подключая к ней коммерческие компании, которые смогут предложить свои продукты и услуги через «Ивана Павлова» и тем самым создав новый рынок цифровых помощников — по нашим подсчетам, на 500 млрд рублей в год.
Для коммерции платформа решит глобальную проблему обслуживания больших потоков людей. Десятилетиями в мире шла пропаганда индивидуализации — каждый теперь считает себя уникальным и хочет, чтобы его жизнь прошла по его собственным правилам. У каждого свои предпочтения. По сути, государство и корпорации сами создали себе сложного потребителя, который не хочет дважды пробовать одно и то же блюдо и требует индивидуального подхода во всем. Кроме того, главный тренд новейшего времени — все хотят стать источником собственного контента и коммерциализировать его. Искусственный интеллект как раз и поможет справляться с этим потоком персональных запросов, не роняя качество их выполнения и не порождая толпы разочарованных клиентов.
— Что нужно, чтобы это заработало?
Сейчас эти технологии работают у наших корпоративных клиентов. Чтобы перенести их в облако и обслуживать рядовых граждан, помимо финансирования глобально нужны две вещи.
Первое — это разрешение государства. С точки зрения регулирования должно измениться очень многое, чтобы искусственный интеллект стал активной частью общества.
Это большая законотворческая работа, результатом которой должна стать возможность каждому гражданину выбрать, в каком режиме его будут обслуживать — по старинке, через искусственный интеллект или в гибридном режиме.
Второе — доступ созданного нами софта к большому количеству государственных сервисов федерального и регионального уровней, чтобы цифровой ассистент мог верифицировать информацию, используя несколько разных источников. И в коммерческом секторе также потребуются интеграции, причем даже более сложные, чем в Госуслугах.
В целом так. Одна технология или группа продуктов потянут за собой смежные, таким образом индустрия будет активно развиваться.
Источник: Хабр