В «Сколтехе» заявили о нехватке у ChatGPT знаний об истории и литературе России

По мнению замглавы Центра компетенций НТИ Александра Сиволобова, у системы также нет достаточной экспертизы в работах известных российских авторов по философии, политике и филологии.

Языковая модель ChatGPT была обучена на ограниченном объеме русскоязычных текстов, что привело к проблеме нехватки у системы знаний о событиях истории и литературных произведениях, которые в том числе изучаются в России в рамках школьной программы. Об этом ТАСС в воскресенье сообщил заместитель руководителя Центра компетенций Национальной технологической инициативы (НТИ) по технологиям беспроводной связи и интернета вещей на базе Сколковского института науки и технологий («Сколтеха») Александр Сиволобов.

Он отметил, что библиотеки данных системы ChatGPT включают достаточно материалов на русском языке, чтобы общаться с ней без перевода.

«Однако есть и проблема. В обучении использовался ограниченный объем русскоязычных текстов. В результате системе не хватает знаний о событиях нашей истории, о литературе, в том числе по школьной программе. Также у нее нет достаточной экспертизы в работах известных российских авторов по философии, политике, филологии и истории», — сказал эксперт.

Ученый напомнил, что ChatGPT был обучен на базе данных текстов, объем которой составляет 570 гигабайт.

«Это очень много. Но далеко не весь объем знаний, находящийся в открытом доступе», — добавил исследователь.

Большие языковые модели

Чат-бот ChatGPT от компании OpenAI был запущен в конце ноября 2022 года. Сервис взаимодействует с пользователем в диалоговом режиме. Искусственный интеллект на основе языковой модели GPT-3.5 может отвечать на дополнительные вопросы, признавать свои ошибки, оспаривать неверные предпосылки и отклонять неуместные запросы. В середине марта компания представила следующую модель — GPT-4. Возможности сервиса привлекли широкое общественное внимание, в том числе в России.

В марте более тысячи экспертов в области искусственного интеллекта, в том числе Илон Маск, опубликовали открытое письмо, в котором призвали ввести мораторий на обучение систем мощнее GPT-4 минимум на полгода в связи с тем, что неконтролируемый процесс в этой сфере может представлять угрозу для человечества. Позже в апреле Маск высказался за государственное регулирование этой области, а также сообщил о планах по созданию чат-бота TruthGPT — «максимально ищущего правду ИИ, который пытается понять природу Вселенной».

«Сбер» на прошлой неделе выпустил собственную версию мультимодальной нейросети GigaChat. Она может решать множество интеллектуальных задач: поддерживать беседу, писать тексты, отвечать на фактологические вопросы. Включение в ансамбль модели Kandinsky 2.1 дает модели навык создания изображений.

Источник: ТАСС

Автор: Mariam

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *