Источник: Известия
Российские ученые разработали эффективный способ быстрого обучения ИИ-моделей — он позволяет экономить вычислительные затраты на 40% без потери качества. Для этого используется набор алгоритмов, которые автоматизируют процесс без ручного тестирования сотен параметров: система самостоятельно отбирает наиболее эффективные конфигурации по таким метрикам, как точность, скорость генерации и соблюдение формата ответа. Области использования технологии широки: государственные и корпоративные задачи, а также промышленные ИИ-сервисы — то есть везде, где искусственный интеллект нуждается в ускоренном обучении.
Ученые Научно-образовательного центра ФНС России совместно с МГТУ им. Н.Э. Баумана разработали автоматизированный сценарий настройки языковых моделей, позволяющий адаптировать ИИ под конкретные измеримые задачи без ручного перебора параметров. Решение направлено на повышение точности, скорости работы и соблюдение заданных форматов в зависимости от целей использования модели.
Разработчики объяснили, что высокая эффективность модели достигается за счет оптимизации ключевых показателей. Для ускорения работы используются суррогатные модели, которые заранее оценивают разные конфигурации ИИ. Это позволяет примерно в 1,6 раза сократить число комплексных проверок системы на наличие вредоносных объектов, уменьшить объем ресурсоемких вычислений и ускорить настройку примерно на 40% времени без потери качества. Эксперименты показали, что метод стабильно превосходит традиционные подходы, в том числе по покрытию кода.
Разработка относится к классу систем автоматического машинного обучения (Automated Machine Learning). Проще говоря, это ИИ, который способен выполнять часть работы дата-сайентиста: автоматически настраивать и подбирать модели под конкретные задачи на основе данных. Сама идея AutoML не нова, но появление больших языковых моделей (Large language model — программ искусственного интеллекта, которые могут распознавать и генерировать текст) требует новых подходов и инструментов, поэтому технологию можно считать актуальной и полезной, отметил д.т.н., руководитель Национального центра когнитивных разработок ИТМО Александр Бухановский.
— Технология МГТУ им. Н.Э. Баумана ориентирована на отдельные ИИ-модели, однако в перспективе она может быть особенно востребована при создании мультиагентных систем на базе больших фундаментальных моделей. В таких системах одна и та же ИИ-модель может использоваться разными агентами, но с разными настройками — по точности, скорости и другим параметрам, — уточнил эксперт.
Свежие комментарии