Технический комитет по стандартизации «Искусственный интеллект» вынес на публичное обсуждение первую редакцию стандарта «Информационные технологии. Искусственный интеллект. Качество данных для аналитики и машинного обучения. Часть 4: Инструментарий для мониторинга качества данных». Проект стандарта разработан Национальным центром цифровой экономики МГУ имени М.В.Ломоносова и Институтом развития информационного общества.
Национальный стандарт «Информационные технологии. Искусственный интеллект. Качество данных для аналитики и машинного обучения. Часть 4: Инструментарий для мониторинга качества данных» представляет собой русскоязычную адаптацию разрабатываемого международного стандарта стандарту ISO/IEC 5259–4 Artificial intelligence — Data quality for analytics and machine learning (ML) — Part 4: Data quality process framework. Данный стандарт является составной частью разрабатываемой серии международных стандартов ИСО/МЭК 5259-X «Информационные технологии. Искусственный̆ интеллект. Качество данных для аналитики и машинного обучения».
«Количество продуктов, систем или решений, связанных с искусственным интеллектом, в последние годы быстро растет. Данные были признаны одним из наиболее важных аспектов систем искусственного интеллекта на основе машинного обучения. Для всех подходов к обучению – с учителем, без учителя или с подкреплением качество данных может быть главной проблемой при создании, использовании и оценке систем машинного обучения. Очевидно, что полезные и надежные результаты аналитики больших данных или машинного обучения могут быть получены только на точных и полных данных», — уверена руководитель департамента Института развития информационного общества (ИРИО), профессор Санкт-Петербургского государственного университета Надежда Щёголева, которая разрабатывала стандарт.
В проекте национального стандарта описывается реализация стандартизированной общей процедуры обработки данных в отношении качества данных для аналитики и машинного обучения: принципы и структура процесса обеспечения качества данных, методы и процесс маркировки данных, роли участников в подобных процессах с учетом различных подходов к машинному обучению (с учителем, без учителя или с подкреплением).
Проект стандарта разработан Национальным центром цифровой экономики МГУ и Институтом развития информационного общества. Координацию работ по согласованию и утверждению документа осуществляет подкомитет «Данные» (ПК 02) в составе технического комитета по стандартизации «Искусственный интеллект» (ТК 164). Деятельность ПК 02 поддерживается в рамках программы Центра компетенций НТИ по технологиям хранения и анализа больших данных на базе МГУ.
«Осуществляя мониторинг процессов аналитики больших данных на основе международного стандарта, организации смогут улучшить свои системы поддержки принятия решений, повысить качество обслуживания клиентов, оперативно реагировать на многочисленные угрозы, и тем самым уменьшить количество ошибок и снизить затраты», — отмечает Юрий Хохлов, глава ПК 02 «Данные», председатель совета директоров ИРИО.
Первая редакция стандарта доступна на сайте Центра компетенций НТИ по большим данным на базе МГУ по адресу https://bigdata.msu.ru/standards. Замечания по проекту принимаются по электронной почте standards@iis.ru до 16 ноября 2022 года. По результатам публичного обсуждения редакция стандарта будет дополнена и утверждена ТК 164 «Искусственный интеллект», после документ планируется внести в Росстандарт.
Источник: Центр компетенций НТИ по технологиям хранения и анализа больших данных на базе МГУ