Ученые МТУСИ разработали способ сохранять качество цифрового звука без увеличения объема файла. Более того, с его помощью можно уменьшить размер файла на 20%. Обычно для уменьшения объема архивов звука используют форматы вроде MP3, но они добавляют новые искажения. Новые алгоритмы решают эту проблему: они сохраняют качество даже при снижении объема файла вдвое.
Этот метод позволяет сохранять качество даже тогда, когда у цифровой звукозаписи есть недостатки, уловимые уху, в отличие от аналогового метода, где шумы менее ощутимы и человек их всё равно слышит благодаря особенностям слуха.
— Формат MP3, несмотря на популярность, имеет недостатки. Например, при оцифровке аналогового сигнала (импульсно-кодовой модуляции, ИКМ) в цифровой на скорости 250–270 Кбит/с теряются нюансы, так называемые атаки, которые определяют насыщенность звука и его разборчивость, — заявили в пресс-службе университета.
Цифровой звук сейчас применяется везде: на стриминговых платформах, в подкастах, аудиокнигах, озвучке видеоигр, фильмах, видеороликах, голосовых сообщениях, видеозвонках, умных колонках, голосовых помощниках. Он используется даже в слуховых аппаратах, отмечает гендиректор группы компаний ST IT, эксперт рынка TechNet НТИ Антон Аверьянов.
— Проблема в том, что тихие звуки в «цифре» часто теряются. По старым стандартам до половины данных просто вылетает, а чтобы это исправить, требуется увеличивать размер файлов, что плохо сказывается на пользователях. Эта проблема весьма актуальна, особенно при низких битрейтах или в условиях ограниченной памяти и пропускной способности. Искажения проявляются в таких аспектах, как потеря тихих звуков, шумы, «металлический» оттенок или смазанность. Например, в MP3 при 56–128 Кбит/с теряется до 50% данных, что заметно ухудшает качество — звук становится плоским, детали пропадают, — сказал он.
Патентованные методы предварительной обработки и компандирования открывают путь к более эффективным студийным архивам и потоковой передаче аудио высокого качества даже при низких битрейтах, считает ведущий эксперт в области ИИ «Университета 2035» Ярослав Селиверстов.
— Возможность передавать качество 32-разрядного сигнала через 16-разрядный поток — колоссальное достижение в условиях ограниченных ресурсов. Это особенно перспективно для мобильных приложений, облачного хранения и ИИ-систем, где объем и точность критичны. Такую разработку можно считать не только перспективной, но и системообразующей для нового этапа цифрового звука, — добавил он.
Источник: Известия
Свежие комментарии