Нейросетям нашлось новое применение — сжимать звук в десятки раз лучше, чем MP3

Александр



Французский математик Фабрис Беллар создал новый звуковой формат — TSAC. Он ориентирован на потоковую передачу аудио с очень низким битрейтом и показывает себя намного эффективнее, чем MP3 и другие популярные форматы.

Подписаться на iGuides в Telegram, чтобы узнать обо всем первым — t.me/iguides

Беллар — один из создателей технологий QEMU, FFmpeg, BPG, QuickJS, TinyGL и TinyCC, и он использовал часть своих наработок при программировании стандарта TSAC. В качестве основы был взят кодек Descript, переведённый на использование в стереорежиме и дополненный моделями машинного обучения на базе нейросети. Это позволило получить очень высокую степень сжатия с реконструкцией утерянных нюансов звучания с учётом слухового восприятия человеком.

TSAC предусматривает кодирование аудиосигнала с шириной потока 5,5 кбит/с для моно и 7,5 кбит/с для стерео. Для сравнения: несжатый звук на компакт-диске передаётся в потоке 1411,2 кбит/с. Кодировщик формата TSAC может задействовать вычислительные мощности центрального процессора, а для достижения максимальной эффективности необходимы ИИ-ресурсы видеокарты (поддерживаются ускорители NVIDIA на микроархитектур Ampere, ADA и Hopper — RTX 3090, RTX 4090, RTX A6000, A100 и H100). Модель кодировщика занимает в памяти компьютера всего 200 МБ.

TSAC может составить конкуренцию MP3, AAC, Vorbis OGG и другим популярным форматам. Несмотря на использование с крайне низким битрейтом, он подходит для потоковой передачи не только голоса, но и музыки.
Подписаться на iGuides в Telegram, чтобы узнать обо всем первым

7
iGuides в Дзене —  dzen.ru/iguides
iGuides в Telegram — t.me/iguides
iGuides в VK —  vk.com/iguides
iGuides в Ok.ru — ok.ru/iguides

Рекомендации

Рекомендации

Будь в курсе последних новостей из мира гаджетов и технологий

Мы в соцсетях

Комментарии

Dmitriy
+1182
Т е. пока ресурсы на кодирование большие, при этом кодирует сугубо записи с телефонной линии, судя по характеристикам. Про декодирование ни слова... Да и зачем оно? Экономить место? Чтобы на дискетку влезало? Сейчас уже не те годы, чтобы люто жать. Вопрос качества больше интересен.
5 мая 2024 в 19:09
#

Читайте также