2

Google представила умный аудиокодек, способный качественно передавать речь всего в 3 кбит/c

Егор


Мы уже привыкли к тому, что ежедневно прослушиваем множество аудиосообщений. И хотя скорость доступа в интернет во всем мире постоянно растет, все еще есть необходимость в кодеках, которые способны качественно передавать речь в минимальном объеме данных. Поэтому разработчики из Google создали и обучили аудиокодек Lyra, который существенно обгоняет всех конкурентов.

На данный момент самым популярным открытым кодеком для передачи голоса в VoIP-телефонии является Opus, который с битрейтом около 32 кбит/c обеспечивает качество передачи речи, максимально близкое к оригиналу. Однако, разумеется, он может работать и на более низких битрейтах, вплоть до 6 кбит/с, а его конкурент, Speex, даже при 3 кбит/с.

Однако такой низкий битрейт негативно сказывается на восприятии речи: слова становятся неразборчивыми, появляются различные артефакты звука типа «голоса робота». Для того, чтобы избавиться от таких проблем, Google использовала генеративные модели, обученные на тысячах часов диалогов.

Более того, для экономии битрейта Lyra генерирует параллельно несколько сигналов в разных частотных диапазонах, которые потом объединяются в один выходной сигнал с нужной частотой дискретизации. Все это в итоге позволяет использовать кодек даже на слабых смартфонах, обеспечивая реальную задержку кодирования не больше 90 мс.

Если сравнивать Lyra с текущими кодеками, то по соотношению битрейт-качество у него просто нет конкурентов: если Opus на 6 кбит/c выдает явно слышные артефакты, а Speex на 3 кбит/c разговаривает «голосом робота», то Lyra на 3 кбит/c передает голос с минимумом искажений в сравнении с оригиналом.


Субъективное сравнение качества голоса по разным кодекам.

Более того, Lyra обучалась хорошо передавать голос не только на английском — кодек поддерживает более 70 мировых языков. Что интересно, объединение Lyra с продвинутыми видеокодеками типа AV1 позволяет проводить видеоконференции для пользователей, скорость интернета которых составляет всего 56 кбит/с!

Разумеется, Google не собирается останавливаться на достигнутом — компания продолжает улучшать и обучать Lyra. Возможно, в будущем кодек будет использоваться для качественного сжатия и передачи музыки по Bluetooth, где есть жесткие ограничения на битрейт.
13
iGuides в Яндекс.Дзен —  zen.yandex.ru/iguides
iGuides в Telegram — t.me/iguides
iGuides в VK —  vk.com/iguides
iGuides в Ok.ru — ok.ru/iguides

Будь в курсе последних новостей из мира гаджетов и технологий

Мы в соцсетях

Комментарии

Seagull
–522
Очень было бы интересно послушать в реальности
3 марта 2021 в 23:31
#
Егор Морозов
+1764
В статье есть примеры голоса с разными кодеками.
3 марта 2021 в 23:40
#
Seagull
–522
Примеры примерами, я знаю что такое кодеки и знаю как ими пользоваться)
3 марта 2021 в 23:45
#