Социальная «ВКонтакте» создала технологию, благодаря которой пользователям не придётся слушать голосовые сообщения — их можно прочитать. Достаточно нажать одну кнопку, и искусственный интеллект расшифрует аудиозапись. За распознавание речи отвечает нейросеть, которая учитывает высокую нагрузку платформы, русскоязычный сленг и низкое качество записи.
Функция работает в мобильном приложении VK, доступна для части пользователей и появится у всех в течение недели. Распознавать можно как полученные, так и отправленные голосовые сообщения длительностью до 30 секунд — 90% от всех аудио, которые записывают пользователи «ВКонтакте». Новая технология также помогает вернуться к нужной информации в переписке: голосовые сообщения можно находить при помощи поиска по тексту. В будущем функция распознавания появится в веб-версии «ВКонтакте», а расшифровать можно будет как более длинные, так и пересланные сообщения.
Ежемесячно аудиосообщениями обмениваются 30 миллионов пользователей «ВКонтакте», поэтому новая технология рассчитана на высокие нагрузки. Нейросеть расшифровывает записи быстрее, чем человек, хорошо понимает разговорный язык и заимствованную лексику, а также справляется с записями низкого качества и нечёткой речью.
Распознавание голосовых сообщений автоматизировано и проводится при помощи искусственного интеллекта. «ВКонтакте» утверждает, что сотрудники соцсети и сторонние лица не обладают доступом к личным сообщениям пользователей, в том числе голосовым.
В VK появился перевод голосовых сообщений в текст

Александр Кузнецов
—
iGuides в Яндекс.Дзен — zen.yandex.ru/iguides.ru
iGuides в Telegram — t.me/igmedia
Рекомендации
-
Sony PlayStation 5 сливают по рекордно низкой цене на распродаже 11.11 на AliExpress
-
«Яндекс Такси» придумало, как сделать поездки дешевле на 20%. Водителям это не нравится — они хитрят, чтобы брать в разы дороже
-
Тысячи смарт-часов Galaxy Watch по всему миру выключились и больше не включились
-
Нейросеть научилась «скрещивать» две картинки. Мы попробовали и создали монстра
Рекомендации
Комментарии
Уже давно весь звуковой трындёж раскладывается на буковки и бережно хранится в txt
+141
У Я.Мессенджера слизали? Мне нравится эта функция,так как не всегда удобно слушать сообщение,а лучше прочитать его.
То есть если аудио уже 31 секунда, программа даже первые 30 не будет распознавать?