siri-iphone.jpg

По части локализации голосовых помощников, Apple является бесспорным лидером. Siri поддерживает 24 языка и 36 диалекта. К примеру, Google Assistant поддерживает пять языков. В интервью Reuters, глава отдела речи Siri рассказал, как ассистент обучается новым языкам.

Алекс Асеро возглавляет команду обучения Siri речи с 2013 года. Он рассказывает, что процесс обучения Siri начинается с поиска людей, которые могут говорить на новом языке. Они читают разные списки слов и небольшие тексты, причем на разных акцентах и диалектах.


Человеческая речь записывается и расшифровывается другими людьми. Это формирует каноническое представление произношения слов. Затем данные передаются в отдел машинного обучения.  Алгоритм улучшается со временем, благодаря большему количеству данных.  Перед тем как добавлять язык в Siri, Apple выпускает язык, как часть функции диктовки iOS и macOS и голосового ввода клавиатуры iOS. Это позволяет Apple получить больше анонимных образцов речи.

Голоса реальных людей включают фоновые шумы и различные недостатки произношения. Специалисты Apple расшифровывают данные и вносят изменения в модель языка. Асеро отмечает, что этот процесс снижает частоту появления ошибок в два раза. Apple повторяет эту процедуру до тех пор, пока не поймет, что речь Siri точна и правильна. Затем, Siri получает поддержку нового языка в одном из следующих обновлений.

Но на этом обучение не заканчивается. В первое время, когда новые пользователи Siri начинают общаться с ней, она просит ответить на различные вопросы, например, рассказать шутку. Это позволяет улучшить качество речи ассистента. Спустя некоторое время, Siri может отвечать на определенные вопросы без необходимости записи заданных ответов, например, на просьбу рассказать шутку. Но база данных человеческих ответов, используемых для ответов на большинство вопросов, по-прежнему обновляется каждые две недели.