Яндекс открыла доступ YaLM 100B — это нейросеть для генерации и обработки текстов на русском и английском языках. Ее могут использовать разработчики и исследователи со всего мира.
Гендиректор Яндекс Технологий рассказал:
«Для обучения такой большой языковой модели требуются огромные ресурсы, опытные специалисты и годы работы. А нам важно, чтобы доступ к современным технологиям был не только у крупнейших IT-компаний, а у всего сообщества исследователей и разработчиков. Выкладывая YaLM 100B в открытый доступ, мы рассчитываем, что это даст толчок развитию генеративных нейросетей».YaLM 100В обучали на суперкомпьютерах Яндекса. Технологии отечественной компании были признаны самыми мощными в Восточной Европе. В процессе обучения нейросеть обработала около 2 ТБ текстов из открытых датасетов и интернета на русском и английском языках. Модель предоставляется по открытой лицензии Apache 2.0 и доступна на GitHub.