Недавно «Яндекс» выкатил свою новую разработку — голосового помощника на базе генеративной нейросети YandexGPT. Опция получила название «Алиса Про» и, как заявляется, теперь превосходит обычную Алису, которая и без того была очень неплоха.
Теория: что умеет Алиса Про
По заявлениям «Яндекса», обновленный ассистент стал лучше по множеству параметров. Вот они:- Научилась объяснять сложное простым языком. Например, она расскажет, как возникает торнадо и чем паровой увлажнитель отличается от ультразвукового. До сих пор Алиса отвечала примерно на 60% вопросов, а в остальных случаях отправляла пользователя в поисковик. Сейчас она отвечает на 95% вопросов и может назвать источник.
- Можно создавать что-то новое, не переходя в режим «Давай придумаем». Например, можно просто спросить: «Алиса, что подарить коллеге?» или «Алиса, что приготовить на завтрак?»
- Научилась удерживать контекст беседы, поэтому с ней можно общаться, как с человеком, переходя от одной темы к другой. А еще Алиса стала задавать дополнительные вопросы.
- Научилась давать развёрнутые ответы, работать с разными стилями и форматами и следовать инструкциям с несколькими условиями.
- Освоила навыки виртуальной няни: напомнит ребенку о полезных привычках, разбудит вовремя, составит познавательные игры и квесты.
Что ж, попробуем проверить хотя бы часть этих утверждений. В ходе текста будем задавать одни и те же вопросы Алисе и Алисе Про, и сравнивать ответы на них.
1. Объяснения
Попробуем задать ассистенту вопросы о сложных материях и посмотрим, как она их объяснит. Начнем с самоопределения:Похоже, новая нейросеть никак не повлияла на самооценку Алисы. Перейдем к философским темам:
В обоих случаях Алиса отшучивается, несмотря на то, что словарь Ожегова вполне себе определяет любовь как «глубокое эмоциональное влечение, сильное сердечное чувство». Что ж, ладно, тогда чуть приземляемся:
Ответы отличаются, однако Про-версия едва ли дала существенно больше информации. Давайте спросим о физических терминах:
Любопытной мне показалась реакция на вопрос о любви к iPhone. Обычная Алиса с первого раза перевела стрелки, после чего я переформулировал вопрос и получил очень сжатый ответ. Алиса Про с первого раза развернула очень логичную и связную портянку:
Вывод: разницу заметно практически сразу — Алиса Про действительно стала понятливее и многословнее. Переходим к другим навыкам.
2. Идеи и креатив
«Яндекс» обещает нам тонну идей в самых разных жизненных ситуациях. Давайте посмотрим, что обе Алисы подскажут нам в том или ином случае, и оценим, насколько её советы совместимы с реальностью. Собираемся на уикенд:Могу точно сказать, что рекомендации обычной Алисы крайне тухлые, за исключением, разве что, Большого каньона и с натяжкой Тарханкута. А вот Алиса Про предложила гораздо больше приятных локаций для семейного отдыха — здесь и горы, и море, и бесподобная Балаклава, и архитектура, и ботанический сад. Зачет!
Попробуем классику — выбор подарка:
Обе Алисы предложили практически весь каталог «Яндекс Маркета», но в случае с Про мне понравилось, что ИИ выделил категории жирным шрифтом — можно пробежать глазами по пунктам и остановиться на понравившемся.
А теперь представим себя подростком и спросим о домашнем питомце из тиктока:
Очень яркий пример. Посмотрите на ответ обычной Алисы: он хорош, грамотен, но скорее похож на 6 причин не заводить капибару. Ответ Алисы Про более структурирован и выглядит как план действий — собственно, именно об этом я и спрашивал. Даже о законности намерений и времени на адаптацию не забыла.
Ну и напоследок немного набросим на вентилятор:
Здесь тоже показательно: обычная Алиса дала теоретические преимущества iOS и Android по пунктам, а ответ Алисы Про имеет более прикладную структуру сценариев и сравнения.
Поехали проверять контекст.
3. Контекст
Здесь мы хотим понять, действительно ли Алиса научилась удерживать мысль и вести структурированный диалог на «человеческом» языке.Заводим разговор на тему захворавшего макбука:
Контекст первого уровня обе Алисы сохранили успешно. А теперь внимание:
Оба ответа короткие, но только Алиса Про уловила истинный посыл моего криворукого беспокойства — я переживаю, что данные повредятся при ремонте, а не сокрушаюсь об уже свершившейся поломке. Обычная Алиса в этом случае совершенно не поняла клиента.
Впрочем, я еще поболтал с обеими Алисами и увидел, что контекст неплохо держит как обычный, так и обновленный ассистент. В целом Алиса Про скорее стала правильнее понимать контекст, чем удерживать его. Я разными способами пытался заставить Алису Про задать мне дополнительные вопросы, но не получилось. Возможно, требуется более творческое мышление, чем у меня.
Главный вопрос — стоит ли отдавать за Алису Про 100 рублей в месяц, когда закончится тестовый период? Я бы сказал «да», но с условиями:
- Если развернутые ответы сделают вашу работу эффективнее
- Если у вас есть дети, которым постоянно нужно что-то спрашивать для учебы.
Для бытовых неспецифических задач всё еще отлично подходит обычная бесплатная Алиса, хотя после тестирования она и кажется мне теперь немного туповатой. Собственно, «Яндекс» именно так и подает Алису Про — как инструмент для достижения цели, а не просто развлечение. И в этом она смогла меня удивить.