Disney сделала взгляд роботов пугающе реалистичным

Будь в курсе последних новостей из мира гаджетов и технологий

iGuides для смартфонов Apple

Disney сделала взгляд роботов пугающе реалистичным

Пользователь удален — 10 ноября 2020, 15:45

В большинстве областей роботы, похожие на людей, не требуются, и на заводах «очеловечивание» механизмов может снизить эффективность их работы. Однако все же есть одно применение роботов, где сходство с человеком важно — это сфера развлечений. Инженеры в Disney Research занимаются этим долгое время и добились больших успехов в конструировании аниматронных механизмов — посмотрите, например, на механического Барака Обаму, созданного больше 10 лет назад:

Следующим шагом Disney планирует наладить создание аниматронных фигур, способных демонстрировать различные сценарии поведения, для интерактивного взаимодействовать с посетителями парка. Проблема в том, что именно здесь мы попадаем на потенциальную территорию «Зловещей долины», когда действия андроида вызывают неприязнь у реальных людей. Увы, этого не избежать, когда вы пытаетесь создать «иллюзию жизни», что и собирается сделать Disney (они прямо так и говорят).

В докладе, представленном на IROS в этом месяце, команда из Disney Research, Калифорнийского технологического института, Университета Иллинойса в Урбана-Шампейн и Walt Disney Imagineering пытается создать максимально правдоподобную иллюзию жизни с помощью одного, возможно, самого важного социального сигнала: взгляда глаз.

Прежде чем смотреть видео ниже, рекомендую ознакомиться с описанием представленного в нем андроида:

Персонаж-робот играет пожилого человека, читающего книгу, возможно, в библиотеке или на скамейке в парке. Он плохо слышит и имеет проблемы со зрением. Тем не менее, его постоянно отвлекают от чтения люди, просто проходящие мимо или приветствующие его. В большинстве случаев он поглядывает на людей, идущих достаточно далеко, но, когда люди вторгаются в его личное пространство, он будет смотреть на них с неодобрением из-за того, что его отвлекают, или же дружески приветствовать тех, кто ему знаком.

Что именно означает «реалистичность» в контексте взгляда робота? В аннотации статьи цель описывается как «[стремление] создать взаимодействие, демонстрирующее иллюзию жизни». Об этом можно думать как о старом добром тесте Тьюринга, сфокусированном на взгляде: если взгляд робота нельзя отличить от взгляда человека, то вы победили, создав иллюзию жизни. И, что важно, мы говорим здесь о взаимном взгляде — не просто о роботе, смотрящем вдаль, но об андроиде: вы смотрите в глаза этого робота, а он смотрит прямо на вас, как человек.

Подход, который использует Дисней, больше похож на аниматронику, чем на биологию или психологию. Другими словами, роботы не будут пытаться понять, что происходит в нашем мозгу, чтобы заставить наши глаза двигаться так, как будто мы смотрим на реального человека, и строить на этом свою систему поведения. Вместо этого Дисней хочет, чтобы взгляд просто выглядел «правильно».

Такой подход «визуальной привлекательности» очень хорош, и с ним уже было проведено огромное количество исследований взаимодействия человека и робота (human-robot interaction, HRI), но обычно с менее человекоподобными платформами. А если все же говорить об андроидах, то использованное в ролике выше аппаратное обеспечение, которое называется «аудио-аниматронный кастомный бюст Walt Disney Imagineering», (custom Walt Disney Imagineering Audio-Animatronics bust), включает шею, глаза, веки и брови.

Эффект «Зловещей долины» — даже робот, полностью скопированный с человека и имеющий его волосы ~~и мотоцикл~~, выглядит как-то не так.

Чтобы определиться с движением взгляда, система сначала идентифицирует человека, на которого нацелено ее внимание, используя RGB-D камеру (то есть камеру с «пониманием» глубины картинки, иными словами с лидаром). Если рядом находится больше одного человека, система вычисляет для каждого из них «оценку любопытства», которая в настоящее время упрощена и исходит из того, насколько физически близок определенный человек. В результате система выбирает человека с наивысшим баллом любопытства (то есть ближайшего) и может начать выполнять различные действия в зависимости от того, что это за человек:

Чтение: состояние персонажа по умолчанию. Если не выполняется никакое другое состояние и рядом никого нет, робот вернется в состояние чтения. В нем персонаж будет читать книгу, расположенную на уровне туловища.
Быстрый взгляд: переход в это состояние из состояния «Чтение» или «Вовлечение» происходит, когда механизм внимания обнаруживает сигнал с оценкой любопытства выше определенного порога, но ниже, чем нужно для «Вовлечения».
Вовлечение: переход в это состояние возможен как из состояния «Чтение», так и из состояния «Взгляд», когда механизм внимания обнаруживает сигнал с высокой оценкой любопытства. Это состояние заставляет робота смотреть на человека и «вести» его глазами.
Подтверждение: переход в это состояние возможен как из состояния «Вовлечение», так и из состояния «Взгляд», когда человек считается знакомым роботу и тот может его поприветствовать.

Под этими поведенческими состояниями высокого уровня скрываются движения более низкого уровня, такие как имитация дыхания, небольшие движения головы, моргание глаз и саккады (быстрые движения глаз, которые происходят, когда люди или роботы смотрят между двумя различными фокусными точками). Такое сложное иерархическое многоуровневое поведенческое состояние называется архитектурой подчинения, которая восходит к работе Родни Брукса над такими роботами, как Чингис в 1980-х годах и Cog и Kismet в 90-х, и предоставляет возможность создавать сложные формы поведения из набора простых децентрализованных низкоуровневых моделей.

Знакомьтесь, эту милашку зовут Kismet.

Это название связано с аналогичным использованием подчинения в человеческом поведении: психомоторное поведение человека можно интуитивно смоделировать как многоуровневое поведение с входящими сенсорными сигналами, где более высокие поведенческие уровни способны подчинять более низкое поведение. На самом низком уровне у нас есть непроизвольные движения, такие как сердцебиение, дыхание или моргание.

Однако более высокие поведенческие реакции могут взять верх и контролировать поведение более низкого уровня: например, реакция «бей или беги» может вызвать учащение пульса и дыхания. Поскольку персонаж-робот смоделирован по морфологии человека, имитировать биологическое поведение с помощью подхода «снизу вверх» относительно просто.

Брукс, почетный профессор Массачусетского технологического института, а совсем недавно и соучредитель и технический директор Robust.ai, написал в Твиттере о проекте Диснея следующее: «Люди недооценивают, сколько нужно времени, чтобы перейти от академической статьи к реальной робототехнике. 25 лет спустя Дисней использует мою архитектуру подчинения для управления гуманоидными глазами, куда лучше и плавнее, чем в наших реализации 1995 года с Cog и Kismet».

Результат, как показывает видео, оказался неплохим, хотя трудно сказать, как бы все сложилось, если бы у робота было больше, ну, знаете, частей лица. Но и тут прослеживается важный момент: нам не обязательно иметь реалистичного гуманоидного робота, чтобы использовать преимущества архитектуры подчинения в контексте HRI — любой андроид, который может установить связь с человеком на основе взгляда, уже считается нами более человечным.