С момента своего появления на свет робот-собака Spot от Boston Dynamics уже стал международной знаменитостью, о которой знают не только фанаты робототехники, но в принципе все. На своём пути самосовершенствования этот робот-пёс научился многому, от проведения тестов на запахи, контроля качества на производстве и в строительстве, до танцев и паркура. Кажется, он берёт от жизни всё, вот только молчит… а точнее молчал до недавнего времени, так как с помощью интеграции ChatGPT его молчание прекратилось навсегда.
С помощью искусственного интеллекта четвероногий робот научился разговаривать на нескольких языках, примеряя на себя образ разных личностей. Он в совершенстве владеет английским на нескольких акцентах, и звучит как настоящий человек.
Как можно видеть на видео с испытаний робота на болтливость, Spot способен воплощать в себе несколько личностей в зависимости от того, какую языковую модель общения предлагает ему человек. Его рот, похожий на пасть гадюки, имитирует мимику в процессе разговора, реагируя на интонации и другие аспекты общения. Всё это делает его куда более совершенным собеседником в сравнении с тем, каким нам представляется обычный разговаривающий робот.
С возможностью разговаривать и поддерживать диалог Spot находит много новых сценариев применения, чему безумно рады в Boston Dynamics. Например, он может работать гидом в музеях, встречать людей в офисах технологических корпораций и провожать их куда надо.
Boston Dynamics заинтересована в речевых способностях Spot на базе языковых моделей вроде ChatGPT. Команда разработчиков заявляет, что эти модели способны к алгоритмам автодополнения, что означает их способность предсказывать следующие биты незавершённого текста по мере получения потока текста. В Boston Dynamics вдохновлены данной функцией, а также возможностями недавно выпущенных моделей VQA, которые способны создавать подписи к изображениям и отвечать на простые вопросы о ни.
Чтобы сделать робота-собаку собеседником для человека, специалисты Boston Dynamics произвели несколько аппаратных интеграций и загрузили в него соответствующие программные модели. Также его базовый набор дополнился специальной камерой, динамиком и микрофоном, чтобы он мог следить за положением собеседника и понимать, что люди хотят от него, отвечать им и быть услышанным. Для навыков ведения беседы в роботе Spot используется GPT-3.5 от OpenAI.
Как показали офисные эксперименты сотрудников Boston Dynamics, разговаривающий робот-пёс Spot удивительно хорошо вживается в свою роль. Например, он охотно согласился искать Йети в кабинете, спрашивая встречных сотрудников, не видели ли они его, либо когда ему спрашивали о неизвестной его личности, он отправлялся на помощь к сотрудникам Boston Dynamics в надежде разрешить поставленную задачу. И все эти операции он выполняет самостоятельно, по собственной воле и без предварительной загрузки алгоритма действий, что потрясающе!