Alexa, играй с роботом: представление первого конкурса Alexa Prize SimBot в области воплощённого искусственного интеллекта
Alexa, play with robot: Introducing the First Alexa Prize SimBot Challenge on Embodied AI
August 9, 2023
Авторы: Hangjie Shi, Leslie Ball, Govind Thattai, Desheng Zhang, Lucy Hu, Qiaozi Gao, Suhaila Shakiah, Xiaofeng Gao, Aishwarya Padmakumar, Bofei Yang, Cadence Chung, Dinakar Guthy, Gaurav Sukhatme, Karthika Arumugam, Matthew Wen, Osman Ipek, Patrick Lange, Rohan Khanna, Shreyas Pansare, Vasu Sharma, Chao Zhang, Cris Flagg, Daniel Pressel, Lavina Vaz, Luke Dai, Prasoon Goyal, Sattvik Sahai, Shaohua Liu, Yao Lu, Anna Gottardi, Shui Hu, Yang Liu, Dilek Hakkani-Tur, Kate Bland, Heather Rocker, James Jeun, Yadunandana Rao, Michael Johnston, Akshaya Iyengar, Arindam Mandal, Prem Natarajan, Reza Ghanadan
cs.AI
Аннотация
Программа Alexa Prize предоставила многочисленным студентам университетов возможность исследовать, экспериментировать и демонстрировать свои таланты в создании диалоговых агентов через такие задачи, как SocialBot Grand Challenge и TaskBot Challenge. Поскольку диалоговые агенты всё чаще появляются в мультимодальных и воплощённых контекстах, важно изучить возможности диалогового взаимодействия, усиленного компьютерным зрением и физическим воплощением. В данной статье описывается SimBot Challenge — новое соревнование, в котором университетские команды состязаются в создании роботов-ассистентов, выполняющих задачи в симулированной физической среде. В статье представлен обзор SimBot Challenge, включающего как онлайн-, так и оффлайн-этапы. Мы описываем инфраструктуру и поддержку, предоставленные командам, включая Alexa Arena — симулированную среду, а также набор инструментов машинного обучения, предоставленный командам для ускорения разработки моделей зрения и языка. Мы обобщаем подходы, которые использовали команды для преодоления исследовательских задач, и выделяем ключевые уроки. Наконец, мы проводим анализ производительности конкурирующих SimBots в ходе соревнования.
English
The Alexa Prize program has empowered numerous university students to
explore, experiment, and showcase their talents in building conversational
agents through challenges like the SocialBot Grand Challenge and the TaskBot
Challenge. As conversational agents increasingly appear in multimodal and
embodied contexts, it is important to explore the affordances of conversational
interaction augmented with computer vision and physical embodiment. This paper
describes the SimBot Challenge, a new challenge in which university teams
compete to build robot assistants that complete tasks in a simulated physical
environment. This paper provides an overview of the SimBot Challenge, which
included both online and offline challenge phases. We describe the
infrastructure and support provided to the teams including Alexa Arena, the
simulated environment, and the ML toolkit provided to teams to accelerate their
building of vision and language models. We summarize the approaches the
participating teams took to overcome research challenges and extract key
lessons learned. Finally, we provide analysis of the performance of the
competing SimBots during the competition.