V-IRL: 가상 지능을 현실 세계에 기반하기
V-IRL: Grounding Virtual Intelligence in Real Life
February 5, 2024
저자: Jihan Yang, Runyu Ding, Ellis Brown, Xiaojuan Qi, Saining Xie
cs.AI
초록
인간이 거주하는 지구와 현대 AI 에이전트가 생성되는 디지털 영역 사이에는 감각적 격차가 존재합니다. 현실 세계에서 인간처럼 유연하게 감지하고, 사고하며, 행동할 수 있는 AI 에이전트를 개발하기 위해서는 디지털 세계와 물리적 세계 사이의 현실성 격차를 해소하는 것이 필수적입니다. 실제 하드웨어와 제어의 제약 없이, 우리가 거주하는 것과 같이 풍부하고 다양한 환경에서 에이전트를 구현할 수 있는 방법은 무엇일까요? 이를 위해 우리는 V-IRL을 소개합니다: 이 플랫폼은 에이전트가 가상이면서도 현실적인 환경에서 현실 세계와 확장 가능하게 상호작용할 수 있도록 합니다. 우리의 플랫폼은 다양한 실용적 작업을 수행할 수 있는 에이전트를 개발하기 위한 놀이터 역할을 하며, 전 세계에 걸친 현실 세계 데이터와의 인식, 의사결정, 상호작용 능력의 진전을 측정할 수 있는 방대한 테스트베드로 기능합니다.
English
There is a sensory gulf between the Earth that humans inhabit and the digital
realms in which modern AI agents are created. To develop AI agents that can
sense, think, and act as flexibly as humans in real-world settings, it is
imperative to bridge the realism gap between the digital and physical worlds.
How can we embody agents in an environment as rich and diverse as the one we
inhabit, without the constraints imposed by real hardware and control? Towards
this end, we introduce V-IRL: a platform that enables agents to scalably
interact with the real world in a virtual yet realistic environment. Our
platform serves as a playground for developing agents that can accomplish
various practical tasks and as a vast testbed for measuring progress in
capabilities spanning perception, decision-making, and interaction with
real-world data across the entire globe.