ChatPaper.aiChatPaper

울음소리에서 문법으로: 협력적 채집 행동에서 나타나는 언어의 출현

From Grunts to Grammar: Emergent Language from Cooperative Foraging

May 19, 2025
저자: Maytus Piriyajitakonkij, Rujikorn Charakorn, Weicheng Tao, Wei Pan, Mingfei Sun, Cheston Tan, Mengmi Zhang
cs.AI

초록

초기 원시인들은 제스처, 발성, 그리고 간단한 신호를 통해 협력, 계획 수립, 포식자 회피, 자원 공유를 수행했습니다. 오늘날 인간은 복잡한 언어를 사용하여 놀라운 결과를 달성하며 협력합니다. 무엇이 이러한 의사소통의 진화를 이끌었을까요? 언어는 어떻게 발생하고, 적응하며, 팀워크에 필수적인 요소가 되었을까요? 언어의 기원을 이해하는 것은 여전히 도전적인 과제입니다. 언어학과 인류학 분야의 주요 가설은 언어가 초기 인간 협력의 생태적, 사회적 요구를 충족하기 위해 진화했다고 주장합니다. 언어는 고립된 상태에서 발생한 것이 아니라, 공동의 생존 목표를 통해 발전했습니다. 이러한 관점에서 영감을 받아, 우리는 다중 에이전트 포징 게임(Foraging Games)에서의 언어 발생을 연구합니다. 이러한 환경은 의사소통의 진화에 영향을 미쳤을 것으로 여겨지는 인지적, 생태적 제약을 반영하도록 설계되었습니다. 에이전트는 공유된 그리드 세계에서 다른 에이전트와 환경에 대한 부분적인 지식만을 가지고 작동하며, 고가치 목표물을 수집하거나 시간 순서에 따른 행동을 실행하는 등의 게임을 완료하기 위해 협력해야 합니다. 종단간 심층 강화 학습을 사용하여, 에이전트는 행동과 의사소통 전략을 처음부터 학습합니다. 우리는 에이전트가 자연 언어의 특징인 임의성, 상호 교환성, 전위성, 문화적 전달, 그리고 구성성을 갖춘 의사소통 프로토콜을 개발한다는 것을 발견했습니다. 우리는 각 속성을 정량화하고, 인구 규모와 시간적 의존성과 같은 다양한 요인이 발생한 언어의 특정 측면을 어떻게 형성하는지 분석합니다. 우리의 프레임워크는 부분적 관찰 가능성, 시간적 추론, 그리고 구체화된 다중 에이전트 설정에서의 협력 목표로부터 언어가 어떻게 진화할 수 있는지 연구하기 위한 플랫폼 역할을 합니다. 우리는 모든 데이터, 코드, 모델을 공개할 예정입니다.
English
Early cavemen relied on gestures, vocalizations, and simple signals to coordinate, plan, avoid predators, and share resources. Today, humans collaborate using complex languages to achieve remarkable results. What drives this evolution in communication? How does language emerge, adapt, and become vital for teamwork? Understanding the origins of language remains a challenge. A leading hypothesis in linguistics and anthropology posits that language evolved to meet the ecological and social demands of early human cooperation. Language did not arise in isolation, but through shared survival goals. Inspired by this view, we investigate the emergence of language in multi-agent Foraging Games. These environments are designed to reflect the cognitive and ecological constraints believed to have influenced the evolution of communication. Agents operate in a shared grid world with only partial knowledge about other agents and the environment, and must coordinate to complete games like picking up high-value targets or executing temporally ordered actions. Using end-to-end deep reinforcement learning, agents learn both actions and communication strategies from scratch. We find that agents develop communication protocols with hallmark features of natural language: arbitrariness, interchangeability, displacement, cultural transmission, and compositionality. We quantify each property and analyze how different factors, such as population size and temporal dependencies, shape specific aspects of the emergent language. Our framework serves as a platform for studying how language can evolve from partial observability, temporal reasoning, and cooperative goals in embodied multi-agent settings. We will release all data, code, and models publicly.

Summary

AI-Generated Summary

PDF22May 20, 2025