グロントから文法へ:協調的採餌行動から生まれる創発的言語
From Grunts to Grammar: Emergent Language from Cooperative Foraging
May 19, 2025
著者: Maytus Piriyajitakonkij, Rujikorn Charakorn, Weicheng Tao, Wei Pan, Mingfei Sun, Cheston Tan, Mengmi Zhang
cs.AI
要旨
初期の洞窟住人は、身振り手振り、発声、そして単純な信号に頼って、調整や計画を立て、捕食者を避け、資源を共有していました。今日、人間は複雑な言語を用いて協力し、驚くべき成果を達成しています。このコミュニケーションの進化を駆動するものは何でしょうか?言語はどのように出現し、適応し、チームワークにとって不可欠なものとなるのでしょうか?言語の起源を理解することは依然として課題です。言語学と人類学における主要な仮説は、言語が初期の人間の協力における生態的および社会的な要求を満たすために進化したと主張しています。言語は孤立して生まれたのではなく、共有された生存目標を通じて発展したのです。この見方に触発され、我々はマルチエージェントの採集ゲームにおける言語の出現を調査します。これらの環境は、コミュニケーションの進化に影響を与えたと考えられる認知的および生態的な制約を反映するように設計されています。エージェントは、他のエージェントや環境についての部分的な知識しか持たない共有グリッドワールドで動作し、高価値のターゲットを拾うや時間的に順序付けられたアクションを実行するなどのゲームを完了するために調整する必要があります。エンドツーエンドの深層強化学習を使用して、エージェントはアクションとコミュニケーション戦略をゼロから学習します。我々は、エージェントが自然言語の特徴である恣意性、交換可能性、転位性、文化的伝播、および構成性を持つコミュニケーションプロトコルを開発することを発見しました。我々は各特性を定量化し、人口規模や時間的依存性などの異なる要因が、出現する言語の特定の側面をどのように形成するかを分析します。我々のフレームワークは、部分的な観察可能性、時間的推論、および具現化されたマルチエージェント設定における協力的な目標から言語がどのように進化するかを研究するためのプラットフォームとして機能します。我々はすべてのデータ、コード、およびモデルを公開します。
English
Early cavemen relied on gestures, vocalizations, and simple signals to
coordinate, plan, avoid predators, and share resources. Today, humans
collaborate using complex languages to achieve remarkable results. What drives
this evolution in communication? How does language emerge, adapt, and become
vital for teamwork? Understanding the origins of language remains a challenge.
A leading hypothesis in linguistics and anthropology posits that language
evolved to meet the ecological and social demands of early human cooperation.
Language did not arise in isolation, but through shared survival goals.
Inspired by this view, we investigate the emergence of language in multi-agent
Foraging Games. These environments are designed to reflect the cognitive and
ecological constraints believed to have influenced the evolution of
communication. Agents operate in a shared grid world with only partial
knowledge about other agents and the environment, and must coordinate to
complete games like picking up high-value targets or executing temporally
ordered actions. Using end-to-end deep reinforcement learning, agents learn
both actions and communication strategies from scratch. We find that agents
develop communication protocols with hallmark features of natural language:
arbitrariness, interchangeability, displacement, cultural transmission, and
compositionality. We quantify each property and analyze how different factors,
such as population size and temporal dependencies, shape specific aspects of
the emergent language. Our framework serves as a platform for studying how
language can evolve from partial observability, temporal reasoning, and
cooperative goals in embodied multi-agent settings. We will release all data,
code, and models publicly.Summary
AI-Generated Summary