Collaboration Hétérogène des Modèles Fondamentaux Scientifiques

Résumé

Les systèmes d'agents basés sur de grands modèles de langage ont démontré de fortes capacités. Cependant, leur dépendance au langage comme interface universelle limite fondamentalement leur applicabilité à de nombreux problèmes du monde réel, en particulier dans les domaines scientifiques où des modèles de fondation spécialisés ont été développés pour traiter des tâches spécifiques qui vont au-delà du langage naturel. Dans ce travail, nous présentons Eywa, un cadre hétérogène d'agents conçu pour étendre les systèmes centrés sur le langage à une classe plus large de modèles de fondation scientifiques. L'idée clé d'Eywa est d'augmenter les modèles de fondation spécifiques à un domaine avec une interface de raisonnement basée sur un modèle de langage, permettant ainsi à ces modèles de guider l'inférence sur des modalités de données non linguistiques. Cette conception permet aux modèles de fondation prédictifs, généralement optimisés pour des données et des tâches spécialisées, de participer à des processus de raisonnement et de prise de décision de plus haut niveau au sein de systèmes agentiques. Eywa peut servir de remplacement direct pour un pipeline à agent unique (EywaAgent) ou être intégré dans des systèmes multi-agents existants en remplaçant les agents traditionnels par des agents spécialisés (EywaMAS). Nous étudions en outre un cadre d'orchestration basé sur la planification dans lequel un planificateur coordonne dynamiquement des agents traditionnels et des agents Eywa pour résoudre des tâches complexes impliquant des modalités de données hétérogènes (EywaOrchestra). Nous évaluons Eywa sur un ensemble varié de domaines scientifiques couvrant les sciences physiques, les sciences de la vie et les sciences sociales. Les résultats expérimentaux démontrent qu'Eywa améliore les performances sur les tâches impliquant des données structurées et spécifiques à un domaine, tout en réduisant la dépendance au raisonnement basé sur le langage grâce à une collaboration efficace avec des modèles de fondation spécialisés.

English

Agentic large language model systems have demonstrated strong capabilities. However, their reliance on language as the universal interface fundamentally limits their applicability to many real-world problems, especially in scientific domains where domain-specific foundation models have been developed to address specialized tasks beyond natural language. In this work, we introduce Eywa, a heterogeneous agentic framework designed to extend language-centric systems to a broader class of scientific foundation models. The key idea of Eywa is to augment domain-specific foundation models with a language-model-based reasoning interface, enabling language models to guide inference over non-linguistic data modalities. This design allows predictive foundation models, which are typically optimized for specialized data and tasks, to participate in higher-level reasoning and decision-making processes within agentic systems. Eywa can serve as a drop-in replacement for a single-agent pipeline (EywaAgent) or be integrated into existing multi-agent systems by replacing traditional agents with specialized agents (EywaMAS). We further investigate a planning-based orchestration framework in which a planner dynamically coordinates traditional agents and Eywa agents to solve complex tasks across heterogeneous data modalities (EywaOrchestra). We evaluate Eywa across a diverse set of scientific domains spanning physical, life, and social sciences. Experimental results demonstrate that Eywa improves performance on tasks involving structured and domain-specific data, while reducing reliance on language-based reasoning through effective collaboration with specialized foundation models.

Collaboration Hétérogène des Modèles Fondamentaux Scientifiques

Heterogeneous Scientific Foundation Model Collaboration

Résumé

Support