Collaborazione Eterogenea tra Modelli Fondamentali Scientifici

Abstract

I sistemi agentici basati su grandi modelli linguistici hanno dimostrato notevoli capacità. Tuttavia, la loro dipendenza dal linguaggio come interfaccia universale ne limita fondamentalmente l'applicabilità a molti problemi del mondo reale, specialmente in ambiti scientifici dove sono stati sviluppati modelli fondativi dominio-specifici per affrontare compiti specializzati che vanno oltre il linguaggio naturale. In questo lavoro, introduciamo Eywa, un framework agentico eterogeneo progettato per estendere i sistemi centrati sul linguaggio a una più ampia classe di modelli fondativi scientifici. L'idea chiave di Eywa è potenziare i modelli fondativi dominio-specifici con un'interfaccia di ragionamento basata su modelli linguistici, consentendo a questi ultimi di guidare l'inferenza su modalità di dati non linguistiche. Questo progetto permette a modelli fondativi previsionali, tipicamente ottimizzati per dati e compiti specializzati, di partecipare a processi di ragionamento e decisione di livello superiore all'interno di sistemi agentici. Eywa può fungere da sostituto immediato per una pipeline ad agente singolo (EywaAgent) o essere integrato in sistemi multi-agente esistenti sostituendo gli agenti tradizionali con agenti specializzati (EywaMAS). Investigiamo inoltre un framework di orchestrazione basato sulla pianificazione, in cui un pianificatore coordina dinamicamente agenti tradizionali e agenti Eywa per risolvere compiti complessi attraverso modalità di dati eterogenee (EywaOrchestra). Valutiamo Eywa in un'ampia gamma di domini scientifici che spaziano dalle scienze fisiche, alle scienze della vita, fino alle scienze sociali. I risultati sperimentali dimostrano che Eywa migliora le prestazioni in compiti che coinvolgono dati strutturati e dominio-specifici, riducendo al contempo la dipendenza dal ragionamento basato sul linguaggio attraverso un'efficace collaborazione con modelli fondativi specializzati.

English

Agentic large language model systems have demonstrated strong capabilities. However, their reliance on language as the universal interface fundamentally limits their applicability to many real-world problems, especially in scientific domains where domain-specific foundation models have been developed to address specialized tasks beyond natural language. In this work, we introduce Eywa, a heterogeneous agentic framework designed to extend language-centric systems to a broader class of scientific foundation models. The key idea of Eywa is to augment domain-specific foundation models with a language-model-based reasoning interface, enabling language models to guide inference over non-linguistic data modalities. This design allows predictive foundation models, which are typically optimized for specialized data and tasks, to participate in higher-level reasoning and decision-making processes within agentic systems. Eywa can serve as a drop-in replacement for a single-agent pipeline (EywaAgent) or be integrated into existing multi-agent systems by replacing traditional agents with specialized agents (EywaMAS). We further investigate a planning-based orchestration framework in which a planner dynamically coordinates traditional agents and Eywa agents to solve complex tasks across heterogeneous data modalities (EywaOrchestra). We evaluate Eywa across a diverse set of scientific domains spanning physical, life, and social sciences. Experimental results demonstrate that Eywa improves performance on tasks involving structured and domain-specific data, while reducing reliance on language-based reasoning through effective collaboration with specialized foundation models.

Collaborazione Eterogenea tra Modelli Fondamentali Scientifici

Heterogeneous Scientific Foundation Model Collaboration

Abstract

Support