Heterogene Kollaboration wissenschaftlicher Grundlagenmodelle

Zusammenfassung

Agentische Systeme mit großen Sprachmodellen haben beeindruckende Fähigkeiten demonstriert. Ihre Abhängigkeit von Sprache als universeller Schnittstelle begrenzt jedoch grundlegend ihre Anwendbarkeit auf viele reale Probleme, insbesondere in wissenschaftlichen Domänen, in denen domänenspezifische Foundation-Modelle entwickelt wurden, um spezialisierte Aufgaben jenseits natürlicher Sprache zu bewältigen. In dieser Arbeit stellen wir Eywa vor, ein heterogenes agentisches Framework, das darauf ausgelegt ist, sprachzentrierte Systeme auf eine breitere Klasse wissenschaftlicher Foundation-Modelle auszudehnen. Die Kernidee von Eywa besteht darin, domänenspezifische Foundation-Modelle mit einer sprachmodellbasierten Reasoning-Schnittstelle zu erweitern, um Sprachmodellen zu ermöglichen, Inferenzen über nicht-linguistische Datenmodalitäten zu steuern. Dieser Entwurf ermöglicht es prädiktiven Foundation-Modellen, die typischerweise für spezialisierte Daten und Aufgaben optimiert sind, an höherwertigen Reasoning- und Entscheidungsprozessen innerhalb agentischer Systeme teilzunehmen. Eywa kann als direkter Ersatz für eine Single-Agent-Pipeline (EywaAgent) dienen oder in bestehende Multi-Agenten-Systeme integriert werden, indem traditionelle Agenten durch spezialisierte Agenten ersetzt werden (EywaMAS). Wir untersuchen weiterhin ein planungsbasiertes Orchestrierungsframework, in dem ein Planner dynamisch traditionelle Agenten und Eywa-Agenten koordiniert, um komplexe Aufgaben über heterogene Datenmodalitäten hinweg zu lösen (EywaOrchestra). Wir evaluieren Eywa in einer Vielzahl wissenschaftlicher Domänen aus den Bereichen Physik, Lebens- und Sozialwissenschaften. Experimentelle Ergebnisse zeigen, dass Eywa die Leistung bei Aufgaben mit strukturierten und domänenspezifischen Daten verbessert, während die Abhängigkeit von sprachbasiertem Reasoning durch effektive Zusammenarbeit mit spezialisierten Foundation-Modellen verringert wird.

English

Agentic large language model systems have demonstrated strong capabilities. However, their reliance on language as the universal interface fundamentally limits their applicability to many real-world problems, especially in scientific domains where domain-specific foundation models have been developed to address specialized tasks beyond natural language. In this work, we introduce Eywa, a heterogeneous agentic framework designed to extend language-centric systems to a broader class of scientific foundation models. The key idea of Eywa is to augment domain-specific foundation models with a language-model-based reasoning interface, enabling language models to guide inference over non-linguistic data modalities. This design allows predictive foundation models, which are typically optimized for specialized data and tasks, to participate in higher-level reasoning and decision-making processes within agentic systems. Eywa can serve as a drop-in replacement for a single-agent pipeline (EywaAgent) or be integrated into existing multi-agent systems by replacing traditional agents with specialized agents (EywaMAS). We further investigate a planning-based orchestration framework in which a planner dynamically coordinates traditional agents and Eywa agents to solve complex tasks across heterogeneous data modalities (EywaOrchestra). We evaluate Eywa across a diverse set of scientific domains spanning physical, life, and social sciences. Experimental results demonstrate that Eywa improves performance on tasks involving structured and domain-specific data, while reducing reliance on language-based reasoning through effective collaboration with specialized foundation models.

Heterogene Kollaboration wissenschaftlicher Grundlagenmodelle

Heterogeneous Scientific Foundation Model Collaboration

Zusammenfassung

Support