Colaboración Heterogénea de Modelos Fundamentales Científicos

Resumen

Los sistemas agentes de modelos de lenguaje grande han demostrado capacidades sólidas. Sin embargo, su dependencia del lenguaje como interfaz universal limita fundamentalmente su aplicabilidad a muchos problemas del mundo real, especialmente en dominios científicos donde se han desarrollado modelos de base específicos para abordar tareas especializadas más allá del lenguaje natural. En este trabajo, presentamos Eywa, un marco de agentes heterogéneo diseñado para extender los sistemas centrados en el lenguaje a una clase más amplia de modelos de base científicos. La idea clave de Eywa es aumentar los modelos de base específicos de dominio con una interfaz de razonamiento basada en modelos de lenguaje, permitiendo que estos guíen la inferencia sobre modalidades de datos no lingüísticas. Este diseño permite que los modelos de base predictivos, que normalmente están optimizados para datos y tareas especializadas, participen en procesos de razonamiento y toma de decisiones de alto nivel dentro de sistemas agentes. Eywa puede servir como reemplazo directo para una pipeline de agente único (EywaAgent) o integrarse en sistemas multiagente existentes reemplazando agentes tradicionales con agentes especializados (EywaMAS). Además, investigamos un marco de orquestación basado en planificación donde un planificador coordina dinámicamente agentes tradicionales y agentes Eywa para resolver tareas complejas en modalidades de datos heterogéneas (EywaOrchestra). Evaluamos Eywa en un conjunto diverso de dominios científicos que abarcan ciencias físicas, de la vida y sociales. Los resultados experimentales demuestran que Eywa mejora el rendimiento en tareas que involucran datos estructurados y específicos de dominio, mientras reduce la dependencia del razonamiento basado en lenguaje mediante una colaboración efectiva con modelos de base especializados.

English

Agentic large language model systems have demonstrated strong capabilities. However, their reliance on language as the universal interface fundamentally limits their applicability to many real-world problems, especially in scientific domains where domain-specific foundation models have been developed to address specialized tasks beyond natural language. In this work, we introduce Eywa, a heterogeneous agentic framework designed to extend language-centric systems to a broader class of scientific foundation models. The key idea of Eywa is to augment domain-specific foundation models with a language-model-based reasoning interface, enabling language models to guide inference over non-linguistic data modalities. This design allows predictive foundation models, which are typically optimized for specialized data and tasks, to participate in higher-level reasoning and decision-making processes within agentic systems. Eywa can serve as a drop-in replacement for a single-agent pipeline (EywaAgent) or be integrated into existing multi-agent systems by replacing traditional agents with specialized agents (EywaMAS). We further investigate a planning-based orchestration framework in which a planner dynamically coordinates traditional agents and Eywa agents to solve complex tasks across heterogeneous data modalities (EywaOrchestra). We evaluate Eywa across a diverse set of scientific domains spanning physical, life, and social sciences. Experimental results demonstrate that Eywa improves performance on tasks involving structured and domain-specific data, while reducing reliance on language-based reasoning through effective collaboration with specialized foundation models.

Colaboración Heterogénea de Modelos Fundamentales Científicos

Heterogeneous Scientific Foundation Model Collaboration

Resumen

Support