Colaboração Heterogênea de Modelos de Fundação Científica

Resumo

Os sistemas de modelos de linguagem grandes (LLMs) agentivos têm demonstrado capacidades robustas. No entanto, a sua dependência da linguagem como interface universal limita fundamentalmente a sua aplicabilidade a muitos problemas do mundo real, especialmente em domínios científicos onde modelos de base (foundation models) específicos de domínio foram desenvolvidos para lidar com tarefas especializadas que vão além da linguagem natural. Neste trabalho, apresentamos o Eywa, um framework agentivo heterogéneo concebido para estender os sistemas centrados em linguagem a uma classe mais ampla de modelos de base científicos. A ideia central do Eywa é aumentar modelos de base específicos de domínio com uma interface de raciocínio baseada em modelos de linguagem, permitindo que estes guiem a inferência sobre modalidades de dados não linguísticas. Este projeto permite que modelos de base preditivos, normalmente otimizados para dados e tarefas especializadas, participem em processos de raciocínio e tomada de decisão de alto nível dentro de sistemas agentivos. O Eywa pode funcionar como um substituto direto para um pipeline de agente único (EywaAgent) ou ser integrado em sistemas multiagente existentes, substituindo os agentes tradicionais por agentes especializados (EywaMAS). Investigamos ainda um framework de orquestração baseado em planeamento, no qual um planeador coordena dinamicamente agentes tradicionais e agentes Eywa para resolver tarefas complexas em diversas modalidades de dados heterogéneas (EywaOrchestra). Avaliamos o Eywa num conjunto diversificado de domínios científicos, abrangindo ciências físicas, da vida e sociais. Os resultados experimentais demonstram que o Eywa melhora o desempenho em tarefas que envolvem dados estruturados e específicos de domínio, ao mesmo tempo que reduz a dependência do raciocínio baseado em linguagem através de uma colaboração eficaz com modelos de base especializados.

English

Agentic large language model systems have demonstrated strong capabilities. However, their reliance on language as the universal interface fundamentally limits their applicability to many real-world problems, especially in scientific domains where domain-specific foundation models have been developed to address specialized tasks beyond natural language. In this work, we introduce Eywa, a heterogeneous agentic framework designed to extend language-centric systems to a broader class of scientific foundation models. The key idea of Eywa is to augment domain-specific foundation models with a language-model-based reasoning interface, enabling language models to guide inference over non-linguistic data modalities. This design allows predictive foundation models, which are typically optimized for specialized data and tasks, to participate in higher-level reasoning and decision-making processes within agentic systems. Eywa can serve as a drop-in replacement for a single-agent pipeline (EywaAgent) or be integrated into existing multi-agent systems by replacing traditional agents with specialized agents (EywaMAS). We further investigate a planning-based orchestration framework in which a planner dynamically coordinates traditional agents and Eywa agents to solve complex tasks across heterogeneous data modalities (EywaOrchestra). We evaluate Eywa across a diverse set of scientific domains spanning physical, life, and social sciences. Experimental results demonstrate that Eywa improves performance on tasks involving structured and domain-specific data, while reducing reliance on language-based reasoning through effective collaboration with specialized foundation models.

Colaboração Heterogênea de Modelos de Fundação Científica

Heterogeneous Scientific Foundation Model Collaboration

Resumo

Support