MiroThinker-1.7 & H1: Rumo a Agentes de Pesquisa de Alto Desempenho por meio de Verificação

Resumo

Apresentamos o MiroThinker-1.7, um novo agente de pesquisa projetado para tarefas complexas de raciocínio de longo horizonte. Com base nessa fundação, introduzimos ainda o MiroThinker-H1, que estende o agente com capacidades de raciocínio robustas para uma resolução de problemas em múltiplas etapas mais confiável. Especificamente, o MiroThinker-1.7 melhora a confiabilidade de cada etapa de interação por meio de uma fase de mid-training agentiva que enfatiza o planejamento estruturado, o raciocínio contextual e a interação com ferramentas. Isso permite uma interação multi-etapa mais eficaz e um raciocínio sustentado em tarefas complexas. O MiroThinker-H1 incorpora ainda a verificação diretamente no processo de raciocínio, tanto em níveis locais quanto globais. Decisões de raciocínio intermediárias podem ser avaliadas e refinadas durante a inferência, enquanto a trajetória geral de raciocínio é auditada para garantir que as respostas finais sejam respaldadas por cadeias coerentes de evidências. Em benchmarks que abrangem pesquisa na web aberta, raciocínio científico e análise financeira, o MiroThinker-H1 alcança desempenho state-of-the-art em tarefas de pesquisa aprofundada, mantendo ao mesmo tempo resultados sólidos em domínios especializados. Também disponibilizamos o MiroThinker-1.7 e o MiroThinker-1.7-mini como modelos de código aberto, oferecendo capacidades competitivas de agente de pesquisa com eficiência significativamente melhorada.

English

We present MiroThinker-1.7, a new research agent designed for complex long-horizon reasoning tasks. Building on this foundation, we further introduce MiroThinker-H1, which extends the agent with heavy-duty reasoning capabilities for more reliable multi-step problem solving. In particular, MiroThinker-1.7 improves the reliability of each interaction step through an agentic mid-training stage that emphasizes structured planning, contextual reasoning, and tool interaction. This enables more effective multi-step interaction and sustained reasoning across complex tasks. MiroThinker-H1 further incorporates verification directly into the reasoning process at both local and global levels. Intermediate reasoning decisions can be evaluated and refined during inference, while the overall reasoning trajectory is audited to ensure that final answers are supported by coherent chains of evidence. Across benchmarks covering open-web research, scientific reasoning, and financial analysis, MiroThinker-H1 achieves state-of-the-art performance on deep research tasks while maintaining strong results on specialized domains. We also release MiroThinker-1.7 and MiroThinker-1.7-mini as open-source models, providing competitive research-agent capabilities with significantly improved efficiency.