MiroThinker-1.7 & H1 : Vers des agents de recherche robustes par la vérification

Résumé

Nous présentons MiroThinker-1.7, un nouvel agent de recherche conçu pour les tâches de raisonnement complexes à long horizon. Sur cette base, nous introduisons également MiroThinker-H1, qui étend les capacités de l'agent avec un raisonnement approfondi pour une résolution de problèmes multi-étapes plus fiable. En particulier, MiroThinker-1.7 améliore la fiabilité de chaque étape d'interaction grâce à une phase d'entraînement intermédiaire qui met l'accent sur la planification structurée, le raisonnement contextuel et l'interaction avec des outils. Cela permet une interaction multi-étapes plus efficace et un raisonnement soutenu pour les tâches complexes. MiroThinker-H1 intègre en outre une vérification directement dans le processus de raisonnement, aux niveaux local et global. Les décisions de raisonnement intermédiaires peuvent être évaluées et affinées lors de l'inférence, tandis que la trajectoire globale du raisonnement est auditée pour garantir que les réponses finales s'appuient sur des chaînes de preuves cohérentes. Sur des benchmarks couvrant la recherche web ouverte, le raisonnement scientifique et l'analyse financière, MiroThinker-H1 obtient des performances à la pointe de l'état de l'art pour les tâches de recherche approfondie, tout en maintenant des résultats solides dans des domaines spécialisés. Nous publions également MiroThinker-1.7 et MiroThinker-1.7-mini en tant que modèles open-source, offrant des capacités compétitives d'agent de recherche avec une efficacité nettement améliorée.

English

We present MiroThinker-1.7, a new research agent designed for complex long-horizon reasoning tasks. Building on this foundation, we further introduce MiroThinker-H1, which extends the agent with heavy-duty reasoning capabilities for more reliable multi-step problem solving. In particular, MiroThinker-1.7 improves the reliability of each interaction step through an agentic mid-training stage that emphasizes structured planning, contextual reasoning, and tool interaction. This enables more effective multi-step interaction and sustained reasoning across complex tasks. MiroThinker-H1 further incorporates verification directly into the reasoning process at both local and global levels. Intermediate reasoning decisions can be evaluated and refined during inference, while the overall reasoning trajectory is audited to ensure that final answers are supported by coherent chains of evidence. Across benchmarks covering open-web research, scientific reasoning, and financial analysis, MiroThinker-H1 achieves state-of-the-art performance on deep research tasks while maintaining strong results on specialized domains. We also release MiroThinker-1.7 and MiroThinker-1.7-mini as open-source models, providing competitive research-agent capabilities with significantly improved efficiency.

MiroThinker-1.7 & H1 : Vers des agents de recherche robustes par la vérification

MiroThinker-1.7 & H1: Towards Heavy-Duty Research Agents via Verification

Résumé

Support