MiroThinker-1.7 & H1: Auf dem Weg zu leistungsstarken Forschungsagenten durch Verifikation

Zusammenfassung

Wir stellen MiroThinker-1.7 vor, einen neuen Forschungsagenten für komplexe langfristige Denkaufgaben. Auf dieser Grundlage führen wir weiterhin MiroThinker-H1 ein, das den Agenten um leistungsstarke Denkfähigkeiten für zuverlässigeres mehrstufiges Problemlösen erweitert. Insbesondere verbessert MiroThinker-1.7 die Zuverlässigkeit jedes Interaktionsschritts durch eine agentenbasierte Zwischentrainingsphase, die strukturierte Planung, kontextbezogenes Denken und Werkzeuginteraktion betont. Dies ermöglicht effektivere mehrstufige Interaktion und nachhaltiges Denken bei komplexen Aufgaben. MiroThinker-H1 integriert Verifikation direkt in den Denkprozess auf lokaler und globaler Ebene. Zwischenentscheidungen können während der Inferenz bewertet und verfeinert werden, während der gesamte Denkpfad überprüft wird, um sicherzustellen, dass Endantworten durch kohärente Beweisketten gestützt werden. In Benchmarks zu webbasierter Recherche, wissenschaftlichem Denken und Finanzanalyse erzielt MiroThinker-H1 Spitzenleistungen bei anspruchsvollen Forschungsaufgaben und behält gleichzeitig starke Ergebnisse in spezialisierten Domänen bei. Wir veröffentlichen zudem MiroThinker-1.7 und MiroThinker-1.7-mini als Open-Source-Modelle, die wettbewerbsfähige Forschungsagenten-Fähigkeiten mit deutlich verbesserter Effizienz bieten.

English

We present MiroThinker-1.7, a new research agent designed for complex long-horizon reasoning tasks. Building on this foundation, we further introduce MiroThinker-H1, which extends the agent with heavy-duty reasoning capabilities for more reliable multi-step problem solving. In particular, MiroThinker-1.7 improves the reliability of each interaction step through an agentic mid-training stage that emphasizes structured planning, contextual reasoning, and tool interaction. This enables more effective multi-step interaction and sustained reasoning across complex tasks. MiroThinker-H1 further incorporates verification directly into the reasoning process at both local and global levels. Intermediate reasoning decisions can be evaluated and refined during inference, while the overall reasoning trajectory is audited to ensure that final answers are supported by coherent chains of evidence. Across benchmarks covering open-web research, scientific reasoning, and financial analysis, MiroThinker-H1 achieves state-of-the-art performance on deep research tasks while maintaining strong results on specialized domains. We also release MiroThinker-1.7 and MiroThinker-1.7-mini as open-source models, providing competitive research-agent capabilities with significantly improved efficiency.

MiroThinker-1.7 & H1: Auf dem Weg zu leistungsstarken Forschungsagenten durch Verifikation

MiroThinker-1.7 & H1: Towards Heavy-Duty Research Agents via Verification

Zusammenfassung

Support