MiroThinker-1.7 e H1: Verso Agenti di Ricerca Robusti tramite Verifica

Abstract

Presentiamo MiroThinker-1.7, un nuovo agente di ricerca progettato per compiti complessi di ragionamento a lungo termine. Sviluppando questa base, introduciamo ulteriormente MiroThinker-H1, che estende le capacità dell'agente con funzionalità di ragionamento avanzato per una risoluzione dei problemi multi-step più affidabile. In particolare, MiroThinker-1.7 migliora l'affidabilità di ogni fase di interazione attraverso uno stadio di mid-training agentico che enfatizza la pianificazione strutturata, il ragionamento contestuale e l'interazione con strumenti. Ciò consente un'interazione multi-step più efficace e un ragionamento prolungato attraverso compiti complessi. MiroThinker-H1 incorpora ulteriormente la verifica direttamente nel processo di ragionamento sia a livello locale che globale. Le decisioni di ragionamento intermedie possono essere valutate e affinate durante l'inferenza, mentre la traiettoria complessiva del ragionamento viene verificata per garantire che le risposte finali siano supportate da catene coerenti di evidenze. Attraverso benchmark che coprono la ricerca sul web aperto, il ragionamento scientifico e l'analisi finanziaria, MiroThinker-H1 raggiunge prestazioni all'avanguardia in compiti di ricerca approfondita mantenendo risultati solidi in domini specializzati. Rilasciamo inoltre MiroThinker-1.7 e MiroThinker-1.7-mini come modelli open-source, fornendo capacità competitive di agente di ricerca con un'efficienza significativamente migliorata.

English

We present MiroThinker-1.7, a new research agent designed for complex long-horizon reasoning tasks. Building on this foundation, we further introduce MiroThinker-H1, which extends the agent with heavy-duty reasoning capabilities for more reliable multi-step problem solving. In particular, MiroThinker-1.7 improves the reliability of each interaction step through an agentic mid-training stage that emphasizes structured planning, contextual reasoning, and tool interaction. This enables more effective multi-step interaction and sustained reasoning across complex tasks. MiroThinker-H1 further incorporates verification directly into the reasoning process at both local and global levels. Intermediate reasoning decisions can be evaluated and refined during inference, while the overall reasoning trajectory is audited to ensure that final answers are supported by coherent chains of evidence. Across benchmarks covering open-web research, scientific reasoning, and financial analysis, MiroThinker-H1 achieves state-of-the-art performance on deep research tasks while maintaining strong results on specialized domains. We also release MiroThinker-1.7 and MiroThinker-1.7-mini as open-source models, providing competitive research-agent capabilities with significantly improved efficiency.

MiroThinker-1.7 e H1: Verso Agenti di Ricerca Robusti tramite Verifica

MiroThinker-1.7 & H1: Towards Heavy-Duty Research Agents via Verification

Abstract

Support