MiroThinker-1.7 y H1: Hacia Agentes de Investigación de Alto Rendimiento mediante Verificación

Resumen

Presentamos MiroThinker-1.7, un nuevo agente de investigación diseñado para tareas complejas de razonamiento de horizonte largo. Sobre esta base, presentamos además MiroThinker-H1, que extiende el agente con capacidades de razonamiento de alto rendimiento para una resolución de problemas multi-etapa más confiable. En particular, MiroThinker-1.7 mejora la fiabilidad de cada paso de interacción mediante una etapa de entrenamiento intermedio agéntico que enfatiza la planificación estructurada, el razonamiento contextual y la interacción con herramientas. Esto permite una interacción multi-etapa más efectiva y un razonamiento sostenido en tareas complejas. MiroThinker-H1 incorpora además la verificación directamente en el proceso de razonamiento a nivel tanto local como global. Las decisiones de razonamiento intermedias pueden evaluarse y refinarse durante la inferencia, mientras se audita la trayectoria general de razonamiento para garantizar que las respuestas finales estén respaldadas por cadenas coherentes de evidencia. En diversos benchmarks que cubren investigación en la web abierta, razonamiento científico y análisis financiero, MiroThinker-H1 logra un rendimiento de vanguardia en tareas de investigación profunda, manteniendo al mismo tiempo resultados sólidos en dominios especializados. También liberamos MiroThinker-1.7 y MiroThinker-1.7-mini como modelos de código abierto, ofreciendo capacidades competitivas de agente de investigación con una eficiencia significativamente mejorada.

English

We present MiroThinker-1.7, a new research agent designed for complex long-horizon reasoning tasks. Building on this foundation, we further introduce MiroThinker-H1, which extends the agent with heavy-duty reasoning capabilities for more reliable multi-step problem solving. In particular, MiroThinker-1.7 improves the reliability of each interaction step through an agentic mid-training stage that emphasizes structured planning, contextual reasoning, and tool interaction. This enables more effective multi-step interaction and sustained reasoning across complex tasks. MiroThinker-H1 further incorporates verification directly into the reasoning process at both local and global levels. Intermediate reasoning decisions can be evaluated and refined during inference, while the overall reasoning trajectory is audited to ensure that final answers are supported by coherent chains of evidence. Across benchmarks covering open-web research, scientific reasoning, and financial analysis, MiroThinker-H1 achieves state-of-the-art performance on deep research tasks while maintaining strong results on specialized domains. We also release MiroThinker-1.7 and MiroThinker-1.7-mini as open-source models, providing competitive research-agent capabilities with significantly improved efficiency.

MiroThinker-1.7 y H1: Hacia Agentes de Investigación de Alto Rendimiento mediante Verificación

MiroThinker-1.7 & H1: Towards Heavy-Duty Research Agents via Verification

Resumen

Support