MiroThinker-1.7 и H1: на пути к созданию мощных исследовательских агентов с помощью верификации

Аннотация

Мы представляем MiroThinker-1.7 — нового исследовательского агента, разработанного для сложных задач с длинными горизонтами рассуждений. На этой основе мы также представляем MiroThinker-H1, который расширяет агента возможностями интенсивного логического вывода для более надежного решения многошаговых задач. В частности, MiroThinker-1.7 повышает надежность каждого шага взаимодействия за счет агентской стадии промежуточного обучения, акцентирующей структурированное планирование, контекстные рассуждения и взаимодействие с инструментами. Это обеспечивает более эффективное многошаговое взаимодействие и устойчивые рассуждения в сложных задачах. MiroThinker-H1 дополнительно интегрирует верификацию непосредственно в процесс рассуждений на локальном и глобальном уровнях. Промежуточные логические решения могут оцениваться и уточняться во время вывода, в то время как общая траектория рассуждений аудируется для обеспечения согласованных цепочек доказательств, подтверждающих итоговые ответы. В тестах, охватывающих веб-исследования, научные рассуждения и финансовый анализ, MiroThinker-H1 демонстрирует передовые результаты в задачах углубленного исследования, сохраняя при этом высокую эффективность в специализированных областях. Мы также выпускаем MiroThinker-1.7 и MiroThinker-1.7-mini в качестве открытых моделей, предлагающих конкурентоспособные возможности исследовательского агента при значительном повышении эффективности.

English

We present MiroThinker-1.7, a new research agent designed for complex long-horizon reasoning tasks. Building on this foundation, we further introduce MiroThinker-H1, which extends the agent with heavy-duty reasoning capabilities for more reliable multi-step problem solving. In particular, MiroThinker-1.7 improves the reliability of each interaction step through an agentic mid-training stage that emphasizes structured planning, contextual reasoning, and tool interaction. This enables more effective multi-step interaction and sustained reasoning across complex tasks. MiroThinker-H1 further incorporates verification directly into the reasoning process at both local and global levels. Intermediate reasoning decisions can be evaluated and refined during inference, while the overall reasoning trajectory is audited to ensure that final answers are supported by coherent chains of evidence. Across benchmarks covering open-web research, scientific reasoning, and financial analysis, MiroThinker-H1 achieves state-of-the-art performance on deep research tasks while maintaining strong results on specialized domains. We also release MiroThinker-1.7 and MiroThinker-1.7-mini as open-source models, providing competitive research-agent capabilities with significantly improved efficiency.

MiroThinker-1.7 и H1: на пути к созданию мощных исследовательских агентов с помощью верификации

MiroThinker-1.7 & H1: Towards Heavy-Duty Research Agents via Verification

Аннотация

Support