首页 > 基础资料博客日记

LLM | 整理了 MiroThinker 的技术报告 / 公开资料

2026-04-09 17:30:02基础资料围观1次

这篇文章介绍了LLM | 整理了 MiroThinker 的技术报告 / 公开资料，分享给大家做个参考，收藏极客资料网收获更多编程知识

整理了 MiroThinker 的技术报告和公开资料。目前 MiroThinker release 了三份技术报告，分别是 mirothinker 1.0、mirothinker 1.7 和 miroflow。

1. 官方网站
2. 开源代码与模型资源
3. 官方文档
4. 中文社区的第三方解读（人类撰写）

1. 官方网站

资源	链接	说明
项目主页	mirothinker.io	官方介绍、技术特性、模型版本对比
网页版 demo	dr.miromind.ai	网页版交互式 Demo，可直接试用
公司主页	miromind.ai	MiroMind 团队介绍与项目生态

2. 开源代码与模型资源

2.1 GitHub 仓库

主仓库：MiroMindAI/MiroThinker
MiroFlow（个人理解是一个 Deep Research agent 的框架，可能是 mirothinker 的 harness 的一部分）：MiroMindAI/MiroFlow

2.2 Hugging Face 模型

模型 / 数据集名称	参数量	上下文	工具调用	链接
MiroThinker-1.7-mini	30B	256K	300	HF 链接
MiroThinker-1.7	235B	256K	300	HF 链接
MiroThinker-v1.5-30B	30B	256K	400	HF 链接
MiroThinker-v1.5-235B	235B	256K	400	HF 链接
MiroThinker-v1.0-8B/30B/72B	多规格	256K	600	HF 集合页
MiroVerse-v0.1（数据集）	147K+ 个轨迹	/	/	HF 链接

2.3 核心项目生态

MiroMind ODR (Open Deep Research)
├── MiroThinker    → 模型（工具增强推理的大语言模型）
├── MiroFlow       → Agent框架（可复现的多智能体编排）
├── MiroVerse      → 数据集（147K+ 研究轨迹样本）
└── MiroTrain      → 训练基础设施（支持RL、长文本训练）

2.4 工作内容与算法概况

核心创新：提出 Interactive Scaling（交互式扩展） 作为模型性能的"第三维度"，与模型规模、上下文长度并列
训练方法：
- 中期训练（mid-training）强化规划与工具交互能力
- SFT + DPO + RL 三阶段优化
- 时序敏感沙盒训练，避免"未来信息泄露"
推理机制：
- 支持假设 → 搜索 → 验证 →修正的闭环推理
- 局部验证（单步逻辑）+ 全局验证（整体一致性）
- 最高支持 600 次工具调用/任务
工具集成：Web 搜索（Serper）、网页抓取（Jina）、代码执行（E2B）、文档解析、多模态处理等

3. 官方文档

官方文档

类型	链接 / 位置	内容
README	GitHub/README.md	快速开始、配置说明、基准评测
工具文档	`libs/miroflow-tools/README.md`	MCP 工具配置、API 密钥说明
部署指南	GitHub Wiki / `docs/` 目录	SGLang / vLLM 部署、量化方案、Docker 支持

技术报告

论文	arXiv ID	发布日期	核心贡献
MiroThinker: Pushing the Performance Boundaries of Open-Source Research Agents via Model, Context, and Interactive Scaling	2511.11793	2025-11	提出 Interactive Scaling，v1.0 版本基准结果
MiroThinker-1.7 & H1: Towards Heavy-Duty Research Agents via Verification	2603.15726	2026-03	引入验证机制，1.7 与 H1版本技术细节
MiroFlow: Towards High-Performance and Robust Open-Source Agent Framework	2602.22808	2026-02	Agent 框架设计，支持高并发与可复现评测

官方博客：miromind.ai/blog（感觉在技术上的信息量不大）

4. 中文社区的第三方解读（人类撰写）

发布者	文章
量子位	陈天桥代季峰打响 2026 大模型第一枪：30B 参数跑出 1T 性能（最初是看量子位的推送了解到 mirothinker 并试用，发现 deep research 表现很强）
始智 AI	MiroThinker 开源，专为深度研究和解决多步复杂任务而生
AI 产品银海	已开源！这个搜索智能体模型，思路有点不一样
开放传神（OpenCSG）	MiroThinker-1.7：当 AI 学会"慢思考"，推理能力迎来质的飞跃

文章来源:https://www.cnblogs.com/moonout/p/19841257
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系邮箱：jacktools123@163.com进行投诉反馈，一经查实，立即删除！

标签：

上一篇：AI编程一年后，我还记得怎么手写代码吗？答案让我沉默了
下一篇：复刻字节 AI 开发流：实践 Node.js 通用脚手架

首页 > 基础资料博客日记

LLM | 整理了 MiroThinker 的技术报告 / 公开资料

1. 官方网站

2. 开源代码与模型资源

3. 官方文档

4. 中文社区的第三方解读（人类撰写）

相关文章

最新发布

点击排行

本站推荐

标签云

首页 > 基础资料 博客日记

LLM | 整理了 MiroThinker 的技术报告 / 公开资料

1. 官方网站

2. 开源代码与模型资源

3. 官方文档

4. 中文社区的第三方解读（人类撰写）

相关文章

最新发布

点击排行

本站推荐

标签云

首页 > 基础资料博客日记