首页 > 基础资料 博客日记
LLM | 整理了 MiroThinker 的技术报告 / 公开资料
2026-04-09 17:30:02基础资料围观1次
这篇文章介绍了LLM | 整理了 MiroThinker 的技术报告 / 公开资料,分享给大家做个参考,收藏极客资料网收获更多编程知识
整理了 MiroThinker 的技术报告和公开资料。目前 MiroThinker release 了三份技术报告,分别是 mirothinker 1.0、mirothinker 1.7 和 miroflow。
1. 官方网站
| 资源 | 链接 | 说明 |
|---|---|---|
| 项目主页 | mirothinker.io | 官方介绍、技术特性、模型版本对比 |
| 网页版 demo | dr.miromind.ai | 网页版交互式 Demo,可直接试用 |
| 公司主页 | miromind.ai | MiroMind 团队介绍与项目生态 |
2. 开源代码与模型资源
2.1 GitHub 仓库
- 主仓库:MiroMindAI/MiroThinker
- MiroFlow(个人理解是一个 Deep Research agent 的框架,可能是 mirothinker 的 harness 的一部分):MiroMindAI/MiroFlow
2.2 Hugging Face 模型
| 模型 / 数据集名称 | 参数量 | 上下文 | 工具调用 | 链接 |
|---|---|---|---|---|
| MiroThinker-1.7-mini | 30B | 256K | 300 | HF 链接 |
| MiroThinker-1.7 | 235B | 256K | 300 | HF 链接 |
| MiroThinker-v1.5-30B | 30B | 256K | 400 | HF 链接 |
| MiroThinker-v1.5-235B | 235B | 256K | 400 | HF 链接 |
| MiroThinker-v1.0-8B/30B/72B | 多规格 | 256K | 600 | HF 集合页 |
| MiroVerse-v0.1(数据集) | 147K+ 个轨迹 | / | / | HF 链接 |
2.3 核心项目生态
MiroMind ODR (Open Deep Research)
├── MiroThinker → 模型(工具增强推理的大语言模型)
├── MiroFlow → Agent框架(可复现的多智能体编排)
├── MiroVerse → 数据集(147K+ 研究轨迹样本)
└── MiroTrain → 训练基础设施(支持RL、长文本训练)
2.4 工作内容与算法概况
- 核心创新:提出 Interactive Scaling(交互式扩展) 作为模型性能的"第三维度",与模型规模、上下文长度并列
- 训练方法:
- 中期训练(mid-training)强化规划与工具交互能力
- SFT + DPO + RL 三阶段优化
- 时序敏感沙盒训练,避免"未来信息泄露"
- 推理机制:
- 支持假设 → 搜索 → 验证 →修正的闭环推理
- 局部验证(单步逻辑)+ 全局验证(整体一致性)
- 最高支持 600 次工具调用/任务
- 工具集成:Web 搜索(Serper)、网页抓取(Jina)、代码执行(E2B)、文档解析、多模态处理等
3. 官方文档
官方文档
| 类型 | 链接 / 位置 | 内容 |
|---|---|---|
| README | GitHub/README.md | 快速开始、配置说明、基准评测 |
| 工具文档 | libs/miroflow-tools/README.md |
MCP 工具配置、API 密钥说明 |
| 部署指南 | GitHub Wiki / docs/ 目录 |
SGLang / vLLM 部署、量化方案、Docker 支持 |
技术报告
| 论文 | arXiv ID | 发布日期 | 核心贡献 |
|---|---|---|---|
| MiroThinker: Pushing the Performance Boundaries of Open-Source Research Agents via Model, Context, and Interactive Scaling | 2511.11793 | 2025-11 | 提出 Interactive Scaling,v1.0 版本基准结果 |
| MiroThinker-1.7 & H1: Towards Heavy-Duty Research Agents via Verification | 2603.15726 | 2026-03 | 引入验证机制,1.7 与 H1版本技术细节 |
| MiroFlow: Towards High-Performance and Robust Open-Source Agent Framework | 2602.22808 | 2026-02 | Agent 框架设计,支持高并发与可复现评测 |
官方博客:miromind.ai/blog(感觉在技术上的信息量不大)
4. 中文社区的第三方解读(人类撰写)
| 发布者 | 文章 |
|---|---|
| 量子位 | 陈天桥代季峰打响 2026 大模型第一枪:30B 参数跑出 1T 性能(最初是看量子位的推送 了解到 mirothinker 并试用,发现 deep research 表现很强) |
| 始智 AI | MiroThinker 开源,专为深度研究和解决多步复杂任务而生 |
| AI 产品银海 | 已开源!这个搜索智能体模型,思路有点不一样 |
| 开放传神(OpenCSG) | MiroThinker-1.7:当 AI 学会"慢思考",推理能力迎来质的飞跃 |
文章来源:https://www.cnblogs.com/moonout/p/19841257
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:jacktools123@163.com进行投诉反馈,一经查实,立即删除!
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:jacktools123@163.com进行投诉反馈,一经查实,立即删除!
标签:

