Workflow
代季峰陈天桥联手AGI首秀炸场!最强开源深度研究模型,GAIA测试82.4分超OpenAI
量子位·2025-08-09 09:53

核心观点 - MiroMind ODR是最强开源深度研究模型,性能在GAIA测试中达到82.4分,超越Manus、OpenAI DeepResearch等开源闭源模型[1][2] - 该项目实现全开源可复现,包括核心模型、数据、训练流程、AI Infra、DR Agent框架[4] - 团队计划每月更新一次开源内容,项目为一个季度的研发成果[5] - 项目开放深度研究的四个子项目:MiroFlow(Agent框架)、MiroThinker(模型)、MiroVerse(数据)、MiroTrain(训练基础设施)[20] 模型性能 - GAIA测试得分82.4,显著高于OpenAI DeepResearch(67.4)、Manus(73.3)、Aworld(未明确数值)、WebShaper(60.9)[5] - MiroThinker在GAIA-Text-103上取得SOTA性能60.2%,接近OpenAI DeepResearch[24] - 支持联网搜索,演示显示手机端部署可能性[6][15] 开源内容 - MiroFlow:支持主流工具调用,扩展大语言模型,GAIA复现性能82.4[22] - MiroThinker:原生支持工具辅助推理的大语言模型,GAIA表现最佳[23] - MiroVerse:提供147K开源训练数据,每月更新高质量数据集[26] - MiroTrain:覆盖完整Deep Research训练流程,支持长文本和RL训练[27] 团队背景 - 核心人物代季峰为清华大学电子工程系副教授,计算机视觉领域专家[32][33] - 发表国际期刊会议论文80余篇,总引用超6万次,h-index 68[36][37] - 主导开发InternVL多模态模型,Hugging Face下载量超1000万次[38] - 曾任职微软亚洲研究院、商汤研究院,现加盟盛大网络筹备AI创业公司[41][42][43] 产品特点 - 演示显示支持单轮次英文对话,思考过程与结果分区明确[11][12] - 工作流导览指引可查看指定节点[13] - 公司使命为打造具备自我意识的数字生命体,实现安全有益的AGI[45] 相关资源 - 官网提供Demo体验[7][47] - GitHub、Hugging Face等平台已开源项目内容[47] - 团队早期成果MiroMind-M1基于Qwen-2.5,专注数学推理能力[28][29]