MiroFlow

搜索文档
陈天桥MiroMind团队连续登顶FutureX,超越国际领先预测大模型
新浪科技· 2025-09-22 07:57
公司技术成就 - MiroMind团队搭载GPT-5的MiroFlow智能体框架在FutureX基准评测中连续两周(9月第1周和第2周)夺得榜首 超越国际顶尖机构和闭源商业模型 [1] - 公司在GAIA-Validation基准测试中取得82.4%的准确率 并在HLE、BrowseComp及xBench-DeepSearch等多项基准中领先国际对手 [2] - MiroFlow框架已对外提供完全开源且可复现的配置方案 [2] 技术特性与能力 - 采用记忆驱动机制 专为预测与决策设计 区别于专注文本输出的生成式模型 [1] - 具备四大核心能力:信息洞察力(快速抓取/整合海量数据)、逻辑推理与趋势感知(发现模式/识别因果)、概率与不确定性管理(量化风险/最优决策)、跨领域整合能力(金融/政治/科技/社会多领域融合) [1] 实证案例表现 - 成功预测2025年9月9日ATP男子单打排名第4-6位选手 [1] - 精准预测2025年9月11日Solana数字加密货币突破关键价格档位 体现对价格波动类问题的系统建模与风险控制能力 [1] 行业基准背景 - FutureX为全球首个动态实时LLM智能体未来预测基准 由字节跳动SEED团队联合斯坦福大学、复旦大学推出 [2] - 基准从全球200多个高质量网站精选下周才有明确结果的问题 涵盖股票价格、体育赛事、政治选举、科技公司战略等未来事件领域 [2]
陈天桥旗下AI公司MiroMind打造全球顶尖预测型大模型,性能登顶行业基准
机器之心· 2025-09-20 04:37
文章核心观点 - AI预测能力是衡量智能的最佳标准 未来预测将成为AI发展的重要方向 [2][4][5] - MiroMind团队开发的预测大模型在FutureX基准测试中连续夺冠 展示了在实时未来事件预测领域的领先地位 [2][8] - 预测大模型在金融、体育、政治等跨领域应用具有重大价值 能够为投资决策和风险规避提供前瞻性洞察 [2][5][13] FutureX预测基准 - 全球首个动态实时LLM智能体未来预测基准 由字节跳动SEED团队联合斯坦福大学等机构共同推出 [5] - 从200多个高质量网站精选下周才有明确结果的问题 涵盖股票价格、体育比赛、政治选举和科技公司战略走向等领域 [5] - 要求AI基于当前信息进行逻辑推理和趋势分析 推动AI在真实世界复杂场景中的实用能力提升 [5] MiroMind技术成果 - 在FutureX榜单上连续两周蝉联冠军 搭载GPT-5的MiroFlow框架位居榜首 自研模型MiroThinker位列前五 [8] - 成功预测2025年9月9日ATP男子单打排名第4-6位选手 克服网球排名系统复杂变量挑战 [10] - 准确预测2025年9月11日Solana加密货币关键价格档位突破 展现系统建模和风险控制能力 [11] - 在GAIA-Validation基准取得82.4%优异成绩 在HLE、BrowseComp和xBench-DeepSearch等测试中领先国际对手 [12] 预测方法论 - 网球排名预测采用五步策略:制定计划、获取基础数据、理解积分规则、动态信息更新、概率分析与综合判断 [13] - 加密货币预测采用六步策略:构建市场基准线、量化短期波动空间、梳理外部因素、分析市场情绪、挑选价格档位、交叉验证 [13] - 核心能力包括信息洞察力、逻辑推理与趋势感知、概率与不确定性管理、跨领域整合能力 [13] 技术框架与开源 - MiroFlow提供完全开源可复现的框架和配置 致力于建设创新者平台 [12] - 为研究者和开发者提供基础框架、模型和工具链完整支持 支持多Agent协作和多模态理解前沿探索 [12] - 自研旗舰基础智能体模型MiroThinker具备强大推理、决策和多模态理解能力 即将以完全开源形式向全球开放 [15] 行业影响与发展 - AI预测能力将改变投资和规划方式 使决策从盲目试错转向提前洞察趋势和把握机遇 [2] - 预测大模型在金融市场价格波动、体育赛事结果、政治选举等跨领域应用展现巨大潜力 [5][10][11] - 陈天桥旗下MiroMind团队从网络游戏、脑科学研究转向AI预测前沿探索 正在开发长期记忆模块嵌入模型 [17][18]
独家|陈天桥布局端到端Deep Research生态赛道,MiroMind发布全栈开源深度研究项目ODR
Z Potentials· 2025-08-09 04:50
公司概况 - 专注于构建具有自主意识的数字Agent,目标是为全人类实现安全可控的AGI,核心理念是AGI为持续迭代的动态系统而非固化模型 [2] - 愿景成为人工智能创新领域的全球领军者,聚焦基础模型及下一代智能关键技术的前沿探索,强调长期主义、开发者友好和系统开放理念 [2] - 由前中国首富陈天桥创办,其曾创立盛大网络并保持中国最年轻内地首富纪录(31岁),近年All in AI+脑科学领域,孵化多家AI创业公司并捐赠5000万元成立复旦天桥人工智能研究院 [4] 技术架构与性能 - 全栈开源生态系统:包含Agent框架(MiroFlow)、模型(MiroThinker)、数据(MiroVerse)和训练基础设施(MiroTrain/MiroRL),所有组件开放共享 [1][8] - SOTA级性能:MiroFlow搭配商用模型API在GAIA验证集得分82.4,超越现有商用API;搭配开源MiroThinker模型在GAIA-Text-103数据集达60.2%性能,接近OpenAI Deep Research水平 [1][15] - 可复现性:MiroFlow框架代码和配置开源,第三方可复现GAIA验证集82.4的高性能表现 [13] 核心团队与技术背景 - 清华电子工程系副教授代季峰领衔,其研究成果包括可变形卷积Deformable ConvNets(PyTorch标准算子)、BEVFormer(自动驾驶多相机感知里程碑)、UniAD(CVPR 2023最佳论文)等 [5][6] - 代季峰开发的InternVL多模态基础模型Hugging Face下载量超1000万次,论文总引用6万余次 [6] 开发者生态 - 提供147k开源训练数据(MiroVerse),按月更新并响应社区反馈 [12] - 社区活动包括竞赛、排行榜、Hackathons,开发者可直接影响项目发展 [1][22] - 支持数据需求提报、功能定制与技术挑战,覆盖数据工程师、AI研究员等多角色参与 [22] 行业定位与竞品对比 - 对标OpenAI Deep Research概念,构建开源协作的深度研究生态系统(Agent框架+模型+数据+训练设施) [7] - 在GAIA性能表现上显著领先竞品:MiroMind ODR得分82.4,远超OpenAI Deep Research(67.4)、Manus(73.3)等 [10]