Workflow
MiroFlow智能体框架
icon
搜索文档
陈天桥MiroMind团队连续登顶FutureX,超越国际领先预测大模型;美团发布高效推理模型丨AIGC日报
创业邦· 2025-09-23 00:14
1.【陈天桥MiroMind团队连续登顶FutureX,超越国际领先预测大模型】9月22日下午消息,据动态 实时LLM智能体未来预测基准FutureX最新评测结果,慈善家陈天桥创立的AI公司MiroMind团队搭载 GPT-5的MiroFlow智能体框架,已在9月第1周和第2周连续夺得榜首,超越众多国际顶尖机构和闭 源商业模型。据悉,与专注文本输出的生成式模型不同,MiroMind采用记忆驱动机制,专为预测与 决策设计,旨在打造全球最好的预测大模型。在测试中,MiroMind成功预测了2025年9月9日ATP男 子单打排名第4-6位的选手,同时还成功预测了2025年9月11日数字加密货币Solana将突破的一系 列关键价格档位,体现了模型在处理价格波动类问题上的系统建模能力与风险控制水平。(新浪科 技) 更多AIGC资讯…… 2.【美团发布高效推理模型LongCat-Flash-Thinking】9月22日消息,美团今日发布高效推理模型 LongCat-Flash-Thinking。新模型是中国首个兼具"深度思考+工具调用"与"非形式化+形式化"推理 能力的大语言模型,在逻辑、数学、代码、智能体等多领域推理任 ...
重磅!陈天桥创立的AI公司MiroMind打造出全球顶尖预测型大模型,性能领先行业基准
钛媒体APP· 2025-09-21 15:47
公司技术成就 - MiroMind在FutureX基准测试中连续两周蝉联冠军 搭载GPT-5的MiroFlow智能体框架在9月第1周和第2周位列榜首 自研模型MiroThinker均位列前五 [2] - MiroMind采用记忆驱动机制 专为预测与决策设计 与专注文本输出的生成式模型不同 [2] - 在测试中成功预测2025年9月9日ATP男子单打排名第4-6位选手 难点在于网球排名系统涉及积分计算 比赛结果 时间窗口等多个变量 [8] - MiroMind ODR项目V0.1版本GAIA测试达82.4分 性能超越OpenAI的DeepResearch(67.4分)和Manus(73.3分)等开源和闭源AI深度研究模型 [10][11] - MiroFlow框架在GAIA-Validation上取得82.4%的优异成绩 在多个基准测试中领先国际对手 [12] - 自研旗舰基础智能体模型MiroThinker具备强大推理 决策和多模态理解能力 能在多Agent协作中发挥核心作用 [12] - 模型采取六步策略预测男子网球排名 包括制定预测计划 建立基准线 研究积分规则 搜索比赛成绩 多情景分析和概率验证 [13] - 在预测Solana加密货币价格突破关键档位时 通过交叉验证确定最优预测选项 体现系统建模能力与风险控制水平 [13] 技术架构与开源策略 - MiroMind ODR项目完全开源且可复现 核心模型 数据 训练流程 AI Infra DR Agent框架统统开源 [11] - 项目主要包括MiroFlow MiroThinker MiroVerse和MiroTrain四个子项目 可在手机端运行 [12] - 团队以每月一次开源更新的速度同社区一起创作最强深度研究模型 [11] - MiroThinker很快将以完全开源形式向全球开发者和研究者开放 提供可复现的模型和实验环境 [12] - MiroFlow提供完全开源 可复现的框架和配置 致力于建设创新者平台 [12] 团队背景与资源支持 - 由陈天桥与清华大学电子工程系副教授代季峰联手筹备 目标是打造下一个OpenAI 围绕AGI展开基础性研究 [8] - 代季峰曾任微软亚洲研究院视觉组首席研究员 商汤科技研究院执行研究总监 研究方向包括视觉信息理解基础模型与核心算法 [9] - 陈天桥承诺盛大内部孵化的所有AI企业的一半利润将分给团队 [10] - 公司正在探索将长期记忆模块深度嵌入模型 在复杂多变环境中做出更精准可靠的预测 [14] 行业定位与发展愿景 - FutureX是全球首个动态实时LLM智能体未来预测基准 由字节跳动SEED团队联合斯坦福大学 复旦大学 普林斯顿大学共同推出 从200多个高质量网站精选问题 [5] - 马斯克曾表示预测未来的能力是衡量智能的最佳标准 让AI具备不确定环境下的决策能力是通向AGI的重要一步 [5] - 公司致力于打造全球最好的预测大模型 让AI记住过去 洞察未来 [8] - 代季峰透露项目终极目的是"我们不提供AI 但我们与您共同构建AI" [13] - 陈天桥呼吁中国科创投资人不要将脑机接口只当作赚钱风口 强调硬科技创新无法用互联网行业的短周期快回报模式衡量 [14] - 科创领域亟需有长远眼光的耐心资本 为企业提供长期稳定支持 帮助从基础研究到产业化落地 [14]