Workflow
陈天桥MiroMind团队连续登顶FutureX,超越国际领先预测大模型
新浪科技·2025-09-22 07:57

公司技术成就 - MiroMind团队搭载GPT-5的MiroFlow智能体框架在FutureX基准评测中连续两周(9月第1周和第2周)夺得榜首 超越国际顶尖机构和闭源商业模型 [1] - 公司在GAIA-Validation基准测试中取得82.4%的准确率 并在HLE、BrowseComp及xBench-DeepSearch等多项基准中领先国际对手 [2] - MiroFlow框架已对外提供完全开源且可复现的配置方案 [2] 技术特性与能力 - 采用记忆驱动机制 专为预测与决策设计 区别于专注文本输出的生成式模型 [1] - 具备四大核心能力:信息洞察力(快速抓取/整合海量数据)、逻辑推理与趋势感知(发现模式/识别因果)、概率与不确定性管理(量化风险/最优决策)、跨领域整合能力(金融/政治/科技/社会多领域融合) [1] 实证案例表现 - 成功预测2025年9月9日ATP男子单打排名第4-6位选手 [1] - 精准预测2025年9月11日Solana数字加密货币突破关键价格档位 体现对价格波动类问题的系统建模与风险控制能力 [1] 行业基准背景 - FutureX为全球首个动态实时LLM智能体未来预测基准 由字节跳动SEED团队联合斯坦福大学、复旦大学推出 [2] - 基准从全球200多个高质量网站精选下周才有明确结果的问题 涵盖股票价格、体育赛事、政治选举、科技公司战略等未来事件领域 [2]