Claude Opus 4.5 模型更新 - Anthropic正式发布Claude Opus 4 5,在编程、智能体及计算机操作方面表现卓越,真实世界软件工程测试达行业SOTA,超越GPT-5 1-Codex-Max和Gemini 3 Pro [1] - API定价为每百万Token 5美元(输入)/ 25美元(输出),相比上代Opus 4 1降低三分之二,在SWE-bench Verified中等effort设定下输出token使用量减少76% [1] - 模型在居家测试中得分超过所有人类候选人,在抵御提示注入攻击方面显著增强,是目前最不容易被欺骗的前沿模型之一 [1] OpenAI 购物研究功能 - OpenAI向所有登录用户开放“购物研究”功能,由经过强化学习训练的GPT-5 mini版本支持,准确率达64%,改变传统搜索逻辑让AI替用户做购物功课 [2] - 该功能通过追问预算、用途、期待功能等问题生成深度买家指南,支持图片搜索、优惠查找和横向对比,可调取Memory功能中的聊天记录实现个性化推荐 [2] - 已有商家加入Instant Checkout功能可实现边挑选边下单,OpenAI声明不收费推荐且不与零售商分享用户聊天记录,但国内市场数据缺失严重 [2] 腾讯混元OCR模型 - 腾讯混元推出开源模型HunyuanOCR,参数仅1B,在复杂文档解析OmniDocBench测评中获94 1分最高分,超过谷歌Gemini3-pro等领先模型 [3] - 模型依托混元原生多模态架构采用端到端训练和推理范式,在OCRBench榜单总得分860分,取得3B以下参数SOTA成绩,支持14种高频小语种翻译 [3] - 精通多语种复杂文档解析、文字检测识别,在票据字段抽取、视频字幕识别、拍照翻译等场景广泛应用,获ICDAR2025文档翻译比赛小模型赛道冠军 [3] 美国“创世纪计划” - 特朗普签署“创世纪计划”行政命令,由美国能源部主导构建“美国科学与安全平台”整合超算资源和联邦数据 [4] - 明确锁定先进制造、生物技术、关键材料、核裂变与核聚变、量子信息科学、半导体微电子六大优先领域,要求60天内提出20项国家挑战 [4] - 设定极速推进时间表270天内展示平台初步运行能力,英伟达、OpenAI、Anthropic等成为潜在供应商,强调数据安全和出口管制要求 [4] 小米MiMo-Embodied模型 - 小米汽车陈龙团队开源全球首个打通自驾与具身智能的跨领域基座模型MiMo-Embodied,基于MiMo-VL架构通过四阶段训练策略有效打破领域鸿沟 [5][6] - 模型在自动驾驶与具身智能共29个Benchmark上超越现有专用模型及通用模型,实现SOTA性能,涵盖环境感知、规划到机器人拿取、导航全场景 [6] - 采用渐进式训练包含具身AI监督微调、自动驾驶监督微调、思维链推理微调和强化学习微调四阶段,在具身导航和操作任务中展现强大能力 [6] X公司AI替代与裁员 - 马斯克解雇X公司负责打击垃圾邮件和信任安全问题工程团队一半成员,该团队从2022年超100人缩减至不足10人,裁员幅度达90% [7] - 马斯克计划彻底移除X启发式推荐算法由Grok接手,通过阅读全部内容自动匹配用户兴趣 [7] - 马斯克推进“巨硬Macrohard计划”用AI重做微软产品,但裁员影响了X Money支付服务等关键项目 [7] OpenAI AI硬件设备 - OpenAI联合创始人阿尔特曼和苹果前首席设计官艾维透露AI硬件已有首批原型,将在不到两年时间内面世,目标成为继iPhone、MacBook后第三大核心设备 [8] - 该设备是无屏幕AI手机,大小与iPod Shuffle相仿可挂脖子上,配备麦克风和摄像头能感知用户生活情景,深度理解场景长时间接管任务过滤无关信息 [8] - OpenAI今年5月斥资65亿美元收购艾维创办的AI硬件公司io [8] 食品行业AI应用 - 瑞士巧克力巨头Barry Callebaut与植物基食品科技公司NotCo合作,使用AI引擎Giuseppe开发下一代巧克力,应对全球可可价格三十年最大涨幅 [9] - Giuseppe基于十年高保真数据训练,可扫描成千上万种成分分析特性模拟替代方案,将成分化学、配方、感官读数综合成决策引擎加速产品开发周期 [9] AI发展观点 - 斯坦福大学教授李飞飞强调AI是文明级技术,技术应走向普惠开放让每个人平等负责任地参与使用,必须确保发展始终处于人类引导控制之下 [10] - 她提出“空间智能”是AI进化下一关键阶段,赋予机器在三维空间中理解感知推理与交互能力,其创办的World Labs估值已达十亿美元 [11] - 李飞飞认为超级智能挑战根源不在技术而在人类治理能力,教育应培养孩子好奇心批判性思维和责任感,最根本原则是不要让工具使你变愚蠢 [11]
腾讯研究院AI速递 20251126
腾讯研究院·2025-11-25 16:01