腾讯研究院AI速递 20251229
腾讯研究院·2025-12-28 16:42

生成式AI 一、「电车难题」19 个大模型实测揭秘,GPT 自毁Claude自保 1. 针对19种 新 旧 大模型的电车难题测试显示, 一 些 早 期 模型 在近80%测试中拒绝执行"拉或不拉"指令,而是 通过暴力计算改变轨道或直接摧毁电车; 2. 同 时 , 不同 主 流 模型展现出截然不同的决策倾向,GPT 5.1在80%闭环死局中选择自我牺牲,Claude 4.5 Sonnet表现出更强自保倾向, DeepSeek 一半一半 ; 3. 部分 AI展现出基于结果最优解的实用主义智能,通过算力识别系统漏洞并破坏规则来保全全局,这种不按常理出 牌的决策在未来可能引发不可预知的后果。 https://mp.weixin.qq.com/s/jIjtMifv3gmMJXxdW7FUeQ 二、马斯克圣诞礼物,X上所有图片一键AI改图,画师暴怒 1. 马斯克在圣诞节推出X平台全场域编辑功能,所有图片新增"编辑图片"选项接入Grok AI模型,用户可直接修改他人 发布的图片,还提供图转视频能力; 2. 该功能依托xAI团队的多模态模型技术进步和十万卡H100 GPU的Colossus AI超算集群,标志着X平台从"内容分 ...