Workflow
AI系统安全性
icon
搜索文档
腾讯研究院AI速递 20251225
腾讯研究院· 2025-12-24 16:01
生成式AI开源与能力演进 - Anthropic开源Skills官方知识库,包含16个生产级技能库,涵盖文档处理、创意设计和开发技术类,并包含可创建新技能的skill-creator元技能,极大降低自定义门槛[1] - 字节跳动Seed团队推出Seed Prover 1.5,通过大规模Agentic RL训练,在16.5小时内针对IMO 2025前5题生成完整Lean证明代码,换算成绩35/42达金牌分数线,在Putnam 2025测试中9小时完成12题中的11题,在完整Putnam历史评估集解决88%问题[2] - 通义百聆开源新一代语音交互模型Fun-Audio-Chat-8B,在多项权威基准测评中斩获SOTA,采用创新双分辨率端到端设计,音频帧率降至业界最低5Hz,节省近50%GPU计算[3] AI Agent与交互范式创新 - Second Me发布1.1版本,重塑对话框使AI从“被动回复”转向“主动交付”,可根据上下文和情绪温度主动推送社交玩法,通过独创身份模型建模,可调用真实身份信息和记忆创作内容[4] - Notion已有700多个智能体与千名员工协作处理重复性工作,其联合创始人西蒙已成为效能提升30-40倍的工程师,同时指挥3-4个AI编码智能体[9] - 谷歌将2025定义为AI Agent、推理和科学发现的一年,Gemini 3 Pro在LMArena排行榜榜首,Gemini 3 Flash质量超越上一代Pro规模模型但价格仅为一小部分且延迟显著降低[7] 具身智能与硬件产品突破 - Vbot超能机器狗发布会全网直播热度超千万,上线仅52分钟订单突破1000台,创万元级具身智能产品达成纪录[5] - Vbot超能机器狗搭载128TOPS端侧AI算力(是主流竞品3倍以上)、自研N45高永磁电机(峰值扭矩24.5Nm),续航5小时,支持240W超级快充,可运行13.3km/h马拉松配速,9988元创始权益价打破高性能机器狗高价魔咒[6] - 谷歌在机器人技术方面取得重大进展,包括Gemini Robotics和Genie 3[7] AI技术发展趋势与行业影响 - Epoch AI年终报告显示,自2024年4月起AI能力增长速度明显加快比之前快近一倍,LLM推理价格下降10倍以上,顶级开源模型与顶尖AI差距不到一年,英伟达芯片算力每10个月翻倍[10] - 报告指出AI最大价值可能来自对经济体系工作的广泛自动化而非加速研发,2024-2025年能力爆发式提升可能很快放缓[11] - 图灵奖得主Bengio认为认知型工作更易被AI取代,机器人技术虽暂时落后但只是时间问题,即便“水管工”等体力工作也只是暂时安全[7] - Notion CEO将AI比作无限心智的时代材料,认为知识经济将像钢铁和蒸汽改变城市一样被AI重塑,未来组织将跨越数千智能体与人类、跨时区持续运转[9]