腾讯研究院 - 财报，业绩电话会，研报，新闻

腾讯研究院

搜索文档

腾讯研究院AI速递 20250807

腾讯研究院· 2025-08-06 16:01

生成式AI - Anthropic发布Claude Opus 4 1，提升Agent代理任务、真实世界编码和推理能力，在SWE-bench Verified基准测试中达到74 5%，相比Opus 4提升2个百分点，大幅领先GPT-4 1（54 6%）[1] - OpenAI开源gpt-oss-120b和gpt-oss-20b两款推理模型，性能与o4-mini相当，分别采用117B和21B总参数，原生支持128k上下文长度，gpt-oss-120b可在单个H100 GPU上运行[2] - 谷歌DeepMind发布Genie 3，能一句话生成动态可交互世界，以每秒20-24帧速度实时生成720p画面，支持实时交互且生成内容连贯性可维持数分钟[3] - 谷歌Gemini新增"Storybook"功能，用户简单描述情节即可自动生成10页完整图文故事书，支持多种艺术风格和个性化定制[4] AI竞赛与性能 - 首届Kaggle AI国际象棋竞赛中，Grok 4表现最佳，显示"GM级别"战术策略与速度，与Gemini 2 5 Pro一起挺进半决赛[5] - ElevenLabs发布AI音乐模型Eleven Music，能生成从流行嘻哈到管弦乐各种风格，用户可通过文本prompt精确控制音乐底层乐器、调式、和弦和节奏[6] 人形机器人 - 傅利叶发布第三代人形机器人GR-3，采用柔和淡黄配色和柔性材质，嵌入微表情系统，能通过眼球转动、眨眼和神态表情传达情绪，覆盖导览问答、儿童互动等陪伴交互场景[7] 人机交互技术 - Meta开发的非侵入性表面肌电图(sEMG)技术通过记录放大肌肉神经信号实现实时手势解码和计算机交互，在连续手势控制任务中每秒能够互动0 66次，离散手势识别准确度达89-95%[8] AI智能体发展 - LangChain CEO认为未来会从聊天模式转向"环境化/常驻"智能体，环境化智能体可主动监听事件流并异步行动，多智能体系统是趋势[9] 创业模式 - Gamma以30人团队服务近5000万用户，ARR超5000万美元，采用"球员兼教练"管理模式，招募具有主动性、强学习意愿的"通才"而非"专才"[10][11]

腾讯研究院· 2025-08-06 09:03

AI时代职业新趋势 - AI技术发展催生新职业形态，如一人企业数量增加，闲鱼平台新增320多个新职业[7] - 提供情绪价值的职业兴起，包括陪聊、陪诊、夸赞服务等新兴服务类别[7] - 职业与收入呈现解耦趋势，第二职业收入占比提升，收入来源多样化[15][19] 人才需求变化 - 复合型人才需求激增，AI应用师、AI产品经理等岗位快速增长[24] - 技能要求呈现"自主性"与"专业性"并重特点，AI暴露度高的职业对自主性要求更高[23] - 全栈型人才和"粘合剂"式人才受青睐，需同时具备技术、业务和行业知识[24] 教育就业匹配 - "3+1+1"教育模式被提出，3年专业学习+1年企业实训+1年调整期[25] - 校企合作订单班模式效果显著，如天津滨海新区央国企订单班直接输送技能人才[29] - 高校教育滞后市场3-5年，但通过产研结合可缩短至1-3年差距[26] 行业机会分布 - 银发经济领域存在大量机会，包括养老看护服务及配套软硬件开发[38] - 现代服务业持续升级，生活服务、绿色经济等领域岗位需求旺盛[38] - 直播销售岗位泛化，从互联网公司扩展到各行业销售渠道变革[41] 就业结构变革 - 小微企业增速显著，注册数量和招聘需求增长快于大中型企业[17] - 蓝领起薪超过白领，职业等级观念面临重构，如上门洗澡服务客单价高[39] - 工作形态趋向任务制和碎片化，打破传统"朝九晚五"模式[19] 技术影响深度 - AI替代效应短期内以替代为主，长期将创造新岗位[17] - 深度使用AI者更不易被替代，拒绝AI者被替代风险更高[17] - 人机协同成为常态，AI辅助决策但最终决定权保留给人[63] 特殊群体就业 - 农民工就业灵活性强，平台就业和零工经济成为主要选择[44] - 中年人再就业需调整心态，经验优势结合AI技术可形成竞争力[53] - 应届毕业生存在"往下匹配"趋势，超60%求职岗位学历要求低于自身[54]

腾讯研究院· 2025-08-05 16:01

Claude Opus 4.1内测与行业动态 - Claude Opus 4.1正在内部测试，预计半月内发布，主打提升推理和规划能力 [1] - Anthropic年收入增长5倍达50亿美元，编程客户Cursor和GitHub Copilot贡献14亿美元API收入 [1] - Claude在AI编程领域优势明显但面临OpenAI等竞对威胁 [1] 腾讯ima功能更新 - ima新增AI播客功能，基于混元大模型提供自然对话与优质听感 [2] - 支持文件夹一键导入功能，大幅简化知识导入流程 [2] - 新增Xmind脑图解读与知识库内容置顶功能，提升知识管理效率 [2] 阿里开源Qwen-Image模型 - 通义千问开源200亿参数图像生成模型Qwen-Image，中英文文本渲染能力出色 [3] - 模型能精准生成含复杂文字的图像，包括PPT、海报和商品宣传图 [3] - 采用MMDiT架构和渐进式训练策略，多项基准测试达SOTA水平 [3] 华为开源盘古模型与CANN架构 - 华为开源三款盘古模型，规模分别为1B、7B和718B，Ultra MoE达7180亿参数 [4] - AI计算架构CANN及Mind系列应用使能套件全面开源开放 [4] - 采用Multi-head Latent Attention和负载均衡策略等创新技术 [4] 纳米AI多智能体蜂群技术 - 纳米AI推出多智能体蜂群，一句话生成10分钟高质量AI视频，降低95%制作成本 [5] - 引入L4级智能体标准，实现多智能体共享记忆和协作 [5] - 单步智能体成功率达99.97%，支持无限Token和上下文长度 [5] 谷歌大模型对抗赛 - 谷歌发起首届大模型对抗赛，8款顶级AI模型将在国际象棋领域对决 [6][7] - 参赛模型包括OpenAI、DeepSeek、Kimi、谷歌、Anthropic和xAI等 [6] - 比赛采用单败淘汰制，全程透明直播 [7] 苹果脑控技术进展 - 苹果与Synchron合作推出BCI HID协议，让脑电波成为原生输入方式 [8] - 渐冻症患者通过Stentrode脑机接口设备成功操控iPad [8] - 相比Neuralink采用低风险无创手术方式 [8] 宇树科技机器人产品 - 宇树科技发布四足机器狗Unitree A2，可负重100kg，最大奔跑速度5米/秒 [9] - 此前发布人形机器人R1，售价3.99万元起，被称为行业"价格屠夫" [9] - 公司2024年营收突破10亿元，Go1机器人全球出货量超5万台 [9] AI对社会结构影响预测 - 前谷歌高管预警2027年起AI将开启15年"地狱期"，中产阶级或被消灭 [10] - 预测未来社会将只剩顶端0.1%富人和底层民众 [10] - 2042年后或进入AI主导的乌托邦时代 [10] 阶跃星辰开源基座模型 - 阶跃星辰开源基座模型Step 3，为3210亿参数的多模态推理模型 [11] - CEO坚信多模态生成与理解统一是通往AGI的必由之路 [11] - 聚焦智能终端Agent和垂类Agent两大方向 [11]

Artificial Intelligence

AGI

Artificial Intelligence

腾讯ima

Qwen-Image

盘古模型

Artificial Intelligence

AGI

Artificial Intelligence

腾讯ima

Qwen-Image

盘古模型

赛博沙盒：如何与AI共创未来丨1.4万字圆桌实录

腾讯研究院· 2025-08-05 09:03

AI与游戏的共生关系 - 游戏作为AI的孵化器具有历史渊源，从20世纪50年代起棋类游戏就成为AI研究的理想试验场[9][10] - 游戏环境为AI训练提供规则明确、边界清晰的"理想物理环境"，类似高中物理题中的简化假设[12] - 复杂电子游戏（如Dota、星际争霸）推动AI学习范式进化，从规则学习到自我学习再到生成式AI[14][15] - 游戏既是孕育AI的"算法子宫"，也是测试AI安全性的"数字迷宫"，具有双重功能[11] 智能NPC的商业化路径 - 智能NPC将颠覆RPG游戏体验，通过个性化对话和动态叙事创造"真实世界"感[18] - 成本控制方案包括离线部署预训练模型与分层收费模式（基础角色免费+算力API付费）[20][21] - 竞技类游戏AI需平衡难度与体验，过度强大的AI可能导致玩家挫败感[24][25] - 情感向游戏与AI结合最具商业潜力，可形成"算力即服务"新商业模式[22][23] 游戏开发的技术革新 - AI已应用于游戏动作系统优化（如《黑神话》的丝滑动作衔接）和副本平衡性测试[19] - 低代码编辑器（如《元梦之星》）结合AI技术大幅降低游戏开发门槛[31] - AI可辅助检测游戏剧情逻辑矛盾，维护大型开放世界的叙事一致性[28][29] - 未来游戏开发可能进入"人人都是创作者"的时代，类似短视频的内容生产革命[31] 游戏作为社会实验场 - 游戏可模拟信息传播环境，训练用户识别虚假信息的"信息疫苗"功能[33] - 严肃游戏（如《瘟疫危机》）能有效提升公共卫生教育效果[34] - 游戏引擎技术已应用于自动驾驶训练等现实领域的技术研发[36] - 游戏推动硬件产业发展，显卡从游戏配件演变为AI算力核心的历史进程[38] 游戏媒介的独特性 - 游戏整合而非替代其他媒介，通过交互性提供影视和文学无法实现的体验[42] - 游戏采用TCP式深度交互模式，与电影的UDP式单向传播形成互补[43] - 中国游戏产业实现技术代偿，跳过主机阶段直接进入移动游戏时代[40] - 游戏研究呈现"红细胞"（开发技术）与"白细胞"（社会影响）的学科分化[48]

论坛预告丨科技创新与良法善治的智识交汇！Day 2

腾讯研究院· 2025-08-05 09:03

论坛概述 - 香港中文大学法律学院与腾讯研究院联合主办"网络法论坛"，聚焦科技创新与法律治理的交叉领域 [1] - 论坛主题为"科技创新与良法善治"，旨在为大湾区科技与法律交互提供智慧支持 [1] - 讨论范围涵盖全球数字经济、互联网公共政策、人工智能治理等前沿议题 [1] 议程安排 - 8月6日10:15-11:15由王雅媛女士主讲《个人资料(私隐)条例》下的网络行为法律责任与合规要求 [3] - 11:30-12:30由张平教授探讨中国人工智能立法的思路与展望 [3] - 活动通过腾讯会议（会议号472 853 853）线上开展 [3] 推荐内容 - 薛军教授著作《中国广告法的数字转型之思》被列为延伸阅读材料 [5]

腾讯研究院· 2025-08-04 16:01

GPT-5技术进展 - 奥特曼亲自展示GPT-5实测，暗示即将进入"SaaS快时尚时代"[1] - GPT-5采用超级对齐团队遗留的"通用验证器"技术，训练方法为"证明者-验证者游戏"[1] - 研发面临高质量训练数据不足和大规模预训练收益下降的挑战[1] 苹果AI战略布局 - 组建AKI团队研发类ChatGPT搜索引擎，由前Siri负责人领导[2] - 扎克伯格提出"个人超级智能"概念，称AI眼镜将挑战iPhone地位[2] - 库克强调iPhone仍是生态中心，透露苹果有"令人兴奋的AI计划"[2] 腾讯开源模型 - 开源四款混元小模型(0.5B/1.8B/4B/7B)，手机可运行并在微信读书落地[3] - Hunyuan 7B数学能力超越OpenAI o1-mini和Qwen3-8B，支持256k上下文长度[3] - 增强agent能力，适合低功耗场景和低成本垂直领域微调[3] 快手AI影视创新 - 可灵AI短剧《新世界加载中》全球播放1.97亿次，全网曝光13.7亿+[4] - 赋能Z世代团队实现多风格创作，降低大制作门槛[4] - 通过20次迭代提升水面效果、动态控制等影视细节表现力[4] 高德地图AI升级 - 发布全球首个AI Native应用"高德地图2025"，搭载智能体"小高老师"[5] - 智能体具备自主推理、计划、反思能力，提供全旅程AI服务[5] - 整合超视距感知和AR互动体验三大智能体服务[5] 小米音频模型 - 开源MiDashengLM-7B声音理解模型，刷新22个评测集记录[6][7] - 首Token延迟为业界1/4，数据吞吐效率达同类20倍[7] - 实现语音/环境声/音乐统一理解，已在30+智能家居场景落地[7] AI视频现象 - "兔子蹦床"AI视频播放超5亿次，多数观众未识别为AI生成[8] - 成功要素包括夜视画质掩盖缺陷、@Ring标记增强可信度[8] - 反映用户"选择相信"的新型社交媒体互动逻辑[8] 具身智能突破 - 中科硅纪发布四款灵巧手和三款机器人整机产品[9] - 产品覆盖工业、高风险环境和服务场景[9] - 通过软硬协同打通具身智能产业化"最后一厘米"[9] AI行业观点交锋 - 马斯克称"只有工程师没有科学家"，LeCun反驳会扼杀创新[10] - LeCun强调研究者追求新原理，工程师聚焦系统构建[10] 强化学习前沿 - Ai2科学家提出RLVR技术，目标打造开源推理模型[11][12] - 区分RLHF与RLVR，强调智能体需发展四层能力[12] - 呼吁开源AI从论文转向创造实际"产物"[12]

Software and Internet

Software and Internet

混元小模型

高德地图2025

人形机器人的进化之路｜2.5万字圆桌实录

腾讯研究院· 2025-08-04 09:23

具身智能技术突破 - 端到端大模型实现从L2到L4级跃迁 Physical Intelligence公司Π系列模型展示少样本学习能力[7][8] - 数据采集技术突破主从臂式遥操/VR遥操/光学动捕等技术提升效率 AGL Bot World项目采集百万级真机数据[9] - 仿真技术显著提升生成式模型使仿真效果从"非常假"到"视觉逼真" 物理交互仿真仍需加强[9] 技术瓶颈与挑战 - 开放环境任务执行能力弱复杂技能/高精度场景下故障率高存在安全风险[6] - 硬件成本与运维问题单台机器人成本达数十万人民币供电持久性不足[6] - 泛化能力存在局限 Physical Intelligence Π0模型在OOD场景成功率低于产业预期[10] 主流技术范式 - VLA（视觉-语言-动作）成为共识框架但底层架构仍处探索期存在自回归与Diffusion两条技术路线[32][33] - 系统1（直觉响应）与系统2（规划决策）协同方案短程任务端到端解决长程任务需规则介入[18][19] - 触觉模态(T)增强形成VTLA框架触觉信号使响应延迟从2-3秒提升至毫秒级[15][16] 数据生态现状 - 真实数据与仿真数据存在鸿沟刚体仿真准确度达80%-90% 柔性体/流体仿真仍困难[36][39] - 数据规模严重不足具身数据量仅为语言模型的1/5000 需百亿级VLA token训练量[9][57] - 互联网视频数据利用受限缺乏动作标签与多视角信息需清洗与伪标签生成技术[42][43] 产业化路径 - 专业场景优先落地工厂SOP场景成熟度高于开放家庭环境规则系统现阶段更可靠[14][51] - 消费级产品渐进发展扫地机器人+简易操作臂组合或成突破口价格增幅需控在数百元内[50] - 中间件接口标准化需求迫切需建立动作抽象层兼容不同机器人本体[26][27] 技术演进方向 - 世界模型与强化学习结合数据驱动的物理规律模拟替代传统物理引擎[35][37] - 穿戴设备数据反哺未来消费级设备可能意外积累海量具身数据[41] - 多模态持续扩展红外/温度等非人类模态将增强环境感知能力[29][32]

腾讯研究院· 2025-08-04 09:23

论坛概述 - 香港中文大学法律学院与腾讯研究院联合主办"网络法论坛"，聚焦科技创新与法律治理的交叉领域 [1] - 论坛旨在为科技创新与良法善治的价值交互贡献大湾区智慧 [1] - 讨论主题包括全球数字经济、互联网公共政策、人工智能治理等前沿议题 [1] 演讲嘉宾 - 蒙美玲教授：香港中文大学系统工程与工程管理学系讲席教授，演讲主题为"AI for an Empowered Future: Educating the Next Generation with Intelligence, Agency, and Integrity" [2][8] - 苏文藻教授：香港中文大学研究院院长，演讲主题为"Ethical Dilemmas in AI" [4][9] - 王雅媛女士：个人资料私隐专员公署助理专员，演讲主题为"从《个人资料(私隐)条例》探索网络行为的法律责任与合规要求" [6][9] - 张平教授：北京大学人工智能研究院AI安全与治理中心主任，演讲主题为"中国人工智能立法的思路与展望" [8][9] 论坛议程 - 8月5日11:30-12:15：蒙美玲教授主题演讲 [8] - 8月5日12:15-13:00：苏文藻教授主题演讲 [9] - 8月6日10:15-11:15：王雅媛女士主题演讲 [9] - 8月6日11:30-12:30：张平教授主题演讲 [9] 推荐阅读 - 腾讯研究院发布《拥抱概率真相——AI时代谣言套路拆解与防御指南》 [10] - 腾讯研究院发布《共生伙伴：2025人工智能十大趋势｜2025 WAIC报告重磅发布》 [10]

腾讯研究院· 2025-08-03 16:01

Anthropic与OpenAI竞争升级 - Anthropic切断OpenAI对Claude API的访问权限，指控其利用Claude工具开发GPT-5违反服务条款[1] - OpenAI回应称API评估竞品能力是行业惯例，对Anthropic决定表示失望[1] - 事件标志AI巨头竞争进入"数据与接口封锁"阶段，API成为战略资源[1] Grok推出短视频生成功能 - Grok Imagine功能向Grok Heavy用户开放，支持一键生成动画/写实风格短视频[2] - 生成速度极快，在X平台引发刷屏效应，被科技公司CEO评价"超出想象"[2] - 马斯克定位为AI版Vine，直接对标谷歌Veo 3产品[2] 谷歌发布IMO金牌模型 - Gemini 2.5 Deep Think模型达到IMO铜牌水平，Ultra订阅价249.99美元/月[3] - 性能超越OpenAI o3和Grok 4，通过扩展并行"思考时间"优化代码/科学/推理能力[3] - 原版模型曾获IMO金牌，新版本速度更快实用性更强[3] Manus推出多Agent并行功能 - Wide Research功能支持100个Agent同时工作，Pro版定价199美元/月[4] - 每个子Agent为完整Manus实例，可自主完成复杂调研并汇总结果[4] - 基于虚拟化基础设施和MapReduce范式，但用户反馈积分消耗过高[4] 开源图像模型技术突破 - FLUX.1-Krea模型专注解决"AI感"问题，通过两阶段训练提升自然细节[5] - 分析指出"AI风格"源于指标过度优化和美学评估偏见[5] - 采用监督微调+人类反馈强化学习针对性改善蜡质皮肤/过曝高光等问题[5] AI育种与数学研究进展 - 华中农大团队在Nature发表AI育种研究，整合组学技术和基因编辑实现精准改良[7] - OpenAI三人团队开发实验性模型，4.5小时完成IMO六题达金牌标准[7] - 模型采用通用强化学习技术，展现自我识别难题能力[7] AI建模与职业影响研究 - 哈萨比斯提出AI可建模所有进化系统，预测2030年AGI概率达50%[8] - 微软研究分析20万对话显示翻译/销售/程序员等职业受AI影响超80%[9] - AI适用性与薪资/学历弱相关，更取决于信息处理领域匹配度[9] 未来社会与AI关系展望 - 凯文·凯利主张将AI视为"异类智能"，预测2049年"镜像世界"成为主流社交平台[10][11] - 强调人类价值将因稀缺上升，核心技能是"学会如何为自己学习"[11]

Artificial Intelligence

通用AI

AGI

Artificial Intelligence

Grok Imagine

Gemini 2.5 Deep Think

Artificial Intelligence

通用AI

AGI

Artificial Intelligence

Grok Imagine

Gemini 2.5 Deep Think

腾讯研究院AI每周关键词Top50

腾讯研究院· 2025-08-02 02:33

芯片与算力 - AI推理芯片由云天励飞推出 [3] - 无问芯穹关注AI效能提升 [3] 模型发展 - OpenAI推出「龙虾」盲测模型 [3] - 阶跃星辰发布Step 3模型 [3] - RockAI推出Yan 2.0模型 [3] - 智谱发布GLM-4.5模型 [3] - 昆仑万维推出Skywork UniPic模型 [3] - 群核科技发布InteriorGS数据集 [3] - DeepSeek开发NSA技术 [3] - OpenAI正在部署GPT-5 [3] 应用场景 - 腾讯发布AI应用全景图 [3] - 阿里巴巴推出AI眼镜 [3] - Lovart发布ChatCanvas应用 [3] - 钛动科技推出Navos应用 [3] - Coze开发零代码平台 [3] - 可灵AI推出灵动画布 [3] - 腾讯与Lovart合作3D生成API [3] - 阿里发布Wan2.2应用 [3] - 商汤推出悟能具身平台 [4] - Anthropic设置周流量限制 [4] - 微软发布AI Edge应用 [4] - 阶跃星辰推出阶跃深研 [4] - 京东发布JoyAI [4] - 加州大学等开发MIRIX [4] - 国家卫星气象中心推出空间天气预报模型 [4] - OpenAI推出学习模式 [4] - xAI发布Imagine视频功能 [4] - 拓竹科技推出混元3D模型 [4] - WPS发布灵犀Office智能体 [4] - 火山引擎推出SeedEdit 3.0 [4] - Google发布Video Overviews [4] - 理想汽车推出VLA司机大模型 [4] - Google发布AlphaEarth [4] - Moonvalley推出Sketch-to-Video [4] - Ollama发布对话界面 [4] - 阿里推出1688 AI版 [4] 科技创新 - 宇树科技推出Unitree R1 [4] - 上智院等发布星河启智平台 [4] - 上海AI lab推出书生Intern-S1 [4] - 逐际动力发布LimX Oli [4] 行业观点 - 辛顿提出大模型永生观点 [4] - 辛顿与周伯文讨论AI变聪明与善良 [4] - Shopify推动全员AI转型 [4] - OpenAI提出AI市场泡沫观点 [4] - a16z讨论AI时代护城河 [4] - 张正友提出具身智能趋势 [4] - 谷歌前CEO讨论开放权重价值 [5] - Meta探讨超级智能与开源变化 [5] - a16z提出投资判断标准 [5]

Artificial Intelligence

大模型永生

Artificial Intelligence

GPT - 5

AI推理芯片

AI眼镜

Artificial Intelligence

大模型永生

Artificial Intelligence