腾讯研究院
搜索文档
腾讯研究院AI速递 20250807
腾讯研究院· 2025-08-06 16:01
生成式AI - Anthropic发布Claude Opus 4 1,提升Agent代理任务、真实世界编码和推理能力,在SWE-bench Verified基准测试中达到74 5%,相比Opus 4提升2个百分点,大幅领先GPT-4 1(54 6%)[1] - OpenAI开源gpt-oss-120b和gpt-oss-20b两款推理模型,性能与o4-mini相当,分别采用117B和21B总参数,原生支持128k上下文长度,gpt-oss-120b可在单个H100 GPU上运行[2] - 谷歌DeepMind发布Genie 3,能一句话生成动态可交互世界,以每秒20-24帧速度实时生成720p画面,支持实时交互且生成内容连贯性可维持数分钟[3] - 谷歌Gemini新增"Storybook"功能,用户简单描述情节即可自动生成10页完整图文故事书,支持多种艺术风格和个性化定制[4] AI竞赛与性能 - 首届Kaggle AI国际象棋竞赛中,Grok 4表现最佳,显示"GM级别"战术策略与速度,与Gemini 2 5 Pro一起挺进半决赛[5] - ElevenLabs发布AI音乐模型Eleven Music,能生成从流行嘻哈到管弦乐各种风格,用户可通过文本prompt精确控制音乐底层乐器、调式、和弦和节奏[6] 人形机器人 - 傅利叶发布第三代人形机器人GR-3,采用柔和淡黄配色和柔性材质,嵌入微表情系统,能通过眼球转动、眨眼和神态表情传达情绪,覆盖导览问答、儿童互动等陪伴交互场景[7] 人机交互技术 - Meta开发的非侵入性表面肌电图(sEMG)技术通过记录放大肌肉神经信号实现实时手势解码和计算机交互,在连续手势控制任务中每秒能够互动0 66次,离散手势识别准确度达89-95%[8] AI智能体发展 - LangChain CEO认为未来会从聊天模式转向"环境化/常驻"智能体,环境化智能体可主动监听事件流并异步行动,多智能体系统是趋势[9] 创业模式 - Gamma以30人团队服务近5000万用户,ARR超5000万美元,采用"球员兼教练"管理模式,招募具有主动性、强学习意愿的"通才"而非"专才"[10][11]
AI时代的职业与教育|2万字圆桌实录
腾讯研究院· 2025-08-06 09:03
AI时代职业新趋势 - AI技术发展催生新职业形态,如一人企业数量增加,闲鱼平台新增320多个新职业[7] - 提供情绪价值的职业兴起,包括陪聊、陪诊、夸赞服务等新兴服务类别[7] - 职业与收入呈现解耦趋势,第二职业收入占比提升,收入来源多样化[15][19] 人才需求变化 - 复合型人才需求激增,AI应用师、AI产品经理等岗位快速增长[24] - 技能要求呈现"自主性"与"专业性"并重特点,AI暴露度高的职业对自主性要求更高[23] - 全栈型人才和"粘合剂"式人才受青睐,需同时具备技术、业务和行业知识[24] 教育就业匹配 - "3+1+1"教育模式被提出,3年专业学习+1年企业实训+1年调整期[25] - 校企合作订单班模式效果显著,如天津滨海新区央国企订单班直接输送技能人才[29] - 高校教育滞后市场3-5年,但通过产研结合可缩短至1-3年差距[26] 行业机会分布 - 银发经济领域存在大量机会,包括养老看护服务及配套软硬件开发[38] - 现代服务业持续升级,生活服务、绿色经济等领域岗位需求旺盛[38] - 直播销售岗位泛化,从互联网公司扩展到各行业销售渠道变革[41] 就业结构变革 - 小微企业增速显著,注册数量和招聘需求增长快于大中型企业[17] - 蓝领起薪超过白领,职业等级观念面临重构,如上门洗澡服务客单价高[39] - 工作形态趋向任务制和碎片化,打破传统"朝九晚五"模式[19] 技术影响深度 - AI替代效应短期内以替代为主,长期将创造新岗位[17] - 深度使用AI者更不易被替代,拒绝AI者被替代风险更高[17] - 人机协同成为常态,AI辅助决策但最终决定权保留给人[63] 特殊群体就业 - 农民工就业灵活性强,平台就业和零工经济成为主要选择[44] - 中年人再就业需调整心态,经验优势结合AI技术可形成竞争力[53] - 应届毕业生存在"往下匹配"趋势,超60%求职岗位学历要求低于自身[54]
腾讯研究院AI速递 20250806
腾讯研究院· 2025-08-05 16:01
Claude Opus 4.1内测与行业动态 - Claude Opus 4.1正在内部测试,预计半月内发布,主打提升推理和规划能力 [1] - Anthropic年收入增长5倍达50亿美元,编程客户Cursor和GitHub Copilot贡献14亿美元API收入 [1] - Claude在AI编程领域优势明显但面临OpenAI等竞对威胁 [1] 腾讯ima功能更新 - ima新增AI播客功能,基于混元大模型提供自然对话与优质听感 [2] - 支持文件夹一键导入功能,大幅简化知识导入流程 [2] - 新增Xmind脑图解读与知识库内容置顶功能,提升知识管理效率 [2] 阿里开源Qwen-Image模型 - 通义千问开源200亿参数图像生成模型Qwen-Image,中英文文本渲染能力出色 [3] - 模型能精准生成含复杂文字的图像,包括PPT、海报和商品宣传图 [3] - 采用MMDiT架构和渐进式训练策略,多项基准测试达SOTA水平 [3] 华为开源盘古模型与CANN架构 - 华为开源三款盘古模型,规模分别为1B、7B和718B,Ultra MoE达7180亿参数 [4] - AI计算架构CANN及Mind系列应用使能套件全面开源开放 [4] - 采用Multi-head Latent Attention和负载均衡策略等创新技术 [4] 纳米AI多智能体蜂群技术 - 纳米AI推出多智能体蜂群,一句话生成10分钟高质量AI视频,降低95%制作成本 [5] - 引入L4级智能体标准,实现多智能体共享记忆和协作 [5] - 单步智能体成功率达99.97%,支持无限Token和上下文长度 [5] 谷歌大模型对抗赛 - 谷歌发起首届大模型对抗赛,8款顶级AI模型将在国际象棋领域对决 [6][7] - 参赛模型包括OpenAI、DeepSeek、Kimi、谷歌、Anthropic和xAI等 [6] - 比赛采用单败淘汰制,全程透明直播 [7] 苹果脑控技术进展 - 苹果与Synchron合作推出BCI HID协议,让脑电波成为原生输入方式 [8] - 渐冻症患者通过Stentrode脑机接口设备成功操控iPad [8] - 相比Neuralink采用低风险无创手术方式 [8] 宇树科技机器人产品 - 宇树科技发布四足机器狗Unitree A2,可负重100kg,最大奔跑速度5米/秒 [9] - 此前发布人形机器人R1,售价3.99万元起,被称为行业"价格屠夫" [9] - 公司2024年营收突破10亿元,Go1机器人全球出货量超5万台 [9] AI对社会结构影响预测 - 前谷歌高管预警2027年起AI将开启15年"地狱期",中产阶级或被消灭 [10] - 预测未来社会将只剩顶端0.1%富人和底层民众 [10] - 2042年后或进入AI主导的乌托邦时代 [10] 阶跃星辰开源基座模型 - 阶跃星辰开源基座模型Step 3,为3210亿参数的多模态推理模型 [11] - CEO坚信多模态生成与理解统一是通往AGI的必由之路 [11] - 聚焦智能终端Agent和垂类Agent两大方向 [11]
赛博沙盒:如何与AI共创未来丨1.4万字圆桌实录
腾讯研究院· 2025-08-05 09:03
AI与游戏的共生关系 - 游戏作为AI的孵化器具有历史渊源,从20世纪50年代起棋类游戏就成为AI研究的理想试验场[9][10] - 游戏环境为AI训练提供规则明确、边界清晰的"理想物理环境",类似高中物理题中的简化假设[12] - 复杂电子游戏(如Dota、星际争霸)推动AI学习范式进化,从规则学习到自我学习再到生成式AI[14][15] - 游戏既是孕育AI的"算法子宫",也是测试AI安全性的"数字迷宫",具有双重功能[11] 智能NPC的商业化路径 - 智能NPC将颠覆RPG游戏体验,通过个性化对话和动态叙事创造"真实世界"感[18] - 成本控制方案包括离线部署预训练模型与分层收费模式(基础角色免费+算力API付费)[20][21] - 竞技类游戏AI需平衡难度与体验,过度强大的AI可能导致玩家挫败感[24][25] - 情感向游戏与AI结合最具商业潜力,可形成"算力即服务"新商业模式[22][23] 游戏开发的技术革新 - AI已应用于游戏动作系统优化(如《黑神话》的丝滑动作衔接)和副本平衡性测试[19] - 低代码编辑器(如《元梦之星》)结合AI技术大幅降低游戏开发门槛[31] - AI可辅助检测游戏剧情逻辑矛盾,维护大型开放世界的叙事一致性[28][29] - 未来游戏开发可能进入"人人都是创作者"的时代,类似短视频的内容生产革命[31] 游戏作为社会实验场 - 游戏可模拟信息传播环境,训练用户识别虚假信息的"信息疫苗"功能[33] - 严肃游戏(如《瘟疫危机》)能有效提升公共卫生教育效果[34] - 游戏引擎技术已应用于自动驾驶训练等现实领域的技术研发[36] - 游戏推动硬件产业发展,显卡从游戏配件演变为AI算力核心的历史进程[38] 游戏媒介的独特性 - 游戏整合而非替代其他媒介,通过交互性提供影视和文学无法实现的体验[42] - 游戏采用TCP式深度交互模式,与电影的UDP式单向传播形成互补[43] - 中国游戏产业实现技术代偿,跳过主机阶段直接进入移动游戏时代[40] - 游戏研究呈现"红细胞"(开发技术)与"白细胞"(社会影响)的学科分化[48]
论坛预告丨科技创新与良法善治的智识交汇!Day 2
腾讯研究院· 2025-08-05 09:03
论坛概述 - 香港中文大学法律学院与腾讯研究院联合主办"网络法论坛",聚焦科技创新与法律治理的交叉领域 [1] - 论坛主题为"科技创新与良法善治",旨在为大湾区科技与法律交互提供智慧支持 [1] - 讨论范围涵盖全球数字经济、互联网公共政策、人工智能治理等前沿议题 [1] 议程安排 - 8月6日10:15-11:15由王雅媛女士主讲《个人资料(私隐)条例》下的网络行为法律责任与合规要求 [3] - 11:30-12:30由张平教授探讨中国人工智能立法的思路与展望 [3] - 活动通过腾讯会议(会议号472 853 853)线上开展 [3] 推荐内容 - 薛军教授著作《中国广告法的数字转型之思》被列为延伸阅读材料 [5]
腾讯研究院AI速递 20250805
腾讯研究院· 2025-08-04 16:01
GPT-5技术进展 - 奥特曼亲自展示GPT-5实测,暗示即将进入"SaaS快时尚时代"[1] - GPT-5采用超级对齐团队遗留的"通用验证器"技术,训练方法为"证明者-验证者游戏"[1] - 研发面临高质量训练数据不足和大规模预训练收益下降的挑战[1] 苹果AI战略布局 - 组建AKI团队研发类ChatGPT搜索引擎,由前Siri负责人领导[2] - 扎克伯格提出"个人超级智能"概念,称AI眼镜将挑战iPhone地位[2] - 库克强调iPhone仍是生态中心,透露苹果有"令人兴奋的AI计划"[2] 腾讯开源模型 - 开源四款混元小模型(0.5B/1.8B/4B/7B),手机可运行并在微信读书落地[3] - Hunyuan 7B数学能力超越OpenAI o1-mini和Qwen3-8B,支持256k上下文长度[3] - 增强agent能力,适合低功耗场景和低成本垂直领域微调[3] 快手AI影视创新 - 可灵AI短剧《新世界加载中》全球播放1.97亿次,全网曝光13.7亿+[4] - 赋能Z世代团队实现多风格创作,降低大制作门槛[4] - 通过20次迭代提升水面效果、动态控制等影视细节表现力[4] 高德地图AI升级 - 发布全球首个AI Native应用"高德地图2025",搭载智能体"小高老师"[5] - 智能体具备自主推理、计划、反思能力,提供全旅程AI服务[5] - 整合超视距感知和AR互动体验三大智能体服务[5] 小米音频模型 - 开源MiDashengLM-7B声音理解模型,刷新22个评测集记录[6][7] - 首Token延迟为业界1/4,数据吞吐效率达同类20倍[7] - 实现语音/环境声/音乐统一理解,已在30+智能家居场景落地[7] AI视频现象 - "兔子蹦床"AI视频播放超5亿次,多数观众未识别为AI生成[8] - 成功要素包括夜视画质掩盖缺陷、@Ring标记增强可信度[8] - 反映用户"选择相信"的新型社交媒体互动逻辑[8] 具身智能突破 - 中科硅纪发布四款灵巧手和三款机器人整机产品[9] - 产品覆盖工业、高风险环境和服务场景[9] - 通过软硬协同打通具身智能产业化"最后一厘米"[9] AI行业观点交锋 - 马斯克称"只有工程师没有科学家",LeCun反驳会扼杀创新[10] - LeCun强调研究者追求新原理,工程师聚焦系统构建[10] 强化学习前沿 - Ai2科学家提出RLVR技术,目标打造开源推理模型[11][12] - 区分RLHF与RLVR,强调智能体需发展四层能力[12] - 呼吁开源AI从论文转向创造实际"产物"[12]
人形机器人的进化之路|2.5万字圆桌实录
腾讯研究院· 2025-08-04 09:23
具身智能技术突破 - 端到端大模型实现从L2到L4级跃迁 Physical Intelligence公司Π系列模型展示少样本学习能力[7][8] - 数据采集技术突破 主从臂式遥操/VR遥操/光学动捕等技术提升效率 AGL Bot World项目采集百万级真机数据[9] - 仿真技术显著提升 生成式模型使仿真效果从"非常假"到"视觉逼真" 物理交互仿真仍需加强[9] 技术瓶颈与挑战 - 开放环境任务执行能力弱 复杂技能/高精度场景下故障率高 存在安全风险[6] - 硬件成本与运维问题 单台机器人成本达数十万人民币 供电持久性不足[6] - 泛化能力存在局限 Physical Intelligence Π0模型在OOD场景成功率低于产业预期[10] 主流技术范式 - VLA(视觉-语言-动作)成为共识框架 但底层架构仍处探索期 存在自回归与Diffusion两条技术路线[32][33] - 系统1(直觉响应)与系统2(规划决策)协同方案 短程任务端到端解决 长程任务需规则介入[18][19] - 触觉模态(T)增强形成VTLA框架 触觉信号使响应延迟从2-3秒提升至毫秒级[15][16] 数据生态现状 - 真实数据与仿真数据存在鸿沟 刚体仿真准确度达80%-90% 柔性体/流体仿真仍困难[36][39] - 数据规模严重不足 具身数据量仅为语言模型的1/5000 需百亿级VLA token训练量[9][57] - 互联网视频数据利用受限 缺乏动作标签与多视角信息 需清洗与伪标签生成技术[42][43] 产业化路径 - 专业场景优先落地 工厂SOP场景成熟度高于开放家庭环境 规则系统现阶段更可靠[14][51] - 消费级产品渐进发展 扫地机器人+简易操作臂组合或成突破口 价格增幅需控在数百元内[50] - 中间件接口标准化需求迫切 需建立动作抽象层兼容不同机器人本体[26][27] 技术演进方向 - 世界模型与强化学习结合 数据驱动的物理规律模拟替代传统物理引擎[35][37] - 穿戴设备数据反哺 未来消费级设备可能意外积累海量具身数据[41] - 多模态持续扩展 红外/温度等非人类模态将增强环境感知能力[29][32]
论坛预告丨科技创新与良法善治的智识交汇!
腾讯研究院· 2025-08-04 09:23
论坛概述 - 香港中文大学法律学院与腾讯研究院联合主办"网络法论坛",聚焦科技创新与法律治理的交叉领域 [1] - 论坛旨在为科技创新与良法善治的价值交互贡献大湾区智慧 [1] - 讨论主题包括全球数字经济、互联网公共政策、人工智能治理等前沿议题 [1] 演讲嘉宾 - 蒙美玲教授:香港中文大学系统工程与工程管理学系讲席教授,演讲主题为"AI for an Empowered Future: Educating the Next Generation with Intelligence, Agency, and Integrity" [2][8] - 苏文藻教授:香港中文大学研究院院长,演讲主题为"Ethical Dilemmas in AI" [4][9] - 王雅媛女士:个人资料私隐专员公署助理专员,演讲主题为"从《个人资料(私隐)条例》探索网络行为的法律责任与合规要求" [6][9] - 张平教授:北京大学人工智能研究院AI安全与治理中心主任,演讲主题为"中国人工智能立法的思路与展望" [8][9] 论坛议程 - 8月5日11:30-12:15:蒙美玲教授主题演讲 [8] - 8月5日12:15-13:00:苏文藻教授主题演讲 [9] - 8月6日10:15-11:15:王雅媛女士主题演讲 [9] - 8月6日11:30-12:30:张平教授主题演讲 [9] 推荐阅读 - 腾讯研究院发布《拥抱概率真相——AI时代谣言套路拆解与防御指南》 [10] - 腾讯研究院发布《共生伙伴:2025人工智能十大趋势|2025 WAIC报告重磅发布》 [10]
腾讯研究院AI速递 20250804
腾讯研究院· 2025-08-03 16:01
Anthropic与OpenAI竞争升级 - Anthropic切断OpenAI对Claude API的访问权限,指控其利用Claude工具开发GPT-5违反服务条款[1] - OpenAI回应称API评估竞品能力是行业惯例,对Anthropic决定表示失望[1] - 事件标志AI巨头竞争进入"数据与接口封锁"阶段,API成为战略资源[1] Grok推出短视频生成功能 - Grok Imagine功能向Grok Heavy用户开放,支持一键生成动画/写实风格短视频[2] - 生成速度极快,在X平台引发刷屏效应,被科技公司CEO评价"超出想象"[2] - 马斯克定位为AI版Vine,直接对标谷歌Veo 3产品[2] 谷歌发布IMO金牌模型 - Gemini 2.5 Deep Think模型达到IMO铜牌水平,Ultra订阅价249.99美元/月[3] - 性能超越OpenAI o3和Grok 4,通过扩展并行"思考时间"优化代码/科学/推理能力[3] - 原版模型曾获IMO金牌,新版本速度更快实用性更强[3] Manus推出多Agent并行功能 - Wide Research功能支持100个Agent同时工作,Pro版定价199美元/月[4] - 每个子Agent为完整Manus实例,可自主完成复杂调研并汇总结果[4] - 基于虚拟化基础设施和MapReduce范式,但用户反馈积分消耗过高[4] 开源图像模型技术突破 - FLUX.1-Krea模型专注解决"AI感"问题,通过两阶段训练提升自然细节[5] - 分析指出"AI风格"源于指标过度优化和美学评估偏见[5] - 采用监督微调+人类反馈强化学习针对性改善蜡质皮肤/过曝高光等问题[5] AI育种与数学研究进展 - 华中农大团队在Nature发表AI育种研究,整合组学技术和基因编辑实现精准改良[7] - OpenAI三人团队开发实验性模型,4.5小时完成IMO六题达金牌标准[7] - 模型采用通用强化学习技术,展现自我识别难题能力[7] AI建模与职业影响研究 - 哈萨比斯提出AI可建模所有进化系统,预测2030年AGI概率达50%[8] - 微软研究分析20万对话显示翻译/销售/程序员等职业受AI影响超80%[9] - AI适用性与薪资/学历弱相关,更取决于信息处理领域匹配度[9] 未来社会与AI关系展望 - 凯文·凯利主张将AI视为"异类智能",预测2049年"镜像世界"成为主流社交平台[10][11] - 强调人类价值将因稀缺上升,核心技能是"学会如何为自己学习"[11]
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-08-02 02:33
芯片与算力 - AI推理芯片由云天励飞推出 [3] - 无问芯穹关注AI效能提升 [3] 模型发展 - OpenAI推出「龙虾」盲测模型 [3] - 阶跃星辰发布Step 3模型 [3] - RockAI推出Yan 2.0模型 [3] - 智谱发布GLM-4.5模型 [3] - 昆仑万维推出Skywork UniPic模型 [3] - 群核科技发布InteriorGS数据集 [3] - DeepSeek开发NSA技术 [3] - OpenAI正在部署GPT-5 [3] 应用场景 - 腾讯发布AI应用全景图 [3] - 阿里巴巴推出AI眼镜 [3] - Lovart发布ChatCanvas应用 [3] - 钛动科技推出Navos应用 [3] - Coze开发零代码平台 [3] - 可灵AI推出灵动画布 [3] - 腾讯与Lovart合作3D生成API [3] - 阿里发布Wan2.2应用 [3] - 商汤推出悟能具身平台 [4] - Anthropic设置周流量限制 [4] - 微软发布AI Edge应用 [4] - 阶跃星辰推出阶跃深研 [4] - 京东发布JoyAI [4] - 加州大学等开发MIRIX [4] - 国家卫星气象中心推出空间天气预报模型 [4] - OpenAI推出学习模式 [4] - xAI发布Imagine视频功能 [4] - 拓竹科技推出混元3D模型 [4] - WPS发布灵犀Office智能体 [4] - 火山引擎推出SeedEdit 3.0 [4] - Google发布Video Overviews [4] - 理想汽车推出VLA司机大模型 [4] - Google发布AlphaEarth [4] - Moonvalley推出Sketch-to-Video [4] - Ollama发布对话界面 [4] - 阿里推出1688 AI版 [4] 科技创新 - 宇树科技推出Unitree R1 [4] - 上智院等发布星河启智平台 [4] - 上海AI lab推出书生Intern-S1 [4] - 逐际动力发布LimX Oli [4] 行业观点 - 辛顿提出大模型永生观点 [4] - 辛顿与周伯文讨论AI变聪明与善良 [4] - Shopify推动全员AI转型 [4] - OpenAI提出AI市场泡沫观点 [4] - a16z讨论AI时代护城河 [4] - 张正友提出具身智能趋势 [4] - 谷歌前CEO讨论开放权重价值 [5] - Meta探讨超级智能与开源变化 [5] - a16z提出投资判断标准 [5]