腾讯研究院 - 财报，业绩电话会，研报，新闻

腾讯研究院

搜索文档

腾讯研究院AI速递 20250829

腾讯研究院· 2025-08-28 16:01

大模型安全与性能评估 - OpenAI与Anthropic首次联合评估模型安全性双方互授API权限进行测试 [1] - Claude模型在幻觉控制方面表现优异拒绝70%不确定问题幻觉率显著低于OpenAI模型 [1] - 在越狱测试中OpenAI的o3和o4-mini模型略优于Claude 但在抵抗系统提示词提取方面Claude表现更稳定 [1] 多模态图像生成技术突破 - 谷歌Gemini团队推出原生图像生成模型Nano-Banana 实现质量飞跃支持一句话生成和编辑高清图像 [2] - 模型采用原生多模态架构支持连续多轮对话并记忆历史图像和指令实现像素级完美编辑 [2] - 单次生成5张高清图片仅需13秒创新交错生成技术可分解复杂指令文本渲染能力成为进步标尺 [2] 视频与音频生成技术进展 - 腾讯混元开源端到端视频音效模型HunyuanVideo-Foley 输入视频和文字即可生成电影级音效 [3] - 采用双流多模态扩散变换器架构实现多模态语义均衡响应在泛化能力、语义响应和音频保真度达业界领先 [3] - 字节跳动推出OmniHuman-1.5视频模型首次实现双人音频驱动功能支持两个数字人实时对戏 [4][5] - 模型精准还原口型表情解析语音情绪并匹配肢体语言支持文本控制风格动作维持一分钟以上时序连贯性 [4][5] AI自动化平台商业化 - 工作流自动化工具n8n在8个月内营收增长4倍估值达23亿美元活跃用户超23万 [6] - 平台升级为AI应用编排层通过可视化方式连接应用和数据库支持构建Agent处理复杂任务 [6] - 采用Fair-Code许可模式比传统开源更利于商业化支持高度定制化工作流部署 [6] AI科学计算应用 - 华盛顿大学利用AI将气候模拟时间从数月缩短至12小时成功实现1000年数据模拟 [7] - 深度学习模型替代传统物理方程计算在保持高精度同时大幅提升效率助力极端天气预测研究 [7] 行业竞争格局变化 - AI百大榜单显示ChatGPT首次失去榜首位置开源模型与闭源模型差距明显缩小 [8][9] - 多家中国公司模型进入前20强评测维度从基础能力扩展至实际应用效果和商业价值 [8][9] AI安全与治理前瞻 - Geoffrey Hinton预警超级AI可能在10年内出现具备创造力、自主意识和自我改进能力 [10] - 提出人类需接受被AI抚养的"婴儿假说" 呼吁延迟AI训练5年直至安全保障措施完善 [10] - Anthropic CEO指出AI存在无序风险需构建可靠可理解的系统公司正组建安全评估团队 [11]

AI是通向“超人”的阶梯，还是退回“猿猴”的陷阱？

腾讯研究院· 2025-08-28 10:38

AI对人类智力的影响 - AI可能使人类思维同质化缺乏新意和批判性思考[2] - 麻省理工学院实验显示使用ChatGPT组记忆正确率仅11.1% 远低于未使用组的88.9%[4] - 脑电波数据显示AI使用组神经连接强度(dDTF=0.009)显著低于未使用组(dDTF=0.053)[4][5] 认知能力变化机制 - 认知负荷转移导致大脑处理能力退化类似过度依赖导航系统[5] - 认知卸载效应使大脑为节省能量将任务外包给AI工具[5] - 知识平庸化趋势使AI输出内容缺乏思想灵魂呈现平铺直叙特征[6] 智力维度重构 - 智力应视为多维光谱而非单一分数包含批判思维/记忆力/逻辑推理等多要素[10] - AI主要替代计算和记忆能力但创造力/情感理解/同理心等软技能仍难以被取代[10] - 认知增强使人类从繁琐记忆中解放专注于高级认知活动[11][12] 教育体系变革 - 教育需从知识灌输转向培养批判性思维和创造力[17] - 可探索无分数学习模式将基础知识学习交由AI处理[17] - 认知教育应重点培养语言能力/逻辑能力/自主判断能力等基础认知能力[18] 人机关系重构 - 需重新定义人类价值锚定点探索深空/深海等新疆域[14] - 未来可能出现人机混合的赛博格新物种改变人类生产生活方式[15] - 意识问题构成人与机器的本质区别需警惕AI对人心智的渗透[15] 技术发展辩证观 - AI影响具有动态辩证性既存在降智风险也具备启智潜力[9] - 技术将淘汰平庸思维解放敢于提问和善于反思的独特智慧[18] - 国务院要求深入研究AI对人类认知判断的深层次影响机制[2]

AI降智

AI启智

认知卸载

Artificial Intelligence

Artificial Intelligence

ChatGPT

腾讯元宝

腾讯研究院AI速递 20250828

腾讯研究院· 2025-08-27 16:01

英伟达NVFP4技术突破 - 推出NVFP4新格式以4-bit精度实现16-bit训练精度在Blackwell Ultra上性能较Hopper架构提升7倍 [1] - 采用微块缩放 E4M3高精度块编码哈达玛变换和随机舍入技术解决低精度训练中的动态范围梯度波动性和数值稳定性问题 [1] - 与AWS 谷歌云 OpenAI等机构合作在万亿级令牌规模下实现稳定收敛节省大量算力和电力成本 [1] 谷歌Gemini 2.5 Flash图像模型 - 发布gemini-2.5-flash-image-preview模型拥有SOTA图像生成与编辑能力出色角色一致性和极快速度 [2] - 支持32k上下文每张图像生成成本仅0.28元比OpenAI便宜95% 在Google AI Studio和Gemini API提供预览 [2] - 图像编辑功能卓越支持换装换场景合成照片和多轮编辑在Artificial Analysis图像编辑类别排名第一 LM Arena多项指标夺冠 [2] Anthropic浏览器扩展发布 - 推出Claude for Chrome浏览器扩展可帮助用户设日历回邮件找房等任务在侧边窗口保留浏览器活动上下文 [3] - 目前仅向1000名Max套餐用户开放测试主要考虑安全因素防范提示注入攻击设置限制访问特定网站功能 [3] - AI浏览器成为巨头争夺新战场 Perplexity推出Comet 微软Edge集成Copilot 谷歌Chrome集成Gemini OpenAI将发布AI浏览器 [3] PixVerse视频生成技术升级 - V5视频生成模型大幅提升速度 5秒生成360p短片 1分钟完成1080p高清视频降低AI视频创作时间和成本 [4] - 优化动态清晰度一致性和指令理解能力增强人物场景一致性提供更接近真实拍摄效果 [4] - 新增续写和Agent智能体功能视频可丝滑延长至30秒提供多种创意模板降低普通用户视频创作门槛 [4] DeepMind健康大模型突破 - 发布基于Gemini微调的健康大语言模型PH-LLM 能将可穿戴设备数据转化为个性化健康建议在睡眠和运动领域表现优异 [5][6] - 在睡眠医学考试中得分79%超过医生76% 在健身认证考试中表现88%远超专家71% 能根据传感器数据预测用户睡眠质量 [6] - 采用两阶段训练先对完整模型进行睡眠和健康领域微调再增加多模态适配器预测睡眠障碍根据个体传感器数据生成高度个性化建议 [6] 腾讯开放原子大赛 - 开放原子大赛腾讯赛题第二期启动新增AI播客和数据库方向赛题总奖金40万元全球招募开发者 [7] - 混元AI播客创新智造挑战赛奖金10万元基于混元开源模型开发三类AI播客技术文本转多角色对话契合风格播客和深度话题播客 [7] - 包括OpenTenBase-TXSQL改写优化挑战赛30万元决赛11月在腾讯深圳总部举行优胜方案代码有机会融入开源项目 [7] SpaceX星舰技术进展 - 星舰第十次综合飞行测试成功执行由第二代星舰S37和B16助推器组成完成星链卫星模拟器部署等关键任务 [8] - B16助推器测试飞行极限和发动机系统冗余设计 S37飞船完成猛禽发动机太空点火重入大气层并溅落印度洋 [8] - 关键任务包括测试易受损区域耐受度不同隔热瓦性能捕捉连接件热性能和襟翼极限为载人和火星移民计划铺平道路 [8] AI对美国就业市场影响 - 斯坦福报告显示自2022年末以来AI暴露度越高职业就业增长越慢 22-25岁劳动者在高AI暴露度职业中就业率下降明显 [9] - AI对就业影响体现在替代或增强人类工作能力用于替代工作时年轻劳动者就业率下降用于增强时就业率上升 [9] - 高AI暴露职业年轻劳动者有13%相对就业下降率 AI主要替代年轻人掌握的编码知识较少替代年长者积累的隐性知识 [9] 大模型技术决策与Agent发展 - 大模型技术从预训练/SFT转向预训练/强化学习从缸中之脑转向Agentic系统 K2模型采用MoE架构和Muon优化器实现更高token效率 [10][11] - Agent泛化性追求通用性而非简单模拟人类行为可能需要用更多AI训练AI和InnovationL4解决AgentL3问题 [11] - 将OpenAI的L1-L5分级视为非线性技术里程碑认为AGI是方向而非终点组织管理需要平衡SFT和RL [11]

Artificial Intelligence

AGI

Artificial Intelligence

Gemini 2.5 Flash

PH - LLM

NVFP4

Artificial Intelligence

AGI

Artificial Intelligence

腾讯研究院· 2025-08-27 09:28

信息蜂房概念核心 - 腾讯研究院提出信息蜂房概念以对抗信息茧房强调用户作为能动的协作性信息生态参与者而非被动封闭的个体 [1] - 信息蜂房隐喻蜜蜂灵活采集花粉区别于蚕蛹被茧包裹的被动状态体现多元流动主动探索和协作共建三大核心要素 [1][2] 信息蜂房四大特征 - 多元信息入口包括订阅社交搜索和专业渠道等多维度获取方式避免单一算法推荐导致的信息茧房 [4] - 强用户主动性用户自主探索信息而非被动刷流形成个性化知识地图并参与评论分享和内容创作 [5][6] - 协作共建机制用户作为信息创造者传播者和评价者共同塑造生态通过共享机制和对话降低个体隔离风险 [7][8][9] - 生态互联不同信息节点间通过开放接口跨平台搜索和内容标准化实现自由流动避免算法驱动的单一栽培 [10][11][12] 支持生态互联的具体措施 - 技术手段包括开放接口与数据互通跨平台搜索聚合工具内容标准化跨节点推荐和多入口导航 [11][12] - 制度设计涵盖鼓励多样化创作开放共享政策跨群体协作以及版权与协作规范保障 [13] - 用户行为引导注重主动探索与多入口使用通过导航工具改进推荐逻辑和多维分类帮助用户发现知识联系 [14] 符合信息蜂房特征的产品案例 - 维基百科开放式协作编辑多语言版本和内部链接网络促进多元共生 [17] - Quora类问答平台用户主动提问与回答形成多角度知识网络类似社会化知识市场 [17] - 豆瓣通过小组同城和评论构建兴趣社群用户生成内容驱动非严格分类的动态信息流 [18] - Reddit 由多样化subreddit社区组成用户跨社区流动并通过投票机制决定内容排序 [19] - RSS/播客类产品用户主动订阅实现去中心化信息获取支持多感官呈现和连续学习体验 [20] - 开源社区如GitHub 开发者协作贡献代码工具和文档通过版本控制和问题跟踪实现知识迭代 [21] - 开放获取知识系统如PubMed Central 免费提供全文文献支持数据挖掘和跨国知识网络构建 [22][23] 信息生态优化方向 - 增强用户能动性提供搜索订阅等工具支持主动探索和跨领域信息获取 [25] - 推动多元共生在内容分发中引入多样性激励机制增加跨圈层内容 [25] - 鼓励群体协作通过社区化和开源共建机制促进信息流动与协同演化 [26] - 构建健康信息生态需兼顾多元化透明度和公共性支持知识生成流通和共享 [26]

腾讯研究院· 2025-08-26 16:01

生成式AI模型技术突破 - 英伟达推出Jet-Nemotron小模型系列（2B/4B参数），采用后神经架构搜索与JetBlock线性注意力模块，在数学、代码、常识等维度性能超越Qwen3、Gemma3等主流开源模型 [1] - 模型在H100 GPU上推理吞吐量最高提升53.6倍，长上下文场景优势显著 [1] - 面壁多模态模型MiniCPM-V 4.5以8B参数量超越Qwen2.5-VL 72B模型，成为首个具备高刷视频理解能力的多模态模型 [2] - 支持最大96倍视觉压缩率，可接收6倍视频帧数量，采用3D-Resampler压缩技术和统一OCR学习 [2] - 微软开源音频模型VibeVoice-1.5B，可连续合成90分钟超长语音，支持4名发言人，实现3200倍音频压缩 [3] - 采用双语音tokenizer架构解决音色与语义不匹配问题，压缩效率是主流Encodec模型的80倍 [3] 模型融合与演化创新 - Sakana AI提出M2N2模型融合进化方法，引入竞争与吸引力机制，打破预定义静态边界 [4] - 通过多样性竞争促使模型专业化，择偶机制根据互补优势配对融合，避免灾难性遗忘问题 [4] - 方法兼容不同目标训练的模型，不需原始训练数据即可保留模型能力 [4] 模型部署与运营问题 - DeepSeek V3.1存在异常插入"极/極/extreme"等token的bug，影响语法树和代理流程 [5] - 问题出现在第三方量化部署和官方全精度模型中，即使保守解码参数设置也无法避免 [6] - 对依赖自动化编码或测试流水线的团队造成重大麻烦 [6] AI商业与生态发展 - Perplexity推出全球首个AI搜索收入分成计划，设立4250万美元基金分配给出版商 [7] - 出版商可获得Comet Plus订阅收入（月费5美元）的80%，基于内容出现频率或查询次数分享收入 [7] - 马斯克旗下公司起诉苹果与OpenAI，指控通过锁定市场维持垄断地位，阻止创新者参与竞争 [8] - 诉讼索赔数十亿美元，案件可能影响AI市场范畴界定和商业合作模式 [8] 机器人硬件与算力升级 - 英伟达发布机器人专用芯片Jetson Thor，采用Blackwell架构GPU，AI算力达2070 FP4 TFLOPS [9] - 算力是上代Jetson Orin的7.5倍，内存容量128G，显存带宽273GB/s，能效提升3.5倍 [9] - 宇树科技、银河通用机器人等中国厂商首发搭载，开发者套件售价3499美元 [9] 人工智能教育与政策 - OpenAI教育负责人表示70%雇主更倾向招聘会使用AI的新人而非有10年经验的老手 [10] - ChatGPT成为全球最大学习平台，Study Mode功能以苏格拉底式方法指导学习 [10] - 国务院发布《人工智能+行动意见》，提出2027年实现AI与6大重点领域深度融合 [12] - 重点覆盖科学技术、产业发展、消费提质等领域，要求加强算力统筹、数据供给等八大基础支撑 [12]

腾讯研究院· 2025-08-26 09:35

文章核心观点 - 全球AI消费硬件产业正沿着AI原生设备探索、渐进强化现有设备、模型赋能第三方硬件三条核心发展路线演进，并形成与之适配的差异化商业模式[2][4][8] - AI硬件交互范式正向"无感化"方向转变，AI眼镜成为关键载体，长期可能取代手机成为主流交互终端[21][22][26] - 行业竞争焦点从单一硬件创新转向模型能力、硬件形态与应用生态的三维融合，软件生态成为决胜关键[27][28] AI消费硬件发展路线 - **路线1：AI原生设备探索派**：以Rabbit R1、Humane AI Pin为代表，完全重构交互范式，采用"意图即操作"理念，弱化App和菜单，依赖大模型驱动语义理解[4][5] 但面临极高不确定性，例如AI Pin已于2025年2月28日停止所有在线功能，Rabbit R1存在低活跃用户率、性能稳定性问题[5] - **路线2：渐进强化派**：以苹果、Meta为代表，在现有终端（手机/眼镜/耳机）系统集成AI能力，例如Apple Intelligence通过本地大模型（M系列芯片支持）实现端侧AI处理[6] 2024年9月美国调研显示Apple Intelligence推动消费者支付意愿提升11%，成为54%潜在换机用户核心决策因素[12] - **路线3：模型赋能派**：以OpenAI、谷歌为代表，通过API/SDK将模型能力注入第三方硬件，例如GPT-4o嵌入Ray-Ban智能眼镜提供实时对话能力[7] 该路径面临模型推理成本高、终端适配技术门槛、平台控制权缺失等挑战，例如谷歌需向三星支付高额授权费并让渡部分订阅收益以换取Gemini AI在Galaxy S25预装[15] AI消费商业模式分析 - **AI原生探索派商业模式**：依靠硬件溢价（如Rabbit R1售价199美元）和订阅服务收费，但陷入硬件价值证明困局[10] 例如日本GROOVE X的LOVOT陪伴机器人售价3935美元配合67美元月费，但全球发售5年销量仅1.4万台，年均出货不足3000台[11] - **渐进强化派商业模式**：以硬件销售为主，通过订阅服务（如健康分析报告、专业翻译）创造持续性收入[12] 例如Oura Ring转向"基础数据免费+深度健康服务订阅"模式后，订阅转化率增长18%[13] - **模型赋能派商业模式**：通过API调用量收费（如Token消耗量或请求次数），并提供企业级订阅和私有部署服务[15] 该模式面临终端厂商自研模型趋势冲击，例如vivo通过自研蓝心大模型减少第三方API依赖[15] 技术实现与产业生态 - **端云结合成为主流技术路径**：端侧处理高频低延迟任务（如相册整理、实时翻译），云端处理复杂计算任务（如长文案创作）[20] 终端设备常用模型参数量多低于70亿（7B），以30亿（3B）和40亿（4B）规模最为普遍，部分采用MoE架构平衡性能与功耗[20] - **产业链上下游加速整合**：模型厂商与芯片巨头深度合作，例如Meta与高通合作优化Llama 3在骁龙芯片的移动端运行效率[18][19] 阿里巴巴推动通义千问大模型与硬件厂商适配构建完整生态系统[19] - **AI眼镜成为关键硬件形态**：2025年多家巨头进入市场，包括Meta Oakley Meta（399-499美元）、小米AI Glasses（1999元）、谷歌Android XR眼镜（未公布价格）、阿里Quark AI Glasses（预计中端价位）[24] 未来发展趋势 - **交互范式向无感化演进**：语音和视觉交互逐步取代触控，语言用户界面（LUI）可能取代图形用户界面（GUI）[26] OpenAI正与前苹果设计师合作开发无屏幕、以对话式AI为核心交互的新型硬件[25] - **AI从功能补充升级为应用入口**：三星Galaxy S25搭载的AI Agent Bixby支持跨越30多个本地应用和10多个第三方应用的一体化操作[27] Google实现Gemini与Search、YouTube、Gmail等产品数据打通，可直接访问用户历史数据并写入应用[28] - **生态协同成为竞争核心**：Meta眼镜成功关键因素是无缝接入Instagram、Facebook社交矩阵，提供即拍即传的闭环体验[28]

研讨回顾｜姜还是老的辣，AI公益课还是“一起学”的好

腾讯研究院· 2025-08-26 09:35

项目背景与目标 - 腾讯研究院联合多个团队筹备"腾讯长辈AI公益课"系列旨在帮助老年人跨越数字鸿沟提升AI应用能力[3] - 项目从2023年8月开始推进已完成4节示例课和初步方案设计[4] - 通过线上研讨会邀请老年教育领域专家对课程方案进行点评与优化[5] 老年人AI需求调研 - 针对60-80岁长者群体的调研发现六大核心需求：出行与生活便利医疗服务陪伴与社交健康管理娱乐创作安全与防护[7] - 调研样本为100名长者发现主要学习障碍是"需要反复练习"和"容易遗忘"[10] - 多数长者倾向先掌握基础功能再实践应用[10] 课程体系设计 - 课程分为生活场景类和艺术创作类两大单元覆盖AI陪伴出行医疗绘画视频创作等核心板块[10] - 采用"示范→拆解→跟练→拓展"的功能制教学路径[10] - 每课时长控制在15-20分钟符合老年人注意力集中时长[16] 课程设计原则 - 避免年龄标签化倡导"无龄感"课程设计[12] - 采用场景化生活化剧情化的保姆级教程对专业术语进行解释[14] - 简化操作界面重点解决APP下载等初级卡点问题[14] - 减少文字说明干扰采用语音解说配合路径图展示[16] - 区分基础版与进阶版教学基础版聚焦核心功能实现[17] 教学模式创新 - 开发普通话与方言双版本课程依托混元大模型多模态技术能力[21] - 建立线上课程社群通过推选班委形成学习小组实现互助学习[23] - 运营1119个课程班级群通过定期例会支持班级管理者[23] - 设置作品展示平台通过大赛征稿等形式激发创作热情[25] 社会价值体现 - 项目体现科技企业社会责任推动AI技术普惠化应用[3][27] - 通过"老带新"模式实现"老有所为"的社会价值[23] - 探索AI时代应对老龄化的创新解决方案[27]

腾讯研究院· 2025-08-25 16:01

AI行业竞争动态 - 马斯克成立新AI软件公司"巨硬"(Macrohard) 直接针对微软目标是用AI黑箱完全替代微软核心业务[1] - 新公司可能与xAI的孟菲斯Colossus 2超级计算机项目密切相关延续了马斯克与比尔·盖茨的个人及商业竞争关系[1] 3D生成技术突破 - 群核科技开源3D场景生成模型SpatialGen 一句话即可生成可交互的3D室内空间设计[2] - 模型支持结构化场景交互包括空间查询、适老化设计及路径规划等功能[2] - 公司正在开发全球首款深度融合3D能力的AI视频生成Agent 已实现精准一致性和动作稳定的视频生成[2] 智能会议解决方案 - 腾讯会议推出"AI纪要"功能每2分钟主动推送会议总结实时捕捉关键信息、结论和待办事项[3] - 功能可识别会议氛围和言语潜台词支持会议记录一键导入元宝进行深度提问与内容提炼[3] - 钉钉发布首款AI硬件DingTalk A1 集成录音笔、会议机、翻译机和AI助理功能配备5颗全向麦克风和骨传导技术[5] - A1内置AI听记系统基于1亿小时音频训练支持30种方言、140种语言识别和200多种行业术语会议后自动生成任务跟进表格[6] 视频生成技术演进 - Video Ocean成为全球首个接入GPT-5的视频智能体一句话即可生成分钟级完整视频涵盖分镜、画面、配音和字幕全流程[4] - 产品通过三大模块无缝衔接将用户从提示词工程师转变为创意导演效率提升10倍[4] - 已吸引14个国家115位创作者体验可生成F1赛车解说、海洋纪录片等多类型视频内容[4] 科研激励与人才发展 - 2025年科学探索奖评选50位青年科学家信息电子领域6位学者获奖包括复旦大学姜育刚、清华大学吴嘉敏等[7] - 获奖者中包含13位年轻科学家(男性35岁及以下女性38岁及以下) 含6位90后每人5年内获300万元人民币奖金[7] - 评审机制强调原创性重点关注"为什么能做出前人做不出的工作" 由14位科学家与马化腾共同发起[7] 开发者工具生态 - 前特斯拉AI总监Karpathy分享四层AI编程工具链 75%时间使用Cursor编辑器自动补全代码[8] - 第二层通过大模型修改代码段第三层使用Claude Code实现功能模块最难问题交由GPT-5 Pro在10分钟内解决隐蔽bug[8] 数字永生与知识传承 - Delphi公司开发数字思维(digital minds)产品通过AI构建专家和创作者的个性化思维模型供他人交互学习[9] - 公司认为连接、能量和信任将成为AI时代最稀缺资源预计2026年用户难以区分与真人或其数字思维的交流[9] - 采用自适应时间性知识图谱技术已应用于教育学习、CEO思维规模化和个人流量入口等场景[9]

腾讯研究院· 2025-08-25 08:58

文章核心观点 - 当前关于人工智能对就业影响的量化研究存在显著局限性包括结果不可比测算片面性和方法静态性导致预测准确性存疑[4][5][6] - 量化AI对就业影响面临操作难题包括无法从多重经济因素中独立切割AI的影响难以清晰界定AI的技术范围以及无法预判未来技术发展路径[7][8][9][10] - 数据本身存在三大局限性受利益驱动可能被主观干预执行过程中存在抽样和调研失真以及无法预测人类社会突发变革事件[11][12] 三大不足 - 不同机构测算结果差异巨大且不可比例如高盛(2023)显示美国67%岗位面临AI自动化风险而国际劳工组织(2023)显示高收入国家仅5.5%岗位受自动化影响低收入国家仅0.4%[4][5] - 现有研究多采用"AI职业暴露度"指标但高暴露度不必然导致岗位消失未考虑技术经济可行性和时间线易引发过度恐慌[5] - 研究方法存在静态局限性仅以现有岗位为研究对象而历史数据显示2018年60%的工作在1940年并不存在未来新岗位无法被预判[6] 三道操作难题 - AI对就业的影响无法从经济周期产业政策人口结构等多重因素中独立切割理想化模型在现实中适用性有限[8] - AI缺乏明确定义且很少独立存在已嵌入导航翻译图像识别等日常应用技术边界动态变化导致影响范围难以界定[9] - 技术发展路径本身不可预测历史表明众多技术预言最终失效缺乏准确技术前景预判则就业影响测算无法成立[10] 三个局限性 - 数据可能受利益驱动被主观干预例如上市公司财务造假或安全事故瞒报行为[12] - 调研执行过程存在普遍失真问卷抽样不合理或敷衍应答导致数据偏差需依赖机构权威性背书[12] - 数据仅能反映历史规律无法预测突发变革例如传统出行数据无法推导汽车发明或春节等黑天鹅事件[12]

腾讯研究院· 2025-08-24 16:01

开源大模型进展 - xAI开源Grok-2模型权重和架构采用MoE架构拥有9050亿总参数推理时激活1360亿参数支持128k上下文长度商业使用限于年收入低于100万美元的公司模型体积超500GB 需8张显存大于40GB的GPU部署[1] - Grok-3将在6个月后开源[1] AI推理优化技术 - Meta AI与加州大学提出DeepConf置信度筛选方法通过实时监控置信度对推理路径动态筛选和加权投票使开源模型在AIME 2025达到99.9%准确率减少85% token消耗无需外部工具[2] - 提供离线和在线两种工作模式可直接应用于现有模型无需额外训练在vLLM中仅需约50行代码集成[2] 企业战略调整 - OpenAI CEO Sam Altman将日常运营移交应用业务CEO Fidji Simo 本人专注筹集万亿级资金和超级计算项目[3] - Simo具有Facebook增长期和Instacart上市经验将负责ChatGPT等消费级应用商业化产品线可能扩展至浏览器最快今年秋季在ChatGPT购物搜索引入联盟链接变现[3] 芯片技术突破 - DeepSeek V3.1使用UE8M0 FP8参数精度引发寒武纪等国产芯片概念股涨近14%[4] - UE8M0 FP8为微缩块格式全部8比特分配给指数位无符号位大幅提高带宽效率和性能与下一代国产芯片协同优化让相同硬件运行更大模型提高国产芯片性价比多家厂商已联合验证该格式[4] 产业合作动态 - Meta与Midjourney合作获得AI图像和视频生成技术使用许可将整合到未来AI模型中开发与OpenAI Sora竞争的产品[5] - Midjourney成立于2022年未接受外部融资年收入预计2亿美元今年6月发布首款AI视频模型V1[5] 企业AI应用强制推广 - Coinbase CEO强制要求所有工程师试用GitHub Copilot和Cursor AI工具对未按要求行动且无合理理由的员工直接开除[6] - 开发者社区对强制推广AI工具存在分歧部分支持提升效率部分担忧损害工作品质[6] 生物科技跨界合作 - OpenAI与Retro Biosciences合作开发GPT-4b micro模型设计全新蛋白质使细胞重编程技术效率提升50倍[7] - AI设计的RetroSOX和RetroKLF蛋白质命中率分别超30%和50% 不仅加速细胞重编程还降低DNA损伤水平为细胞疗法和抗衰老技术开辟新路径[7] 产品开发方法论 - Claude Code采用内部原型测试流程工程师直接用Claude Code快速做功能原型内部推广反响热烈后正式发布[8] - 小团队开发者倾向使用自动接受模式开启多个Claude并行处理任务大企业偏爱先探索代码库制定详细计划[8] - 通过CLAUDE.md文件、自定义斜杠命令和钩子实现高度定制配套SDK能在30分钟内搭建功能强大的代理原型[8] 平台竞争格局 - AI应用生成平台走向专业化与差异化发展各平台在细分领域互补共存形成多元格局[9] - 平台呈现三大类别：Prototyping原型设计、Personal software个人软件和Production apps生产应用针对不同用户层级[9] - 超七成用户保持单一平台忠诚度 21%高级用户使用多个互补平台未来各品牌将走向更深层次专业化[9] AI能耗透明度 - 谷歌发布首份AI能耗报告显示中位Gemini提示词消耗0.24瓦时电力相当于微波炉运行一秒碳排放量为0.03克二氧化碳[10] - 能耗构成：AI芯片(TPU)占58% 主机CPU和内存占25% 备用设备占10% 数据中心开销占8%[10] - Gemini能耗一年内下降33倍每个提示词消耗约0.26毫升水为科技公司首次发布透明AI能耗评估数据[10]