Workflow
腾讯研究院
icon
搜索文档
AI时代的迷失:可怕的不是跟不上变化,而是用旧思维赶路
腾讯研究院· 2025-11-28 08:45
AI时代思维方式的决定性作用 - 技术本身并非时代发展的最关键变量,真正决定时代走向的是背后的“思维方式”[8] - 现代中国的快速崛起印证了思维方式改变是推动经济发展的底层动力,而非某一项具体技术[9] - 对AI的恐慌、崇拜和误解本质原因是部分文化尚未完成“现代化思维”转换[9] 现代思维的核心要素 - 现代思维具备几大要素:证据优先、逻辑推理、可被推翻、理解不确定性、自我判断[15] - 现代思维是AI时代最重要的“底层操作系统”,因为人类仍需自己理解世界结构、判断信息真假、做出关键决策[15] - 逻辑是现代思维最核心、最不可替代的底层结构,是适应未来的基本生存能力[23][28] AI技术本质与能力边界 - 现代AI本质是强大计算机+高效算法+海量数据,没有任何部分超越图灵机模型[31][37] - AI受图灵机固有局限性制约,存在原则上无法突破的能力天花板[31] - AI可以高度拟合人类语言但不等于拥有理解,可以生成内容但不等于具备创造力[35] 人类与AI的差异化优势 - 人类真正优势在于理解得深而非算得快,包括语境理解、价值判断、抽象能力等[42] - 人类拥有机器无法模拟的类比能力,能在不同领域间抽取结构、识别深层模式[42] - 未来人类需专注于思考、判断、决策、抽象、推理、创造等AI无法替代的核心能力[42] AI时代的教育与职业选择 - 知识正从“资本”变成“原材料”,真正价值从“拿到信息”转移到“处理信息”[21] - 越冷门领域越难被AI取代,因为缺乏规模化市场不具备大规模替代的商业价值[55] - 未来最稀缺的是能提供独特价值的个体,而非标准人才[55] AI时代的认知挑战与应对 - 真正削弱深度思考能力的是电子设备的商业机制,而非AI本身[45] - AI会淘汰不愿意思考的人,但不会减少思考,反而能帮助回到深度思考[46] - 未来差距不是信息差而是思维差,关键在于能否驾驭工具和做出判断[50]
腾讯研究院AI速递 20251128
腾讯研究院· 2025-11-27 16:21
谷歌TPU自研芯片进展 - 谷歌TPU从2015年发展至2025年第七代TPU(代号Ironwood),成为可能撼动英伟达霸权的战略级武器[1] - TPU v7单芯片FP8算力达4.6 petaFLOPS,一个Pod集成9216颗芯片性能超42.5 exaFLOPS,采用2D/3D环面拓扑结合光路交换网络,年可用性达99.999%[1] - 谷歌垂直整合策略使其避免了昂贵的CUDA税,推理成本较GPU系统低30%-40%[1] - Meta考虑2027年在数据中心部署TPU并通过谷歌云租用算力[1] Anthropic长程Agent技术突破 - Anthropic发布针对长程Agent的双Agent架构解决方案,包括初始化Agent负责搭建环境和编码Agent负责增量进展,解决Agent跨会话工作的记忆难题[2] - 环境管理包含功能列表(200+功能点标记状态)、增量进展(Git提交和进度文件)和端到端测试(使用Puppeteer浏览器自动化)三大支柱[2] - 该方案基于Claude Agent SDK,通过让Agent像人类工程师一样在会话间保持一致进度,成功实现跨数小时甚至数天的复杂任务[2] DeepSeek数学模型创新 - DeepSeek发布基于DeepSeek-V3.2-Exp-Base的DeepSeek-Math-V2,实现IMO金牌级水平,性能优于Gemini DeepThink[3] - 创新引入自我验证数学推理框架,包含证明验证器(分0/0.5/1三档评分)、元验证(检查评语合理性)和诚实奖励机制(奖励诚实指错的模型)[3] - 在IMO-ProofBench基准的Basic子集上达到近99%高分,Putnam 2024中以扩展测试实现118/120接近满分,突破传统强化学习限制[3] AI音乐行业正版化进程 - AI音乐平台Suno与华纳音乐集团达成全球首个"正版授权AI音乐"合作框架,结束所有法律纠纷,标志AI音乐正版化里程碑[4] - Suno将在2026年推出基于高品质授权音乐训练的新模型,承诺超越现有v5模型,华纳旗下艺术家可自主选择是否授权并获得收入[4] - 免费用户未来无法下载创作音频仅能播放分享,付费用户下载功能保留但有月度额度限制[4] - Suno同时收购华纳旗下演唱会服务Songkick布局线下生态[4] 马斯克Grok 5游戏AI挑战 - 马斯克宣布Grok 5将在2026年挑战《英雄联盟》最强战队T1(由传奇选手Faker领衔),为AI戴上"纯视觉感知"和"人类级反应延迟"双重镣铐[5][6] - Grok 5或将拥有6万亿参数,作为多模态LLM通过"阅读"游戏说明和"观看"比赛视频构建世界模型,依靠逻辑推理而非暴力手速取胜[6] - 马斯克将把Grok 5的视觉-动作模型直接应用于特斯拉Optimus人形机器人,游戏团战作为现实世界的练兵场验证具身智能能力[6] 阿里开源图像生成模型 - 阿里开源6B参数图像生成模型Z-Image,包含Z-Image-Turbo(8步达到主流竞品性能)、Z-Image-Base(非蒸馏基础模型)和Z-Image-Edit(图像编辑专用版本)三个版本[7] - Z-Image-Turbo在企业级H800 GPU上实现亚秒级推理速度,可轻松运行于16G显存消费级设备,在照片级写实生成和中英双语文字渲染方面表现突出[7] - 采用可扩展单流DiT(S3-DiT)架构,将文本、视觉语义token与图像VAE token在序列维度拼接为统一输入流,最大化参数利用效率[7] 无问芯穹融资与AI基建进展 - 清华AI Infra企业无问芯穹完成近5亿元A+轮融资,由珠海科技集团、孚腾资本领投,成立2年半累计获得近15亿元融资[8] - 无穹AI云首次实现六种不同品牌芯片间交叉混合训练,算力利用率最高达97.6%,已在全国完成超25000P算力纳管,覆盖26城市53个数据中心[8] - 推出端侧全模态理解模型无穹天权(3B成本、7B内存需求达21B级智能水平)和终端推理加速引擎无穹开阳(3倍时延降低、40%能耗节省),打造Agentic Infra[8] 清华大学AI教育指导原则 - 清华大学正式发布《人工智能教育应用指导原则》,提出"主体责任""合规诚信""数据安全""审慎思辨""公平包容"五大核心原则[9] - 指导原则明确禁止将AI生成内容直接作为学业成果提交,严禁用AI代替学术训练、代写论文等行为,要求教师对AI生成教学内容负责[9] - 清华已有超390门课程融入AI教学实践,自主研发"三层解耦架构"和全功能智能体学伴"清小搭",历时两年调研全球25所高校70份指南完成制定[9] 美国创世纪AI科研计划 - 美国启动"创世纪计划"(US Genesis Mission)作为AI曼哈顿计划,目标是训练科学基础模型、打造科研智能体,让AI深度嵌入科研全流程[10] - 能源部科学事务副部长Darío Gil在《科学》杂志发表社论,强调AI价值在于生成可验证结果而非仅写摘要,需动员国家实验室、企业和顶尖大学[11] - 《自然》同期发表社论提出"神经符号AI"路径,将大模型统计学习与符号推理、规划模块组合,可能是迈向接近人类水平智能的关键[11]
8656家小微市场主体调研:经营状况与预期回落,线上化率有所下滑
腾讯研究院· 2025-11-27 09:13
经营状况 - 经营状况有所下滑,亏损面环比扩大0.2个百分点至5.9%,停滞面环比收窄0.3个百分点至11.1% [3][6] - 盈利水平指数为71.4,环比下降0.3,营收增速指数为52.0,环比下降0.5,创历史新低 [3][6] 市场预期与投资 - 市场预期指数为65.6,环比下降0.9,连续五个季度下滑 [3][9] - 投资倾向指数为65.5,环比下降0.2,连续四个季度下滑 [3][9] 成本与需求挑战 - 人力成本压力加剧,用工成本上升覆盖面为39.4%,环比提升0.4个百分点 [3][12] - 消费疲弱问题突出,用户消费意愿低覆盖面为31.3%,同质化竞争覆盖面为32.9%,同比分别上升1.7和1.8个百分点 [3][12] - 原材料涨价和门店租金高覆盖面环比分别变化+0.2和-1.3个百分点,压力有所缓解 [12] 政策支持 - 普惠型政策覆盖面改善,优惠利率或贴息覆盖面为29.5%,环比上升2.1个百分点,成为覆盖面最高的支持政策 [15] - 营商环境体感温度指数环比回升0.6度至-6.0,但仍处于偏冷区间 [3][17] 融资环境 - 总融资需求为70.9%,环比上升2.9个百分点,实际融资缺口升至37.0%,环比上升0.9个百分点 [20] - 银行信贷供给覆盖面扩大,仅从银行渠道融资的主体占比为48.2%,环比上升3.2个百分点 [22] - 借贷综合利率指数为5.57%,环比上升30个基点,银行与非银渠道利差扩大至252个基点 [3][25] 数字化转型 - 线上化率为48.7%,环比下降1.0个百分点,连续七个季度下滑 [3][28] - 融合型线上销售占比为27.6%,环比上升2.2个百分点,线上销售收入能力连续三个季度优化 [28] - 直播渗透率为30.5%,环比降低1.1个百分点,连续两个季度下滑 [32] - 跨平台经营占比提升至72.2%,线上销售趋于分散,高度集中销售占比环比下降3.1个百分点 [30]
腾讯研究院AI速递 20251127
腾讯研究院· 2025-11-26 16:11
ChatGPT语音与文本交互升级 - OpenAI将语音模式全面整合至主聊天界面,实现语音应答、视觉呈现与文字转录服务的同步获取,用户无需切换模式[1] - 新版本在用户查询时能提供自然流畅的语音回应,同时实时生成地图、图表、图片等视觉内容,并自动完成语音转文字转录[1] - 公司在设置菜单中保留模式切换开关,偏好沉浸式音频体验的用户可一键恢复旧版独立语音模式[1] ChatGPT应用生态扩展 - OpenAI在ChatGPT网页端内测全新App Directory,首次系统化展示开发者构建的第三方应用,支持用户浏览、搜索和一键添加使用[2] - 新版目录以卡片形式呈现覆盖购物、生产力、教育、旅行等多场景的AI应用,用户可在ChatGPT内直接调用实现即点即用[2] - 基于ChatGPT 4亿周活用户和每分钟60亿tokens处理量,应用目录推动平台从AI对话工具向完整AI应用商店演进[2] FLUX图像生成模型进展 - 德国黑森林实验室发布FLUX2图像生成模型家族,可同时参考多达10张图片保持字符、产品和风格一致性,支持最高4百万分辨率图像编辑[3] - FLUX2系列发布3款模型,开源的FLUX2 [dev]为32B参数量模型,此前Flux1 [dev]在Hugging Face受欢迎度仅次于DeepSeek-R1[3] - 模型基于潜在流匹配架构,结合Mistral-3 24B视觉语言模型与整流流式Transformer,在超写实图像生成表现突出但暂不支持中文渲染[3] CharacterAI未成年人服务调整 - CharacterAI推出全新故事功能,未满18岁用户将无法使用聊天机器人服务,转而提供更为结构化的引导式互动方式[4] - 公司CEO坦言对于18岁以下用户开放式聊天可能并非合适产品,决策基于对AI聊天机器人可能带来心理健康风险的担忧[4] - 加利福尼亚州成为美国首个对AI伴侣进行监管的州,联邦层面有议员提出全国性法案旨在全面禁止未成年人使用AI伴侣[4] TRAE国内版开发工具升级 - TRAE国内版正式上线SOLO模式,带来SOLO Coder、Plan模式、多任务并行、代码变更工具DiffView、上下文压缩等核心能力[5][6] - SOLO模式定位为响应感知的编程智能体,支持检索10万个代码文件的超大上下文,通过全新三栏布局实现多任务并行开发[6] - 核心设计理念是All in One统一开发过程中所有元素,让开发者专注于指导和监督AI工作,而非实时配对AI编程助手[6] 腾讯混元3D引擎国际化推进 - 腾讯混元3D创作引擎正式推出国际站,模型API在腾讯云国际站同步上线面向国际用户开放,社区下载量超300万是全球最受欢迎的3D开源模型[7] - 最新Hunyuan3D 30版本首创3D-DiT分级雕刻模型,建模精度较前代提升3倍,支持1536³几何分辨率与36亿体素超高清建模,效果保持业界SOTA[7] - 目前已有超过150家企业通过腾讯云接入,涵盖游戏制作、电商宣传、影视特效、3D打印等领域,传统3D制作周期从数天缩短至分钟级[7] Skywork专业数据服务拓展 - 天工Skywork全新上线专业数据模式,已连接430家权威机构数据源,覆盖政府开放数据、国际组织、学术科研、金融市场、气象环境等关键领域[8] - 接入世界银行、IMF、WHO、FDA、Google Scholar、NASA等核心数据源,通过跨源统一回答与聚合实现一次检索整合权威数据[8] - 支持指定特定专业数据库回答确保无幻觉内容生成,所有答案自动附上数据来源信息确保回答可追溯、更透明,提升决策和报告可靠性[8] AI技术发展路径展望 - Ilya Sutskever提出Scaling时代已终结,我们正走向研究时代,认为当前技术路线无法实现AGI[9] - 他指出模型泛化能力是核心瓶颈远逊人类,即便用所有编程竞赛题目训练模型仍无法形成真正解题直觉,评估分数光鲜但实际性能滞后[9] - 预测5-20年内将出现能像人类一样学习并超越人类的AI系统,强调需要为模型内置类似人类的判断直觉和稳定价值感受器[9] AI芯片市场竞争态势 - 谷歌开始向Meta等大型机构推介在其数据中心部署TPU方案,Meta计划2027年斥资数十亿美元使用TPU,谷歌云预测此业务可拿下英伟达10%年营收[10] - 英伟达强调自己是唯一能够兼容所有AI模型、覆盖所有计算场景的硬件平台,并积极通过投资拉拢Anthropic、OpenAI等大客户[11] - 黄仁勋在内部会议坦言英伟达撑着整个地球,业绩好被说助长泡沫、业绩差会被当作泡沫破裂证据,市场预期难以满足[11]
从虚拟峡谷到经济锚点:解码电竞价值创造的内在逻辑
腾讯研究院· 2025-11-26 09:44
文章核心观点 - 电竞产业价值已超越赛场胜负,外溢至社会经济领域,其核心驱动力源于技术突破、玩家社群自组织及商业价值挖掘 [2][3] - 电竞赛事作为产业枢纽,将分散的用户行为结构化,并催生专业化分工,展现出强大的消费拉动与城市动能激活效应 [8][9][10][11] - 电竞生态构建于深度用户参与之上,通过共建、共治机制将观众转化为共建者,并以电竞精神凝聚长期情感链接 [13][14][15][16][17][18] 电竞产业的发展历程与生长逻辑 - 技术突破是电竞诞生的基础,20世纪50年代晶体管发明使计算机小型化,1962年《Spacewar!》游戏的出现体现了将虚拟环境作为竞技场的早期萌芽 [5] - 强黏性玩家社群推动竞技从自发行为演变为组织化实践,1972年斯坦福AI实验室举办的《Spacewar!》竞赛(15人参与)标志着电竞向竞赛形式的首次转化,1980年首届万人级电子游戏锦标赛验证线下号召力 [6] - 商业力量识别电竞传播势能,1997年职业电子竞技联盟(CPL)成立并分发超300万美元奖金,2000年世界电子竞技大赛(WCG)推动电竞国际化,同年韩国官方首次提出“电子竞技”一词完成制度化认可 [7] 电竞赛事作为产业平台的价值外溢 - 赛事通过固定赛程将碎片化游戏体验升级为周期性公共文化场景,并内生演化出战队、教练、数据分析师等专业化分工角色 [9][10] - 赛事作为注意力枢纽产生显著经济效益:2025年EWC沙特电竞世界杯全球线上观看人次达7.5亿,吸引300万全球游客(含30万国际游客),拉动消费约6000万美元,酒店入住率增40%,餐饮收入增35% [11] - 国内赛事同样展现消费活力,2024年《王者荣耀》KPL年度总决赛跨省市购票用户占比超80%,单次赛事直接经济效益约3.03亿元,对旅游六要素拉动规模约2.34亿元 [11] 用户参与驱动的电竞生态构建 - 职业俱乐部通过会员体系、内容矩阵和线下活动将用户关系从“观看”升级为“参与”,实现消费转化与情感连接 [14] - 用户共治机制(如英雄联盟全明星赛观众投票决定选手)制度化参与改变赛事叙事,构成稳定关系链 [14] - 开放身份转换路径(如王者荣耀全民电竞人才计划)设置赛事主理人、解说等多岗位,使观众可转化为共建者,大众赛事体系提供从海选到全国总决赛的清晰路径 [15] 电竞精神作为产业可持续发展的内核 - 电竞满足年轻一代自我实现的内在驱动,其强调的意志品质、团队协作与逆境奋发价值观与年轻人需求契合 [17] - 电竞入亚赋予为国争光的集体荣誉感,并成为跨越地域的社交语言与文化共识,为青年提供理解世界的共同语境 [17][18] - 电竞精神凝聚个人奋斗、团队协作、荣誉追求和文化共鸣,将短期热情转化为长期情感链接,形成可持续文化生命力 [18]
腾讯研究院AI速递 20251126
腾讯研究院· 2025-11-25 16:01
Claude Opus 4.5 模型更新 - Anthropic正式发布Claude Opus 4 5,在编程、智能体及计算机操作方面表现卓越,真实世界软件工程测试达行业SOTA,超越GPT-5 1-Codex-Max和Gemini 3 Pro [1] - API定价为每百万Token 5美元(输入)/ 25美元(输出),相比上代Opus 4 1降低三分之二,在SWE-bench Verified中等effort设定下输出token使用量减少76% [1] - 模型在居家测试中得分超过所有人类候选人,在抵御提示注入攻击方面显著增强,是目前最不容易被欺骗的前沿模型之一 [1] OpenAI 购物研究功能 - OpenAI向所有登录用户开放“购物研究”功能,由经过强化学习训练的GPT-5 mini版本支持,准确率达64%,改变传统搜索逻辑让AI替用户做购物功课 [2] - 该功能通过追问预算、用途、期待功能等问题生成深度买家指南,支持图片搜索、优惠查找和横向对比,可调取Memory功能中的聊天记录实现个性化推荐 [2] - 已有商家加入Instant Checkout功能可实现边挑选边下单,OpenAI声明不收费推荐且不与零售商分享用户聊天记录,但国内市场数据缺失严重 [2] 腾讯混元OCR模型 - 腾讯混元推出开源模型HunyuanOCR,参数仅1B,在复杂文档解析OmniDocBench测评中获94 1分最高分,超过谷歌Gemini3-pro等领先模型 [3] - 模型依托混元原生多模态架构采用端到端训练和推理范式,在OCRBench榜单总得分860分,取得3B以下参数SOTA成绩,支持14种高频小语种翻译 [3] - 精通多语种复杂文档解析、文字检测识别,在票据字段抽取、视频字幕识别、拍照翻译等场景广泛应用,获ICDAR2025文档翻译比赛小模型赛道冠军 [3] 美国“创世纪计划” - 特朗普签署“创世纪计划”行政命令,由美国能源部主导构建“美国科学与安全平台”整合超算资源和联邦数据 [4] - 明确锁定先进制造、生物技术、关键材料、核裂变与核聚变、量子信息科学、半导体微电子六大优先领域,要求60天内提出20项国家挑战 [4] - 设定极速推进时间表270天内展示平台初步运行能力,英伟达、OpenAI、Anthropic等成为潜在供应商,强调数据安全和出口管制要求 [4] 小米MiMo-Embodied模型 - 小米汽车陈龙团队开源全球首个打通自驾与具身智能的跨领域基座模型MiMo-Embodied,基于MiMo-VL架构通过四阶段训练策略有效打破领域鸿沟 [5][6] - 模型在自动驾驶与具身智能共29个Benchmark上超越现有专用模型及通用模型,实现SOTA性能,涵盖环境感知、规划到机器人拿取、导航全场景 [6] - 采用渐进式训练包含具身AI监督微调、自动驾驶监督微调、思维链推理微调和强化学习微调四阶段,在具身导航和操作任务中展现强大能力 [6] X公司AI替代与裁员 - 马斯克解雇X公司负责打击垃圾邮件和信任安全问题工程团队一半成员,该团队从2022年超100人缩减至不足10人,裁员幅度达90% [7] - 马斯克计划彻底移除X启发式推荐算法由Grok接手,通过阅读全部内容自动匹配用户兴趣 [7] - 马斯克推进“巨硬Macrohard计划”用AI重做微软产品,但裁员影响了X Money支付服务等关键项目 [7] OpenAI AI硬件设备 - OpenAI联合创始人阿尔特曼和苹果前首席设计官艾维透露AI硬件已有首批原型,将在不到两年时间内面世,目标成为继iPhone、MacBook后第三大核心设备 [8] - 该设备是无屏幕AI手机,大小与iPod Shuffle相仿可挂脖子上,配备麦克风和摄像头能感知用户生活情景,深度理解场景长时间接管任务过滤无关信息 [8] - OpenAI今年5月斥资65亿美元收购艾维创办的AI硬件公司io [8] 食品行业AI应用 - 瑞士巧克力巨头Barry Callebaut与植物基食品科技公司NotCo合作,使用AI引擎Giuseppe开发下一代巧克力,应对全球可可价格三十年最大涨幅 [9] - Giuseppe基于十年高保真数据训练,可扫描成千上万种成分分析特性模拟替代方案,将成分化学、配方、感官读数综合成决策引擎加速产品开发周期 [9] AI发展观点 - 斯坦福大学教授李飞飞强调AI是文明级技术,技术应走向普惠开放让每个人平等负责任地参与使用,必须确保发展始终处于人类引导控制之下 [10] - 她提出“空间智能”是AI进化下一关键阶段,赋予机器在三维空间中理解感知推理与交互能力,其创办的World Labs估值已达十亿美元 [11] - 李飞飞认为超级智能挑战根源不在技术而在人类治理能力,教育应培养孩子好奇心批判性思维和责任感,最根本原则是不要让工具使你变愚蠢 [11]
寻找“解法”:2025可持续社会价值创新大会正式预告
腾讯研究院· 2025-11-25 09:53
大会核心信息 - 2025可持续社会价值创新大会(S大会)将于12月3日在北京中关村国际创新中心举办 [16][17] - 大会主题为“解法”,旨在探索人工智能技术助力可持续发展的可行路径 [2][18] - 大会目标是将“AI向善”的共识从理念推向实践,推动技术到社会的系统性革新 [5][18] 主论坛议程与核心议题 - 上午主论坛将围绕“AI向善”展开,图灵奖得主姚期智和清华大学教授薛澜将发表主旨演讲,从技术与人文维度剖析AI与社会发展的关系 [7][21][22] - 设置两场关键对话,分别聚焦“科技向善”和全球性挑战的生态化解决方案,参与者包括码隆科技、强脑科技、腾讯公司的高管以及施瓦布社会企业家基金会等机构代表 [8][23] 平行论坛核心内容 - 下午同步举办五场平行论坛,核心议题为“AI向善”与“社会创新” [10] - “创新实践”论坛将展示AI假肢助力残障人士、AI预防雷电灾害等具体案例 [10] - “前沿研究”论坛汇聚清华大学、中国科学院等机构学者,探讨AI伦理、治理与发展路径 [10][25][27] - “青年参与”论坛将呈现由高中生发起的跨国“黑客松”、青年开发者打造的“AI幸福舱”等实践 [10][28][29] 社会创新与影响力投资 - “社会创新·生态”论坛将探讨企业如何打破组织边界,将核心能力作为“公共产品”开放给生态伙伴 [11][32][35] - “影响力投资”论坛指出全球影响力投资正迈向万亿美元规模,亚洲是增长最快市场,论坛将聚焦混合金融等创新模式在亚洲的落地 [11][38][39] 互动体验与展示 - 大会现场将打造沉浸式体验场,展示科技如何改变残障人士生活、智能轮椅提升老年人生活质量等解决方案 [13] - 设置“碳寻制造”新品发布会,展示6款采用碳捕集利用技术的新品,并设有数字景德镇VR漫游、盲人影院听觉科技等主题体验空间 [13]
全球Z世代“轻社交”趋势:动因与启示
腾讯研究院· 2025-11-25 09:53
全球Z世代社交方式转变趋势 - 社交关系呈现模块化特征,重心从维护稳定泛化友谊网络转向根据场景和即时需求精准匹配轻量灵活的社交零件,例如“搭子文化”在工作环境中覆盖六成以上年轻人,58%通过线下活动寻找临时伙伴[4] - 以维系友谊或结识新朋友为目的使用社交媒体的用户比例较2014年下降超过25%,显示社交动机持续弱化[4] - 社交内容呈现瞬时化主流表达,Instagram Stories功能日活跃用户从2017年1.5亿增至2025年5亿,其中86.6%用户保持每日发布习惯,朋友圈三天可见设置也反映年轻群体转向自由即时表达[6] - 社交互动呈现游戏化特征,通过每日限时自拍挑战、排行榜与勋章奖励系统将真实分享转化为规则性互动任务,游戏如《Roblox》以低门槛互动设计使“一起玩”成为社交关系起点[7] 轻社交现象核心动因 - 宏观环境催生低能耗社交需求,2025年世界不确定性指数是2014年五倍以上,Z世代面临高于平均水平的工作、财务与社会压力,推动社交模式向轻量化系统性演进[9] - 认知转向重构社交价值观,长期接触负面信息加剧不确定感,促使主动疏离高投入深度社会连接,转而重视互动中真实感与瞬间意义,模块化社交的低心理负担与高情绪确定性更具吸引力[10] - 技术发展塑造社交行为新模式,用户被动浏览行为自2014年以来增长超10%,超过86%用户存在无意识刷视频行为,算法驱动的瞬时兴趣匹配机制推动形成功能导向轻量化关系偏好[11][12] 对科技企业的启示与建议 - 构建多元生态适配全球需求,需在研究出海国家Z世代社交习惯与情感需求基础上,打造覆盖多场景、多文化且兼具本土适应性与全球共通性的解决方案[14] - 产品设计聚焦认知转向,在游戏和社交媒体等产品中重点构建低负担、高真实感互动场景,将情感价值与自我表达融入用户体验作为核心导向[14] - 推动算法重塑链接,将“可持续社交”理念融入技术架构,优化算法在停留时长和多元化内容推送间实现平衡,使技术成为健康数字生活共建者[15]
腾讯研究院AI速递 20251125
腾讯研究院· 2025-11-24 16:14
生成式AI技术进展 - 谷歌发布嵌套学习新机器学习范式,将模型视为一组嵌套的优化问题以减轻灾难性遗忘 [1] - 该方法通过关联记忆、更新频率分层和优化器即记忆模块实现早期层高频刷新、后期层低频整合的新训练框架 [1] - 基于此推出的HOPE模型在语言建模困惑度和常识推理准确率上表现最优,在长上下文任务中展现卓越内存管理能力 [1] OpenAI竞争动态 - OpenAI内部备忘录显示奥特曼承认谷歌近期AI进展可能给公司带来暂时经济阻力 [2] - OpenAI研究员已知晓谷歌开发了超越Gemini 3的模型,奥特曼间接承认开始落后谷歌 [2] - OpenAI或将在未来几个月推出代号"Shallotpeat"的新模型,专门修复预训练过程中的错误以追赶谷歌 [2] AI应用产品更新 - 设计Agent Lovart正式接入Nano Banana Pro,支持一次性处理14张图片元素并生成专业级设计成品和视频 [3] - Lovart推出Touch Edit功能,通过简单点击即可精准修改细节,还支持"编辑元素"功能将图片分层可编辑 [3] - 北大哲学博士刘耕创办Elser.AI,这款AI短剧生成Agent在无宣传情况下积累了20万全球活跃用户 [5] - Elser.AI支持从剧本到分镜到成片的全流程创作,用户可控制角色形象、构图景深、运镜动作等所有细节 [5] 行业标准与交互范式 - MCP社区由OpenAI和Anthropic核心维护者联手推出MCP Apps提案,规范对交互式用户界面的支持 [4] - 该提案引入拼接轨迹图、状态转移场和预先声明的资源技术,使MCP服务器能直接提供可视化操作界面 [4] - MCP Apps基于MCP-UI和OpenAI Apps SDK,已被Postman、Shopify、Hugging Face等公司采用 [4] AI科研突破 - 陶哲轩使用Gemini Deep Think十分钟完成了Erdős 367号问题的证明补全,该问题涉及连续整数结构的乘法数论 [7] - 近期Erdős问题网站上陆续有6个困扰数学界多年的难题通过AI辅助方法得以解决 [7] 跨平台兼容与技术落地 - Google宣布Pixel 10系列正式支持原生AirDrop能力,可直接向iPhone隔空投送照片及文件 [8] - 香港科技大学团队实现全球首个能在真实场景中完成篮球动作的机器人demo,使用宇树G1完成三步上篮等技能 [9] - 该成果基于SkillMimic-V2技术,通过拼接轨迹图、状态转移场等创新在低质量数据条件下训练出复杂交互策略 [9] 行业领袖观点 - DeepMind CEO表示谷歌AI叙事正从"奋力追赶"转变为"处于领先地位",Gemini 3在"人类终极考试"得分从21.6%飙升至37.5% [10] - 预测通往AGI还需5-10年及一两个重大突破,目前扩展定律仍有效但存在边际效用递减 [10] - 认为种子轮投资可能存在泡沫,但在应用层和前沿科技领域蕴含巨大真实价值 [10]
美国AI算力新基建是“泡沫”吗?
腾讯研究院· 2025-11-24 09:03
美国算力投资热潮的规模与驱动因素 - 当前美国算力投资是在通用人工智能趋势下的超前基础设施布局,规划中的大型数据中心项目总装机容量已突破45吉瓦,预计吸引超2.5万亿美元投资[3][7] - 代表项目包括OpenAI与Oracle、软银合作的星际之门计划(部署至少10吉瓦算力),与博通研发10吉瓦定制AI加速器,与AMD合作部署不少于6吉瓦AMD GPU卡;Meta正在推进包括1吉瓦普罗米修斯项目和计划扩容至5吉瓦的海伯利安项目;亚马逊预计在2026-2027年新增约13吉瓦容量[7] - 英伟达因AI投资跃升为全球市值最高的公司,市值一度达到破纪录的5万亿美元,甚至有分析师预测其市值将达到8.5万亿美元[7][17] 市场需求与收入增长 - 大模型企业增长斜率高,对芯片需求持续提升:OpenAI预计今年底年化收入将超过200亿美元,相比去年40亿美元增长5倍,并计划到2030年增长至数千亿美元;Anthropic有望在今年底实现90亿美元年度经常性收入,相比去年10亿美元增长9倍[3][13][14] - 行业落地推动云厂商收入增长:今年三季度,亚马逊、微软和谷歌的云计算收入受AI拉动,分别达330亿美元(同比增长20%)、309亿美元(同比增长28%)和152亿美元(同比增长34%)[4][16] - 用户增长和Token使用量激增:全球大模型个人用户去重后约10亿,而全球互联网用户达55亿,显示AI用户仍有巨大增长空间;Google一家10月公布的月均Token使用量就达1300万亿,a16z合伙人表示过去17个月内全球Token处理量增加150倍[12][16] 投资资金来源与潜在风险 - 主要科技公司现金流相对充足:英伟达、微软、谷歌、亚马逊、博通、Meta、特斯拉、Oracle的合计现金及等价物超过2000亿美元[23] - 债务融资规模巨大且风险凸显:美国AI公司今年以来发债规模已超过2000亿美元,AI相关债务正以每季度约1000亿美元的速度累积;Meta发行债券筹资270亿美元,微软携手贝莱德推出300亿美元基金并计划最终筹集高达1000亿美元,xAI通过特殊目的实体模式筹集200亿美元[23][24] - 摩根士丹利预测到2028年全球在AI数据中心和芯片上的总支出将高达2.9万亿美元,其中科技巨头提供1.4万亿美元,债务融资预计填补1.2万亿美元缺口,私募信贷基金将成为主力提供8000亿美元[24] 历史对比与泡沫评估 - 判断投资是否为泡沫需考察其生产性及资金来源:当前投资相较于荷兰郁金香等非生产性泡沫更具合理性;对比2000年互联网泡沫时期,当前科技股估值虽有一定上升但仍处于相对合理区间,有较强业绩支撑[5][26][27] - 芯片资产特性风险被忽视:芯片折旧周期仅约5年,一旦过剩其价值会迅速损耗,这与互联网泡沫时期光纤长达25年使用寿命且后期能被重新利用的特性不同[28] - 电力供应成为重大制约:到2030年数据中心可能占美国能源消耗的10%(2022年仅为2.5%),卡内基梅隆大学预测数据中心扩张将使全美平均电费再上涨8%,部分密集区涨幅甚至可能高达25%[30] 技术演进与未来展望 - 黄仁勋提出3个Scaling Law观点,认为在预训练、后训练强化学习及推理过程中均存在规模法则支撑算力持续增长;英伟达过去4个季度已售出600万块Blackwell GPU,预计Blackwell和Rubin系列芯片明年销售额将达到5000亿美元[17][19] - 高盛预期AI广泛普及有望为美国经济增加约20万亿美元,其中约8万亿美元以资本收入形式流入企业,为算力基建提供更强合理性[18] - 数据中心建设是美国再工业化战略的重要组成部分,可有效牵引本土土建、钢构、机电、冷却、发电、储能等成套工业链条[20]