腾讯研究院
搜索文档
如何度过技术变革的“乱纪元”?
腾讯研究院· 2025-12-15 10:18
文章核心观点 - AI的快速发展正引发深刻的技术与社会变革 当前硅谷的裁员潮虽非完全由AI引发 但AI在其中扮演了复杂的一体两面角色 既催化组织变革 也迫使企业进行战略聚焦和资源重配[2] - 应对AI带来的挑战 需要从个体和社会两个层面着手 个体需提升适应能力 社会则需构建制度化的韧性机制 以度过技术变革的“乱纪元”[3] - 回顾工业革命的历史经验 特别是对比英国的卢德运动与中国张謇的实践 能为应对当前AI冲击提供启发 关键在于如何协调技术进步与社会福祉[4][5][6][7] - 与历次技术革命相比 人工智能革命在速度、规模和影响上更为剧烈 对社会适应与协调能力提出了前所未有的挑战[9][11][13] - 在后AI时代 科技公司需要积极承担社会责任 从张謇精神中汲取智慧 秉持发展为先、以人为本、社会共生的理念 以引导技术向善[14][15][16][17] AI与当前就业市场动态 - 根据Layoffs.fyi统计 2024年已有超过218家科技公司进行裁员 总人数超过11万[2] - AI在本轮裁员中作用复杂 一方面是推动企业实质性组织变革的催化剂 另一方面其巨大的投入预期迫使企业进行战略聚焦和资源重新配置[2] - 部分企业在盈利增长下的反常规裁员操作 被视作AI就业替代的重要信号[2] 历史镜鉴:工业革命的启示 - 第一次工业革命初期 蒸汽机在提升效率的同时也带来了社会转型阵痛 引发了如1811年卢德运动等工人对抗[5] - 同期 经济学家David Ricardo(1821年)和哲学家Thomas Carlyle(1839年)已开始关注和批判机器对工人利益及社会结构的冲击[5] - 工业革命浪潮传入中国后 以张謇为代表的企业家采取了截然不同的路径 通过开办实业、发展教育、建设福利体系(如工人住宅、公园、医务室) 实现了工人、企业与社区的协同发展[6] - 张謇的模式使南通在数十年间从农业县转变为近代工商业城市 体现了企业效率与社会福祉兼顾的发展逻辑[7] - 工业革命时期 技术扩散受物理空间制约 社会有相对充裕的时间通过立法(如1833年英国《工厂法》)等机制适应调整 例如英国城市人口比重从1801年的33.8%增长到1851年的50.2%[10] AI技术革命的独特性与挑战 - AI革命触及的根本性问题在于可能取代人类思考 挑战人的主体性和意义感[9] - AI技术扩散速度远超以往:第一次工业革命普及持续近百年 电力需几十年 信息革命以年/月为单位 而AI则以天为节奏更新 有“大模型一天,人间一年”的说法[11] - 标志性产品用户积累时间急剧缩短:电话达到50%美国家庭普及用了50多年 广播吸引5000万听众用了38年 互联网时代的Meta达到1亿用户用54个月 移动互联网的TikTok用9个月 而AI时代的ChatGPT仅用2个月[11] - 麦肯锡全球研究院研究表明 以AI为代表的新兴科技促成的社会转变 与工业革命相比“发生的速度快10倍 规模大300倍 影响几乎大3000倍”[11] AI对就业的影响预测 - 世界经济论坛《2025年未来就业报告》预测 到2030年 AI将替代9200万个岗位 同时创造1.7亿个新岗位 净增7800万个就业机会[12] - 联合国国际劳工组织与波兰机构的联合研究显示 全球四分之一工作岗位可能受生成式AI影响 但最可能结果是岗位转型而非直接被取代[12] - DeepSeek研究员陈德里预测 AI影响就业分为三个阶段:3-5年短周期为人类与AI协作蜜月期;5-10年中期取代风险上升;10-20年长周期可能取代绝大多数人类工作 社会秩序面临较大挑战[12] 后AI时代的企业责任与发展理念 - 应对AI挑战需构建新的社会韧性机制 从社会系统再平衡高度进行整体思考[13] - 在技术变革的“乱纪元” AI企业需积极、主动探索社会议题解决方案 并反馈至产品责任与伦理规范[14] - 行业领先公司已开始探索:OpenAI创始人萨姆·奥特曼开启无条件基本收入(UBI)实验;谷歌正在物色“高级人工智能经济学家”以研究后AGI时代的经济学与资源分配[14] - 张謇精神对AI时代企业的现实启迪包含三点核心:1)发展为先的使命追求 以产业升级和社会进步为己任;2)以人为本的价值导向 技术发展必须服从人的价值与利益 保障人的主体性与尊严;3)社会共生的发展逻辑 构建跨越产业、文化和治理的系统性生态 推动形成丰裕、可持续的智能社会[15][16][17]
腾讯探元计划创新升级:重点破解“AI考古”与“活化利用”前沿难题
腾讯研究院· 2025-12-15 10:18
腾讯探元计划NextGen升级发布 - 腾讯于12月12日在北京举办探元创新大会,正式启动全新升级的“探元计划NextGen”[2][3] - 新计划将重点聚焦“AI考古”与“活化利用”两大赛道,旨在深度拓展AI等前沿技术应用,破解文化遗产保护与活化的前沿难题[2][3] - 该计划由腾讯SSV与腾讯研究院主办,联合北京大学文化产业研究院、山东大学文化遗产研究院等机构共同发起[4] AI考古赛道规划与目标 - “AI考古”赛道由山东大学文化遗产研究院联合发起,旨在将人工智能技术深度融入考古学研究与实践[3] - 该赛道计划评选2-3个标志性场景项目,每个提供百万元级资助;以及3-5个技术突破项目,每个提供30万元资助[3] - 赛道致力于解决传统考古耗时长、依赖专家经验、数据处理效率低等挑战,从文物智能复原、数据智能分析、古文字智能解读等层面推动行业进步[3] 活化利用赛道规划与目标 - “活化利用”赛道由北京大学文化产业研究院联合发起,目标是精准推动3个左右具有代表性的文化数智化场景落地,形成可复制、可推广的模式,并推动潜力项目走向国际[3] - 该赛道直面文化遗产资源数智活化痛点,发起三大议题以解决行业问题[5] - 议题一为“文化垂类多模态智能体”,解决通用大模型在文化遗产领域个性化和专业性不足的痛点[5] - 议题二为“沉浸式互动体验创新”,重点解决文化资源展示方式单一、故事讲述单调、互动体验不足的问题[5] - 议题三为“人机协同技艺传承与创新”,重点解决文化传承断层问题,通过对传承人技艺进行标准化、可量化分析和永久性数字化保存,实现活态传承[5] 探元AI技术平台与能力 - 腾讯SSV数字文化实验室在会上发布了面向文博场景的探元AI,致力于为行业痛点及公众体验提升提供系统化解决方案[2] - 探元AI基于混元和DeepSeek双引擎大模型,整合了腾讯多媒体实验室6DoF技术、混元图生文团队的AI多模态识别能力,并基于腾讯优图实验室、腾讯云智能等平台超过300项AI原子能力构建[7] - 平台构建了高质量的结构化数据和文物语料库,并面向行业开放知识库管理平台以及系列场景化的智能体开发支持[7] - 作为文博助手,探元AI将面向公众提供实景导览、文物讲解、拍照识文物、AIGC创作工具,以提升公众互动观展体验[7] 探元平台发展现状与愿景 - 目前已有全国超过600家博物馆入驻探元平台,并沉淀了包括甲骨文、北京中轴线、景德镇等在内的头部文化IP语料库[8] - 公司下一步将逐步开放探元AI工具平台,为更多文保机构提供技术支撑,助力构建全链条的数字化防护体系,并向中小博物馆推出低门槛的普惠解决方案[8] - 探元平台旨在以AI为内核,构建一个开源的社会文化服务平台,用AI驱动中华文化遗产的数智化转型,目标是“让真实的文明,被活在今天时代的人们,更真切的感知”[8] 2024年文化遗产数字化成果 - 2024年,探元计划在文化遗产数字化保护与活化方面取得系列突破性进展[11] - 运用AI大模型与太赫兹时域光谱技术,成功实现对克孜尔石窟烟熏壁画的智能识别与虚拟复原[11] - 攻克了龙门石窟微痕浅浮雕的高精度三维建模与纹饰解析瓶颈[11] - 微痕增强技术帮助研究人员更高效地释读安阳殷墟的甲骨文[11] - 在传承与传播方面,利用三维算法技术数字化再现了河南陈家沟陈氏太极拳的姿态动作[11] - 借助数字交互与动捕技术,使三星堆博物馆的数字IP“蜀堆堆”变得生动可爱,获得年轻游客欢迎[11] 行业背景与公司战略 - 2024年,中国博物馆的接待人次达到了14.9亿,但文博消费体验仍有很大提升空间,年轻用户渴望参与和共情,而非单向说教[7] - 腾讯公司副总裁表示,“科技向善”是公司长期坚守的使命,保护、传承传统文化,推动“科技+文化”融合发展是公司持续关注与投入的重要事业[12] - 腾讯探元计划持续搭建跨界对话平台,推进科技与文化融合,让技术方与场景方有效衔接,其成果已成功入选《世界互联网大会文化遗产数字化案例集(2025)》,获得国际认可[12]
腾讯研究院AI速递 20251215
腾讯研究院· 2025-12-14 16:01
OpenAI GPT-5.2发布与市场反馈 - OpenAI在十周年发布号称“最强专业知识工作模型”的GPT-5.2系列,但上线24小时后在X平台和Reddit上遭遇用户集体差评,被批评过于平淡、安全审查过度、情商堪忧 [1] - 第三方基准测试显示GPT-5.2表现不佳:在SimpleBench测试中得分低于一年前的Claude Sonnet 3.7,在LiveBench测试中得分低于Opus 4.5和Gemini 3.0,甚至在简单问题上回答错误 [1] - 用户最诟病的是其安全拒绝机制过于严格,导致模型的共情力和语境感知能力下降,在情感支持等场景中给出的建议机械且脱离现实 [1] 谷歌推出Gemini Deep Research Agent - 在GPT-5.2发布前一小时,谷歌推出全新版Gemini Deep Research Agent,该产品基于Gemini 3 Pro构建,并通过多步强化学习训练以提高准确性并减少幻觉 [2] - 新版Agent在多项基准测试中取得领先成绩:在Humanity's Last Exam测试集中达到46.4%,在DeepSearchQA上取得66.1%,在BrowseComp测试中获得59.2%的高分 [2] - 谷歌同步推出了开源的网络研究Agent基准DeepSearchQA和全新的交互式API,后者支持服务器端状态管理、远程MCP工具调用和后台执行长时间推理循环 [2] Runway发布通用世界模型GWM - Runway正式发布5大更新,包括升级的Gen-4.5旗舰视频模型和首个通用世界模型GWM-1,前者支持原生音频生成编辑和多镜头编辑功能 [3] - GWM-1是一个自回归模型,支持逐帧预测和实时干预,包含三种变体:可探索环境的GWM Worlds、对话角色的GWM Avatars和机器人操作的GWM Robotics [3] - 英伟达CEO黄仁勋发来祝贺视频,标志着行业从单纯的“视频生成”迈向真正的“世界模拟”,AI开始理解物理世界的底层逻辑 [3] 谷歌AI翻译与浏览器创新 - 谷歌翻译引入Gemini模型能力,推出支持任何品牌耳机的实时语音翻译Beta版,覆盖超过70种语言,并能保留说话者的语调、重音和节奏 [4] - 文本翻译引擎经过重构,能智能解析俚语和成语的上下文,而非生硬逐字翻译,支持英语与近20种语言(包括中文、日语、德语等)互译 [4] - Chrome团队在Google Labs推出实验性浏览器Disco,其核心概念是GenTabs生成式标签页,可将网页内容转化为包含地图、行程表的交互式微型应用 [4] 腾讯混元3D模型与拓竹科技合作 - 拓竹科技旗下3D模型平台MakerWorld全面升级,接入腾讯混元3D 3.0大模型,并上线全新手办生成器“印你”,用户只需上传一张图片即可生成可打印的3D模型 [5][6] - 混元3D 3.0首创3D-DiT分级雕刻技术,建模精度提升3倍,几何分辨率高达1536³,支持36亿体素超高清建模,使五官更立体、细节更锐利、纹理更逼真 [6] - MakerWorld平台已有20款各具特色的建模工具,吸引全球超过200万用户,此次接入顶尖生成式AI技术使设计周期大幅缩短,创作不再受限于建模技术 [6] 迪士尼与OpenAI达成战略合作 - 迪士尼向OpenAI进行10亿美元股权投资,并获得购买额外股权的认股权证,这是Sora平台首次迎来大型内容授权合作伙伴 [7] - 双方达成三年期许可协议,第一年具有排他性,Sora和ChatGPT Images将获得迪士尼旗下超过200个角色授权,包括米老鼠、漫威、皮克斯和星球大战角色,但不包含真人肖像或声音 [7] - 迪士尼将利用OpenAI的API构建新产品工具覆盖Disney+流媒体平台,为员工部署ChatGPT用于内部工作流程,粉丝精选创作视频将在Disney+播放 [7] AI在数学研究领域取得突破 - 数学家埃尔德什于1975年提出的Erdos1026问题困扰数学界50年,在AI辅助下,人类团队仅用48小时便攻克并给出正式证明,陶哲轩称AI带来了全新理解,绝非简单搜索 [8] - Harmonic的AI系统Aristotle在Lean证明辅助语言中自动证出c(k²)=1/k,AlphaEvolve系统则探索c(n)数值结果帮助提炼出干净公式 [8] - AI通过深度搜索找到了2024年Baek、Koizumi、Ueoro论文的完整解,这在传统模式下可能需要数周甚至数月,此次证明了AI在生成新数学洞见而非仅检索现有文献方面的能力 [8] 宇树科技推出人形机器人应用商店 - 宇树科技正式上线行业内首个致力于将人形机器人功能模块化、标准化的内容分发平台——人形机器人应用商店,旨在解决复杂动作开发难、用户上手门槛高的问题 [9] - 应用商店集成用户广场、动作库、数据集及开发者中心四大核心模块,用户无需底层代码编写能力即可像安装手机软件一样一键部署云端运动控制算法 [9] - 首批上线应用包括基于G1系列机器人的“李小龙”截拳道与“扭扭舞”预设,通过独家动力学算法结合高精度动作捕捉数据,将武术动作库无缝移植到机器人硬件 [9] DeepMind科学家对AGI发展的预测 - Google DeepMind首席AGI科学家Shane Legg预测,最小AGI有50%的可能性在2028年实现,完全AGI将在最小AGI出现后3-6年内实现,随后进入超级智能ASI阶段 [10] - 他认为AGI并非一个临界点,而是一个连续光谱,分为三阶段:最小AGI能完成普通人的典型认知任务,完全AGI能完成最杰出人类的认知任务,ASI全面超越人类所有认知领域 [11] - AGI将导致倒挂式结构性失业,高层认知工作首当其冲,基层体力工作暂时安全,社会需要重新设计分配机制并重构人类在失去工作身份后的幸福定义 [11] 生成式AI用户趋势与市场格局 - Similarweb发布的2025年度AI报告显示,全球生成式AI平台月访问量超过70亿次,同比暴涨76%,移动端App下载量达19亿次,一年内翻了3倍多 [12] - 18-34岁用户占比反而下降约15%,说明年纪更大的用户正在快速涌入,ChatGPT已跻身全球前五大网站,但95%的用户仍同时使用谷歌,形成互补双入口格局 [12] - AI Mode成为首个访问量突破1亿的生成式AI搜索功能,互联网正从“被搜索检索”变成“被AI谈论” [12]
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-12-13 02:33
芯片与算力进展 - 英伟达H200芯片出口成为关注焦点[3] - 摩尔线程发布了新的GPU架构[3] - 英伟达发布了CUDA Toolkit 13.1[3] - Starcloud在太空AI算力领域有所布局[3] 大模型与架构创新 - 谷歌推出了Titans架构和深度思考模式[3] - 智谱发布了GLM-4.6V模型[3] - 美团发布了LongCat-Image模型[3] - 腾讯发布了混元2.0模型[3] - 英伟达发布了NVARC小模型[3] - OpenAI正在进行新模型测试[3] - Mistral AI发布了Devstral 2模型[3] - Meta发布了名为「牛油果」的模型[3] AI应用与产品 - Meta展示了AI可穿戴设备[3] - Anthropic推出了AI面试官应用[3] - 微软发布了VibeVoice应用[3] - 可灵平台推出了主体库功能[3] - 阿里发布了Qwen3-TTS和Qwen-Image-i2L应用[3][4] - 智谱发布了AutoGLM和GLM-ASR应用[3] - 通义实验室有所动作[3] - Nature Select提到了Echo-N1应用[3] - Nabla Bio在开发前沿AI药物[3] - Adobe集成了ChatGPT功能[4] - 智谱发布了GLM-TTS应用[4] - 商汤发布了Seko 2.0应用[4] - 元宝应用推出了总结群消息功能[4] 前沿科技与硬件 - 普渡科技发布了PUDU D5系列产品[4] - Google推出了Android XR[4] - 智元机器人实现了机器人量产[4] - 灵初智能发布了Psi-SynEngine[4] 行业事件与动态 - 苹果公司面临人才流失问题[4] - 微软发布了红色警告[4] - Linux基金会与吴恩达联合成立了AAIF组织[4] 行业观点与趋势 - Yann LeCun发表了关于离职的论文[4] - OpenRouter分析了AI应用现状[4] - a16z提出了搜索AI时代的观点并探讨了AI创业机会[4] - Geoffrey Hinton认为谷歌AI必将获胜[4] - Andrej Karpathy分享了AI提问策略[4] - OpenAI讨论了企业AI采用情况[4] - 摩根士丹利指出TPU产能正在爆发[4] - Anthropic组建了AI宪法团队[4] - MiniMax强调了全模态发展的重要性[4]
前沿研究丨数字福祉如何衡量?清华徐心团队以GDP-B方法测度数字经济隐形价值
腾讯研究院· 2025-12-12 08:00
研究背景与核心挑战 - 在数字经济时代,大量免费或零价格的数字产品和服务创造了巨大社会价值,但因其“零价格”特性,难以被传统的国民经济核算体系(如GDP)所捕捉和衡量 [2][5][6] - 清华大学徐心教授团队的研究旨在解决这一关键挑战,即如何科学地衡量这些无形的数字福祉,并重新定义数字经济时代的价值内涵 [2][4][5] 研究方法论创新:GDP-B框架 - 研究团队引入并完善了“GDP-B”(国内生产总值-效益)测量方法,以填补数字福祉测量的空白 [6][7] - 该方法通过巧妙结合大规模实证调研与激励相容实验设计,引导用户真实反映数字服务在其“心理账户”中的价值,从而在客观价格数据与主观调研数据之间找到平衡点,构建了数字福祉的科学测量体系 [7][9] 中国数字福祉的实证研究发现 - 研究团队开展了覆盖全国11个一二线城市、13000名受访者的大规模预调研 [10] - 发现中国消费者对数字服务的价值感知显著较高,例如支付、导航等常用APP的月均估值远超国际同类产品水平 [10] - 数字福祉并非固定不变,而是随使用场景、服务状态等因素动态变化 [11] - 研究关注数字福祉与经济发展水平的关系,初步发现中国一二线城市呈现与斯坦福团队(基于13国数据)不同的趋势:人均GDP更高的城市,消费者从数字APP中获得的价值感知更大 [12] - 关于“数字库兹涅茨曲线”的形态,存在两种可能性:若将中国数据与斯坦福数据合并,可能呈现倒U型曲线;而随着调研覆盖更多中国城市,也可能复现正U型规律,这需要更大规模的全国性研究来验证 [12] 研究规划与生态构建 - 研究团队计划每季度开展全国性调研,以建立中国数字福祉的动态数据库,深入探索数字福祉与经济发展水平的关系等底层规律 [13][14] - 研究已与腾讯可持续社会价值事业部等机构建立合作,计划构建中国数字福祉的长期观测体系,旨在为数字经济时代的政策制定提供科学依据 [15] - 未来规划包括:在确保数据安全的前提下逐步开放研究数据;基于大规模实证数据探索经济智能大模型的开发;深化数字福祉与经济社会发展关系的理论研究 [17] 研究的学术与社会意义 - 该研究展现了中国学者在国际前沿领域的创新实力,为理解数字经济的社会价值提供了新的理论框架和研究方法 [17] - 研究不仅旨在推动学术理论发展,更期望通过系统性的测量研究,帮助更准确地评估数字经济发展成效,为高质量发展提供重要参考 [15][17]
英伟达H200获准出口中国的三个关键问题
腾讯研究院· 2025-12-12 08:00
以下文章来源于腾讯科技 ,作者值得关注的 苏扬 腾讯科技作者 徐青阳 编辑 "在国家安全得到保障的前提下,美国即将允许英伟达向中国大陆等地区的客户出口H200产品。"特朗 普美国时间12月8日在社交媒体上宣布了这一"交易",作为回报,英伟达需要给美国政府25%的销售分 成。 从目前特朗普在社交媒体官宣允许H200出口的这个动作来看,上述疑虑已经得到了安抚。很重要的一 点, 是过去一段时间黄仁勋在各种场合吹风,"不确定大陆客户会不会要"、"H200已经不够先进"。 腾讯科技 . 腾讯新闻旗下腾讯科技官方账号,在这里读懂科技! 对此,英伟达回应称:"向商业客户供应H200是一种值得肯定的举措。" H200的出口解禁这个事情上,有三个问题值得关注: 流程什么时候落地、对谁是利好,对国产生态会 带来什么影响? H200的解禁实际上早有传闻,之前的争议点在于:美国行政和立法部门之间的博弈。或者说,如何消 除美国国会层面对"保持美国AI继续领先能力"丧失的疑虑。 "美国商务部和国会不一定乐见,现在这种提议到最后落地,概率要打个问号。 "此前一位科技政策研 究员谈及H200的解禁传闻时说。 相关流程需要多长时间? 但黄仁勋 ...
腾讯研究院AI速递 20251212
腾讯研究院· 2025-12-11 16:25
Meta的战略调整与重大投资 - Meta神秘AI项目“牛油果”(Avocado)发布计划从2025年底推迟至2026年第一季度,其训练使用了Google Gemma、OpenAI gpt-oss和Qwen模型,并可能采取闭源方式 [1] - 在Llama 4发布后效果未达预期,Meta重新思考开源战略,成立MSL超级智能实验室,并以143亿美元引入28岁的AI负责人Alexandr Wang [1] - MSL部门裁员600人,但不涉及核心的TBD Lab团队,同时公司宣布投资270亿美元建设Hyperion数据中心 [1] 大模型应用生态集成 - Adobe将其Photoshop、Express和Acrobat工具集成至ChatGPT,用户可通过文字描述直接使用图片美化、设计信函和编辑PDF等功能,目标面向ChatGPT超8亿的周活跃用户 [2] - 这些集成工具在ChatGPT中可免费使用,但不包含Generative Fill等高级功能,这是OpenAI将更多第三方应用引入ChatGPT的举措之一 [2] - 今年10月首批加入ChatGPT的第三方应用包括Spotify、Zillow和Figma等 [2] AI模型与技术的开源发布 - 智谱发布工业级语音合成系统GLM-TTS,仅用10万小时数据训练便实现“3秒”音色复刻,在字错误率和情感表达上达到开源SOTA水平 [3] - GLM-TTS采用两阶段生成范式,并基于GRPO算法融合了CER、相似度、情感、笑声四维度的正则化奖励机制 [3] - 模型已在Hugging Face和ModelScope开源,用户可通过Z.ai、智谱清言及BigModel平台体验和调用API [3] AI视频与内容创作工具进展 - 商汤Seko 2.0发布多剧集创作功能,支持最高100集连续创作,声称一个人30分钟即可完成一集短剧,实现从剧本到成片全流程自动化 [4] - 该工具核心优势在于保持资产库的主体和场景一致性,并能自动关联前后剧情,其数据采集成本仅为真机遥操方案的10% [4] - 工具集成了Vdiu、海螺、可灵等主流视频大模型,并推出限时活动,商汤自研生图模型限免一周,月高级会员提供65折优惠 [4] AI助手功能拓展 - 腾讯元宝AI助手推出QQ群智能未读消息总结功能,能将群聊记录提炼成结构清晰的总结报告 [5] - 功能具体包括热聊话题归类、精准信息追踪(筛选@提及消息)、群文件整合和原文直达索引 [6] - 元宝已支持添加为QQ好友进行一对一对话,其电脑版、浏览器插件及移动APP均已上线 [6] 太空计算与AI前沿 - 初创公司Starcloud发射的Starcloud-1卫星搭载H100芯片,其算力比以往太空GPU强100倍,并成功在轨运行谷歌Gemma,训练出首个太空大型语言模型 [6] - 该模型基于Karpathy的nanoGPT用莎士比亚语料训练,可用文艺复兴时期语言风格回答问题,并能进行实时情报分析 [6] - Starcloud计划打造5GW的轨道数据中心并配备4公里太阳能板,预计成本仅为地面数据中心的1/10,SpaceX和谷歌等巨头均已布局该领域 [6] 具身智能与数据采集技术 - 灵初智能发布全球首个具身原生人类数据采集方案Psi-SynEngine,包含便携式外骨骼触觉手套数采套装、大规模in the wild数采数据管线等 [7] - 该方案数据获取成本仅为真机遥操方案的10%,定位精度达亚毫米级,可完整采集手部手臂全部自由度和全手触觉信息 [7] - 公司同步发布Psi-SynNet-v0大规模真实世界多模态数据集,覆盖视觉、语言、触觉、动作,已构建上万小时规模并计划明年突破百万小时量级 [7] AI行业趋势与投资观点 - a16z预测到2026年,AI将彻底重塑各行业,Agent-native基础设施将成为必需品,系统核心瓶颈在于多Agent协调能力而非算力存储 [8] - 消费级AI产品重心正从“提高效率”转向“增进连接”,更“懂我内心”的产品比“帮我做事”的产品有更好的用户留存 [8] - AI绝大部分市场机会在传统垂直行业而非硅谷,视频将成为可“进入”的仿真环境,CRM将变成基础设施,Agent将成为交互核心 [8] 中国AI公司的发展与竞争力 - MiniMax创始人闫俊杰强调全模态发展是AGI的必由之路,公司在语言模型、视频、音频赛道均做到全球领先,音频全球第一、视频第二,未来将探索多模态融合 [9] - MiniMax-M2以61总分位居全球大语言模型第五、开源第一,其采用10B激活参数(总参数230B)的MoE架构,算力成本仅为Claude4.5的8%,上线一个多月tokens调用量突破1万亿次 [9] - AI时代核心竞争力是想象力而非技能,中国公司需要本土创新而非“拿来主义”,关键人才均为本土培养,真正的技术天才将在两三年内出现 [10]
对培育壮大中国具身智能产业的认识与建议
腾讯研究院· 2025-12-11 09:28
以下文章来源于新经济导刊 ,作者欢迎关注 新经济导刊 . 《新经济导刊》是由国务院发展研究中心主管的面向新经济领域的国家级权威期刊,以洞悉经济变革和 创新趋势为宗旨,聚焦新技术、新产业、新业态、新模式、新场景、新管理以及创新创业、转型升级 等,是科学引文数据库SCD来源刊和CNKI中国知网上网期刊。 本文刊发于《新经济导刊》2025年第10期 党的二十届四中全会审议通过的《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》强 调要前瞻布局未来产业,推动量子科技、生物制造、氢能和核聚变能、脑机接口、具身智能、第六代移 动通信等成为新的经济增长点。这些产业由前沿技术驱动、发展潜力巨大,对中长期经济社会发展具有 全局性影响,对我国在新一轮科技革命与产业变革、大国博弈与世界格局重塑进程中赢得主动权具有关 键战略意义。 其中,具身智能是未来产业的重要组成部分,将对经济社会多个领域产生变革性影响,产业前景十分广 阔。当前中国具身智能产业发展处于起步期,在具身智能大模型研发和产品制造方面具有较好基础,市 场规模有望在2030年达到4000亿元、在2035年突破万亿元。"十五五"时期,建议优先聚焦共性难题开展 关键技 ...
腾讯研究院AI速递 20251211
腾讯研究院· 2025-12-10 16:01
生成式AI 2. 开发者实测显示OpenAI生图质量尤其在人物面部生成效果上不如谷歌Nano Banana Pro,推测可能仍基于GPT- 4o训练但相较上一代有所提升; 3. 谷歌Nano Banana Flash新模型也将本周登场,同时Gemini 3 Flash即将发布,OpenAI与谷歌正面争锋AI"大 戏"即将上演。 https://mp.weixin.qq.com/s/VsFTC-85bLSvma7icsbb_w 二、Mistral再开源!发布代码模型Devstral 2及自家原生CLI 1. Mistral AI发布下一代代码模型系列Devstral 2(123B)和Devstral Small 2(24B),在SWE-bench Verified 上分别达到72.2%和68.0%,成本效率比Claude Sonnet高出7倍; 2. 同步发布原生CLI工具Mistral Vibe,提供项目感知上下文、智能引用和多文件编排功能,已作为Zed扩展程序提 供; 3. 采用修改版MIT许可证增加收入限制条款,月收入超2000万美元的公司无权免费使用,需联系Mistral AI购买商业 授权。 http ...
人应成为AI发展的尺度
腾讯研究院· 2025-12-10 08:33
文章核心观点 - 人工智能是时代发展的最新“筛选器”,而非简单的“替代者”,它将人类竞争力的衡量标准从“掌握知识”提升到“驾驭智能” [4][5][6] - 在人工智能时代,人类区别于机器的核心价值在于其本质特质,如判断力、韧性、直觉与觉知力,这些特质将变得愈发珍贵并成为新的竞争力核心 [4][7][8][9][10] - 人类应超越技术决定论的被动视角,通过主动选择和系统性的社会变革来强化不可替代的特质,从而驾驭技术,共同绘制未来图景 [12][13][14] AI作为时代筛选器 - 社会对“精英”或“有用之才”的定义始终与技术工具共同演进,从识字算数到掌握专业知识,人工智能是当前最新、最强大的标尺 [6][24] - 人工智能将价值衡量标准从“掌握知识”提升为“驾驭智能”,能够熟练运用AI工具协同共创的人将获得巨大赋能 [6][24] - 人的价值体现形式发生转移,当知识如电力般成为基础设施后,区分个体的关键不再是“你知道什么”,而是“你能用已知的知识做什么”、“如何面对未知”及“在困境中如何自处与突破” [6][17] 竞争力回归人的本质 - **判断力与主动性**:在信息过剩的时代,甄别真伪、权衡利弊并做出决策的人类判断力至关重要,这需要与基于判断主动探索和发起行动的主动性相结合 [8][17] - **生命的韧性**:人类在试错与挫折中学习和成长的韧性,是应对未来复杂多变挑战、保持内核稳定的战略必需,这与遇到未知错误可能停止运行的机器逻辑形成对比 [8][18] - **直觉与灵感**:无法被编程的直觉、悟性与灵感是人类创造力最原初的源泉,能推动根本性创新,例如鲁班发明锯子、王羲之创作兰亭序等历史典故 [9][18] - **自我觉知与洞察需求**:自我觉知是保持判断力、韧性和创造力的根基,有助于在变化中主动塑造生命;而洞察人心底层未被言说的真实需求的能力,则彰显了无法被算法完全解码的公共价值与领导力 [10][19] 超越技术决定论 - **个人层面**:需要主动脱离信息茧房、广泛阅读并思考“为什么”;走出舒适区接受挑战,将挫折视为反馈;为直觉留出空间进行“无用”探索;沉浸于真实人际互动与社会实践 [12][20] - **社会与教育层面**:教育范式需从知识灌输转向能力培养,重视项目式学习、艺术与体育;组织文化应奖励创新并容忍有价值的失败;社会需提供心理健康支持与职业再培训体系以保障转型 [13][21] - 人工智能的终极意义在于促使人类回归内在,专注于情感、创造、关怀与探索等生命中最珍贵的事物,人类应作为掌握新航技的航海者,与机器协同共同绘制未来 [13][14][21]