腾讯研究院

搜索文档
腾讯研究院AI速递 20250923
腾讯研究院· 2025-09-22 16:01
联发科天玑9500芯片发布 - 采用第三代3nm工艺和全大核架构 集成超300亿晶体管 NPU性能比上代提升111% 功耗降低56% [1] - 采用超性能+超能效双NPU架构 首次引入存算一体设计和BitNet 1.58 bit量化推理框架 支持端侧模型训练 [1] - 支持128K长文本处理 4K画质图像生成 vivo和OPPO等厂商旗舰新机将搭载该芯片 [1] OpenAI计算资源投入与新产品 - 已投入160亿美元租用计算资源 计划在2024-2030年间投入3500亿美元租赁服务器 2030年单年预计花费1000亿美元 [2] - 与甲骨文签署5年3000亿美元算力合同 额外追加1000亿美元用于备用服务器 [2] - 预告未来几周推出计算密集型新产品 Pro用户需额外付费 [2] 谷歌开源Deep Research新范式 - 突破传统Agent"规划-检索-生成"模式 提出新的研究框架 采用"扩散式降噪"过程 [3] - 让Agent基于草稿发现信息缺口 从外部搜寻证据 反复优化研究内容 [3] - 引入多版本智能自我批判和报告级降噪技术 在GAIA等任务上全面优于OpenAI DeepResearch [3] DeepSeek发布V3.1终极版本 - 发布DeepSeek-V3.1的终极(Terminus)版本 针对用户反馈进行改进 [4] - 缓解中英文混杂 偶发异常字符等语言一致性问题 优化Code Agent与Search Agent表现 [5] - 在官方App 网页端 小程序与DeepSeek API模型同步上线 开源版本可在Hugging Face和ModelScope平台下载 [5] 可灵AI 2.5视频模型突破 - 在运动能力和表情表演方面实现重大突破 准确表现人物微表情变化与复杂情绪 维持角色一致性 [6] - 完美衔接下落 奔跑 骑摩托等连续动作 保持环境交互真实感细节 理解复杂因果关系 [6] - 在动作戏上表现极佳 生成高质量跑酷 跨越 战斗和爆炸场景 已对超级创作者灰度内测 [6] 美团高效推理模型发布 - 发布高效推理模型LongCat-Flash-Thinking 在逻辑 数学 代码和智能体等多领域达到全球开源模型最先进水平 [7] - 首创领域并行强化学习训练方法 采用异步弹性共卡系统实现三倍提速 设计双路径推理框架提升智能体能力 [7] - 在推理基准测试上全面领先开源模型 在AIME和LiveCodeBench等测试中与GPT-5等顶级闭源模型表现相当 [7] 百度开源视觉理解模型 - 发布视觉理解模型Qianfan-VL并全面开源 提供3B 8B和70B三种规格 支持OCR识别和教育垂类等场景 [8] - 基于开源模型开发 在自研昆仑芯P800上完成全流程计算 支持单任务5000卡规模并行计算 [8] - 具备思维链能力 OCR全场景识别和复杂版面文档理解能力 在多项基准测试中表现优异 [8] 亚太区科技创新人才评选 - 公布2025年度"35岁以下科技创新35人"亚太区入选名单 35位创新者来自AI 机器人 材料等领域 [10] - 夏斐 閔世媛等多位入选者在人工智能领域取得突破 包括具身智能 非参数大语言模型等方向 [10] - 中国入选者最多 截至2024年共完成11届评选 中国共82人入选 领先新加坡76人 [10] 图像生成模型发展趋势 - 图像模型未来会从创意工具转变为信息查询工具 最大挑战是把LLM的"世界知识"融入图像模型 [11] - 现有图像模型质量"上限"已接近顶点 但"下限"仍有巨大提升空间 未来将专注于提高"模型可表达性" [11] - 未来交互界面将整合文本 图像 语音等多种模态 AI模型与传统工具将长期共存 [11]
邱泽奇:所谓“智能鸿沟”,可能源于我们的自大
腾讯研究院· 2025-09-22 08:48
AI对人类认知的影响 - AI使用是否降智并非非黑即白问题 这种提问方式类似工业时代的低效质疑[3] - 人类思维具有跳跃性和相变性 目前脑科学尚未合理解释这些现象[3][8] - AI学习基于人类知识库 类似阅读图书但缺乏视觉感知和情感识别能力[3][7] - 人工智能存在讨好使用者的缺陷 需通过多角度挑战促使其迭代优化[3][15] - 私域AI陪伴市场潜力巨大 包括AI社交陪伴应用/玩具/宠物等方向[4][14] AI的知识局限性 - 大模型无法获取未授权学术资源 例如2016-2018年全球1万种科学期刊发表的超过30万篇论文[7] - AI主要减少高级知识分子与大众的知识差异 但远未覆盖人类知识整体[7] - 机器学习依赖海量语料 但人类难以判断其背景价值观的潜在问题[3][12] - 符号主义路径代表Alpha Zero在限定场景有效 但泛化能力仍不足[9] 人机交互模式 - 主动质疑AI输出可促进思维锻炼 形成人机互生的良性循环[10][11] - 需区分AI的事实性归纳与价值观输出 对后者需保持持续警惕[12] - 不同AI模型存在显著差异 建议通过多品牌比较选择性使用[3][15] - 交互过程类似阅读百科全书 但需结合东方伦理认知与西方事物认知的双重传统[7] 教育体系变革 - 基础能力培养更为关键 包括语言能力/逻辑能力/认知能力[13][14] - 教育重点应从知识传授转向认知提升 大学课堂应减少知识性内容[14] - 鼓励学生使用AI探讨知识性与探索性问题 教师角色转向引导讨论[14] - IQ测量模式可能过时 EQ对成功贡献更大 智能评估需摆脱固定模式[11] 智能平权与多样性 - AI既带来知识平权 也可能扩大使用群体间的能力差距[16] - 数字鸿沟本质是高位视角的观察偏差 应尊重个体生活方式的多样性[5][16] - 人类生命约3万天 幸福感获取方式存在显著个体差异[5][16] - 需允许不同智能应用层次共存 避免单一标准衡量智能价值[16]
腾讯研究院AI速递 20250922
腾讯研究院· 2025-09-21 16:01
浏览器与生产力工具AI升级 - Chrome进行2008年以来最大更新 集成Gemini AI助手到浏览器右上角 支持跨标签页对话和内容总结 [1] - 地址栏升级为"Omnibox全能框" 可智能推荐问题并直接开启AI模式进行复杂查询 [1] - 利用Gemini Nano增强安全保护 识别有害网站 自动管理垃圾通知 一键修复泄露密码 已向美国用户开放 [1] - Notion发布3.0版本 引入Agent功能 可自主执行所有Notion操作 为时隔7年重大更新 [2] - Agent能自主工作长达20分钟 跨工具完成复杂任务 如整合客户反馈 更新知识库 生成入职计划 [2] - 新版本引入个性化"记忆库" 即将推出"自定义Agent"支持自动运行和团队共享 创建专属AI团队成员 [2] 3D设计与视频生成技术突破 - 腾讯发布混元3D Studio 整合3D资产生产全流程 将生产周期从天级缩短到分钟级 [3] - 工作台提供概念设计 几何建模 组件拆分 低模拓扑 贴图 绑骨蒙皮 动画等全方位3D创作管线 [3] - 平台搭载混元3D 3.0模型 具备分割生成 UV展开 材质编辑等创新功能 已集成于混元3D AI创作引擎 [3] - 阿里云开源通义万相动作生成模型Wan2.2-Animate 支持驱动人物 动漫形象和动物照片 [4] - 模型提供角色模仿和角色扮演两种模式 人物一致性和生成质量大幅提升 [4] - 通过骨骼信号 隐式特征和光照融合LoRA技术 在主观评测中超越Runway Act-two等闭源模型 [4] - Luma AI发布Ray3全球首个推理视频模型 将AI视频从实验性生成推进到专业可用 [5] - Draft Mode仅用20秒生成预览 成本为最终渲染1/5 支持精细控制 允许涂鸦引导演员动作和镜头运动 [6] - 模型支持保真运动 物理模拟 复杂人群 光照交互和写实细节 原生支持10 12 16-bit HDR视频输出 [6] 音频与语音技术进展 - ElevenLabs推出Studio 3.0 将旁白 音乐 音效 字幕和视频编辑整合到一条时间线 [7] - 支持从10,000+AI声音中选择 自动生成专属配乐 文本提示生成音效 语音校正和隔离 一键多语言字幕 [7] - 工具适用于视频创作者 播客主 有声书作者和AI电影人 所有功能可通过API调用 [7] - 小米开源首个原生端到端语音模型Xiaomi-MiMo-Audio 参数规模70亿 预训练数据超1亿小时 [8] - 模型具备自然对话 音频字幕 长时间音频理解等多种能力 首次实现语音领域基于ICL的少样本泛化 [8] - 在MMSU MMAU等基准测试实现SOTA 可用于语音续写 语音编辑和音频理解 [8] 生物科技与AI交叉创新 - Retro Biosciences宣布年底启动实验药RTR242首次人体试验 可激活衰老细胞自噬系统 [9] - 公司使命是清理大脑中堆积变异蛋白和损伤分子 以延长人类10年健康寿命 [9] - 实验室中干细胞标记表达量提升50倍 公司计划募资10亿美元与Altos Labs竞争 [9] - Arc研究所和斯坦福大学团队利用Evo模型构建全球首个AI生成功能性噬菌体基因组 [10] - 所有功能性基因组携带67-392个新突变 部分基因组整合远缘噬菌体蛋白质并保持功能 [11] - 实验验证AI设计基因组能感染特定宿主菌株 展示AI协调复杂突变能力 [11] 开发工具与代码生成应用 - OpenAI公开Codex7种核心应用场景 包括代码理解 重构迁移 性能优化 提升测试覆盖率等 [12] - 技术团队用Codex快速理解陌生代码 批量修改多文件 优化性能瓶颈 生成单元测试 [12] - 公开6条最佳实践 包括用提问模式分析 迭代改进开发环境 构建详细提示等 [12]
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-09-20 02:33
芯片与硬件 - 华为发布昇腾AI芯片计划[3] - Meta推出三款AI眼镜产品[4] - 魅族发布AI眼镜StarV Snap[3] - 宇树科技发布UnifoLM-WMA-0模型[3] 模型与技术进展 - OpenAI推出GPT-5-Codex模型[3] - xAI发布Grok 4 Fast模型[3] - DeepSeek-R1模型登上Nature封面[4] - 腾讯混元发布AI绘画微调功能[3] - 阿里推出通义DeepResearch[4] - 哔哩哔哩推出IndexTTS2音频技术[4] - UCLA开发光学生成图像技术[4] - Math公司推出AI高斯科技[4] 应用与产品创新 - Utopai推出AI原生影视应用[3] - MiniMax发布Music 1.5应用[3] - 腾讯发布混元3D 3.0应用[3] - 美团推出「懒人点餐」AI应用[3] - 小红书推出FireRedTTS-2应用[3] - Meta AI推出MobileLLM-R1应用[3] - Gemini应用登顶App Store[3] - 可灵发布新版数字人[3] - 阿尔巴尼亚任命AI部长[3] - 昆仑万维推出Agent Studio平台[3] - World Labs发布新成果Marble[3] - OpenAI推出企业应用市场[4] - Anthropic参与企业应用市场[4] - 腾讯推出智能体开发平台3.0[4] - ima支持音频文件处理[4] - YouTube推出AI创作工具[4] - OpenAI在编程竞赛中登顶[4] - 天工超级智能体推出AI Developer[4] - 德国癌症研究中心开发疾病预测AI[4] - Shopify推出生产级Agent[4] - DeepMind提出虚拟代理经济[5] 资本与行业动态 - Figure获得具身智能领域最高估值[4] - OpenAI与微软签署合作备忘录[4] - xAI裁减标注团队[4] - MiniMax面临侵权诉讼[4] 行业观点与趋势 - 红杉美国提出AI产业新格局观点[4] - DeepMind提出「科学API」概念[4] - Fastly提出「AI保姆」观点[4] - Anthropic发布AI经济指数[4] - OpenAI发布ChatGPT使用报告[4] - 腾讯汤道生提出智能化全球化观点[4] - 华为提出智能世界2035愿景[4]
探元计划及其共创项目入选世界互联网大会案例集——以数字技术赋能文化遗产高质量传承
腾讯研究院· 2025-09-19 07:48
世界互联网大会文化遗产数字化案例集发布 - 2025世界互联网大会文化遗产数字化论坛发布《世界互联网大会文化遗产数字化案例集(2025)》,从全球数百个申报项目中遴选出40项代表性案例[1] - "探元计划2024"成功入选案例集,其三个创新资助项目同步入选,包括龙门石窟微痕浅浮雕三维建模、长城遗产价值挖掘方案及云冈石窟缪子成像技术项目[1] 探元计划2024项目概况 - 项目由国家文物局科技教育司指导,中国文物信息咨询中心、腾讯SSV数字文化实验室、腾讯研究院及社会价值投资联盟联合发起[7] - 聚焦文博场景"防、保、研、管、用"共性需求,通过高精度三维扫描、人工智能大模型等技术实现壁画修复、丝织品复原等关键技术突破[7] - 构建跨域共享的文化数字化融合共创空间,探索"技术普惠+双价值导向"创新路径[7] 龙门石窟微痕浅浮雕数字化项目 - 龙门石窟研究院联合武汉大学在腾讯探元计划资助下,针对微痕特征提取难题开展技术研发[8] - 项目实现采集设备成本大幅降低及采集工作效率大幅提升,提升石窟寺保护利用水平[8] 长城遗产数字化保护方案 - 天津大学通过无人机低空航测获取超200万张高清图像及厘米级三维数据,解决山脊沙漠等区域采集难题[10] - 依托WebGIS搭建长城全线实景三维数据库,结合目标检测技术自动提取遗产空间特征,形成大尺度线性文化遗产数字化保护框架[10] 云冈石窟缪子成像技术应用 - 腾讯探元计划与云冈研究院、兰州大学共建项目,利用宇宙射线缪子强穿透性实现非侵入式三维密度成像[12] - 技术规避传统钻探对文物的破坏性,为大型文物内部结构探测提供新范式[12] 探元计划系统性创新路径 - 创新"场景方+技术方+平台方"共建模式,打破领域壁垒形成可持续跨界协作生态[14] - 攻克AI虚拟修复与高精度采集等核心技术,形成可复用标准化数字保护解决方案[15] - 项目成果惠及文化传播与公共教育,通过多终端提升可视化与国际传播力,带动数字文化科技企业发展[16]
硅谷大厂裁员背后的组织变革丨硅谷AI转型录NO.1
腾讯研究院· 2025-09-19 07:48
《硅谷AI 转型录》 是由腾讯研究院发起的一个全新的观察系列。AI已经开始在底层重构我们工作的方方 面面,这一次"AI革命",不仅仅是简单的生产工具升级,而是一场关于生产关系、协作方式和价值创造 的深刻变革。 腾讯研究院的袁晓辉和余一,将携手硅谷顾问陈然以及更多行业先驱,深入硅谷的创新变革一线,聚焦 于 两个核心 :一是AI如何作为一种基础能力,渗透并重构我们的工作、创造和竞争。二是不同的群 体,特别是硅谷的先锋企业和个人,如何开创人机协作的新范式,如何适应甚至引领这场变革。不只关 心正在发生什么,更关心它为何发生,以及它将走向何方。 【金句亮点】 本期嘉宾简介: 裁员和重构是硅谷这两年非常火热的话题,当我们看到这些公司核心的计划的时候,你会发现这 并不是一个短期的情况,而是一个长期的系统性的、正在发生的一个剧烈的一个变化。 大重构的时代已经来了,这个不是一个提高10%、20%的时代,而是一个你需要围绕AI进行大量 的重构、重建、重新思考的时代。 AI让一个企业更回归到一个更本质的东西,就是制造和销售,有大量的其他功能或者组织都在被 外包化和工具化,企业回归到更本质的去花更多时间制造产品和销售产品。 人最重要 ...
腾讯研究院AI速递 20250919
腾讯研究院· 2025-09-18 16:01
华为昇腾AI芯片路线图及产品发布 - 华为发布昇腾AI芯片4年5款产品路线图,包括2026年Q1推出的昇腾950PR、2026年Q4的昇腾950DT、2027年Q4的昇腾960和2028年Q4的昇腾970 [1] - 新芯片系列支持低精度数据格式,昇腾950PR在FP8/MXFP8/HiF8精度下算力达1PFLOPS,MXFP4下达2PFLOPS,采用自研HiBL 1.0内存 [1] - 华为推出全球最强算力超节点和集群,包括Atlas 950 SuperPoD支持8192张卡无收敛全互联,Atlas 960 SuperCluster算力规模可达百万卡 [1] OpenAI与谷歌Gemini在编程竞赛表现 - OpenAI在ICPC 2025编程竞赛中5小时内解决全部12个问题,成绩相当于人类排名第1位,使用GPT-5和一款实验性推理模型共同完成 [2] - 谷歌Gemini 2.5 Deep Think解决10个问题,总用时677分钟,达到金牌级表现,若与大学队伍对比排名第2 [2] - 两家公司模型均未针对ICPC进行专门训练,Gemini在半小时内解决了竞赛中无任何大学队伍解出的C题,展示出AI在复杂推理和编程问题上的突破性进展 [2] Meta智能眼镜产品发布 - Meta发布三款新智能眼镜,其中Meta Ray-Ban Display是首款带有彩色光波导HUD显示屏和Meta Neural Band肌电神经接口的AI眼镜,售价799美元 [2] - Ray-Ban Meta (Gen 2)作为小改款主力机型,电池续航翻倍,支持3K分辨率录制,新增Conversation Focus功能增强人声频率,售价379美元 [2] - Oakley Meta Vanguard针对运动人群,采用运动防风镜外形,中央广角摄机,9小时续航,支持与Strava和佳明设备整合,售价499美元 [2] DeepSeek-R1论文登上Nature封面 - DeepSeek-R1论文以封面文章登上Nature,证明大语言模型的推理能力可以通过纯强化学习提升,无需人工标注的推理过程 [3] - 研究团队提出"群体相对策略优化"(GRPO)算法,帮助模型演化出更多样化、复杂的推理行为,在21个主流基准测试上表现优异 [3] - Nature社论将DeepSeek-R1评为"第一个在经过同行评审后发表的主流LLM",认为这是朝着AI透明化迈出的可喜一步,有助于遏制AI行业的过度炒作 [3] 阿里开源深度研究Agent模型 - 阿里开源首个深度研究Agent模型:通义DeepResearch,拥有3B激活参数,性能对标基于OpenAI o3、DeepSeek V3.1和Claude-4-Sonnet等旗舰模型的ReAct Agent [4][5] - 该模型在HLE、BrowseComp、BrowseComp-ZH、GAIA等七大Agent评测集中表现优异,模型、框架和方案已在Github、Hugging Face和魔搭社区全面开源 [4][5] - 研究团队构建了合成数据驱动的完整训练链路,以Qwen3-30B-A3B模型为基础,设计了ReAct和基于自研IterResearch的Heavy两种推理模式,解决了"认知空间窒息"与"不可逆噪声污染"问题 [5] 天工超级智能体上线Vibe Coding Agent - 天工超级智能体(Skywork Super Agents)正式上线Vibe Coding Agent—AI Developer,帮助非专业开发人员通过自然语言交互快速构建、部署和管理全栈Web应用程序 [6] - AI Developer不仅能生成前端页面,还可与Supabase深度集成,实现数据库、用户鉴权、文件存储、实时更新和调用外部服务等后端功能 [6] - 该功能还提供Stripe支付和Resend邮箱服务集成,支持用户打造包含付款和邮件通知功能的应用,大大降低了全栈开发的门槛 [6] AI疾病预测工具Delphi-2M - 来自德国癌症研究中心等机构的研究团队开发出新型AI工具Delphi-2M,可预测个人罹患1000多种疾病的风险,有些疾病甚至可提前数十年预测 [7] - Delphi-2M基于改进的GPT架构构建,利用40万英国生物银行参与者数据训练,能够为个体提供长达20年的潜在疾病风险估计 [7] - 模型在大规模外部验证中表现稳定(AUC值0.67),有望增强个性化健康风险认知,为精准医疗提供依据,但研究团队强调该模型更适合作为现有诊断流程的补充工具而非替代方案 [7] AI虚拟代理经济研究 - Google DeepMind发布论文《虚拟代理经济》,认为自主AI代理正形成新经济层,以超越人类理解的速度和规模进行交易与协作 [8] - 默认发展路径会导致"高频协商"主宰经济,富人的AI代理在每次经济互动中都占优势,最终形成算法固化的数字鸿沟和阶级结构 [8] - 研究者提出构建"公平经济"的方案,包括平均分配"数字货币"和建立以"信任"为核心的数字基础设施,强调重构社会运行机制,使AI经济服务于人类长远福祉 [8]
腾讯研究院AI速递 20250918
腾讯研究院· 2025-09-17 16:01
空间智能与3D生成技术 - 李飞飞公司World Labs发布空间智能模型Marble 仅用单张图片或文本提示即可生成持久存在的大规模3D世界 [1] - Marble相比前代产品支持浏览器自由视角导航 生成世界规模更大、风格更多样化且几何结构更干净 [1] - 用户可将生成内容导出为高斯点云并集成至Three.js 实现在桌面、移动设备和VR头显的高效运行 目前已开放白名单测试 [1] AI支付协议与金融科技 - 谷歌联合美国运通、PayPal、Mastercard等60多家机构推出代理支付协议AP2 旨在构建AI代理支付安全标准框架 [2] - AP2通过加密签名数字合同作为用户指令证明 允许预授权AI代理在特定条件下自动完成购买 支持实时交易与无人工委托任务 [2] - 加密版本A2A x402支持稳定币支付 目前协议已开放GitHub仓库供开发者探索 [2] 企业级AI应用开发 - Anthropic计划投资10亿美元创建企业应用克隆体 OpenAI预计2030年前在数据相关成本支出80亿美元 [3] - 两家公司使用强化学习环境模拟企业软件(如Salesforce、Zendesk、Cerner)训练AI模型操作专业系统 [3] - 通过聘请领域专家示范任务执行 训练AI成为虚拟同事以开辟新盈利渠道 [3] 智能体平台升级与开源 - 腾讯云智能体开发平台ADP3.0全面升级RAG、Multi-Agent及WorkFlow工具链 近3个月完成近600个功能上线 [4] - 平台完善知识库管理运维 支持多方式配置Agent协同 提供工作流全局Agent视野和即时指令技术 [4] - 优图实验室将开源Youtu-Agent智能体框架和Youtu-GraphRAG知识图谱框架 已推出智能质检等行业Agent解决方案 [4] AI版权争议与法律风险 - 迪士尼、华纳兄弟和环球影业联合起诉MiniMax 指控其海螺AI产品未经授权使用蜘蛛侠等IP进行AI训练 [5] - 三大公司要求返还侵权所得并索赔每项侵权最高15万美元 请求法院颁布永久禁令切断MiniMax使用相关IP的可能性 [5] - MiniMax此前在国内面临爱奇艺关于《苍兰诀》的类似指控 揭示AIGC在IP模仿领域的重大法律风险 [6] 音频处理与效率工具 - ima更新支持上传MP3、M4A、WAV、AAC格式音频文件 AI自动生成原文、速览和纪要 方便处理培训录音等内容 [7] - 新增电脑端快捷键截图功能 支持截图后直接提问、加入知识库或记笔记 [7] - 手机端笔记支持离线编辑与新建 无网络状态下可记录灵感 联网后自动同步 [7] 视频创作AI工具 - YouTube为Shorts创作者推出生成式AI工具 引入谷歌文本转视频模型Veo 3定制版"Veo 3 Fast" [8] - 新版以480p分辨率低延迟生成内容并同步添加声音 支持将动态效果应用到静态图片 [8] - 同步推出基于谷歌Lyria 2的语音转歌曲混音工具和AI编辑功能 可自动整理精彩片段并添加音乐与转场效果 [8] 具身智能与机器人融资 - 人形机器人公司Figure完成C轮融资 获超10亿美元承诺资本 投后估值达390亿美元创具身智能赛道纪录 [9] - 融资由Parkway Venture Capital领投 英伟达、英特尔资本等参与 资金用于扩大BotQ工厂生产规模及GPU基础设施搭建 [9] - Figure推出Helix端到端视觉-语言-动作模型 其机器人已实现叠衣服、分拣快递等复杂任务 [9] 未来技术趋势预测 - 华为发布《智能世界2035》报告 预测AGI将成为最具变革性驱动力量 AI智能体从执行工具演进为决策伙伴 [10] - 十大趋势包括人机协同编程成为主流、交互方式向多模态演进 2035年全社会算力总量将增长10万倍 [10] - AI存储容量需求较2025年增长500倍 可再生能源发电占比突破50% [10] AI系统架构实践 - Shopify分享AI助手Sidekick架构经验 建议保持架构简单、工具边界清晰并采用模块化设计如即时指令 [12] - 提出用反映真实生产环境的基准真相集替代黄金数据集 将大语言模型裁判与人类评估结果对齐 [12] - 警告奖励作弊问题(如退出式作弊、标签式作弊) 建议构建多层检测机制并结合程序化验证与语义评估 [12]
产业数字化就业调研报告:全国产业数字化就业总量约6千万,集中于小微市场主体
腾讯研究院· 2025-09-17 09:44
产业数字化就业总量 - 2024年底全国产业数字化就业总量为6195.1万 占全国就业人员的8.4%[2] - 2025年二季度末产业数字化就业总量降至6000.9万 较一季度减少53.7万 环比下降0.9%[22] - 企业数字化就业岗位数为2083.1万 环比上升10.7% 个体户数字化就业岗位数为3917.7万 环比下降6.1%[22] 行业分布特征 - 批发零售业是数字化就业体量最大的行业 2025年二季度达2513.8万 占产业数字化岗位总量的41.1%[2][23] - 文化娱乐业是数字就业渗透率最高的行业 2025年二季度渗透率达29.8%[2][24] - 生产制造业数字化就业渗透率仅为4.6% 低于行业平均水平[2][24] 市场主体结构 - 个体户是产业数字化就业创造主力 连续四个季度占比超六成[2][31] - 企业创造的数字化就业主要集中在东部沿海省份 广东331.1万 江苏235.8万 浙江145.4万[27] - 第五次经济普查显示个体经营户从业人员占比仅29.5% 但产业数字化就业中个体户占比达65%以上[31] 调研方法论 - 调研采用线上问卷方式 覆盖社交媒体/电商/出行/外卖等多平台[6] - 问卷通过企鹅有调平台/微众银行App/微众银行公众号三个渠道投放 有效避免多平台重复计算问题[8] - 估算分三步:样本合并计算/线上化率测算/就业总量推算 基于第五次经济普查数据校准[19][20] 行业动态变化 - 批发零售业数字化就业环比下降9.3% 主因个体户线上化率和户均岗位数双降[26] - 生产制造业数字化就业总量568.5万 环比上升12.3%[23] - 餐饮住宿业数字化岗位数662.1万 环比下降3.1% 地产建筑业448.6万 环比下降2.0%[23] 区域分布特征 - 企业数字化就业超过100万的省份包括广东331.1万/江苏235.8万/浙江145.4万/山东113.8万/辽宁110.0万[27] - 北京99.8万/湖北92.0万/河北90.1万/福建89.0万等省份企业数字化就业超50万[27] - 个体户数字化就业因缺乏省份分布数据未进行区域拆分[33]
腾讯研究院AI速递 20250917
腾讯研究院· 2025-09-16 16:01
生成式AI - OpenAI发布GPT-5-Codex专为智能体编程优化 可自主连续工作超7小时 已在Codex所有使用场景上线并整合ChatGPT账号体系[1] - GPT-5-Codex在SWE-bench Verified和代码重构基准测试中性能超越GPT-5(high) 可根据任务复杂度动态调整思考时间[1] - 模型具备代码审查能力 能主动发现漏洞 上线两小时半流量占Codex总量40% 支持多种工具调用并计划API开放[1] 3D建模技术 - 腾讯发布混元3D 3.0模型 建模精度提升3倍 几何分辨率达1536³ 支持36亿体素超高清建模[2] - 新模型针对人物生成专项优化 实现精细面部重塑 达到真人手办级别效果[2] - 同步上线腾讯云API和专业级混元3D Studio工作台 覆盖3D管线七大核心环节 成为全球下载量超260万的最受欢迎开源3D模型之一[2] AI音乐创作 - 昆仑万维旗下AI音乐创作平台Mureka上线"Agent Studio"功能 用户只需说出想法 Agent自动生成歌词和匹配音乐风格[3] - 已上线六个Agent场景:创作专辑、塔罗音愈、热点写歌、Diss制造机、以歌致礼和撩人情歌[3] - 支持基于热门话题创作 结合网络实时搜索生成个性化音乐[3] 机器人世界模型 - 宇树科技开源机器人世界模型-动作架构UnifoLM-WMA-0 拥有理解机器人和环境相互作用物理规律的世界模型 可适配多种机器人本体[4] - 模型支持决策模式和仿真模式两种核心功能 在真机测试中预测与实际操作高度吻合[4] - 使用Open-X数据集微调视频生成能力 基于5个开源数据集完成全流程训练 GitHub发布后获100+星标 推理代码和模型检查点均已开源[4] AI智能眼镜 - 魅族发布AI拍摄眼镜StarV Snap 首发价1999元 重39g 搭载高通第一代骁龙AR1平台 支持12国语言同声传译、AI识物和语音转写[5][6] - 配备1200万像素镜头 支持109°超广角视野、720P长时间录制、1080P高清拍摄 具备EIS防抖等算法优化[6] - 与支付宝、蚂蚁国际达成战略合作 可直接通过眼镜完成扫码支付 设计有拍摄提示灯和防遮挡检测机制[6] - Meta即将发布AI眼镜 由Meta AI驱动 配备单眼抬头显示器和神经腕带交互系统 预计起售价800美元[7] - 新品以Ray-Ban品牌发布 主要用于Meta AI和步行导航 腕带支持手指滑动字母回复消息[7] - 泄露视频展示与EssilorLuxottica合作的智能眼镜产品线 包括Ray-Ban Meta、Oakley Meta HSTN和Oakley Meta Sphaera眼镜[7] 机器人技术 - 南方科技大学主动智能系统实验室发布宇树G1机器人测试视频 展示机器人在遭受推搡仍能保持平衡 倒地后迅速起身[8] - 视频在B站获25万播放量 在海外平台病毒式传播 众多国外网友误以为是CGI特效[8] - 实验室除抗干扰测试外 还研发声音"画地图"技术Acoustic Mapping和声源可视化系统Acoustic Camera[8] AI应用使用情况 - OpenAI与杜克、哈佛联合发布报告显示 截至2025年7月ChatGPT周活跃用户超7亿(占全球成年人口10%) 每周消息总量达180亿条[9] - 非工作类使用从53%增至70% 实用建议、信息查询、文书写作是三大主要使用场景 占对话80%[9] - 编程使用比例从12%骤降至5% 高学历用户工作相关使用比例更高:研究生48%、本科46%、无本科学历37%[9] - Anthropic报告显示Claude主战场是代码编写(36%) 用户将完整任务交给Claude的比例从27%提升到39%[9] - 企业API用户77%对话呈自动化模式[9] 企业AI战略 - 腾讯提出"向智能化要产业效率 向全球化要收入规模"的企业增长策略 发布腾讯云智能体战略全景图[10] - AI已成为腾讯新业务基因 腾讯元宝成为国内DAU排名前三AI原生应用 IMA知识库文件数量突破1亿[11] - QQ浏览器AI月活比4月增长17.8倍 助力广告、游戏等业务实现双位数增长[11] - 腾讯云国际业务持续高双位数增长 服务全球客户数同比翻番 90%以上中国互联网企业和95%以上头部游戏公司出海选择腾讯云[11] - 三年给伙伴带来商机规模同比增长330%[11]