腾讯研究院

搜索文档
腾讯研究院AI速递 20250828
腾讯研究院· 2025-08-27 16:01
英伟达NVFP4技术突破 - 推出NVFP4新格式 以4-bit精度实现16-bit训练精度 在Blackwell Ultra上性能较Hopper架构提升7倍 [1] - 采用微块缩放 E4M3高精度块编码 哈达玛变换和随机舍入技术 解决低精度训练中的动态范围 梯度波动性和数值稳定性问题 [1] - 与AWS 谷歌云 OpenAI等机构合作 在万亿级令牌规模下实现稳定收敛 节省大量算力和电力成本 [1] 谷歌Gemini 2.5 Flash图像模型 - 发布gemini-2.5-flash-image-preview模型 拥有SOTA图像生成与编辑能力 出色角色一致性和极快速度 [2] - 支持32k上下文 每张图像生成成本仅0.28元 比OpenAI便宜95% 在Google AI Studio和Gemini API提供预览 [2] - 图像编辑功能卓越 支持换装 换场景 合成照片和多轮编辑 在Artificial Analysis图像编辑类别排名第一 LM Arena多项指标夺冠 [2] Anthropic浏览器扩展发布 - 推出Claude for Chrome浏览器扩展 可帮助用户设日历 回邮件 找房等任务 在侧边窗口保留浏览器活动上下文 [3] - 目前仅向1000名Max套餐用户开放测试 主要考虑安全因素 防范提示注入攻击 设置限制访问特定网站功能 [3] - AI浏览器成为巨头争夺新战场 Perplexity推出Comet 微软Edge集成Copilot 谷歌Chrome集成Gemini OpenAI将发布AI浏览器 [3] PixVerse视频生成技术升级 - V5视频生成模型大幅提升速度 5秒生成360p短片 1分钟完成1080p高清视频 降低AI视频创作时间和成本 [4] - 优化动态 清晰度 一致性和指令理解能力 增强人物场景一致性 提供更接近真实拍摄效果 [4] - 新增续写和Agent智能体功能 视频可丝滑延长至30秒 提供多种创意模板 降低普通用户视频创作门槛 [4] DeepMind健康大模型突破 - 发布基于Gemini微调的健康大语言模型PH-LLM 能将可穿戴设备数据转化为个性化健康建议 在睡眠和运动领域表现优异 [5][6] - 在睡眠医学考试中得分79%超过医生76% 在健身认证考试中表现88%远超专家71% 能根据传感器数据预测用户睡眠质量 [6] - 采用两阶段训练 先对完整模型进行睡眠和健康领域微调 再增加多模态适配器预测睡眠障碍 根据个体传感器数据生成高度个性化建议 [6] 腾讯开放原子大赛 - 开放原子大赛腾讯赛题第二期启动 新增AI播客和数据库方向赛题 总奖金40万元 全球招募开发者 [7] - 混元AI播客创新智造挑战赛奖金10万元 基于混元开源模型开发三类AI播客技术 文本转多角色对话 契合风格播客和深度话题播客 [7] - 包括OpenTenBase-TXSQL改写优化挑战赛30万元 决赛11月在腾讯深圳总部举行 优胜方案代码有机会融入开源项目 [7] SpaceX星舰技术进展 - 星舰第十次综合飞行测试成功执行 由第二代星舰S37和B16助推器组成 完成星链卫星模拟器部署等关键任务 [8] - B16助推器测试飞行极限和发动机系统冗余设计 S37飞船完成猛禽发动机太空点火 重入大气层并溅落印度洋 [8] - 关键任务包括测试易受损区域耐受度 不同隔热瓦性能 捕捉连接件热性能和襟翼极限 为载人和火星移民计划铺平道路 [8] AI对美国就业市场影响 - 斯坦福报告显示自2022年末以来AI暴露度越高职业就业增长越慢 22-25岁劳动者在高AI暴露度职业中就业率下降明显 [9] - AI对就业影响体现在替代或增强人类工作能力 用于替代工作时年轻劳动者就业率下降 用于增强时就业率上升 [9] - 高AI暴露职业年轻劳动者有13%相对就业下降率 AI主要替代年轻人掌握的编码知识 较少替代年长者积累的隐性知识 [9] 大模型技术决策与Agent发展 - 大模型技术从预训练/SFT转向预训练/强化学习 从缸中之脑转向Agentic系统 K2模型采用MoE架构和Muon优化器实现更高token效率 [10][11] - Agent泛化性追求通用性而非简单模拟人类行为 可能需要用更多AI训练AI和InnovationL4解决AgentL3问题 [11] - 将OpenAI的L1-L5分级视为非线性技术里程碑 认为AGI是方向而非终点 组织管理需要平衡SFT和RL [11]
胡泳:什么是“信息蜂房型”的互联网产品?
腾讯研究院· 2025-08-27 09:28
信息蜂房概念核心 - 腾讯研究院提出信息蜂房概念以对抗信息茧房 强调用户作为能动的协作性信息生态参与者而非被动封闭的个体 [1] - 信息蜂房隐喻蜜蜂灵活采集花粉 区别于蚕蛹被茧包裹的被动状态 体现多元流动 主动探索和协作共建三大核心要素 [1][2] 信息蜂房四大特征 - 多元信息入口 包括订阅 社交 搜索和专业渠道等多维度获取方式 避免单一算法推荐导致的信息茧房 [4] - 强用户主动性 用户自主探索信息而非被动刷流 形成个性化知识地图并参与评论分享和内容创作 [5][6] - 协作共建机制 用户作为信息创造者 传播者和评价者共同塑造生态 通过共享机制和对话降低个体隔离风险 [7][8][9] - 生态互联 不同信息节点间通过开放接口 跨平台搜索和内容标准化实现自由流动 避免算法驱动的单一栽培 [10][11][12] 支持生态互联的具体措施 - 技术手段包括开放接口与数据互通 跨平台搜索聚合工具 内容标准化 跨节点推荐和多入口导航 [11][12] - 制度设计涵盖鼓励多样化创作 开放共享政策 跨群体协作以及版权与协作规范保障 [13] - 用户行为引导注重主动探索与多入口使用 通过导航工具 改进推荐逻辑和多维分类帮助用户发现知识联系 [14] 符合信息蜂房特征的产品案例 - 维基百科 开放式协作编辑 多语言版本和内部链接网络促进多元共生 [17] - Quora类问答平台 用户主动提问与回答形成多角度知识网络 类似社会化知识市场 [17] - 豆瓣 通过小组 同城和评论构建兴趣社群 用户生成内容驱动非严格分类的动态信息流 [18] - Reddit 由多样化subreddit社区组成 用户跨社区流动并通过投票机制决定内容排序 [19] - RSS/播客类产品 用户主动订阅实现去中心化信息获取 支持多感官呈现和连续学习体验 [20] - 开源社区如GitHub 开发者协作贡献代码工具和文档 通过版本控制和问题跟踪实现知识迭代 [21] - 开放获取知识系统如PubMed Central 免费提供全文文献 支持数据挖掘和跨国知识网络构建 [22][23] 信息生态优化方向 - 增强用户能动性 提供搜索订阅等工具支持主动探索和跨领域信息获取 [25] - 推动多元共生 在内容分发中引入多样性激励机制增加跨圈层内容 [25] - 鼓励群体协作 通过社区化和开源共建机制促进信息流动与协同演化 [26] - 构建健康信息生态需兼顾多元化 透明度和公共性 支持知识生成流通和共享 [26]
腾讯研究院AI速递 20250827
腾讯研究院· 2025-08-26 16:01
生成式AI模型技术突破 - 英伟达推出Jet-Nemotron小模型系列(2B/4B参数),采用后神经架构搜索与JetBlock线性注意力模块,在数学、代码、常识等维度性能超越Qwen3、Gemma3等主流开源模型 [1] - 模型在H100 GPU上推理吞吐量最高提升53.6倍,长上下文场景优势显著 [1] - 面壁多模态模型MiniCPM-V 4.5以8B参数量超越Qwen2.5-VL 72B模型,成为首个具备高刷视频理解能力的多模态模型 [2] - 支持最大96倍视觉压缩率,可接收6倍视频帧数量,采用3D-Resampler压缩技术和统一OCR学习 [2] - 微软开源音频模型VibeVoice-1.5B,可连续合成90分钟超长语音,支持4名发言人,实现3200倍音频压缩 [3] - 采用双语音tokenizer架构解决音色与语义不匹配问题,压缩效率是主流Encodec模型的80倍 [3] 模型融合与演化创新 - Sakana AI提出M2N2模型融合进化方法,引入竞争与吸引力机制,打破预定义静态边界 [4] - 通过多样性竞争促使模型专业化,择偶机制根据互补优势配对融合,避免灾难性遗忘问题 [4] - 方法兼容不同目标训练的模型,不需原始训练数据即可保留模型能力 [4] 模型部署与运营问题 - DeepSeek V3.1存在异常插入"极/極/extreme"等token的bug,影响语法树和代理流程 [5] - 问题出现在第三方量化部署和官方全精度模型中,即使保守解码参数设置也无法避免 [6] - 对依赖自动化编码或测试流水线的团队造成重大麻烦 [6] AI商业与生态发展 - Perplexity推出全球首个AI搜索收入分成计划,设立4250万美元基金分配给出版商 [7] - 出版商可获得Comet Plus订阅收入(月费5美元)的80%,基于内容出现频率或查询次数分享收入 [7] - 马斯克旗下公司起诉苹果与OpenAI,指控通过锁定市场维持垄断地位,阻止创新者参与竞争 [8] - 诉讼索赔数十亿美元,案件可能影响AI市场范畴界定和商业合作模式 [8] 机器人硬件与算力升级 - 英伟达发布机器人专用芯片Jetson Thor,采用Blackwell架构GPU,AI算力达2070 FP4 TFLOPS [9] - 算力是上代Jetson Orin的7.5倍,内存容量128G,显存带宽273GB/s,能效提升3.5倍 [9] - 宇树科技、银河通用机器人等中国厂商首发搭载,开发者套件售价3499美元 [9] 人工智能教育与政策 - OpenAI教育负责人表示70%雇主更倾向招聘会使用AI的新人而非有10年经验的老手 [10] - ChatGPT成为全球最大学习平台,Study Mode功能以苏格拉底式方法指导学习 [10] - 国务院发布《人工智能+行动意见》,提出2027年实现AI与6大重点领域深度融合 [12] - 重点覆盖科学技术、产业发展、消费提质等领域,要求加强算力统筹、数据供给等八大基础支撑 [12]
人工智能下一站:新消费硬件
腾讯研究院· 2025-08-26 09:35
文章核心观点 - 全球AI消费硬件产业正沿着AI原生设备探索、渐进强化现有设备、模型赋能第三方硬件三条核心发展路线演进,并形成与之适配的差异化商业模式[2][4][8] - AI硬件交互范式正向"无感化"方向转变,AI眼镜成为关键载体,长期可能取代手机成为主流交互终端[21][22][26] - 行业竞争焦点从单一硬件创新转向模型能力、硬件形态与应用生态的三维融合,软件生态成为决胜关键[27][28] AI消费硬件发展路线 - **路线1:AI原生设备探索派**:以Rabbit R1、Humane AI Pin为代表,完全重构交互范式,采用"意图即操作"理念,弱化App和菜单,依赖大模型驱动语义理解[4][5] 但面临极高不确定性,例如AI Pin已于2025年2月28日停止所有在线功能,Rabbit R1存在低活跃用户率、性能稳定性问题[5] - **路线2:渐进强化派**:以苹果、Meta为代表,在现有终端(手机/眼镜/耳机)系统集成AI能力,例如Apple Intelligence通过本地大模型(M系列芯片支持)实现端侧AI处理[6] 2024年9月美国调研显示Apple Intelligence推动消费者支付意愿提升11%,成为54%潜在换机用户核心决策因素[12] - **路线3:模型赋能派**:以OpenAI、谷歌为代表,通过API/SDK将模型能力注入第三方硬件,例如GPT-4o嵌入Ray-Ban智能眼镜提供实时对话能力[7] 该路径面临模型推理成本高、终端适配技术门槛、平台控制权缺失等挑战,例如谷歌需向三星支付高额授权费并让渡部分订阅收益以换取Gemini AI在Galaxy S25预装[15] AI消费商业模式分析 - **AI原生探索派商业模式**:依靠硬件溢价(如Rabbit R1售价199美元)和订阅服务收费,但陷入硬件价值证明困局[10] 例如日本GROOVE X的LOVOT陪伴机器人售价3935美元配合67美元月费,但全球发售5年销量仅1.4万台,年均出货不足3000台[11] - **渐进强化派商业模式**:以硬件销售为主,通过订阅服务(如健康分析报告、专业翻译)创造持续性收入[12] 例如Oura Ring转向"基础数据免费+深度健康服务订阅"模式后,订阅转化率增长18%[13] - **模型赋能派商业模式**:通过API调用量收费(如Token消耗量或请求次数),并提供企业级订阅和私有部署服务[15] 该模式面临终端厂商自研模型趋势冲击,例如vivo通过自研蓝心大模型减少第三方API依赖[15] 技术实现与产业生态 - **端云结合成为主流技术路径**:端侧处理高频低延迟任务(如相册整理、实时翻译),云端处理复杂计算任务(如长文案创作)[20] 终端设备常用模型参数量多低于70亿(7B),以30亿(3B)和40亿(4B)规模最为普遍,部分采用MoE架构平衡性能与功耗[20] - **产业链上下游加速整合**:模型厂商与芯片巨头深度合作,例如Meta与高通合作优化Llama 3在骁龙芯片的移动端运行效率[18][19] 阿里巴巴推动通义千问大模型与硬件厂商适配构建完整生态系统[19] - **AI眼镜成为关键硬件形态**:2025年多家巨头进入市场,包括Meta Oakley Meta(399-499美元)、小米AI Glasses(1999元)、谷歌Android XR眼镜(未公布价格)、阿里Quark AI Glasses(预计中端价位)[24] 未来发展趋势 - **交互范式向无感化演进**:语音和视觉交互逐步取代触控,语言用户界面(LUI)可能取代图形用户界面(GUI)[26] OpenAI正与前苹果设计师合作开发无屏幕、以对话式AI为核心交互的新型硬件[25] - **AI从功能补充升级为应用入口**:三星Galaxy S25搭载的AI Agent Bixby支持跨越30多个本地应用和10多个第三方应用的一体化操作[27] Google实现Gemini与Search、YouTube、Gmail等产品数据打通,可直接访问用户历史数据并写入应用[28] - **生态协同成为竞争核心**:Meta眼镜成功关键因素是无缝接入Instagram、Facebook社交矩阵,提供即拍即传的闭环体验[28]
研讨回顾|姜还是老的辣,AI公益课还是“一起学”的好
腾讯研究院· 2025-08-26 09:35
项目背景与目标 - 腾讯研究院联合多个团队筹备"腾讯长辈AI公益课"系列 旨在帮助老年人跨越数字鸿沟 提升AI应用能力[3] - 项目从2023年8月开始推进 已完成4节示例课和初步方案设计[4] - 通过线上研讨会邀请老年教育领域专家对课程方案进行点评与优化[5] 老年人AI需求调研 - 针对60-80岁长者群体的调研发现六大核心需求:出行与生活便利 医疗服务 陪伴与社交 健康管理 娱乐创作 安全与防护[7] - 调研样本为100名长者 发现主要学习障碍是"需要反复练习"和"容易遗忘"[10] - 多数长者倾向先掌握基础功能再实践应用[10] 课程体系设计 - 课程分为生活场景类和艺术创作类两大单元 覆盖AI陪伴 出行 医疗 绘画 视频创作等核心板块[10] - 采用"示范→拆解→跟练→拓展"的功能制教学路径[10] - 每课时长控制在15-20分钟 符合老年人注意力集中时长[16] 课程设计原则 - 避免年龄标签化 倡导"无龄感"课程设计[12] - 采用场景化 生活化 剧情化的保姆级教程 对专业术语进行解释[14] - 简化操作界面 重点解决APP下载等初级卡点问题[14] - 减少文字说明干扰 采用语音解说配合路径图展示[16] - 区分基础版与进阶版教学 基础版聚焦核心功能实现[17] 教学模式创新 - 开发普通话与方言双版本课程 依托混元大模型多模态技术能力[21] - 建立线上课程社群 通过推选班委形成学习小组实现互助学习[23] - 运营1119个课程班级群 通过定期例会支持班级管理者[23] - 设置作品展示平台 通过大赛 征稿等形式激发创作热情[25] 社会价值体现 - 项目体现科技企业社会责任 推动AI技术普惠化应用[3][27] - 通过"老带新"模式实现"老有所为"的社会价值[23] - 探索AI时代应对老龄化的创新解决方案[27]
腾讯研究院AI速递 20250826
腾讯研究院· 2025-08-25 16:01
AI行业竞争动态 - 马斯克成立新AI软件公司"巨硬"(Macrohard) 直接针对微软 目标是用AI黑箱完全替代微软核心业务[1] - 新公司可能与xAI的孟菲斯Colossus 2超级计算机项目密切相关 延续了马斯克与比尔·盖茨的个人及商业竞争关系[1] 3D生成技术突破 - 群核科技开源3D场景生成模型SpatialGen 一句话即可生成可交互的3D室内空间设计[2] - 模型支持结构化场景交互 包括空间查询、适老化设计及路径规划等功能[2] - 公司正在开发全球首款深度融合3D能力的AI视频生成Agent 已实现精准一致性和动作稳定的视频生成[2] 智能会议解决方案 - 腾讯会议推出"AI纪要"功能 每2分钟主动推送会议总结 实时捕捉关键信息、结论和待办事项[3] - 功能可识别会议氛围和言语潜台词 支持会议记录一键导入元宝进行深度提问与内容提炼[3] - 钉钉发布首款AI硬件DingTalk A1 集成录音笔、会议机、翻译机和AI助理功能 配备5颗全向麦克风和骨传导技术[5] - A1内置AI听记系统基于1亿小时音频训练 支持30种方言、140种语言识别和200多种行业术语 会议后自动生成任务跟进表格[6] 视频生成技术演进 - Video Ocean成为全球首个接入GPT-5的视频智能体 一句话即可生成分钟级完整视频 涵盖分镜、画面、配音和字幕全流程[4] - 产品通过三大模块无缝衔接 将用户从提示词工程师转变为创意导演 效率提升10倍[4] - 已吸引14个国家115位创作者体验 可生成F1赛车解说、海洋纪录片等多类型视频内容[4] 科研激励与人才发展 - 2025年科学探索奖评选50位青年科学家 信息电子领域6位学者获奖 包括复旦大学姜育刚、清华大学吴嘉敏等[7] - 获奖者中包含13位年轻科学家(男性35岁及以下 女性38岁及以下) 含6位90后 每人5年内获300万元人民币奖金[7] - 评审机制强调原创性 重点关注"为什么能做出前人做不出的工作" 由14位科学家与马化腾共同发起[7] 开发者工具生态 - 前特斯拉AI总监Karpathy分享四层AI编程工具链 75%时间使用Cursor编辑器自动补全代码[8] - 第二层通过大模型修改代码段 第三层使用Claude Code实现功能模块 最难问题交由GPT-5 Pro在10分钟内解决隐蔽bug[8] 数字永生与知识传承 - Delphi公司开发数字思维(digital minds)产品 通过AI构建专家和创作者的个性化思维模型供他人交互学习[9] - 公司认为连接、能量和信任将成为AI时代最稀缺资源 预计2026年用户难以区分与真人或其数字思维的交流[9] - 采用自适应时间性知识图谱技术 已应用于教育学习、CEO思维规模化和个人流量入口等场景[9]
AI影响就业的量化悖论
腾讯研究院· 2025-08-25 08:58
文章核心观点 - 当前关于人工智能对就业影响的量化研究存在显著局限性 包括结果不可比 测算片面性和方法静态性 导致预测准确性存疑[4][5][6] - 量化AI对就业影响面临操作难题 包括无法从多重经济因素中独立切割AI的影响 难以清晰界定AI的技术范围 以及无法预判未来技术发展路径[7][8][9][10] - 数据本身存在三大局限性 受利益驱动可能被主观干预 执行过程中存在抽样和调研失真 以及无法预测人类社会突发变革事件[11][12] 三大不足 - 不同机构测算结果差异巨大且不可比 例如高盛(2023)显示美国67%岗位面临AI自动化风险 而国际劳工组织(2023)显示高收入国家仅5.5%岗位受自动化影响 低收入国家仅0.4%[4][5] - 现有研究多采用"AI职业暴露度"指标 但高暴露度不必然导致岗位消失 未考虑技术经济可行性和时间线 易引发过度恐慌[5] - 研究方法存在静态局限性 仅以现有岗位为研究对象 而历史数据显示2018年60%的工作在1940年并不存在 未来新岗位无法被预判[6] 三道操作难题 - AI对就业的影响无法从经济周期 产业政策 人口结构等多重因素中独立切割 理想化模型在现实中适用性有限[8] - AI缺乏明确定义且很少独立存在 已嵌入导航 翻译 图像识别等日常应用 技术边界动态变化 导致影响范围难以界定[9] - 技术发展路径本身不可预测 历史表明众多技术预言最终失效 缺乏准确技术前景预判则就业影响测算无法成立[10] 三个局限性 - 数据可能受利益驱动被主观干预 例如上市公司财务造假或安全事故瞒报行为[12] - 调研执行过程存在普遍失真 问卷抽样不合理或敷衍应答导致数据偏差 需依赖机构权威性背书[12] - 数据仅能反映历史规律 无法预测突发变革 例如传统出行数据无法推导汽车发明 或春节等黑天鹅事件[12]
腾讯研究院AI速递 20250825
腾讯研究院· 2025-08-24 16:01
开源大模型进展 - xAI开源Grok-2模型权重和架构 采用MoE架构拥有9050亿总参数 推理时激活1360亿参数 支持128k上下文长度 商业使用限于年收入低于100万美元的公司 模型体积超500GB 需8张显存大于40GB的GPU部署[1] - Grok-3将在6个月后开源[1] AI推理优化技术 - Meta AI与加州大学提出DeepConf置信度筛选方法 通过实时监控置信度对推理路径动态筛选和加权投票 使开源模型在AIME 2025达到99.9%准确率 减少85% token消耗 无需外部工具[2] - 提供离线和在线两种工作模式 可直接应用于现有模型无需额外训练 在vLLM中仅需约50行代码集成[2] 企业战略调整 - OpenAI CEO Sam Altman将日常运营移交应用业务CEO Fidji Simo 本人专注筹集万亿级资金和超级计算项目[3] - Simo具有Facebook增长期和Instacart上市经验 将负责ChatGPT等消费级应用商业化 产品线可能扩展至浏览器 最快今年秋季在ChatGPT购物搜索引入联盟链接变现[3] 芯片技术突破 - DeepSeek V3.1使用UE8M0 FP8参数精度 引发寒武纪等国产芯片概念股涨近14%[4] - UE8M0 FP8为微缩块格式 全部8比特分配给指数位无符号位 大幅提高带宽效率和性能 与下一代国产芯片协同优化 让相同硬件运行更大模型 提高国产芯片性价比 多家厂商已联合验证该格式[4] 产业合作动态 - Meta与Midjourney合作获得AI图像和视频生成技术使用许可 将整合到未来AI模型中 开发与OpenAI Sora竞争的产品[5] - Midjourney成立于2022年未接受外部融资 年收入预计2亿美元 今年6月发布首款AI视频模型V1[5] 企业AI应用强制推广 - Coinbase CEO强制要求所有工程师试用GitHub Copilot和Cursor AI工具 对未按要求行动且无合理理由的员工直接开除[6] - 开发者社区对强制推广AI工具存在分歧 部分支持提升效率 部分担忧损害工作品质[6] 生物科技跨界合作 - OpenAI与Retro Biosciences合作开发GPT-4b micro模型 设计全新蛋白质 使细胞重编程技术效率提升50倍[7] - AI设计的RetroSOX和RetroKLF蛋白质命中率分别超30%和50% 不仅加速细胞重编程 还降低DNA损伤水平 为细胞疗法和抗衰老技术开辟新路径[7] 产品开发方法论 - Claude Code采用内部原型测试流程 工程师直接用Claude Code快速做功能原型 内部推广反响热烈后正式发布[8] - 小团队开发者倾向使用自动接受模式开启多个Claude并行处理任务 大企业偏爱先探索代码库制定详细计划[8] - 通过CLAUDE.md文件、自定义斜杠命令和钩子实现高度定制 配套SDK能在30分钟内搭建功能强大的代理原型[8] 平台竞争格局 - AI应用生成平台走向专业化与差异化发展 各平台在细分领域互补共存 形成多元格局[9] - 平台呈现三大类别:Prototyping原型设计、Personal software个人软件和Production apps生产应用 针对不同用户层级[9] - 超七成用户保持单一平台忠诚度 21%高级用户使用多个互补平台 未来各品牌将走向更深层次专业化[9] AI能耗透明度 - 谷歌发布首份AI能耗报告 显示中位Gemini提示词消耗0.24瓦时电力 相当于微波炉运行一秒 碳排放量为0.03克二氧化碳[10] - 能耗构成:AI芯片(TPU)占58% 主机CPU和内存占25% 备用设备占10% 数据中心开销占8%[10] - Gemini能耗一年内下降33倍 每个提示词消耗约0.26毫升水 为科技公司首次发布透明AI能耗评估数据[10]
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-08-23 02:33
模型发布与更新 - 腾讯混元发布3D世界模型Lite版和AutoCodeBench代码模型 [3] - Meta推出DINOv3视觉模型 [3] - Multiverse研发最小AI模型 [3] - 英伟达推出Nemotron Nano 2模型 [3] - OpenAI进行五代GPT模型对比分析 [3] - DeepSeek发布DeepSeek-V3.1模型 [3] - 字节推出Seed-OSS系列模型 [3] - 港大和可灵联合提出Context as Memory模型架构 [3] - 谷歌发布Gemma 3 270M轻量级模型 [3] 应用产品与功能 - 昆仑万维升级Mureka至V7.5版本 [3] - OpenAI推出GPT-5编程提示功能 [3] - Meta发布新AI眼镜产品 [3] - 逗逗AI推出游戏伙伴应用 [3] - 蔡浩宇团队上线AI游戏产品 [3] - 百度发布GenFlow 2.0和蒸汽机2.0应用 [3][4] - 谷歌推出Nano Banana应用 [3] - Higgsfield推出Draw-to-Video视频生成应用 [4] - 智谱升级AutoGLM至2.0版本 [4] - 腾讯发布企业微信5.0并接入腾讯元宝AI能力 [4] - Looki推出L1设备 [4] - 谷歌发布Pixel 10系列硬件 [4] - 腾讯视频集成腾讯元宝AI功能 [4] 机器人技术进展 - 宇树等公司联合举办人形机器人运动会 [4] - 智元机器人实现远征A2长距离行走 [4] - 宇树推出芭蕾人形机器人 [4] - 波士顿动力公布Atlas机器人最新进展 [4] 行业观点与趋势 - DeepMind探讨世界模型发展路径 [4] - OpenAI提出AI CEO概念并强调AI改变世界的潜力 [4] - Sierra AI关注长尾Agent公司发展 [4] - 华为讨论鸿蒙系统生死线问题 [4] - Hinton提出AI母性本能理论 [4] - 英伟达看好小模型未来发展 [4] - Richard Sutton提出OaK架构理论 [4] - OpenAI复盘GPT-5开发过程 [4] - Anthropic发表对大模型的思考 [4] - Manus探索Agent支付场景 [4] - BVP分析AI护城河构建策略 [4] - Lovable讨论AI创业方向 [4] - Index Ventures阐述AI投资逻辑 [4] 企业动态 - Meta重组AI部门 [4] - 阿里巴巴未明确提及具体动态(需跳过无关内容) [4]
重磅报告|智启新章:2025金融业大模型应用报告正式发布(附下载)
腾讯研究院· 2025-08-22 08:04
文章核心观点 - 生成式AI投资回报成为产业界核心议题 大模型技术需跨越技术潜力与商业价值之间的鸿沟 [1] - 金融业是数字化转型先锋 金融机构需解决大模型落地最后一公里问题 [1] - 2025年将成为金融行业深度整合AI 实现大模型技术红利兑现的关键拐点 [1] - AI应用关键是以投入产出比(ROI)为标尺校准应用范式 优化落地路径 而非陷入技术竞赛 [1] - 大模型驱动以ROI为导向的生产力革命已在金融业头部机构中发生 [1][3] 技术发展现状 - 大模型从聚光灯下的明星技术沉淀为驱动社会运行的智能基础设施 [6] - 模型演进方向从探索能力边界转向追求效率革命 算法与架构优化重新定义性能天花板 [11] - 算力需求呈现更重视推理的结构性变化 [11] - 数据训练关注点从追求海量规模转向倚重高价值精准数据 [11] - 应用场景从提效工具升级为协作伙伴 智能体重构人机协作形态 [11] 金融业应用实践 - 领先大行将复杂信贷审批报告分析从数小时甚至数天压缩至3分钟 准确率提升超15% [3] - 头部券商借助AI智能体实现7X24小时监控全球超过5000家上市公司动态 [3] - 海外顶尖投行部署数百个AI程序员 后续或增至数千个 目标将工程师生产力提升三到四倍 [3] - 全球近半数金融机构已启动大模型应用建设 行业从试验阶段迈入规模化部署期 [12] - 银行业是大模型落地应用最广泛领域 证券和保险行业头部机构探索多样化应用模式 [12] 落地挑战与应对 - 面临局部突破与整体效能平衡 创新投入与资源效能平衡 前沿探索与风险防控三大平衡关系考验 [14] - 深度应用面临高价值数据资源碎片化 战略规划和投资回报不清晰 低容错场景技术适配难 组织人才升级滞后等挑战 [15] - 需从战略 数据 组织 技术四个层面系统施策 构建四位一体综合能力框架 [15] - 智能理财助理 财富管理风控 保险代理人 投研报告生成 编程助手等场景已实现商业化突破 [15] 未来发展趋势 - AI驱动金融服务走向普惠化 智能化与个性化 将专家级服务带给更广泛长尾客户群体 [16] - AI与人类专业能力深度融合重新定义金融运营与管理模式 加速推动复合型创新型金融人才需求形成 [16] - 高质量私域数据挖掘与应用将成为金融机构核心竞争力 [16] - AI技术和治理体系成熟将推动监管科技效率与效能提升 [16]