Agent
搜索文档
深度|DeepMind CEO Demis: AGI还需5-10年,还需要1-2个关键性突破
搜狐财经· 2025-12-21 06:05
公司战略与核心优势 - 公司将其独特优势归结为将世界级的研究、工程能力和基础设施三者结合 在AI前沿领域 同时具备这三者的机构非常少 [8] - 公司采用科学方法作为核心思维方式 并将其应用于研究、工程乃至商业领域 这构成了其工作的严谨性与精确性的来源 [7][8] - 公司在发展路径上保持务实 会追随实证证据的指引 例如在看到scaling laws显现效果后 逐步将更多资源投入到该研究路径上 [27][28] 产品与技术路线图 - 公司的核心基础模型Gemini从一开始就是多模态的 能够同时处理图像、视频、文本和音频 并越来越多地生成这些类型的输出 [10] - 接下来12个月的重点方向包括:多模态能力融合取得显著进展、视频能力与语言模型融合产生有趣的能力组合、以及开发更可靠的基于Agent的系统 [10] - 公司的长期愿景是将Gemini打造成“通用助手” 使其出现在更多设备上 并成为用户日常生活结构的一部分 提升工作效率和改善个人生活 [11] - 最新发布的Gemini 3模型在推理深度、细腻度以及“性格”上表现出色 能够简洁直接地回答 并在观点不合理时温和提出异议 [24] - Gemini 3展现出对高层次指令的深度理解能力 以及生成高度细节化输出的能力 在前端开发、网站构建和一次性生成游戏方面表现突出 [25][26] - 公司有一个名为Genie 3的“世界模型”或交互式视频模型 用户可以在生成的视频中“行走” 并在一分钟内保持整体一致性 [10] 行业竞争格局 - 在AI领域 美国和西方整体在基准测试和最先进系统方面仍处于领先地位 但这种领先优势可能仅以“月”为单位 而非“年” [21] - 中国在AI领域并未落后太多 拥有出色的模型和有能力的团队 但在算法创新和原创性方面 西方目前仍然具有优势 [21] - AI行业正经历一场可能是科技史上最激烈的竞争 [8] - AI产业某些部分可能存在泡沫 例如一些规模极其夸张的早期融资 但从长期看 AI被认为是人类历史上最具变革性的技术之一 投入将被证明是值得的 [31] - 行业人才争夺战相当激烈 但最优秀的科学家和工程师希望参与最前沿的工作 持续的技术领先地位将形成吸引力正反馈 [31] 通用人工智能发展预测 - 通用人工智能可能还需要五到十年的时间才能实现 [6][29] - 对AGI的标准设定很高 要求系统能展现出人类所具备的全部认知能力 包括发明和创造能力 并在各个维度上具备一致性 而非当前“锯齿状”的智能形态 [29] - 实现AGI可能不仅需要将现有系统的scaling能力推到极限 还需要一到两个类似Transformer或AlphaGo的范式级关键突破 [29][30] - 当前系统缺乏一些关键能力 如持续学习、在线学习、长期规划和推理能力 这些能力最终会具备 但可能需要关键性突破 [6][29] 技术应用与市场潜力 - AI在网络安全领域的应用受到高度重视 旨在用AI强化防御体系以应对网络威胁 [17] - 在商业和企业领域 随着AI变得重要 企业客户会对Agent的行为保障提出明确要求 这可能会自然地奖励那些更负责任的供应商 [18] - AI在体育领域有巨大应用潜力 因为体育拥有丰富数据并追求极致精英表现 例如AI可以优化角球进攻中球员的精确站位以增加头球进球 [35][36] - 多模态理解能力 尤其是视频理解能力被严重低估 例如Gemini能够对视频内容进行概念层面的理解和哲学解读 [22] - 像Gemini Live这样的功能 允许用户用手机摄像头对准物体获得实时协助 其多模态能力的强大尚未被充分认识 [23] 技术发展现状与挑战 - 目前基于Agent的系统还不够可靠 无法独立完成完整任务 但预计一年后会开始看到接近这一能力水平的Agent出现 [10][12] - 创新和进步的速度非常快 以至于模型的创造者可能都来不及探索现有系统十分之一的潜力 用户常常将模型能力发挥到远超内部测试的程度 [27] - 随着AI系统变得更复杂和更具自主性 存在偏离最初设定指令或目标的空间 如何确保其始终保持在安全边界内是一个活跃的研究领域 [18] - 存在AI被恶意行为者滥用的风险 例如制造病原体或对关键基础设施发动网络攻击 这是必须严密防范的场景 [15][16][17]
日耗50万亿Token,火山引擎的AI消费品战事
36氪· 2025-12-19 10:55
火山引擎AI业务增长与市场地位 - 截至2025年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍[1] - 在MaaS(模型即服务)市场,火山引擎已成为国内市场份额第一,全球排名第三[2] - 公司营收规模快速增长,2024年营收超过110亿元,增速远超60%;2025年营收已超过200亿元[6] 2025年AI市场核心趋势 - 多模态和Agent是2025年AI市场的关键趋势[3] - 视频生成模型的竞争焦点已从参数、时长转向能否直接产出“可发布的完整作品”,声画同步成为重要竞争因素[7][11] - 行业迭代速度极快,模型正从技术工具演变为具备社交平台潜力的创作工具[9][22] 火山引擎Force大会核心产品发布 - 模型侧发布豆包旗舰模型1.8和视频生成模型Seedance 1.5 pro[3] - 围绕Agent生态发布企业推理代工服务、强化学习平台、企业级AI Agent平台AgentKit以及HiAgent“1+N+X”智能体工作站[3] - 豆包大模型1.8采用集成策略,将LLM、VLM、Thinking等能力整合进单一模型接口,简化客户选择与集成流程[26][27] Seedance 1.5 pro视频模型的技术与商业突破 - 核心主打声画同步功能,可实现开箱即用,生成视频的嘴型匹配、情绪捕捉与画面配合度达到高可用水平[8][13] - 在中文适配、电影级运镜、动态张力及环境沉浸感方面表现突出,优于部分海外模型[13][14][15] - 通过多阶段蒸馏、量化等工程优化,模型端到端推理速度提升超过10倍,极大降低了生成成本[17][31] - 模型支持多种方言和强表演场景,适合生成可供二次创作的社交内容,与豆包、即梦等C端产品联动潜力大[21][22] 火山引擎的AI发展战略与系统工程 - 公司定位为AI Native,其基础设施、产品架构及商业模式均围绕AI云原生设计,视AI为弯道超车的关键[34] - 竞争已从模型能力比拼转向系统工程较量,重点解决企业“用不起来”的问题,涉及数据接入、任务编排、效果评估等[35] - 同步建设模型的“脑”(豆包大模型)与“手”(AgentKit),旨在降低开发门槛,提供从开发到运营的闭环解决方案[37] - 演示中企业级电商客服Agent从搭建到上线用时不足半小时,展现了效率的飞跃[38] 商业模式与成本优化创新 - 推出“AI节省计划”,通过阶梯式折扣帮助企业最高节省47%的成本[32] - 探索按“智能”交付物价值或按思考长度分段付费等新型计费模式,超越单纯的Token计费[33] - 通过工程优化不断提升MaaS服务“密度”,即在同等成本下提供更多价值[30][31] 市场渗透现状与未来展望 - 国内大约10%-20%的头部企业消耗了超过90%的Token,大模型服务渗透率不高,头部效应明显[24][25] - 预计到2030年,豆包大模型的Token调用量将比2025年末增长约100倍[24] - 公司目标是构建完整的AI基础设施和服务体系,让每个企业都能低门槛、低成本地使用先进AI能力[38]
日耗50万亿Token,火山引擎的AI消费品战事
36氪· 2025-12-19 10:31
大模型已经从单点能力, 进入系统工程的较量。 文 | 陆莫斯 封面来源 | AI生成 如果想知道AI市场到底发展成什么样,火山引擎已经是中国市场当仁不让的风向标。 "截至今年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍。"12月18日,在人头攒动的Force大会现场,火山引擎总裁谭待宣布 了这一数字。 2025年,这一数字仅为16.4万亿 图源:火山引擎 MaaS(模型即服务),是最直接的观察模型消耗量的指标。单论这一市场,如今火山引擎已经成为国内市场份额第一,全球也能排在第三位。 2025年中旬,云厂商争夺"AI云第一"的硝烟还未停息,到了今年最后一个月,各个大厂又端上了各个新版本——前有谷歌的旗舰模型Gemini 3、视频模型 Veo 3.1炸场,后有OpenAI的GPT-5.2紧追不舍。在国内,包括阿里、腾讯等巨头也纷纷端出了新模型的更新。 如果要给2025年的AI市场概括关键词,多模态和Agent必定在榜。 这次的Force大会,火山引擎重点发布的产品,也围绕这两方面展开: 模型侧:豆包旗舰模型1.8、以及视频生成模型Seedance 1.5 pro; 围绕Agent开 ...
AI 产业速递:从字节原动力大会看国内 AI 应用落地趋势
长江证券· 2025-12-19 09:27
报告行业投资评级 - 投资评级:看好,维持 [6] 报告的核心观点 - 从火山引擎原动力大会观察到明确的下游需求爆发趋势和模型能力的持续迭代,供需共振下看好明年行业token用量再上台阶 [2][9] - 重点关注多模态(如生图、生视频)、端侧(如AI玩具、眼镜等)、Agent等赛道的应用机会 [2][9] 事件描述与数据表现 - 2025年12月18日,火山引擎举办冬季Force原动力大会,正式发布豆包大模型1.8及音视频创作模型Seedance 1.5 pro,同时发布多款新产品 [2][4] - 截至2025年12月,豆包大模型日均token使用量突破50万亿,自发布以来增长471倍,较去年同期增长超过10倍 [9] - 已有超过100家企业客户累计token使用量超过一万亿 [9] 模型能力迭代升级 - **豆包大模型1.8**:拥有更强多模态Agent能力 [9] - 升级多模态理解,单视频理解帧数从640提升至1280 [9] - 更强Agent能力,加强工具调用、长文和多轮指令遵循,同时支持OS Agent落地 [9] - 更灵活的上下文管理:支持256K,具备原生API上下文管理 [9] - **豆包视频生成模型Seedance 1.5 pro**:主要进步在于音画高精同步、支持多人多语言对白及具备影视级叙事张力 [9] 新产品与架构发布 - 全面升级AI云原生架构 [9] - 推出企业级AI Agent平台AgentKit,帮助企业打造多样的Agent,解决权限、集成等工作 [9] - 推出智能体工作站HiAgent,帮助企业管理和调度未来的数字员工 [9] - 发布多款封装完成的通用Agent,如“内容审核Agent”、“内容洞察Agent”、“客服Agent”,以降低企业特定任务的部署难度 [9] 商业模式与定价策略 - 火山引擎推出模型“节省计划”,提供阶梯折扣最高节省47% [2][9] - 模型定价思路从最初的技术调优实现单token降价,演进为根据Context区间定价,再到针对客户使用多款模型解决不同任务的习惯推出整体节省计划 [9] - 定价策略旨在使客户在token用量增大的情况下享受更优惠价格,降低创新成本 [9]
火山引擎总裁谭待:谈论Agent与APP冲突还太早
第一财经· 2025-12-19 06:51
豆包大模型业务进展 - 火山引擎发布豆包大模型1.8与音视频创作模型Seedance 1.5 pro [2] - 豆包大模型日均tokens调用量已超过50万亿,较2024年9月的30万亿有显著增长 [2] AI Agent的发展阶段与行业观点 - 行业将互联网APP对AI的针对性限制解读为“Agent时代与APP时代之间的冲突”,但公司认为行业发展仍处早期,本质是观察视角问题 [2] - AI的核心价值在于更便利、更低成本地满足用户需求,从而创造增量,例如便捷配送服务可能将咖啡需求从一天一杯升级为两杯 [2] - Agent不会淘汰Web或APP,而是会与现有载体共存互补,通过需求扩容和用户时长增加形成新格局 [2] - 当前行业对AI与Agent的探索仍处于摸索阶段,市场需求已存在但模型尚不完善,企业实践各具特色,这种状态预计还会持续三年左右 [3] - 行业“是否准备就绪”的核心在于Agent工具的完善,公司内部正投入精力将存量功能转化为Agent可识别、可调用的工具 [3] Agent的技术挑战与多模态发展 - 无论是豆包AI助手还是APP,本质都是由众多复杂Agent构成的集合,不同功能背后对应不同逻辑的Agent [4] - Agent待突破的两大核心挑战包括基础能力支撑与满足真实线上落地的健全性、运行时稳定性、弹性伸缩、数据安全等高标准要求 [4] - 多模态大模型(如Seedance 1.5 pro)的迭代标志着AI应用向更深场景发展,使AI能“看、听、说、做”,处理视觉输入与输出 [4] - 多模态模型的应用场景包括驾驶时的路况识别、产品质检以及餐饮服务中的需求响应 [4] - 多模态模型较去年已能解决非常多问题,模型进步并解锁一个领域的更迭速度非常快 [4] - 厂商之间最重要的是先将市场做大,帮助各行业AI落地更快 [4] AI时代云服务的价值与趋势 - 作为云平台,火山引擎持续强调AI时代云服务的价值 [5] - AWS管理层曾表示其生成式AI平台Bedrock目标是成为“全球最大的推理引擎”,长期潜力可与规模约400亿美元的EC2服务媲美 [5] - 公司认可该趋势,并将MaaS(模型即服务)业务发展趋势类比芯片业务:GPU出货量已超过CPU,MaaS也将从训练转向推理 [5] - 以2025年初DeepSeek带火一体机销售但最终很多人“砸”手里为例,佐证AI时代云业务的重要性 [5] - 核心原因在于AI与大模型技术快速迭代(约三个月更新一代),且Agent、AgentKit、RAG等技术产品无法私有化部署,固定算力的一体机难以支撑丰富的AI应用落地 [5] - 基于此,公司判断软件时代的私有化一体机模式在AI时代将被淘汰 [5]
MaaS做到第一后,火山下一步怎么走?
雷峰网· 2025-12-19 04:55
" Agent Infra 之战,被火山推上了新高度。 " 作者丨林觉民 编辑丨 Kash 云厂商突围,今天已迫在眉睫。 在市场厮杀多年,云市场早已被"钳"得窒息——难以遏止的恶性价格战、难以标品化的项目、难以规模化 的高投入商业模式,就像一个泥潭,让厂商们深陷其中。 而被市场"炒了又热,热了又炒"的大模型,会是云厂商冲破泥潭的突破口吗?许多人如此相信,但如何突 围,答案还并不明朗。 12 月 18、19 日,字节火山引擎召开了 2025 年的冬季 Force 大会,以豆包大模型 1.8、视频生成模型 Seedance 1.5 pro 等新进展,决心在行业的坚壁上砸开一条"渠",把 AI 的"活水"引进行业。 可以说,Agent 是今天 AI 实现突破的"超级共识",但怎么发展 Agent,却仍然是厂商们众说纷纭的"多 元叙事"。 Agent Infra 平台——"AgentKit",则是火山为了这场"大考"给出的答案。 今天,Agent 开发者平台不少,火山做 AgentKit 背后的逻辑是什么?这一切,或许早就可以从火山引擎 的发展史中,找到暗藏的草蛇灰线。 01 火山 MaaS 登顶 No.1,主要是抓 ...
提升Agent的可信度后,企业会多一批好用的“数字员工”吗?
36氪· 2025-12-19 00:11
随着 AI 技术从"工具化"向"自主化"严谨,智能体(Agent)正在成为企业应用大模型的重要形态。那 么,如何优化 Agent,让它变得更可信、更好用,最终能够成为企业优秀的"数字员工"? 近日 InfoQ《极客有约》X AICon 直播栏目特别邀请、RBC senior application support analyst 马可薇担 任主持人,和值得买科技 CTO 王云峰、商汤科技大装置事业群高级技术总监鲁琲、明略科技集团高级 技术总监吴昊宇一起,在AICon 全球人工智能开发与应用大会 2025 北京站即将召开之际,共同探讨如 何提升企业 Agent 的"可信度"。 部分精彩观点如下: 以下内容基于直播速记整理,经 InfoQ 删减。 定义 Agent 的技术边界 马可薇:很多人觉得 Agent 就是 Chatbot 加了几个插件。但从技术架构视角看,当系统目标从"对话"变 成"行动",你们认为技术栈上产生的最大一个质变是什么? 完整的过程包括:模型接收任务,判断应采取的行动,感知外界、接收反馈,并基于反馈不断调整规 划。这与过去单纯的 chatbot 模式有巨大差异,其技术复杂度和对生态的要求都远高 ...
火山引擎总裁谭待:谈论Agent与APP冲突还太早
第一财经· 2025-12-18 15:26
除了外部独立APP的"反制",整个技术生态的成熟度也未做好迎接Agent全面接入的准备。对此,火山引擎智能算法负责人吴迪对第一财经记者表示,当前 行业对AI与Agent的探索仍处于摸索阶段。过渡阶段里,市场需求已存在,但模型尚不完善,企业实践也各具特色,这种状态预计还会持续三年左右。从生 态与第三方视角来看,行业"是否准备就绪"的核心在于Agent 工具的完善。吴迪透露,公司内部已投入大量精力,尝试将存量功能转化为Agent可识别、可 调用的工具。 谭待向记者补充称,不论是豆包AI助手还是APP等产品,本质都是由众多复杂Agent构成的集合。哪怕是搜索、垂直领域问答等不同功能,背后都对应不同 逻辑的Agent,而如今Agent待突破的两大核心挑战包括基础能力支撑与真实线上落地要求,满足健全性、运行时稳定性、弹性伸缩、数据安全等高标准。 2025年迈入尾声,海内外大模型头部厂商密集发力,包括Seedance 1.5 pro在内的多款多模态大模型更新迭代。对此,谭待分析称,多模态让大模型能像人一 样 "看、听、说、做",标志着AI应用往更深的场景走了。以前用大模型多为文字聊天,现在要让它办实事,不管是开车时的路况 ...
对话火山引擎谭待:多数人低估了火山拿下 AI 云的决心
晚点LatePost· 2025-12-18 11:58
"后发有劣势也有优势,关键是把手里的牌打好。" 文 丨 贺乾明 今年下半年,火山引擎调整 2021 年定下的千亿元年营收目标:原定 2029 年-2031 年的实现周期不 变,目标金额上调数百亿元。 当我们问 "这是谁的要求" 时,火山引擎总裁谭待说,是团队主动上调,是他们的 "务实浪漫"。多数 人低估了火山引擎拿下 AI 云的决心。 他们的信心来源,是火山引擎 MaaS(模型即服务)收入和豆包大模型能力提升都超出预期。12 月 18 日,火山引擎举办冬季 Force 原动力大会,谭待宣布,今年 12 月,豆包大模型日均 Token 处理量超 过 50 万亿,半年增长超 200%。 增长的动力不只来自字节旗下豆包、即梦等 AI 应用快速发展,还有一批外部客户在深入使用大模 型:累计使用上万亿 Token 的超过 100 家,比全球云计算巨头 AWS 还多了一倍。 "大模型能力持续提升,会解锁新场景,从而带动 Token 使用量增长。" 谭待说,比如生图、生视频的 需求过去一年随着 Seedream、Seedance 模型成熟迅速上涨。 这次大会,火山引擎又升级多款大模型。豆包基础大模型 1.8 版本, 强化多 ...
腾讯大模型团队架构调整,前OpenAI研究员姚顺雨出任要职|36氪独家
36氪· 2025-12-17 15:18
腾讯AI战略与组织调整 - 近期完成组织调整,新成立AI Infra部、AI Data部、数据计算平台部,以整合内部力量,统一模型团队[4] - 任命Vinces Yao(姚顺雨)为首席AI科学家,并兼任AI Infra部、大语言模型部负责人,其曾为OpenAI研究员,是Operator与Deep Research核心贡献者[4] - 新成立的AI Data部负责大模型数据及评测体系建设,数据计算平台部负责大数据和机器学习的数据智能融合平台建设[6] 人才争夺与团队建设 - 在AI人才招聘上表现激进,2025年校招对中意人才出价高50%是基准线,最高可达2倍薪资挖人[8] - 正以加倍薪资积极挖角字节跳动等公司的顶尖AI人才[8] - 新任负责人姚顺雨已帮助混元团队从字节、阿里及多家AI初创公司招募到数位核心员工[9] 自研模型进展与成果 - 整合原有团队并调整训练目标后,成果迅速显现,于12月5日发布全新大模型HY 2.0,在推理和效率上有显著进步[10] - 整个2025年,混元团队发布了超过30个新模型,其3D模型已位居全球领先梯队[10] - 公司内部已形成共识:必须拥有不能拖后腿的自研模型能力[4][17] 市场竞争与产品化驱动 - 2024年第三季度开始感受到紧迫感,外部重要因素是字节旗下豆包日活逼近1000万,被视为产品初步站稳脚跟的分界线[14] - 决定坚定在AI助手类应用方向加大投入,必须以产品化、商业化方式竞争,并于2025年初将“元宝”应用调整至云与智慧产业事业群[15] - 借助开源模型DeepSeek,“元宝”月活在2025年初1个月内突破4000万,一度在苹果免费下载榜跃居第一,但后续增长放缓,凸显自研模型的重要性[15][17] 行业趋势与未来赛点 - 行业验证铁律:模型能力决定产品上限,对话依然是AI应用的核心形态[19] - 智能体正成为下一个竞争赛点,字节推出豆包手机将赛场推向新阶段[20] - 公司总裁刘炽平明确表示微信最终会推出一个智能体,但同时指出AI市场仍处于非常早期的发展阶段[23]