Workflow
豆包大模型
icon
搜索文档
火山引擎FORCE大会追踪(2):Agent规模化落地,方舟与企业底座升级
海通国际证券· 2025-12-21 14:15
报告行业投资评级 - 报告未明确给出对火山引擎或其所属行业的投资评级 [1] 报告核心观点 - 火山引擎通过其产品组合将智能体(Agent)从概念探讨转向工程化与规模化落地,构建了覆盖模型服务、训练优化、上下文与记忆管理、企业级底座与治理以及开发提效工具的全链路支撑体系 [2] - 该平台化整合方案为企业客户提供了明确价值:有效降低拼装与集成成本,清晰界定工程边界,并确立可预期的上线路径,从而助力开发团队更聚焦于业务价值创造 [2] - 火山引擎正通过日益完善的产品矩阵与体系化的生态运营,在技术快速迭代的窗口期内,助力开发者将创新高效、稳健地转化为可衡量的业务价值 [6] 根据相关目录分别进行总结 火山方舟平台关键升级 - 发布新一代Responses API,支持单次请求内完成多轮上下文承接、多工具协调与结果归总,显著减少了传统方案中多次交互与复杂胶合代码带来的开销 [3] - 发布开发者模式,通过节点化、可追踪、可展开的工具调用链路,将智能体决策过程由黑箱转为可观测、可调试的资产,提升了问题定位效率 [3] - 现场披露的量化效果显示,在部分场景中,平均回复时延降低约20%,失败率下降约75% [3] - 借助上下文缓存,端到端时延可降低约50%,成本节约超过80%,会话缓存命中率可达85%–93% [3] 企业级规模化落地支持体系 - 发布并升级AgentKit企业级AI Agent平台底座,以模块化架构覆盖开发、部署、运维、监控与安全等环节 [1][4] - AgentKit突出零信任身份管控、存量API资产工具化、既有知识向智能体体系迁移及开箱即用评测能力,旨在解决企业当前的核心瓶颈——在不重构系统的前提下,实现既有资产安全、可控、可评估地被智能体调度 [4] - 发布TRAE CN企业版,为企业AI编码提供稳定性、适配性与安全性更强的工程底座,支持超大规模代码库索引、毫秒级响应及全链路加密传输,并以云端零存储策略保障数据合规 [1][4] - 增强VikingDB向量数据库及Viking记忆库的功能,结合其递进式检索、图文记忆与知识整合能力,为企业实现知识高效入模、上下文精准供给、抑制幻觉及结果可溯源提供了系统化的工程落地路径 [1][4] 开发者生态与增长动能 - 产品层面,扣子平台月活跃开发者已超300万,TRAE月活用户突破160万,表明其开发者生态已具备显著的规模基础与用户粘性 [5] - 生态运营层面,将原有开发者社区升级为专注Agent的开发者社区,并同步上线动手实验室、核心开发者计划及城市社区等系列生态支持举措 [1][5] - 城市社区已在北京、上海、深圳、成都四地试点,并计划于2026年扩展至全国十余城,旨在将发布会上的短期热度转化为持久的开发与实践闭环 [5]
海外周观点:拼多多聚焦供应链助力Temu再造拼多多,蚂蚁阿福发布新版-20251221
华西证券· 2025-12-21 14:08
证券研究报告|投资策略周报 [Table_Date] 2025 年 12 月 21 日 [Table_Title] 拼多多聚焦供应链助力 Temu 再造拼多多,蚂蚁阿福发布新版 [Table_Title2] 海外周观点 [Table_Summary] 核心内容: ► 拼多多:股东大会宣布组织架构升级,看好 Temu 的未来发展 组织架构升级:12 月 19 日,拼多多召开年度股东大 会,宣布升级公司治理架构,实行联席董事长制度。 赵佳臻获任联席董事长,与陈磊共同担任集团联席董 事长兼联席 CEO。此外,任命王密出任集团工程高级 副总裁,李炯出任集团财务总监。王密此前担任拼多 多集团研发副总裁,曾在腾讯、甲骨文任职;李炯拥 有丰富财务从业经验,加入拼多多前任职于毕马威。 Temu:管理层表示,下一个三年,将有机会再造一个 拼多多。Temu 业务快速发展,已经在全世界大部分国 家都具有了不错的市场规模,3 年走完了拼多多国内 电商 10 年的路。下一个阶段,公司战略更加聚焦, 锚定中国供应链作为接下来业务发展的核心。公司将 继续践行高质量发展,全力发展中国供应链的高质 量、品牌化,实现平台的再造,带动生态体系价值 ...
行业周报:国内L3级准入试点许可,百融云硅基员工+AnthropicSkill范式发布,关注Agent产业机会-20251221
开源证券· 2025-12-21 11:53
报告行业投资评级 - 看好(维持)[1] 报告核心观点 - 互联网行业短期面临高基数与竞争压力,但多条业务线整合协同与AI赋能有望成为业绩及估值驱动因素,需关注AI商业化及应用场景拓展[5][14] - AI行业需求可预见性提升,Google TPU商业化潜力获大额订单确认,Agent产业在百融云与Anthropic推动下有望加速进入工程化交付阶段[6][7][21][22][27] - 智能驾驶行业迎来关键政策突破,国内L3级自动驾驶获准入试点许可,高阶智驾商业化拐点将至,Robotaxi在技术、成本、政策驱动下蓄势待发[6][30][35] 根据相关目录分别总结 1. 互联网:豆包日均Tokens使用量突破50万亿,平台规范完善 - **大模型渗透加速**:字节跳动豆包大模型家族能力位于全球第一梯队,截至2025年12月,其日均Tokens使用量已突破**50万亿**,居中国第一、全球第三,已有超过**100家**企业在火山引擎上累计Tokens使用量超过**一万亿**[17] - **平台政策导向转变**:国家发布《互联网平台价格行为规则》,旨在规范价格竞争、保护经营者自主定价权及消费者权益,政策导向从“低价惠民”转向“保障商家利润、促进消费升级”,平台战略重点或从单纯GMV转向商户健康度与AI驱动效率提升[20] - **市场表现与资金流向**:报告期内(2025年12月15日-19日),恒生互联网科技业指数下跌**2.9%**,跑输主要指数,但港股通资金净流入互联网大厂,其中小米集团-W、美团-W、阿里巴巴-W、腾讯控股分别净流入**41.0亿港元**、**18.9亿港元**、**11.1亿港元**、**11.1亿港元**[14][52][53] 2. AI:Google TPU商业化潜力进一步确认,关注Agent产业机会 - **TPU大订单确认商业化潜力**:博通披露其**210亿美元**的ASIC订单买家为Anthropic(Q3 **100亿美元**,Q4追加**110亿美元**),涉及谷歌TPU v7机架系统,预计2026年底前交付,博通AI产品订单积压金额高达**730亿美元**,谷歌TPU阵营商业化潜力强化[21] - **Agent产业化进程加速**: - **百融云**提出硅基员工及RaaS(按结果付费)战略,其专属模型在成本与效果上具备优势,例如500通对话成本仅**0.1元**,优于字节的**1.2元**和DeepSeek的**6元**,对应人工坐席成本为**1900元**,公司定位企业级Agent开发平台,与2B基因形成差异化[22][24] - **Anthropic**发布基于Skill的模块化Agent范式并开源,采用三层架构(元数据约**100 tokens**、主体文档低于**5000 tokens**、资源无上限)提升上下文窗口效率,旨在降低复杂Agent开发门槛,推动AI应用从“实验性对话”进入“工程化交付”[26][27][29] - **市场空间广阔**:报告引用数据,2023年中国Agentic AI可触达市场规模为**739亿元**,替代率不足**1%**,若2030年替代率提升至**10%**,市场规模可达**1.8万亿元**,年复合增长率(CAGR)为**58%**[22] 3. 智能驾驶:国内L3级获准入试点许可,Robotaxi蓄势待发 - **L3级自动驾驶实现关键突破**:2025年12月15日,工信部批准长安深蓝SL03与极狐阿尔法S6两款车型的L3级准入试点许可,标志着L3自动驾驶从测试进入商业化应用关键一步,当前车型暂不面向个人消费者,仅限运营单位在限定区域使用[30] - **Robotaxi商业化加速**:在技术成熟、成本下降与政策驱动下,Robotaxi有望加速落地,报告分析了“主机厂+自动驾驶公司+出行服务商”等商业模式,认为该模式能综合各方能力,有利于加速商业化[35][37] - **国内外企业进展**: - **海外**:Waymo较为领先,已在多个城市实现无安全员全天候运营,并以**1100亿美元**估值寻求新一轮融资,特斯拉、Zoox等企业也在积极推进[41][42] - **国内**:百度Apollo(萝卜快跑)、小马智行、文远知行均已开启小规模全无人商业化运营,截至2025年10月,萝卜快跑全球覆盖**22个**城市,国内运营城市实现**100%**全无人驾驶,每周全无人订单超过**25万单**,小马智行2025年第三季度Robotaxi收入达**4770万元**[43][44] 4. 周度数据更新 - **指数表现**:报告期内(2025年12月15日-19日),恒生指数下跌**1.10%**,恒生科技指数下跌**2.82%**,在全球主要市场中涨幅靠后[46] - **AH股溢价**:恒生沪港通AH溢价指数为**121.58**,环比有所提升,报告认为AH股溢价或已触底[57] 5. 投资建议 - **互联网**:关注AI商业化及应用场景拓展,推荐阿里巴巴-W、拼多多、百度集团-SW,受益标的腾讯控股[5][58][60] - **计算机**:AI需求可预见性提升,软件侧孕育机会,重点推荐受益于央国企IT支出的浪潮数字企业,受益标的有金蝶国际、百融云、北森控股、第四范式等[60] - **汽车&自动驾驶**:国内L3级获准入试点许可,高阶智驾商业化迎来拐点,Robotaxi有望加速落地,受益标的包括整车(小鹏汽车-W、小米集团-W、特斯拉)、自动驾驶解决方案(百度集团-SW、小马智行-W、文远知行-W)及零部件(地平线机器人-W、速腾聚创、禾赛-W)[60]
AI新变化:光纤光缆或涨价、谷歌液冷和光模块需求或提升、国内AI招标或提速
开源证券· 2025-12-21 03:15
行业投资评级 - 投资评级:看好(维持)[1] 核心观点 - 报告认为AI产业出现新变化,包括光纤光缆或涨价、谷歌液冷和光模块需求或提升、国内AI招标或提速[3][10] - 展望2026年,AI“虹吸效应”显著,全球AI或继续共振,看好“光、液冷、国产算力、卫星”四条核心主线[7][19] 周投资观点:AI新变化 - **火山引擎大会与豆包大模型**:2025年12月18日至19日,火山引擎冬季FORCE原动力大会召开,发布企业级AI Agent平台AgentKit和智能体工作站HiAgent,推动Agent大规模落地[4][13][14] - **豆包大模型日均Tokens使用量已突破50万亿**,居中国第一、全球第三,2025年上半年在中国大模型公有云服务中占据49.2%的份额,已有超过100家企业在火山引擎上累计Tokens使用量超过一万亿[4][15] - **谷歌AI生态完善**:2025年4月9日,谷歌发布TPUv7 Ironwood,单芯片算力达4614 TeraFlops,内存192GB,带宽7.2 Tbps,单集群可扩展至9216芯片并采用液冷方案[5][16] - **海外TPU需求旺盛**:Anthropic计划部署多达100万个谷歌TPU芯片训练Claude模型,该扩展计划价值数百亿美元,预计算力容量将于2026年达1GW级别;Meta正商讨最早于2026年从谷歌云租用芯片,投资或价值数十亿美元[5][17] - **AI拉动光纤光缆需求**:AI大模型训练与推理加速,对集群内部网络及外部数据中心互联(DCI)要求提升,带动光纤光缆用量增长,价格有望复苏[6][18] 通信数据追踪 - **5G基建**:截至2025年10月底,我国5G基站总数达475.8万站,较2024年末净增50.7万站[28][30] - **5G用户**:2025年10月,三大运营商及广电5G移动电话用户数达11.84亿户,同比增长18.99%[28][31] - **5G手机出货**:2025年9月,5G手机出货2410.6万部,占总出货量的86.3%,出货量同比增长8.02%[28][38] - **运营商云业务**:2025年上半年,移动云营收561亿元,同比增长11.3%;天翼云营收573亿元,同比增长3.8%;2025年前三季度,联通云营收529亿元[47] - **运营商ARPU值**:2025年前三季度,中国移动移动业务ARPU值为48.0元,同比略减3.0%;2025年上半年,中国电信移动业务ARPU值为46.0元,同比略减0.6%;2023年,中国联通移动业务ARPU值为44.0元,同比略减0.7%[47] 投资建议与推荐主线 - **光网络设备**:推荐光模块、光器件、CPO、光纤光缆、交换机路由器及芯片等领域标的,如中际旭创、新易盛、天孚通信、源杰科技、中天科技、亨通光电、紫光股份、中兴通讯、盛科通信等[7][19] - **计算设备**:推荐国产AI芯片、AI服务器及电源等领域标的,如中兴通讯、紫光股份、欧陆通等[20] - **AIDC机房建设**:推荐液冷温控、AIDC机房等领域标的,如英维克、光环新网、奥飞数据等[22] - **算力租赁**:列出受益标的,如有方科技、云赛智联等[23] - **云计算平台**:列出受益标的,如中国移动、中国电信、中国联通、阿里巴巴、腾讯控股等[24] - **AI应用**:推荐AI模组等领域标的,如广和通[25] - **卫星互联网&6G**:列出卫星互联网和6G领域受益标的,如海格通信、信科移动、通宇通讯等[25]
【国盛计算机】算力&存力依旧
新浪财经· 2025-12-21 02:42
字节与腾讯的AI战略动态 - 字节跳动在FORCE原动力大会上宣布,截至今年12月,其豆包大模型日均tokens使用量已突破50万亿,位居中国第一、全球第三,已有超过100家企业在火山引擎上累计tokens使用量超过一万亿,而今年5月底该数据为超过16.4万亿,较去年5月发布时增长137倍 [1][7][24][30] - 字节在大会上发布了豆包大模型1.8和豆包视频生成模型Seedance 1.5 pro,并宣布其大模型家族在多模态理解和生成能力、Agent能力上已位于全球第一梯队,同时火山引擎升级了AI云原生全栈服务,推出企业级AI Agent平台AgentKit和HiAgent智能体工作站 [8][31] - 腾讯于12月17日宣布升级大模型研发架构,新成立AI Infra部、AI Data部和数据计算平台部,并任命前OpenAI研究员姚顺雨为“CEO/总裁办公室”首席AI科学家,同时兼任AI Infra部和大语言模型部负责人,旨在提升AI大模型研究能力与研发效率 [1][9][24][32] 全球大模型技术迭代与竞争 - 谷歌发布的Gemini 3 Pro在多模态理解和长期规划能力上实现核心突破,模型可在文本、图像、视频、音频与代码之间进行精细推理,尤其在屏幕理解任务上表现突出,并在Vending-Bench 2测试中展示出长达一年的可靠规划与工具使用能力 [2][10][25][33] - OpenAI发布的GPT-5.2聚焦专业知识型工作场景,在复杂文档、数据分析、代码开发和多步骤项目管理中表现显著提升,其提出的GDPval评测体系显示,GPT-5.2在70.9%的知识型任务中表现优于或与顶尖人类专家持平 [2][11][12][25][34][35] - 国产模型DeepSeek V3.2系列通过稀疏注意力机制、大规模后训练与合成数据等创新路径实现能力跃升,在公开推理基准测试中达到GPT-5水平,略低于Gemini-3.0-Pro,但团队坦承其世界知识广度仍落后于顶尖闭源模型,主要受限于预训练算力 [2][12][13][25][35][36][37] AI驱动的存储需求与供应格局 - 存储芯片巨头美光科技2026财年Q1营收达136.4亿美元,同比增长57%,远超预期的129.5亿美元,调整后净利润为54.82亿美元,同比增长58%,其中云存储部门销售额52.8亿美元,同比翻倍 [3][14][26][37] - 美光科技表示其2026日历年的所有HBM产能已全部售罄且价格销量锁定,预计HBM市场规模到2028年将达到1000亿美元,比之前预测提前两年,公司正首次与客户谈判带有强制性条款的多年期供货合同,并将2026财年资本支出上调至200亿美元 [3][15][26][38] - 2025年10月,OpenAI以“星际之门”为名与三星和SK海力士签署协议,锁定每月高达90万片DRAM晶圆供应,约占全球DRAM产量的40%,AI服务器对HBM和DDR5企业级内存的需求正大量消耗晶圆产能,导致原厂将产能优先分配给高利润产品,对消费级产品造成排挤 [3][16][26][39] 端侧AI Agent的应用突破 - 字节跳动于12月1日发布豆包手机助手预览版,作为面向手机厂商的系统级AI服务,将豆包大模型深度嵌入操作系统,实现以语音或简单指令替代复杂手动操作,功能覆盖跨平台比价点外卖、内容搜索等场景,并与中兴合作推出首款售价3499元的打样手机 [4][17][27][40] - 豆包手机助手上线后引发了部分被操作App的抗拒,在微信、农行、建行等社交和金融类应用中出现登录异常、功能受限甚至账号短暂封禁的问题,字节于12月5日发布说明,对AI操作手机能力进行规范化调整,主动限制刷激励、金融类应用及部分游戏场景 [4][18][27][41] - 豆包手机助手被视为大模型应用落地的重要突破,标志着端侧Agent时代的开启,预示着移动交互范式将从以应用为中心的图形用户界面向由自然语言驱动、能完成跨App任务编排与执行的Agentic交互演进 [4][19][27][42] 建议关注的投资方向 - 算力领域建议关注的公司包括寒武纪、海光信息、中际旭创、中芯国际、浪潮信息、中科曙光等 [6][20][29][43] - Agent领域建议关注的公司包括谷歌、阿里巴巴、腾讯控股、第四范式、科大讯飞、恒生电子等 [6][20][29][43] - 其他相关领域建议关注自动驾驶方向的江淮汽车、赛力斯、小鹏汽车、理想汽车等,以及军工AI方向的拓尔思、能科科技、中科星图等 [6][21][29][44]
豆包狂飙,字节AI再亮剑
华尔街见闻· 2025-12-20 04:44
作者 | 王小娟 编辑 | 黄昱 中国AI领域的竞争,依旧体现在互联网巨头们的一举一动中。临近年末,各大厂也在密集总结成绩,并放出新的大招。 "豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍。" 12月18日,火山引擎FORCE原动力大会上,火山引擎总裁谭待宣布的这一数据引发行业关注。截至今年12月,已有超过100家企业客户累计token使用量超过 一万亿。 这意味着,字节跳动正式加入全球token经济的头部竞争。同日,字节跳动还发布了豆包大模型1.8版本及音视频创作模型Seedance 1.5 pro,全面升级多模态 Agent(智能体)能力。 为了进一步提升竞争力,在全球范围内招揽人才,字节在12月19日宣布对全球员工进行涨薪,意在吸引那些AI领域的顶尖从业者。 当然,行业其他玩家也都在全力加速。 不过,面对当前豆包大模型的更新,火山引擎总裁谭待认为,当前豆包大模型和Gemini3相比还有一定的差距。但他同时也表示,追赶的效果取决于衡量维 度 。"从距离上看,我们确实存在差距;从短期速度上看,也有不足,但我们的加速度正在提升,最终会逐步缩小差距。" 在火山引擎FORCE原动力大会之前 ...
计算机行业GenAI系列(二十三):火山多模态和千问高德:硬核能力成生态格局新基石
广发证券· 2025-12-19 13:51
报告行业投资评级 - 行业评级为“买入” [2] 报告的核心观点 - 核心观点:科技公司的分化正在从商业模式竞争向硬科技实力竞争方向倾斜,大模型的崛起意味着中国科技产业可能迎来了继移动互联网之后、十余年来又一次由技术本身主导竞争格局的关键时刻,竞争的重心正在从商业模式转向底层硬实力 [5][79] - 核心观点:火山引擎发布的豆包大模型在多模态理解与智能体执行力上与Qwen3比肩,其日均Tokens使用量快速增长,商业化路径逐渐清晰 [5] - 核心观点:阿里千问APP接入高德地图,使得AI助手获得了对物理世界的理解与行动能力,实现了从“理解用户意图”到“执行具体服务”的跨越,迈出了构建超级Agent的关键一步 [5][56][74] 根据相关目录分别进行总结 一、豆包大模型TOKENS持续增长,推理和应用驱动算力增长 - 截至2025年12月18日,豆包大模型日均Tokens使用量已突破50万亿,较2025年9月的30万亿大幅增长,自发布以来增长417倍 [5][14] - 2025年9月至12月,豆包大模型Tokens使用量的月度平均增速为22%,与2025年5月至9月的月度平均增速21%基本持平 [14] - 豆包大模型1.8版本的Tokens调用价格与1.6版本持平,但通过Token效率优化、减少多轮重试与无效推理等方式降低了冗余算力消耗,在单位推理成本降低的趋势下,应用端算力成本消耗的增速或低于Tokens的增速 [5][15] - 豆包大模型采用超稀疏MoE架构,将单层级训练速度最高提升1.96倍,端到端效率平均提升1.71倍,并通过多模态联合训练、分阶段预训练+定向微调等方式降低训练阶段算力成本 [20] - 未来AI算力需求增长的驱动力将更多来自模型推理和应用落地,国产AI芯片(如寒武纪)和服务器(如浪潮信息、紫光股份)以及基础软件工具(如第四范式、星环科技)有望受益于推理侧算力占比的提升 [20][24] 二、豆包大模型性能提升较大,产品功能多维度增强 (一)豆包大模型1.8 - 豆包大模型1.8在工具调用、复杂指令遵循及OS智能体等关键维度均实现显著增强,在多模态理解与智能体执行力上与Qwen3比肩 [5][32] - 在基础数学与推理能力测试中,豆包模型分别以94.3对87.2、83.8对79.8的得分领先于Qwen3-235B-a22b-thinking模型 [27][29] - 其视觉能力升级至支持单次1280帧视频解析,并能通过低帧率模式处理超长视频 [28] - 在多模态评估中,豆包1.8在MMMU-Pro基准获73.2分,且在通用视觉问答、文档图表理解及动作感知等任务中保持领先于Qwen3-VL [28][30] (二)视频生成模型Seedance 1.5 Pro - Seedance 1.5 Pro基于原生音视频联合生成架构,实现音画同步精度达到毫秒级,口型高精度对齐 [33] - 其Draft样片功能可生成低分辨率预览视频,关键要素与成片高度一致,有望提升创作效率65%,减少约60%无效成本 [33] - 根据官方评测,Seedance 1.5 Pro在音频质量、同步性及表现力等全维度评估中,凭借“声画一体”的原生架构优于Kling 2.6与Veo 3.1 [5][37] (三)图像创作模型Seedream 4.5和语音识别模型2.0 - Seedream 4.5模型在主体一致性、指令遵循精准度、空间逻辑理解及美学表现力等方面实现迭代 [43] - 豆包语音识别模型2.0的上下文整体关键词召回率提升20%,并且支持多模态视觉识别,通过视觉信息输入让文字识别更精准 [43] (四)总结 - 截至2025年12月18日,豆包大模型日均tokens使用量已突破50万亿,而2024年12月该数据为4万亿 [47] - 目前已有超过100家企业在火山引擎上累计Tokens使用量超过一万亿 [47] - 豆包大模型迭代节奏快速,以数月级版本更新为常态,并通过与字节内部业务(如抖音、飞书)深度结合形成较强的迭代动力 [51] 三、千问APP接入高德,超级Agent从意图理解向现实世界服务执行跨越 - 千问APP公测后一周下载量破1000万,仅23天月活用户数突破3000万 [53] - 2025年12月18日,千问APP正式接入高德地图,基于高德的扫街榜、实时路况等能力,可为用户智能推荐餐厅、规划最优出行路线 [5][56] - 实测比较显示,在出行游玩规划、路线时长估计、餐厅推荐等生活场景中,千问APP因能直接调用高德服务,提供包含实时数据、可执行链接和结构化建议的答案,其可执行性和便利性优于豆包APP和DeepSeek APP [58][59][62][66][68][71] - 通过APP授权打通能力边界是构建超级Agent当前可行度较高、落地速度较快的整合路径,高德能力的快速上线验证了该路径的成熟度 [74] - 报告预期,随着千问APP持续迭代,淘宝、飞猪等阿里系核心应用可能陆续融入,形成以意图为中心调用服务的统一智能入口,这可能对现有APP的流量与角色分工带来结构性变化 [75]
英特尔与火山引擎联手,开启「全局效率优化」时代
36氪· 2025-12-19 13:26
全球市场都在面临一场前所未有的算力需求爆发。 特别是在多模态技术趋于成熟,企业级复杂Agent落地愈发成熟的当下,越来越多企业跑在了AI转型的前沿。 爆发背后的AI原生解法 然而,当模型选择更多,算力需求不断膨胀时,如何算好经济账,如何实现高吞吐、低时延,在稳定性、可靠性与兼容性上更加有的放矢。凡此种种,让 AI加速迈入了云原生时代。 12月19日,在2025火山引擎冬季FORCE原动力大会上,豆包大模型1.8及音视频创作模型Seedance 1.5 pro正式亮相。权威评测数据显示,豆包大模型在多 模态理解、生成能力及Agent能力上,已跻身全球第一梯队。 另据火山引擎总裁谭待介绍,截至今年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍。 在千行百业落地应用AI的关键节点,火山引擎的AI普惠究竟是如何做到的? "数据是新时代的石油",火山引擎总裁谭待曾在采访时表示,云计算行业的第二次浪潮就在于智能化,其意义不仅在于能发挥数据价值,还在于端到端的 业务落地,以大模型为基础,包括MaaS(模型即服务)、AI Agent将成为未来数年内的主流叙事。 延续着这样的思路,火山引擎做出了一 ...
英特尔与火山引擎联手,开启「全局效率优化」时代
36氪· 2025-12-19 13:19
AI普惠时代终将到来。 全球市场都在面临一场前所未有的算力需求爆发。 特别是在多模态技术趋于成熟,企业级复杂Agent落地愈发成熟的当下,越来越多企业跑在了AI转型的前沿。 然而,当模型选择更多,算力需求不断膨胀时,如何算好经济账,如何实现高吞吐、低时延,在稳定性、可靠性与兼容性上更加有的放矢。凡此种种,让AI 加速迈入了云原生时代。 12月19日,在2025火山引擎冬季FORCE原动力大会上,豆包大模型1.8及音视频创作模型Seedance 1.5 pro正式亮相。权威评测数据显示,豆包大模型 在多模态理解、生成能力及Agent能力上,已跻身全球第一梯队。 另据火山引擎总裁谭待介绍,截至今年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍。 在千行百业落地应用AI的关键节点,火山引擎的AI普惠究竟是如何做到的? 爆发背后的 AI 原生解法 "数据是新时代的石油",火山引擎总裁谭待曾在采访时表示,云计算行业的第二次浪潮就在于智能化,其意义不仅在于能发挥数据价值,还在于端到端的业 务落地,以大模型为基础,包括MaaS(模型即服务)、AI Agent将成为未来数年内的主流叙事。 延续着 ...
日耗50万亿Token,火山引擎的AI消费品战事
36氪· 2025-12-19 10:55
火山引擎AI业务增长与市场地位 - 截至2025年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍[1] - 在MaaS(模型即服务)市场,火山引擎已成为国内市场份额第一,全球排名第三[2] - 公司营收规模快速增长,2024年营收超过110亿元,增速远超60%;2025年营收已超过200亿元[6] 2025年AI市场核心趋势 - 多模态和Agent是2025年AI市场的关键趋势[3] - 视频生成模型的竞争焦点已从参数、时长转向能否直接产出“可发布的完整作品”,声画同步成为重要竞争因素[7][11] - 行业迭代速度极快,模型正从技术工具演变为具备社交平台潜力的创作工具[9][22] 火山引擎Force大会核心产品发布 - 模型侧发布豆包旗舰模型1.8和视频生成模型Seedance 1.5 pro[3] - 围绕Agent生态发布企业推理代工服务、强化学习平台、企业级AI Agent平台AgentKit以及HiAgent“1+N+X”智能体工作站[3] - 豆包大模型1.8采用集成策略,将LLM、VLM、Thinking等能力整合进单一模型接口,简化客户选择与集成流程[26][27] Seedance 1.5 pro视频模型的技术与商业突破 - 核心主打声画同步功能,可实现开箱即用,生成视频的嘴型匹配、情绪捕捉与画面配合度达到高可用水平[8][13] - 在中文适配、电影级运镜、动态张力及环境沉浸感方面表现突出,优于部分海外模型[13][14][15] - 通过多阶段蒸馏、量化等工程优化,模型端到端推理速度提升超过10倍,极大降低了生成成本[17][31] - 模型支持多种方言和强表演场景,适合生成可供二次创作的社交内容,与豆包、即梦等C端产品联动潜力大[21][22] 火山引擎的AI发展战略与系统工程 - 公司定位为AI Native,其基础设施、产品架构及商业模式均围绕AI云原生设计,视AI为弯道超车的关键[34] - 竞争已从模型能力比拼转向系统工程较量,重点解决企业“用不起来”的问题,涉及数据接入、任务编排、效果评估等[35] - 同步建设模型的“脑”(豆包大模型)与“手”(AgentKit),旨在降低开发门槛,提供从开发到运营的闭环解决方案[37] - 演示中企业级电商客服Agent从搭建到上线用时不足半小时,展现了效率的飞跃[38] 商业模式与成本优化创新 - 推出“AI节省计划”,通过阶梯式折扣帮助企业最高节省47%的成本[32] - 探索按“智能”交付物价值或按思考长度分段付费等新型计费模式,超越单纯的Token计费[33] - 通过工程优化不断提升MaaS服务“密度”,即在同等成本下提供更多价值[30][31] 市场渗透现状与未来展望 - 国内大约10%-20%的头部企业消耗了超过90%的Token,大模型服务渗透率不高,头部效应明显[24][25] - 预计到2030年,豆包大模型的Token调用量将比2025年末增长约100倍[24] - 公司目标是构建完整的AI基础设施和服务体系,让每个企业都能低门槛、低成本地使用先进AI能力[38]