Workflow
火山引擎
icon
搜索文档
火山引擎总裁谭待:谈论Agent与APP冲突还太早
第一财经· 2025-12-19 06:51
豆包大模型业务进展 - 火山引擎发布豆包大模型1.8与音视频创作模型Seedance 1.5 pro [2] - 豆包大模型日均tokens调用量已超过50万亿,较2024年9月的30万亿有显著增长 [2] AI Agent的发展阶段与行业观点 - 行业将互联网APP对AI的针对性限制解读为“Agent时代与APP时代之间的冲突”,但公司认为行业发展仍处早期,本质是观察视角问题 [2] - AI的核心价值在于更便利、更低成本地满足用户需求,从而创造增量,例如便捷配送服务可能将咖啡需求从一天一杯升级为两杯 [2] - Agent不会淘汰Web或APP,而是会与现有载体共存互补,通过需求扩容和用户时长增加形成新格局 [2] - 当前行业对AI与Agent的探索仍处于摸索阶段,市场需求已存在但模型尚不完善,企业实践各具特色,这种状态预计还会持续三年左右 [3] - 行业“是否准备就绪”的核心在于Agent工具的完善,公司内部正投入精力将存量功能转化为Agent可识别、可调用的工具 [3] Agent的技术挑战与多模态发展 - 无论是豆包AI助手还是APP,本质都是由众多复杂Agent构成的集合,不同功能背后对应不同逻辑的Agent [4] - Agent待突破的两大核心挑战包括基础能力支撑与满足真实线上落地的健全性、运行时稳定性、弹性伸缩、数据安全等高标准要求 [4] - 多模态大模型(如Seedance 1.5 pro)的迭代标志着AI应用向更深场景发展,使AI能“看、听、说、做”,处理视觉输入与输出 [4] - 多模态模型的应用场景包括驾驶时的路况识别、产品质检以及餐饮服务中的需求响应 [4] - 多模态模型较去年已能解决非常多问题,模型进步并解锁一个领域的更迭速度非常快 [4] - 厂商之间最重要的是先将市场做大,帮助各行业AI落地更快 [4] AI时代云服务的价值与趋势 - 作为云平台,火山引擎持续强调AI时代云服务的价值 [5] - AWS管理层曾表示其生成式AI平台Bedrock目标是成为“全球最大的推理引擎”,长期潜力可与规模约400亿美元的EC2服务媲美 [5] - 公司认可该趋势,并将MaaS(模型即服务)业务发展趋势类比芯片业务:GPU出货量已超过CPU,MaaS也将从训练转向推理 [5] - 以2025年初DeepSeek带火一体机销售但最终很多人“砸”手里为例,佐证AI时代云业务的重要性 [5] - 核心原因在于AI与大模型技术快速迭代(约三个月更新一代),且Agent、AgentKit、RAG等技术产品无法私有化部署,固定算力的一体机难以支撑丰富的AI应用落地 [5] - 基于此,公司判断软件时代的私有化一体机模式在AI时代将被淘汰 [5]
正与字节开展AI手机合作?联想内部人士:一直保持密切沟通
新浪科技· 2025-12-19 04:02
有联想内部人士透露,联想集团一直与豆包、火山引擎等字节系业务保持紧密合作。目前,联想 相关业务也一直在与豆包在智能终端领域的合作保持密切沟通。(新浪科技) 12月19日,据报道,字节跳动正推进与vivo、联想、传音等硬件厂商开展AI手机的合作,为其设 备预装AIGC插件,从而获得用户入口,扭转当前AI在执行层面的被动局面。 ...
正与字节开展AI手机合作?联想内部人士:一直保持密切沟通
新浪财经· 2025-12-19 03:45
新浪科技讯 12月19日上午消息,据报道,字节跳动正推进与vivo、联想、传音等硬件厂商开展AI手机 的合作,为其设备预装AIGC插件,从而获得用户入口,扭转当前AI在执行层面的被动局面。 有联想内部人士对新浪科技透露,联想集团一直与豆包、火山引擎等字节系业务保持紧密合作。目前, 联想相关业务也一直在与豆包在智能终端领域的合作保持密切沟通。 责任编辑:江钰涵 责任编辑:江钰涵 新浪科技讯 12月19日上午消息,据报道,字节跳动正推进与vivo、联想、传音等硬件厂商开展AI手机 的合作,为其设备预装AIGC插件,从而获得用户入口,扭转当前AI在执行层面的被动局面。 有联想内部人士对新浪科技透露,联想集团一直与豆包、火山引擎等字节系业务保持紧密合作。目前, 联想相关业务也一直在与豆包在智能终端领域的合作保持密切沟通。 ...
字节端侧AI进展交流
2025-12-04 15:36
公司:字节跳动 * **AI战略重心与组织架构** * 公司AI战略聚焦三大方向:通用型AGI、具身智能和世界模型[1] * 研发由四大团队负责:C团队(基础模型孵化)、Follow团队(垂直行业应用)、Stone团队(AI工具链)、Cici团队(海外豆包产品)[2] * C团队和Follow团队承担了80%的产品及模型研发工作,人员规模分别超过1200人和1000人[2] * 公司AI战略核心思路是B端导向,90%以上的AI token消耗来自B端业务,C端流量主要用于吸引B端客户渗透产品矩阵[7] * **资本开支与算力布局** * 2024年资本开支预计约500亿元,2025年大幅提升至1600亿元,2026年初步规划达2200亿元[5] * 2025年资本开支中,900亿元用于购买GPU,700亿元用于共建AIDC及超算中心[1][5] * 2026年规划中,约70%(约1540亿元)用于购买GPU,其余30%用于共建超算中心[6] * GPU采购中,NVIDIA占比约75%,国内厂商占比约25%[1][6] * 现有总算力为1475亿FLOPS,相当于110万张H100D GPU的算力,其中H20型号已突破30万张[1][7] * **B端业务与火山引擎** * 公司整体收入主要来源于B端业务,通过提供AI解决方案、定制开发及私有化部署等服务获取收入[1][7] * 火山引擎2025年预计收入超过500亿元,侧重提供多元化AI处理解决方案及算力服务,以差异化优势与阿里云竞争[1][8] * **AI手机战略与进展** * 推出AI手机的战略目的是拓展硬件生态,通过AIOS 1.1.0通用型Agent平台掌控移动操作系统流量入口[1][10][11] * 公司与中兴、努比亚合作,计划2026年Q1末或Q2初推出量产机,目标出货量百万级别[1][14] * 预计2026年全球AI手机市场规模达8000万台,公司目标占据5%份额,即销售突破500万台[3][15] * 工程机使用骁龙8至尊版特供版芯片,算力400 TOPS;量产机预计算力达800 TOPS,可运行7B模型[3][25] * 工程机预备了3万台,70%分配给开发者渠道,C端预约量超出预期40%[13] * 计划通过语音控制和对话方式改变用户习惯,并渗透到衣食住行领域,高德地图已加入其生态系统[3][24] * **技术挑战与用户反馈** * FLO事业群面临主要技术问题:语义理解能力不足(单轮指令识别率低,多轮对话连贯性差,此类问题占比约60%)、触控物理触控失败率达24%、跨应用操作成功率低于50%、端侧模型延迟较大(用户侧达2-3秒)[16] * 用户反馈问题集中在:语义理解与多轮对话、跨应用操作(复杂任务如出行、住酒店、点外卖尤为明显)、端侧延迟、硬件资源占用(内存、耗电、发热)、数据隐私、个性化程度不高[18] * 线上存在3400多个P0级bug,团队每两天发布一个补丁版本进行热更新[18] * 技术问题基本可通过迭代解决,但部分特殊用户需求因硬件限制难以满足[19] * **应对第三方APP调用的技术方案** * 主流方法是模拟用户物理点击(类似按键精灵加RPA),通过视觉理解捕捉屏幕事件反馈,无需APP授权[20][21] * 其他方案包括:与公司直接合作获取底层授权、使用豆包录制视频重现用户行为、云端部署花生壳代理IP切换访问[23] * 未安装相应APP时,可通过浏览器激活方式(如WebDriver或Chrome V8引擎)实现自动化操作[22] * **未来展望与行业影响** * 系统级AI助手有潜力重塑移动端流量入口,终极目标是使用户无需安装APP即可获得服务,可能颠覆现有智能终端和操作系统格局[27] * AI手机可能改变互联网平台竞争格局,但目前各大公司均处于试水阶段,未来取决于技术突破与合作竞争[28] * 公司推动超级APP策略,旨在通过其内容生态(抖音、头条、TikTok等)构建统一管理的超级APP,通过语音交互满足用户需求[29] 行业:AI手机与算力服务 * **AI手机市场预期** * 字节跳动预计2026年全球AI手机市场规模将达到8000万台[3][15] * **云计算竞争格局** * 阿里云在SaaS和PaaS领域表现出色,生态系统成熟;火山引擎作为后起之秀,侧重AI处理解决方案及算力服务,寻求差异化竞争[8] * **技术发展趋势** * 端侧与云端协同推理是AI手机的重要技术路径,但面临延迟、资源占用等挑战[16][25][26] * 模拟点击、RPA、浏览器自动化等技术是解决跨应用操作和第三方调用限制的关键方向[20][21][22]
3.4万亿,张一鸣的版图还在扩张
新浪财经· 2025-12-01 07:22
字节跳动股权交易与估值 - 今日资本徐新以约3亿美元成功竞得字节跳动老股,较原定约2亿美元价格溢价超30% [1][14][15][17] - 该交易将字节跳动估值推高至4800亿美元(约3.4万亿元),使其超越SpaceX成为全球第二大非上市企业 [2][15] - 此次交易是字节跳动今年最大的二级市场交易之一,反映出资本市场对公司扩张版图的强烈认可 [16][18][21] 抖音电商业务表现 - 抖音电商2024年前10个月GMV增速超30%,全年GMV将突破4万亿元,逼近拼多多水平 [4][6] - 2024年抖音电商以3.5万亿元成交额超越京东,首次跻身行业前三 [6] - 抖音电商收入结构多元化,2024年货架场景GMV占比超40%,店播GMV占比略超30%,达人直播贡献约30% [8] - 在达人直播中,百万粉丝以上头部达人GMV贡献仅占大盘约9%,中小达人贡献约21% [8] 电商行业竞争格局 - 高盛预测到2025年抖音电商市场份额将达24%,京东降至16%,淘天和拼多多分别占31%和19% [6] - 2017年淘天与京东合计市占率达93%,2025年这一数字腰斩至50%,显示行业格局剧烈变化 [6] - 抖音电商2020年成立一级部门时GMV达5000亿元,2021年逼近万亿元,呈现爆发式增长 [6] 字节跳动AI业务布局 - 公司2024年AI领域资本开支达800亿元,2025年预计翻倍至1500亿-1600亿元,其中900亿元用于算力卡采购,700亿元投向数据中心建设 [10] - 豆包大模型截至2025年5月底日均调用量达16.4万亿tokens,为发布初期的130多倍,在全球AI应用榜跻身前四 [10] - 火山引擎2024年在中国公有云大模型调用量市场份额达46.4%,超过百度与阿里之和 [11] AI行业竞争动态 - 阿里系AI产品千问和灵光于2025年11月上线,迅速进入App Store中国区免费榜前六,打破字节此前前五全包格局 [11] - 千问公测首周下载量突破1000万,增速超过ChatGPT、Sora等国际产品及DeepSeek等国内同行 [11] - 阿里宣布三年内计划投入3800亿元押注AI,其AI消息推动港股盘中股价大涨超6% [11] 公司整体财务与运营 - 字节跳动2025年二季度营收达480亿美元,同比增长25%,超越Meta成为全球营收最高的社交公司 [20] - 以2024年1600亿美元营收计算,4800亿美元估值对应静态市销率仅3倍,低于AI独角兽动辄几十倍溢价水平 [20] - 公司业务多元化,抖音电商GMV突破4万亿,本地生活服务快速渗透,TikTok贡献25%营收,豆包AI用户达1.6亿 [20]
高盛点评“中国AI大厂之战”:阿里 vs 腾讯 vs 字节
华尔街见闻· 2025-11-29 13:26
文章核心观点 - 中国AI行业竞争焦点已从模型参数转向资本效率、基础设施与流量入口的路线之争 [1] - 阿里巴巴、字节跳动、腾讯三大巨头采取截然不同的AI发展战略 [4] - 中美AI技术竞争呈现“动态追赶”格局,中国模型通常在美方突破后3-6个月内快速跟进 [17] - 中国AI板块当前估值并未出现泡沫,腾讯和阿里巴巴的预期市盈率低于部分美国科技巨头 [18] 阿里巴巴:对标谷歌的“全栈式”重资产豪赌 - 采取类似谷歌的“全栈式”打法,通过垂直整合构建“基础模型+多模态能力” [2] - 9月季度资本开支同比暴增80%至320亿人民币,坚定执行AI基础设施扩张计划 [2] - 阿里云外部收入在9月季度同比增长29%,AI相关收入连续第9个季度实现三位数增长 [3] - 高盛预测阿里云收入增速将在12月季度进一步加速至38% [3] - 最新发布的“通义App”首周下载量突破1000万 [5] 字节跳动:凭借流量优势的应用层突围 - 打法带有鲜明“流量基因”,通过C端应用统治力反哺底层基建 [7] - 日均Token使用量突破30万亿,逼近谷歌的43万亿,远超百度与DeepSeek的10万亿量级 [7] - “豆包”稳居国内AI应用活跃度榜首,海外教育应用Gauth月流水同比增长394% [8] - 旗下火山引擎在“大模型公有云市场份额”中已占据49.2%的份额 [11] - 通过应用层创造的巨大推理需求,在MaaS领域对传统云巨头完成侧翼包抄 [10] 腾讯:克制的“生态渗透”策略 - 保持一贯克制,资本开支同季度同比下降并下调全年预算目标 [13] - 策略核心是将AI能力无缝“缝合”进庞大的微信生态,缺乏性感的资本开支数字但落地确定性高 [14] - 已将AI助手“元宝”整合进微信支付,通过AI文案工具和菜单识别功能服务中小商家 [14] 中美AI技术动态与行业观察 - 美国基础模型通过Gemini 3 Pro等发布再次证明性能边界突破能力,打破“技术停滞”担忧 [16] - 中国AI模型在美国版本跃升后3-6个月内迅速跟进,形成“领跑-追赶-再领跑”的竞争新常态 [17] - 中国厂商韧性源于“中国速度”与开源生态,80%的AI初创公司使用大厂开源模型 [17] - 中国模型在成本控制上极具侵略性,如快手“可灵”视频模型以显著低于全球同类产品的价格构建性价比护城河 [17]
高盛点评“中国AI大厂之战”:阿里 vs 腾讯 vs 字节
美股IPO· 2025-11-29 11:00
中国互联网巨头AI战略对比 - 阿里巴巴采取对标谷歌的“全栈式”重资产策略,9月季度资本开支同比暴增80%至320亿人民币,试图通过“基础模型+多模态能力”垂直整合构建壁垒[6] - 腾讯保持克制策略,资本开支同比下降并下调全年预算,专注于将AI能力无缝嵌入微信等现有生态,例如将AI助手“元宝”整合进微信支付[15][16][17] - 字节跳动通过C端应用流量反哺底层基建,其AI应用“豆包”日均Token使用量突破30万亿,已逼近谷歌的43万亿水平,并通过火山引擎在大模型公有云市场占据49.2%份额[10][13][14] 各公司业务表现与预测 - 阿里云外部收入在9月季度同比增长29%,AI相关收入连续9个季度三位数增长,预计12月季度增速将加速至38%[7];其通义App首周下载量突破1000万,灵光App6天内获200万下载[8] - 字节跳动旗下教育应用Gauth月流水同比增长394%,豆包MAU达1.57亿,火山引擎在AI云服务市场占比14.8%[5][11] - 腾讯混元图像3.0在全球文生图排名第一,其AI原生应用腾讯元宝MAU为3300万;高盛预测阿里云2026财年收入达1563.88亿人民币(增长33%),腾讯云为547.46亿人民币(增长30%)[5][17] 中美AI技术竞争格局 - 美国模型如谷歌Gemini 3 Pro近期实现性能突破,打破“AI技术停滞”担忧,中国模型通常在3-6个月内快速迭代追赶,形成“领跑-追赶-再领跑”的动态竞争常态[4][18][19] - 中国厂商依托“中国速度”与开源生态,80%AI初创公司使用开源模型,并通过极致性价比(如快手可灵模型)在应用层构建护城河[19] - 中国AI板块估值未出现泡沫,腾讯和阿里巴巴2026年预期市盈率分别为21倍和23倍,低于谷歌(24倍)及亚马逊、微软(28-30倍)[20]
杨震原:2021 年字节团队曾训出大语言模型,但当时 “没眼光”
36氪· 2025-11-25 11:26
公司技术发展历程 - 2014年公司创始人提出使用大规模机器学习系统搭建推荐系统,以解决图片、文字、视频等多种媒体形式的推荐问题,并设定了万亿级别特征规模的激进目标[1][5] - 公司早期在优化算法上进行了多路径探索,包括CDN优化器项目和SGD-FTRL项目,最终SGD-FTRL方案在几个月内成功上线,实现了稀疏化万亿特征的目标[8] - 2014年底公司引入FM类算法,并演化为更通用的深度学习体系,从上线第一天起就是一个流式训练系统[9] 科学计算领域探索 - 2020年左右公司开始探索AI在科学计算领域的应用,认为通过求解薛定谔方程可以模拟世界绝大部分现象,并利用模拟产生有价值数据驱动机器学习进步[10] - 公司在神经网络量子蒙特卡洛方法领域进行投入,2021年后的多项工作已达到业界前沿,其中LAVA项目显示出该问题与大模型一样存在Scaling Law[16] - 公司提出首个能适用于固体体系的NNQMC方法DeepSolid,并用于研究拓扑绝缘体等材料,发现MoTe2二维材料在特定条件下会变为拓扑绝缘体[17] - 在分子动力学领域,公司开发了GPU4PySCF实现GPU加速DFT计算,达到1GPU≈500~1000CPU core的加速效果,算力成本降低1个数量级[20][21] - 公司开发了Bamboo-MLFF和ByteFF两类分子动力学力场,其中ByteFF-Pol在无实验数据zeroshot预测电解液性质上实现业界SOTA精度[21] - 公司与比亚迪成立联合实验室,将高通量自动化实验与科学计算算法结合,探索AI for Science在电池材料领域的工业落地应用[21] XR技术研发进展 - 2021年字节跳动收购Pico团队,最初有两条产品路线并行推进,2023年决定减少内容和营销投入,更坚定地投入技术路线[22] - 在清晰度方面,公司2022年启动MicroOLED定制,目标达到近4000PPI,最终成品平均PPD40,中心区域超过45,达到行业领先水平[24][26][29] - 公司为解决MR技术挑战,2022年6月立项全链路自研头显专用芯片,2024年回片并进入量产阶段,系统延迟可做到12毫秒左右[30][31] - 公司建设了专业的高精度测试系统用于环境识别和交互校准,并开发了专门的3D重建机制与高精度手势数据采集系统[33] - 新的MR产品计划于2026年发布[33] 大模型技术布局 - 公司在2021年曾有机会早期关注大语言模型,但当时评估认为LLM暂无实用价值,2022年ChatGPT发布后公司快速调整并加大投入[1][34] - 目前豆包是中国最流行的AI对话助手,火山引擎的大模型服务根据IDC报告是中国MaaS市场第一名[2][34] - 公司在Infra方面具备积累,大规模稳定训练系统MegaScale在训练任务上MFU超过55%,是当时主流开源框架的1.3倍以上[34] - 公司在模型结构、自研服务器上有很多探索,实现了大模型的低调用成本,能够打破业界价格下限同时保证不错毛利[35] - 公司的GenMedia模型、VLM、语音模型表现良好,长期属于国际一流水平,还在进行Seed Edge等前沿探索[35]
从推荐算法优化到AI4S、Pico和大模型,杨震原长文揭秘字节跳动的技术探索
机器之心· 2025-11-25 09:37
公司技术发展历程 - 2014年公司开始构建大规模机器学习推荐系统,第一版即计划做到万亿级别特征规模 [7] - 2020年左右公司开始探索AI在科学计算领域的应用,认为求解薛定谔方程可模拟世界绝大部分现象 [13] - 2021年公司收购Pico团队进入XR领域,初期有两条产品路线,2023年决定更坚定投入基础技术研发 [27] - 2022年公司开始在大模型方向投入,火山引擎大模型服务已成为中国MaaS市场第一名 [39] 推荐系统技术突破 - 2014年工业界主流大规模机器学习系统用于搜索广告,公司将其原理应用于推荐系统面临工程与算法挑战 [7] - 公司优化器准备两套方案,SGD-FTRL项目数月上线成功实现稀疏化万亿特征目标,框架灵活 [10] - 2014年底公司引入FM类算法并演化成更通用的深度学习体系,上线第一天即为流式训练系统 [11] 科学计算AI应用 - 公司从2020年开始持续投入AI for Science,在神经网络量子蒙特卡洛方法领域已做到业界前沿 [16][19] - 公司发现科学计算问题与大模型一样存在Scaling Law,使用更多参数可提升仿真精度 [19] - 在分子动力学领域,公司开发GPU4PySCF实现GPU加速DFT计算业界SOTA,1GPU算力相当于500-1000CPU核心 [24] - 公司开发的Bamboo-MLFF和ByteFF力场模型在无实验数据zeroshot预测电解液性质上实现业界SOTA精度 [24] - 公司与比亚迪成立联合实验室,将高通量自动化实验与科学计算算法结合,探索AI在电池材料领域工业应用 [25] XR技术研发进展 - 公司为解决XR设备清晰度问题,2022年启动MicroOLED定制,目标达到近4000 PPI,约为iPhone 17 ProMax的九倍 [29][32] - 通过导入微透镜提升亮度并结合光学设计优化,最终成品平均PPD达40,中心区域超过45,处于行业领先水平 [33] - 为应对MR技术挑战,公司自研头显专用消费电子芯片,2024年回片并进入量产,系统延迟可做到12毫秒左右 [34][35] - 公司建设了专业高精度测试系统、3D重建机制与高精度手势数据采集系统,以提升交互体验 [36] - 预计2026年将有新产品发布 [36] 大模型战略与成果 - 火山引擎大模型服务根据IDC报告是中国MaaS市场第一名 [39] - 公司在Infra方面积累深厚,大规模训练系统MegaScale的MFU超过55%,是当时主流开源框架1.3倍以上 [39] - 通过模型结构、自研服务器等探索实现大模型低调用成本,在保证不错毛利前提下打破业界价格下限 [40] - GenMedia模型、VLM、语音模型表现长期处于国际一流水平 [40] - 公司对未来大模型发展提出思考,关注模型持续学习能力、与世界的交互能力等基础问题 [43]
140亿“风投女王”,豪掷3亿美元弥补遗憾
36氪· 2025-11-25 00:06
交易概述 - 今日资本以3亿美元价格购入原价约2亿美元的字节跳动股份,交易使字节跳动估值推升至4800亿美元[1][2] - 该交易为字节跳动今年最大的二级市场交易之一,竞标过程迅速,有多达七家竞标者参与[2] - 今日资本创始人徐新早年曾因张一鸣70亿美元的要价而错过投资字节跳动的机会[1][3] 字节跳动估值与行业地位 - 字节跳动当前4800亿美元的估值在全球初创企业中排名第二,仅次于估值5000亿美元的OpenAI,超过SpaceX的约4000亿美元估值[4][5] - 公司估值提升的基石在于持续强劲的业务增长和在AI技术领域的创新突破[1][5] 字节跳动AI战略与投入 - 公司2024年在AI上的资本开支高达800亿元,接近百度、阿里巴巴和腾讯三巨头的总和(约1000亿元)[6] - 2025年AI投入预计翻倍至1500-1600亿元,其中900亿元用于AI算力卡采购,700亿元投向数据中心基础设施建设[7] - 自有云服务火山引擎在中国公有云大模型调用量的市场份额高达46.4%,超过百度与阿里之和[7] - 豆包大模型日均调用量已飙升至16.4万亿tokens,是发布初期的130多倍,在全球AI应用产品榜上高居第四[7] 创始人动态与公司前景 - 创始人张一鸣在2025年胡润百富榜上身家同比上涨34%至4700亿元,位列榜单第二[1][3] - 张一鸣近期罕见公开亮相,大谈AI创新人才培养,并每月参加一次Seed核心技术团队的复盘会,显示出对AI业务的高度关注[5] 今日资本与徐新背景 - 今日资本目前独立管理着30亿美元的基金,投资动态超过60条,投资版图包括美团、三只松鼠、蔚来、知乎、BOSS直聘、月之暗面等明星企业[11] - 徐新拥有辉煌的投资战绩,早期投资网易获得800%收益,投资京东获得超过150倍的账面回报[10][11]