Workflow
破局者字节,全栈AI狂飙
21世纪经济报道·2025-08-29 07:34

文章核心观点 - 字节跳动通过全栈AI布局实现纵向成本与体验的飞轮效应和横向C端超级App与B端企业服务的双轮驱动 构建开放生态 坚定长期投入追求智能上限并服务产业应用 [1] 全栈AI布局 - 公司持续加大AI基础技术研发投入 基于互联网海量数据建设海内外算力中心 自研DPU的GPU实例较上一代集群性能最高提升三倍以上 [3] - 2025年计划在AI基础设施投入超120亿美元(约855.78亿元人民币) 2024年资本开支800亿元 2025年预计翻倍至1600亿元 主要用于自建算力中心与DPU芯片研发 [3] - 最新开源Seed-OSS-36B模型采用Apache-2.0许可证 支持原生512K上下文长度 引入可控思维预算机制提升推理效率 在AIME24达91.7分 AIME25达84.7分 [3] - 多模态技术Waver 1.0基于修正流Transformer架构 支持文本到视频 图像到视频和文本到图像生成无需切换模型 统一架构实现多模态生成无缝切换重构内容创作流程 [3][4] - OmniHuman-1.5通过全方位条件训练颠覆静态图像转动态视频传统认知 仅需一张人物照片和一段音频即可生成说话 唱歌 做手势和表达情绪的视频 [6] 产品矩阵与市场表现 - ToC端AI应用布局全面 Chatbot豆包或为国内最大的AI Native应用 覆盖Chatbot 教育 图像视频 情感陪伴等垂类 海外国内产品基本一一对照 同时布局APP端和Web端 [6] - 豆包拥有超1.1亿用户 同比增长864.35% 位列榜单第二 豆包家族包含通用Pro/Lite 角色扮演 语音合成/识别 文生图 视频生成等十余款细分模型 [6] - 视频生成产品线Seedance 1.0 Pro在全球文生视频 图生视频双榜领先 5秒1080P视频生成成本仅3.67元 Waver 1.0支持长达10秒高质量视频生成 兼容多种艺术风格 [7] - 企业级市场HiAgent 2.0与豆包企业版双轮驱动 HiAgent 2.0采用调度对话行动三位一体架构 支持流程图/自然语言/API三种任务编排方式 内置100+行业模板库 [7] - 推出AI硬件产品包括AI耳机Ola Friend等AIoT产品 截至6月11日接入豆包的AIoT产品出货量超100万台 预计2025年年底有望突破1000万台 [7] 行业应用与渗透 - 豆包大模型服务全球TOP10手机厂商中的9家 八成主流汽车品牌 70%的系统重要性银行及超五成985高校 [8] - 截至2025年5月底 豆包大模型日均Tokens使用量超过16.4万亿 较去年5月刚发布时增长137倍 [8] - IDC报告显示2024年火山引擎在中国公有云大模型服务调用量上稳居第一 市场份额46.4% [8] 差异化竞争策略 - SuperCLUE 2025年5月测评显示字节豆包1.5深度思考模型与商汤日日新V6并列国内第一 [10] - 首创按输入长度区间定价 0~32K段输入0.8元/百万Tokens 综合成本仅为竞品的1/3 推动大模型进入厘时代 [10] - 火山引擎差异化优势体现在规模优势与AI原生能力 抖音 头条等内部业务运行使其成为中国计算规模最大的云厂商之一 通过规模化降低成本提供高性价比多云服务 [10][11] - 豆包大模型发展迅速 C端用户可直接体验形成B端与C端的协同 [11] 生态建设与未来趋势 - 火山引擎定位不只做自有模型而是打造模型超市 汇聚智谱 MiniMax 百川等第三方大模型 提供精调 评测 推理全托管服务 [13] - 成立手机 汽车等行业联盟 与头部企业合作 与金蝶 汉得等行业伙伴集成模型能力拓展垂直领域 [11] - 孵化AI原生企业服务初创公司 通过孵化器提供代金券和技术支持 助力成长推动中国AI企业服务弯道超车 [11] - 技术融合更加深入 多模态技术打破传统内容生成边界 AI与VR/AR结合可能成为下一个突破点 [13] - 人机交互方式发生变革 探索更便携更自然的交互方式 未来可能出现更多创新交互设备 [13] - 智能体中台技术成熟与行业模板库完善 企业级AI Agent将从单点效率提升转向全链路智能重构 推动中国企业数字化转型进入AI原生新阶段 [13]