Seedance 1.0 Pro

搜索文档
破局者字节,全栈AI狂飙
21世纪经济报道· 2025-08-29 07:34
文章核心观点 - 字节跳动通过全栈AI布局实现纵向成本与体验的飞轮效应和横向C端超级App与B端企业服务的双轮驱动 构建开放生态 坚定长期投入追求智能上限并服务产业应用 [1] 全栈AI布局 - 公司持续加大AI基础技术研发投入 基于互联网海量数据建设海内外算力中心 自研DPU的GPU实例较上一代集群性能最高提升三倍以上 [3] - 2025年计划在AI基础设施投入超120亿美元(约855.78亿元人民币) 2024年资本开支800亿元 2025年预计翻倍至1600亿元 主要用于自建算力中心与DPU芯片研发 [3] - 最新开源Seed-OSS-36B模型采用Apache-2.0许可证 支持原生512K上下文长度 引入可控思维预算机制提升推理效率 在AIME24达91.7分 AIME25达84.7分 [3] - 多模态技术Waver 1.0基于修正流Transformer架构 支持文本到视频 图像到视频和文本到图像生成无需切换模型 统一架构实现多模态生成无缝切换重构内容创作流程 [3][4] - OmniHuman-1.5通过全方位条件训练颠覆静态图像转动态视频传统认知 仅需一张人物照片和一段音频即可生成说话 唱歌 做手势和表达情绪的视频 [6] 产品矩阵与市场表现 - ToC端AI应用布局全面 Chatbot豆包或为国内最大的AI Native应用 覆盖Chatbot 教育 图像视频 情感陪伴等垂类 海外国内产品基本一一对照 同时布局APP端和Web端 [6] - 豆包拥有超1.1亿用户 同比增长864.35% 位列榜单第二 豆包家族包含通用Pro/Lite 角色扮演 语音合成/识别 文生图 视频生成等十余款细分模型 [6] - 视频生成产品线Seedance 1.0 Pro在全球文生视频 图生视频双榜领先 5秒1080P视频生成成本仅3.67元 Waver 1.0支持长达10秒高质量视频生成 兼容多种艺术风格 [7] - 企业级市场HiAgent 2.0与豆包企业版双轮驱动 HiAgent 2.0采用调度对话行动三位一体架构 支持流程图/自然语言/API三种任务编排方式 内置100+行业模板库 [7] - 推出AI硬件产品包括AI耳机Ola Friend等AIoT产品 截至6月11日接入豆包的AIoT产品出货量超100万台 预计2025年年底有望突破1000万台 [7] 行业应用与渗透 - 豆包大模型服务全球TOP10手机厂商中的9家 八成主流汽车品牌 70%的系统重要性银行及超五成985高校 [8] - 截至2025年5月底 豆包大模型日均Tokens使用量超过16.4万亿 较去年5月刚发布时增长137倍 [8] - IDC报告显示2024年火山引擎在中国公有云大模型服务调用量上稳居第一 市场份额46.4% [8] 差异化竞争策略 - SuperCLUE 2025年5月测评显示字节豆包1.5深度思考模型与商汤日日新V6并列国内第一 [10] - 首创按输入长度区间定价 0~32K段输入0.8元/百万Tokens 综合成本仅为竞品的1/3 推动大模型进入厘时代 [10] - 火山引擎差异化优势体现在规模优势与AI原生能力 抖音 头条等内部业务运行使其成为中国计算规模最大的云厂商之一 通过规模化降低成本提供高性价比多云服务 [10][11] - 豆包大模型发展迅速 C端用户可直接体验形成B端与C端的协同 [11] 生态建设与未来趋势 - 火山引擎定位不只做自有模型而是打造模型超市 汇聚智谱 MiniMax 百川等第三方大模型 提供精调 评测 推理全托管服务 [13] - 成立手机 汽车等行业联盟 与头部企业合作 与金蝶 汉得等行业伙伴集成模型能力拓展垂直领域 [11] - 孵化AI原生企业服务初创公司 通过孵化器提供代金券和技术支持 助力成长推动中国AI企业服务弯道超车 [11] - 技术融合更加深入 多模态技术打破传统内容生成边界 AI与VR/AR结合可能成为下一个突破点 [13] - 人机交互方式发生变革 探索更便携更自然的交互方式 未来可能出现更多创新交互设备 [13] - 智能体中台技术成熟与行业模板库完善 企业级AI Agent将从单点效率提升转向全链路智能重构 推动中国企业数字化转型进入AI原生新阶段 [13]
破局者字节,全栈AI狂飙
21世纪经济报道· 2025-08-28 12:54
公司AI战略布局 - 公司完成从底层硬件到上层应用的全栈AI布局 形成成本与体验的飞轮效应 [1] - 以C端超级App流量与B端企业服务双轮驱动 构建强大开放生态 [1] - 坚定长期投入 追求智能上限 服务产业应用 [1][9] 算力基础设施投入 - 2025年计划在AI基础设施投入超120亿美元(约855.78亿元人民币) [2] - 2024年资本开支800亿元 2025年预计翻倍至1600亿元 主要用于自建算力中心与DPU芯片研发 [2] - 自研DPU的GPU实例较上一代集群性能最高提升三倍以上 [2] 模型技术突破 - Seed-OSS-36B模型支持原生512K上下文长度 引入可控思维预算机制 [2] - 在AIME24达91.7分 AIME25达84.7分 [2] - Waver 1.0基于修正流Transformer架构 支持文本到视频等多模态生成 [2] - OmniHuman-1.5通过全方位条件训练实现静态图像转动态视频 [3] C端产品表现 - 豆包拥有超1.1亿用户 同比增长864.35% 位列国内AI应用第二 [4] - 豆包家族包含通用Pro/Lite 角色扮演 语音合成等十余款细分模型 [4] - Seedance 1.0 Pro文生视频成本仅3.67元/5秒1080P视频 [4] - Waver 1.0支持10秒高质量视频生成 运动连贯性超越现有模型 [4] B端企业服务 - HiAgent 2.0采用调度对话行动三位一体架构 支持三种任务编排方式 [5] - 内置100+行业模板库 [5] - 豆包大模型服务全球TOP10手机厂商中的9家 80%主流汽车品牌 [6] - 服务70%系统重要性银行及超50%的985高校 [6] 硬件生态建设 - 接入豆包的AIoT产品出货量超100万台 预计2025年底突破1000万台 [6] - 推出AI耳机Ola Friend等AIoT产品 [6] - 硬件产品与软件生态互补 构建完整AI体验 [6] 市场竞争力 - 豆包1.5深度思考模型与商汤日日新V6并列国内第一 超越谷歌Gemini 2.5 Flash [7] - 首创按输入长度区间定价 0-32K段输入0.8元/百万Tokens [7] - 综合成本仅为竞品1/3 推动大模型进入厘时代 [7] 云服务优势 - 火山引擎在中国公有云大模型服务调用量市场份额46.4% 稳居第一 [6] - 成为中国计算规模最大的云厂商之一 通过规模化降低成本 [8] - 豆包大模型日均Tokens使用量超16.4万亿 较发布时增长137倍 [6] 生态合作策略 - 成立手机 汽车等行业联盟 与头部企业合作 [8] - 与金蝶 汉得等行业伙伴集成模型能力 拓展垂直领域 [8] - 孵化AI原生企业服务初创公司 提供代金券和技术支持 [8] 技术发展趋势 - 多模态技术打破内容生成边界 音频文本图像视频转换更流畅 [10] - 火山引擎打造模型超市 汇聚智谱 MiniMax等第三方大模型 [10] - 探索新的人机交互方式 产品向更便携自然方向发展 [10] - 企业级AI Agent从单点效率提升转向全链路智能重构 [10]
摩根士丹利:快手科技_人工智能视频生成热度攀升,Sedance 1.0 Pro 强劲首发为下一个驱动力
摩根· 2025-06-23 02:09
报告行业投资评级 - 快手科技股票评级为“Equal - weight”(等权重),行业观点为“Attractive”(有吸引力),目标价为60.00港元,较目标价的涨跌幅度为1% [6] 报告的核心观点 - 近期两款新模型发布改变了AI视频生成领域的竞争格局,字节跳动发布的Seedance 1.0 pro在文本到视频和图像到视频的人工分析排行榜上均排名第一,超越谷歌、快手和OpenAI的相关模型,且价格比同类产品低60 - 70%,生成速度相对较快;MiniMax发布的Hailuo 02在图像到视频排行榜上排名第二 [2] - 这证实了市场长期以来认为字节跳动将成为AI视频生成领域重要参与者的观点,新模型发布将加剧竞争,但目前难以判断谁是长期赢家 [3] - 建议关注快手Kling 2.2版本在技术性能和定价方面的未来迭代,Kling年初至今的强劲财务表现是快手股价的关键驱动因素,但在AI视频生成竞争稳定前,不宜对Kling估值给予过高评价,维持对快手的等权重评级 [3] 根据相关目录分别进行总结 新模型发布情况 - 6月11日,字节跳动在火山引擎动力大会上发布AI视频生成模型Seedance 1.0 pro,能生成1080P高清视频,多相机无缝切换,定价为每5秒视频3.67元,约40秒可生成5秒视频 [2] - 6月16日,MiniMax发布AI视频生成模型Hailuo 02 [2] 排行榜排名 - 文本到视频排行榜:Seedance 1.0排名第一,Arena ELO为1295;谷歌Veo 3 Preview (No Audio)排名第二,Arena ELO为1248;谷歌Veo 2排名第三,Arena ELO为1131;快手Kling 2.0排名第四,Arena ELO为1110;OpenAI Sora排名第五,Arena ELO为1047 [8] - 图像到视频排行榜:Seedance 1.0排名第一,Arena ELO为1351;MiniMax Hailuo 02 (0616)排名第二,Arena ELO为1331;谷歌Veo 3 Preview (No Audio)排名第三,Arena ELO为1241;快手Kling 2.0排名第四,Arena ELO为1194 [9] 快手科技财务数据 - 截至2025年6月17日收盘价为59.40港元,52周范围为68.90 - 37.55港元,稀释后流通股数为4354百万股,当前市值为2367.20亿元人民币,企业价值为2141.59亿元人民币,日均交易额为22.31亿港元 [6] - 预计2024 - 2027财年每股收益分别为4.02元、4.54元、5.00元、5.45元,净收入分别为1270亿元、1420亿元、1540亿元、1650亿元,EBITDA分别为200亿元、270亿元、320亿元、370亿元 [6] 估值方法 - 采用贴现现金流模型,关键假设包括12%的加权平均资本成本和2%的永续增长率,对Kling的估值采用全球顶级软件公司的25倍EV/S [10] 行业内其他公司评级 - 互联网及其他服务行业内,Autohome Inc等部分公司有不同的评级,如Autohome Inc评级为E(等权重),Full Truck Alliance Co. Ltd评级为O(超配)等 [67]
互联网软件与服务行业AI产业跟踪:2025火山引擎春季FORCE原动力大会:大模型与智能硬件共筑AI生态
东吴证券国际· 2025-06-17 14:26
报告行业投资评级 未提及 报告的核心观点 - 2025年作为中国Agent应用元年,生成式AI正向具备自主决策能力的Agentic AI跃迁,豆包大模型1.6系列升级推动Agentic AI加速落地,Seedance 1.0 Pro登顶全球文生视频和图生视频榜单,大模型商业化持续领跑 [2][3] - 火山引擎通过“大模型+场景化落地”双轮驱动,形成从开发者生态到垂直行业解决方案的完整闭环,高性价比助力应用加速落地,巩固字节跳动在AIGC领域的技术壁垒与市场份额 [8][18] 根据相关目录分别进行总结 大会成果 - 2025年6月11 - 12日,火山引擎春季FORCE原动力大会在北京举行,发布豆包大模型1.6及视频生成模型Seedance 1.0 Pro,升级Agent开发平台等AI云原生能力,展示AI与IoT技术融合路径,推出开发工具链升级方案及相关解决方案 [6][7] 大模型能力升级 - 豆包大模型1.6全系列原生支持多模态、256K超长上下文及深度思考能力,不同子模型各有强化,综合成本下降63% [6][11] - 推理、多模态和GUI操作能力全面升级,支持“边想边搜”及Deep Research,多模态应用覆盖高价值场景,GUI操作能力推动办公自动化落地 [2][12] 视频生成模型优势 - Seedance 1.0 Pro支持文字与图片输入,生成多镜头无缝切换的1080P高清视频,主体运动稳定性与画面自然度领先,生成效率提升,在文生视频与图生视频领域位列全球第一 [3][16] - 通过多镜头叙事等优化,在电商、影视、游戏等场景商业化突破,定价较竞品降低60% - 80%,通过“技术分层+场景渗透”策略形成规模化落地 [18] 大模型商业化情况 - 豆包大模型日均tokens调用量持续增长,助力火山引擎稳居中国公有云市场第一、市占率达46.4%,AI工具、互动娱乐、信息处理为核心场景,新兴场景表现突出 [8] - 应用端向硬件与垂直行业延伸,消费电子、汽车、金融、高校等领域均有合作 [8]
人工智能产业再迎政策支持!科创板人工智能ETF(588930)开盘走势冲高回落,连续4个交易日获得资金净流入
每日经济新闻· 2025-06-16 02:43
北京市人工智能赋能新型工业化行动方案 - 北京市经济和信息化局印发《北京市人工智能赋能新型工业化行动方案(2025年)》,推动人工智能与工业深度融合,拓展应用场景,助力制造业智能化升级,加速培育新质生产力,提升全要素生产率 [1] A股市场人工智能板块表现 - 6月16日A股市场开盘震荡,大盘蓝筹回调,人工智能题材走强 - 科创板人工智能指数成分股中,优刻得-W、道通科技、福昕软件、亚信安全涨超2%,澜起科技、天准科技、云从科技-UW、安路科技涨超1% [1] - 科创板人工智能ETF(588930)过去5个交易日资金净流入超2600万元,市场热度较高 [1] 科创板人工智能ETF(588930)概况 - 跟踪科创板人工智能指数,布局30只科创板人工智能龙头 - 覆盖AI产业链上游算力芯片、中游大模型云计算、下游机器人等创新应用 - 聚焦电子、计算机、机械设备、家电、通信五大行业 - 前五大成份股合计权重47%,具有较高的AI主题纯度和弹性 [1] 华创证券对AI板块的研判 - AI板块在2025年展现出显著投资价值 - 多模态模型与超级智能体技术不断演进,AI从基础模型研发迈向实际应用场景深化拓展 [2] - 以火山引擎Force原动力大会为例,豆包大模型家族升级推出支持256K长上下文的豆包1.6、文生视频和图生视频任务排名第一的Seedance 1.0 Pro等创新产品,显示AI在内容生成、智能体开发等方面能力大幅提升 [2]
实测豆包1.6,最火玩法all in one!Seedance登顶视频生成榜一,豆包APP全量上线
量子位· 2025-06-12 07:11
豆包大模型1.6系列性能突破 - 豆包大模型1.6系列在推理、数学、多模态能力上进入全球第一梯队[1] - 海淀区高考模拟测试中文理科成绩均突破700分 其中理科较去年提升154分(706分 vs 552分)[2][3] - 主力模型doubao-seed-1.6支持256K上下文 是国内首个支持该长度的思考模型 具备深度思考自适应功能[24] Seedance 1.0 Pro视频模型技术领先 - 文生视频(ELO 1299)和图生视频(ELO 1343)双榜单全球第一 超越Google Veo 3和OpenAI Sora[4][5] - 具备无缝多镜头叙事能力 支持航拍/第一人称/近景等视角切换 生成速度达40秒/5秒视频[38][40][49] - 理解能力突出 可精准还原唐代服饰细节 合理调整人物动作顺序[44][46] 行业定价模式重构 - Seedance 1.0 Pro视频生成成本低至3.67元/5秒 行业最低价[11] - 豆包1.6采用输入长度区间定价 0-32K区间综合成本较1.5版本降低63%[13][14] - 特惠区价格进一步降至0.8元/百万tokens(输入) 与1.0版本持平[16][18] 多模态能力升级 - 新增视频理解功能 可基于视频内容生成朋友圈文案[31] - 具备GUI操作能力 能自主完成酒店预订全流程操作[35][36] - 语音播客模型支持秒级生成双人对话 具备声线模仿等高级功能[51][55] 企业级Agent开发支持 - 推出PromptPilot工具 支持自动优化提示词和badcase修复[61] - 开源veRL强化学习框架 支持LLM基础设施与模块化API集成[63] - AgentKit工具链实现全栈开发支持 可自动化生成研究报告和网站[68][66] 市场表现与行业地位 - 豆包大模型日均tokens使用量达16.4万亿 较发布初期增长137倍[73] - 火山引擎占据中国公有云大模型46.4%市场份额 调用量达114.2万亿tokens[74] - 已服务联想、宝马、奔驰等头部企业 大模型业务成增速最快板块[75][76]
从高考到实战,豆包大模型交卷了
机器之心· 2025-06-12 06:08
豆包大模型1.6升级 - 豆包大模型1.6包含标准版、深度思考强化版和极速版三个主要版本[3] - 性能达到世界前沿水平,是国内首个支持256K上下文的思考模型系列,具备多模态理解和GUI操作能力[4] - 在高考数学测试中,豆包1.6从能读重本升级到能上清北的水平[4] - 编程任务测试中,豆包1.6一次性完成贪吃蛇游戏代码编写且无需修改[15] - 在五位数字密码推理问题中,豆包1.6是国内首个能通过非编程式推理解决该问题的模型[19][22] Seedance 1.0 Pro视频生成模型 - Seedance 1.0 Pro支持无缝多镜头叙事、多动作及随心运镜[6] - 在Artificial Analysis视频竞技场中表现超过Veo3和可灵2.0[6] - 测试显示该模型在动态一致性、细节真实感和镜头语言理解方面表现优异[38][39] AI基础设施与工具 - 火山引擎推出三大AI基础设施套件:AgentKit、TrainingKit和ServingKit[8][65] - veRL强化学习框架已支持DeepSeek 671B和Qwen3 235B等大型MoE模型,GitHub star量超过9300[62][63] - 构建多模态数据湖,为企业提供AI原生数据基建[64] - 推出Prompt Pilot服务,可自动分析和优化提示词[58] 技术发展主线 - 第一条主线是"推理+视觉"范式发展,将推理能力扩展到视觉理解领域[51] - 第二条主线是视频生成走向实用化,高质量视频生成进入实际生产环境[51] - 第三条主线是多步骤复杂任务处理,即智能体(Agent)概念的发展[52] 市场影响与战略 - Meta宣布148亿美元投资Scale AI事件引发市场关注[30] - 火山引擎强调"AI云原生"概念,重新优化AI工作负载的云端架构[8][71] - 公司计划长期投入,目标是成为客户信赖的云服务平台[72]
字节 AI 卷出新高度:豆包试水“上下文定价”,Trae 覆盖内部80%工程师,战略瞄定三主线
AI前线· 2025-06-11 08:39
字节AI技术发展主线 - 公司认为AI技术发展主线包括多模态推理与思考、视频生成技术突破、多步骤复杂任务处理能力提升[5] - 预计2025年视频生成技术将进入实际生产环节 如消费领域和电商广告短片制作[5] - 多步骤复杂任务处理能力预计在2024年Q4达到可用水平 简单任务准确率可达80%-90%[5] 豆包大模型1.6升级 - 发布三个版本模型 均支持256K超长上下文和多模态输入[3] - 在高考数学测试中取得144分 海淀模拟考试理科706分 文科712分[3] - 支持自动操作浏览器完成酒店预定 识别购物小票并整理Excel等真实世界任务[3] - 综合成本仅为豆包1.5深度思考模型或DeepSeek R1的三分之一[8] 模型定价策略 - 1-32K上下文长度定价:输入0.8元/百万tokens 输出8元/百万tokens[9] - 32-128K上下文长度定价:输入1.2元/百万tokens 输出16元/百万tokens[9] - 128-256K上下文长度定价:输入2.4元/百万tokens 输出24元/百万tokens[9] 视频生成模型Seedance 1.0 Pro - 具备无缝多镜头叙事 多动作运镜 稳定运动与真实美感三大特点[18] - 生成5秒1080P视频仅需3.67元 价格具有竞争力[18] - 1万元预算可生成2700条1080P视频 或9700多条780P视频[20] Trae开发工具进展 - 内部超过80%工程师使用 月活用户超100万[14] - 采用自然语言编程方式 AI生成85%代码 开发者仅需优化不到5%[16] - 支持100+MCP Servers 支持代码重构 批量修改和交互式问答等复杂任务[16] 行业技术趋势 - 强化学习算力消耗快速攀升 预计2027年投入可能接近预训练规模[25] - 企业加速改造基础设施和云计算体系以适应AI发展需求[23] - 提示词工程正向价值随模型能力提升而增大 最终将由自动化系统解决[25] 商业化应用实践 - 与网易《逆水寒》合作测试玩家创作角色故事视频生成[22] - 豆包实时语音模型全量上线方舟平台 推出支持自然对话的播客模型[22] - 自建算力占比达30% 结合公有云资源平衡成本[11]