Seedance 1.5 Pro - 财报，业绩电话会，研报，新闻

Seedance 1.5 Pro

搜索文档

新浪财经· 2025-12-22 07:36

市场表现 - 截至2025年12月22日15:00，中证消费电子主题指数(931494)强势上涨2.74% [1] - 指数成分股环旭电子(601231)上涨10.02%，景旺电子(603228)上涨8.86%，生益科技(600183)上涨8.51%，东山精密(002384)、华工科技(000988)等个股跟涨 [1] - 消费电子ETF(561600)上涨2.62%，最新价报1.18元 [1] 行业驱动因素 - AI大模型进展不断，豆包App视频生成能力升级，支持Seedance1.5 Pro模型，可一键生成声音和画面相匹配的有声视频 [1] - 火山引擎发布的豆包大模型1.8及Seedance 1.5 Pro在多模态Agent场景中实现关键技术突破 [2] - 豆包大模型日均token使用量突破50万亿，服务超百家万亿级企业客户，表明其已实现在高并发、长周期生产环境中的规模化验证 [2] - 该模型聚焦于解决智能体（Agent）落地“最后一公里”问题，系统性增强多工具调用与复杂指令稳定执行能力 [2] - 模型为质量检测、教育培训、安防巡检等高价值场景提供可集成的能力接口，此类任务可靠执行能力更贴近实际投资回报率考量，有望加速AI从概念验证迈向规模化部署 [2] 指数与产品构成 - 消费电子ETF紧密跟踪中证消费电子主题指数 [2] - 中证消费电子主题指数选取50只业务涉及元器件生产、整机品牌设计及生产等消费电子相关的上市公司证券作为指数样本 [2] - 截至2025年11月28日，中证消费电子主题指数前十大权重股分别为立讯精密、寒武纪、工业富联、中芯国际、京东方A、澜起科技、兆易创新、豪威集团、东山精密、亿纬锂能，前十大权重股合计占比56.39% [3] - 消费电子ETF(561600)设有场外联接基金，包括平安中证消费电子主题ETF发起式联接A(015894)、C(015895)、E(024557) [3]

2025-12-21 11:01

行业与公司 * 行业：中国互联网、人工智能、数据中心、云计算、电子商务、在线娱乐、本地服务、货运匹配、在线招聘、房地产经纪、汽车后市场服务等[1][8][11][14][15][19] * 涉及公司：阿里巴巴、腾讯、字节跳动、百度、快手、网易、京东、拼多多、美团、滴滴、满帮集团、贝壳、BOSS直聘、途虎养车等，以及数据中心公司GDS、VNET[1][8][11][14][15][19] 核心观点与论据人工智能发展五大主题 1. **前沿AI模型与智能体能力持续突破**：中美AI模型性能差距缩小至3-6个月[1][8] * 美国模型（如GPT-5.2、Gemini 3）在每次更新中仍保持领先[8] * 中国模型（如小米MiMo-V2-Flash、字节跳动Doubao-Seed-1.8）快速跟进，差距在缩小[8] 2. **AI助手在中国普及，长期可能影响应用流量**：操作系统级AI助手可能改变用户与移动设备的交互方式[1][7][8] * 字节跳动豆包手机助手（与中兴努比亚合作）是集成在操作系统级别的AI助手[8] * 智谱AI开源了AutoGLM，可在50多个高频中国应用中模拟人类操作[8] * 小米超级小爱同学拥有1.2亿月活跃用户，每日使用会话6500万，支持超过3000种技能[8] 3. **AI推理需求/代币使用量持续高速增长**：由To-C和To-B需求共同驱动[1][10] * 字节跳动豆包大模型日处理代币量在2025年12月超过50万亿（10月为30万亿+），位居中国第一、全球第三[10] * 字节跳动火山引擎MaaS服务覆盖了80%的头部快消品牌、90%的主要汽车OEM等客户[10] * 公司预计其2025财年收入将超过200亿元人民币，较去年翻倍[10] 4. **中国多模态模型凭借成本/开源/速度优势进军全球市场**：与全球玩家的能力差距正在缩小[1][10] * 阿里巴巴发布视频生成模型Wan2.6，支持多镜头叙事[10] * 腾讯发布HY WorldPlay 1.5流式视频扩散模型[10] * 字节跳动发布Doubao-Seed-1.8和视频生成模型Seedance 1.5 Pro[10] * 价格检查显示，快手的Kling 2.5 Turbo比谷歌Veo 3/OpenAI Sora 2便宜得多，且性能具有竞争力[10] 5. **国内外芯片供应动态演变**：潜在英伟达H200供应与2026年国内芯片供应增加[1][10] * 美国政府将允许英伟达向中国销售H200芯片，并征收25%的费用[10] * 阿里巴巴和字节跳动已表示有兴趣从英伟达购买H200芯片[10] * H200芯片在内存、带宽、功耗和计算性能上均优于中国特供版H20芯片[10] 投资观点与标的 * **估值**：阿里巴巴和腾讯相对于全球同行估值仍不高[1] * **关键受益标的**： * **中国互联网巨头**：阿里巴巴（全栈AI布局，明年每股收益从低基数复苏）、腾讯（稳定的每股收益增长+关键AI应用代表）[1] * **中国数据中心**：GDS和VNET（基于强劲的订单量、资本支出和AI计算需求）[1] * **子行业偏好排序**： 1. **云/数据中心**：关键标的为阿里巴巴、GDS、VNET[1] 2. **游戏**：关键标的为腾讯、网易[1] 3. **出行**：关键标的为滴滴、满帮集团[1] 4. **电子商务**：关键标的为快手[1] 全球AI视频生成市场总规模预测 * 预计全球AI视频生成模型总市场规模将从2025年的10亿美元增长至2033年的391亿美元，8年复合年增长率为56%[2][23] * **2P（专业用户）市场**：预计从2025年的7亿美元增长至2033年的170亿美元，8年复合年增长率为49%，2033年占总市场规模的43%[6][23] * **2B（企业）市场**：预计从2025年的4亿美元增长至2033年的222亿美元，8年复合年增长率为66%，2033年占总市场规模的57%[6][23] * **中国玩家份额**：在全球基础模型市场中的收入份额预计从2025年的约4%稳步增长至2029年的7%[6] 资本支出与云业务 * **2026年资本支出展望**：预计中国超大规模云厂商资本支出将进一步上升至5000亿元人民币水平，其中国内产能占比更高[11] * 2025年BBAT合计资本支出预计超过4000亿元人民币以上（同比增长62%）[11] * 2026年预计中国超大规模云厂商资本支出同比增长20%，其中国内芯片/计算支出占比将大幅提高（高盛预计：从2025财年的20-30%增至2026财年的40%）[11] * **阿里巴巴与腾讯对比**：阿里巴巴今年资本支出显著高于腾讯，源于其AI基础设施/全栈能力[11] * **云收入增长**：更高的计算效率可能推动AI资本支出向收入转化，在强劲的训练后/推理需求背景下加速云收入增长[11] * **阿里巴巴云业务**：9月季度云收入同比增长34%（内部收入同比增长53%/外部收入同比增长29%），AI收入占外部收入的20%（连续第9个季度三位数增长）[11] 用户参与度趋势（2025年11月） * **总体**：前400款移动应用总使用时长同比增长5%（与10月持平）[11][93] * **AI生成内容/聊天机器人**：国内AIGC应用参与度环比增长5%，由豆包（环比增长14%）和通义千问（环比增长108%）驱动[11] * **电子商务**：使用时长同比增长11%[15] * 京东使用时长同比增长39%，淘宝同比增长12%，拼多多同比增长6%[15] * 商户应用日活跃用户份额：淘宝千牛占35%，拼多多商户版占23%，抖音商户版占21%[15] * **社交**：使用时长同比增长4%，微信使用时长同比增长4%[15] * **视频**：使用时长同比增长8%[15] * 抖音主应用使用时长同比增长19%，极速版同比增长28%[15] * 快手主应用使用时长同比下滑8%，极速版同比下滑8%[15] * 腾讯视频使用时长同比下滑22%，优酷同比下滑28%[15] * **游戏**：使用时长同比增长12%[15] * 《王者荣耀》使用时长同比增长5%[15] * 《和平精英》使用时长同比下滑2%[15] * 网易《逆水寒》手游使用时长同比下滑44%[15] * 《蛋仔派对》使用时长同比增长23%[15] * **本地服务**：使用时长同比增长14%[15] * 美团使用时长同比增长7%[15] * 高德地图使用时长同比增长30%[15] * **货运匹配**：满帮集团司机和货主应用总参与度同比增长17%[14] * **在线招聘**：BOSS直聘月活跃用户同比增长10%，使用时长同比增长4%[19] * **房地产**：贝壳三大主要应用使用时长同比下滑1%[19] * **汽车后市场服务**：途虎养车应用月活跃用户同比增长13%，达1700万[19] 其他重要内容 * **中国To-C AI应用货币化路径**：与美国主要通过订阅收费不同，中国To-C聊天机器人目前大多免费，货币化路径仍在演变，未来可能更多由广告收入驱动[11][13] * **Temu数据**：2025年11月全球月活跃用户为5.2亿，环比持平；美国月活跃用户环比增长4%，占全球月活跃用户的17%[15] * **跨境电商监管压力**：欧盟宣布将从2026年7月1日起对低价值包裹征收3欧元关税[15] * **教育类AI应用**：字节跳动豆包学习（国内）和Gauth（海外）日活跃用户分别同比增长194%和39%，达到250万和310万[19] * **操作系统级AI助手的潜在挑战**：可能面临“围墙花园”生态系统或安全问题的挑战[9] * **对字节跳动的关注**：需警惕其利用AI/智能体功能在社交、音乐、交易、即时通讯等垂直领域持续扩张带来的竞争威胁[9]

Artificial Intelligence

Artificial Intelligence

证券时报网· 2025-12-19 09:39

字节跳动AI视频生成模型升级 - 字节跳动旗下豆包App的视频生成能力升级，支持新一代音视频创作模型Seedance1.5Pro，用户可通过“照片动起来”功能，上传图片并输入提示词，一键生成声音和画面相匹配的有声视频 [1] - 同期，字节跳动旗下即梦AI网页版也全面升级，打造一站式“AI片场”，并全球首发上线基于Seedance1.5Pro的“视频3.5Pro”模型，支持视频与音频同时生成 [3] Seedance1.5Pro模型核心能力 - 该模型依托原生音视频联合架构与精细化后训练，实现了对多模态指令的较好遵循，并具备精准的音画同步与较高的视听一致性 [1] - 模型支持多种语言和地方方言口音，能够捕捉其独有的语音韵律与情感张力 [1] - 模型具备电影级运镜控制与动态张力，拥有自发的镜头调度能力，能实现电影级的画面衔接与专业影调，大幅提升视频动态张力 [1] - 模型的语义理解与叙事协调性增强，能实现对叙事语境的精准解析，显著提升音视频段落的整体叙事协调性，为专业级内容创作提供支撑 [1] - 模型在遵循复杂指令方面表现优异，能精准响应运镜调度、动作幅度及光影氛围等要求，并对中文发音口型、面部微表情乃至多种方言生成提供更强支持 [3] 模型应用场景与优势 - Seedance1.5Pro模型对视听协同、动态调度和文化语境的精准掌握，使其在影视创作、短剧生成、广告生产及戏曲演绎等场景中，均展现出较好的叙事表现力与视听融合度 [1] - “视频3.5Pro”模型支持视频与音频同时生成，人物口型、乐器演奏、环境音效等元素无需后期配音，大幅提升了视频的真实感与沉浸感 [3] 产品迭代与历史背景 - 2025年6月，字节跳动视频生成模型Seedance1.0Pro正式发布，支持文字与图片输入，可生成多镜头无缝切换的高品质视频，主体运动稳定性与画面自然度较高 [2] - 即梦AI网页版本次升级还涵盖了全新UI，升级了画布、agent等功能的交互方式，旨在将复杂的AI创作工具整合为直观、高效的一站式“AI片场” [4]

豆包 1.8 多模态超越谷歌Gemini 3！字节祭出“推理代工”，要做模型届的英特尔？

AI前线· 2025-12-18 07:24

豆包大模型1.8核心性能与能力 - 火山引擎正式推出新一代豆包大模型1.8，面向多模态Agent场景深度优化 [2] - 模型上下文窗口达256k，最大输入Token长度为224k，最大输出及思考内容Token长度均为64k [2] - 运行效率高，TPM（每分钟处理Token数）达5000k，RPM（每分钟请求数）为30k [3] - 原生支持智能上下文管理，可配置策略清除低价值历史信息，确保多步骤任务稳定完成 [7] 评测表现与行业地位 - 在AIME 2025等Agent评测集上稳步提升，在通用智能体测评Benchmark上取得全球领先成绩 [3] - 多模态理解方面，在视觉判断准确性、空间理解、文档解析、视频运动识别等多项能力上超越Gemini 3，其他任务处于全球第一梯队 [3] - 具体评测数据：在数学（AIME-25）得分94.3，推理（GPQA-Diamond）得分83.8，复杂指令遵循（MultiChallenge）得分66.7，通用智能体（BrowseComp-en）得分67.6 [4] - 多模态能力评测：多模态推理（MMMU-Pro）得分73.2，通用视觉问答（VLMsAreBiased）得分62.0，空间理解（MMS/Bench）得分25.8，文档与图表理解（OmniDocBench）得分0.106，动作机感知（MotionBench）得分70.6，长视频理解（VideoMME）得分87.8 [4] 多模态与Agent应用场景 - 演示中成功规划流程，调用十余个工具，在多个电商平台完成耳机全网比价与最优选择，能力可应用于电商、生活服务及企业自动化流程 [5] - 能快速低帧率浏览1小时4分钟的监控视频，精准定位事故画面并分析肇事车辆与时间，能力可拓展至在线教育、安全巡检、产品质检等领域 [5] - 大幅提升视觉理解基础能力，可低帧率理解超长视频，并在视频运动理解、复杂空间理解、文档结构化解析能力上有所提升 [7] - Tool Use能力、复杂指令遵循能力、OS Agent能力均实现大幅增强 [7] 图像与视频生成能力 - 豆包大模型拥有全球领先的图像与视频生成能力，覆盖从图像创作与编辑、视频生成、数字人制作到3D模型生成的完整创作链条 [8] - 新一代豆包生图模型Seedream 4.5在复杂指令遵循、画面元素保持能力上大幅提升，融入更丰富世界知识 [8] - Seedream 4.5能将不同人物、物体与场景照片智能组合生成创意合影，将汽车渲染成分解结构图，制作多卡通角色主题拼图，实现逼真的模特虚拟试穿及专业级产品营销海报 [8] - 视频生成模型Seedance 1.5 Pro正式登场，核心特点为音画同步输出、多人多语言对白配音及更强的影视级叙事张力 [9] - Seedance 1.5 Pro实现声音与画面在时间、语义上的精准同步，能根据角色数量和身份精准匹配口型，原生支持多种语言及中国各地方言 [9] - Seedance 1.5 Pro能通过提示词生成充满细节和情感张力的画面，驾驭影视级镜头语言和叙事张力 [11] - Seedance系列将上线“Draft样片”功能，可先快速生成低分辨率样片验证创意，帮助用户将整体创作效率提升65%，并减少60%的无效创作成本 [13] 企业服务与市场进展 - 截至今年12月，豆包大模型的日均tokens调用量已突破50万亿，自发布以来实现417倍增长，与去年12月相比实现超过10倍增长 [6] - 2025年已有超过100万家企业及个人使用火山引擎大模型服务，覆盖百余行业，其中超过100家企业在火山引擎的累计tokens使用量突破1万亿 [16] - 火山引擎正式推出“豆包助手API”，将豆包APP核心的对话、思考、搜索、创作等Agent能力以API形式开放，首批文本相关能力已上线 [16] - 豆包APP是国内用户规模最大的AI应用，从技术角度看是中国最复杂、难度最高的AI Agent之一 [16] 成本优化与推理服务 - 火山引擎推出业界首个“AI节省计划”，平台上所有按量付费的大模型均可参与，企业各部门享受统一价格优惠，不同模型用量可合并累计 [17] - “AI节省计划”采用阶梯折扣，用量越多节省越多，最高可节省47%的成本 [17] - 火山方舟正式推出“推理代工”服务，针对典型开源大模型结构提供极致的弹性伸缩、全栈推理优化与分布式缓存等支持 [18] - 用户上传加密模型参数后无需运维底层GPU，根据测试，以云上集群替代自建集群可使硬件与运维成本下降约一半，采用方舟推理代工服务对比云上租赁GPU算力可获得额外1.6倍左右的吞吐提升 [18] - 火山引擎能在分钟级完成百卡到千卡的算力伸缩以应对突发流量 [18] - AI产业的推理与训练走向分工与分层是大势所趋，对大多数团队而言，低成本、高吞吐地“推理好”一个大模型可能比“后训练好”一个模型更为困难 [19]

字节 Seedance 1.5 Pro 藏师傅实测：可以说方言的音画同出视频模型

歸藏的AI工具箱· 2025-12-18 04:38

核心观点 - 字节跳动旗下火山引擎发布的Seedance 1.5 Pro视频生成模型，在音画同步生成、方言支持、语义理解、镜头控制及文生视频质量方面实现显著升级，大幅降低了视频制作复杂性，有望推动视频生成产品与视频Agent应用进入新的爆发期 [1][3][36][37] 模型核心功能升级 - **音画同步与方言支持**：模型支持音画同步生成，并能够生成包括陕西话、四川话、粤语在内的多种主流方言，在口型、语调对齐方面效果出色 [2][3][4][5] - **语义理解与情绪表演**：模型对叙事语境的解析能力增强，声音与画面在情绪控制和专业表演能力上提升巨大，能够表现恐惧、崩溃、释放等复杂情绪 [3][19][20][21][22][23][24][25] - **精准镜头控制**：模型具备自主机位调度能力，能够实现长镜头跟随、希区柯克变焦、推轨变焦等复杂运镜，在长达**12秒**的视频中保持连贯与稳定 [3][26][27][28][29][30][31][32] - **文生视频能力**：模型支持通过纯文本提示词生成最长**12秒**的视频（另有**5秒**和**10秒**选项），在色彩表现、物品材质和整体真实性上表现优异 [3][35][36] 技术细节与测试表现 - **方言生成效果**：在测试中，模型成功生成了包含“聊咋咧”、“美滴很”等特色词汇的陕西话视频，以及多角色、多对话的四川方言和粤语场景，音调准确且遵循提示词的时间顺序 [6][7][8][9][10][11] - **非人场景音画同步**：模型在生成宠物（如猫咪）视频时，能准确同步咀嚼音效（如“咔滋咔滋”）与画面，并让动物以符合其解剖结构的方式“说”出指定的小奶音人话，避免了恐怖谷效应 [14][15][16][17] - **复杂运镜实现**：模型成功完成了连续**12秒**的快速希区柯克变焦，背景透视压缩效果连贯，并与人物呼吸音效节奏同步；在长镜头测试中，能稳定跟随人物移动并保持场景与物体的物理一致性 [28][29][30][31][32] - **文生视频优势**：纯文生视频方式在色彩、材质表现上更佳，其与音频能力的原生融合在真实性和上下文一致性上优于图生视频，为视频Agent产品提供了更好的基础 [36][37] 行业影响与应用前景 - **填补本土化内容空白**：在涉及中国本土文化、方言细节的内容生成上，国产模型具有不可替代的优势，该模型对此的重视将拓展其在影视等领域的应用 [12][13] - **降低视频制作门槛**：模型在提示词理解、表演能力、音画同出及高质量文生视频方面的进步，大幅降低了视频制作的复杂性，并可能缩短视频Agent产品所需的上下文长度 [37] - **推动产品爆发**：模型能力的提升预计将推动视频生成产品和视频Agent应用迎来一个新的爆发期，为之前受限于模型能力的创意想法提供了实现工具 [37]

实测字节Seedance 1.5 Pro，能直出方言的AI视频也来了。

数字生命卡兹克· 2025-12-18 04:33

文章核心观点 - 公司在火山Force原动力大会上发布了其新一代视频生成模型Seedance 1.5 Pro，该模型在音画同步、中文与方言能力、情感表现力等方面实现了显著突破，达到了广告级甚至影视级别的输出效果，有望推动AI视频的工业化进程和创作理念变革 [3][35][36][37][38] 模型发布与获取 - 新模型Seedance 1.5 Pro已正式上线，用户可通过豆包、即梦或火山方舟平台体验 [7] - 在豆包平台，用户需在“视频生成”或“照片动起来”功能中选择1.5 Pro模型 [7] - 在即梦平台，用户需在“生成视频”功能中选择3.5 Pro模型，该模型基于Seedance 1.5 Pro能力，目前支持文生图、单参考和首尾帧生成 [8] - 火山方舟平台提供了京剧、名画等特定玩法的体验 [9] - 模型的API接口即将开放，目前已可预约 [12] 核心能力一：音画同步 - 模型在主体说话时的唇形一致性上表现优异，能够完美对口型 [13] - 模型能够理解并执行复杂的提示词，包括指定的说唱歌词、音效节奏（如100BPM的语速）等，实现精准的音画匹配 [13] - 模型支持多人对话场景，能够根据提示词中规定的对话内容和顺序，准确地将台词分配给不同角色 [16][17] - 模型具备多分镜音画同步能力，结合其最高支持12秒视频生成的特性，用户可通过“参考图+文生分镜”的方式快速生成广告短片等内容 [16] - 模型能够生成包含完整剧情、镜头切换、运镜和音效的12秒短片，所有元素匹配得当 [18][19] - 模型目前对“罐头笑声”等特定文化概念的理解尚有不足 [14] 核心能力二：中文与方言能力 - 模型具备强大的多语言输出能力，可无障碍生成英语、日语、韩语、西班牙语等内容 [21] - 模型的中文及方言能力在所有模型中处于“断档的强”的领先地位，是其最强的技能点 [23] - 模型生成的粤语内容已具备一定的韵味和氛围感，声音效果与细节准确性非常高，可达到约80%的成品水准 [23][24] - 模型还能自如生成四川话、上海话、东北话、台湾腔等多种方言，并支持在视频中进行方言切换与互动 [25] - 使用技巧：为获得最佳效果，需向模型提供目标语言或方言的原始文本提示词 [26] 核心能力三：情感表现力 - 模型的情感表现力大幅提升，能够根据不同的情境设定，对同一句台词演绎出完全不同的感觉 [27] - 模型能够生动演绎诸如“嘴角颤抖”、“一声冷哼”、“皮笑肉不笑”等细微的面部表情和情绪细节，声线也会随之变化，极具代入感 [30] - 仅凭一句台词，不加其他提示，模型也能自动配上一段合适的表演，实现“一条过” [30] - 模型的情感表现力是配乐、音效、运镜等多种能力综合作用的结果，能够生成沉浸感极强的视频片段，例如第一视角驾驶战斗机的场景 [33] - 该能力使得生成的内容可直接作为剪辑素材，大幅提升了制作效率 [34] 未来展望与行业影响 - 公司透露了一项未上线的“draft样片”功能，该功能可先生成低分辨率样片供用户确认关键元素，再生成高清成片，旨在减少“抽卡”次数，节约成本与时间 [35] - Seedance 1.5 Pro的更新使AI视频实现了画面、台词、音效、节奏、情绪的深度融合，输出可直接用于剪辑的广告级或影视级素材 [37] - 该技术进步被视为对AI视频工业化的“巨大提升”，将改变创作方式，促使声音与画面被一同纳入创作考量，可能引发新的提示词方式、视频形态、制作流程乃至生产力变革 [38]