Workflow
Seedance 1.5 Pro
icon
搜索文档
消费电子ETF(561600)收涨超2.6%,AI大模型进展不断
新浪财经· 2025-12-22 07:36
市场表现 - 截至2025年12月22日15:00,中证消费电子主题指数(931494)强势上涨2.74% [1] - 指数成分股环旭电子(601231)上涨10.02%,景旺电子(603228)上涨8.86%,生益科技(600183)上涨8.51%,东山精密(002384)、华工科技(000988)等个股跟涨 [1] - 消费电子ETF(561600)上涨2.62%,最新价报1.18元 [1] 行业驱动因素 - AI大模型进展不断,豆包App视频生成能力升级,支持Seedance1.5 Pro模型,可一键生成声音和画面相匹配的有声视频 [1] - 火山引擎发布的豆包大模型1.8及Seedance 1.5 Pro在多模态Agent场景中实现关键技术突破 [2] - 豆包大模型日均token使用量突破50万亿,服务超百家万亿级企业客户,表明其已实现在高并发、长周期生产环境中的规模化验证 [2] - 该模型聚焦于解决智能体(Agent)落地“最后一公里”问题,系统性增强多工具调用与复杂指令稳定执行能力 [2] - 模型为质量检测、教育培训、安防巡检等高价值场景提供可集成的能力接口,此类任务可靠执行能力更贴近实际投资回报率考量,有望加速AI从概念验证迈向规模化部署 [2] 指数与产品构成 - 消费电子ETF紧密跟踪中证消费电子主题指数 [2] - 中证消费电子主题指数选取50只业务涉及元器件生产、整机品牌设计及生产等消费电子相关的上市公司证券作为指数样本 [2] - 截至2025年11月28日,中证消费电子主题指数前十大权重股分别为立讯精密、寒武纪、工业富联、中芯国际、京东方A、澜起科技、兆易创新、豪威集团、东山精密、亿纬锂能,前十大权重股合计占比56.39% [3] - 消费电子ETF(561600)设有场外联接基金,包括平安中证消费电子主题ETF发起式联接A(015894)、C(015895)、E(024557) [3]
东方电缆:斩获 310 亿元新电缆订单
2025-12-21 11:01
行业与公司 * 行业:中国互联网、人工智能、数据中心、云计算、电子商务、在线娱乐、本地服务、货运匹配、在线招聘、房地产经纪、汽车后市场服务等[1][8][11][14][15][19] * 涉及公司:阿里巴巴、腾讯、字节跳动、百度、快手、网易、京东、拼多多、美团、滴滴、满帮集团、贝壳、BOSS直聘、途虎养车等,以及数据中心公司GDS、VNET[1][8][11][14][15][19] 核心观点与论据 人工智能发展五大主题 1. **前沿AI模型与智能体能力持续突破**:中美AI模型性能差距缩小至3-6个月[1][8] * 美国模型(如GPT-5.2、Gemini 3)在每次更新中仍保持领先[8] * 中国模型(如小米MiMo-V2-Flash、字节跳动Doubao-Seed-1.8)快速跟进,差距在缩小[8] 2. **AI助手在中国普及,长期可能影响应用流量**:操作系统级AI助手可能改变用户与移动设备的交互方式[1][7][8] * 字节跳动豆包手机助手(与中兴努比亚合作)是集成在操作系统级别的AI助手[8] * 智谱AI开源了AutoGLM,可在50多个高频中国应用中模拟人类操作[8] * 小米超级小爱同学拥有1.2亿月活跃用户,每日使用会话6500万,支持超过3000种技能[8] 3. **AI推理需求/代币使用量持续高速增长**:由To-C和To-B需求共同驱动[1][10] * 字节跳动豆包大模型日处理代币量在2025年12月超过50万亿(10月为30万亿+),位居中国第一、全球第三[10] * 字节跳动火山引擎MaaS服务覆盖了80%的头部快消品牌、90%的主要汽车OEM等客户[10] * 公司预计其2025财年收入将超过200亿元人民币,较去年翻倍[10] 4. **中国多模态模型凭借成本/开源/速度优势进军全球市场**:与全球玩家的能力差距正在缩小[1][10] * 阿里巴巴发布视频生成模型Wan2.6,支持多镜头叙事[10] * 腾讯发布HY WorldPlay 1.5流式视频扩散模型[10] * 字节跳动发布Doubao-Seed-1.8和视频生成模型Seedance 1.5 Pro[10] * 价格检查显示,快手的Kling 2.5 Turbo比谷歌Veo 3/OpenAI Sora 2便宜得多,且性能具有竞争力[10] 5. **国内外芯片供应动态演变**:潜在英伟达H200供应与2026年国内芯片供应增加[1][10] * 美国政府将允许英伟达向中国销售H200芯片,并征收25%的费用[10] * 阿里巴巴和字节跳动已表示有兴趣从英伟达购买H200芯片[10] * H200芯片在内存、带宽、功耗和计算性能上均优于中国特供版H20芯片[10] 投资观点与标的 * **估值**:阿里巴巴和腾讯相对于全球同行估值仍不高[1] * **关键受益标的**: * **中国互联网巨头**:阿里巴巴(全栈AI布局,明年每股收益从低基数复苏)、腾讯(稳定的每股收益增长+关键AI应用代表)[1] * **中国数据中心**:GDS和VNET(基于强劲的订单量、资本支出和AI计算需求)[1] * **子行业偏好排序**: 1. **云/数据中心**:关键标的为阿里巴巴、GDS、VNET[1] 2. **游戏**:关键标的为腾讯、网易[1] 3. **出行**:关键标的为滴滴、满帮集团[1] 4. **电子商务**:关键标的为快手[1] 全球AI视频生成市场总规模预测 * 预计全球AI视频生成模型总市场规模将从2025年的10亿美元增长至2033年的391亿美元,8年复合年增长率为56%[2][23] * **2P(专业用户)市场**:预计从2025年的7亿美元增长至2033年的170亿美元,8年复合年增长率为49%,2033年占总市场规模的43%[6][23] * **2B(企业)市场**:预计从2025年的4亿美元增长至2033年的222亿美元,8年复合年增长率为66%,2033年占总市场规模的57%[6][23] * **中国玩家份额**:在全球基础模型市场中的收入份额预计从2025年的约4%稳步增长至2029年的7%[6] 资本支出与云业务 * **2026年资本支出展望**:预计中国超大规模云厂商资本支出将进一步上升至5000亿元人民币水平,其中国内产能占比更高[11] * 2025年BBAT合计资本支出预计超过4000亿元人民币以上(同比增长62%)[11] * 2026年预计中国超大规模云厂商资本支出同比增长20%,其中国内芯片/计算支出占比将大幅提高(高盛预计:从2025财年的20-30%增至2026财年的40%)[11] * **阿里巴巴与腾讯对比**:阿里巴巴今年资本支出显著高于腾讯,源于其AI基础设施/全栈能力[11] * **云收入增长**:更高的计算效率可能推动AI资本支出向收入转化,在强劲的训练后/推理需求背景下加速云收入增长[11] * **阿里巴巴云业务**:9月季度云收入同比增长34%(内部收入同比增长53%/外部收入同比增长29%),AI收入占外部收入的20%(连续第9个季度三位数增长)[11] 用户参与度趋势(2025年11月) * **总体**:前400款移动应用总使用时长同比增长5%(与10月持平)[11][93] * **AI生成内容/聊天机器人**:国内AIGC应用参与度环比增长5%,由豆包(环比增长14%)和通义千问(环比增长108%)驱动[11] * **电子商务**:使用时长同比增长11%[15] * 京东使用时长同比增长39%,淘宝同比增长12%,拼多多同比增长6%[15] * 商户应用日活跃用户份额:淘宝千牛占35%,拼多多商户版占23%,抖音商户版占21%[15] * **社交**:使用时长同比增长4%,微信使用时长同比增长4%[15] * **视频**:使用时长同比增长8%[15] * 抖音主应用使用时长同比增长19%,极速版同比增长28%[15] * 快手主应用使用时长同比下滑8%,极速版同比下滑8%[15] * 腾讯视频使用时长同比下滑22%,优酷同比下滑28%[15] * **游戏**:使用时长同比增长12%[15] * 《王者荣耀》使用时长同比增长5%[15] * 《和平精英》使用时长同比下滑2%[15] * 网易《逆水寒》手游使用时长同比下滑44%[15] * 《蛋仔派对》使用时长同比增长23%[15] * **本地服务**:使用时长同比增长14%[15] * 美团使用时长同比增长7%[15] * 高德地图使用时长同比增长30%[15] * **货运匹配**:满帮集团司机和货主应用总参与度同比增长17%[14] * **在线招聘**:BOSS直聘月活跃用户同比增长10%,使用时长同比增长4%[19] * **房地产**:贝壳三大主要应用使用时长同比下滑1%[19] * **汽车后市场服务**:途虎养车应用月活跃用户同比增长13%,达1700万[19] 其他重要内容 * **中国To-C AI应用货币化路径**:与美国主要通过订阅收费不同,中国To-C聊天机器人目前大多免费,货币化路径仍在演变,未来可能更多由广告收入驱动[11][13] * **Temu数据**:2025年11月全球月活跃用户为5.2亿,环比持平;美国月活跃用户环比增长4%,占全球月活跃用户的17%[15] * **跨境电商监管压力**:欧盟宣布将从2026年7月1日起对低价值包裹征收3欧元关税[15] * **教育类AI应用**:字节跳动豆包学习(国内)和Gauth(海外)日活跃用户分别同比增长194%和39%,达到250万和310万[19] * **操作系统级AI助手的潜在挑战**:可能面临“围墙花园”生态系统或安全问题的挑战[9] * **对字节跳动的关注**:需警惕其利用AI/智能体功能在社交、音乐、交易、即时通讯等垂直领域持续扩张带来的竞争威胁[9]
字节跳动最新音视频模型Seedance 1.5 Pro上线豆包App 一键生成有声视频
证券时报网· 2025-12-19 09:39
字节跳动AI视频生成模型升级 - 字节跳动旗下豆包App的视频生成能力升级,支持新一代音视频创作模型Seedance1.5Pro,用户可通过“照片动起来”功能,上传图片并输入提示词,一键生成声音和画面相匹配的有声视频 [1] - 同期,字节跳动旗下即梦AI网页版也全面升级,打造一站式“AI片场”,并全球首发上线基于Seedance1.5Pro的“视频3.5Pro”模型,支持视频与音频同时生成 [3] Seedance1.5Pro模型核心能力 - 该模型依托原生音视频联合架构与精细化后训练,实现了对多模态指令的较好遵循,并具备精准的音画同步与较高的视听一致性 [1] - 模型支持多种语言和地方方言口音,能够捕捉其独有的语音韵律与情感张力 [1] - 模型具备电影级运镜控制与动态张力,拥有自发的镜头调度能力,能实现电影级的画面衔接与专业影调,大幅提升视频动态张力 [1] - 模型的语义理解与叙事协调性增强,能实现对叙事语境的精准解析,显著提升音视频段落的整体叙事协调性,为专业级内容创作提供支撑 [1] - 模型在遵循复杂指令方面表现优异,能精准响应运镜调度、动作幅度及光影氛围等要求,并对中文发音口型、面部微表情乃至多种方言生成提供更强支持 [3] 模型应用场景与优势 - Seedance1.5Pro模型对视听协同、动态调度和文化语境的精准掌握,使其在影视创作、短剧生成、广告生产及戏曲演绎等场景中,均展现出较好的叙事表现力与视听融合度 [1] - “视频3.5Pro”模型支持视频与音频同时生成,人物口型、乐器演奏、环境音效等元素无需后期配音,大幅提升了视频的真实感与沉浸感 [3] 产品迭代与历史背景 - 2025年6月,字节跳动视频生成模型Seedance1.0Pro正式发布,支持文字与图片输入,可生成多镜头无缝切换的高品质视频,主体运动稳定性与画面自然度较高 [2] - 即梦AI网页版本次升级还涵盖了全新UI,升级了画布、agent等功能的交互方式,旨在将复杂的AI创作工具整合为直观、高效的一站式“AI片场” [4]
豆包 1.8 多模态超越谷歌Gemini 3!字节祭出“推理代工”,要做模型届的英特尔?
AI前线· 2025-12-18 07:24
豆包大模型1.8核心性能与能力 - 火山引擎正式推出新一代豆包大模型1.8,面向多模态Agent场景深度优化 [2] - 模型上下文窗口达256k,最大输入Token长度为224k,最大输出及思考内容Token长度均为64k [2] - 运行效率高,TPM(每分钟处理Token数)达5000k,RPM(每分钟请求数)为30k [3] - 原生支持智能上下文管理,可配置策略清除低价值历史信息,确保多步骤任务稳定完成 [7] 评测表现与行业地位 - 在AIME 2025等Agent评测集上稳步提升,在通用智能体测评Benchmark上取得全球领先成绩 [3] - 多模态理解方面,在视觉判断准确性、空间理解、文档解析、视频运动识别等多项能力上超越Gemini 3,其他任务处于全球第一梯队 [3] - 具体评测数据:在数学(AIME-25)得分94.3,推理(GPQA-Diamond)得分83.8,复杂指令遵循(MultiChallenge)得分66.7,通用智能体(BrowseComp-en)得分67.6 [4] - 多模态能力评测:多模态推理(MMMU-Pro)得分73.2,通用视觉问答(VLMsAreBiased)得分62.0,空间理解(MMS/Bench)得分25.8,文档与图表理解(OmniDocBench)得分0.106,动作机感知(MotionBench)得分70.6,长视频理解(VideoMME)得分87.8 [4] 多模态与Agent应用场景 - 演示中成功规划流程,调用十余个工具,在多个电商平台完成耳机全网比价与最优选择,能力可应用于电商、生活服务及企业自动化流程 [5] - 能快速低帧率浏览1小时4分钟的监控视频,精准定位事故画面并分析肇事车辆与时间,能力可拓展至在线教育、安全巡检、产品质检等领域 [5] - 大幅提升视觉理解基础能力,可低帧率理解超长视频,并在视频运动理解、复杂空间理解、文档结构化解析能力上有所提升 [7] - Tool Use能力、复杂指令遵循能力、OS Agent能力均实现大幅增强 [7] 图像与视频生成能力 - 豆包大模型拥有全球领先的图像与视频生成能力,覆盖从图像创作与编辑、视频生成、数字人制作到3D模型生成的完整创作链条 [8] - 新一代豆包生图模型Seedream 4.5在复杂指令遵循、画面元素保持能力上大幅提升,融入更丰富世界知识 [8] - Seedream 4.5能将不同人物、物体与场景照片智能组合生成创意合影,将汽车渲染成分解结构图,制作多卡通角色主题拼图,实现逼真的模特虚拟试穿及专业级产品营销海报 [8] - 视频生成模型Seedance 1.5 Pro正式登场,核心特点为音画同步输出、多人多语言对白配音及更强的影视级叙事张力 [9] - Seedance 1.5 Pro实现声音与画面在时间、语义上的精准同步,能根据角色数量和身份精准匹配口型,原生支持多种语言及中国各地方言 [9] - Seedance 1.5 Pro能通过提示词生成充满细节和情感张力的画面,驾驭影视级镜头语言和叙事张力 [11] - Seedance系列将上线“Draft样片”功能,可先快速生成低分辨率样片验证创意,帮助用户将整体创作效率提升65%,并减少60%的无效创作成本 [13] 企业服务与市场进展 - 截至今年12月,豆包大模型的日均tokens调用量已突破50万亿,自发布以来实现417倍增长,与去年12月相比实现超过10倍增长 [6] - 2025年已有超过100万家企业及个人使用火山引擎大模型服务,覆盖百余行业,其中超过100家企业在火山引擎的累计tokens使用量突破1万亿 [16] - 火山引擎正式推出“豆包助手API”,将豆包APP核心的对话、思考、搜索、创作等Agent能力以API形式开放,首批文本相关能力已上线 [16] - 豆包APP是国内用户规模最大的AI应用,从技术角度看是中国最复杂、难度最高的AI Agent之一 [16] 成本优化与推理服务 - 火山引擎推出业界首个“AI节省计划”,平台上所有按量付费的大模型均可参与,企业各部门享受统一价格优惠,不同模型用量可合并累计 [17] - “AI节省计划”采用阶梯折扣,用量越多节省越多,最高可节省47%的成本 [17] - 火山方舟正式推出“推理代工”服务,针对典型开源大模型结构提供极致的弹性伸缩、全栈推理优化与分布式缓存等支持 [18] - 用户上传加密模型参数后无需运维底层GPU,根据测试,以云上集群替代自建集群可使硬件与运维成本下降约一半,采用方舟推理代工服务对比云上租赁GPU算力可获得额外1.6倍左右的吞吐提升 [18] - 火山引擎能在分钟级完成百卡到千卡的算力伸缩以应对突发流量 [18] - AI产业的推理与训练走向分工与分层是大势所趋,对大多数团队而言,低成本、高吞吐地“推理好”一个大模型可能比“后训练好”一个模型更为困难 [19]
字节 Seedance 1.5 Pro 藏师傅实测:可以说方言的音画同出视频模型
歸藏的AI工具箱· 2025-12-18 04:38
核心观点 - 字节跳动旗下火山引擎发布的Seedance 1.5 Pro视频生成模型,在音画同步生成、方言支持、语义理解、镜头控制及文生视频质量方面实现显著升级,大幅降低了视频制作复杂性,有望推动视频生成产品与视频Agent应用进入新的爆发期 [1][3][36][37] 模型核心功能升级 - **音画同步与方言支持**:模型支持音画同步生成,并能够生成包括陕西话、四川话、粤语在内的多种主流方言,在口型、语调对齐方面效果出色 [2][3][4][5] - **语义理解与情绪表演**:模型对叙事语境的解析能力增强,声音与画面在情绪控制和专业表演能力上提升巨大,能够表现恐惧、崩溃、释放等复杂情绪 [3][19][20][21][22][23][24][25] - **精准镜头控制**:模型具备自主机位调度能力,能够实现长镜头跟随、希区柯克变焦、推轨变焦等复杂运镜,在长达**12秒**的视频中保持连贯与稳定 [3][26][27][28][29][30][31][32] - **文生视频能力**:模型支持通过纯文本提示词生成最长**12秒**的视频(另有**5秒**和**10秒**选项),在色彩表现、物品材质和整体真实性上表现优异 [3][35][36] 技术细节与测试表现 - **方言生成效果**:在测试中,模型成功生成了包含“聊咋咧”、“美滴很”等特色词汇的陕西话视频,以及多角色、多对话的四川方言和粤语场景,音调准确且遵循提示词的时间顺序 [6][7][8][9][10][11] - **非人场景音画同步**:模型在生成宠物(如猫咪)视频时,能准确同步咀嚼音效(如“咔滋咔滋”)与画面,并让动物以符合其解剖结构的方式“说”出指定的小奶音人话,避免了恐怖谷效应 [14][15][16][17] - **复杂运镜实现**:模型成功完成了连续**12秒**的快速希区柯克变焦,背景透视压缩效果连贯,并与人物呼吸音效节奏同步;在长镜头测试中,能稳定跟随人物移动并保持场景与物体的物理一致性 [28][29][30][31][32] - **文生视频优势**:纯文生视频方式在色彩、材质表现上更佳,其与音频能力的原生融合在真实性和上下文一致性上优于图生视频,为视频Agent产品提供了更好的基础 [36][37] 行业影响与应用前景 - **填补本土化内容空白**:在涉及中国本土文化、方言细节的内容生成上,国产模型具有不可替代的优势,该模型对此的重视将拓展其在影视等领域的应用 [12][13] - **降低视频制作门槛**:模型在提示词理解、表演能力、音画同出及高质量文生视频方面的进步,大幅降低了视频制作的复杂性,并可能缩短视频Agent产品所需的上下文长度 [37] - **推动产品爆发**:模型能力的提升预计将推动视频生成产品和视频Agent应用迎来一个新的爆发期,为之前受限于模型能力的创意想法提供了实现工具 [37]
实测字节Seedance 1.5 Pro,能直出方言的AI视频也来了。
数字生命卡兹克· 2025-12-18 04:33
文章核心观点 - 公司在火山Force原动力大会上发布了其新一代视频生成模型Seedance 1.5 Pro,该模型在音画同步、中文与方言能力、情感表现力等方面实现了显著突破,达到了广告级甚至影视级别的输出效果,有望推动AI视频的工业化进程和创作理念变革 [3][35][36][37][38] 模型发布与获取 - 新模型Seedance 1.5 Pro已正式上线,用户可通过豆包、即梦或火山方舟平台体验 [7] - 在豆包平台,用户需在“视频生成”或“照片动起来”功能中选择1.5 Pro模型 [7] - 在即梦平台,用户需在“生成视频”功能中选择3.5 Pro模型,该模型基于Seedance 1.5 Pro能力,目前支持文生图、单参考和首尾帧生成 [8] - 火山方舟平台提供了京剧、名画等特定玩法的体验 [9] - 模型的API接口即将开放,目前已可预约 [12] 核心能力一:音画同步 - 模型在主体说话时的唇形一致性上表现优异,能够完美对口型 [13] - 模型能够理解并执行复杂的提示词,包括指定的说唱歌词、音效节奏(如100BPM的语速)等,实现精准的音画匹配 [13] - 模型支持多人对话场景,能够根据提示词中规定的对话内容和顺序,准确地将台词分配给不同角色 [16][17] - 模型具备多分镜音画同步能力,结合其最高支持12秒视频生成的特性,用户可通过“参考图+文生分镜”的方式快速生成广告短片等内容 [16] - 模型能够生成包含完整剧情、镜头切换、运镜和音效的12秒短片,所有元素匹配得当 [18][19] - 模型目前对“罐头笑声”等特定文化概念的理解尚有不足 [14] 核心能力二:中文与方言能力 - 模型具备强大的多语言输出能力,可无障碍生成英语、日语、韩语、西班牙语等内容 [21] - 模型的中文及方言能力在所有模型中处于“断档的强”的领先地位,是其最强的技能点 [23] - 模型生成的粤语内容已具备一定的韵味和氛围感,声音效果与细节准确性非常高,可达到约80%的成品水准 [23][24] - 模型还能自如生成四川话、上海话、东北话、台湾腔等多种方言,并支持在视频中进行方言切换与互动 [25] - 使用技巧:为获得最佳效果,需向模型提供目标语言或方言的原始文本提示词 [26] 核心能力三:情感表现力 - 模型的情感表现力大幅提升,能够根据不同的情境设定,对同一句台词演绎出完全不同的感觉 [27] - 模型能够生动演绎诸如“嘴角颤抖”、“一声冷哼”、“皮笑肉不笑”等细微的面部表情和情绪细节,声线也会随之变化,极具代入感 [30] - 仅凭一句台词,不加其他提示,模型也能自动配上一段合适的表演,实现“一条过” [30] - 模型的情感表现力是配乐、音效、运镜等多种能力综合作用的结果,能够生成沉浸感极强的视频片段,例如第一视角驾驶战斗机的场景 [33] - 该能力使得生成的内容可直接作为剪辑素材,大幅提升了制作效率 [34] 未来展望与行业影响 - 公司透露了一项未上线的“draft样片”功能,该功能可先生成低分辨率样片供用户确认关键元素,再生成高清成片,旨在减少“抽卡”次数,节约成本与时间 [35] - Seedance 1.5 Pro的更新使AI视频实现了画面、台词、音效、节奏、情绪的深度融合,输出可直接用于剪辑的广告级或影视级素材 [37] - 该技术进步被视为对AI视频工业化的“巨大提升”,将改变创作方式,促使声音与画面被一同纳入创作考量,可能引发新的提示词方式、视频形态、制作流程乃至生产力变革 [38]