Workflow
Seedance 1.5 pro
icon
搜索文档
字节原动力大会点评:产业落地高速增长,Agent能力开放有望带动云持续高增
东方证券· 2025-12-24 10:42
报告行业投资评级 - 行业评级为“看好”(维持)[5] 报告的核心观点 - 报告认为,火山引擎Force原动力大会显示AI产业落地正日益深化,模型能力持续升级,特别是多模态理解与Agent能力的提升,有望通过供给升级进一步带动需求,并看好通用Agent平台对下游云服务上量的带动作用[2][8] - 报告持续看好多模态乃至全模态的技术路径迭代[8] 根据相关目录分别进行总结 投资建议与投资标的 - 看好具备硬件-研究-模型-应用场景全栈AI路径的科技大厂,相关标的包括阿里巴巴-W(09988,买入)、谷歌-A(GOOGL.O,未评级)[3] - 看好多模态相关产品,因其兼容B/C端用户且商业化场景明确、增长确定性高,建议关注快手-W(01024,买入)、美图公司(01357,买入)[3] - 重视其他具备模型能力的厂商及相关产业链,以及受益于底模能力迭代、下游应用场景体验改善的标的,包括腾讯控股(00700,买入)、同道猎聘(06100,未评级)、北森控股(09669,未评级)[3] 行业动态与数据表现 - 截至12月,豆包大模型日均Tokens使用量已突破50万亿,较9月的30万亿增长67%,居中国第一、全球第三[8] - 目前已有超过100家企业在火山引擎上累计Tokens使用量超过一万亿[8] - 从中国公有云大模型调用量份额看,火山引擎以49.2%位居第一,较2024年的46.4%提升2.8个百分点[8] - Tokens使用的增长意味着下游场景应用持续上量,AI产业落地正日益深化[8] 模型能力升级 - 发布豆包大模型1.8,其多模态理解能力大幅提升,可以低帧率理解超长视频,广泛应用于在线教育、安全巡检、产品质检等场景[8] - 豆包大模型1.8具备更强的Agent能力,提升了模型对复杂任务的规划和执行能力[8] - 豆包大模型1.8拥有更灵活的上下文管理,在通用智能体测评集BrowserComp中取得全球领先成绩[8] - 发布Seedance 1.5 pro,具备音画同步、多人多语言对白配音功能[8] - Seedance 1.5 pro的Draft样本功能可通过低分辨率输出预览加最终高分辨率成片,帮助创作者减少60%的无效创作成本[8] - 模型能力作为供给侧核心,是持续带动需求扩容的关键[8] 云服务与平台发展 - 火山引擎提供AI云原生全栈服务,在MaaS(模型即服务)上推出企业自有模型的推理代工服务、强化学习平台,以帮助企业实现成本端稳定可控[8] - 面向Agent开发和运营,火山引擎发布了企业级AI Agent平台AgentKit和HiAgent “1+N+X”智能体工作站[8] - 火山引擎通过系列通用智能体,将大量共性的业务能力和经验以开箱即用的方式开放给企业,有望进一步带动下游云服务上量[8]
行业周报:大厂加速模型升级,继续布局游戏等多模态AI应用-20251221
开源证券· 2025-12-21 15:28
报告投资评级 - 行业投资评级:看好(维持)[1] 报告核心观点 - 科技大厂持续升级多模态AI模型,有望深入赋能内容创作领域,建议继续布局多模态AI应用及推理算力方向[3] - 游戏行业供需共振下或延续高景气,叠加新品类扩张与AI赋能,建议加码布局游戏板块[3] 行业数据综述 - 游戏数据:截至2025年12月20日22:00,《三角洲行动》获内地iOS游戏免费榜第一,《王者荣耀》获内地iOS游戏畅销榜第一[10];《潜水员戴夫》在TapTap安卓及iOS预约榜均排名第一[10] - 电影数据:电影《疯狂动物城2》获得周票房冠军,当周票房为3.21亿元,累计票房达37.50亿元[23] 行业新闻综述:AIGC - 大厂模型迭代:阿里巴巴发布万相2.6系列模型,为国内首个支持角色扮演功能的视频模型,单次视频生成时长国内最高达15秒[3][29];腾讯发布混元世界模型1.5,可创建互动世界并开源实时世界模型框架[3][29];字节跳动发布豆包大模型1.8及音视频创作模型Seedance 1.5 Pro[3][31] - 模型性能与商业化:谷歌发布Gemini 3 Flash,官方称其为迄今最强智能体模型,在多项测试中性能略胜Gemini 3 Pro[3][33];小米开源模型MiMo-V2-Flash在代码能力评测中表现领先[32];智谱AI已通过港交所聆讯,2024年营收3.124亿元,复合年增长率达130%[34] - 应用数据:2025年12月,豆包大模型日均Token处理量超过50万亿,半年增长超200%[31] 行业新闻综述:游戏 - 市场规模:2025年,国内游戏市场实际销售收入3507.89亿元,同比增长7.68%;用户规模6.83亿,同比增长1.35%,双双创历史新高[36] - 细分市场:2025年,国内客户端游戏市场实销收入781.6亿元,同比大幅增长14.97%;主机游戏市场实销收入83.62亿元,同比增长86.33%;小程序游戏市场收入535.35亿元,同比大幅增长34.39%[36] - 渠道政策:日本《移动软件竞争法》落地,苹果和谷歌开放第三方支付,苹果App Store佣金下调至10%或21%[35] - 新品动态:哔哩哔哩曝光竖版捉宠游戏《闪耀吧!噜咪》[37];网易曝光两款自走棋新品[37];《洛克王国世界》定档2026年3月26日上线[37] 行业新闻综述:影视 - 平台布局:百度将推出独立漫剧APP“柚漫剧”[38] - AI应用:AI工具已用于短剧剧本创作,据称可提升效率超50%,单集工具成本可低至3元[38] 公司公告总结 - 哔哩哔哩:向147名员工授出合计2,014,815份限制性股份单位以作激励[40] - 百纳千成:拟全资收购AI营销公司众联世纪,后者2024年营收达64.17亿元[41] - 中文在线:拟筹划发行H股股票并在香港联交所主板上市[41] 板块行情综述 - 整体表现:A股传媒板块在2025年第51周(12月15日-12月19日)下跌0.18%,表现居于市场上游[42] - 子板块表现:体育板块周涨幅最大(+3.41%),影视板块表现较弱(-3.36%)[42][47] - 个股表现:A股传媒个股中,亨通股份周涨幅最大(+12.91%),科达股份周跌幅最大(-12.59%)[43];美股传媒个股中,康卡斯特周涨幅最大(+8.59%)[50];港股传媒个股中,中教控股周涨幅最大(+12.42%)[51]
传媒行业?AI周度跟踪之四十七:字节大会发布多款模型,谷歌Gemini3Flash速度提升-20251221
广发证券· 2025-12-21 09:32
行业投资评级 - 报告对传媒行业给予“买入”评级 [1] 核心观点 - 报告核心观点为关注AI技术迭代带来的潜在投资机会,并梳理了海内外AI大模型、多模态及应用层面的最新动态 [6] 国内AI动态跟踪 - **大模型产品数据**:根据SimilarWeb数据,上周(2025/12/8-2025/12/14)国内主要AI大模型网页端访问量表现分化,其中DeepSeek以7472.79万次访问量保持领先,环比上升0.26%;豆包访问量为2361.84万次,环比上升6.07%;Kimi访问量为902.95万次,环比下降4.46%;通义千问访问量环比大幅上升51.22%至22.58万次 [6][20] - **大模型产品数据**:在App iPhone端下载量方面,根据七麦数据,上周豆包以209.66万次下载量保持领先,环比微降0.03%;腾讯元宝下载量为124.44万次,环比上升14.17%;通义千问下载量为83.02万次,环比下降18.39% [21][24] - **热门应用数据**:上周国内AI应用数据中,AI搜索产品秘塔AI搜索网页访问量达171.20万次,环比上升25.89%,其App下载量环比上升46.14%至2.94万次;AI设计产品Pixso AI网页访问量环比上升45.10%至16.65万次;AI视频产品PixVerse网页访问量为153.81万次,环比上升6.87% [24][25][30] - **应用买量追踪**:根据APPGrowing数据,上周腾讯元宝在广告投放素材量上以675,911个保持第一,环比上升16.98%;通义千问投放素材量为219,777个,环比下降52.91% [31] - **应用买量追踪**:2025年12月至今的广告投放金额数据显示,腾讯元宝投放金额达86,268.90万元,通义千问为36,772.38万元,豆包为2,594.34万元 [31] - **公司重点事件**:商汤科技发布行业首个创编一体智能体Seko 2.0,旨在赋能短剧创作,将制作周期缩短近九成,平台已汇聚超20万创作者 [37][38] - **公司重点事件**:商汤科技发布AI办公智能体“小浣熊3.0”,具备一键生成高质量PPT等能力,企业场景落地分析精度达95%,已拥有超300万注册用户 [37][38] - **公司重点事件**:MiniMax视频团队开源视觉生成模型关键组件VTP;阶跃星辰升级其GUI Agent模型Step-GUI,支持200多个任务场景 [38] 海外AI动态跟踪 - **大模型产品数据**:根据SimilarWeb数据,上周海外主要AI大模型网页端访问量中,ChatGPT以132,387.06万次访问量稳居第一,环比微降0.99%;Claude访问量为4,126.03万次,环比上升0.71%;Gemini访问量为147.35万次,环比下降11.51% [6][41] - **热门应用数据**:上周海外AI陪伴产品Character AI网页访问量为4,153.97万次,环比下降1.89%,其App全球iPhone端下载量环比上升28.66%至53.61万次;AI搜索产品Perplexity AI网页访问量为4,374.03万次,环比微降0.18% [45][53] - **公司重点事件**:瑞典AI编程初创公司Lovable近日完成新一轮融资,估值飙升至66亿美元,较半年前暴涨超三倍 [55][56] 海内外科技大厂AI动态 - **大模型进展**:谷歌正式发布高效、低成本模型Gemini 3 Flash,其响应速度提升3倍,性能已超越前代Gemini 2.5 Pro并接近GPT-5.2等前沿模型 [6][57][59] - **大模型进展**:字节跳动豆包大模型团队发布通用Agent模型Seed 1.8,集成了搜索、代码与GUI交互能力,在Agentic Coding及多模态推理等指标上处于业界第一梯队 [6][57][58] - **多模态迭代**:OpenAI发布全新旗舰图像生成模型GPT Image 1.5,在细节保留、文本渲染及原图光线保持方面实现突破 [6][57][58] - **多模态迭代**:字节发布新一代音视频联合生成模型Seedance 1.5 pro,实现了精准音画同步与电影级运镜控制 [6][57][58] - **多模态迭代**:Meta推出首个统一多模态音频分离模型SAM Audio,支持通过文本或视觉提示从复杂音频中精准提取目标声音 [6][57][58] - **应用层面**:蚂蚁集团旗下AI健康助手独立App AQ更新版本,正式启用中文名“蚂蚁阿福” [6][57][58] - **其他动态**:腾讯混元世界模型1.5正式发布并开源实时世界模型框架;阿里发布新一代万相2.6系列模型,支持角色扮演等功能;美团开源虚拟人视频生成模型LongCat-Video-Avatar [58] 投资建议 - **云基建方向**:建议关注阿里巴巴、腾讯控股 [6][59] - **AI视频与IP产业链**:若Sora推动AI视频平台跑通商业化闭环,建议关注IP产业链的阅文集团、中文在线、上海电影、奥飞娱乐、华策影视、欢瑞世纪等;AI内容确权关注阜博集团;视频平台关注快手、哔哩哔哩 [6][59] - **AI营销方向**:建议关注汇量科技、易点天下、蓝色光标、天下秀 [6][59] - **AI终端与电商方向**:AI终端关注出门问问;AI电商关注值得买 [6][59] - **AI客服与游戏方向**:AI客服agent关注神州泰岳;AI游戏关注恺英网络 [6][59] - **AI医疗方向**:建议关注京东健康、阿里健康,AI问诊功能完善有望为线上平台导流并实现变现闭环,大厂增加即时零售投入有望带动互联网医疗用户流量和O2O业务单量增长 [6][59] - **细分应用落地**:关注商业化进展较好的快手、美图、粉笔等 [6][59] 重点公司估值 - 报告列出了横店影视、芒果超媒、腾讯控股、阿里巴巴、哔哩哔哩、京东健康等多家公司的估值和财务预测数据,所有提及公司评级均为“买入” [7]
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-12-20 02:33
芯片领域动态 - 谷歌推出TorchTPU芯片 [3] - 苹果研发AI服务器芯片 [3] 大模型与算法进展 - 谷歌发布Gemini 3 Flash模型 [3] - 字节跳动发布Seed1.8模型 [3] - 小米发布MiMo-V2-Flash模型 [3] - 英伟达发布Nemotron 3模型 [3] - OpenAI研究Circuit-Sparsity模型稀疏化技术 [3] - Thinking Machines发布Tinker模型 [3] - OpenAI可能正在开发GPT-5.2模型 [3] - OpenAI建立科学能力基准 [4] AI应用与产品发布 - OpenAI计划推出ChatGPT应用商店 [3] - 阶跃星辰发布Step-GUI应用 [3] - xAI为Grok推出Grok Voice功能 [3] - 行业在开发Agent API [3] - 苹果规划AI眼镜产品 [3] - OpenAI推出ChatGPT Images功能 [3] - Meta发布SAM Audio应用 [3] - 腾讯发布混元世界模型1.5 [3] - Vidu发布Vidu Agent应用 [3] - 谷歌推出Super Gems应用 [3] - 腾讯元宝推出写作模式 [3] - 通义万相推出角色扮演功能 [3] - 字节跳动发布Seedance 1.5 pro应用 [3] - 长安汽车与北汽集团推进L3级自动驾驶 [3] - Manus发布Manus 1.6应用 [3] - 谷歌推出NotebookLM应用 [3] - 通义发布Fun语音模型 [4] - Zoom推出Zoom AI功能 [4] - 行业出现医学版ChatGPT应用 [4] - Gemini推出Deep Research Agent [4] - Runway发布GWM-1应用 [4] - 谷歌将翻译功能融合进Gemini [4] - 拓竹科技与混元合作推出「印你」应用 [4] - 宇树科技推出机器人应用商店 [4] 前沿科技与行业观点 - Harmonic研究Erdos1026问题 [4] - 风险投资机构a16z提出AI泡沫判断标准 [4] - OpenAI研究记忆系统 [4] - 谷歌研究递归自我改进技术 [4] - 多款AI模型面临“AI手指”生成难题 [4] - 媒体披露OpenAI的Sora模型开发内幕 [4] - 行业关注AI生成的成人内容市场 [4] - DeepMind对AGI(通用人工智能)到来做出预测 [4] - 数据分析公司Similarweb揭示AI用户趋势 [4] - OpenAI与迪士尼探讨合作 [4]
早报|App Store搜索页将加更多广告/海南封关:iPhone直降最高2140元/小红书发力「优质中长视频」
新浪财经· 2025-12-19 12:50
ChatGPT应用商店上线 - OpenAI在ChatGPT正式上线“应用”商店功能,应用分为“精选/生活方式/工作效率”三大类[3] - 已上架应用包括Adobe Photoshop、Apple Music、Canva、Figma、Booking.com等,支持在聊天中完成订购、将大纲转为演示文稿、搜索酒店等操作[4] - 开发者可提交应用进行审核与发布,深受欢迎的应用有望获得重点推荐或在对话中被主动推荐[4] - 与此前的“GPTs Store”不同,本次应用商店以更接近苹果App Store的形态将复杂能力封装为可点击、可订阅、可组合的“应用”[5] 海南自贸港封关与iPhone降价 - 海南自由贸易港正式启动全岛封关运作,实施“一线放开、二线管住、岛内自由”政策[7] - 封关首日,iPhone 17 Pro Max 2TB顶配版本免税价16859元,叠加消费券后低至15859元,较官网节省2140元[8] - iPhone 17 Pro Max 256GB免税价为9299元,较电商平台便宜700元[8] - 免税清单覆盖税目扩充至6600个,较此前增加近3倍,新增扫地机器人、微型无人机等品类[10] - 离岛旅客全年免税额度为10万元,岛内居民在有年度离岛记录情况下可不限次购买15类“即购即提”商品,单件单价需低于2万元[10] OpenAI产品与融资动态 - OpenAI发布智能体编码模型GPT-5.2-Codex,在SWE-Bench Pro基准测试中准确率达56.4%,在Terminal-Bench 2.0中准确率为64.0%[14] - OpenAI正在洽谈新一轮融资,规模最高或达1000亿美元,公司估值目标约为7500亿美元,较今年10月约5000亿美元跃升近50%[27] - 公司CEO奥特曼透露,OpenAI或在2027年上市,正考虑最早在2026年下半年提交上市申请[28] 苹果App Store广告策略调整 - 苹果宣布将在App Store搜索结果中扩充广告位,明年起在搜索结果列表更靠后的位置新增广告[18] - 苹果称搜索是大多数用户在App Store中查找并下载应用的主要方式,近65%的下载发生在搜索之后[18] - App Store每周访问用户超过8亿,超过85%的用户在最近一次访问中至少下载了一款应用,搜索结果顶部广告位的转化率约60%[18] 半导体行业动态 - 美光预计受AI驱动需求激增影响,DRAM和NAND的紧张行业状况将持续至2026年以后[21] - 美光最新财季营收达136.4亿美元,较去年同期的87.1亿美元显著增长[21] - 受半导体短缺影响,本田计划自12月下旬至明年1月上旬对日本与中国工厂实施停产或减产,预计本财年营业利润缩减1500亿日元(约合67.83亿元人民币)[30] 中国AI公司上市进展 - 国产大模型企业MiniMax(稀宇科技)与智谱AI已通过港交所聆讯,其中MiniMax计划于2026年1月在港挂牌上市[22] - MiniMax自2022年初成立至IPO仅用四年,2024年预期营收约7000万美元,公司估值超过40亿美元(约288亿元人民币)[23] - 智谱AI最新估值约400亿元人民币,2025年总营收预计将实现100%以上同比增长,并希望未来API业务收入占比提升至50%[24] 小红书组织架构调整 - 小红书对社区组织架构进行深度调整,核心目标直指“增长”,从垂类运营转向依据不同业务目标划分[32] - 社区部现由云帆与新岛分别负责两条业务线,“Live”初步定位为“优质中长视频”,时长或超过2分钟[32] - 小红书在2025年中估值升至260亿美元(约1830亿元人民币),较2025年初的200亿美元增长30%[32] 腾讯AI业务与诉讼 - 腾讯回应“元宝到底是AI还是人”质疑,声明所有带有“内容由AI生成”标识的评论均由元宝AI独立生成[35] - 腾讯与索尼就《荒野起源》涉嫌抄袭《地平线》系列一案达成保密和解,索尼已撤回起诉[37] AI Agent应用商业化 - AI Agent应用Manus近期达到年化运行率(ARR)1.26亿美元,自3月底启动商业化至今不足9个月[40] 大模型与地图服务整合 - 千问App全面接入高德地图能力,用户可一体化完成路线规划、周边餐饮娱乐检索与“顺路”店铺筛选[42] 新能源汽车交付纪录 - 蔚来全新ES8交付突破30000台,距离达成第20000台交付仅过去19天,创下国内40万元以上纯电车型最快突破三万台交付的纪录[45] AI研发成本与竞争格局 - 微软AI负责人表示,未来5到10年内,想在前沿AI领域保持领先将需要“数千亿美元”级别的投入[48] - 微软最新财季营收为777亿美元,当前市值约3.54万亿美元[49] 消费电子新品发布 - AR眼镜厂商XREAL发布新品XREAL 1S,定价3299元,搭载自研X1空间计算芯片,支持实时2D转3D功能[53][54] - 小米宣布小米17 Ultra将于下周发布,与徕卡全球影像战略合作升级,起售价或上调500元至6999元[56] - 逐际动力发布多形态具身机器人TRON 2,售价4.98万元起,一个本体可在双臂、双足、双轮足三种核心构型间快速切换[58] 大模型技术进展 - 字节跳动旗下火山引擎发布豆包大模型1.8,日均token使用量突破50万亿,较去年同期增长超过10倍[62] - 已有超过100家企业客户累计token使用量超过1万亿[62] 消费品市场与价格 - 连锁餐饮品牌“太二酸菜鱼”宣布全面启动“透明菜单分类制度”,将菜品按主材鲜活属性与预处理程度划分为4个类别[70] - 车厘子价格大幅下降,北京新发地市场海运车厘子最低价达35元/斤,不到一个月降幅超过30%[73] - 周大福对“一口价黄金”产品进行今年第三次提价,大部分产品上调幅度集中在4%—16%,部分畅销款实际涨幅已超过30%[79]
日耗50万亿Token,火山引擎的AI消费品战事
36氪· 2025-12-19 10:55
火山引擎AI业务增长与市场地位 - 截至2025年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍[1] - 在MaaS(模型即服务)市场,火山引擎已成为国内市场份额第一,全球排名第三[2] - 公司营收规模快速增长,2024年营收超过110亿元,增速远超60%;2025年营收已超过200亿元[6] 2025年AI市场核心趋势 - 多模态和Agent是2025年AI市场的关键趋势[3] - 视频生成模型的竞争焦点已从参数、时长转向能否直接产出“可发布的完整作品”,声画同步成为重要竞争因素[7][11] - 行业迭代速度极快,模型正从技术工具演变为具备社交平台潜力的创作工具[9][22] 火山引擎Force大会核心产品发布 - 模型侧发布豆包旗舰模型1.8和视频生成模型Seedance 1.5 pro[3] - 围绕Agent生态发布企业推理代工服务、强化学习平台、企业级AI Agent平台AgentKit以及HiAgent“1+N+X”智能体工作站[3] - 豆包大模型1.8采用集成策略,将LLM、VLM、Thinking等能力整合进单一模型接口,简化客户选择与集成流程[26][27] Seedance 1.5 pro视频模型的技术与商业突破 - 核心主打声画同步功能,可实现开箱即用,生成视频的嘴型匹配、情绪捕捉与画面配合度达到高可用水平[8][13] - 在中文适配、电影级运镜、动态张力及环境沉浸感方面表现突出,优于部分海外模型[13][14][15] - 通过多阶段蒸馏、量化等工程优化,模型端到端推理速度提升超过10倍,极大降低了生成成本[17][31] - 模型支持多种方言和强表演场景,适合生成可供二次创作的社交内容,与豆包、即梦等C端产品联动潜力大[21][22] 火山引擎的AI发展战略与系统工程 - 公司定位为AI Native,其基础设施、产品架构及商业模式均围绕AI云原生设计,视AI为弯道超车的关键[34] - 竞争已从模型能力比拼转向系统工程较量,重点解决企业“用不起来”的问题,涉及数据接入、任务编排、效果评估等[35] - 同步建设模型的“脑”(豆包大模型)与“手”(AgentKit),旨在降低开发门槛,提供从开发到运营的闭环解决方案[37] - 演示中企业级电商客服Agent从搭建到上线用时不足半小时,展现了效率的飞跃[38] 商业模式与成本优化创新 - 推出“AI节省计划”,通过阶梯式折扣帮助企业最高节省47%的成本[32] - 探索按“智能”交付物价值或按思考长度分段付费等新型计费模式,超越单纯的Token计费[33] - 通过工程优化不断提升MaaS服务“密度”,即在同等成本下提供更多价值[30][31] 市场渗透现状与未来展望 - 国内大约10%-20%的头部企业消耗了超过90%的Token,大模型服务渗透率不高,头部效应明显[24][25] - 预计到2030年,豆包大模型的Token调用量将比2025年末增长约100倍[24] - 公司目标是构建完整的AI基础设施和服务体系,让每个企业都能低门槛、低成本地使用先进AI能力[38]
日耗50万亿Token,火山引擎的AI消费品战事
36氪· 2025-12-19 10:31
火山引擎AI业务增长与市场地位 - 截至2025年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍 [3] - 2025年日均token使用量为16.4万亿 [4] - 火山引擎在MaaS(模型即服务)市场已成为国内份额第一,全球排名第三 [4] - 公司2024年营收规模超过110亿元,增速远超60%;2025年营收已超过200亿元 [8] - 预计到2030年,豆包大模型的Token调用量将比2025年末增长约100倍 [36] 大模型发展趋势:从单点能力到系统工程 - 大模型竞争已从单点能力较量进入系统工程的较量 [2] - 行业头部效应明显,约10%-20%的头部企业消耗了超过90%的Token,大模型服务渗透率不高 [36][37] - 公司提出在模型上做“减法”,将LLM、VLM、Thinking等所有模型能力集成进一个API接口,降低客户选择与集成复杂度 [38] - 模型能力的集成对基础模型要求更高,需要领先的基模作为支撑 [39] - 基础模型的能力直接决定下游应用天花板,例如豆包基础模型支撑了Seedance在语义理解、情感识别等方面的细致表现 [40][41] 视频生成模型的竞争维度与进展 - 2025年视频模型竞争焦点从卷参数、秒数,转向能否直接产出“可发布的完整作品” [10] - “声画同出”(声画同步)成为关键竞争因素,是客户的核心诉求之一 [15][28] - 火山引擎发布的视频生成模型Seedance 1.5 pro主打声画同步、开箱即用 [11] - 该模型在中文对口型匹配度、声音与人物环境适配度、沉浸感方面表现突出 [18][19] - 模型强化了对电影级运镜和动态张力的遵循,动作幅度及多镜头、多主体呈现高于行业水平 [20][25] - 通过多阶段蒸馏、量化等工程优化,Seedance 1.5 pro的端到端推理速度提升超过10倍,降低了生成成本 [28][46] Agent(智能体)工具链与生态建设 - 公司重点发布围绕Agent的工具链和生态服务,包括企业模型推理代工、强化学习平台、企业级AI Agent平台AgentKit及智能体工作站HiAgent [6] - AgentKit旨在降低开发者门槛,封装prompt工程、工具调用等底层能力,让开发者聚焦业务逻辑,并提供从创建、测试、部署到监控的完整运营闭环 [53] - 公司自身在客服、内容审核等业务中积累了Agent实践经验,并通过AgentKit对外输出 [53] - 演示案例显示,从零搭建并上线一个企业级电商客服Agent用时不到半小时 [54] - 公司目标是让每个企业都能拥有自己的AI助手,构建完整的AI基础设施和服务体系 [54] 商业化、工程优化与计费创新 - 行业通过工程优化提升MaaS服务“密度”,即在同等成本下提供更多价值 [45] - 公司推出“AI节省计划”计费模式,通过阶梯式折扣,帮助企业最高节省47%的成本 [47] - 公司认为未来计费方式不应仅按Token,而可能按交付的“智能”或思考长度分段付费 [47][48] - 公司从成立起就围绕AI云原生设计基础设施、产品架构和商业模式,将AI视为弯道超车的关键 [49][50] - AI基础设施竞争已演变为系统工程的较量,企业需要解决数据接入、任务编排、效果评估、成本控制等系列问题 [51] 内容生态与模型应用潜力 - Seedance 1.5 pro支持方言、对白和强表演场景,适合在豆包、即梦等C端产品中生成可供二次创作和分享的内容 [32] - 公司对“什么内容能火”的理解已转化为模型的训练目标 [33] - 随着视频生成模型成熟,AI生产视频将与C端产品联动,模型不仅作为技术工具,更具备演变为社交平台的潜力 [33]
周受资内部信曝TikTok美国方案;腾讯回应“元宝AI”质疑
21世纪经济报道· 2025-12-19 03:01
巨头动态与战略调整 - TikTok美国业务将成立新的数据安全合资公司 名为TikTok美国数据安全合资有限责任公司 负责美国的数据保护、算法安全、内容审核和软件保障 相关事宜将在明年1月22日前完成 [2] - 亚马逊重组AI部门 将通用人工智能部门并入新部门 新部门还将涵盖芯片研发团队与量子计算团队 由云计算部门资深副总裁Peter DeSantis负责 [7][8] - 腾讯回应旗下AI产品“元宝”被质疑人工操作 称一切带有“内容由AI生成”字样的评论均由元宝AI生成 背后并无人工运营 [3] 人工智能与模型进展 - OpenAI正就融资事宜与投资者进行初步谈判 公司估值或将达到7500亿美元左右 最多可筹集到1000亿美元资金 [3] - 字节跳动发布豆包大模型1.8及音视频创作模型Seedance 1.5 pro 截至今年12月 豆包大模型日均token使用量突破50万亿 较去年同期增长超过10倍 已有超过100家企业客户累计token使用量超过一万亿 [5] - 谷歌发布更具效率的人工智能模型Gemini 3 Flash 运行速度达到Gemini2.5 Pro的三倍 成本仅为Gemini3 Pro的四分之一 [15] - 美团开源虚拟人视频生成模型LongCat-Video-Avatar 在动作拟真度、长视频稳定性与身份一致性三个维度实现提升 [16][17] 半导体与硬件行业 - 机构预测HBM3e与Server DDR5价差将快速收敛 HBM3e价格原高出Server DDR5四至五倍 预期至2026年末 差距将缩小为一至二倍 [9] - 美光科技2026财年第一季度营收为136.43亿美元 上年同期为87.09亿美元 净利润为52.40亿美元 上年同期为18.70亿美元 [10] - 摩根大通预测2026年半导体行业收入将增长10%至15% 用于数据中心资本支出的业务支出将再增长50% [12] - 芯原股份披露 今年第三季度末 公司在手订单中来自系统厂商、大型互联网公司、云服务提供商和车企等客户群体的订单占比高达83.52% [11] - 小米宣布小米17 Ultra将于下周发布 搭载移动影像领域首款徕卡APO认证长焦镜头 [6] 融资、上市与合作 - 自动驾驶公司Momenta与出行及生活服务平台Grab达成战略合作 并获Grab战略投资 双方将共同推动自动驾驶技术在东南亚市场的应用 [13] - 卧安机器人启动港股招股 计划于12月30日登陆港交所主板 拟发行2222.23万股H股 发行价区间为63港元至81港元 最高募资18亿港元 [14] - 英伟达CEO黄仁勋透露 作为向OpenAI投资千亿美元计划的一部分 英伟达目前尚未向OpenAI支付“一分钱” [4] 机器人产品发布 - 逐际动力发布全新多形态具身机器人TRON 2 售价4.98万元起 集高性能操作双臂与全地形移动双足于一体 [18]
告别抽卡!一手实测字节刚放出的视频模型Seedance 1.5 pro
机器之心· 2025-12-18 09:08
产品发布与核心升级 - 火山引擎在2025年冬季FORCE原动力大会上正式发布了新一代豆包视频生成模型「Seedance 1.5 pro」[2] - 该模型最大更新在于实现了原生音画高精同步,覆盖环境音、动作音、合成音、乐器音、背景音乐及人声等全场景,音画同步率全球领先[5] - 模型能够更好地遵循复杂指令,支持更多外国语言与中文方言的自然对白,更精准地捕捉运动细节,叙事理解与连贯性更强,人物情绪与表情呈现也更加细腻[5] 技术性能与评估 - 在视频能力评估中,Seedance 1.5 pro在文本生成视频的对齐度指标上取得领先,并在其他多项指标上位居前列[6] - 在音频能力评估中,Seedance 1.5 pro在生成质量、同步性、对齐度、表现力等多项指标上全方位超越谷歌Veo 3.1和昆仑万维Kling 2.6[6] - 相较于前代Seedance 1.0 pro,新版本完成了从视频生成模型到原生音视频联合生成基础模型的跃迁[54] 核心功能与实测表现 - 模型支持中文、英文、小语种及16种中文方言,包括陕西话、四川话、东北话、台湾腔、闽南语、粤语等[13][14] - 能够生成多人多语言对白视频,实现口型毫秒级精准对齐,对话语气、气口和语调自然[13][25] - 在影视级叙事张力上表现突出,能根据单张图像生成细腻的多种人物情绪表情,如开怀大笑、愤怒、悲伤、疲惫等[31][32][33] - 擅长处理复杂动态场景,如赛车疾驰、战争场面、第一人称追逐戏,运动幅度大且流畅,能精准捕捉多层次运动元素和环境音效[35][37][38] - 具备商业广告制作潜力,能严格遵循长而复杂的提示词,处理复杂空间变化,精准还原极简风格、科技感等抽象概念和品牌调性[40][41] 技术架构与创新 - Seedance 1.5 Pro在架构层面原生支持音视频联合生成,包括文本到音视频生成和基于图像引导的音视频生成[47] - 关键技术融合了统一的多模态联合生成架构、全面的音视频数据框架、精细化的后训练优化策略和高效的推理加速方案[49] - 在框架层面,提出基于MMDiT架构的统一建模框架,支持跨模态深度交互,确保视听信号时间精准同步与语义高度一致[50] - 在数据层面,构建了以实现音画一致、运动表现力为核心目标的高质量音视频数据框架[51] - 在后训练阶段,引入了为音视频场景定制的基于人类反馈的强化学习算法,使训练速度提升近三倍[52] - 在推理阶段,通过优化蒸馏框架和基础设施,在保持性能前提下实现了10倍以上的端到端推理加速[52] 产品可用性与稳定性 - Seedance 1.5 pro已上线火山方舟体验中心,预计12月23日通过火山引擎为企业用户提供API,个人用户可通过即梦网页版和豆包App使用[8] - 模型表现出极高的指令遵循度,基本不需要用户反复“抽卡”式生成,首次生成的视频效果往往最佳[43] - 对于日常内容创作、轻量级商业广告以及AI短剧制作,Seedance 1.5 Pro被认为完全够用[44] 行业意义与发展阶段 - Seedance 1.5 pro的发布是自2024年初Sora亮相以来,视频生成领域快速演进的一个缩影[58] - 行业技术已从“人类直觉可接受”阶段,开始真正迈向“创作级、生产级”阶段,使小团队能完成过去需影视工作室完成的内容[59] - 新版本在补全模型能力的同时,加快了体系化竞争的步伐,持续缩小模型输出与真实视频制作需求之间的差距[59] - 业界对视频生成领域有更高期待,例如马斯克希望其模型Grok能在2026年底前产出至少能看的电影[60] - 预计未来,视频生成大模型将以更成熟的方式参与从创意生成到内容制作的全过程,使用比重和承担角色将继续提升[61]
8点1氪:罗永浩回应“骂俞敏洪是忘恩负义”;馆藏估价8800万名作现身拍卖市场,南京博物院回应;多只“宝宝类”基金收益率跌破1%
36氪· 2025-12-18 00:09
罗永浩职场观点 - 罗永浩在播客中回应“骂俞敏洪是忘恩负义”的说法,表示完全不能认同,并认为当今社会年轻人骂老板和职场是主流,自己因此被指责很奇怪 [2] - 罗永浩阐述其理解的“知遇之恩”是领导在众人否定时坚持认可并支持员工,而非单纯提供工作平台 [2] 文博与艺术品市场 - 南京博物院回应明代仇英《江南春》画作出现在拍卖市场,称该画作曾于1961年和1964年被专家组鉴定为伪作,并于上世纪90年代依规处置,目前正涉及赠与合同纠纷审理 [4] - 报道称,庞莱臣后人曾向南京博物院捐赠137件(套)珍贵书画,而此次拍卖出现的《江南春》估价达8800万元人民币 [4] 货币基金市场动态 - 截至12月16日,Wind数据显示941只货币基金七日年化收益率中位数为1.24%,其中102只跌破1%,300余只在1%至1.2%之间 [4] - 天弘余额宝基金七日年化收益率为1.014%,此前一度跌至1.001%,但始终保持在1%以上 [4] - 截至10月底,货币基金总份额为15.05万亿份,较9月底增长逾3800万份 [4] 科技公司人事与组织变动 - 腾讯新成立AI Infra部、AI Data部、数据计算平台部,姚顺雨(Vinces Yao)出任首席AI科学家,向总裁刘炽平汇报,并兼任AI Infra部、大语言模型部负责人 [5] - 姚顺雨毕业于清华和普林斯顿大学,曾任OpenAI研究员,是Operator与Deep Research产品的核心贡献者 [5] - 宗馥莉卸任杭州娃哈哈食品有限公司法定代表人、经理、董事职务,均由许思敏接任,该公司注册资本2.4亿余元人民币 [6] 新股与资本市场表现 - 12月17日,国产GPU公司沐曦股份登陆科创板,竞价高开568%,股价报700元人民币,总市值达2800亿元人民币,单签盈利近30万元人民币 [6] - 沐曦股份成为A股全面注册制以来最赚钱新股,超越摩尔线程 [6] 消费品牌与市场拓展 - 蜜雪冰城美国首店在洛杉矶好莱坞试运营,推出预售套餐定价3.99美元含两杯饮品及冰淇淋,新用户最低仅需1.17美元,糖度选项最高可达200% [9][10] - 高端运动品牌迪桑特于北京华贸中心举办品牌大秀并启幕全球旗舰店,向中国国家高山滑雪队交接2026米兰冬奥会队服 [7][8] 人工智能与模型发布 - 小鹏汽车董事长何小鹏称当前没有AI泡沫,认为人形机器人未来将是巨头间的竞争,而专用机器人领域存在大量机会 [10] - 小米正式发布并开源最新MoE大模型MiMo-V2-Flash,该模型在世界评估榜单中位列全球开源模型TOP2,在成本低于DeepSeek-V3.2的情况下推理速度是其3倍 [22][23] - 字节跳动Seed团队发布新一代音视频创作模型Seedance 1.5 pro,支持音视频联合生成及图像引导生成等任务 [23] - 谷歌正式发布Gemini 3 Flash模型,Gemini 3家族产品线至此完整 [23] 半导体与科技产业链 - 苹果正与印度芯片制造商进行初步商谈,计划在印度封装iPhone芯片,意味着其在印度的布局可能从终端组装向上游半导体封装延伸 [11] - 科技媒体爆料称苹果iPhone 18 Pro系列计划彻底摒弃“灵动岛”药丸形挖孔,采用左上角单打孔前置镜头与屏下FaceID技术 [18] 新能源汽车与行业动态 - 马斯克回应福特收缩电动汽车战略,认为传统汽车行业已走向衰落,并比喻非自主内燃机汽车像“骑马使用翻盖手机” [11][12] - 烟台公安打掉一个炒作新能源汽车负面信息的团伙,抓获12人,查扣资金100余万元人民币,关停账号8000余个,该团伙曾针对小米、华为鸿蒙智行、理想汽车等品牌进行炒作 [16][17] 公司财务与债务重组 - 融创中国公告预计其境外债重组生效日期为2025年12月23日前后,届时约96亿美元的现有债务将获全面解除及免除 [20] - 万科对已到期的20亿元人民币中期票据推出新展期方案,将本金兑付时间展期12个月至2026年12月15日,到期应付利息6000万元人民币在宽限期内支付 [13][14] 互联网平台监管 - 北京市多部门联合约谈抖音、小红书、贝壳、58同城、闲鱼、链家等互联网平台,要求其自查并下架唱衰楼市、虚假房源等违规信息,建立常态化内容审核机制 [12] - 市场监管总局表示,平台要求商家提供“全网最低价”可能构成滥用市场支配地位或垄断协议行为 [17] 消费市场与零售 - 随着海运智利车厘子到港,市场价格预计将再度下探,开柜后市场降价幅度预计达20%~30%,部分车厘子每斤售价已跌破20元人民币 [13] - 知名连锁品牌万宁宣布因业务战略调整,将关闭中国内地所有门店,线下门店于2026年1月15日后停止运营,线上平台将于2025年12月底陆续停止销售 [18][19] 股权投资变动 - 阿里创投通过大宗交易减持华谊兄弟2952.68万股,其与一致行动人马云合计持股比例由6.064215%降至4.999996%,不再是公司持股5%以上股东 [12] 咖啡行业并购传闻 - 知情人士透露,瑞幸咖啡正在考虑竞购雀巢旗下高端咖啡连锁品牌蓝瓶咖啡,旨在提升品牌形象并拓展高端市场,同时也在评估其他收购目标 [20] 公司上市进展 - 北京智谱华章科技股份有限公司(智谱)于12月17日通过港交所上市聆讯 [20] - 兆易创新科技集团股份有限公司更新港交所聆讯后资料集,意味着其港交所IPO通过聆讯 [20] - 美格智能收到中国证监会出具的境外发行上市备案通知书,正申请发行H股并在港交所主板上市 [21] 美股市场收盘 - 12月17日美股收盘,三大指数集体下跌,道指跌0.47%,纳指跌1.81%,标普500指数跌1.16% [19] - 大型科技股多数走弱,特斯拉跌超4%,英伟达、谷歌跌超3%,苹果、Meta跌超1% [19]