多模态大模型 - 财报，业绩电话会，研报，新闻 - Reportify

多模态大模型

搜索文档

海外市场收入贡献占比超70% MiniMax何以用385人“小团队”撬动全球AGI市场？

每日经济新闻· 2025-12-21 14:49

成立至今仅四年，MiniMax稀宇科技或将创下AI企业从成立到 IPO的最快纪录。 12月21日，MiniMax稀宇科技首次刊发其聆讯后资料集（PHIP）版本的招股书资料，有望以"全球化AGI第一股"身份在港交所挂牌上市。过去一年，MiniMax的技术实力持续兑现：自主研发的多模态通用大模型矩阵初具规模，旗下开源文本大模型M2更在权威测评榜单 Artificial Analysis (AA) 中脱颖而出，斩获全球总分前五、开源赛道第一的亮眼成绩。而比技术突破更具差异化的，是MiniMax与生俱来的全球化基因。作为国内独树一帜的全球化AGI公司，其早在创立之初便跳出了国内赛道的同质化内卷，推出了包括Talkie星野和海螺AI在内的AI 原生产品矩阵，实现C 端与B端市场的全面覆盖。招股书显示，截至2025年9月30日，其AI原生产品累计为来自超过200个国家及地区的逾2亿名个人用户，以及来自超过100个国家及地区的10万家企业提供服务。时至如今，其技术上的突破正在全球市场收获商业化的正向回馈。数据显示，其2025年前九个月营收同比增长超过170%，海外市场收入贡献占比超 70%，展现出卓越的全球市场 ...

多模态大模型

Artificial Intelligence

MiniMax - M1系列模型

多模态大模型

Artificial Intelligence

MiniMax - M1系列模型

豆包大模型日均token用量破50万亿后，火山引擎将主战场押注Agent

钛媒体APP· 2025-12-19 10:05

图片由AI生成在历经"卷"价格争议、DeepSeek冲击波、Agent元年、端侧AI爆发后，豆包大模型又迎来了一次重要更新。 12月18日，火山引擎正式发布豆包大模型1.8及音视频创作模型Seedance 1.5 pro。据火山引擎总裁谭待介绍，截至今年12月，豆包大模型日均token使用量突破50万亿，较去年同期增长超过10倍；目前已有超过100家企业客户累计token使用量超过一万亿。火山引擎称，权威评测数据显示，最新版大模型在Agent能力、多模态理解等方面已跻身全球第一梯队。针对日益增长的视频创作需求，火山引擎推出了Seedance 1.5 pro音视频创作模型。据其介绍，该模型具备影视级的叙事张力，能够精准捕捉运动细节并细腻呈现人物情绪，更在音画同步技术上取得了突破性进展。目前，个人用户已可在豆包、即梦AI等平台体验该模型；企业用户则可通过火山引擎API接入Seedance 1.5 pro模型服务。多模态能力增强，Agent进入"真干活"阶段尽管多模态大模型需求旺盛，但行业仍处于早期，技术限制尚未完全突破，谭待也在会后的媒体采访中表示，需保持耐心，模型会持续进化并逐步解锁新 ...

多模态大模型

豆包大模型1.8

Seedance 1.5 pro音视频创作模型

HiAgent智能体工作站

多模态大模型

豆包大模型1.8

Seedance 1.5 pro音视频创作模型

HiAgent智能体工作站

火山引擎总裁谭待：谈论Agent与APP冲突还太早

第一财经· 2025-12-19 06:51

豆包大模型业务进展 - 火山引擎发布豆包大模型1.8与音视频创作模型Seedance 1.5 pro [2] - 豆包大模型日均tokens调用量已超过50万亿，较2024年9月的30万亿有显著增长 [2] AI Agent的发展阶段与行业观点 - 行业将互联网APP对AI的针对性限制解读为“Agent时代与APP时代之间的冲突”，但公司认为行业发展仍处早期，本质是观察视角问题 [2] - AI的核心价值在于更便利、更低成本地满足用户需求，从而创造增量，例如便捷配送服务可能将咖啡需求从一天一杯升级为两杯 [2] - Agent不会淘汰Web或APP，而是会与现有载体共存互补，通过需求扩容和用户时长增加形成新格局 [2] - 当前行业对AI与Agent的探索仍处于摸索阶段，市场需求已存在但模型尚不完善，企业实践各具特色，这种状态预计还会持续三年左右 [3] - 行业“是否准备就绪”的核心在于Agent工具的完善，公司内部正投入精力将存量功能转化为Agent可识别、可调用的工具 [3] Agent的技术挑战与多模态发展 - 无论是豆包AI助手还是APP，本质都是由众多复杂Agent构成的集合，不同功能背后对应不同逻辑的Agent [4] - Agent待突破的两大核心挑战包括基础能力支撑与满足真实线上落地的健全性、运行时稳定性、弹性伸缩、数据安全等高标准要求 [4] - 多模态大模型（如Seedance 1.5 pro）的迭代标志着AI应用向更深场景发展，使AI能“看、听、说、做”，处理视觉输入与输出 [4] - 多模态模型的应用场景包括驾驶时的路况识别、产品质检以及餐饮服务中的需求响应 [4] - 多模态模型较去年已能解决非常多问题，模型进步并解锁一个领域的更迭速度非常快 [4] - 厂商之间最重要的是先将市场做大，帮助各行业AI落地更快 [4] AI时代云服务的价值与趋势 - 作为云平台，火山引擎持续强调AI时代云服务的价值 [5] - AWS管理层曾表示其生成式AI平台Bedrock目标是成为“全球最大的推理引擎”，长期潜力可与规模约400亿美元的EC2服务媲美 [5] - 公司认可该趋势，并将MaaS（模型即服务）业务发展趋势类比芯片业务：GPU出货量已超过CPU，MaaS也将从训练转向推理 [5] - 以2025年初DeepSeek带火一体机销售但最终很多人“砸”手里为例，佐证AI时代云业务的重要性 [5] - 核心原因在于AI与大模型技术快速迭代（约三个月更新一代），且Agent、AgentKit、RAG等技术产品无法私有化部署，固定算力的一体机难以支撑丰富的AI应用落地 [5] - 基于此，公司判断软件时代的私有化一体机模式在AI时代将被淘汰 [5]

多模态大模型

多模态大模型

AI 时代，如何定义电商营销新范式

搜狐财经· 2025-12-19 03:08

「用 AI 改造行业」这句话，电商行业已经喊了很多年。但实际行动，却一直比较散点，停留在诸如「猜你喜欢」「以图搜图」这样单点的能力建设，不够深入，也难以实现真正的系统级 AI 升级改造。核心瓶颈有二：一是早年 AI 技术尚未成熟，缺乏支撑全链路协同的底层能力；二是系统级改造需穿透产品核心逻辑，而新玩法、新能力的叠加必然推高使用门槛。对普通商家而言，应对复杂系统往往需要投入高额人力物力，这让技术升级的规模化落地难以为继。直到 2025 年，抖音电商率先用 AI 破局，解开了技术深度升级与商家门槛降低的两难问题。而背后的秘密武器，正是不久前千川大会上重磅发布的「千川・乘方」：借助 AI 加持，以及平台的精准用户洞察，千川・乘方不仅能最大限度的简化商家的操作，提升用户的内容体验，更做到了预判用户需求、激发用户需求、千人千策，以实现商家、用户、平台三方共赢。那么千川·乘方到底是怎样一个产品？它是将如何撑起抖音电商高增长、用户体验、商家体验的之间的不可能三角的？再看技术引擎。过去五年，虽然基于深度学习的推荐模型一直是电商搜推的核心，但是包括多模态 AI 在内的更多技术则一直停留在辅助工具层面，核心原因 ...

多模态大模型

千川・乘方

多模态大模型

千川・乘方

火山引擎总裁谭待：谈论Agent与APP冲突还太早

第一财经· 2025-12-18 15:26

除了外部独立APP的"反制"，整个技术生态的成熟度也未做好迎接Agent全面接入的准备。对此，火山引擎智能算法负责人吴迪对第一财经记者表示，当前行业对AI与Agent的探索仍处于摸索阶段。过渡阶段里，市场需求已存在，但模型尚不完善，企业实践也各具特色，这种状态预计还会持续三年左右。从生态与第三方视角来看，行业"是否准备就绪"的核心在于Agent 工具的完善。吴迪透露，公司内部已投入大量精力，尝试将存量功能转化为Agent可识别、可调用的工具。谭待向记者补充称，不论是豆包AI助手还是APP等产品，本质都是由众多复杂Agent构成的集合。哪怕是搜索、垂直领域问答等不同功能，背后都对应不同逻辑的Agent，而如今Agent待突破的两大核心挑战包括基础能力支撑与真实线上落地要求，满足健全性、运行时稳定性、弹性伸缩、数据安全等高标准。 2025年迈入尾声，海内外大模型头部厂商密集发力，包括Seedance 1.5 pro在内的多款多模态大模型更新迭代。对此，谭待分析称，多模态让大模型能像人一样 "看、听、说、做"，标志着AI应用往更深的场景走了。以前用大模型多为文字聊天，现在要让它办实事，不管是开车时的路况 ...

多模态大模型

豆包大模型1.8

音视频创作模型Seedance 1.5 pro

多模态大模型

豆包大模型1.8

音视频创作模型Seedance 1.5 pro

商汤科技预计配售31.5亿港元，用于多模态大模型研发和垂直场景商业落地

格隆汇· 2025-12-18 00:55

公司融资与资金用途 - 公司于2025年12月18日通过一般授权配售17.5亿股新B类股份，预计配售总额约为31.5亿港元 [1] - 配售获得六家机构积极认购，反映市场对公司长期价值与发展前景的信心 [1] - 配售所得款项将全面用于深化全栈人工智能领域的领先布局 [1] - 具体资金用途包括：打造行业领先的AI云、持续扩大并提高人工智能基础设施“商汤大装置”的规模与国产化比例 [1] - 资金将支持生成式人工智能的研发，以及基于多模态大模型衍生产品的开发与商业落地 [1] - 资金还将用于探索人工智能在创新垂直领域的技术融合与实践，例如金融、教育等行业 [1] 产品生态与技术进展 - 公司自12月15日启动“商汤产品发布周”，陆续推出多款基于日日新多模态大模型的产品应用 [2] - 发布行业首个创编一体、多剧集生成智能体Seko2.0，其背后的日日新Seko系列模型已完成与国产AI芯片寒武纪的适配 [2] - 推出面向办公场景的AI办公智能体小浣熊3.0 [2] - 推出面向电商运营场景的如影营销智能体 [2] - 即将亮相大晓机器人、咔皮家族等一系列兼具开创性与实用性的AI产品 [2] - 近期产品突破体现了公司在AI技术与实际场景融合方面的持续引领能力 [2]

商汤(HK:00020)

多模态大模型

日日新多模态大模型

多模态大模型

日日新多模态大模型

商汤科技预计配售31.5亿港元，继续扩大大装置规模和提升国产化比例

金融界· 2025-12-18 00:35

公司融资与资金用途 - 公司于2025年12月18日通过一般授权配售17.5亿股新B类股份 [1] - 预计配售总额约为31.5亿港元并获得六家机构积极认购 [1] - 配售所得款项将用于深化全栈人工智能领域布局包括打造行业领先的AI云及扩大人工智能基础设施商汤大装置的规模与国产化比例 [1] - 资金将支持生成式人工智能的研发以及多模态大模型衍生产品的开发与商业落地 [1] - 资金还将用于探索人工智能在金融、教育等创新垂直领域的技术融合与实践 [1] 产品生态与技术进展 - 公司自12月15日启动“商汤产品发布周” 陆续推出多款基于日日新多模态大模型的产品应用 [2] - 发布行业首个创编一体、多剧集生成智能体Seko2.0 其背后的日日新Seko系列模型已完成与国产AI芯片寒武纪的适配 [2] - 推出面向办公场景的AI办公智能体小浣熊3.0 以及面向电商运营场景的如影营销智能体 [2] - 即将亮相大晓机器人、咔皮家族等一系列兼具开创性与实用性的AI产品 [2] - 近期进展体现了公司在AI技术与实际场景融合方面的持续引领能力 [2]

商汤(HK:00020)

多模态大模型

如影营销智能体

多模态大模型

如影营销智能体

商汤-W(00020)拟配售17.5亿股新B类股份净筹约31.46亿港元

智通财经网· 2025-12-17 23:19

待配售事项完成后，假设配售股份悉数获成功配售，预期配售事项的所得款项总额及所得款项净额将分别约为31.50亿港元及31.46亿港元。配售事项的所得款项净额将主要用于以下用途：(i)30%用于支持公司的核心业务发展，包括打造行业领先的AI云、持续扩大公司人工智能基础设施商汤大装置的规模与提高其国产化比例;(ii)30%用于支持生成式人工智能的研发，以及基于公司多模态大模型衍生产品的开发与商业落地;(iii)20%用于探索人工智能在创新垂直领域的技术融合与实践，包括但不限于AI在金融、教育等行业的落地;(iv)20%用作公司的一般营运资金。智通财经APP讯，商汤-W(00020)发布公告，于2025年12月18日，公司与配售代理订立配售协议，据此，配售代理已有条件及个别同意(作为公司的配售代理)尽力促使不少于六名承配人认购17.5亿股配售股份，每股配售股份1.80港元的配售价较B类股份于2025年12月17日(即最后交易日及厘定配售价之日) 在联交所所报之收市价每股1.97港元折让约8.63%。配售事项项下的配售股份将相当于本公告日期已发行B类股份数目约4.60%及已发行股份数目约4.52%。 ...

商汤(HK:00020)

生成式人工智能

多模态大模型

商汤大装置

生成式人工智能

多模态大模型

商汤大装置

商汤-W(00020.HK)拟配售17.5亿股新B类股份总筹31.5亿港元

格隆汇· 2025-12-17 23:07

配售协议核心条款 - 商汤-W与配售代理国泰君安国际及招银国际订立配售协议，将尽力促使不少于六名承配人认购17.5亿股配售股份 [1] - 每股配售股份的配售价定为1.80港元 [1] - 配售股份相当于公告日期已发行B类股份约4.60%及已发行股份总数约4.52% [1] 融资规模与资金用途 - 假设配售股份悉数获配售，预期所得款项总额约为31.50亿港元，所得款项净额约为31.46亿港元 [1] - 所得款项净额的30%将用于支持公司核心业务发展，包括打造AI云及扩大人工智能基础设施商汤大装置的规模与国产化比例 [1] - 所得款项净额的30%将用于支持生成式人工智能的研发，以及多模态大模型衍生产品的开发与商业落地 [1] - 所得款项净额的20%将用于探索人工智能在创新垂直领域的技术融合与实践，例如金融、教育等行业 [1] - 所得款项净额的20%将用作公司的一般营运资金 [1]

商汤(HK:00020)

生成式人工智能

多模态大模型

商汤大装置

生成式人工智能

多模态大模型

商汤大装置

最近收到了很多同学关于具身方向选择的咨询......

具身智能之心· 2025-12-17 00:05

【具身智能之心论文辅导重磅上线！多模态大模型/VLA/强化学习/VLN/遥操作/数采/机器人仿真/real2sim2real/端到端/diffusion等顶会方向1V1定制化辅导】辅导区间 CCF-A到CCF-C 先看看具身的一些方向，vln、vla、强化、还有一些real2sim2real。很多小白不知道如何下手，选择强化学习还是vla？传统slam还是vln？哪些方向需要较大算力，哪些不需要？除此之外，什么样的本体适合自己研究，预算不够怎么办？仿真可以吗？对正在从事slam的同学，vln和vla都是一个比较好的切入方向。如果有机械臂，展开vla是一个不错的选择。除此之外，没有硬件的同学可以尽量在仿真里面或者使用低成本的so-100等硬件完成实验。也有很多低成本的科研平台，比如移动操作平台。四足和人形更适合强化，vla难度过高。剩下就是一些方法论的问题了，有好的idea至关重要。对很多新人研究者，一个好的idea需要踩很多次坑。如果你还是新人，不知道怎么入门，可以看看我们推出的论文辅导。论文辅导上线了最近收到很多小伙伴的咨询，其中不乏大模型、传统机器人、机械方向的同学。 ✅ 顶会/顶刊 ...

多模态大模型

具身智能之心论文辅导

多模态大模型

具身智能之心论文辅导