多模态模型 - 财报，业绩电话会，研报，新闻 - Reportify

多模态模型

搜索文档

加码下一代“操作系统”和“计算机” 阿里巴巴放出一系列新招

证券时报网· 2025-09-24 15:44

阿里巴巴AI战略愿景 - 公司预测通用人工智能AGI是确定性事件终极目标是发展超越人类的超级人工智能ASI [2] - 大模型是下一代操作系统超级AI云是下一代计算机 [2] - 一旦跨过奇点 AI将催生IT产业巨大变革 [2] AI基础设施投资 - 公司积极推进三年3800亿AI基础设施建设计划并持续追加更大投入 [2][3] - 2032年阿里云全球数据中心能耗规模将比2022年提升10倍 [3] - 过去一年阿里云AI算力增长超5倍 AI存力增长4倍多 [4] 全球基础设施扩建 - 在巴西法国荷兰首次设立云计算地域节点 [4] - 扩建墨西哥日本韩国马来西亚和迪拜的数据中心 [4] - 目前在全球29个地区运营91个可用区是中国最大亚太第一云服务商 [4] 全栈技术能力展示 - 发布新一代磐久128超节点AI服务器单柜支持128个AI计算芯片密度刷新业界纪录 [4] - 展示从底层芯片超节点服务器高性能网络到AI平台的全栈AI技术能力 [4] 大模型产品突破 - 发布七款大模型技术产品覆盖语言语音视觉多模态代码等领域 [5] - 通义旗舰模型Qwen3-Max性能超过GPT5和Claude Opus 4 跻身全球前三 [5] - 千问视觉理解模型Qwen3-VL开源在32项核心能力测评中超过Gemini2.5-Pro和GPT5 [5] 产业合作与落地 - 与英伟达在Physical AI领域合作集成全套Physical AI软件栈 [7] - 阿里云百炼平台已有超20万开发者开发80多万个Agent [8] - 通义灵码插件下载量超2200万累计为开发者生成超60亿行代码 [8] 行业应用案例 - 工商银行使用多模态技术取代传统OCR技术开发商户智能审核助手 [9] - 网易借助Qwen3-coder模型实现游戏开发提效50% [9] - 宝马比亚迪蔚来等车企利用阿里AI打造智能座舱 [9] - 西门子工业智能系统使用多个AI Agent完成订单调度生产等具体任务 [9]

超级人工智能（ASI）

多模态模型

阿里通义旗舰模型Qwen3 - Max

超级人工智能（ASI）

多模态模型

阿里通义旗舰模型Qwen3 - Max

华为，重磅新品发布

中国基金报· 2025-09-24 10:53

新品发布概况 - 公司于9月24日举行穿戴音频新品线上发布会，推出HUAWEI WATCH GT 6系列智能手表、HUAWEI FreeClip 2耳夹耳机及华为Vision智慧屏5 Pro等新品 [1] - 智能穿戴设备正从“科技尝鲜品”转变为大众日常刚需产品，公司凭借创新技术和全面产品线成为全球智能穿戴设备领域的领航者 [1] HUAWEI WATCH GT 6系列 - WATCH GT 6系列包括41mm、46mm两款及GT 6 Pro 46mm款式，采用多面几何锋芒设计、蓝宝石玻璃镜面、航天级钛合金机身与微晶纳米陶瓷后壳 [4] - 系列技术底座全面革新，首次搭载全新高硅叠片异形电池，电池容量相比上一代提升65% [4] - GT 6 Pro和GT 6 46mm版本在轻度使用下续航最长可达21天，GT 6 41mm版本续航最长可达14天 [4] - 系列搭载全新升级玄玑感知系统，首发骑行模拟功率，支持骑行自动识别，并配备升级版向日葵定位系统以准确记录运动数据 [4] - GT 6 46mm售价1588元起，41mm售价1488元起，9月29日开售；GT 6 Pro 46mm售价2488元起，10月20日开售 [5] - 华为WATCH GT系列智能手表全球累计出货量已超5400万台 [2][5] - 公司今年上半年全球腕上可穿戴出货量第一，2019年至2024年连续六年中国腕上可穿戴出货量第一 [5] HUAWEI FreeClip 2耳夹耳机 - 耳机推出丹宁蓝、羽沙白与摩登黑三款配色，首发价格1299元，10月20日正式开售 [6][7] - 得益于自研第三代音频芯片与NPU AI处理器，耳机算力比上一代提升10倍，通话音质更佳，支持鸿蒙AI体验 [7] - 耳机支持小艺唤醒、智慧播报、小艺翻译、头动播报等功能，用户可通过点头或摇头完成接听、拒接等操作 [7] 行业市场表现与前景 - 2025年第二季度全球腕戴设备市场出货4922万台，同比增长12.3%，中国市场出货2080万台，同比增长33.8%，增速领跑全球 [9] - 公司在全球腕戴设备市场份额达20.2%，出货量全球第一，连续两季度登顶；国内市场以33.4%的份额连续6年保持出货量第一，出货量达700万台，同比增长16.6% [9] - 自2015年推出首款穿戴产品以来，公司穿戴设备累计出货量已达2亿台，用户设备复购率达68%，远超行业平均水平的45% [10] - 全球智能可穿戴设备市场规模在2025年已突破1000亿美元，中国市场规模同步迈过千亿元人民币大关 [10] - 医疗级可穿戴设备年复合增长率持续保持在40%以上，显著高于消费级产品 [10] - 在端侧AI芯片、多模态模型等技术发展和融合下，可穿戴设备正逐步向个人健康防线及全域智能生活核心入口发展 [10]

全域智能生活

多模态模型

智能穿戴设备

HUAWEI WATCH GT 6系列

华为FreeClip 2耳夹耳机

全域智能生活

多模态模型

智能穿戴设备

HUAWEI WATCH GT 6系列

华为FreeClip 2耳夹耳机

微信WeChat-YATT横空出世，腾讯强化学习布局剑指何方

搜狐财经· 2025-09-24 09:56

WeChat-YATT技术特点 - 基于Megatron-Core和SGLang/vLLM研发专注强化学习和多模态模型训练[2] - 显著优化强化学习场景参数更新效率提供灵活多模态数据融合接口通过模块化设计降低分布式训练门槛[2] - 命名"Yet Another Transformer Trainer"体现腾讯在AI基础设施层的长期投入决心[6] 技术对比优势 - 相比Meta PyTorch在强化学习支持更胜一筹对比Google JAX在中文场景和多模态处理具明显优势[4] - 与同类强化学习框架Ray RLlib相比深度整合微信生态独具特色[4] - 特别强调易扩展性满足大模型快速迭代需求参数规模突破万亿门槛后训练框架灵活度决定竞赛先机[4] 腾讯AI战略布局 - 开源WeChat-YATT是构建技术生态圈的重要步骤类似Google开源TensorFlow的路径[2] - 结合申请微信AI服务平台商标混元大模型全面落地等动作形成底层技术突破与上层应用落地的双轮驱动[7] - 微信作为十亿级流量入口需强大AI能力支撑混元大模型持续进化需高效训练工具 WeChat-YATT填补关键环节形成从基础设施到终端应用的完整链条[7] 强化学习战略价值 - 重点投入强化学习训练库预示在游戏推荐系统自动驾驶等核心领域的下一代AI应用场景布局[7] - 大模型时代竞争本质是基础设施竞争自主可控训练框架将成为头部企业标配[7]

腾讯控股(HK:00700)

AI大模型训练

多模态模型

AI大模型训练

多模态模型

可穿戴设备迎政策利好！这一品类出货量大增超60% 外资机构密集调研4股

财经网· 2025-09-23 02:11

政策支持 - 国家体育总局印发指导意见推进运动促进健康服务数字化和智能化升级加强智慧可穿戴监测设备与器材应用[1] - 政策支持运用大数据和人工智能等高新技术打造数智应用场景提高服务科技含量和精准度[1] - 可穿戴设备主要包括智能眼镜智能手表智能手环和智能戒指等产品用于实时监测生理状态和周围环境信息[1] 行业增长 - 2025年第二季度全球腕戴设备市场出货4922万台同比增长12.3%[2] - 中国腕戴设备市场出货2080万台同比增长33.8% 增速领跑全球[2] - 中国成人智能手表市场出货958万台同比增长64% 其中千元以下及2000元以上产品分别增长66.1%和110.2%[2] 技术发展 - 可穿戴设备通过AI芯片和多模态模型技术向个人健康防线和全域智能生活核心入口发展[2] - 健康管理从监测走向治疗生态从孤立走向协同应用范围持续扩展至医疗保健和工业物联网等领域[1][2] - 设备功能包括健康管理运动测量社交互动和智能家居控制等场景[1] 市场表现 - A股可穿戴设备概念指数9月22日上涨2.47% 67只概念股中11只9月以来涨幅超10%[3] - 长盈精密天岳先进和立讯精密累计涨幅分别达43.59% 35.78%和32.56%[3] - 长盈精密开发基于AI技术的可穿戴产品关键零部件取得较大突破[3] 外资关注 - 7月以来20只概念股接受外资机构调研立讯精密水晶光电领益智造和恺英网络调研机构家数分别为28家 14家 11家和9家[3] - 立讯精密在AI眼镜零组件和整机产品领域有广泛布局支持约三分之一市场品类[3] - 17只概念股获QFII重仓合计持仓市值21.99亿元京东方A 洲明科技和领益智造持仓市值超1亿元[4] 公司动态 - 立讯精密总市值4420.1亿元市盈率30.25倍[4] - 水晶光电总市值390.63亿元市盈率35.39倍[4] - 领益智造总市值1072.95亿元市盈率53.89倍[4]

立讯精密(SZ:002475)

多模态模型

可穿戴设备

多模态模型

可穿戴设备

2025-09-18 14:41

**公司及行业** * 商汤科技人工智能行业生成式AI领域 [1] **核心财务表现** * 公司整体收入同比增长36% 生成式AI业务收入同比增长73% 占集团整体收入77% [2][3] * 经调整净亏损同比收窄50% [2][4] * 应收账款拨备计提减少约4.5亿元人民币 [2][4] * 现金周转天数缩短至100多天上半年回款达31.6亿元人民币 [2][4][5] **业务结构调整与战略进展** * 财务报表收入结构调整为生成式AI 视觉AI和X创新业务三类 [2][6] * X创新业务子公司大芯片公司"希望"和端侧芯片公司"影微创新"已顺利融资并实现出表 [2][7] * 公司人员成本从高峰6000多人减少至3000多人 [20] **技术优势与核心竞争力** * 拥有中国第一个5A级智算中心上海临港AIDC 是亚洲最大的单体智算中心之一 [12] * 超过10年的视觉AI积累在基础设施投入模型研发及算法突破方面具备优势 [8][9][12] * 在多模态模型研发方面取得进展日新6和日新6.5模型已在金融教育政务电商营销等场景实现商业化应用 [4][19] * 每天可生成约5TB Opens数据用于动态融合模型的数据准备 [18] **产品与应用落地** * Agent产品"小浣熊"产品家族月活跃用户情况及客户转化率亮眼主要面向To B市场拥有超过百万用户 [13][14] * 在具身智能领域拥有超过20个客户提供端到端解决方案 [18] * 生成式AI基础设施不仅是GPU规模还涉及软件行业理解和数据能力等多方面需要针对具体场景进行二次训练和优化 [4][11] **市场认知与行业趋势** * 全球资本市场对生成式AI理解深化对公司发展产生积极影响 [2][8] * 生成式AI领域市场热点从模型关注转向寻找杀手级应用技术和客户需求快速变化 [10] * To B应用在生成式AI领域弹性较好 [10] * 坚定认为大模型发展的下一个阶段是打开与物理世界交互的大门 [18] **运营策略与资源管理** * 在芯片供给和资源获取方面采取轻资产模式通过租赁或联合运营的方式快速获取资源 [17] * 没有设定具体的CAPEX目标而是结合下游需求和上游供应链情况进行灵活调整 [16] * 更注重提供端到端的交付解决方案包括软件层工具层机构模型行业模型以及数据能力等 [16]

商汤(HK:00020)

多模态模型

生成式AI业务

小浣熊产品家族

多模态模型

生成式AI业务

小浣熊产品家族

超讯通信：已在若干客户场景中完成了少量元醒训练推理一体机的交付应用

格隆汇· 2025-09-17 07:58

行业背景 - 国内大模型产业处于快速成长阶段 AIGC、多模态模型及垂直行业模型落地应用持续加速 [1] - 算力基础设施需求显著增长 [1] 产品与技术 - 公司推出元醒训练推理一体机基于沐曦GPU构建 [1] - 面向DeepSeek-R1/V3等大模型全栈式应用场景 [1] - 提供从底层算力到模型部署的一站式交付能力 [1] 市场应用 - 产品满足政企、科研、金融、制造等多行业需求 [1] - 已在若干客户场景中完成少量元醒训练推理一体机交付应用 [1] - 正在积累行业实践经验 [1] 发展前景 - 各类垂直场景应用逐步成熟 [1] - 预计未来该类产品交付规模和市场需求有望持续增长 [1]

超讯通信(SH:603322)

AIGC（生成式人工智能）

多模态模型

垂直行业模型

Telecommunications Equipment

元醒训练推理一体机

AIGC（生成式人工智能）

多模态模型

垂直行业模型

Telecommunications Equipment

元醒训练推理一体机

后端到端时代：我们必须寻找新的道路吗？

自动驾驶之心· 2025-09-01 23:32

行业技术发展趋势 - 2025年VLA（Vision-Language-Action）成为行业新焦点，但技术路径出现明显分歧，部分企业积极推广而部分头部团队选择回避 [1][5][6] - 相较于2023-2024年端到端技术达成行业共识的局面，VLA技术路线呈现"分歧中的探索"态势 [5][6] - 技术切换期被视为占领用户心智和证明研发优势的关键窗口 [4] 企业战略布局差异 - 理想汽车通过VLA巩固端到端技术红利带来的领先优势 [4] - 元戎启行借助VLA提升辅助驾驶系统性能上限 [4] - 小鹏汽车将具身智能领域积累的VLA技术迁移至辅助驾驶系统，并采用自研高算力芯片解决实时性问题 [4][22] - 华为ADS明确主张WA（World Model + Action）为自动驾驶终极方案，回避VLA路径 [5] - 蔚来在低速场景应用世界模型但对外宣传保持低调 [5] - 地平线否认其HSD系统属于VLA，坚持VA（Vision-Action）技术路线 [23] VLA技术原理与应用 - VLA通过视觉模块感知环境、语言模块表述任务、动作模块执行驾驶行为，实现感知-决策一体化 [9] - 技术优势在于结合端到端的性能与语言的可解释性，理想状态下可映射人类驾驶本能 [10] - Wayve的LINGO系列实现边驾驶边用自然语言解释决策，LINGO-2支持实时语言指令调整行为 [12] - OpenDriveVLA融合2D/3D视觉token与语言生成控制轨迹，在Nuscenes数据集取得最优结果 [14][16] - 谷歌Deepmind的RT系列将互联网视觉-语言知识迁移至机器人控制，提升泛化能力 [17][18] 技术挑战与局限性 - 自然语言存在模糊性与不完备性，例如"慢一点"等指令缺乏精确动作约束 [19] - 语言-动作不对称性问题导致监督学习存在噪声，语言主要在任务级别有效而非细粒度控制 [19] - 多模态Transformer推理开销巨大，OpenVLA模型约7B参数需15GB显存且运行频率仅6Hz，低于行业10Hz标准 [21] - 实际部署中多用于上层任务分配，轨迹输出仍由传统模型执行并需兜底机制 [23] 替代技术路径发展 - VA（Vision-Action）方案通过内隐世界模型实现环境状态向量化表示，华为与地平线采用此路径 [23] - 地平线HSD系统通过深度神经网络实现决策统一性，在不同场景下保持自适应行为 [25] - 采用平衡数据分布并筛选优化人类驾驶数据，使决策更符合直觉 [25] - 坚持模块最小化架构，屏蔽激光雷达输入以避免感知依赖，保持系统简洁性与可维护性 [28] - 纯视觉版本结合软硬件一体方案具备成本优势 [31] 行业本质问题与未来方向 - 辅助驾驶核心问题仍是缺乏对世界的深度理解能力 [33] - 语言作为新输入维度类似激光雷达，提供抽象能力但非终极解决方案 [33] - 行业面临选择新道路或深化现有路径的战略抉择，不同技术路线均存在发展机会 [34]

多模态模型

多模态模型

Diffusion 一定比自回归更有机会实现大一统吗？

机器之心· 2025-08-31 01:30

Diffusion架构与自回归架构在多模态大一统模型中的对比 - 多模态能力被视为实现人类级别智能的必要条件构建大一统模型成为关键目标旨在用单一架构统一处理文本图像音频视频 3D模型及机器人动作信号等异构数据类型[8] - 自回归架构长期主导多模态领域 Transformer系列LLM从NLP扩展至多模态催生LLaVa Qwen-VL InternVL Ovis和GPT4等模型[8] - 扩散架构原主要应用于视觉生成领域如Stable Diffusion和DiT 但近期扩散语言模型在NLP任务突破重新引发对其实现多模态大一统潜力的关注[8] Diffusion架构的理论优势与潜力 - 扩散范式天然支持并行生成精细化控制和动态感知这些是自回归模型难以实现的能力[9] - 离散扩散架构被强调为替代自回归实现多模态统一处理的潜在方案[9] - 扩散语言模型通过并行生成和迭代式去噪解决自回归模型推理速度瓶颈具有扩展至其他模态的潜力[9] 生成式建模的信息论基础 - 自回归模型本质是预测下一个token 通过最小化序列描述长度实现无损压缩尤其适应NLP任务[9] - 多模态自回归模型需将输入转换为一维序列早期使用双编码器架构分别处理图像文本后转向仅解码器架构并通过连接器转换图像嵌入[10] - 扩散架构本质是纠错机制正向加噪和反向去噪过程同样构成强大压缩框架且支持两种压缩模式[11]

自回归（AR）

大一统模型

多模态模型

Artificial Intelligence

自回归（AR）

大一统模型

多模态模型

Artificial Intelligence

中信建投 TMT周观点

2025-08-24 14:47

纪要涉及的行业和公司 - **行业**：AI、电影、国防军工、PCB、覆铜板 - **公司**：微软、Salesforce、Adobe、Applovin、多邻国、Snowflake、Elasticsearch、MongoDB、Unity、谷歌、苹果、字节跳动、快手、英伟达、亚马逊、猫眼娱乐、上海电影、阿里影业、生益电子、沪电股份、生益科技纪要提到的核心观点和论据 AI 应用端公司 - **微软**：2025 财年 AI 应用收入预计接近 120 亿美元，Copilot 业务预计收入 20 亿美元，GitHub 贡献约 6 亿美元，均超预期[1][2] - **Salesforce**：Einstein Automate 营收超 1 亿美元，略低于预期，Data Cloud 营收 10 亿美元，同比增长 120%；以 80 亿美元收购云数据库公司增强数据基础能力，预计 2026 年产生影响[1][2][3] - **Adobe**：4 月 Figma 使用量达 220 亿次，纯 AI 业务占比低但增速显著，预计 2025 年 Q4 翻倍[3] - **Applovin**：财报表现良好，但成本上升红利期接近尾声，三方成交广告地位稳固但增长空间受限[3] - **多邻国**：最新季度 Maxim 渗透率达 7%，用户约 70 万，总体渗透率预计达 15%，Maxim 净收入占比可达 15%-20%[3] AI 基础设施公司 - **Snowflake**：营收同比增长 26%，利润同比增长 25%，上调全年预期；RPO 同比增长 34%，新增高价值客户 606 家；推出 Near Intelligence、OpenFlow 和 Cortex 新型 AI Circle 功能巩固领先地位[1][4] 其他公司动态 - **Unity**：处于困境反转阶段，广告业务受季节性因素有压力；7 月将推出 6.2 版本 AI 引擎，整合 Moses 和 Censusf 功能[7] - **谷歌**：多模态模型日均 TOKEN 消耗量约 16 万亿，VU3 正式版加速多模态商业化进程，VU3 定位服务专业创作者，面向美国 Ultra 订阅用户开放，月定价 249.99 美元[2][8][9] - **苹果**：WWDC 2025 大会预计展示新技术与产品更新，内部测试更强大的大模型，或支持端侧设备运行[1][11][12] - **字节跳动**：将在动力大会宣布豆包大模型家族升级，端侧 AI 产品有望加速落地[1][12] - **快手**：可灵 AI 年化收入运营率（ARR）在 2025 年 3 月突破 1 亿美元，连续两月突破 1 亿人民币营收，为 B 端用户提供服务并为超 1 万家企业客户提供 API 服务[10] 算力需求与应对 - **需求增加原因**：大厂与基础业务深度融合、大型 agent 涌现、多模态任务消耗大量算力[2][13] - **TOKEN 消耗与影响**：谷歌日均约 16 万亿，国内大厂年底预计达 40 - 60 万亿，今年 Q4 国内可能算力不足，国产算力产业链发展斜率更陡峭[2][14] - **海外应对措施**：72 机柜增量集中在铜线、电源、散热、PCB 升级，关注英伟达和亚马逊芯片配套；产业链库存下降，上游备库 1.3 倍，上游材料价格上涨[15][16] 电影行业 - **暑期档**：预期较低，但《姜元弄》《长安荔枝》等优质影片可能带动票房回暖[2][22] - **全年票房**：预计 2025 年可达 500 亿左右，关注底部标的猫眼娱乐[2][23] 其他行业 - **GW 星座卫星互联网项目**：第四批卫星 6 月 6 日成功发射，发射频率逐步加快，今年国防军工领域需求有望回暖[27] - **PCB 板块**：4 - 5 月高阶数通 PCB 订单能见度高，高端产能偏紧；产业链下行风险减弱，供需偏紧格局难缓解，关注 ASIC 产业链和高多层领域企业[28][29] - **覆铜板行业**：常规产品提价，汽车需求旺盛，6 月后涨价节奏趋缓；高速产品供不应求，关注高速覆铜板供应商[30] 其他重要但可能被忽略的内容 - **数据云和数据层面布局**：Snowflake、Elasticsearch 和 MongoDB 等公司持续投资，巨头收购趋势加强，数据咨询和数据标签订单加速增长[1][6] - **英伟达散热环节**：散热是技术路线升级关键，现有散热技术达极限，散热系统在 IMV 中价值占比高，中国厂商在冷板元器件及部件领域有发展空间[18][19][21] - **上海电影**：8 月 2 日定档《狼山小妖怪》，参投的 AI 玩具公司 6 月中旬发布首款玩具并发售，与卡牌和手办公司合作推出衍生品[24] - **阿里影业**：关注 IP 开发和线下演出市场，暑期或国庆档有望上映《东极岛》，今年有望业绩修复[25][26]

多模态模型

软件与服务

电影与娱乐

多模态模型

软件与服务

电影与娱乐

马斯克旗下xAI联合创始人伊戈尔·巴布什金离职，将投身AI安全风投领域

搜狐财经· 2025-08-14 05:40

公司动态 - 巴布什金作为xAI工程团队核心人物主导技术架构搭建与超级计算集群建设助力公司在两年内进入全球AI模型开发第一梯队 [1] - xAI已启动全球人才招募计划重点补充AI安全与多模态模型领域专家 [1] - 马斯克公开感谢巴布什金对公司技术基础的贡献承认其对公司成就的关键作用 [1] 行业动向 - 巴布什金将创立风险投资公司Babuschkin Ventures 专注投资AI安全研究及具有"推动人类进步解锁宇宙奥秘"愿景的初创企业 [1]

伊戈尔(SZ:002922)

多模态模型

Artificial Intelligence

多模态模型

Artificial Intelligence