DeepSeek V3.2
搜索文档
【国盛计算机】算力&存力依旧
新浪财经· 2025-12-21 02:42
字节与腾讯的AI战略动态 - 字节跳动在FORCE原动力大会上宣布,截至今年12月,其豆包大模型日均tokens使用量已突破50万亿,位居中国第一、全球第三,已有超过100家企业在火山引擎上累计tokens使用量超过一万亿,而今年5月底该数据为超过16.4万亿,较去年5月发布时增长137倍 [1][7][24][30] - 字节在大会上发布了豆包大模型1.8和豆包视频生成模型Seedance 1.5 pro,并宣布其大模型家族在多模态理解和生成能力、Agent能力上已位于全球第一梯队,同时火山引擎升级了AI云原生全栈服务,推出企业级AI Agent平台AgentKit和HiAgent智能体工作站 [8][31] - 腾讯于12月17日宣布升级大模型研发架构,新成立AI Infra部、AI Data部和数据计算平台部,并任命前OpenAI研究员姚顺雨为“CEO/总裁办公室”首席AI科学家,同时兼任AI Infra部和大语言模型部负责人,旨在提升AI大模型研究能力与研发效率 [1][9][24][32] 全球大模型技术迭代与竞争 - 谷歌发布的Gemini 3 Pro在多模态理解和长期规划能力上实现核心突破,模型可在文本、图像、视频、音频与代码之间进行精细推理,尤其在屏幕理解任务上表现突出,并在Vending-Bench 2测试中展示出长达一年的可靠规划与工具使用能力 [2][10][25][33] - OpenAI发布的GPT-5.2聚焦专业知识型工作场景,在复杂文档、数据分析、代码开发和多步骤项目管理中表现显著提升,其提出的GDPval评测体系显示,GPT-5.2在70.9%的知识型任务中表现优于或与顶尖人类专家持平 [2][11][12][25][34][35] - 国产模型DeepSeek V3.2系列通过稀疏注意力机制、大规模后训练与合成数据等创新路径实现能力跃升,在公开推理基准测试中达到GPT-5水平,略低于Gemini-3.0-Pro,但团队坦承其世界知识广度仍落后于顶尖闭源模型,主要受限于预训练算力 [2][12][13][25][35][36][37] AI驱动的存储需求与供应格局 - 存储芯片巨头美光科技2026财年Q1营收达136.4亿美元,同比增长57%,远超预期的129.5亿美元,调整后净利润为54.82亿美元,同比增长58%,其中云存储部门销售额52.8亿美元,同比翻倍 [3][14][26][37] - 美光科技表示其2026日历年的所有HBM产能已全部售罄且价格销量锁定,预计HBM市场规模到2028年将达到1000亿美元,比之前预测提前两年,公司正首次与客户谈判带有强制性条款的多年期供货合同,并将2026财年资本支出上调至200亿美元 [3][15][26][38] - 2025年10月,OpenAI以“星际之门”为名与三星和SK海力士签署协议,锁定每月高达90万片DRAM晶圆供应,约占全球DRAM产量的40%,AI服务器对HBM和DDR5企业级内存的需求正大量消耗晶圆产能,导致原厂将产能优先分配给高利润产品,对消费级产品造成排挤 [3][16][26][39] 端侧AI Agent的应用突破 - 字节跳动于12月1日发布豆包手机助手预览版,作为面向手机厂商的系统级AI服务,将豆包大模型深度嵌入操作系统,实现以语音或简单指令替代复杂手动操作,功能覆盖跨平台比价点外卖、内容搜索等场景,并与中兴合作推出首款售价3499元的打样手机 [4][17][27][40] - 豆包手机助手上线后引发了部分被操作App的抗拒,在微信、农行、建行等社交和金融类应用中出现登录异常、功能受限甚至账号短暂封禁的问题,字节于12月5日发布说明,对AI操作手机能力进行规范化调整,主动限制刷激励、金融类应用及部分游戏场景 [4][18][27][41] - 豆包手机助手被视为大模型应用落地的重要突破,标志着端侧Agent时代的开启,预示着移动交互范式将从以应用为中心的图形用户界面向由自然语言驱动、能完成跨App任务编排与执行的Agentic交互演进 [4][19][27][42] 建议关注的投资方向 - 算力领域建议关注的公司包括寒武纪、海光信息、中际旭创、中芯国际、浪潮信息、中科曙光等 [6][20][29][43] - Agent领域建议关注的公司包括谷歌、阿里巴巴、腾讯控股、第四范式、科大讯飞、恒生电子等 [6][20][29][43] - 其他相关领域建议关注自动驾驶方向的江淮汽车、赛力斯、小鹏汽车、理想汽车等,以及军工AI方向的拓尔思、能科科技、中科星图等 [6][21][29][44]
Top China Tech Plays in US Markets Amid Trade Deal Progress
ZACKS· 2025-12-18 15:21
贸易环境改善与市场情绪 - 中美于2025年10月在韩国釜山签署贸易协议后 包括腾讯、哔哩哔哩、网易和拼多多在内的中国科技股获得上涨动力 [2] - 美国贸易代表于12月7日确认中国履行了承诺 包括终止半导体调查和恢复农产品采购 [2] - 关税维持在49% 稀土出口管制暂停至2026年11月 中国科技公司在持续结构性紧张中展现出跨行业的韧性 [2] 半导体与先进制造 - 中芯国际在2025年12月使用深紫外光刻技术 在不依赖受限制的EUV设备的情况下实现了5纳米芯片的量产 用于华为麒麟9030处理器 代表了中国最先进的国内半导体制造成就 [3] - 中国晶圆厂在全球前十大生产商的成熟制程产能中占比超过25% 尽管面临西方出口限制 设备投资仍同比增长53% [3] - 在“中国制造2025”目标中 先进材料领域已完成75% [9] 新能源汽车与电池技术 - 比亚迪11月出口量同比增长326%至131,935辆 全球领先特斯拉388,000辆 [4] - 中国新能源汽车渗透率在12月初达到62% 比亚迪2025年出口量有望超过100万辆 [4] - 公司五分钟充电技术可提供250英里续航 优于特斯拉的15分钟超级充电桩 并免费提供高级驾驶辅助系统 [4] - 中国船厂在2024年获得了全球38%的新液化天然气船舶订单 [9] 人工智能与云计算 - DeepSeek的V3.2模型以600万美元的训练成本实现了与GPT-5相当的性能 而西方竞争对手的成本超过1亿美元 [5] - 阿里巴巴承诺三年内向人工智能基础设施投入524亿美元 并推出了其Qwen推理模型系列 [5] - 包括百度、腾讯和阿里巴巴在内的主要公司现在提供免费的人工智能服务 加速了技术普及 [5] 机器人、航空航天与国防 - 人形机器人领域在九个月内完成了610笔投资交易 总额达70亿美元 同比增长250% 比亚迪和小鹏等电动汽车制造商已将人形机器人集成到工厂运营中 [6] - 中国商飞截至2024年交付了12架C919飞机 年产能为50架 但交付量远低于早期雄心勃勃的目标 供应链仍依赖CFM国际的LEAP发动机 目标是拓展东南亚市场 [6] - 中国2025年国防预算增长7.2% 达到2490亿美元 9月胜利日阅兵展示了100型坦克、LY-1舰载激光武器和YJ系列高超音速反舰导弹 [7] - 核武库达到600枚弹头 预计到2035年将显著扩大至1500枚 [7] 医疗设备与创新 - 中国医疗器械市场在2025年达到1729亿美元 由超过33,000家制造企业支撑 较2020年大幅增长27.8% [8] - 国家药监局批准了65项创新医疗器械 优先考虑人工智能诊断、手术机器人和新型生物材料 [8] 高端装备与能源基础设施 - CR450高速动车组原型车时速现可达400公里 [9] - 中国中车保持了56%的全球市场主导份额 [9] - 国家对稀土材料、合成钻石和电池组件实施出口管制 反映了其战略重要性 [9] - 国家电网在2025年创纪录地投资887亿美元 扩展特高压输电网络 [9] - 储能容量超过100吉瓦 占全球安装量的59% 智能电网投资达230亿美元 [9] 宏观经济与市场展望 - 中共中央政治局宣布“适度宽松”的货币政策 高盛将GDP增长预测上调至4.8% [10] - MSCI中国指数相对于美国市场的估值有47%的折价 在贸易关系稳定背景下呈现机会 [10] 重点公司分析:腾讯控股 - 公司凭借其主导的社交媒体和游戏平台 有望从消费者支出增加中受益 [12] - 2025年12月宣布国际游戏销售额创纪录达100亿美元 逆行业放缓之势 2025年第三季度收入增长15% 其中国际游戏激增43% [12] - 拥有14亿微信用户 人工智能集成增强了广告和游戏业务 核心业务保持稳健 [12] - 管理层信心通过32%的股息增长和持续股票回购体现 中国2026年针对国内消费的支持性政策与腾讯多元化生态系统相符 [12] 重点公司分析:哔哩哔哩 - 公司在2025年第三季度实现扭亏为盈 录得4.69亿元人民币净利润 而去年同期为亏损 调整后净利润同比增长233% [13] - 连续13个季度毛利率扩张至36.7% 显示卓越运营能力 广告收入增长23% [13] - 拥有1.17亿日活跃用户 日均使用时长创纪录达112分钟 月付费用户达到3500万 货币化正在加速 [13] - 管理层中期目标为40-45%的毛利率 2025年12月的股票期权行权表明对持续增长的信心 [13] 重点公司分析:网易 - 公司受全球游戏势头加速推动 2025年12月推出的跨平台手机游戏《逆水寒》显著扩大了市场覆盖 [14] - 2025年第三季度游戏收入同比增长11.8%至233亿元人民币 显示核心业务强劲 [14] - 与暴雪的合作因《暗黑破坏神IV》于12月12日在中国上线而得到加强 释放了巨大的国内收入潜力 [14] - 公司将50亿美元的股票回购计划延长至2029年1月 显示了管理层信心并回馈股东 随着2026年《永劫无间》手游上线及漫威、武侠等多IP布局 公司为持续增长做好了战略定位 [14] 重点公司分析:拼多多控股 - 公司在2025年11月公布的第三季度业绩稳健 收入增长9% 净利润增长17% 显示出强大的运营实力 [15] - 双平台战略——拼多多主导中国电商 Temu全球扩张——使公司拥有显著的规模优势 [15] - 公司财务状况异常健康 拥有3870亿元人民币现金储备 零长期债务 净资产收益率超过25% [15] - 对商家的战略性支持投资和生态系统发展举措使拼多多为可持续长期增长做好了成功定位 [15]
Xiaomi MiMo-V2-Flash开源:能力比肩标杆闭源模型Claude 4.5 Sonnet
凤凰网· 2025-12-17 10:26
凤凰网科技讯12月17日,小米官方宣布Xiaomi MiMo-V2-Flash开源。据悉,该模型是小米专为极致推理 效率自研的总参数309B(激活15B)的MoE模型,通过引入Hybrid注意力架构创新及多层MTP推理加速, 在多个Agent测评基准上进入全球开源模型Top2。代码能力比肩标杆闭源模型Claude4.5Sonnet,但推理 价格仅为其2.5%且生成速度提升至2倍。 今日上午的2025小米"人车家全生态"合作伙伴大会上,Xiaomi MiMo大模型负责人罗福莉也介绍了该模 型构建的细节。她称,Xiaomi MiMo-V2-Flash在大部分评测基准上超过了DeepSeek V3.2和K2- Thinking,同时对比参数量减少了二分之一至三分之二,在全球大致处于相同水位的顶尖模型速度和成 本象限里,MiMo-V2-Flash实现了低成本、高速度,已初步具备模拟世界的能力。 罗福莉称,在她看来,下一代智能体系统不是一个"语言模拟器",而是一个真正理解人类世界,并与之 共存的"智能体"。Agent执行能力方面,应实现从"回答问题"到"完成任务"的转变,具备记忆、推理、 自主规划、决策、执行等能力。从 ...
AI 赋能资产配置(三十三):DeepSeek 与 Gemini,谁更懂 A 股?
国信证券· 2025-12-14 11:57
核心观点 - 大模型具备一定的技术分析基本功,能够在合适提示词下完成缠论的基础构件识别,如顶底分型、笔、线段和中枢的划分 [1] - 对于已成型走势,大模型具备一定的系统性技术分析能力,但在精细化概念界定上存在分歧 [1][3] - 在推演未来走势方面,Gemini 3 Pro 在短期内更精准地抓住了“背驰+中枢”的核心逻辑,其分类路径、关键点位与实际市场演绎路径的匹配度更高 [3] - 在易用性方面,Gemini 的 Nano Banana Pro 能够完成简易图形标注,在实际使用便利性上略胜一筹 [1] 测试方法与设计 - 测试遵循“四同原则”以确保公平公正:数据同源(均使用上证指数标准化OHLC数据)、提示词同构、环境同期、评估标准统一(基于缠论原文的客观人为评估)[2][17] - 测试目标为系统评估DeepSeek V3.2与Gemini 3 Pro在缠论分析任务上的能力图谱与局限性,而非评选优胜者 [13] - 构建了分层级评价体系:第一层基础规则遵循度、第二层递归结构与层级分析能力、第三层动态分析与分类判断能力、第四层综合表述与实战逻辑一致性 [14] 技术分析基本功对比 - **K线包含处理**:DeepSeek将65根原始K线合并为48根标准K线,Gemini合并为49根,两者方向判断与取值基本符合规则,但Gemini对规则表述更严谨 [20][28][40] - **顶底分型识别**:DeepSeek识别出8个顶分型和7个底分型,但存在“待确认分型”;Gemini识别分型特征更精准,无模糊分型 [23][30][40] - **笔的划分**:DeepSeek划分了14笔,但存在“未完成笔”且笔的交替性有混乱,违背了“顶底间至少有一根独立K线”的核心规则;Gemini划分了7笔,严格遵循“一顶一底”结合律与间隔规则,笔列清晰准确 [27][34][40] - **线段与中枢识别**:DeepSeek识别了两个线段,但线段2未明确中枢;Gemini对线段和中枢(如前5笔重叠形成的中枢)的描述更完整 [28][35][40] - **逻辑一致性与表述清晰度**:DeepSeek各步骤推导环环相扣但笔划分混乱导致逻辑链断裂;Gemini各步骤结果相互支撑,逻辑更自洽,且结构化输出搭配图表更直观 [40] 已成型走势分析对比 - **测试设计**:要求模型对2024年8月1日至2025年12月8日的上证指数日线进行完整缠论解构,涵盖走势概览、多级别递归分析、动力学分析及综合结论 [43] - **系统递归性**:两者均按“笔→线段→中枢→走势类型”分层拆解,但Gemini的递归逻辑更严谨,对中枢扩张、走势类型的定义更贴合缠论递归规则 [47][55][60] - **定义准确性**:DeepSeek对三类买卖点的几何条件描述较笼统;Gemini对买卖点的认定严格对应几何条件,定义准确性更高 [49][57][60] - **结构洞察力**:DeepSeek未提及走势多义性、特征序列缺口等结构细节;Gemini能精准识别结构细节,如“跌破中枢下沿后被拉回”的多义性,对中阴阶段认知清晰 [60] - **动力学分析深度**:两者均分析了背驰的价格、K线形态及MACD特征,但Gemini的力度对比维度更丰富,转折级别预判的逻辑更严密 [60] - **实战复盘价值**:DeepSeek的买卖点分析与走势贴合,但实战建议偏框架;Gemini的买卖点、关键位(如3800/3674)、操作策略更具体,实战指导性更强 [60] 走势推演能力对比 - **测试设计**:基于2025年8月15日至11月14日(约3个月)的数据,让模型进行未来1个月的走势完全分类推演 [63][64] - **历史结构分析**:DeepSeek输出较短,划分笔数较多;Gemini在走势定义、结构拆解及关键特征上给予了更详细的研判 [67] - **推演路径与准确性**:DeepSeek给出4类路径(中枢震荡延续、扩展、第三类卖点/买点形成),但未明确背驰核心逻辑;Gemini给出分类路径并赋予概率,其“路径一”(60%概率出现趋势背驰,一卖成立)与实际市场演绎路径(11月中和12月上旬分别形成日线一卖和二卖)更贴近 [3][67][70] - **中期推演验证**:在基于更长周期数据推演季度行情的案例中,Gemini在预测时更精准地抓住“背驰+中枢”核心逻辑,其分类路径、关键点位、操作策略与实际走势的匹配度略高于DeepSeek [70][72] 模型综合能力图谱 - **DeepSeek V3.2**:优势在于强大的中文语境理解、长文本生成能力,能快速构建结构工整的分析框架,分类路径完整 [75][78]。不足在于对非公理化严密逻辑的执行精度有待提升,在笔划分等基础环节易出错,且预测时缺乏基于核心矛盾的倾向性判断 [40][75] - **Gemini 3 Pro**:优势在于逻辑推理严谨,对缠论几何规则遵循度高,几乎零误差,且似乎“理解”了背后的动力学原理,能敏锐捕捉“趋势背驰”与“中枢扩展”等关键信号,给出的点位具有高实战价值 [3][76][78]。在易用性上,其Nano Banana Pro的简易图形标注功能也更便利 [1][76] - **应用定位**:两者在适当提示词引导下,均能作为辅助工具帮助搭建分析框架或进行趋势判断,但对其生成的具体结构(如线段、背驰类型)需进行人工复核,不应依赖其结论进行交易决策 [76]
AI赋能资产配置(三十三):DeepSeek与Gemini,谁更懂A股?
国信证券· 2025-12-14 11:07
核心观点 - 大模型具备一定的技术分析基本功,能够在合适提示词指引下完成缠论的基础构件识别,如顶底分型划分、笔和线段擘画以及中枢构建 [1] - 对于“已成型”走势,大模型具备一定的系统性技术分析能力,但在精细化概念界定上存在分歧 [1] - 在推演能力上,Gemini 3 Pro 短期内“更懂 A股”,其推演路径与实际市场走势匹配度更高 [3] - 在易用性方面,Gemini 的 Nano Banana Pro 能够完成简易图形标注,在实际使用便利性上略胜一筹 [1] 测试方法与公平性保证 - 测试遵循“四同原则”以确保公平公正:数据同源(均使用上证指数标准化OHLC数据)、提示词同构、环境同期、评估标准统一(基于缠论原文的客观人为评估)[2][17] - 测试采用分层级评价体系,从基础规则遵循度、递归结构与层级分析能力、动态分析与分类判断能力到综合表述与实战逻辑一致性,逐步提升任务复杂性 [14] 大模型的技术分析基本功 - **K线包含处理**:DeepSeek V3.2 将原始65根K线合并为48根标准K线,Gemini 3 Pro 合并为49根,两者均能明确处理原则,但Gemini对规则表述更严谨 [20][28][40] - **顶底分型识别**:DeepSeek 识别出8个顶分型和7个底分型,但存在“待确认分型”;Gemini 识别精准,无模糊分型 [23][30][40] - **笔的划分**:DeepSeek 划分了14笔,但存在“未完成笔”且笔的交替性有混乱,违背了核心规则;Gemini 划分了7笔,严格遵循“一顶一底”及间隔独立K线规则 [27][34][40] - **线段与中枢初步识别**:DeepSeek 识别了一个向下线段(已完成)和一个向上线段(进行中),但对第二个线段的中枢描述不明确;Gemini 对线段和中枢的识别描述更完整 [28][35][40] - **综合评分**:在缠论基础规则遵循度对比中,Gemini 总分更高(逻辑一致性9分,表述清晰度9分),DeepSeek 在笔的划分(6分)和逻辑一致性(8分)上存在不足 [40] 对“已成型走势”的解读能力 - **测试设计**:要求模型对2024年8月1日至2025年12月8日的上证指数日线进行完整缠论解构,涵盖走势概览、多级别递归分析、动力学分析及综合结论 [43] - **DeepSeek V3.2 表现**:能按“笔→线段→中枢→走势类型”分层拆解,明确了下跌、上涨、盘整三阶段的递归关系,但对线段c的描述为“未完成”,弱化了递归完整性 [47][60] - **Gemini 3 Pro 表现**:以“笔→线段→中枢(扩张型)→走势类型(a+A+b)”构建了更清晰的递归链,各层级衔接紧密,对中枢扩张、走势类型的定义更贴合缠论递归规则 [55][60] - **关键能力对比**:Gemini 在定义准确性(严格遵循买卖点几何规则)、结构洞察力(识别走势多义性与特征序列缺口)及实战复盘价值(买卖点与关键位更具体)上均优于DeepSeek [60] 走势推演能力对比 - **测试设计**:基于2025年8月15日至11月14日(约3个月)的数据,让模型进行未来1个月的走势推演,要求进行历史结构分析、当下定位与完全分类 [64] - **历史结构分析**:DeepSeek 输出较短,划分笔数较多;Gemini 分析更详细,将走势解构为标准的“两中枢上涨趋势”(a+A+b+B+c),并明确了两个日线中枢的区间 [67] - **推演路径与准确性**:DeepSeek 给出四种路径(中枢震荡延续、扩展、第三类卖点/买点形成),但未明确核心逻辑;Gemini 给出了分类路径的形成概率,其高概率路径(“顶背离确认,向下回到中枢”,概率超60%)与实际走势更贴近,成功预测了11月中和12月上旬形成的日线级一卖和二卖 [67][70] - **综合评估**:在短期和中期推演案例中,Gemini 更精准地抓住了“背驰 + 中枢”的核心逻辑,其分类路径、关键点位(如3960/4000)、操作策略与实际走势的匹配度更高 [70][72] 模型特性总结与能力图谱 - **DeepSeek V3.2**:优势在于强大的中文语境理解、长文本生成和宏观叙事能力,能快速构建结构工整的分析框架;不足在于对缠论严密逻辑的执行精度有待提升,尤其在笔的划分上出现基础错误,导致后续分析基础不稳,且在预测中缺乏基于核心矛盾的倾向性判断 [75][78] - **Gemini 3 Pro**:优势在于逻辑推理严谨,几何规则遵循度高,几乎在基础处理上零误差,并能深入理解缠论的动力学原理,在实战预测中能敏锐捕捉“趋势背驰”与“中枢扩展”等关键信号,提供具高度实战价值的分析;此外,其Nano Banana Pro的图形标注功能提升了易用性 [76][78] - **核心结论**:两者均可作为辅助工具帮助搭建分析框架或进行趋势判断,但需对其生成的具体结构(如笔、线段、背驰)进行人工复核,不可直接依赖其结论进行交易决策 [76]
模型的迭代远未结束
国盛证券· 2025-12-14 06:32
行业投资评级 - 增持(维持)[6] 核心观点 - 全球顶尖大模型仍处于高速迭代阶段,技术路线与能力边界持续刷新,算法创新、后训练扩展与Scaling Law仍在持续生效,顶尖模型的竞争与演进远未结束[1][19] - AI算力底座正从Hopper架构过渡至Blackwell架构,其系统性跃升不仅缩短训练时间、改善经济性,更通过支持更大Batch Size等方式,有望推动2026年起新一代模型智能水平的系统性提升[2][3][20][25] - 字节豆包手机助手将大模型深度嵌入操作系统,革新移动交互体验,标志着端侧Agent时代的开启,移动交互范式正从GUI向Agentic交互演进[4][28] 模型技术迭代 - **谷歌Gemini 3 Pro**:核心突破在于世界领先的多模态理解与长期规划能力,能在文本、图像、视频、音频与代码间进行精细推理,尤其在屏幕理解(Screen Understanding)任务上表现突出,并在Vending-Bench 2测试中展现了长达一年的可靠规划与工具使用能力[1][13] - **OpenAI GPT-5.2**:聚焦专业知识型工作场景,在复杂文档、数据分析、代码开发和多步骤项目管理中表现显著提升,其提出的GDPval评测体系从真实职业任务出发衡量模型经济价值,GPT-5.2在70.9%的对比项目中表现优于或与顶尖人类专家持平[1][14][15] - **国产模型DeepSeek V3.2**:通过DSA稀疏注意力机制、大规模后训练(后训练算力预算超预训练成本10%)与合成数据等创新路径实现能力跃升,在公开推理基准测试中达到GPT-5水平,官方坦承其相比顶尖闭源模型的弱势在于预训练算力不足,表明模型能力尚未触及天花板[1][16][17][18][19] 算力底座升级 - **性能全面领先**:Blackwell架构在FP32、FP16、BF16、INT8等主流精度下计算性能全面领先于Hopper架构,并原生支持FP4精度计算[2][21][23] - **内存与互联升级**:单卡显存容量与带宽同步升级(如B200显存达192GB HBM3e,带宽达7.7TB/s),更适合承载大参数模型并减少跨卡通信开销;新一代NVLink互联带宽达1.8TB/s,显著提升多卡及集群扩展效率[2][21][23] - **经济性与训练优势**:Blackwell性能提升幅度高于价格提升,带来显著的“每美元性能”改善,在基于MLPerf的Llama 3.1 405B训练对比中,GB200 NVL72的美元性能几乎是H100的2倍[2][23] - **赋能模型设计**:更强的单卡能力与集群互联支持使用更大的Batch Size,有利于梯度稳定性、收敛质量和计算效率,同时使开发者能探索更深的网络结构、更复杂的算法及更长上下文的训练方式,为2026年新一代模型奠定基础[3][24][25] 应用落地突破 - **字节豆包手机助手**:作为面向手机厂商的系统级AI服务,将豆包大模型深度嵌入操作系统,用户可通过语音或简单指令替代复杂手动操作,能力覆盖跨平台比价点外卖、内容搜索与攻略整理等场景[4][26] - **引发行业反应**:上线后引发部分App(如微信、农行、建行等)的抗拒,出现登录异常、功能受限甚至短暂封禁问题,字节随后主动发布说明,对刷激励、金融类应用及部分游戏场景的AI操作能力进行规范化调整[4][27][28] - **标志性意义**:该产品是大模型应用落地的重要突破,标志着端侧Agent时代的开启,预示移动交互范式将从以应用为中心的GUI向由手机Agent完成跨App任务编排的Agentic交互跃迁[4][28] 建议关注标的 - **算力**:寒武纪、海光信息、中际旭创、新易盛、神州数码、中科曙光、浪潮信息、沪电股份、兴森科技、中芯国际、华虹半导体等[5][8][29] - **Agent**:谷歌、阿里巴巴、腾讯控股、科大讯飞、金山云、拓尔思、同花顺、恒生电子、用友网络、金蝶国际等[8][29][30] - **GUI/API Agent**:字节跳动、谷歌、阿里巴巴、中兴通讯、腾讯控股[29] - **自动驾驶**:江淮汽车、赛力斯、小鹏汽车、理想汽车、禾赛、地平线[9][30] - **军工AI**:拓尔思、能科科技、普天科技、品高股份、海格通信、中科星图[9][30]
计算机行业双周报(2025、11、28-2025、12、11):英伟达H200芯片获批对华出售,关注国产算力发展机遇-20251212
东莞证券· 2025-12-12 08:40
报告行业投资评级 - 超配(维持)[1] 报告核心观点 - 英伟达H200芯片获批对华出售,但需向美方政府缴纳25%的收入分成,短期有望增强国内AI算力供应,缓解头部厂商算力瓶颈,长期在成本与技术限制下将倒逼国产算力快速发展,建议持续关注国产算力产业链发展机遇[4][31] 计算机行业行情回顾 - 申万计算机板块近2周(2025/11/28-2025/12/11)累计下跌3.01%,跑输沪深300指数3.82个百分点,在31个申万一级行业中排名第25名[4][11] - 申万计算机板块12月累计下跌3.79%,跑输沪深300指数4.35个百分点[4][11] - 申万计算机板块今年累计上涨14.05%,跑输沪深300指数1.64个百分点[4][11] - 近两周板块涨幅前三的个股为海峡创新(29.17%)、达华智能(28.37%)和永信至诚(25.84%)[16] - 近两周板块跌幅前三的个股为*ST立方(-52.81%)、浪潮软件(-24.40%)和佳华科技(-22.54%)[16] 板块估值情况 - 截至2025年12月11日,SW计算机板块PE TTM(剔除负值)为52.80倍,处于近5年84.54%分位、近10年70.80%分位[4][21] 重点产业新闻 - 美国政府将允许英伟达向中国出售其H200人工智能芯片,但对每颗芯片收取25%的费用[4][22] - DeepSeek发布V3.2正式版与V3.2-Speciale,推理能力在行业中处于领先位置[4][22] - 阿里成立千问C端事业群,首要目标是将千问打造成一款超级APP,成为AI时代用户的第一入口[4][22] - OpenAI推出了最新模型GPT-5.2系列,在制作电子表格、编写代码等多方面有显著提升[4][22] - 微软宣布未来四年将在印度投资175亿美元,布局AI与云计算业务,这是其在亚洲有史以来规模最大的一笔投资[4][24] 公司公告摘要 - **同方股份**:全资子公司拟转让同方工业信息技术80%股权,对应评估价值为1.36亿元[24] - **华大九天**:实际控制人拟以委托贷款方式向公司拨付国有资本经营预算资金2.5亿元,借款利率1.50%[25] - **海光信息**:董事会审议通过终止换股吸收合并中科曙光并募集配套资金的议案[25] - **神思电子**:拟将持有的上海术木医疗6.1990%股权以1000万元价格转让给全资子公司[26] - **神州信息**:控股股东计划减持不超过2882.73万股股份,占公司总股本的2.9543%[26] - **万集科技**:控股子公司拟引入战略投资者武汉高科,增资2000万元[27] - **信息发展**:拟对交信北斗海南增资,引入战略投资者,增资各方合计出资2.3亿元[28][29] - **佳华科技**:筹划以发行股份及支付现金方式购买数盾信息科技90%股份[29] - **华大九天**:投资1亿元参与设立合伙企业,总认缴出资额1.1亿元,用于投资数字芯片设计验证领域公司[30] - **开普云**:收到政府补助款项1800万元,占最近一年归母净利润的87.43%[30] 建议关注标的及理由 - **广电运通 (002152.SZ)**:金融科技主业稳健增长,同时数据要素、算力等领域布局持续深化[32] - **神州数码 (000034.SZ)**:作为“鲲鹏+昇腾”产业链核心伙伴,有望深度受益国产算力需求上升[32] - **浪潮信息 (000977.SZ)**:持续聚焦智慧计算,人工智能服务器连续3年全球第一,行业地位稳固[32] - **税友股份 (603171.SH)**:国内领先的财税信息化综合服务提供商,有望深度受益于新一轮财税改革[32] - **软通动力 (301236.SZ)**:华为核心合作伙伴,积极参与鸿蒙生态建设,已帮助1100余款产品接入鸿蒙智联生态[35] - **赛意信息 (300687.SZ)**:积极布局AI Agent领域,聚焦核心环节推出差异化智能体解决方案[35]
错过GPT时刻后,闫俊杰和中国“草根”们准备赢回来
观察者网· 2025-12-12 06:58
文章核心观点 - 中美AI竞争格局发生深刻变化,以MiniMax、DeepSeek为代表的中国开源AI企业,凭借技术实力、极致效率和独特的商业模式,正在全球舞台上与美国闭源巨头(如OpenAI、Anthropic)展开正面竞争并取得显著成果,中国AI从过去的“追随者”转变为“应用落地的引领者” [5][12][14] 行业竞争格局与历史脉络 - 中美AI领军人物(Anthropic的Dario Amodei与MiniMax的闫俊杰)有共同起点,均曾为百度北美实验室实习生,但后续发展路径不同,分别在美国和中国引领了大模型的发展 [1] - 十年前,中国团队虽洞察到AI趋势(如Scaling Law),但因特定产业环境未能率先突破,与美国在通用大模型发展上存在时间差 [1][4] - 当前,以DeepSeek、MiniMax为代表的中国开源模型企业,正与美国OpenAI、Anthropic等闭源模型生态进行全方位正面对决 [5] 中国AI企业的技术实力与突破 - **模型性能**:DeepSeek最新发布的V3.2模型在关键推理和数学能力上刷新了SOTA纪录,多项核心基准测试中足以比肩甚至部分超越谷歌Gemini 3 [7] - **实战应用认可**:MiniMax M2模型上线OpenRouter后,日Token消耗量一度突破500亿,是首个达到此成绩的中国模型,其份额与xAI、Google、Anthropic和OpenAI等美国闭源模型并驾齐驱 [9] - **架构与性价比**:MiniMax M2利用稀疏混合专家(MoE)架构将激活参数压至100亿,以仅为Claude 4.5 Sonnet 8%的极致性价比获得大量好评 [9] 中国AI企业的核心竞争力与组织模式 - **人才观与组织**:不迷信硅谷的“天价雇佣兵”或“天才光环”,认为中国年轻人蕴藏巨大潜力,关键在于有效组织;MiniMax内部技术大牛多从团队内部成长,靠钱并非留住创新者的核心 [6][7] - **战略定力与第一性原理**:在公司成立之初,坚定选择“技术驱动”之路,认为大模型时代真正的产品是模型本身,传统APP更像渠道 [10] - **极致效率与成本控制**:MiniMax-M1的强化学习过程仅使用512块英伟达H800 GPU训练三周,租赁成本为53.74万美元(约380万人民币),仅为OpenAI同等模型训练成本的零头 [11] - **人机协同**:公司内部使用AI Agent辅助工作(如自动修改代码),提升组织效率,实现了“实习生也有实习生”的人机协同奇景 [11] 商业模式与市场表现 - **商业闭环**:MiniMax今年年度经常性收入(ARR)已达1亿美元,在视频赛道率先实现正向现金流 [14] - **市场策略**:创新主阵地在Web端,因其能够不依赖买量而自然增长;拒绝“烧钱买量”的务实导向 [14] - **产品差异化**:在AI陪伴领域,产品Talkie不追求所有人喜欢,而是为目标用户提供独特价值,从而在强手如林的美国市场撕开口子 [15] - **全球化与用户导向**:公司坚持直接服务用户、坚持全球化、坚持技术驱动三条原则 [10] 行业影响与未来展望 - **资本效率对比**:全球投行Jefferies报告指出,中国头部AI公司的资本支出仅为美国的18%,但模型性能紧追不舍 [12] - **应用落地引领**:中国“开源军团”在全球应用市场全面开花,例如DeepSeek被诺贝尔奖得主保罗·罗默每日使用,海螺AI、可灵(Kling)等视频生成应用在美国创作者社区口碑炸裂 [14] - **生态冲击**:中国开源生态在性能与成本上对美国高投入闭源模式形成冲击,若OpenAI遭遇危机,可能引发美国整个相关生态的集体失败 [15] - **行业信心**:中国AI创业者自信未来三年内,即使不是自家公司,也会有其他中国团队能够做到引领世界 [15]
对谈刘知远、肖朝军:密度法则、RL 的 Scaling Law 与智能的分布式未来丨晚点播客
晚点LatePost· 2025-12-12 03:09
文章核心观点 - 大模型的发展存在“规模法则”和“密度法则”两条主线,前者追求能力跃迁,后者追求效率提升,即单位算力/参数下智能的最大化 [12][13][18] - 行业正从盲目追求模型规模转向追求能力密度,效率提升将加速端侧智能(如手机、汽车)和分布式智能的发展,最终实现每个人的“专属大模型” [9][10][35] - 强化学习尚未出现清晰的Scaling Law,是当前主要瓶颈,未来的关键方向是自主学习(Self-Learning)和“AI造AI” [24][34][36] 大模型演进的明线与暗线 - **明线:规模法则 (Scaling Law)**:自2018年预训练模型出现后,每隔几年模型能力就会跳跃一次,模型正变得更通用,甚至开始接近或超越人类在某些领域的能力 [12] - **暗线:密度法则 (Densing Law)**:这是大模型时代的“摩尔定律”,关注如何用更少的计算和数据资源更高效地获得智能,核心是追求单位计算带来的智能最大化 [13][14][18] - **密度法则的量化表现**:根据研究,大模型的能力密度(衡量单位参数/算力下模型能力的指标)每3.5个月翻一倍,自2023年1月ChatGPT出现后,这一速度在加快 [4][7] 提升模型能力密度的具体方法 - **模型架构优化**:核心方向包括采用稀疏化的混合专家系统以降低算力消耗,以及对注意力机制进行各种效率改进以应对长文本和Agent任务的需求 [19][20] - **数据治理与合成**:通过高质量的数据清洗、精选和合成,可以大幅提升训练效率,例如将预训练数据集精炼至不到原始容量的1/10,效果反而更好 [22][23] - **学习算法演进**:当前重点转向强化学习,但其尚未出现清晰的Scaling Law,主要瓶颈在于难以构建可扩展的环境和可验证的激励 [24][25] - **软硬一体协同优化**:结合芯片制程进步(摩尔定律)与模型能力密度提升,共同推动端侧设备承载以往只能在云端运行的大模型能力 [30][31] 强化学习的现状与未来探索方向 - **当前瓶颈**:强化学习缺乏像预训练那样清晰的Scaling Law,大多数训练仅几千步,如何持续稳定训练并构建“不可破解”的学习环境是核心挑战 [24][25] - **两条探索路径**:一是继续扩大RL的规模,探索开放域的激励定义;二是寻找更高效的新学习方式,提高样本效率,让模型能像人一样通过少量反馈学习新任务 [26][27] - **RL的已验证能力**:只要有足够数据和反馈,强化学习已能在数学、代码等特定任务上达到人类前0.1%甚至0.01%的水平,预示了打造垂直领域“超级专家模型”的潜力 [25] 端侧智能与分布式智能的未来 - **端侧算力规模**:2023年全国端侧算力(主要是手机)是数据中心算力的12倍,信息化本质是分布式算力和信息的结构,智能化也将遵循这一路径 [9][35] - **端侧部署时间表**:结合密度法则提升和芯片路线图,预测到2030年左右,端侧可部署600亿以上参数的模型,5年内端侧很可能承载GPT-4至GPT-5能力的模型 [32] - **具体应用进展**:车端模型量产速度非常快,已与多家车企合作;预计2027年成为关键节点,届时手机可实现大规模强化学习,支持个人数据训练“专属大模型助理” [32][33] - **未来形态**:智能将分布式存在,形成“智能体的互联网”,个人拥有基于终端数据持续成长的“个人大模型”,云端则存在各垂直领域的“专家大模型” [10][35][36] 下一阶段的范式演进:自主学习与AI造AI - **核心方向**:预训练和强化学习之后,下一个大的方法改进是自主学习,即模型能作为一个高效的学习者,根据用户需求在终端上持续学习新技能 [34] - **发展三阶段**:第一阶段是实现自主学习;第二阶段是具备自主学习能力的AI之间的协作;第三阶段是具备创造新符号关系乃至新符号系统的创新能力 [34][35] - **AGI的雏形**:最早的AGI形态可能不是面向消费者的产品,而是面向生产的系统,具备“AI造AI”的能力,即能自主完成数据生产、环境构建、模型训练和部署的全流程 [36]
OpenAI宣布推出首期OpenAI认证课程,AI人工智能ETF(512930)交投活跃
新浪财经· 2025-12-10 02:02
行业动态与政策 - OpenAI于当地时间12月9日宣布推出首期OpenAI认证课程,包括在ChatGPT平台推出的“人工智能基础课程”试点项目,以及已在Coursera平台上线的“教师版ChatGPT基础课程” [1] - 美国政府拟允许英伟达向中国等国家的合格客户交付H200芯片,此举有望推动国产大模型升级和AI生态繁荣,进而扩大对国产算力芯片及配套AIDC设施的需求,长期利好国产算力产业链 [1] - DeepSeek V3.2版本的发布通过算法优化(如DSA、FP8训练)有效弥补硬件制约,强化了国产AI芯片与高效算法的深度耦合趋势,有助于构建独立于NVIDIA之外的“中国算力栈”,从而加速端侧AI应用落地,尤其在视觉领域具备突破潜力 [1] 市场表现与指数 - 截至2025年12月10日 09:33,中证人工智能主题指数(930713)下跌1.39% [2] - 指数成分股涨跌互现,其中中科星图(688568)领涨4.22%,豪威集团(603501)上涨2.41%,光迅科技(002281)上涨1.82%,中科曙光(603019)领跌 [2] - AI人工智能ETF(512930)最新报价为2.14元 [2] - 中证人工智能主题指数选取50只业务涉及为人工智能提供基础资源、技术以及应用支持的上市公司证券作为指数样本 [2] - 截至2025年11月28日,中证人工智能主题指数前十大权重股合计占比63.92%,前十大权重股分别为中际旭创(300308)、新易盛(300502)、寒武纪(688256)、中科曙光(603019)、澜起科技(688008)、科大讯飞(002230)、海康威视(002415)、豪威集团(603501)、金山办公(688111)、浪潮信息(000977) [2] 相关金融产品 - AI人工智能ETF(512930)的场外联接基金包括:平安中证人工智能主题ETF发起式联接A(023384)、平安中证人工智能主题ETF发起式联接C(023385)、平安中证人工智能主题ETF发起式联接E(024610) [3]