Seek . - 财报，业绩电话会，研报，新闻

DeepSeek-R1

DeepSeekV2

人工智能

刚刚，DeepSeek梁文锋入选Nature年度十大人物，被称为“科技颠覆者”

DeepSeek-R1

DeepSeekV2

36氪· 2025-12-09 02:24

梁文锋与DeepSeek公司 - 公司创始人梁文锋入选《自然》2025年度十大人物，被评价为“科技颠覆者” [1] - 公司发布的DeepSeek AI模型被描述为“惊艳了世界”和“让科学家感到兴奋” [3][4] - 创始人梁文锋为40岁的前金融分析师，曾通过AI算法在股市赚取数百万美元，并于2023年在杭州创立DeepSeek公司 [5] R1模型的技术与市场影响 - 公司于今年1月突然发布功能强大但价格低廉的R1模型，挑战了美国在AI领域的领先优势认知 [4][5] - R1是一款推理大语言模型，擅长通过步骤分解解决数学和编程等复杂任务 [5] - 该模型是首个以开放权重形式发布的此类模型，研究者可免费下载并进行开发 [7] - R1的成功促使中美其他公司纷纷效仿，相继发布各自的开源模型 [7] - 尽管R1在多项能力上与驱动ChatGPT的美国顶尖模型不相上下，但其训练成本远低于竞争对手 [7] - 例如，Meta的Llama 3 405B模型的训练成本高出十倍以上 [9] 公司的运营理念与透明度 - 公司追求透明度，R1模型是首个接受同行评议的主流LLM，公司完整公布了其构建和训练的技术细节 [8] - 通过公开技术“配方”，公司为其他AI研究者提供了训练推理模型的宝贵经验 [11] - 公司在招聘时更看重个人潜力而非经验水平，组织架构扁平化，研究人员可自主决定研究方向 [20] - 公司没有利用其知名度追求商业成功，而是致力于解决AI研究中困难的基础性问题 [20] - 公司承诺其模型将永久开源 [23] 创始人的背景与公司发展 - 创始人梁文锋出身于广东乡村，父母是小学教师，后于浙江大学获得工程学硕士学位 [11] - 他于2015年联合创立对冲基金高飞资本，随后在2023年分拆出DeepSeek公司 [13] - 出于研究好奇，他在过去十年里购买了1万块英伟达GPU [17] - 与许多西方AI企业家一样，公司的目标是指向实现通用人工智能 [17] 模型的应用与行业地位 - DeepSeek模型已深度融入中国人的生活，地方政府利用其运营聊天机器人热线、协助市民填表，每天有数千万人通过微信使用这些模型 [20] - 这一趋势得益于政府推动AI通过智慧城市、医疗保健等应用融入经济发展 [20] - DeepSeek已成为国家形象转型的象征——从卓越的模仿者蜕变为真正的创新者 [20] - 全球正热切期待公司即将推出的下一代推理模型R2 [21] - 公司计划向世界免费开放R2模型 [23] 《自然》年度十大科学人物其他入选者（摘要） - 中国科学院深海科学与工程研究所研究员杜梦然因在海平面9000米以下发现最深的动物生态系统入选，被称为“深潜者” [25] - 美国微生物学和免疫学科学家Susan Monarez因在政治压力下坚守科学诚信而受到关注 [28] - 学者Achal Agrawal因揭露印度高校惊人的论文撤稿率及推动科研评估改革入选 [31] - Tony Tyson作为打造耗资8.1亿美元薇拉·鲁宾天文台望远镜的核心推动者入选 [34] - Precious Matsoso作为促成全球首份《大流行病条约》的核心谈判代表入选 [37] - Sarah Tabrizi因在亨廷顿舞蹈症治疗上取得关键进展入选 [40] - Luciano Moreira因领导在巴西培育数十亿只蚊子以阻断登革热等病毒传播的计划入选 [43] - Yifat Merbl因发现免疫系统新层面——蛋白酶体产生抗菌肽段而入选 [45] - 婴儿KJ Muldoon作为全球首例接受高度个性化CRISPR基因编辑治疗的患者入选 [48]

DeepSeek创始人梁文峰入选《自然》杂志2025年最具影响力人物榜单

新华社· 2025-12-09 00:32

公司及创始人成就 - 中国人工智能公司DeepSeek创始人梁文峰入选《自然》杂志年度“自然10人”榜单因其推动强大的大规模人工智能模型的发展而受到认可 [1] - DeepSeek公司在2025年1月发布了功能强大且性价比极高的R1模型此举被《自然》杂志描述为“震惊了人工智能领域” [1] - R1模型的发布“立即表明美国在人工智能领域的领先地位并没有许多专家想象的那么高” [1] 行业影响与趋势 - 2025年“自然10人”榜单涵盖了包括人工智能在内的广泛科学探索和社会挑战领域 [1] - 榜单旨在表彰对新领域的探索、突破性医学进步的前景以及对维护科学诚信的坚定承诺等 [2] - 榜单故事展现了从宏观到微观层面取得的进步以及科研诚信等幕后工作将如何塑造2025年的科学和社会 [1]

第二波DeepSeek 冲击：V3.2 改写中国云生态与芯片生态的推理经济学

2025-12-08 15:36

行业与公司 * 涉及的行业为中国互联网与人工智能（AI）行业，具体包括AI模型、云服务、AI芯片与服务器、AI智能体平台及SaaS开发商等细分领域[1] * 报告由摩根大通证券（中国）有限公司发布，分析师团队包括姚橙、陈祺、冯令天、徐文韬[4] * 报告明确覆盖并给出投资评级的公司包括：阿里巴巴、腾讯、百度、中微公司、北方华创、华勤技术、浪潮信息[1][32] 核心事件：DeepSeek V3.2发布 * DeepSeek于近期发布了DeepSeek-V3.2和V3.2-Speciale模型，作为2025年9月29日发布的实验性V3.2-Exp模型的后续产品[2] * V3.2模型保留了V3.1-Terminus的混合专家（MoE）架构主体，但引入了DeepSeek稀疏注意力机制（DSA），这是唯一的架构变动[2] * 模型被定位为“为Agent（智能体）构建的推理优先模型”，集成了“思考+工具调用”，思维链和工具调用可在单一轨迹中交错[2] * 模型在大约1,800个合成智能体环境和大约8.5万个复杂指令上进行了训练[2] * Speciale版本放宽了长度和计算限制，在多个推理基准上媲美Gemini 3.0 Pro和GPT-5级系统[2] 性能与效率提升 * DSA机制将长序列的计算复杂度从平方级（O(L²)）降至准线性级（O(L·k)）[3][24] * 当处理长度为128k tokens时，对比V3.1-Terminus，V3.2推理速度提升2-3倍，GPU内存占用减少约30-40%[3][24] * DeepSeek V3.2的Artificial Analysis智能指数从V3.1的大约54提高到约66，智能水平提升22%[17] * 在H800等加速器上，每个token的长上下文成本约降低50%[24] 定价冲击与成本效益 * DeepSeek V3.2实现了API结构性降价，每百万tokens的输入/输出价格分别降至0.28美元/0.42美元[3][19] * 对比V3.1 Reasoning（输入0.42美元/输出1.34美元），输入成本降低33%，输出成本降低69%[3][19] * 对比更早的R1模型（输入1.35美元/输出4.00美元），降价幅度更大[3][19] * 部分工作负载的长上下文推理成本降低了6-10倍[3][19] * 报告将此称为中国AI市场的第二波“DeepSeek冲击”，即以国内适中的价格获得接近前沿模型的开源推理能力[1][3][20] 对中国AI生态的受益者分析云运营商 * 提供模型即服务（MaaS）的云运营商是直接受益者，例如阿里云、腾讯云和百度智能云[13] * 云供应商可以提高AI工作负载的利润率（价格相同、成本下降），或通过降价推动MaaS普及率[13] * V3.2已迅速在国内云端部署，华为云和Ascend实现了Day-0支持，寒武纪、海光、优刻得等也已集成或优化[13] * 阿里云明确指出其集成的V3.2-Exp处理长文本的成本比V3.1低[13] 国内芯片与服务器制造商 * 主要受益者包括国内芯片制造商，其次是国内GPU/服务器厂商[14] * V3.2-Exp是率先在首日便针对非CUDA生态（包括华为CANN堆栈和Ascend硬件、寒武纪vLLM-MLU、海光DTK）进行优化的国产主流前沿模型之一[1][14] * 这表明GPT-5级开源模型可以在国产加速器上高效运行，降低了中国AI买家的潜在执行风险，并可能带动增量需求[14] AI智能体平台与垂直SaaS开发商 * 对于智能体SaaS和垂直AI开发商，V3.2可以在大幅降低可变成本的情况下，提供更高智能、更长记忆引擎，改善单位经济效益[16] * V3.2的“思考+工具调用”和128k-token上下文能力面向AI助理、开发者智能体和垂直行业（编码、法律、金融、医疗保健）助理的工作流程[16] * Hugging Face和ModelScope上提供的宽松式许可开放权重模型，降低了独立SaaS构建者微调或自托管的门槛[16] 行业竞争格局与定价趋势 * DeepSeek V3.2是前沿大语言模型API的“价格颠覆者”，其定价明显低于其他具有类似智能水平的模型，将对竞争对手的token价格造成下行压力[26] * 对比中美大语言模型API，中国模型（如DeepSeek V3.2、Kimi K2 Thinking等）处于“最具吸引力”价值象限，每百万token价格低于2美元，尤其在输出方面成本效益显著[27] * 美国旗舰闭源模型（如GPT-5.1、Claude Opus 4.5等）占据更高的价格带，智能水平略胜一筹，但成本溢价明显[27] * 美国生态在绝对峰值性能上领先，但中国API在性价比方面竞争激烈，为大规模部署提供了更优的价值主张[27] 模型代际对比（V3.2 vs V3.1） * **架构与效率**：V3.1使用标准的密集多头潜在注意力（MLA）；V3.2引入DSA，在长上下文下大幅降低计算复杂度和成本[24] * **能力定位**：V3.1是强大的混合“思考”模型，聚焦一般聊天和稳定性；V3.2是以推理为先的智能体级引擎，针对智能体行为深度训练[21][24] * **硬件生态**：V3.1主要针对英伟达CUDA优化；V3.2为华为Ascend、寒武纪、海光提供了Day-0支持，标志着明确转向国产硬件自主[24]

PriceSeek提醒：铝锭现货价格普遍下跌

新浪财经· 2025-12-08 12:25

中国铝业铝锭现货价格下跌 - 2025年12月8日，中国铝业铝锭(AL99.70)现货价格在主要区域市场普遍下跌 [1] - 华东市场报价为21920元/吨，较上一交易日下跌170元/吨 [1] - 华南市场报价为21810元/吨，较上一交易日下跌160元/吨 [1] - 西南市场报价为21840元/吨，较上一交易日下跌160元/吨 [1] - 中原市场报价为21770元/吨，较上一交易日下跌170元/吨 [1] 价格变动幅度与市场解读 - 各市场价格跌幅约在0.7%至0.8%之间 [2] - 价格下跌表明市场可能供应充足或需求呈现疲软态势 [2] - 该价格变动对铝现货市场构成一般性的利空影响 [2] 大宗商品定价参考机制 - 生意社基准价是基于价格大数据与价格模型产生的交易指导价 [3] - 该基准价可用于确定指定日期的结算价或指定周期的平均结算价 [3] - 大宗商品交易结算价计算公式为：结算价 = 生意社基准价 × K + C [3] - 公式中K为调整系数，涵盖账期成本等因素 [3] - 公式中C为升贴水，涵盖物流成本、品牌价差、区域价差等因素 [4]

DeepSeek双模型发布：一位是“话少助手” 一位是“偏科天才”

科技日报· 2025-12-08 10:03

公司产品发布与技术突破 - 公司于12月1日同时发布DeepSeek-V3.2和DeepSeek-V3.2-Speciale两个正式版模型 [1] - 在公开推理测试中，V3.2水平达到了OpenAI今年8月推出的GPT-5水平，略低于谷歌的Gemini3 Pro [1] - DeepSeek-V3.2定位为高性价比的日常助手，具备更强的推理能力和智能体能力，旨在成为“数字劳动力”以完成自动生成报表、编写代码等复杂工作 [2] - DeepSeek-V3.2-Speciale专攻高难度数学问题求解、学术研究逻辑验证和编程竞赛解题，旨在将开源模型推理能力推向极致 [2] - 新模型实现了两项质的突破：引用领域专用架构和思考型工具调用技术 [2] - 领域专用架构技术可让模型在完成任务时仅检索最关键信息，从而大幅提升效率、降低消耗 [2] - 思考型工具调用技术使模型在得到指令后，能先思考再调用工具执行，然后根据结果继续思考、再次调用，实现多轮交替的复杂问题解决，并保留记录供后续推理使用 [2] - 这是公司首次将思考融入工具使用，改变了以往模型依赖人“喂”数据的发展范式，实现AI的自我训练和进化 [2] - 公司官方网页端、App和API均已更新为正式版DeepSeek-V3.2，但Speciale版本目前仅以临时API服务形式开放，供社区评测与研究 [4] 行业竞争格局与影响 - 过去一年，以Google、OpenAI等为代表的闭源社区在复杂任务中表现优越，而开源社区受制于架构、资源分配及智能体能力等关键缺陷，与闭源社区性能差距进一步扩大 [3] - 公司发布新模型的根本动力是缩小开源模型与闭源模型间的差距 [4] - 新模型证明了闭源大模型的巅峰并非不可逾越，为我国乃至全球开源大模型的发展注入强心剂 [4] - 公司从今年初发布R1大模型以来，发展主线始终聚焦实用性和泛化能力，让“赶超闭源”从美好愿景变为闭源厂商的现实压力 [4] - 公司为全球开发者提供了一个强大、可控且经济的模型底座，助力大语言模型融入千行百业、形成商业闭环 [4] - 新模型为大语言模型带来了新的治理难题，需警惕工具调用风险，以及学术造假、自动化生成代码漏洞、产业不公平竞争等挑战 [4]

大语言模型

DSA技术

思考型工具调用技术