Workflow
Seek .(SKLTY)
icon
搜索文档
DeepSeek 首登《自然》封面:中国大模型创造新历史,做了 OpenAI 不敢做的事
36氪· 2025-09-18 09:56
核心观点 - DeepSeek的R1模型相关论文登上《Nature》封面,标志着其科研成果获得顶级学术期刊认可[2][6] - 该研究首次证明纯强化学习能有效激发大语言模型的推理能力,训练成本仅为29.4万美元[7][47] - 这是首个经过独立同行评审的大语言模型,为行业树立了科学验证的新标杆[10][11][12] 学术认可与行业意义 - 《Nature》是全球影响力最高的期刊之一,h5-index为490,h5-median为784[9] - 与OpenAI、Anthropic、Google仅发布技术报告不同,DeepSeek将模型送入学术体系接受8位独立专家审查[10] - 公开了11页正文、83页补充材料和64页同行评审记录,透明度极高[7][10] - HuggingFace工程师认为此为重要先例,有助于评估系统风险[13] - 《Nature》官方发文呼吁其他公司也将大语言模型提交同行评审[15] 技术创新与方法论 - 核心贡献是纯强化学习框架,无需人类标注思维路径,模型自主学会推理[19][21] - 仅使用规则化奖励信号:答案正确加分,错误减分,不干预思考过程[21][33] - 训练中出现“自我反思、验证、动态调整”等涌现式推理行为[21][35][38] - 在AIME 2024数学竞赛准确率达77.9%,远超人类平均水平[23][31] - 自研GRPO算法通过“组内竞争”估算优势,简化流程并降低资源消耗[47] 模型开发路径 - 从R1-Zero开始:基于6710亿参数MoE架构,跳过传统监督微调,直接进行强化学习[25][26][27] - 训练成本分解:R1-Zero耗20.2万美元,SFT数据创建耗1万美元,最终RL耗8.2万美元[47] - 四阶段进化:R1-Dev1解决可读性问题,R1-Dev2强化推理能力,R1-Dev3扩展通用能力,最终R1完成偏好对齐[41][42][43][44][46] - 最终模型在AlpacaEval 2.0提升25%,Arena-Hard提升17%[47] 数据与训练细节 - 选择Qwen2-7B作为基础模型以避免数据污染问题,实验显示其推理能力超过同期GPT-4o模型[16] - 强化训练后Qwen2-7B-Zero在AIME 2024得分22.3%,远超原始版本7.9%和GPT-4o的9.3%[16] - 明确否认依赖模型蒸馏,强化学习组件独立训练且不依赖于GPT-4等模型的输出[17][18] - 所有训练数据通过网页抓取,未故意加入OpenAI生成内容[7] 性能表现 - 在LiveCodeBench数据集中,R1最终在简单问题准确率100%,中等问题83.45%,困难问题34.44%[45] - 思考长度从几千token增长到上万个token,表明思考深度增加[31] - 在部分代码和理科推理任务上超过GPT-4[23]
DeepSeek紧急声明!
证券时报· 2025-09-18 09:26
公司声明与声誉维护 - 公司发布声明指出不法分子冒充公司或员工通过伪造工牌和营业执照等材料实施诈骗 [1] - 诈骗行为涉及在多个平台以算力租赁和股权融资等名义向用户收取费用 [1] - 公司强调从未要求用户向个人账户或非官方账户付款且任何私下转账要求均属诈骗 [2] - 冒用公司名义开展算力租赁或融资等行为均属违法并将依法追究法律责任 [2] - 公司提醒用户通过官方渠道获取信息且官方网页和App产品目前均为免费 [2] 学术成就与国际认可 - 公司研发的DeepSeek-R1推理模型研究论文登上国际权威期刊Nature封面 [2] - 该论文由公司团队共同完成且梁文锋担任通讯作者 [2] - 研究成果首次公开仅靠强化学习就能激发大模型推理能力的重要发现 [2] - 这是中国大模型研究首次登上Nature封面且为全球首个经过完整同行评审并发表于权威期刊的主流大语言模型研究 [2] - Nature社论评价该研究打破几乎所有主流大模型尚未经过独立同行评审的空白 [2]
登上《自然》!DeepSeek-R1训练方法发布
科技日报· 2025-09-18 08:39
技术突破 - 开源人工智能模型DeepSeek-R1采用纯强化学习方法提升大语言模型推理能力 减少人类输入工作量 [1] - 模型通过解决问题获得奖励强化学习效果 使用强化学习而非人类示例开发推理步骤 降低训练成本与复杂性 [1] - 在数学基准测试中DeepSeek-R1-Zero和DeepSeek-R1分别达到77.9%和79.8%得分 [1] 性能表现 - 模型在数学 编程竞赛及STEM领域研究生水平问题任务上优于传统训练的大语言模型 [1] - 在研究生水平的生物学 物理和化学问题上表现优异 [1] 方法创新 - 包含人类监督下的深入训练阶段以优化推理过程 [1] - 通过展示优质问题解决案例后生成推理模板 [1] - 未来研究可聚焦优化奖励过程以确保推理和任务结果更可靠 [1]
DeepSeek,严正声明!
中国基金报· 2025-09-18 08:37
公司声明与事件 - 深度求索公司发布声明称有不法分子冒充公司或员工实施诈骗 伪造工牌和营业执照等材料 在多个平台以算力租赁和股权融资等名义向用户收取费用 [1] - 公司强调从未要求用户向个人账户或非官方账户付款 任何私下转账要求均属诈骗 冒用公司名义开展算力租赁或融资等行为均属违法 将追究法律责任 [2] - 公司提醒用户通过官网deepseek com及官方认证账号获取信息 官方网页和App产品目前均为免费 API调用服务需前往官网开放平台充值 遇可疑情况可通过官方邮箱联系或向公安机关举报 [2] 公司背景与成就 - 深度求索成立于2023年 由中国知名量化投资机构幻方量化孵化 是一家总部位于杭州的人工智能研究机构 [3] - 创始团队由量化专家梁文锋领衔 集结了多名顶尖高校科研人才及具备国际机构经验的技术专家 [3] - 近期DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1研究论文登上国际权威期刊《Nature》封面 引发市场高度关注 DeepSeek-R1成为首个通过同行评议的主要大语言模型 [3]
训练成本29.4万美元,DeepSeek-R1登Nature封面,首个通过权威期刊同行评审的主流大模型获好评
36氪· 2025-09-18 07:55
学术认可与行业透明度 - DeepSeek-R1的相关研究成果于9月17日登上Nature封面,成为首个通过该权威期刊同行评审的主流大模型[1] - 与预印本相比,正式发表的论文补充披露了模型训练成本,为AI研究提供了更透明、更规范的实践范例[1][17] - 此次同行评审被行业专家视为良好趋势,有望推动更多前沿模型开发团队分享技术细节[16] 训练成本与效率 - DeepSeek-R1的总训练成本为29.4万美元,其中DeepSeek-R1-Zero训练成本20.2万美元,SFT数据创建成本1万美元,DeepSeek-R1训练成本8.2万美元[2] - 训练DeepSeek-R1-Zero使用648张H800 GPU,耗时约198小时;训练DeepSeek-R1同样使用648张H800 GPU,训练约80小时[2] - 尽管公司为模型所依托的基础LLM投入了约600万美元,但总成本远低于业内普遍认为的头部模型训练所需的数千万美元[1] 技术创新与方法论 - 公司基于DeepSeek-V3 Base8,采用Group Relative Policy Optimization作为RL框架,并在RL训练前跳过了传统的监督微调阶段[3] - 该方法允许模型不受限制地探索推理路径,避免了人为定义推理模式可能带来的限制,促进了LLM中新推理能力的涌现[3] - 研究团队设计了特定模板,要求模型先在"Think"标签中输出推理过程,再在"Answer"标签中给出最终答案,以便在强化学习中自主探索有效推理路径[6] 模型性能表现 - DeepSeek-R1-Zero在AIME 2024数学竞赛上的pass@1分数从初始的15.6%显著提升至77.9%,采用自洽解码策略后准确率进一步提升至86.7%,超过人类选手平均水平[6] - 在多项基准测试中,DeepSeek-R1表现优异:English MMLU得分90.8,MMLU-Pro得分84.0,IF-Eval Prompt Strict得分83.3,AlpacaEval2.0 LC-winrate得分87.6[13] - 在编程能力方面,Codeforces Percentile达到96.3,Rating达到2029;在数学能力方面,MATH-500 Pass@1达到97.3[13] 训练过程特征 - 在强化学习过程中,DeepSeek-R1-Zero展现出随训练逐步增强的推理能力,并伴有明显的自我进化特征[7] - 模型由内在适应驱动时,其平均推理长度在训练中持续增长并不断修正推理路径,能主动暂停、检视并修正已有推理步骤[7] - 对比DeepSeek-R1-Zero和DeepSeek-R1 Dev1,DeepSeek-R1在各个开发阶段的指令执行表现有显著提升[11]
DeepSeek-R1 论文登上《自然》封面,通信ETF收涨1.92%
搜狐财经· 2025-09-18 07:50
市场表现 - 三大指数冲高回落 沪指跌1.15% 深成指跌1.06% 创业板指跌1.64% [2] - 旅游 CPO 芯片产业链板块涨幅居前 有色金属 大金融 稀土永磁板块跌幅居前 [2] - 国泰中证全指通信设备ETF收涨1.92% 成分股光库科技涨15% 烽火通信 长飞光纤 亨通光电涨停 [2] 人工智能技术突破 - DeepSeek-R1推理模型研究论文登上《自然》封面 为全球首个经过同行评审的主流大语言模型 [2] - 论文披露更多模型训练细节 正面回应蒸馏质疑 [2] 算力产业前景 - 华为预测2035年全社会算力总量增长10万倍 AI存储容量需求较2025年增长500倍 [3] - 华为公布昇腾芯片路线图 2026Q1推出昇腾950PR 2026Q4推出昇腾950DT 2027Q4推出昇腾960 2028Q4推出昇腾970 [3] 光通信行业分析 - 海外AI算力大额订单与强劲需求支撑光模块行业基本面 AI驱动算力扩张周期持续 [3] - 短期市场情绪化调整提供优质配置机会 中长期坚定看好光模块赛道 [3] 人工智能产业趋势 - 人工智能处于政策 技术 需求三维共振阶段 "人工智能+"行动提供政策赋能与资金支撑 [3] - 国产芯片及云计算龙头业绩逐步验证 大厂CapEx持续投入推高行业发展确定性 [3] - 行业景气度仍有上行空间 科技投资主线地位稳固 [3]
DeepSeek登《Nature》封面 梁文锋带队 首次回应争议
凤凰网· 2025-09-18 07:48
研究突破 - 公司通过纯强化学习框架显著提升大语言模型推理能力 减少对人工标注的依赖[1] - 引入组相对策略优化算法 仅依据最终答案正确性给予奖励 而非模仿人类推理路径[4] - 模型自然涌现自我反思 自我验证及生成长推理链等高级行为 单问题推敲可达数百至上千token[4] 性能表现 - 模型在美国数学邀请赛准确率从15.6%跃升至77.9% 采用自洽解码后达86.7% 超越人类平均水平[4] - 在数学解题 编程竞赛及STEM领域研究生水平问题上均展现更优表现[1] - 通过多阶段优化后 在写作 问答等通用任务上展现流畅性和一致性[5] 成本效率 - 推理成本仅29.4万美元 基础模型训练开销约600万美元 总成本远低于国外巨头[3] - 相比OpenAI训练GPT-4的1亿美元成本 实现数量级降低[3] - 突破行业"资金即壁垒"共识 展现算法创新对成本结构的颠覆性影响[3][8] 技术路径 - 采用非传统训练方式 并非通过复制OpenAI模型推理示例学习[1] - 基础模型基于网络训练 会吸收互联网已有AI生成内容[1] - 方法论被《自然》评论为"让AI学会自己思考" 而非"教AI思考"[4][5] 行业影响 - 研究被《自然》杂志收录并登上封面 标志中国AI领域重大突破[1] - 被Nature审稿人评价为"开启推理革命" 多机构开始应用该方法论改善现有模型[9] - 推动行业竞争从"数据与算力军备竞赛"转向"算法与智慧创新竞赛"[9] 团队背景 - 创始人梁文锋具浙江大学信息与通信工程硕士背景 专注机器视觉与量化交易领域[7] - 曾创办雅克比投资及幻方科技 2023年转向通用人工智能领域[8] - 团队建设坚持"能力为先" 核心岗位由应届生及低年限经验人员构成 自主培养人才[8]
DeepSeek打破历史!中国AI的“Nature时刻”
证券时报· 2025-09-18 07:29
研究突破与学术认可 - DeepSeek-R1推理模型研究论文登上Nature封面 成为中国大模型研究首次获此认可 也是全球首个经过完整同行评审并发表于权威期刊的主流大语言模型研究 [1] - Nature社论评价该研究打破主流大模型缺乏独立同行评审的局面 强调其公开性和透明性价值 [1][2] - 论文历经半年评审周期 8位外部专家参与质询数据来源、训练方法及安全性 全文64页包含训练成本披露和技术细节更新 [2] 技术创新与成本优势 - R1模型使用512张H800 GPU训练80小时 以每GPU小时2美元租赁成本计算 总训练成本为29.4万美元(约209万元人民币) 较其他推理模型千万级成本显著降低 [3] - 团队澄清未使用专有模型蒸馏技术 训练数据全部来自互联网 包含GPT-4生成内容属非故意行为 并提供数据污染防控流程 [3] - DeepSeek-V3.1采用混合推理架构 支持思考与非思考双模式 通过后训练优化提升工具使用与智能体任务表现 [4] 硬件生态与产业协同 - V3.1版本采用UE8M0 FP8 Scale参数精度 专为下一代国产芯片设计 预示未来训练与推理将更多应用国产AI芯片 [4][5] - 通过FP8精度降低算力需求 使国产ASIC芯片在12-28nm成熟制程接近英伟达GPU算力精度 形成"软硬协同"技术壁垒 [5] - 该技术路径带动国产芯片算力股股价飙升 可能成为行业新技术趋势 通过软硬件协同实现数量级性能提升 [5]
中国大模型首登《自然》封面,AI医学的DeepSeek时刻还远吗?
第一财经· 2025-09-18 07:02
AI在医学领域的融合进展 - DeepSeek大模型R1登上《自然》封面,成为继DeepMind后第二家获此殊荣的AI公司[1] - 自2022年底ChatGPT推出以来,生成式AI在医学领域掀起热潮,加速与临床应用融合[1] - 中国大模型技术细节披露有望推动AI医学落地,行业即将迎来DeepSeek时刻[1] AI制药行业发展态势 - 跨国制药公司通过数十亿美元投资布局AI制药,百时美施贵宝和赛诺菲等企业寻求技术突破[3] - 复星医药着力打造AI开发工具提升研发效率,引入AI决策智能体平台PharmAID[3] - Medidata支持了2015年以来美国FDA获批的93%肿瘤新药,公司正联合合作伙伴全面布局AI[3] - 全球由中国企业发起的临床试验比例从约3%跃升至2024年30%,中国成为全球第二大临床试验市场[3] AI药物研发技术挑战 - AI可快速浏览分子数据库匹配化合物与靶点,但仅完成药物发现第一步[4] - 纸面上不错的药物临床试验失败率达90%,AI制药面临技术算法、生物学和监管三重挑战[4] - 大模型缺乏AI制药加速所需数据,人类对细胞相互作用等生物学问题仍知之甚少[4] 医疗AI临床应用实践 - 复旦大学附属中山医院联合华为、联影智能等公司发起"元医疗模拟实验室",推进医疗知识数字化和诊疗能力产品化[5] - 葛均波团队联合华为终端开发可穿戴多模态AI驱动冠心病风险预测系统,重构早期筛查与风险评估临床路径[5] - AI在心率筛查、影像分析、风险评估等特定领域已达临床应用水平,成功实现间歇性房颤监测[6] 医疗AI落地关键要素 - 人工智能医学应用需突破三个关键环节:数据质量、计算能力和算法优化[6] - 医生始终是诊疗决策主体,使用AI技术的医生对医疗行为承担主要责任[6] - 行业正在制定相关伦理规范,确保AI技术安全有效服务于临床诊疗[6]
DeepSeek声明:防范冒用“深度求索”名义实施诈骗
每日经济新闻· 2025-09-18 06:56
1.深度求索从未要求用户向个人账户或非官方账户付款,任何要求私下转账的行为均属诈骗; 2.任何冒用我司名义开展"算力租赁"、"融资"等行为均属违法,我们将依法追究其法律责任。 每经AI快讯,9月17日,深度求索(DeepSeek)发布官方声明: 近期,有不法分子冒充"深度求索"(DeepSeek)官方或在职员工,伪造工牌、营业执照等材料,在多个 平台以"算力租赁"、"股权融资"等名义向用户收取费用实施诈骗。该行为严重侵害用户权益,并损害我 司声誉。 ...