Seek .-DeepSeek论文登上《自然》封面，R1成为首个严格学术审查大模型

公司里程碑与学术认可 - DeepSeek-R1推理模型研究论文登上国际权威期刊《自然》封面成为首个通过同行评议的主要大语言模型[1] - 《自然》期刊在评论报道中用"里程碑式论文"和"创造历史"表达赞赏标志着中国在大模型基础研究领域取得重要突破[2] - 在同行评审过程中公司根据评审意见减少模型拟人化描述并增加技术细节说明包括模型训练数据类型和安全性考虑[1] 技术创新与成本优势 - 模型核心创新在于采用"纯强化学习"方法通过奖励模型达到正确答案的行为来学习推理策略[2] - R1训练成本仅为29.4万美元即使加上约600万美元基础模型成本也远低于行业巨头训练成本[2] - DeepSeek-V3.1实现混合推理架构一个模型同时支持思考模式与非思考模式具备更高思考效率和更强智能体能力[3] 市场影响与开源成果 - 今年1月模型发布时其卓越推理能力和极低开发成本曾引发全球科技股大幅下跌[2] - 开源后R1在Hugging Face下载量突破1090万次成为全球最受欢迎的开源推理模型[2] - 公司明确否认使用OpenAI模型输出进行训练的质疑强调数据全部来自互联网且无专门蒸馏环节[1] 行业意义与数据安全 - 同行评审被《自然》杂志视为抑制AI行业过度炒作的有效方式公司做法被视为值得欢迎的先例[3] - 为防止基准测试数据污染公司对预训练和后训练数据都实施全面去污染措施[1] - 公司成立于2023年由幻方量化孵化创始团队由梁文锋领衔成员来自顶尖高校与国际机构[3]