Workflow
Seek .(SKLTY)
icon
搜索文档
DeepSeek发布防诈骗声明:有不法分子冒用公司名义开展“算力租赁”“融资”,将追究其法律责任
新浪科技· 2025-09-18 05:53
诈骗风险警示 - 近期出现不法分子冒充公司官方或员工 通过伪造工牌及营业执照等材料实施诈骗 [1][2] - 诈骗手段涉及以算力租赁和股权融资等名义向用户收取费用 [1][2] - 该行为严重侵害用户权益并损害公司声誉 [1][2] 官方声明要点 - 公司从未要求用户向个人账户或非官方账户付款 任何私下转账要求均属诈骗 [1][3] - 冒用公司名义开展算力租赁或融资等行为均属违法 公司将依法追究法律责任 [1][3] - 官方网页及App产品目前均为免费状态 API调用服务需通过官网开放平台充值 [1] 官方验证渠道 - 用户应通过官网deepseek com及官方认证账号获取信息 [1] - 官方收款账户名称为杭州深度求索人工智能基础技术研究有限公司 [1] - 遇可疑情况可通过官方邮箱核实或向公安机关举报 [1]
DeepSeek,打破历史!中国AI的“Nature时刻”
证券时报· 2025-09-18 05:24
中国大模型,首登Nature封面。 9月17日,在最新一期的国际权威期刊Nature(自然)中,DeepSeek-R1推理模型研究论文登上了封面。 该论文由DeepSeek团队共同完成,梁文锋担任通讯作者,首次公开了仅靠强化学习就能激发大模型推 理能力的重要研究成果。这是中国大模型研究首次登上Nature封面,也是全球首个经过完整同行评审并 发表于权威期刊的主流大语言模型研究,标志着中国AI技术在国际科学界获得最高认可。 Nature在其社论中评价道:"几乎所有主流的大模型都还没有经过独立同行评审,这一空白终于被 DeepSeek打破。" 中国AI大模型的"Nature时刻" 自大模型浪潮席卷全球以来,技术发布、性能榜单层出不穷,但始终缺乏一个权威的"科学认证"机制。 OpenAI、谷歌等巨头虽屡有突破,但其核心技术多以技术报告形式发布,未经独立同行评审。 DeepSeek以其公开性和透明性打破了这一局面。DeepSeek-R1模型的研究论文最早于今年年初发布在预 印本平台arXiv上。自今年2月14日向Nature投递论文至今,历经半年,8位外部专家参与了同行评审, DeepSeek-R1推理模型研究论文终 ...
DeepSeek首次回应“蒸馏OpenAI”质疑
第一财经· 2025-09-18 04:34
"没有故意加入OpenAI生成的合成数据。" 9月18日,DeepSeek再次引发轰动。由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1研究论文,登上了国际权威期刊《Nature》的封面。 今年1月,DeepSeek曾在arxiv公布了初版预印本论文,相较而言,此次发布在《Nature》的版本补充了更多模型细节,减少了描述中的拟人化说明。在补充 材料中,DeepSeek提到了R1模型的训练成本仅29.4万美元,以及回应了模型发布之初关于蒸馏OpenAI的质疑。 今年1月,有报道提到,OpenAI研究人员认为,DeepSeek可能使用了OpenAI模型的输出来训练R1,这种方法可以在使用较少资源的情况下加速模型能力提 升。 在论文的补充资料部分,DeepSeek回应了关于DeepSeek-V3-Base训练数据来源的问题。"DeepSeek-V3-Base的训练数据仅来自普通网页和电子书,不包含任 何合成数据。在预训练冷却阶段,我们没有故意加入OpenAI生成的合成数据,此阶段使用的所有数据都是通过网页抓取的。"DeepSeek表示。 不过,DeepSeek也说明,已观察到一些网页包含 ...
DeepSeek登上国际权威期刊Nature封面;华为预测2035年AI存储容量需求将比2025年增长500倍
每日经济新闻· 2025-09-18 03:02
市场表现 - 沪指涨0.37%报收3876.34点 深成指涨1.16%报收13215.46点 创业板指涨1.95%报收3147.35点 [1] - 科创半导体ETF涨3.64% 半导体材料ETF涨3.32% [1] - 道琼斯工业平均指数涨0.57% 纳斯达克综合指数跌0.33% 标准普尔500指数跌0.10% [1] - 费城半导体指数跌0.31% 恩智浦半导体涨0.78% 美光科技涨0.74% ARM跌0.31% 应用材料涨2.64% 微芯科技涨2.06% [1] 人工智能技术突破 - DeepSeek-R1推理模型研究论文登上《自然》封面 成为全球首个经过同行评审的主流大语言模型 [2] - 论文披露更多模型训练细节 正面回应蒸馏质疑 [2] 半导体与算力发展前景 - 2035年全社会算力总量将大幅增长 计算领域突破传统冯诺依曼架构束缚 [2] - AI存储容量需求比2025年增长500倍 占比超过70% [2] - 通信网络连接对象从90亿人扩展到9000亿智能体 实现向智能体互联网跃迁 [2] 区域产业规划 - 上海浦东新区启幕张江人工智能创新小镇 计划2027年新集聚人工智能企业500家以上 完成大模型备案100个 [3] - 2030年目标新集聚1000家人工智能企业 实现千亿元产业规模 [3] - 高瓴创投与浦东创投联合发起总规模20亿元的"张江人工智能创新小镇链接基金" [3] 行业趋势研判 - 2025年上半年全球半导体行业呈现结构性繁荣 受AI算力需求增长/终端智能化加速/汽车电子复苏/国产替代深化驱动 [3] - 二季度半导体多数子板块业绩高速增长 三季度旺季有望延续景气 [3] - 2025年全球半导体保持乐观增长走势 AI驱动下游增长 [3] ETF产品布局 - 科创半导体ETF(588170)跟踪上证科创板半导体材料设备主题指数 覆盖半导体设备(59%)和半导体材料(25%)领域 [4] - 半导体材料ETF(562590)指数中半导体设备(59%)和半导体材料(24%)占比靠前 聚焦半导体上游 [4] - 半导体设备和材料行业具备国产化率较低/国产替代天花板较高属性 受益于AI需求扩张/科技重组并购/光刻机技术进展 [4]
国际期刊发表DeepSeek大规模推理模型训练方法 揭示AI背后的科学
中国新闻网· 2025-09-18 02:55
在评估AI表现的数学基准测试中,DeepSeek-R1-Zero和DeepSeek-R1得分分别为77.9%和79.8%。此外, 该模型在编程竞赛及研究生水平的生物学、物理和化学问题上同样表现优异。 《自然》同期发表国际同行专家的"新闻与观点"文章指出,当前版本的DeepSeek-R1有一些能力限制, 希望能在未来版本中得到改进。例如,该模型有时会混合语言,目前只针对中文和英文做了优化;它对 提示词也很敏感,需要精心设计的提示词工程,在某些任务上没有展现出明显提升,例如软件工程任 务。 DeepSeek-AI团队总结认为,未来研究可以聚焦优化奖励过程,以确保推理和任务结果可靠。(完) 中新网北京9月18日电 (记者 孙自法)作为一家专注于大语言模型(LLM)和通用人工智能(AGI)技术的中国 公司,DeepSeek(深度求索)今年早些时候发布的开源人工智能(AI)模型DeepSeek-R1采用的大规模推理模 型训练方法,颇受关注。 北京时间9月17日夜间,该训练方法在国际知名学术期刊《自然》上线发表,其揭示AI技术背后的科学 研究表明,大语言模型的推理能力可通过纯强化学习来提升,从而减少增强性能所需的人类输入 ...
DeepSeek论文登上《自然》封面,R1成为首个严格学术审查大模型
新浪财经· 2025-09-18 02:23
DeepSeek首次公开了仅靠强化学习,就能激发大模型推理能力的重要研究成果,从而启发全球AI研究 者。DeepSeek R1的核心创新在于采用了"纯强化学习"这一自动化试错方法,R1通过奖励模型达到正确 答案的行为来学习推理策略,而非传统模仿人类预设的推理模式。 在补充材料中,DeepSeek团队还首次公开了R1训练成本仅为29.4万美元。这个金额即使加上约600万美 元的基础模型成本,也远低于OpenAI、谷歌训练AI的成本。 今年1月,当DeepSeek R1模型发布时,其卓越的推理能力和极低的开发成本曾引发全球科技股大幅下 跌。 炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! 9月18日,由DeepSeek(深度求索)团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究 论文,登上了国际权威期刊《自然(Nature)》的封面。 DeepSeek R1成为首个通过同行评议的主要大语言模型,发表在《自然》杂志的新版DeepSeek-R1论 文,与今年1月未经同行评审的初版有较大差异。 在同行评议过程中,DeepSeek团队根据评审意见减少了对模型的拟人化描述,并增 ...
DeepSeek-R1论文登上《自然》封面,AI人工智能ETF(512930)涨超0.6%冲击3连涨
新浪财经· 2025-09-18 02:04
行业突破 - DeepSeek-R1成为全球首个经过独立同行评审的主流大语言模型 研究成果登上《自然》期刊封面 [1] - 国产AI生态加速完善 产业链在模型、算力及应用环节均呈现加速发展态势 [1] 市场表现 - 中证人工智能主题指数(930713)上涨0.65% 成分股均胜电子大涨9.99% 瑞芯微涨5.82% 德赛西威涨3.79% 中科曙光涨3.76% 寒武纪涨3.33% [2] - AI人工智能ETF(512930)上涨0.66% 实现三连涨 最新报价2.13元 近一周累计涨幅达8.08% [2] - 该ETF管理费率0.15% 托管费率0.05% 为同业最低水平 近三月跟踪误差仅0.008% 跟踪精度行业最优 [2] 指数构成 - 中证人工智能主题指数选取50只人工智能基础资源、技术及应用支持领域上市公司证券 [2] - 前十大权重股合计占比60.82% 包含新易盛(6.52%)、中际旭创(6.71%)、寒武纪(6.45%)等企业 [3][5] - 权重股寒武纪当日涨3.33% 中科曙光涨3.76% 澜起科技涨1.96% 浪潮信息涨1.49% [2][5]
DeepSeek-R1登上Nature封面:朝着AI透明化迈出的可喜一步
36氪· 2025-09-18 02:02
研究突破 - DeepSeek-R1 论文以封面文章形式发表于权威科学期刊 Nature 证明其研究价值获得学术界高度认可[1] - 研究团队提出无限制强化学习 RL 训练可激发大语言模型 LLM 新推理能力涌现 减少对人类标注数据的依赖[3] - 实验证明纯 RL 训练在数学 编程竞赛和 STEM 研究生水平问题等任务上表现优于传统方法训练的 LLM[3] 技术方法 - 提出群体相对策略优化 GRPO 算法 基于基础模型 DeepSeek-V3 Base 训练 DeepSeek-R1 系列模型[10] - 采用多阶段训练 pipeline 包括拒绝采样 RL 和监督微调 SFT 逐步提升模型能力[12] - RL 训练使模型自然学会输出推理过程 通过评分系统验证答案正确性进行自我改进[9] 模型表现 - DeepSeek-R1 在 GitHub 上获得 91100 个 star 显示全球开发者广泛认可[4] - 在 MMLU MMLU-Pro C-Eval GPQA Diamond 等 21 个主流基准测试中几乎全部取得更好成绩[15] - 模型展现出高级推理模式如自我反思 验证和动态策略适应 并能指导增强小型模型[16] 行业影响 - Nature 社论肯定 DeepSeek-R1 是首个经同行评审后发表的主流 LLM 推动行业透明化[5] - 同行评审机制可澄清 LLM 工作原理 评估模型真实性 避免基准测试被操控[6][17] - 开源模型使更广泛社区能理解修复缺陷 但需加强安全性测试应对潜在风险[18] - Nature 呼吁更多 AI 公司提交模型评审 用证据支持言论 验证相关主张[18]
DeepSeek登上Nature封面,梁文锋带队回应质疑,R1训练真29.4万美金
36氪· 2025-09-18 01:32
刚刚,DeepSeek-R1登上了Nature封面! 今年1月,DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning论文发布,如今成功登上全球顶刊封面。 通讯作者梁文锋带队,用RL为大模型推理能力开辟了全新路径。 论文地址:https://www.nature.com/articles/s41586-025-09422-z 值得一的是,补充材料首次公开了R1训练成本——294000美元,数字低到惊人。 即便是加上约600万美元的基础模型成本,也远低于OpenAI、谷歌训练AI的成本。 在封面推荐中,Nature毫不吝啬地赞扬了DeepSeek-R1的成就。 开源之后,R1在Hugging Face成为最受欢迎的模型,下载量破1090万次。关键是,它是全球首个经过同行评审的主流大模型。 | Training Costs | DeepSeek-R1-Zero | SFT data creation | DeepSeek-R1 | Total | | --- | --- | --- | --- | --- ...
DeepSeek-R1论文登上Nature封面,通讯作者梁文锋
36氪· 2025-09-18 00:45
太令人意外! 却又实至名归! 最新一期的 Nature 封面,竟然是 DeepSeek-R1 的研究。 也就是今年 1 月份 DeepSeek 在 arxiv 公布的论文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》。这篇Nature论文 通讯作者正是梁文锋。 论文链接: https://www.nature.com/articles/s41586-025-09422-z 在封面的推荐介绍中,Nature 写到: 如果训练出的大模型能够规划解决问题所需的步骤,那么它们往往能够更好地解决问题。这种『推理』与人类处理更复杂问题的方式类似,但 这对人工智能有极大挑战,需要人工干预来添加标签和注释。在本周的期刊中,DeepSeek 的研究人员揭示了他们如何能够在极少的人工输入 下训练一个模型,并使其进行推理。 DeepSeek-R1 模型采用强化学习进行训练。在这种学习中,模型正确解答数学问题时会获得高分奖励,答错则会受到惩罚。结果,它学会了推 理——逐步解决问题并揭示这些步骤——更有可能得出正确 ...