Workflow
Seek .(SKLTY)
icon
搜索文档
AI医学的“DeepSeek时刻”快来了?
第一财经· 2025-09-19 00:32
在最新一期《自然》封面上,首次出现了来自中国AI科技公司DeepSeek的大模型R1。此前,全球的科技公司中仅有拿下过诺贝尔奖的DeepMind的 AlphaFold获此殊荣。 本文字数:1960,阅读时长大约3分钟 作者 |第一财经钱童心 2025.09.19 在药物研发过程中,科学家通常会确定体内的某个靶点,例如肿瘤突变或特定激素的受体,然后寻找能够与其结合并改变其行为以治疗某种症状或疾病的 分子。在此基础上,研究人员设计出能够击中靶点并且不会对身体的其他部位造成破坏的化合物。 "人工智能的吸引力在于它可以快速浏览分子数据库,将化合物与靶点相匹配。"一位制药领域专家对第一财经记者表示,"但这只是药物发现的第一步, 还有很多问题目前尚无法用人工智能来预测,例如药物的毒副作用。" 人工智能工具已经在其他科学领域展现出潜力,例如极端天气预报。自2022年底ChatGPT推出以来,生成式AI的迅猛发展在医学领域也掀起热潮。从药物 设计到医学影像,AI企业正在加速与临床应用的融合。随着中国大模型更多技术细节的披露,未来也有望推动大模型在医学领域的落地,AI医学的 DeepSeek时刻即将到来。 AI制药能否孵出"金 ...
DeepSeek 创始人梁文锋在《自然》杂志回应质疑,R1 训练真 29.4 万美金
新浪财经· 2025-09-19 00:03
学术成就与行业认可 - DeepSeek团队的研究成果登上Nature封面,论文主题为通过强化学习激发大语言模型推理能力 [1][3] - Nature发表评论文章对DeepSeek-R1的创新性给予高度评价,称其开创了AI推理新范式 [1][3] - 该模型成为全球首个经过同行评审的主流大语言模型,审稿人认为这一先例有助于系统风险评估 [5][8] 技术突破与创新 - 采用纯强化学习框架DeepSeek-R1-Zero,摒弃传统监督微调(SFT)阶段,仅通过答案正确性给予奖励信号 [10] - 训练成本仅29.4万美元(含20.2万美元Zero阶段+1万美元SFT数据创建+8.2万美元其他成本),总成本远低于行业巨头 [6][7] - 使用GRPO(组相对策略优化)算法替代传统PPO,通过组内竞争机制降低资源消耗并保持训练稳定性 [23][24] 性能表现与能力进化 - 在AIME 2024数学竞赛中,模型准确率从初始15.6%提升至77.9%,结合自洽解码技术后达86.7% [10] - 训练过程中出现"顿悟时刻",模型自主增加思考链长度(最高达数百token)并涌现自我反思、替代解法探索等高级策略 [14][16] - 经过多阶段训练后,在AlpacaEval 2.0和Arena-Hard基准测试中性能提升17%-25%,同时保持数学编程领域顶尖水平 [21] 训练方法论 - 采用四阶段训练流程:冷启动微调、第一轮RL强化推理、大规模SFT混合非推理数据、第二轮RL对齐人类偏好 [18][19] - 设计双轨奖励系统:推理任务采用基于规则的严格奖励(避免奖励投机),通用任务采用基于模型的奖励 [25][26] - 关键训练参数包括学习率3×10⁻⁶、KL散度系数0.001、批次大小512,并在8200步时将上下文长度从32K扩展至65K token [31][34] 市场反响与行业影响 - 开源后在Hugging Face平台下载量突破1090万次,成为最受欢迎模型 [5] - 引发OpenAI质疑可能使用ChatGPT输出训练,但审稿人认可其方法独立性并通过复现验证有效性 [37][39] - 被评价为"开启革命",多国实验室正尝试将该方法扩展至数学编码之外领域 [42]
DeepSeek团队发表重磅论文,《自然》配发社论狂赞呼吁同行效仿
扬子晚报网· 2025-09-18 13:19
研究论文发表 - DeepSeek-R1推理模型研究论文登上《自然(Nature)》封面 成为全球首个经过同行评审的主流大语言模型[2] - 论文披露更多模型训练细节 强调大语言模型推理能力可通过纯强化学习提升 减少人类输入工作量[2] - 训练出的模型在数学 编程竞赛和STEM领域研究生水平问题等任务上表现优于传统训练的LLM[2] 同行评审意义 - 《自然》配发社论强调同行评审对AI模型至关重要 指出目前几乎所有主流大模型都未经过独立同行评审[4] - 同行评审有助于厘清LLM工作原理并评估其是否真正实现宣称功能[6] - DeepSeek-R1成为目前唯一接受同行评审的大语言模型[6] 评审过程与改进 - R1模型经过八位专家评审 从原创性 方法学和鲁棒性等方面接受评估[9] - 公司提供减少数据污染的技术细节 并补充模型发布后新基准评估结果[9] - 同行评审促使论文作出重要修改 所有举措被视作迈向透明化与可复现性的进步[9] 行业影响与呼吁 - 《自然》呼吁其他AI公司效仿DeepSeek做法 将AI模型开发纳入科学研究规范框架[10] - 开放模型允许更广泛群体发现并修复缺陷 虽存在安全争议但具有积极意义[10] - 若同行评审形成趋势 将极大促进AI行业健康发展 DeepSeek-R1被期待成为首个而非最后一个案例[10]
9.18犀牛财经晚报:生猪产能调控超预期 DeepSeek首次回应蒸馏OpenAI质疑
犀牛财经· 2025-09-18 10:30
银行业务动态 - 华瑞银行与苏商银行逆势推出年利率超2%的大额存单产品 其中18个月期利率2.15% 2年期利率2.35% 起购门槛均为20万元 [1] - 华瑞银行两款存单产品仅限上海地区购买 其中18个月期产品已售罄 2年期产品剩余额度仅7820万元 [1] - 业内分析认为高利率存单属于阶段性获客手段 旨在提升零售端市场竞争力 不具备长期可持续性 [1] 科技创新进展 - 科技部确认人形机器人已在汽车制造、物流搬运、电力巡检场景加速落地 关键技术实现突破 [1] - 脑机接口技术取得临床进展 国产脑起搏器实现全面商用 在8个国家400家医院开展植入 累计帮助3万名帕金森病患者 [1] 生猪产能调控 - 农业农村部联合发改委召开产能调控座谈会 要求头部企业带头减产 包括调减能繁母猪存栏量及控制出栏体重在120公斤左右 [2] - 调控措施超出市场预期 配套出台严控信贷投放和减少补贴等财政金融措施 [2] 医药领域突破 - 润生药业丙酸氟替卡松吸入粉雾剂获批上市 成为国内首款高端吸入粉雾剂产品 [2] 人工智能技术 - DeepSeek在《Nature》发表论文 披露R1模型训练成本仅29.4万美元 并回应训练数据仅来自普通网页和电子书 未使用OpenAI合成数据 [3] 企业债务动态 - 锤子科技内部人士回应1500万元债务问题 称罗永浩愿以个人名义偿还但将紫辉创投债务置于最后处理 [4][5] - 融创房地产新增三则被执行人信息 执行标的合计9.2亿元 公司现存被执行人信息280余条 被执行总金额超454亿元 [6] 监管合规事项 - 和顺科技因信息披露问题收到浙江证监局警示函 涉及275.50万元政府补助未及时披露及超募资金投资进展未披露 [7] 重大合同中标 - 蜀道装备控股子公司签署2468.38万元氢燃料电池生产线技术改造施工合同 [8] - 棕榈股份全资子公司中标4.33亿元高标准农田建设项目 占公司2023年营收14.12% [9] - 三维股份子公司中标1.58亿元铁路轨枕采购项目 [12] - 富临精工控股子公司获宁德时代15亿元预付款 用于锁定磷酸铁锂材料供应 [11] 土地资产获取 - 天地源子公司以20.15亿元竞得西安高新区住宅用地 [10] 资本市场动态 - 紫金黄金国际香港IPO预计融资超30亿美元 吸引GIC、Millennium、高瓴、贝莱德等机构认购半数股份 [5] 市场表现数据 - A股三大指数集体下跌 创业板指跌1.64% 沪深两市成交额3.135万亿元创年内第三 超4300只个股下跌 [13] - 机器人板块延续强势 芯片产业链逆势上涨 中芯国际创历史新高 有色金属板块大幅下跌 [13]
DeepSeek 首登《自然》封面:中国大模型创造新历史,做了 OpenAI 不敢做的事
36氪· 2025-09-18 09:56
就在今天,DeepSeek 的大型语言模型 DeepSeek-R1 的研究成果,作为封面文章登上了国际顶尖科学期刊《Nature》。 和 OpenAI 那些动辄上千万美元, 这个只花了 30 万美元训练出来的国产 AI 模型 ,曾经不仅一度引发美股震荡,现在还登上了 Nature 的最新封面。 图片链接:https://www.nature.com/nature/volumes/645/issues/8081 Nature 封面评语 此次登上 Nature 封面的文章,是 DeepSeek 年初在 arXiv 公布的论文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》,即 R1 的技术论文。 虽然大体上和年初那篇类似,但是补充了相当多细节。 论文作者名单,梁文锋是通讯作者 正文只有双栏 11 页,补充材料却来到了 83 页;而同行评审,就是审稿人与 DeepSeek 团队就论文某些问题进行讨论的记录(一般叫 rebuttal,反驳),也有 64 页之多。 这些新公开的资料,让我们看到了 De ...
DeepSeek紧急声明!
证券时报· 2025-09-18 09:26
公司声明与声誉维护 - 公司发布声明指出不法分子冒充公司或员工通过伪造工牌和营业执照等材料实施诈骗 [1] - 诈骗行为涉及在多个平台以算力租赁和股权融资等名义向用户收取费用 [1] - 公司强调从未要求用户向个人账户或非官方账户付款且任何私下转账要求均属诈骗 [2] - 冒用公司名义开展算力租赁或融资等行为均属违法并将依法追究法律责任 [2] - 公司提醒用户通过官方渠道获取信息且官方网页和App产品目前均为免费 [2] 学术成就与国际认可 - 公司研发的DeepSeek-R1推理模型研究论文登上国际权威期刊Nature封面 [2] - 该论文由公司团队共同完成且梁文锋担任通讯作者 [2] - 研究成果首次公开仅靠强化学习就能激发大模型推理能力的重要发现 [2] - 这是中国大模型研究首次登上Nature封面且为全球首个经过完整同行评审并发表于权威期刊的主流大语言模型研究 [2] - Nature社论评价该研究打破几乎所有主流大模型尚未经过独立同行评审的空白 [2]
登上《自然》!DeepSeek-R1训练方法发布
科技日报· 2025-09-18 08:39
技术突破 - 开源人工智能模型DeepSeek-R1采用纯强化学习方法提升大语言模型推理能力 减少人类输入工作量 [1] - 模型通过解决问题获得奖励强化学习效果 使用强化学习而非人类示例开发推理步骤 降低训练成本与复杂性 [1] - 在数学基准测试中DeepSeek-R1-Zero和DeepSeek-R1分别达到77.9%和79.8%得分 [1] 性能表现 - 模型在数学 编程竞赛及STEM领域研究生水平问题任务上优于传统训练的大语言模型 [1] - 在研究生水平的生物学 物理和化学问题上表现优异 [1] 方法创新 - 包含人类监督下的深入训练阶段以优化推理过程 [1] - 通过展示优质问题解决案例后生成推理模板 [1] - 未来研究可聚焦优化奖励过程以确保推理和任务结果更可靠 [1]
DeepSeek,严正声明!
中国基金报· 2025-09-18 08:37
公司声明与事件 - 深度求索公司发布声明称有不法分子冒充公司或员工实施诈骗 伪造工牌和营业执照等材料 在多个平台以算力租赁和股权融资等名义向用户收取费用 [1] - 公司强调从未要求用户向个人账户或非官方账户付款 任何私下转账要求均属诈骗 冒用公司名义开展算力租赁或融资等行为均属违法 将追究法律责任 [2] - 公司提醒用户通过官网deepseek com及官方认证账号获取信息 官方网页和App产品目前均为免费 API调用服务需前往官网开放平台充值 遇可疑情况可通过官方邮箱联系或向公安机关举报 [2] 公司背景与成就 - 深度求索成立于2023年 由中国知名量化投资机构幻方量化孵化 是一家总部位于杭州的人工智能研究机构 [3] - 创始团队由量化专家梁文锋领衔 集结了多名顶尖高校科研人才及具备国际机构经验的技术专家 [3] - 近期DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1研究论文登上国际权威期刊《Nature》封面 引发市场高度关注 DeepSeek-R1成为首个通过同行评议的主要大语言模型 [3]
训练成本29.4万美元,DeepSeek-R1登Nature封面,首个通过权威期刊同行评审的主流大模型获好评
36氪· 2025-09-18 07:55
DeepSeek-R1 的相关研究成果登上 Nature 封面,作为首个通过权威期刊同行评审的主流大模型,其也在技术之外,补充披露了训练成本。 9 月 17 日,DeepSeek-R1 的相关研究成果登上 Nature 封面,这一消息迅速在全球学术领域引发热烈讨论。其实相关研究成果已经于今年 1 月以预印本的 形式发表于 arXiv,但本次公开于 Nature 的意义在于其通过这一权威期刊接受了同行评审,换言之,外部专家并非只接收单向信息,而是能够在独立第 三方(编辑)的监督和管理下,通过一个协作过程提出问题并向作者团队要求更多信息,实属业内首次。 更加重要的是,不同于 1 月公开的预印本论文已经概述了研究方法以及 DeepSeek-R1 在一系列评测基准上的表现,这一正式见刊的论文中补充披露了该 模型的训练成本。据 Nature News 的报道显示,DeepSeek-R1 训练成本仅相当于 29.4 万美元,尽管 DeepSeek 已经为 R1 模型所依托的基础 LLM 投入了约 600 万美元,但成本总额仍远低于业内普遍认为的头部模型训练所需的数千万美元。 * 预印版论文地址:https://hyper ...
DeepSeek-R1 论文登上《自然》封面,通信ETF收涨1.92%
搜狐财经· 2025-09-18 07:50
市场表现 - 三大指数冲高回落 沪指跌1.15% 深成指跌1.06% 创业板指跌1.64% [2] - 旅游 CPO 芯片产业链板块涨幅居前 有色金属 大金融 稀土永磁板块跌幅居前 [2] - 国泰中证全指通信设备ETF收涨1.92% 成分股光库科技涨15% 烽火通信 长飞光纤 亨通光电涨停 [2] 人工智能技术突破 - DeepSeek-R1推理模型研究论文登上《自然》封面 为全球首个经过同行评审的主流大语言模型 [2] - 论文披露更多模型训练细节 正面回应蒸馏质疑 [2] 算力产业前景 - 华为预测2035年全社会算力总量增长10万倍 AI存储容量需求较2025年增长500倍 [3] - 华为公布昇腾芯片路线图 2026Q1推出昇腾950PR 2026Q4推出昇腾950DT 2027Q4推出昇腾960 2028Q4推出昇腾970 [3] 光通信行业分析 - 海外AI算力大额订单与强劲需求支撑光模块行业基本面 AI驱动算力扩张周期持续 [3] - 短期市场情绪化调整提供优质配置机会 中长期坚定看好光模块赛道 [3] 人工智能产业趋势 - 人工智能处于政策 技术 需求三维共振阶段 "人工智能+"行动提供政策赋能与资金支撑 [3] - 国产芯片及云计算龙头业绩逐步验证 大厂CapEx持续投入推高行业发展确定性 [3] - 行业景气度仍有上行空间 科技投资主线地位稳固 [3]