Seek .(SKLTY)
搜索文档
DeepSeek-R1论文登上Nature封面,通讯作者梁文锋
36氪· 2025-09-18 00:45
论文核心观点与行业意义 - DeepSeek-R1模型是首个通过权威学术期刊《自然》同行评审的大语言模型,其论文通讯作者为梁文锋[4][6] - 该研究采用强化学习方法训练模型进行推理,使模型学会逐步解决问题并自我验证,显著提高了在编程和研究生水平科学问题上的表现[6] - 将大模型纳入独立同行评审体系被视为从“技术竞赛”迈向“科学纪律”的关键一步,有助于遏制行业乱象、建立公众信任[7][8] 模型训练方法与技术创新 - 开发团队开辟了新思路:即使不用监督微调作为冷启动,通过大规模强化学习也能显著提升模型推理能力[10] - DeepSeek-R1-Zero采用群组相对策略优化降低训练成本,使用准确度和格式两种互补的奖励机制,并设计简单模板引导基础模型先推理后给出答案[10] - 模型在训练中展现出自我进化能力,学会生成数百到数千个推理token,并自然产生反思能力和探索不同解题方法的高级行为[11] - 针对R1模型构建了少量长思维链数据作为冷启动,解决了DeepSeek-R1-Zero可读性差、语言混杂的问题[12][13] - 训练流程包含推理导向的强化学习、拒绝采样和监督微调、用于所有场景的强化学习等多个阶段[14][15][16] 模型性能表现与基准测试 - DeepSeek-R1采用混合专家架构,激活参数370亿,总参数6710亿[20] - 在多项基准测试中表现优异:MMLU-Pro得分84.0,DROP得分92.2,GPQA Diamond得分71.5,AIME 2024得分79.8[20] - 编码能力突出:LiveCodeBench得分65.9,Codeforces评分2029,百分位96.3[20] - 中文任务表现强劲:C-Eval得分91.8,CLUEWSC得分92.8[20] 知识蒸馏与小模型应用 - 通过使用DeepSeek-R1整理的80万个样本对Qwen和Llama等开源模型进行微调,使小模型具备推理能力[18] - 蒸馏效果显著:DeepSeek-R1-Distill-Qwen-32B在AIME 2024达到72.6分,MATH-500达到94.3分[20] - 即使是1.5B小模型也展现出不错推理能力,在AIME 2024获得28.9分,Codeforces评分达到954[20]
美联储宣布降息25个基点;欧盟宣布对以色列实施制裁,以外长回应;DeepSeek-R1开创历史,梁文锋论文登上《自然》封面|早报
第一财经· 2025-09-18 00:20
美联储货币政策 - 美联储宣布降息25个基点 将联邦基金利率目标区间下调至4.00%-4.25% 为2024年12月以来首次降息 [2] - 美股市场出现分化 道指上涨0.57%至46018.32点 纳指下跌0.33% 标普500指数下跌0.10% [24] - 国际金价高位震荡 COMEX黄金期货下跌0.19%至3681.80美元/盎司 [24] 中国财政与经济数据 - 前8月全国一般公共预算收入148198亿元 同比增长0.3% 税收收入121085亿元同比微增0.02% 为今年以来首次由负转正 [5] - 8月新能源汽车国内销量117.1万辆 环比增长13% 同比增长18.3% 1-8月累计销量808.8万辆同比增长30.1% [10] - 8月新能源汽车出口22.4万辆 环比下降0.6% 同比增长1倍 1-8月出口153.2万辆同比增长87.3% [10] - 上海8月非银行业金融机构存款增加2780亿元 同比多增2858亿元 [12] 产业政策与企业发展 - 商务部将在全国选择约50个城市开展消费新业态、新模式、新场景试点建设 [6] - 国务院国资委将大力推动国资央企战略性专业化重组整合 提升国有资本配置和运营效率 [7][8] - 工信部就《智能网联汽车组合驾驶辅助系统安全要求》强制性国家标准公开征求意见 [9] - 万科完成近年来最大规模组织架构调整 撤销开发经营本部 将"5+2+2"架构调整为16个地区公司由总部直管 [22] - 东风集团成立新合资公司 注册资本84.7亿元 聚焦猛士品牌 与华为合作采用新模式 [23] 科技创新与研发突破 - DeepSeek团队研发的DeepSeek-R1推理模型论文登上《自然》封面 成为全球首个经过同行评审的主流大语言模型 [4] - WTO报告预测到2040年AI将使跨境商品和服务流动增加近40% [21] 资本市场动态 - 9月17日龙虎榜显示机构净买入豪恩汽电9598万元 蔚蓝锂芯9217万元 峰岹科技7130万元 [25][26] - 机构净卖出均胜电子1.66亿元 双环传动1.21亿元 天际股份1.13亿元 [27]
8点1氪|西贝回应“公筷喂狗”事件;美联储宣布降息25个基点;DeepSeek梁文锋论文登上《自然》封面
36氪· 2025-09-18 00:06
西贝餐饮事件 - 西贝餐厅因顾客使用公筷喂狗引发卫生争议 涉事餐具已全部丢弃并进行全面消杀 [1] - 温州市市场监督管理局表示国家及地方层面暂无法律依据认定商家允许宠物入内违规 顾客喂狗属个人行为且未造成直接损害暂不涉及行政处罚 [1] - 西贝品牌传播主管等岗位已停止招聘 月薪10-13K的招聘信息由企业官方发布且真实有效 [10][11][12] 美联储政策动向 - 美联储宣布降息25个基点 联邦基金利率目标区间降至4.00%-4.25% 为2024年12月以来首次降息 [1] 人工智能与科技 - DeepSeek团队梁文锋通讯作者的DeepSeek-R1推理模型论文登上《自然》封面 披露更多训练细节并回应蒸馏质疑 [2][3] - DeepSeek-R1成为全球首个经过同行评审的主流大语言模型 Nature评价其打破主流模型未独立评审的空白 [3] - AI芯片初创公司Groq完成7.5亿美元新一轮融资 投后估值达69亿美元 由Disruptive领投且三星等机构继续参与 [14] 企业动态与融资 - 蔚来集团完成11.6亿美元融资 资金将用于智能电动汽车研发、技术平台开发及充换电基础设施扩展 [14] - 青昀新材完成数亿元C轮融资 由元禾璞华领投 资金用于新一代鲲纶超材料研发及全球化产能扩张 [14] - 一星机器人完成数亿元种子轮融资 投资方包括BV百度风投、同创伟业及银河通用等产业化投资者 [15] 行业政策与消费 - 全国国庆文旅消费月启动 各地发放超3.3亿元消费补贴 银联及金融机构推出消费券和支付满减优惠 [6] - 香港加大鼓励生育力度 初生子女可享两年额外免税额26万港元 适用于2026/27课税年度末所有未满两岁子女 [9] - 职工医保个人账户余额支持转账至近亲属医保钱包 实现跨省医保个人账户共济使用 [4][5] 公司经营与市场 - 匹克被曝全员降薪 总部员工按薪资分档降薪10%-30% 直营分公司办公室职员降薪50% 董事长称整体降幅不到10% [6][7] - 合众新能源管理人否认山子高科重组哪吒汽车 山子高科仅为意向投资人之一 合众新能源破产重整案尚未确定重组投资人 [10] - 中国自行车和电动自行车社会保有量约5.8亿辆 其中电动自行车约3.8亿辆 全国每日因两轮出行减少碳排放约1万吨 [12][13] 金融市场表现 - 美股三大指数收盘涨跌不一 道指涨0.57% 纳指跌0.33% 标普500跌0.1% 热门中概股多数上涨且百度涨超11% [13] 消费与产业趋势 - 月饼行业向全年消费场景转型 中国现存月饼相关企业达2.01万家 广东以超2000家注册量位居第一 [16] - 海底捞多款儿童套餐标注部分预加工 产品由中央厨房统一生产配送至门店再烹制 以确保安全与口味稳定性 [8][9] - 绿茶餐厅撤下本店无预制菜现点现做广告语 外卖餐具上无预制菜字样被涂黑 但工作人员称烤鸡等招牌菜为现做 [4][5]
DeepSeek-R1开创历史,梁文锋论文登上《自然》封面
第一财经· 2025-09-17 23:09
公司里程碑 - DeepSeek-R1研究论文登上国际权威期刊《自然(Nature)》封面,通讯作者为梁文锋[1] - DeepSeek-R1成为全球首个经过独立同行评审的主流大语言模型[1] - 与今年1月发布的初版论文相比,本次论文披露了更多模型训练细节[1] 行业影响 - 目前几乎所有主流大模型都尚未经过独立同行评审,这一空白被DeepSeek打破[1] - 论文正面回应了模型发布之初关于蒸馏技术的质疑[1]
DeepSeek-R1开创历史 梁文锋论文登上《自然》封面
第一财经· 2025-09-17 23:07
公司成就 - DeepSeek-R1推理模型研究论文登上国际权威期刊《自然(Nature)》封面 [1] - 论文由DeepSeek团队共同完成,梁文锋担任通讯作者 [1] - 与今年1月发布的初版论文相比,本次论文披露了更多模型训练细节并正面回应了模型发布之初的蒸馏质疑 [1] 行业地位 - DeepSeek-R1是全球首个经过同行评审的主流大语言模型 [1] - 《自然》评价指出目前几乎所有主流大模型都还没有经过独立同行评审,这一空白终于被DeepSeek打破 [1]
仿制药→创新药,中国生物医药领域迎来“DeepSeek时刻”
搜狐财经· 2025-09-17 15:23
(央视财经《经济信息联播》)在生物医药领域,部分国产创新药在疗效上展现出了能媲美 国际药企 明星药品的表现。近年来,有越来越多的国际制药企业斥巨资和中国药企展开合作。 今年年初,中国的人工智能模型DeepSeek以极低的开发成本和强大的性能获得了世界的瞩目,而其实 在生物技术领域,中国也正在迎来类似的"DeepSeek时刻",中国药企正在从过去的仿制药时代进入到创 新药时代,并且吸引了众多的国际合作。合作的主要形式是授权合作:外方获得在中国以外市场对中方 药品或相关技术,开发、生产及商业化权利。 宏观上来看,美国生物医药数据公司DealForma在今年5月份发布的报告显示:中国生物医药企业在全球 大型授权交易,也就是首付款达到5000万美元或以上的交易中,按数量看占比已达42%,这一比例与去 年的27%和前年的20%相比显著增加。 一些亮眼案例,就例如今年5月辉瑞支付了12.5亿美元的首付款,获得了三生制药一款创新药在海外市 场的授权。此外,今年上半年,美国制药公司艾伯维、默沙东和再生元等和中国药企总计签署了价值数 十亿美元的授权合作协议。 值得一提的是药企阿斯利康,在过去两年间已和十多家中国创新药企达成了授 ...
中国创新药授权出海跑出加速度!中国生物技术领域迎来DeepSeek时刻
新浪财经· 2025-09-17 15:00
行业趋势 - 中国创新药行业呈现爆发式增长态势,授权出海交易金额大幅增长 [1] - 生物技术领域正迎来类似人工智能模型DeepSeek的突破时刻,标志着从仿制药时代进入创新药时代 [1] - 创新药授权出海交易势头迅猛,仅2024年上半年交易金额已超过660亿美元,超过去年全年总额 [1] 交易与合作 - 2024年5月,辉瑞支付12.5亿美元首付款获得三生制药一款创新药在海外市场的授权 [1] - 2024年上半年,美国制药公司艾伯维、默沙东和再生元等与中国药企总计签署了价值数十亿美元的授权合作协议 [1] - 中国药企的创新成果吸引了众多国际合作 [1]
汤道生:腾讯是最早拥抱DeepSeek的,背后是基于用户诉求
新浪科技· 2025-09-17 04:37
云服务商业模式 - 当前云产品主要基于使用量收费模式 包括存储 计算和网络带宽等基础设施服务 [1] - 应用层服务如营销云尚未采用效果付费模式 主要因效果受客户产品定位和目标客户群匹配度等非技术因素影响 [1] - 多数客户理解并接受订阅制商业模式 该模式在应用层面更为可行 [1] 公司战略导向 - 公司战略选择坚持用户为先原则 聚焦用户痛点场景提供最优解决方案 [2] - 基于用户对DeepSeek模型的强烈需求 公司成为最早拥抱该模型的企业 [2] - 多模技术战略将持续围绕用户需求展开 通过技术组合最大化满足客户需求 [2]
阿里开源通义DeepResearch,性能超OpenAI、DeepSeek旗舰模型
新浪科技· 2025-09-17 03:33
模型性能表现 - 在Humanity's Last Exam评测中取得32.9分 超越OpenAI o3的24.9分和DeepSeek V3.1的29.8分 [2] - 在GAIA评测中获得70.9分 高于Claude-4-Sonnet的68.3分和OpenAI o3的未公布分数 [2] - 在WebWalkerQA测试中达到72.2分 超过OpenAI o3的71.7分和DeepSeek V3.1的61.2分 [2] 技术架构创新 - 采用合成数据驱动的完整训练链路 解决长周期任务中的"认知空间窒息"和"噪声污染"问题 [1] - 基于3B激活参数架构 在多个权威评测集上实现SOTA性能表现 [1][2] - 模型框架和方案已全面开源 可通过Github、Hugging Face和魔搭社区获取 [1] 竞品对比优势 - 在BrowseComp-ZH评测中获得43.4分 优于OpenAI 04-mini的28.3分但低于OpenAI o3的49.7分 [2] - 在FRAMES测试中取得90.6分 显著超越Claude-4-Sonnet的80.7分和DeepSeek V3.1的83.7分 [2] - 在xbench-deepsearch评测达到75.0分 高于DeepSeek V3.1的71.0分和Kimi Researcher的69.0分 [2]
豆包月活1.57亿反超DeepSeek重夺榜首,腾讯元宝增速22.4%
新浪科技· 2025-09-16 16:41
行业竞争格局 - 2025年8月豆包以1.57亿月活跃用户规模重新成为原生AI应用月活第一[1] - 豆包月活环比增长6.6%,超越DeepSeek[1] - DeepSeek月活环比下降4.0%,排名发生变化[1] 企业表现亮点 - 腾讯元宝月活环比增速高达22.4%,在TOP10应用中增速最大[1] - 腾讯元宝月活规模处于1000万-1亿量级,位列原生APP月活用户第三位[1] - AO应用月活环比增速达60.1%,排名上升4位[1] 细分市场动态 - 即梦AI在AI创作设计领域月活环比增长10.8%[1] - 豆包爱学和快对AI在AI学科教育领域月活分别环比下降7.0%和6.5%[1] - Kimi月活环比下降9.6%,规模量级下降至500-1000万区间[1]