大语言模型
搜索文档
梁文锋论文登上《自然》封面
财联社· 2025-09-18 00:49
学术研究突破 - DeepSeek-R1推理模型研究论文于9月17日登上《自然》期刊封面 由团队共同完成且梁文锋担任通讯作者 [1] - 论文较1月初版披露更多模型训练细节 并正面回应模型发布初期的蒸馏质疑 [4] - 该模型成为全球首个经过独立同行评审的主流大语言模型 打破行业空白 [4] 行业地位与影响 - 《自然》期刊评价指出 当前几乎所有主流大语言模型均未经过独立同行评审 DeepSeek率先实现这一突破 [4]
梁文锋论文登上《自然》封面
每日经济新闻· 2025-09-18 00:42
(文章来源:每日经济新闻) 与今年1月发布的DeepSeek-R1的初版论文相比,本次论文披露了更多模型训练的细节,并正面回应了 模型发布之初的蒸馏质疑。DeepSeek-R1也是全球首个经过同行评审的主流大语言模型。Nature评价 道:目前几乎所有主流的大模型都还没有经过独立同行评审,这一空白"终于被DeepSeek打破"。 由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上了国际权威期 刊《自然(Nature)》第645期的封面。 ...
8点1氪:西贝回应“公筷喂狗”事件;美联储宣布降息25个基点;DeepSeek梁文锋论文登上《自然》封面
36氪· 2025-09-18 00:19
西贝餐饮事件 - 西贝餐厅发生顾客使用公筷喂狗事件 餐厅负责人表示已丢弃涉事顾客使用过的筷子 餐具 桌布等物品 并未进入清洗流程 [4] - 餐厅当天夜间对前厅和厨房的所有餐具 厨具进行全面消杀 [4] - 温州市市场监督管理局表示国家及温州市层面暂无法律依据认定商家允许宠物入内违规 顾客用餐厅筷子喂狗属于个人行为 若未对其他顾客造成直接损害暂不涉及行政处罚 [4] 美联储货币政策 - 美联储决定将联邦基金利率目标区间下调25个基点至4.00%-4.25%之间 这是自2024年12月以来首次降息 [4] TikTok相关动态 - 特朗普第四次延长TikTok禁令宽限期 本次延迟三个月至12月16日 [5][7] 个人税务事件 - 河南李先生通过个税APP发现建筑公司持续一年为其虚假发放工资 可能涉及企业冒用个人信息虚列工资偷逃税款 税务部门已介入调查 [9] 医保政策更新 - 职工医保个人账户余额支持转账功能 参保人可将医保个人账户资金转账至近亲属医保钱包用于就医购药结算 实现近亲属间医保个人账户共济使用 [8] 餐饮行业动态 - 绿茶餐厅被曝撤下本店无预制菜现点现做广告语 外卖一次性餐具上无预制菜字样被涂黑 餐厅工作人员称烤鸡等招牌菜式是现做的 [8] - 海底捞多款儿童套餐标注部分预加工 客服回应称部分预加工产品由中央厨房统一生产并标准化配送至门店再进行最终烹制 旨在确保餐品安全与口味品质稳定性 [12][13] 上市公司薪酬事件 - 清华学霸吴舰被曝2022年薪资达2350万美元(约合人民币1.67亿元) 正面临美国证券交易委员会和美国司法部民事刑事双重起诉 被指控犯有电汇欺诈 证券欺诈和洗钱罪 目前处于在逃状态 [7][8] 人工智能与科技 - DeepSeek-R1推理模型研究论文登上《自然》期刊封面 是全球首个经过同行评审的主流大语言模型 [6][7] - 上汽荣威M7 DMH正式上市 全球首搭豆包深度思考大模型 限时售价8.58万元起 可实现行业领先场景覆盖率的模糊语义理解和记忆贯穿能力 [23] 企业融资动态 - 蔚来集团成功完成11.6亿美元融资 通过公开增发新股进行 资金将用于智能电动汽车核心技术研发 新一代技术平台及车型开发 充换电基础设施扩展 [20] - AI芯片初创公司Groq完成7.5亿美元新一轮融资 投后估值达69亿美元 由Disruptive领投 贝莱德 路博迈集团等机构参与投资 [20] - 青昀新材完成数亿元C轮融资 由元禾璞华领投 资金将用于新一代鲲纶超材料研发 全球化产能扩张及产业链生态建设 [20] - 一星机器人完成数亿元种子轮融资 投资方包括BV百度风投 同创伟业 银河通用 蓝黛科技等机构 [21][22] 消费与零售 - 蜜雪冰城多个门店出现柠檬水断货 因进口柠檬受天气影响延期到港 同时川渝柠檬进入采摘期需储存优化口感 导致部分区域供应紧张 柠檬价格从去年9月7.83元/公斤上涨至今年9月15元/公斤 [15] - 全国国庆文旅消费月将启动 各地将发放超过3.3亿元消费补贴 文化和旅游部协调中国银联 金融机构 平台企业推出消费券 支付满减等优惠 [10] 企业治理与薪酬 - 匹克被曝全员降薪 总部员工工资5000-10000元降薪10% 10000-20000元降薪20% 20000元以上降薪30% 直营分公司办公室职员降薪50% 终端店铺员工未调整 董事长表示整体降薪幅度不到10% [11] - 日本航空公司因机长执飞前饮酒导致三个航班严重延误 37名高管将被降薪 社长鸟取三津子降薪30%两个月 负责安全监督和航班运营高管降薪20%一个月 其余高管降薪10%一个月 [14] 行业数据与趋势 - 中国自行车社会保有量超过2亿辆 电动自行车社会保有量约3.8亿辆 合计约5.8亿辆 全国每日因两轮出行减少碳排放量约1万吨 相当于节省汽油约660万升 [18] - 中国现存月饼相关企业达2.01万家 今年年内新增500余家 广东以超2000家注册量位居第一 河南 广西紧随其后 月饼行业正从季节性刚需向全年消费场景转型升级 [24] 支付与金融科技 - 谷歌支付服务将在沙特全面推出 沙特中央银行与蚂蚁国际签署协议 计划于2026年实现沙特境内可用支付宝支付服务 两家公司都将依托沙特国家支付系统mada完成支付受理 [9] 港股市场政策 - 香港特区政府加大鼓励生育力度 从2026/27课税年度起 在每名子女出生后首两年 纳税人可就该名子女享有双倍额外免税额(26万港元) [14] 企业高层变动 - 雀巢董事会主席保罗·布克因投资者施压提前卸任 原定2026年4月卸任 现将于10月1日由帕布罗·伊斯拉接替 投资者认为其在一年内连续两任CEO非正常离职事件中负有责任 [16] 汽车行业动态 - 合众新能源管理人否认山子高科重组哪吒汽车 山子高科相关工作人员称公司仅是意向投资人之一 合众新能源破产重整案第一次债权人会议已召开 尚未确定重组投资人 [16] 企业招聘动态 - 西贝餐饮集团招聘品牌传播主管月薪10-13K 引发讨论 有观点认为薪酬在一线餐饮大企中不算高 另有媒体人透露在传统消费品牌里待遇不错 随后西贝品牌传播主管 法务主管 内容营销总监等多岗位已停止招聘 [16][17][18] 宏观经济数据 - 2025年1-8月全国一般公共预算收入148198亿元 同比增长0.3% 其中全国税收收入121085亿元 同比微增0.02% 这是今年以来全国税收收入累计增速首次由负转正 [11] 股市表现 - 美股三大指数收盘涨跌不一 道指涨0.57% 纳指跌0.33% 标普500指数跌0.1% 热门中概股多数上涨 百度涨超11% 蔚来涨超6% 拼多多涨超4% 阿里巴巴 哔哩哔哩 理想汽车涨超2% [19]
早报|美联储宣布降息25个基点;清华学霸晒1.67亿元年薪引调查;多家餐饮店抹掉无预制菜字样;携程被约谈
虎嗅APP· 2025-09-18 00:17
美联储货币政策 - 美联储宣布降息25个基点 将联邦基金利率目标区间下调至4.00%-4.25% 符合市场预期 [2] - 此为2024年12月后时隔9个月再次降息 [3] - 市场普遍预期此次降息将影响全球资本市场流动性及美元汇率走势 [29] 中国平安组织调整 - 公司澄清搬离上海传闻 称部分员工回迁深圳系因监管要求注册地与办公场所一致 并非撤离上海 [4][5] - 涉及调整的为注册地在深圳的平安人寿总公司员工 注册地在上海的平安资管、平安养老险等子公司均保持不变 [5] - 此次调整基于《保险法》《公司法》等监管规定 属治理架构调整 [6] 宁德时代钠离子电池技术 - 公司钠离子电池能量密度达175Wh/kg 具备超500公里纯电续航能力 可覆盖超40%国内乘用车市场需求 [7] - 电池低温性能、碳足迹及安全性能优于锂离子电池 有助于拓宽新能源应用区域边界 [7] - 钠电乘用车动力电池正与客户推进开发 预计2026年实现批量供货 [8] 特朗普延长TikTok禁令 - 特朗普签署行政令 将TikTok禁令执行宽限期延长3个月至12月16日 为第四次延期 [11] - 中美经贸团队近期在马德里就TikTok等经贸问题进行坦诚深入沟通 [12] - 中国外交部回应称主管部门已介绍相关情况 未提供具体评论细节 [23][24] 餐饮行业预制菜争议 - 绿茶餐厅被曝撤下"无预制菜"广告语 外卖餐具相关字样被涂黑 喜家德门店亦遮盖"拒绝预制"标语 [15] - 海底捞回应儿童餐"部分预加工"标注 称产品由中央厨房统一生产配送至门店最终烹制 以确保安全与口味稳定性 [21][22] - 西贝回应顾客用公筷喂狗事件 称已丢弃相关餐具并全面消杀 提及儿童餐累计销售超4000万份 [25] 匹克集团薪酬调整 - 公司否认全员降薪 称调整针对亏损部门和高薪岗位 幅度10%-50% 低收入员工工资补足至3000元 [16] - 整体降薪幅度不到10% 保留绩效奖金制度 [16] - 2025年1-8月直营业务亏损逾1.3亿元 外销业务增长稳定 [16] 华为全联接大会 - 大会主题为"跃升行业智能化" 将发布昇腾AI芯片、鲲鹏计算等数智基础设施新品 [28] - 探讨AI在制造业、医疗等核心领域的应用 [28] 天津医保耗材新规 - 《天津市基本医疗保险医用耗材目录(2025年)》生效 包含3062种医用耗材 [30] - 1896种甲类耗材首次设定医保支付标准 推动部分高价耗材降价 [30] iPhone Air技术创新 - 通过取消实体SIM卡槽和采用高硅负极材料电池 在5.6mm超薄机身中实现27小时视频播放续航 [31] - 电芯密度提升至780Wh/L 较iPhone 16系列提高约18% [31] - iOS 26"适应性电源模式"可动态调整功耗 实测最多提升6%-8%电量 [32] DeepSeek科研突破 - DeepSeek-R1推理模型研究论文登上《自然》封面 为全球首个经同行评审的主流大语言模型 [10] - 论文披露更多模型训练细节 回应蒸馏质疑 [10]
8点1氪|西贝回应“公筷喂狗”事件;美联储宣布降息25个基点;DeepSeek梁文锋论文登上《自然》封面
36氪· 2025-09-18 00:06
西贝餐饮事件 - 西贝餐厅因顾客使用公筷喂狗引发卫生争议 涉事餐具已全部丢弃并进行全面消杀 [1] - 温州市市场监督管理局表示国家及地方层面暂无法律依据认定商家允许宠物入内违规 顾客喂狗属个人行为且未造成直接损害暂不涉及行政处罚 [1] - 西贝品牌传播主管等岗位已停止招聘 月薪10-13K的招聘信息由企业官方发布且真实有效 [10][11][12] 美联储政策动向 - 美联储宣布降息25个基点 联邦基金利率目标区间降至4.00%-4.25% 为2024年12月以来首次降息 [1] 人工智能与科技 - DeepSeek团队梁文锋通讯作者的DeepSeek-R1推理模型论文登上《自然》封面 披露更多训练细节并回应蒸馏质疑 [2][3] - DeepSeek-R1成为全球首个经过同行评审的主流大语言模型 Nature评价其打破主流模型未独立评审的空白 [3] - AI芯片初创公司Groq完成7.5亿美元新一轮融资 投后估值达69亿美元 由Disruptive领投且三星等机构继续参与 [14] 企业动态与融资 - 蔚来集团完成11.6亿美元融资 资金将用于智能电动汽车研发、技术平台开发及充换电基础设施扩展 [14] - 青昀新材完成数亿元C轮融资 由元禾璞华领投 资金用于新一代鲲纶超材料研发及全球化产能扩张 [14] - 一星机器人完成数亿元种子轮融资 投资方包括BV百度风投、同创伟业及银河通用等产业化投资者 [15] 行业政策与消费 - 全国国庆文旅消费月启动 各地发放超3.3亿元消费补贴 银联及金融机构推出消费券和支付满减优惠 [6] - 香港加大鼓励生育力度 初生子女可享两年额外免税额26万港元 适用于2026/27课税年度末所有未满两岁子女 [9] - 职工医保个人账户余额支持转账至近亲属医保钱包 实现跨省医保个人账户共济使用 [4][5] 公司经营与市场 - 匹克被曝全员降薪 总部员工按薪资分档降薪10%-30% 直营分公司办公室职员降薪50% 董事长称整体降幅不到10% [6][7] - 合众新能源管理人否认山子高科重组哪吒汽车 山子高科仅为意向投资人之一 合众新能源破产重整案尚未确定重组投资人 [10] - 中国自行车和电动自行车社会保有量约5.8亿辆 其中电动自行车约3.8亿辆 全国每日因两轮出行减少碳排放约1万吨 [12][13] 金融市场表现 - 美股三大指数收盘涨跌不一 道指涨0.57% 纳指跌0.33% 标普500跌0.1% 热门中概股多数上涨且百度涨超11% [13] 消费与产业趋势 - 月饼行业向全年消费场景转型 中国现存月饼相关企业达2.01万家 广东以超2000家注册量位居第一 [16] - 海底捞多款儿童套餐标注部分预加工 产品由中央厨房统一生产配送至门店再烹制 以确保安全与口味稳定性 [8][9] - 绿茶餐厅撤下本店无预制菜现点现做广告语 外卖餐具上无预制菜字样被涂黑 但工作人员称烤鸡等招牌菜为现做 [4][5]
刚刚!DeepSeek梁文锋论文登上《Nature》封面了!
是说芯语· 2025-09-17 23:35
研究论文发表 - DeepSeek-R1推理模型研究论文登上《自然》期刊封面 由团队共同完成 梁文锋担任通讯作者[1] 模型训练细节 - 论文披露更多模型训练细节 并回应模型发布初期的蒸馏质疑[3] - 基座模型DeepSeek-V3 Base训练数据全部来自互联网 可能包含GPT-4生成结果但非有意为之 无专门蒸馏环节[5] - 提供训练过程中减轻数据污染的详细流程 证明未在训练数据中有意包含基准测试[5] 行业地位与评价 - DeepSeek-R1成为全球首个经过同行评审的主流大语言模型 打破主流大模型未经独立同行评审的空白[3] - 《自然》杂志认为同行评审是抑制AI行业过度炒作的有效方式 因厂商无法验证的宣传可能对社会带来真实风险[5] 模型安全性 - 公司对DeepSeek-R1安全性进行全面评估 证明其安全性领先同期发布的前沿模型[5]
DeepSeek梁文锋论文登上《自然》封面
第一财经· 2025-09-17 23:23
研究突破 - DeepSeek-R1推理模型研究论文登上国际权威期刊《自然》封面[2] - 论文披露更多模型训练细节并正面回应蒸馏质疑[3] - 该模型成为全球首个经过同行评审的主流大语言模型[3] 行业地位 - Nature评价称DeepSeek打破主流大模型缺乏独立同行评审的空白[3] - 目前几乎所有主流大语言模型尚未经过独立同行评审[3]
DeepSeek-R1开创历史 梁文锋论文登上《自然》封面
第一财经· 2025-09-17 23:07
公司成就 - DeepSeek-R1推理模型研究论文登上国际权威期刊《自然(Nature)》封面 [1] - 论文由DeepSeek团队共同完成,梁文锋担任通讯作者 [1] - 与今年1月发布的初版论文相比,本次论文披露了更多模型训练细节并正面回应了模型发布之初的蒸馏质疑 [1] 行业地位 - DeepSeek-R1是全球首个经过同行评审的主流大语言模型 [1] - 《自然》评价指出目前几乎所有主流大模型都还没有经过独立同行评审,这一空白终于被DeepSeek打破 [1]
Shopify 经验贴:如何搞出一个生产级别可用的 AI Agent 系统?
Founder Park· 2025-09-17 12:50
架构演进与设计原则 - 系统核心围绕"智能体循环"构建 包括人类输入 LLM处理决策 环境执行和反馈收集的持续循环[5] - 工具库从最初几个函数扩展到几十个专业化功能 导致"千条指令之死"问题 系统提示词变得杂乱无章且难以维护[10][12] - 采用"即时指令"解决方案 在工具数据返回时附带相关指令而非全部塞入系统提示词 实现恰到好处的上下文[14] - 工具数量在0-20个时边界清晰易于调试 20-50个时边界开始模糊 50个以上时系统变得难以理解和推理[15] - 即时指令带来三大关键好处:局部化指导 缓存效率和模块化 使系统更易维护且所有性能指标提升[16][18] 评估系统构建 - 传统软件测试方法难以处理LLM输出的概率性和多步骤智能体行为的复杂性[17] - 放弃精心策划的"黄金"数据集 采用反映真实生产环境数据分布的"基准真相集"[20] - 评估流程包括人工评估 统计验证和基准设定 使用科恩系数 肯德尔等级相关系数和皮尔逊相关系数衡量标注者一致性[22] - 开发专门的大语言模型裁判并与人类判断校准 将裁判性能从科恩系数0.02提升至0.61 接近人类基准0.69[21] - 构建大语言模型驱动的商家模拟器进行全面测试 在部署前重放真实对话以捕捉性能衰退和验证改进[24][28] 模型训练与优化 - 采用群组相对策略优化强化学习方法 使用大语言模型裁判作为奖励信号[31] - 开发N阶段门控奖励系统 结合程序化验证和语义评估[31] - 遇到严重奖励作弊问题 包括退出式作弊 标签式作弊和模式违规[32] - 模型学会创建错误筛选条件如customer_tags CONTAINS 'enabled'而非正确的customer_account_status = 'ENABLED'[33] - 通过更新语法验证器和大语言模型裁判解决作弊问题 语法验证准确率从93%提升至99% 裁判平均相关性从0.66增加到0.75[34][36] 核心建议与最佳实践 - 保持工具简单性 抵制在没有明确边界情况下添加工具的诱惑[37] - 从模块化开始设计 使用即时指令模式以保持系统可理解性[37] - 早期避免多智能体架构 单智能体系统能处理远超预期的复杂性[37] - 构建多个专门的大语言模型裁判来评估智能体性能的不同方面[37] - 将裁判与人类判断对齐 统计相关性是建立自动化评估信任的关键[37] - 预料奖励作弊问题并提前构建检测机制[37] - 结合程序化验证和语义验证以获得稳健的奖励信号[37] - 投资逼真的用户模拟器进行投产前全面测试[37] - 迭代改进裁判以应对新发现的失败模式[37]
具身智能还需要一个「五年耐心」
36氪· 2025-09-17 08:12
行业现状与核心瓶颈 - 具身智能行业,特别是人形机器人赛道,当前最热门的叙事是进入工业产线,但现实挑战巨大,通用机器人以牺牲“精准性”和“效率”为代价,与产线核心需求错位[2] - 当前通用机器人(尤其是人形机器人)的核心价值更偏向“情绪价值”,即通过技术进步引领社会共识和获取资源,而非立即产生商业化落地价值,许多宣传的落地场景是展示性或实验性的[3] - 行业普遍预期,具身智能有望在未来1-2年内迎来其“GPT-3.0时刻”,即在实验室环境下看到通用模型(大脑+小脑)的明显技术突破并对主流路线达成共识,但从该时刻到公众可用的“GPT-4.0时代”仍需约五年耐心[4][12] 关键技术挑战:数据瓶颈与范式转移 - 数据获取是当前具身智能赛道最窄的瓶颈,从现实世界通过遥操作或示教采集数据存在规模小、成本高、多样性不足三大局限,难以满足训练需求[6] - 与自动驾驶领域能以极低边际成本获取海量真实数据不同,通用机器人领域完全不具备这种数据获取优势[7] - 行业正推动范式转移,通过高精度物理引擎将“数据问题”转化为“算力问题”,在仿真环境中用代码自动化生成无限、多样化的数据,过去需团队数月采集的数据,现在可能只需一堆显卡运行一晚[8] - 仿真数据可高效解决模型从0到90%的能力广度问题,但最后从90%到99.999%的可靠性鸿沟,即“仿真到现实的差距”,必须依靠真实世界的数据来弥合[9][10] 物理世界约束与演进路径 - 具身智能从“GPT-3.0”到“4.0”的演进面临独特的物理约束,其“试错成本”与“物理世界的回环速度”与大模型不在一个量级,机器人一次错误可能导致财产损失或安全事故,且物理迭代速度以秒或分钟计,远慢于数字世界的毫秒级迭代[10] - 引入大规模人类反馈的前提是硬件的大规模部署,但大规模部署又要求机器人先达到极高的可靠性和性价比,这个“先有硬件部署,还是先有成熟智能”的矛盾是软件世界不存在的巨大障碍[11] - 物理世界的“长尾问题”复杂性呈指数级上升,同一个任务因物理参数的微小变化都可能导致失败,其极端案例的分布远比文本世界密集和致命[11] - 基于上述约束,理性预期是需要1-2年迎来“GPT-3.0时刻”,再需3-4年进行硬件铺开、真实数据积累和长尾问题攻克,才能迈向可靠可用的“GPT-4.0时代”[12] 潜在终局玩家画像 - 能够跑完具身智能漫长赛道的终局玩家需具备四大要素:世界一流的AI团队、海量的真实世界数据、顶级的工业制造能力、雄厚的资本与坚定的信念[13][14][15][16] - 目前最突出的潜在头部玩家是马斯克,其同时拥有顶级AI团队、雄厚资本、强大信念,更关键的是在“数据闭环”和“工业制造”上已展现世界级统治力,具有结构性优势[16]