Workflow
Seek .(SKLTY)
icon
搜索文档
DeepSeek新年炸场!梁文锋署名论文发布
第一财经· 2026-01-01 13:44
给AI"水管"加智能阀。 1月1日消息,DeepSeek赶在新年前发送了"贺礼",在新论文中提出了名为mHC(流形约束超连接)的新网络架构,旨在解决传统架构在大规模模型训练中 的不稳定性问题,这一研究或将为下一代基础架构的演进指明新方向。 新论文名为《mHC :Manifold-Constrained Hyper-Connections》(《mHC:流形约束超连接 》),DeepSeek创始人兼CEO梁文锋出现在了合著名单之中,而 解振达(Zhenda Xie)、韦毅轩(Yixuan Wei)、曹焕琪(Huanqi Cao)则是核心贡献者。 近年来,以超连接(HC)为代表的研究拓展了过去十年确立的通用残差连接范式(深度神经网络的经典连接范式),靠拓宽神经网络的"信息传输通道"、 增加通道间的连接,让模型性能变好。但这种多样化也导致了大规模训练中的不稳定性、可扩展性受限及内存访问开销大的问题。 因此,DeepSeek这篇论文针对超连接架构这些问题,提出兼顾性能与效率的改进框架,即mHC 架构,这类似于给超连接的"信息通道"加了一套"交通规 则",在保留性能优势的同时,又恢复了信息原样传递的特性,让模型训练更稳定 ...
AI进化速递丨DeepSeek提出mHC新架构
第一财经· 2026-01-01 13:05
行业技术动态 - 智元公司发布了一体化具身大小脑系统GenieReasoner [1] - 月之暗面公司计划于今年初上线多模态新模型 [1] - DeepSeek公司发布新论文,提出名为mHC(流形约束超连接)的新架构 [1]
DeepSeek 开年发布新论文:提出全新 mHC 架构,梁文锋现身作者名单
新浪财经· 2026-01-01 12:24
IT之家 1 月 1 日消息,北京时间今天下午,DeepSeek 公布了一篇新论文,提出名为 mHC (流形约束超连接)的新架构。根据介绍,该研究旨在解决传统超 连接在大规模模型训练中的不稳定性问题,同时保持其显著的性能增益。 这篇论文的第一作者有三位:Zhenda Xie(解振达)、Yixuan Wei(韦毅轩)、Huanqi Cao。值得一提的是,DeepSeek 创始人兼 CEO 梁文锋也在作者名单 之列。 IT之家附摘要部分大意如下: 最近,以超连接(HC)为例的研究通过扩展残差流宽度和多样化连接模式,扩展了过去十年建立的无 处不在的残差连接范式。虽然产生了显著的性能提升,但这种多样化从根本上损害了残差连接固有的恒 等映射属性,从而导致严重的训练不稳定性和受限的可扩展性,并且还会产生显著的内存访问开销。 为了应对这些挑战,我们提出了流形约束超连接(mHC),这是一个通用框架,可将 HC 的残差连接 空间投影到特定的流形上,以恢复恒等映射属性,同时结合严格的基础设施优化以确保效率。 经验实验表明,mHC 对于大规模训练是有效的,可提供切实的性能改进和卓越的可扩展性。我们预 计,mHC 作为 HC 的灵活 ...
DeepSeek改造何恺明残差连接!梁文峰亲自署名,十年首次重大升级
新浪财经· 2026-01-01 11:45
来源:量子位 | 公众号 QbitAI 残差连接十年未变,扩展之后却带来隐患 2026年新年第一天,DeepSeek上传新论文。 给何恺明2016成名作ResNet中提出的深度学习基础组件"残差连接"来了一场新时代的升级。 DeepSeek梁文峰亲自署名论文,共同一作为Zhenda Xie , Yixuan Wei, Huanqi Cao。 DeepSeek团队的实验表明,在这三个映射中,负责残差流内部信息交换的Hres矩阵贡献了最显著的性能 提升。 残差连接自2016年ResNet问世以来,一直是深度学习架构的基石。 其核心机制简洁明了,x+1 = x + F (x ,W),即下一层的输出等于当前层输入加上残差函数的输 出。 这个设计之所以成功,关键在于"恒等映射"属性,信号可以从浅层直接传递到深层,不经任何修改。 随着Transformer架构的崛起,这一范式已成为GPT、LLaMA等大语言模型的标准配置。 这个设计之所以成功,关键在于"恒等映射"属性,信号可以从浅层直接传递到深层,不经任何修改。 近期出现的Hyper-Connections(HC)试图打破这一格局。HC将残差流的宽度从C维扩展到n×C维 ...
DeepSeek,最新发布!
证券时报· 2026-01-01 10:56
DeepSeek发布新论文,梁文锋参与署名。 图为残差连接范式的示意图。本图对比了 (a) 标准残差连接、(b) 超连接以及 (c) 流形约束超连接的结构设计。与无约束的HC不同,mHC通过将连接矩阵 投影到一个约束流形上,专注于优化残差连接空间,从而确保训练的稳定性。 论文在结论与展望部分指出,实证结果表明,mHC能有效恢复恒等映射特性,相较于传统HC,能以更优的可扩展性实现稳定的大规模训练。关键的是, 通过高效的基础设施级优化,mHC以可忽略的计算开销实现了上述改进。 1月1日消息,DeepSeek发布了一篇新论文,提出了一种名为mHC(流形约束超连接)的新架构。该研究旨在解决传统超连接在大规模模型训练中的不稳 定性问题,同时保持其显著的性能增益。这篇论文的第一作者有三位:Zhenda Xie(解振达)、Yixuan Wei(韦毅轩)、Huanqi Cao。值得注意的是, DeepSeek创始人梁文锋也在作者名单中。 内部大规模训练结果显示,mHC可有效支持规模化训练,当扩展率=4时,仅带来6.7%的额外时间开销。 论文摘要指出,近来,以超连接(HC)为代表的研究通过拓宽残差流宽度和多样化连接模式,拓展了 ...
刚刚,梁文锋署名,DeepSeek元旦新论文要开启架构新篇章
新浪财经· 2026-01-01 10:34
来源:机器之心 新年第一天,DeepSeek 发布了一篇新论文,提出了一种名为 mHC (流形约束超连接)的新架构。 该研究旨在解决传统超连接在大规模模型训练中的不稳定性问题,同时保持其显著的性能增益 。 简单来说,DeepSeek 提出的 mHC 通过将传统 Transformer 的单一残差流扩展为多流并行架构,并利用 Sinkhorn-Knopp 算法将连接矩阵约束在双拟随机矩阵流形上,成功解决了超连接(HC)在大规模训练 中因破坏恒等映射属性而导致的数值不稳定和信号爆炸问题。 从根本上破坏了残差连接固有的恒等映射属性,导致了严重的训练不稳定性和受限的可扩展性,并额外 增加了显著的内存访问开销。 为了解决这些挑战,DeepSeek 的研究团队提出了Manifold-Constrained Hyper-Connections (mHC,流形 约束超连接)。 这篇论文的第一作者有三位:Zhenda Xie(解振达)、Yixuan Wei(韦毅轩)、Huanqi Cao。值得注意 的是,DeepSeek 创始人 & CEO 梁文锋也在作者名单中。 传统的残差连接(即 Transformer 中的 x + F ...
DeepSeek元旦发布新论文 开启架构新篇章
新浪财经· 2026-01-01 09:28
格隆汇1月1日|DeepSeek在元旦发布了一篇新论文,提出了一种名为mHC(流形约束超连接)的新架构。 该研究旨在解决传统超连接在大规模模型训练中的不稳定性问题,同时保持其显著的性能增益 。这篇 论文的第一作者有三位:Zhenda Xie(解振达)、Yixuan Wei(韦毅轩)、Huanqi Cao。值得注意的是, DeepSeek创始人&CEO梁文锋也在作者名单中。 ...
2025盘点:DeepSeek引领AI进化 国补激发消费活力 行业重塑带来更多可能
新浪财经· 2025-12-31 16:07
文章核心观点 2025年是中国数码3C行业经历深刻变革与加速发展的一年,以DeepSeek为代表的国产AI大模型引领了全球AI效率至上的新周期,国家补贴政策强力激活了消费市场,充电宝行业因安全事件迎来最严监管与洗牌,AI眼镜市场实现爆发式增长,同时系统级AI助手的出现引发了关于未来手机形态与生态权限的行业大讨论,这些变化共同重塑了产业的底层逻辑,标志着中国企业正从“并跑”向“领跑”跨越的关键节点 [1][14][27] DeepSeek引领AI效率革命 - 2025年1月20日,DeepSeek-R1发布,以仅约600万美元的极低训练成本冲击硅谷算力霸权,其数学和代码推理能力可对标顶级闭源模型 [1][15] - 9月推出的V3.2-Exp引入稀疏注意力机制,将API价格再次“腰斩”,12月发布的V3.2正式版将逻辑思考与Agent工具调用深度融合,在国际赛事中获金牌级表现 [2][16] - DeepSeek的“开源平权”策略,让千元级手机、入门级AI眼镜等设备能通过低成本云端API实现智能体验,引领了全球AI公司加码开源大模型的风潮 [2][16] “国补元年”激活3C消费市场 - 2025年1月8日,国家发改委、财政部发布政策,首次将手机、平板、智能手表纳入以旧换新补贴范畴,单机最高补贴500元,政策上线20天内即扭转消费疲软 [3][16] - 下半年政策扩容,广东、江苏、四川等14省地方加码,使单台设备综合补贴上限冲至700元,直接拉动全年3C零售额突破1200亿元 [3][16] - 补贴政策不仅带动销量,也促使消费者转向中高端产品,并将昂贵的AI体验门槛拉低至平民水准,加速了全行业智能化普及 [5][18] - 官方已宣布2026年国补政策将延续,且补贴范围有望进一步覆盖至智能眼镜等新兴品类 [5][18] “罗马仕事件”引发充电宝行业强监管 - 2025年6月,移动电源巨头罗马仕因产品自燃隐患被多所高校“封杀”,并遭民航局通报,该公司随后宣布召回近50万台问题产品,行业另一巨头安克也召回71万件 [5][19] - 事件导火索指向上游电芯供应商安普瑞斯未经报备擅自变更隔膜材料 [5][19] - 监管迅速反应:6月28日民航局发布紧急禁令;8月15日国家认监委强制要求所有在售充电宝加贴3C标志;11月工信部公示新增针刺试验等要求的“史上最严”新国标,计划于2026年Q1正式发布 [7][21] - 受事件影响,罗马仕自7月起停工整改6个月,近万张不达标的3C证书被撤销,行业告别低价公模的“狂野时代” [7][21] AI眼镜行业迎来爆发元年 - 2025年AI眼镜享受最高500元补贴,大幅降低消费门槛 [8][22] - 市场规模跨越式增长,全年全球出货量预计达1205万台,中国市场突破275万台,同比激增107%,稳居全球第一 [8][22] - 行业进入“百镜大战”,不仅Rokid、影目等专业品牌发力,华为、小米、阿里、理想汽车等巨头跨界入局,全球近70家企业布局,国际市场上Meta、谷歌与三星等纷纷加码 [10][24] 字节“豆包手机”引发系统级AI助手权限之争 - 12月1日,字节跳动联手中兴推出努比亚M153工程机,搭载“豆包手机助手技术预览版”,赋予AI模拟人类操作的全局权限,可实现跨应用连贯操作 [10][24] - 该技术随后引发“权限攻防战”,微信、支付宝等多家平台以“环境风险”为由对其进行了风控封禁 [12][26] - 此事件揭示了AI时代厂商App底层权限、用户信息安全与交互自由的多维矛盾,并引发行业对手机未来形态的思考:是封闭的应用容器,还是完全开放的数字化分身 [14][27]
科学圆桌会·趣谈2025| 药理学家:这一年,国产创新药正在经历“DeepSeek时刻”
新华社· 2025-12-31 05:04
今年,我们团队经过多年的努力,提出了靶向肾脏纤维化的嵌合抗原受体T细胞免疫疗法(CAR-T)新 思路,引起了业界的高度关注。但我深知,这仅仅是中国药物研发与细胞治疗领域快速发展大潮中的一 朵小小的浪花。 有一天,我们团队与国内生物医药公司讨论完这一新疗法的临床研究方案后,已是午夜时分。走出实验 室,一直紧绷的神经放松下来,我才注意到冬夜的校园那么美,多年前栽下的蜡梅已含苞待放。这何尝 不是创新药从零起步、艰难"绽放"的写照? 身为医药人,站在2025年岁末,有一种格外强烈的感慨:从被业界誉为"中国创新药元年"的2015年算 起,十年磨一剑,国产创新药正在经历"DeepSeek时刻":以长期积累的创新努力迎来产品重大突破。 在医药界,创新药有两个定律。 一个是"双十定律":十年时间、十亿美元,才能让一个新药从实验室 走向患者。这道"高墙",曾让无数创新梦想折戟;另一个就是"九死一生定律":约90%的创新药项目在 临床前或临床阶段失败,最终仅少数获批上市。 就拿我研究的领域来说,慢性肾脏病(CKD)正成为全球公共卫生面临的新挑战。今年5月召开的第78 届世界卫生大会(WHA),将肾脏疾病列入全球优先关注的重大非传 ...
药理学家:这一年,国产创新药正在经历“DeepSeek时刻”
新华社· 2025-12-31 05:02
身为医药人,站在2025年岁末,有一种格外强烈的感慨:从被业界誉为"中国创新药元年"的2015年算 起,十年磨一剑,国产创新药正在经历"DeepSeek时刻":以长期积累的创新努力迎来产品重大突破。 今年,我们团队经过多年的努力,提出了靶向肾脏纤维化的嵌合抗原受体T细胞免疫疗法(CAR-T)新 思路,引起了业界的高度关注。但我深知,这仅仅是中国药物研发与细胞治疗领域快速发展大潮中的一 朵小小的浪花。 有一天,我们团队与国内生物医药公司讨论完这一新疗法的临床研究方案后,已是午夜时分。走出实验 室,一直紧绷的神经放松下来,我才注意到冬夜的校园那么美,多年前栽下的蜡梅已含苞待放。这何尝 不是创新药从零起步、艰难"绽放"的写照? 在医药界,创新药有两个定律。 一个是"双十定律":十年时间、十亿美元,才能让一个新药从实验室 走向患者。这道"高墙",曾让无数创新梦想折戟;另一个就是"九死一生定律":约90%的创新药项目在 临床前或临床阶段失败,最终仅少数获批上市。 就拿我研究的领域来说,慢性肾脏病(CKD)正成为全球公共卫生面临的新挑战。今年5月召开的第78 届世界卫生大会(WHA),将肾脏疾病列入全球优先关注的重大非传 ...