开源模型

搜索文档
DeepSeek终于丢了开源第一王座,但继任者依然来自中国
量子位· 2025-07-18 08:36
模型排名与性能 - Kimi K2在全球开源模型中排名第一,总榜第五,紧追Grok 4等顶尖闭源模型 [1] - Kimi K2得分为1420,与Grok 4(1437)和GPT 4.5(1437)差距较小 [2][23] - 唯二进入总榜TOP 10的开源模型均来自中国(Kimi K2和DeepSeek R1) [2][28] 技术能力表现 - 连续多轮对话能力并列第一,与Grok 4和o3持平 [3] - 编程能力排名第二,与GPT 4.5和Grok 4相当 [3] - 应对复杂提示词能力排名第二,与o3和4o同梯队 [3] 社区热度与影响力 - GitHub标星达5.6K,Hugging Face下载量近10万 [5] - Perplexity CEO公开站台,计划基于K2进行后训练 [5] - 用户访问量过大导致API响应变慢 [6] 架构设计与优化 - 继承DeepSeek V3架构,但进行了参数调整 [9][12] - 增加专家数量,MoE总参数增加但激活参数量不变 [13] - 注意力头数减半以平衡成本,效果影响微小 [13] - 仅保留第一层Dense,其余使用MoE,推理效率无影响 [13] - 专家无分组设计,通过自由路由提升灵活性 [13] - 总参数增至1.5倍,但推理耗时更小且成本可控 [15] 行业趋势与观点 - 开源模型性能已接近闭源,TOP 10分数均超1400 [21][23] - 开源与闭源差距缩小,Kimi K2接近Grok 4和GPT 4.5 [22] - 行业人士认为开源击败闭源将更普遍 [25][27] - 开源模型在AI能力全球扩散中扮演关键角色 [27]
速速收藏!黄仁勋给了年轻人这些实用建议
天天基金网· 2025-07-18 06:17
AI发展阶段 - 人工智能发展速度非常快 每三到五年就有一次重大突破 经历了感知智能和生成式AI两个阶段 目前处于推理型AI阶段 [4] - AI下一阶段是物理型人工智能 能力将应用到机器人等物理机械中 [3][4] - 公司认为AI即将达到通用人工智能水平 在大多数测试中表现将超越人类 [4] 中国市场地位 - 中国是全球最大市场之一 具有神奇活力和独特优势 拥有阿里巴巴等实力雄厚的合作伙伴 [2] - 中国客户能利用公司产品创造令人惊叹的服务 [2] 开源技术发展 - 中国在开源工程方面表现突出 DeepSeek R1 通义千问 Kimi等是全球顶尖多模态推理模型 [6][7] - 中国研究人员在arXiv发表的论文数量全球最多 [7] - 开源是推动AI发展最安全的方式 能提高研究质量和安全性 [7] 硅技术演进 - 硅技术将持续进步 主要体现在三维晶体管结构 面板级封装和模块互联三个方面 [8] - 晶体管将从纳米片技术发展到GAA 再进化到堆叠鳍式场效应晶体管 [8] - 封装技术从单芯片处理发展到多芯片堆叠 CoWoS技术已实现量产 [8] - 硅光子技术将实现光子与电子直接连接 构建更大规模系统 [9] - 公司技术路线图已规划未来十年 预计该领域还有二十年发展空间 [9] 人才培养建议 - 年轻人需要掌握与AI互动能力 保持数学 逻辑思维和编程等基础技能学习 [12] - 应尽早接触和使用AI 这是新一代计算机技术 能力强大且易于使用 [10][12] - 当代年轻人是伴随AI成长的全新世代 具有独特发展优势 [12]
一场关于AI能力与人类智慧的对话
科技日报· 2025-07-18 01:20
AI技术发展趋势 - 下一波AI浪潮是物理AI,融入人类物理世界后解决问题的能力将很快超过人类 [1] - 生成式AI问世7年,已具备理解问题并解决问题的能力,可独立完成任务 [1] - AI不仅能模拟人类智慧,更能增强人类智慧,激发创造力 [2] 开源模型的影响 - 开源模型对中国和全球AI领域都有帮助,汇聚资源形成的创新将造福整个生态系统 [3] - 开源模型如DeepSeek、Kimi等具有颠覆性,将成为驱动AI发展的主要动力 [3] - 开源模型可促进AI在医疗、金融、机器人等行业的高效发展,并确保模型安全性 [3] 芯片技术与AI发展 - 下一轮芯片创新可能采用复合芯片和共封装光学技术(CPO)来供给算力 [4] - 未来20年AI技术的发展仍依赖硅技术的进步和升级 [3][4] - 英伟达将继续在硅科技方面探索并升级,支撑AI技术的创新 [3][4] AI与人类智慧的关系 - AI将在为科学服务中进一步丰富人类智慧 [2] - AI激发人类创造力,如同飞机扩展人类活动范围,AI扩展人类思考能力 [2] - 两位领军人物一致认为AI的发展将增强而非替代人类智慧 [2]
从链博会看先进制造:多方共话产业链重构,黄仁勋热议物理AI
贝壳财经· 2025-07-17 15:32
链博会先进制造主题活动核心观点 - 第三届链博会先进制造主题活动聚焦科技创新引领新质生产力发展,各界代表分享先进制造领域的创新突破、产业协同与全球化趋势[1][2] - 活动汇集110多家中外企业展示先进制造成果,突显国际合作对制造业发展的重要性[6] - 行业领袖围绕AI发展、算力基础、开源模型及硅科技等前沿话题展开深度对话[3][11] 政策与产业建议 - 中国贸促会提出三点建议:支持产业创新尊重企业主体地位、推动科技赋能加速AI应用、深化绿色制造国际合作[6] - 机械工业联合会强调科技创新是产业升级关键,指出全球产业链正经历数字化重构、协同化重塑和合作模式创新三大变革[6] - 新质生产力需依托新型举国体制和高水平自立自强,发展趋势呈现高端化、智能化、绿色化特征[9][10] 全球视野下的中国制造 - 普华永道指出中国经济发展三大驱动力:持续加大的研发投入(年增长率未披露)、高技能人才队伍优势、持续演进的产业生态系统[7][8] - 国际经验借鉴:美国聚焦前沿领域、德国专精特新、日本优势产业集中,中国将推进国际产能合作与产业链全球化[10] - 中国基础设施优势包括高速物流、智慧港口和互联产业园区,为先进制造提供效率支撑[8] AI技术前沿探讨 - 英伟达CEO提出AI发展四阶段:计算机视觉突破(2012-2017)、语言理解超越人类、生成式AI崛起、物理AI(机器人)新浪潮[13] - 算力被认定为AI发展的基础架构,推动从计算机时代向算力时代的范式转变[14] - 开源模型被视为安全发展AI的重要路径,可赋能医疗、金融等行业构建专属模型[15] 技术演进方向 - 硅科技将转向多芯片复合架构(桌式规模)与CPO光子技术,突破单芯片算力限制[15] - 物理AI将成为下阶段重点,实现AI能力与物理世界深度融合(如机器人应用)[13] - 生成式AI已具备理解问题、自主推理能力,这是技术发展史上的重大突破[13] 人才与产业未来 - 年轻人需掌握第一性原理和科学推理能力,而非依赖AI输出结果[16] - AI将作为"终身伙伴"赋能各类人群,成为21世纪决定性技术方向[16][17] - 行业呼吁加强AI应用实践,包括问题描述训练和答案验证能力培养[16]
黄仁勋:有点嫉妒年轻一代
财联社· 2025-07-17 11:43
人工智能发展趋势 - 人工智能下一波发展将聚焦"物理人工智能",即把推理能力应用于机器人等物理机械领域 [1][8] - 过去十年间人工智能计算性能已提升10万倍,为海量数据处理与高效学习奠定了基础 [2] - 人工智能正接近"通用人工智能"阶段,有望在多数认知任务及测试中超越人类表现 [8] 开源生态与工程 - 开源模型已改变人工智能的技术与商业格局,成为重要发展趋势 [2] - 开放创新从研究层面延伸至工程领域,能够实现全球生态系统资源整合 [3] - 中国在开源工程领域的布局尤为明智,其开源模型不仅助力本土生态发展,更对全球生态系统形成支撑 [3][4] 人工智能在科学领域的应用 - 面向科学的人工智能将产生最重大的影响,尤其在生物学和物理领域 [5][6] - 人工智能可解析蛋白质、化学物质、细胞乃至生命的本质,助力药物改进与设计 [5] - 人工智能在预测物理过程效率上远超物理模拟,将成为推动科学发展的核心力量 [6] 算力与芯片技术 - 算力是改变世界的基础架构,AI只是算力带来的成果之一 [10] - 未来硅基技术发展将转向多复合芯片组合,单芯片时代已过 [10] - 预计需要二十年时间完成技术探索和框架构建 [11] 人工智能与人才培养 - 年轻人需掌握问题思考的"第一原则",建立深度思考的思维体系 [12] - 建议学习科学推理、计算机编程等基础知识,即便未来未必从事相关工作 [12] - 融合人工智能的计算机成为"平等器",让各类人群都能获得赋能 [13]
关于科技未来的炸裂预言!黄仁勋王坚大佬对谈,年轻人尤可关注
21世纪经济报道· 2025-07-17 07:56
AI技术演进与未来趋势 - 生成式AI爆发仅是开始 下一波浪潮是物理AI 包括机器人 模拟自然法则 辅助药物设计等领域 [1][6] - AI已超越人类在图像识别 语音识别和语言理解能力 并进入推理阶段 能分解并解决未知问题 [1][6] - 技术迭代周期约4-5年 过去12年AI从认知任务扩展到生成式智能 未来将深度融合物理世界 [6][7] 算力的核心地位 - 算力是AI基础架构 改变世界的本质是算力而非计算机 AI将算力提升至新境界 [1][9] - 英伟达算力10年提升10万倍 支撑AI从预训练 人工强化训练到自主推理的演进 [9][10] - AI不仅模拟人类智慧 更增强创造力 其运行机制与大脑相似但更具扩展性 [9] 开源生态与全球协作 - 中国AI开源论文数量全球第一 Kimi DeepSeek等开源模型推动全球创新协作 [2][10] - 开源工程加速创新 允许跨组织贡献 形成安全发展路径 如DeepSeek论文获A+级全球审查 [11] - 开源模型赋能医疗 金融 机器人等行业 使各领域能定制专属AI解决方案 [11] AI与科学研究的融合 - AI将颠覆生物学研究 通过理解蛋白质 细胞结构辅助药物设计 延长人类寿命 [12] - 物理AI可模拟天气 海洋等复杂系统 比传统方法更高效预测自然现象 [13][14] - 硅基技术仍是AI算力基石 未来20年将通过多芯片复合架构持续突破性能极限 [14][15] 行业领袖对年轻人的建议 - 掌握第一性原理和科学推理 避免过度依赖AI答案 需保持批判性思维 [16][17] - AI是终极平等器 尽早掌握交互能力可赋能各阶层 农民 老年人均能受益 [18] - 当代年轻人将成为AI原住民 终生与AI共生 获得全程陪伴与记忆存储 [19][20] 中国科技力量崛起 - 杭州被视作中国硅谷 孕育DeepSeek Qwen等领先模型 展现区域创新实力 [11][12] - 中国在AI工程与制造领域进步显著 低估华为等企业的观点被批"极其天真" [23]
黄仁勋、王坚对谈全文:一场关于AI、算力与未来的炸裂“预言”
21世纪经济报道· 2025-07-17 06:07
AI技术演进与未来趋势 - 生成式AI爆发只是开始,下一波浪潮是物理AI(physical AI),即AI与物理现实融合,如机器人、模拟自然法则、辅助药物设计等 [2][7] - 2012年深度学习崛起是AI发展转折点,如今AI已超越人类在图像识别、语音识别和语言理解上的能力,并正在学会"推理" [2][6] - AI技术迭代周期约4-5年一次重大突破,过去12年AI迅速发展,目前已能解决大部分认知性任务 [7] - 算力是AI基础架构,AI将算力带到新境界,与其说计算机改变世界不如说是算力改变世界 [2][9] 开源模型与全球协作 - 中国是全球AI开源论文最多的国家,Kimi、DeepSeek等开源模型是中国AI参与全球协作的重要代表 [3][10] - 开源推动创新速度,开源模型汇集全球资源造福整个生态系统,是安全发展AI的方式 [11][12] - 开源不仅开放研究还要开放工程,每个人可贡献创新,如DeepSeek论文获A+评级并向全球开放 [11][12] AI与科学研究的融合 - AI将深刻影响科研方式,可用于理解蛋白质、细胞等生物结构,辅助药物设计延长人类寿命 [13] - AI能模拟复杂物理特性如天气、海洋物理等,帮助预测和推进科学发展 [13][14] - 生物学工程化是历史性机会,AI将帮助理解自然真相和模拟自然法则 [13][14] 算力与硬件技术发展 - 过去10年英伟达算力提高10万倍,能处理更多数据使机器学习更有效 [11] - 硅科技仍将是未来10-20年AI发展基础,但技术路径将转向多复合芯片等新架构 [14][15] - 新一代计算架构如CPU与不同组件连接,技术先进但仍有20年发展空间 [14][15] 行业生态与区域发展 - 杭州正成为全球创新中心,孕育DeepSeek、Qwen等颠覆性AI模型,被誉为"中国硅谷" [12] - AI不仅模拟人类智慧更增强人类创造力,将像飞机扩展人类活动范围一样扩展人类思维 [9]
黄仁勋对谈王坚,称“嫉妒年轻人”
第一财经· 2025-07-17 05:35
核心观点 - 算力是AI发展的基础架构,AI是基于算力发展起来的成果 [1] - AI技术在过去10多年中每隔5年就有一次大变革,目前已能完成大部分认知性任务,下一波浪潮是物理AI [2] - 开源模型改变了AI技术发展方式,中国研究者在AI相关论文数量上全球领先 [2] - 半导体硅为AI发展奠定基础,未来将通过复合芯片和光模块(CPO)技术提升算力 [4] - AI将改变人类与科技的关系,年轻一代将成为"AI原住民" [4] - AI会让人人更平等,各行业人群都应尽快应用AI技术 [5] AI技术发展 - 2012年深度学习技术"大爆炸"使AI能力超越科学家水平 [1] - 2012-2017年计算机视觉、语音识别超越人类能力,随后语言理解也实现超越 [2] - 生成式AI已能理解并生成信息,实现跨模态"翻译" [2] - 物理AI将是下一波浪潮,AI能力将融入物理世界如机器人领域 [2] - 开源模型成为AI发展新趋势,通过全球审查确保安全性 [2] 算力与芯片技术 - 半导体硅为AI发展提供坚实基础 [4] - 未来将采用多复合芯片组合方式,芯片组面积可达桌子大小 [4] - 光模块(CPO)技术将用于芯片连接 [4] - 相关技术发展仍需5-10年时间,公司已在规划10年后框架 [4] AI与人才培养 - AI是年轻人的终生机遇,年轻一代将成为"AI原住民" [4] - 需要建立深度思考体系,具备与AI交互和问题描述能力 [4] - 需培养辨析思维,判断AI回答的正确性 [4] - 不应认为AI会完全替代学习需求 [4] 行业应用前景 - AI将实现与人类共生发展,记录人生旅程 [4] - 机器人领域已实现落地应用,单台机器人可替代1.4-2名工人 [7] - AI将促进社会平等,各行业人群都应尽快应用 [5]
黄仁勋对谈王坚:赞DeepSeek写出A+论文,称“嫉妒年轻人”
第一财经· 2025-07-17 04:41
AI技术发展 - 算力是AI发展的基础架构,AI是基于算力发展起来的成果 [4] - 2012年深度学习技术大爆炸后,AI在计算机视觉、语音识别、语言理解等方面超越人类能力 [4] - 生成式AI近年快速发展,已能理解并生成信息,实现跨模态翻译(如文本到视频) [4] - AI每隔5年经历一次大变革,当前阶段可完成大部分认知性任务,下一波浪潮是物理AI(如机器人) [4] - 2023年开源模型成为AI领域重大改变,中国研究者发布的AI论文数量全球最高 [5] 算力与芯片技术 - 半导体硅为AI发展奠定基础,未来转变将集中在多复合芯片架构和光模块(CPO)连接技术 [5] - 英伟达规划未来5-10年技术框架,包括芯片组设计和光互联方案 [5] 行业机遇与人才 - AI是年轻人的终生机会,新一代将成为"AI原住民",与科技共生成长 [1][6] - 未来需培养深度思考能力,掌握与AI交互、问题描述及结果辨析的技能 [6] - AI将推动社会平等,降低各群体(如农民、老年人)的技术使用门槛 [6] 企业动态 - 英伟达CEO高度评价中国AI研究(如DeepSeek论文达到A+级科学与工程水平) [5]
华人工程师被疯抢,世界第一AI创业公司,走进覆灭前夜
钛媒体APP· 2025-07-15 04:54
全球AI人才争夺战 - 马斯克xAI公司创始团队12人中至少有5名华人工程师 包括吴宇怀 吉米·巴 杨格 戴子航和张国栋 [2][3] - Meta以四年3亿美元总包方案挖角OpenAI华人工程师余家辉 首年薪酬超1亿美元 [5][6][7] - Meta"超级智能团队"14名成员中8位为华人 多数来自OpenAI和谷歌DeepMind [10] OpenAI面临的核心挑战 - 2023年11月管理层内斗导致CEO奥特曼短暂出局 最终700名员工联名逼宫使其回归 [18][19][20] - 创始团队13人中仅剩3人留任 中高层流失严重 包括首席科学家 安全团队负责人等关键岗位 [20][21][22] - 2023年至今完成三轮共566亿美元融资 但股权激励支出达44亿美元 占营收119% [23][30] 中国AI力量的崛起 - 开源模型DeepSeek以557万美元训练成本实现比肩ChatGPT性能 迫使OpenAI考虑开源策略 [25][26] - 字节跳动挖角谷歌DeepMind前副总裁吴永辉 其为Gemini应用总技术负责人 [27][28] - 中国高校培养的顶尖人才正成为全球AI主力 Meta挖角团队中多人本科毕业于清华 北大等校 [10][11][12] 行业竞争格局变化 - OpenAI从谷歌DeepMind挖角3名顶级工程师 但随后自身遭Meta大规模挖角至少8名核心研究员 [14][15] - 谷歌DeepMind收购原OpenAI目标公司Windsurf 强化Gemini项目工具开发能力 [29] - OpenAI反挖角特斯拉 Meta xAI等公司技术高管 但股权激励模式难持续 [30] 技术路线调整 - DeepSeek打破"性能-成本-速度"不可能三角 推动OpenAI计划推出开源推理模型 [25][26] - OpenAI原定2024年夏季发布开放权重模型 但已两次推迟且无限期搁置 [26] - 中国通义 豆包 Kimi等模型快速迭代 形成对OpenAI的技术追赶压力 [27]