R1推理模型

搜索文档
DeepSeek悄然发布开源版GPT-5竞品,定价更低
财富FORTUNE· 2025-08-26 13:04
深度求索新模型V3.1的技术突破与市场策略 - 新模型V3.1在部分基准测试中表现与GPT-5相媲美 且定价低于OpenAI的GPT-5 [2] - 模型参数规模达6850亿 采用混合专家架构 仅需激活部分参数以降低开发者计算成本 [6] - 首次在单一系统中同时实现快速应答与逐步推理功能 此前需分开处理 [6] 中国AI战略与国产化进程 - 深度求索是中国推进先进AI系统研发、部署与管控战略的关键一环 新模型专门针对国产芯片优化以实现卓越性能 [2] - 公司展现出应对美国出口管制的韧性 并减少对英伟达芯片的依赖 [5] - 中国AI生态包括阿里巴巴通义千问、月之暗面Kimi、百度文心一言等多模型体系 [3] 国际竞争与行业影响 - OpenAI首席执行官承认中国开源模型的竞争影响其开源决策 担忧全球技术生态可能主要依托中国开源模型构建 [4] - 深度求索模型已在中国广泛应用 并逐渐在全球普及 部分美国企业已基于其R1推理模型开发应用程序 [2] - 美国批准英伟达和AMD向中国出口专用AI芯片(包括H20芯片)但要求将销售收入的15%上缴美国政府 [4] 技术演进与行业评价 - 新模型虽未达R1模型的突破性水平 但持续实现实质性改进 被评价为"令人印象深刻" [7] - 成为少数具备同时实现快速应答与推理能力的开源权重模型之一 技术亮点被分析师称为"最大亮点" [6] - 开发者认为深度求索模型在生产应用部署上较OpenAI版本更复杂 后者部署相对便捷 [7]
当中国开源AI领跑,美国科技圈和政界坐不住了
搜狐财经· 2025-08-14 18:58
中国开源AI模型发展 - 中国正加快将开源人工智能模型打造成全球标准 此举震动美国科技巨头与政策制定者 担心美国优势被取代并筹划应对策略 [2] - 中国AI领域2024年突破不断 DeepSeek推出R1推理模型引发轰动 阿里巴巴密集推进Qwen系列开源 几乎每个季度都有新动作 持续巩固开源AI地位 [2] - 开源模型提供免费下载和自由修改 推动中国AI技术迅速在全球落地应用 美国专有模型公司感受到压力 OpenAI于8月初推出首个开源模型gpt-oss应对挑战 [2] 中美AI竞争格局 - 中国出现反超美国的可能性 凭借开放权重模型生态和半导体设计制造积极布局积蓄势能 [5] - 美国特朗普政府7月发布"美国人工智能行动计划" 明确指出开源模型可能在部分领域成为全球标准 呼吁打造基于美国价值观的领先开源模型 [5] - 中国高度竞争的商业环境和知识快速扩散 在AI竞赛中积累惊人动能 中美在不同AI领域各有优势 美国在大规模云端AI部署领先 中国长期在安防技术占优 [5] 开源模型性能与应用 - 研究机构Artificial Analysis评测显示 自2023年11月起中国最好开放权重模型整体性能已超越美国开源冠军 [7] - 在数学和编程等能力方面 阿里巴巴Qwen3某一版本击败OpenAI的gpt-oss [7] - 华侨银行利用开源模型开发约30款内部工具 使用Google Gemma总结文件 Qwen协助写代码 DeepSeek分析市场趋势 同时使用约10个开源模型 [7] 开源生态商业模式 - 开源AI领先者难以立即获得可观回报 研发成本动辄上亿美元 但可通过锁定用户后在生态内其他服务盈利 类似谷歌在安卓系统捆绑搜索和YouTube [6] - 企业偏好开源模式 可自由定制并部署在内部系统 将敏感数据留在自家服务器 [6] - 科研界长期将开源视为加速新兴技术发展的方式 中国鼓励AI、操作系统、半导体架构和工程软件领域的开源研发 [6] 中美AI生态差异 - 美国公司基础模型研发采取相对封闭策略 需要投入巨额资金挖角竞争对手核心成员 知识流动缓慢且代价高昂 [9] - 中国开源AI生态呈现高度竞争态势 领先基础模型公司相互压低价格 高调宣传 在人才与客户上互相挖角 [9] - 这种达尔文式竞争会淘汰部分现有玩家 但孕育出更强大的公司 DeepSeek和阿里巴巴等免费模型赢得全球用户青睐 [9]
速递|DeepSeek 2月刚盈亏平衡,梁文锋坚定AGI优先,拒绝融资和盲目商业化
Z Finance· 2025-03-16 11:19
文章核心观点 中国人工智能初创企业DeepSeek专注研究而非追逐收入,决心优先发展AGI,与硅谷对手形成鲜明对比,其发展引发市场对美国科技集团的质疑和担忧,同时自身也面临收入可持续性和芯片获取等问题 [1][2][3] 公司发展策略 - 公司由对冲基金亿万富翁梁文峰领导,选择专注研究,拒绝盲目商业化,将大部分资源集中在模型开发和追求构建人工通用智能 [2][3] - 创始人拒绝了中国科技巨头、风投和国家支持基金的投资兴趣,维持精简运作追求AGI [3] 公司业务情况 - 2月收入首次足以覆盖持续成本,自1月发布低成本R1推理模型后关注度持续上升,该模型性能与对手媲美但构建成本低得多 [2] - 客户主要来自医疗和金融等行业,购买R1和V3模型的API访问权限,因非研究用途资源不足暂停此类服务 [3] 与对手对比 - OpenAI利用早期领先优势围绕ChatGPT构建强大消费者业务,通过销售API创造可观收入,自2019年多轮融资约200亿美元,正计划以2600亿美元估值再筹集400亿美元,去年烧掉50亿美元用于训练新模型,实现约40亿美元收入 [4][5] - DeepSeek约160名员工,OpenAI拥有2000多名员工,且DeepSeek缺乏商业野心,与OpenAI专注推广大众市场产品不同 [6] 市场影响 - DeepSeek引发市场对谷歌和OpenAI等美国科技集团能否保持技术优势的质疑,以及对大型科技集团巨额AI基础设施支出计划是否明智的担忧 [3] - 腾讯采用DeepSeek开源模型后API销量成倍增长,约一半云服务客户尝试使用其模型,20%客户要求定制本地化版本 [6] 潜在问题与计划 - 公司收入流可持续性存疑,如苹果选择阿里巴巴的Qwen而非DeepSeek推出AI功能 [6] - 长远来看,获得英伟达新一代更先进芯片机会有限或成潜在瓶颈 [7] - 工程师正推进R2和V4型号发布,原定于五月的发布时间可能提前 [7]