Workflow
开源大模型
icon
搜索文档
中国工商银行原首席技术官吕仲涛:展望智能金融五大趋势,开源生态与成本降低推动行业普惠化变革
新浪财经· 2025-12-20 13:34
吕仲涛指出,当前金融行业的AI创新已进入以大模型为关键抓手的新阶段。特别是随着以DeepSeek R1 为代表的开源大模型生态的崛起,推动大模型生态进入了开源的普惠期,特征包括模型的全能化,技术 的普惠化,应用的全面化,创新的全民化。他总结出智能金融发展的五大核心趋势: 趋势一:慢思考技术拓展复杂业务场景。 以DeepSeek为代表的"慢思考"(思维链)技术显著提升逻辑 推理上限,带来场景创新,使其在信贷授信决策、虚增销售识别、客户潜在需求洞察及舆情深度分析等 细分场景中发挥关键作用,助力实现客户服务精准化、风险管理前瞻化、运营管理自动化。 趋势二:推理成本降低助力智能金融普惠规模发展。 通过模型蒸馏等技术,小参数模型性能大幅提 升,显著降低了AI部署门槛和推理成本。这使得广大中小金融机构能够广泛应用AI技术,从核心业务 延伸至更多长尾场景,增强智能金融服务的高可及性。 趋势三:智能体迭代升级驱动金融智能新时代。 金融智能体正从"推理者"向"智能体"阶段演进。它们 通过增强的信息获取、决策和执行能力,能够执行复杂的金融任务,如交易监控、资产配置、风险评估 等,通过会话式界面串联业务功能,极大提升金融服务效率与 ...
3年亏7亿、资不抵债? 暖哇科技冲刺港股IPO倒计时
凤凰网财经· 2025-12-15 14:11
文章核心观点 - 暖哇科技港股IPO进程面临多重不确定性,包括财务数据有效期临近、自身持续亏损与资不抵债、客户高度集中、技术依赖开源模型以及港交所IPO审核趋严等挑战 [2][4][5] 01 3年亏损超7亿真相 - 公司营收增长迅猛,2022年至2024年收入从3.45亿元增至9.44亿元,复合增长率高达65.5% [6] - 但同期账面亏损持续,2022年至2025年上半年累计净亏损达7.18亿元 [6] - 若参考经调整净利润(非国际财务报告准则计量),公司自2023年起已实现盈利,2023年、2024年及2025年上半年经调整净利润分别为1851.5万元、5750万元及2490.3万元,对应利润率分别为2.8%、6.1%及5.8% [7] - 巨额账面亏损主要源于会计处理,即可转换可赎回优先股被确认为金融负债,其公允价值随估值提升产生账面亏损,上市后转为权益将不再产生此类亏损 [8] - 截至2025年6月30日,公司流动负债总额16.96亿元,总资产较流动负债缺口9.66亿元,其中以公允价值计入损益的金融负债达13.46亿元,主要为11.98亿元的可换股可赎回优先股,上市后资产净值有望转正 [9] 02 毛利率承压下滑 - 公司综合毛利率呈先升后降趋势,从2022年的57.7%微升至2023年的58.3%后,2024年骤降至49.8%,2025年上半年回升至51.0%,但仍较2023年峰值回落7.3个百分点 [10] - 核心业务AI承保解决方案收入占比从2022年的62.5%稳步攀升至2025年上半年的74.5%,但其毛利率从2022年的69.1%降至2024年的53.3%,2025年上半年略微回升至56.7% [11] - 另一业务AI理赔解决方案毛利率长期较低,2024年为37.8%,2025年上半年进一步降至34.4%,对整体毛利形成不利影响 [12] - 公司坦承在与大型保险公司的谈判中议价能力较弱,客户要求更优惠的定价和条款,若无法通过提升销量或降低成本弥补,经营业绩可能受损 [13] 03 半数收入依赖众安在线 - 公司客户集中度高,2022年至2025年上半年,前五大客户收入占比分别为92.3%、82.9%、78.9%和73.6% [14] - 众安在线是公司的并列第一大股东(持股31.65%)、第一大客户及重要供应商,形成“股东+客户+供应商”三重绑定 [14] - 来自众安在线的收入占比在2022年至2025年上半年分别为78.7%、61.8%、45.2%和49.6%,尽管近年有所波动下降,但仍接近半数 [14] - 这种深度绑定暴露了公司客户多元化不足、业务独立性欠缺的弱点 [14] 04 开源模型藏多重风险 - 公司自称“中国保险业最大的独立AI科技公司”,但其AI系统开发中使用Qwen2.5、DeepSeek-V3等开源大模型 [15] - 公司回应称开源软件仅用于基础服务支持,核心竞争力在于自主研发能力,使用开源模型可提高效率、降低运营成本 [16] - 但公司也承认使用开源软件伴随多重风险,包括技术错误、许可证维护不当可能引发侵权诉讼或冲击业务稳定性,以及竞争对手可能借此开发同类产品削弱其市场竞争力 [16] - 数据安全与监管合规风险持续存在,相关法规持续演变可能导致公司经营或技术不合规,合规成本与不确定性较高 [16] 05 港股IPO审查趋严? - 港交所与香港证监会联合致函保荐人,指出近期新上市申请出现质量下滑问题及部分不合规行为,强调将确保审核严谨进行,提升上市资料质量 [17] - 市场分析认为香港证监会备案流程预计将持续趋严,港股IPO窗口的不确定性增加 [17] - 这对于财务数据有效期已进入倒计时的暖哇科技构成又一重挑战 [17]
3年亏7亿、资不抵债? 暖哇科技冲刺港股IPO倒计时
凤凰网财经· 2025-12-15 11:41
公司IPO进程与时间压力 - 公司向港交所递表已满三个月,但尚未进入关键的聆讯环节 [1] - 公司申报的财务数据有效期已进入倒计时,招股书有效期也仅剩3个月时间 [1] 公司创始人及股权结构 - 公司创始人、董事长兼首席执行官卢旻现年50岁,拥有超过20年保险科技行业从业经验 [1] - 卢旻曾历任上海保险交易所保险科技事业部总经理,并曾在阿里巴巴及易保网络技术任职 [1] - 卢旻与众安在线并列为公司的第一大股东,持股比例达31.65% [1] 公司市场地位与营收增长 - 公司自称“中国保险业最大的独立AI科技公司”及“中国健康险行业具备全栈风险分析能力的最大的AI科技公司” [3][5] - 公司营收增长迅猛,近三年复合增长率高达65.5% [3] - 2022年至2024年,公司收入从3.45亿元飙升至9.44亿元 [5] - 2024年实现营收9.44亿元,2025年上半年录得4.31亿元,同比保持微增 [5] 公司财务亏损状况 - 2022年至2025年上半年,公司累计净亏损达7.18亿元 [5] - 各期净亏损分别为:2022年2.23亿元、2023年2.40亿元、2024年1.55亿元、2025年上半年0.9988亿元 [5] - 税前亏损占收入的比例从2022年的64.7%下降至2025年上半年的23.2% [6] 公司经调整净利润表现 - 若参考经调整净利润(非国际财务报告准则计量),公司盈利表现截然不同 [6] - 2023年经调整净利润首次转正为1851.5万元,2024年增至5750万元,2025年上半年达2490.3万元 [6] - 对应经调整净利润率分别为2.8%、6.1%及5.8%,已呈现持续盈利态势 [6] - 经调整净利润与报告净利润差距巨大,主要因调整了“金融负债公允价值变动亏损”等科目 [7] 金融负债与资不抵债状况 - 巨额账面亏损主要源于“金融负债公允价值变动亏损”,该亏损并非真实经营损失 [7] - 该亏损源于公司发行的可转换可赎回优先股,其公允价值随公司估值提升而被动增加,产生账面亏损 [7] - 截止2025年6月30日,公司流动负债总额高达16.96亿元,总资产较流动负债缺口达9.66亿元,处于“资不抵债”状态 [8] - 以公允价值计入损益的金融负债达13.46亿元,主要为11.98亿元的可换股可赎回优先股 [8] - 公司表示,一旦成功上市,该类优先股将自动转换为普通股,相关账面亏损将不再产生,并有望实现资产净值转正 [7][8] 公司毛利率表现与压力 - 公司综合毛利率呈现先升后降的承压态势 [10] - 综合毛利率从2022年的57.7%微升至2023年的58.3%后,2024年骤降至49.8%,2025上半年回升至51.0% [10] - 2025年上半年毛利率较2023年峰值回落7.3个百分点,且同比2024年上半年的52.5%下降1.5个百分点 [10] - 核心业务AI承保解决方案收入占比从2022年的62.5%稳步攀升至2025年上半年的74.5% [10] - 但AI承保解决方案毛利率从2022年的69.1%降至2024年的53.3%,2025年上半年略微回升至56.7% [10][11] - AI理赔解决方案的毛利率长期较低,2024年为37.8%,2025年上半年进一步降至34.4% [11] - 公司坦承在与大型保险公司的谈判中议价能力较弱,核心客户持续要求更优惠的定价和条款 [12] 客户集中度与关联方依赖 - 公司客户集中度过高,2022年至2025年上半年,前五大客户收入占比分别高达92.3%、82.9%、78.9%和73.6% [14] - 众安在线是公司的并列第一大股东(持股31.65%)、第一大客户及重要供应商,形成“股东+客户+供应商”的三重绑定 [14] - 来自众安在线的收入占比在2022年至2025年上半年分别为78.7%、61.8%、45.2%和49.6%,尽管有所波动下降,但仍接近半数 [14] - 这种深度绑定暴露了公司客户多元化不足、业务独立性欠缺等弱点 [14] 技术路径与开源模型风险 - 公司AI系统开发中使用的是Qwen2.5、DeepSeek-V3等开源大模型 [16] - 公司表示开源软件仅用于基础服务支持,竞争力核心是自主研发能力,使用开源模型可提高效率、降低运营成本 [16] - 但公司也承认使用开源软件伴随多重风险,包括技术错误、许可证维护问题可能引发侵权指控或诉讼,冲击业务稳定性 [16] - 开源软件的开放性可能导致竞争对手借此开发同类产品,削弱其市场竞争力 [16] 数据安全与监管合规风险 - 公司表示所有医疗数据处理均符合《个人信息保护法》及相关法规 [17] - 但公司坦承数据保护、AI应用相关监管法规正持续演变,新的法律法规可能施加新的要求或禁令,导致经营或技术不合规 [17] 港股IPO市场环境变化 - 港交所确认与香港证监会就上市申请相关事宜联合致函保荐人,直指近期新上市申请中出现的质量下滑问题及部分不合规行为 [19] - 港交所表示将致力确保新上市申请的审核能及时且严谨进行,确保提交的上市资料内容完整并维持高质素 [19] - 市场分析认为香港证监会备案流程预计将持续趋严,港股IPO窗口的不确定性增加 [19] - 这对于财务数据有效期进入倒计时的公司而言,是又一重挑战 [19]
扎克伯格押注阿里千问,全球AI竞赛格局变了
搜狐财经· 2025-12-12 04:19
文章核心观点 - 中国AI模型,特别是阿里巴巴的通义千问,已在开源生态和软件算法层面具备全球领先实力,并开始向全球输出技术标准和生态,全球AI格局正从“模型为王”转向“应用为王”,并形成“西谷(谷歌)东阿(阿里)”的双巨头格局 [2][18] Meta转向采用中国AI模型 - Meta创始人扎克伯格态度发生180度转变,其新模型“牛油果”(Avocado)项目选择蒸馏阿里巴巴的通义千问开源模型 [3] - 转变源于商业理性与技术现实,Meta实验室发现依赖自研或美国本土模型难以达到最优性能与成本平衡 [5] - 硅谷精英为效率和性能买单,Airbnb CEO称赞千问“比OpenAI更好更便宜”,推特创始人也期待其产品与千问3-Coder结合 [6] 中国开源模型的崛起与领先地位 - 2024年8月,阿里千问模型的衍生模型数量首次超越Meta [5] - 阿里通义团队实行“饱和式开源”策略,已开源300多款模型,实现“全尺寸、全模态”覆盖,支持全球119种语言 [6] - 英伟达CEO黄仁勋指出中国在开源领域遥遥领先,千问的曲线陡峭上升并占据开源模型大部分市场份额 [7] - DeepSeek发布R1时,其6个小尺寸模型中有4个采用了千问进行蒸馏 [5] “西谷东阿”全栈AI格局形成 - 全球范围内,只有谷歌和阿里巴巴真正打通了从底层芯片、云基础设施、大模型到顶层应用生态的完整闭环 [9] - 阿里拥有从底层AI云、中层千问模型矩阵到上层淘宝、高德、钉钉等国民级应用及海量数据的“端到端”全栈AI体系 [11] - 阿里云季度营收同比增长34%,AI相关产品收入连续9个季度实现3位数增长,形成“云+AI”正向飞轮 [12] - 资本市场形成“西谷东阿”共识,一年来阿里股价累计上涨超93%,与谷歌的涨幅(92%)几乎同步 [13] AI竞争转向应用与生态 - AI行业核心趋势正从“炫技”和“模型为王”走向“实用”和“应用为王” [15] - 千问APP自公测以来,仅用23天月活用户数就突破3000万,成为全球增长最快的AI应用,并实现从“陪聊”到“办事”的质变 [16] - 依托千问强大开源基座,中国AI应用在丰富度和渗透率上正以前所未有的速度追赶甚至超越美国 [17] - 未来AI竞争将是生态系统的碰撞,资金将更集中流向兼具“硬科技”(芯片、模型)和“软实力”(应用、生态)的头部玩家 [18][19]
开源模式重构产业竞争格局
经济日报· 2025-12-10 22:38
中国开源生态发展现状与规模 - 截至2024年底,中国活跃开源项目已超过300万个,活跃开源开发者达227万人,形成规模宏大、结构多元的开源人才队伍 [1] - 开源欧拉社区成员单位超2100家,全球贡献者突破2.3万人,用户数超过550万 [1] - openEuler系列操作系统累计装机量于2025年底将超过1600万套,已成为中国行业数智化首选操作系统,在互联网、通信、政务、金融、公共事业和能源等行业实现规模化应用 [1] 开源在关键技术与产业领域的突破 - 开源模式正重构AI竞争格局,中国在开源大模型领域处于领先位置,Qwen、DeepSeek等均在国际评测榜单名列前茅 [1] - 360集团开源视觉语言对齐模型FG-CLIP2,在29项权威公开基准测试中超越了Google的SigLIP2与Meta的MetaCLIP2,标志着在AI基础模型领域取得突破性进展 [2] - 在硬件领域,以RISC-V为代表的开源架构快速崛起,未来开源RISC-V将引领下一代AI算力体系,为后摩尔时代的自主创新提供重要机遇 [1] - 开源鸿蒙、开源欧拉等操作系统项目不仅在代码量与贡献者规模上实现量级突破,还在金融、航天等关键行业完成规模化落地 [2] 开源社区与平台的发展与转型 - 北京亦庄建设国内首个AI开源根社区“模力方舟”,已上线超1.6万个开源模型、超1万项数据集,旨在打造具有全球影响力的开源创新高地 [3] - 浪潮的UBML开源社区以“可视化开发+开源共享”为核心,大幅降低应用搭建门槛,帮助中小企业快速构建系统,并为开发者提供低试错成本的创新载体 [2] - 开源社区正向智能开发社区转型,以大模型能力为核心重构社区的技术底座、协作模式与价值生态,推动开发从“工具辅助”迈入“智能协同”新阶段 [3] - 开源社区价值落地需要构建从创作、反馈到变现的完整闭环,打通社区与应用市场的链接通道,让开发者分享的智能组件通过商业应用实现价值变现 [4] 政策与生态支持体系 - 北京经济技术开发区实施“开源聚力行动”,通过“科创十条”、“AI二十条”、“人才十条”等专项政策,系统性支持开源项目和企业发展 [3] - 开放原子开源基金会完善项目孵化、人才培养等全链条服务,通过人才评价机制、活动推动开源融入教学与实践,构建规范社区环境与完善激励机制 [3]
开源和闭源模型的差距在拉大:这是DeepSeek论文揭示的残酷真相
36氪· 2025-12-06 00:03
行业核心观点 - 开源大模型与闭源模型的性能差距正在扩大,而非缩小,尤其是在复杂任务上闭源系统展现出越来越强的优势 [1][2] 性能差距现状 - 在MMLU-Pro测试中,DeepSeek V3.2得分85.0,低于GPT-5的87.5和Gemini 3.0 Pro的90.1 [2] - 在GPQA Diamond测试中,DeepSeek V3.2得分82.4,低于GPT-5的85.7和Gemini 3.0 Pro的91.9 [2] - 在HLE测试中,差距尤为明显:DeepSeek V3.2得分25.1,GPT-5得分26.3,而Gemini 3.0 Pro高达37.7 [3] - 尽管DeepSeek V3.2是当前最强的开源模型,但在需要深度推理和复杂任务处理的场景中,与顶级闭源模型仍存在明显差距 [4] 开源模型的结构性困境 - **架构限制**:开源模型普遍依赖传统的vanilla attention机制,该机制在处理长序列时效率极低,严重限制了可扩展部署和有效的后训练 [5][6] - **资源投入鸿沟**:后训练是关键环节,但大部分开源模型的后训练预算可能连预训练成本的1%都不到,而DeepSeek V3.2的后训练计算预算超过了预训练成本的10% [7] - **AI Agent能力滞后**:在真实应用场景中,开源模型的泛化能力和指令理解能力明显落后,阻碍了实际部署的有效性 [8] - 具体表现为:在MCP-Mark中,DeepSeek V3.2得分45.9,低于Gemini 3.0 Pro的51.0;在MCP-Universe中,前者为80.3,后者为87.9;在Tool-Decathlon中差距更明显 [8] DeepSeek的技术创新与应对策略 - **架构革新**:引入DSA机制,通过“闪电索引器”选择top-k个最重要的token参与计算,将计算复杂度从O(L²)降至O(L×k),其中k=2048 [10] - 在128K上下文长度下,DSA大幅降低了推理成本且性能几乎无损,在AA-LCR和Fiction.liveBench等测试中表现甚至优于使用传统注意力的前代模型 [10] - **超常规资源投入**:持续强化学习训练预算已超过预训练成本的10%,为数学、编程、推理、Agent等六大领域分别训练专家模型 [12] - 在持续预训练阶段,模型经历了943.7B tokens的训练,并采用GRPO算法进行混合训练,整合推理、Agent和人类对齐任务 [12] - **系统化强化Agent能力**:开发了系统化的任务合成流程,合成了超过1800个多样化环境和85,000条复杂提示,涵盖24,667个代码Agent任务、50,275个搜索Agent任务、4,417个通用Agent任务和5,908个代码解释器任务 [13] - 效果显著:在MCP-Universe上达到80.3%的成功率,虽低于Gemini 3.0 Pro的87.9%,但已是开源模型最佳表现,显著缩小了与闭源模型的差距 [13] 行业启示与路径 - 开源AI的生存之道在于技术路线创新,而非硬碰硬拼资源 [14] - DeepSeek V3.2证明了通过更高效的架构和更科学的后训练,可以用更少的资源实现接近闭源模型的效果 [13][14] - 如果Gemini 3.0证明了持续扩展预训练的潜力,DeepSeek V3.2则证明了在大规模上下文环境中强化学习的可扩展性 [13]
每日报告精选-20251205
国泰海通证券· 2025-12-05 13:30
人工智能与计算机行业 - DeepSeek-V3.2系列模型在公开推理基准测试中表现已对标GPT-5,其长思考增强版V3.2-Speciale在国际数学奥林匹克等顶级赛事中达到人类顶尖水平[4] - DeepSeek-V3.2通过在大规模Agent训练数据上进行强化学习,在涵盖1800余个环境的85,000余条复杂指令上训练,使其在工具调用评测中达到开源模型最高水平[5] - 豆包大模型日均tokens使用量已从2024年5月的1200亿增长253倍至2025年9月的超30万亿[10] - 豆包大模型1.6版本的综合成本较豆包1.5深度思考与DeepSeek R1下降63%[10] 公司研究与市场策略 - 首次覆盖富维股份,给予“增持”评级,预测2025/26/27年营业收入为208.72/220.62/231.65亿元,归母净利润为6.30/6.99/7.75亿元[13] - 2025年11月行业主题ETF规模前三板块为证券(13.0%)、芯片(12.0%)与医药(7.3%),合计占比32.3%[18] - 截至2025年11月28日,全市场固收+基金规模为21824.28亿元,产品数量1148只[20] - 本年中证2000指数增强策略超额收益为28.08%[30] 金融工程与量化策略 - 综合量化模型信号和日历效应,建议12月超配大盘风格和价值风格[24] - 本年以来大小盘轮动量化模型收益24.71%,相对等权基准的超额收益为1.5%[24] - 2025年11月下旬,日本国债市场经历剧烈抛售,40年期收益率飙至3.747%历史峰值,核心驱动因素包括21.3万亿日元财政刺激计划及日本央行削减长端购债规模[44] 债券市场与货币政策 - 截至2025年三季度末,摊余成本法债基的基金资产净值合计约1.47万亿元,债券投资市值规模为1.95万亿元[41] - 预计2025年末至2026年全年OMO利率仍有1-2次、累计10-20BP的降息空间[36] - 易受年末费率新规影响的债基持有信用债规模约占全市场托管余额的9.13%,规模约2.65万亿元[42]
超级大肉!国产GPU第一股上市,最高涨超500%,中一签狂赚27万!股民:我要酸死了...
雪球· 2025-12-05 07:52
市场整体表现 - 12月5日收盘,沪指涨0.7%,深成指涨1.08%,创业板指涨1.36% [1] - 沪深两市成交额达1.73万亿元,较上一交易日放量1768亿元 [1] - 全市场近4400只个股上涨,呈现涨多跌少格局 [1] - 保险、贵金属、福建、商业航天等板块涨幅居前,银行、中药、影视院线等板块跌幅居前 [1] 摩尔线程上市表现 - 被称为“国产GPU第一股”的摩尔线程于12月5日登陆科创板 [3] - 开盘竞价高开468%,盘中最高涨幅超500%,最高价达688元 [3] - 收盘报600.50元/股,总市值达2822亿元 [3] - 投资者中一签开盘卖出可盈利约27万元 [2][3] - 公司发行价为114.28元/股,本次发行募集资金总额约80亿元,净额75.76亿元 [8] - 募集资金将用于新一代AI训推一体芯片、图形芯片、AI SoC芯片研发项目及补充流动资金 [8] - 2022年至2024年及2025年上半年,公司营业收入分别为0.46亿元、1.24亿元、4.38亿元、7.02亿元 [8] - 同期归母净利润分别为-18.94亿元、-17.03亿元、-16.18亿元和-2.71亿元 [8] AI算力板块表现 - 受摩尔线程大涨提振,AI算力板块显著复苏,CPO概念领涨 [9] - 长光华芯收获20%幅度涨停,股价创历史新高,今年以来累计涨幅超230% [9] - 致尚科技、永鼎股份、可川科技涨停,东田微、炬光科技等涨超10% [12] - 深度求索发布DeepSeek-V3.2系列模型,在推理能力、工具调用与开源生态等方面实现突破 [15] - 国泰海通研报认为,DeepSeek-V3.2系列标志着开源大模型进入性能与实用性并重阶段,其推理能力媲美顶尖闭源模型 [15] - 东吴证券研报认为,国产算力呈现“商业兑现加速”与“技术范式突破”共振势头,已进入业绩兑现黄金周期 [15] 大金融板块表现 - 午后保险、证券、互联网金融等大金融板块持续拉升 [16] - 瑞达期货直线拉升封板,中银证券涨停,兴业证券涨超5%,湘财股份、东方财富、东北证券、华泰证券跟涨 [17] - 广发证券研报称,2025年市场活跃度回升,券商业绩高增,2026年行业ROE有望持续提升 [22]
国泰海通|计算机:DeepSeek-V3.2系列发布:推理能力对标顶尖闭源,开源生态引领应用落地
核心观点 - DeepSeek-V3.2系列的发布标志着开源大模型进入性能与实用性并重的新阶段 其在核心推理能力上达到顶尖闭源模型水平 并创新性地将思考模式融入工具调用 为AI应用开发提供了更高效、更经济的解决方案 推动大模型开源与开发者生态繁荣 [1][2] 模型性能与能力突破 - DeepSeek-V3.2在公开推理基准测试中表现已对标GPT-5 并显著优于部分专注长上下文的开源模型 [2] - 长思考增强版V3.2-Speciale在多项国际顶级竞赛中达到人类顶尖水平 在国际数学奥林匹克(IMO)、国际大学生程序设计竞赛(ICPC)等顶级赛事中斩获金牌 其中ICPC成绩位列人类选手第二名 [2] - V3.2-Speciale版本融合了深度数学定理证明能力 首次在多项高难度推理任务上验证了开源模型达到人类顶尖智力水平的潜力 [2] - DeepSeek-V3.2是业界首个将链式思考能力系统化融入工具调用流程的开源模型 [3] - 通过独创的大规模Agent训练数据合成方法 模型在涵盖1800余个环境的85,000余条复杂指令上进行强化学习 使其在未经特殊训练的工具调用评测中达到开源模型最高水平 显著缩小了与闭源模型的差距 [3] 技术架构与创新 - 模型创新性地实现了思考模式与工具调用的深度融合 大幅提升了智能体在复杂场景中的泛化与执行能力 [3] - 该架构允许开发者在思考模式下进行多轮规划与工具调用 为构建能够处理复杂、多步骤现实任务的AI智能体提供了可靠的开源基础 [3] - 此次更新支持了思考模式下的工具调用 提供了长达128K的上下文窗口 [4] 开源生态与产业影响 - 深度求索已将官方网页、App及API服务全面升级至DeepSeek-V3.2 并为研究社区临时开放了Speciale版本的API [4] - 公司通过HuggingFace、ModelScope等平台完整开源了模型权重与技术细节 [4] - 这种“开放性能 + 开放生态”的组合策略 大幅降低了企业与开发者的应用门槛 有望引领开源模型从技术追赶向规模化、实用化产业部署的关键转折 [4] - 彻底的开放策略预计将吸引大量开发者基于其构建垂直应用 形成以DeepSeek为核心的开源应用生态 进一步巩固其在开源领域的引领地位 [4]
DeepSeek V3.2正式版发布:官方称推理比肩GPT-5
凤凰网· 2025-12-03 09:04
模型发布与性能表现 - 公司于12月1日正式发布新一代开源大模型DeepSeek-V3.2及其长思考增强版DeepSeek-V3.2-Speciale,并同步更新官方网页端、App及API至V3.2版本 [1] - DeepSeek-V3.2在公开推理基准测试中推理能力达到GPT-5水平,与Gemini-3.0-Pro接近,同时输出长度较Kimi-K2-Thinking显著缩短以降低计算开销 [1] - DeepSeek-V3.2-Speciale版本融合DeepSeek-Math-V2定理证明能力,在IMO、CMO、ICPC及IOI等国际竞赛中取得金牌成绩,其中ICPC成绩达到人类选手第二名水平 [1] 技术特性与能力提升 - 新版本首次实现思考模式与工具调用融合,支持在思考过程中调用外部工具 [5] - 通过大规模Agent训练数据合成方法,模型在1800多个环境和超过8.5万条复杂指令上进行强化学习训练,提升了泛化能力 [5] - 公司在智能体评测中达到当前开源模型最高水平,进一步缩小与闭源模型差距 [5] 版本演进与开放策略 - 此前实验版本DeepSeek-V3.2-Exp于两个月前发布,经用户反馈测试,其采用的DSA稀疏注意力机制在各项场景中未出现显著性能下降 [5] - Speciale版本目前以临时API形式开放,供社区研究与评测 [5]