Workflow
开源模型
icon
搜索文档
大模型年中报告:Anthropic 市场份额超 OpenAI,开源模型企业采用率下降
Founder Park· 2025-08-04 13:38
基础大模型发展趋势 - 基础大模型正成为生成式AI核心引擎并重塑计算未来 其能力与成本控制的演进将推动系统 应用及产业格局变革 [2] - 模型API支出在6个月内从35亿美元增长至84亿美元 企业重心从训练微调转向模型推理 标志阶段性转折 [2] - 代码生成成为首个大规模爆发的AI应用场景 基础模型能力升级路径新增"带验证器的强化学习"(RLHF with verifiers) [2] 市场竞争格局变化 - Anthropic以32%企业使用率超越OpenAI(25%)和Google(20%) 成为市场新领跑者 Meta Llama占9% DeepSeek仅1% [9] - Anthropic崛起始于2024年6月Claude Sonnet 3 5发布 2025年系列版本(Claude Sonnet 3 7/4 Opus 4 Claude Code)巩固领先地位 [12] - 企业投入集中流向少数高性能闭源模型 开源采用趋势因前沿突破放缓而减弱 [3] Anthropic成功驱动因素 - 代码生成领域占据42%市场份额(OpenAI为21%) 催生19亿美元生态系统及AI IDE 应用构建工具等新形态产品 [13][14] - 采用带可验证奖励的强化学习(RLVR)突破数据瓶颈 成为提升模型可靠性与实际能力的关键路径 [15] - 率先实现Agent范式突破 通过多轮自我优化及工具调用提升模型执行力 2025年被称为"Agent之年" [16] 开源模型发展现状 - 开源模型运行任务占比从19%降至13% Meta Llama仍领先但Llama 4表现未达预期 [17] - 中国公司贡献突出开源模型(DeepSeek 字节跳动 阿里巴巴等) 但性能落后前沿闭源模型9-12个月 叠加部署复杂度导致份额停滞 [17][20] - 开源吸引力在于定制化 成本优势及私有化部署 但初创企业生产负载正加速转向闭源 [20] 企业模型选择行为 - 66%开发者选择原供应商升级 仅11%切换供应商 性能(非价格)是核心决策因素 [24][27] - 性能优先逻辑下 旧模型即使降价十倍也无法挽回用户 Claude 4发布一个月内即抢占45%用户 [27][30] - AI支出从训练转向推理 初创企业推理任务占比从48%升至74% 近半数企业主要计算任务由推理驱动 [31]
具有“开源精神”的投研团队是什么样的?
点拾投资· 2025-08-01 07:03
人工智能行业趋势 - 2025年被视为人工智能真正的元年,DeepSeek推出的V3和R1模型在7天内突破1亿用户并采用开源模式[1] - 开源模型推动科技民主化,使技术从"厨师做菜"变为"人人可做菜",并支持二次销售[1] - 开源是科技革命的第一推动力,中国在开源模型领域发展迅速,引发全球科技领袖对"开源与闭源"的讨论[1] 诺安基金科技组的投资策略 - 科技投资需专业团队,因科技股具有非线性特点,需抓住产业拐点实现高收益[2][3] - 团队通过前瞻性研究预判国产大模型奇点,认为开源加速智能供给,跟踪国内外开源团队形成超越市场的认知[2] - 科技投资覆盖全产业链,包括半导体国产化、AI应用、创新药等方向,形成多元化布局[15][16][26] 人工智能的经济影响 - AI推动全要素生产率提升,自动化优化决策并缩短创新周期[6] - 创造新市场如自动驾驶、智能机器人,并催生个性化推荐等商业模式[7] - 优化资源配置,提高基础设施智能化及市场平台匹配效率[8] 诺安科技组的团队构建 - 团队文化强调扁平化、包容性,避免阿尔法损耗,注重独立思考与开放共享[20][21] - 前瞻性产业判断通过多产业链交叉验证,把握半导体国产替代、AI变革等趋势[22][23] - 全产业链产品布局覆盖芯片、AI应用、创新药等,形成360度视角[25][26] 中国科技产业链发展 - 2020年华为制裁事件后,中国加速硬科技自主可控,完善创新产业链[12][14] - 半导体国产化突围与AI硬件突破推动中国科技竞争力提升[16][17] - 科技投资需"耐心资本",支持长期创新,优化社会资源配置[28] 基金经理观点与案例 - 邓心怡认为技术溢价能力反映不可替代性,需解决"真痛点"[9] - 刘慧影看好AI独角兽基于硬件突破与用户理解提升竞争力[10] - 唐晨关注AI医疗,如手术机器人实时数据分析与远程手术潜力[10]
基模下半场:开源、人才、模型评估,今天的关键问题到底是什么?
Founder Park· 2025-07-31 14:57
中国开源模型的崛起 - 中国开源模型如Kimi、Qwen、智谱GLM-4.5等近期密集发布,Hugging Face热门榜几乎被中国模型垄断[1][3] - 中国模型发展速度惊人,一旦模式被验证可行,中国擅长集中资源快速工程化实现[5][8] - 中国开源模型可能成为发展中国家的模型标准,尤其在"全球南方"市场占据优势[6][7] 中美AI竞争格局 - 大模型竞争已演变为中美之间的比拼,开源标准可能转向中国模型[3] - 美国如Meta等公司正加大投入,但中国在公私合作和资源投入方面更具优势[8][10] - 中国机构如清华大学已拥有先进语言模型,而美国部分高校资源相对不足[8][10] 模型训练与人才 - 不同机构间人才差异并不显著,模型好坏更多取决于资源利用效率[15][16] - 顶尖实验室内部普遍存在混乱,但关键在于能否产出有效模型[19][20] - 实验速度和基础设施比单纯追求"天才"更重要,需要重视团队协作价值[21][22] 模型评测与基准测试 - 当前更需要好的基准测试来评估模型能力,而非仅关注技术细节[3][24] - 制作高质量评测的门槛越来越高,但可能带来新的话语权[24][25] - 评测领域存在巨大蓝海机会,定义新任务不需要庞大算力[26] 强化学习与推理技术 - RL无法泛化到数学和代码之外的说法被夸大,这些领域只是更容易验证[32] - GSPO算法通过分组序列策略优化显著提升样本效率[28][29] - 模型推理研究进展有限,蒸馏小模型比RL更实用[27] 未来挑战与趋势 - 验证难度将越来越大,特别是在科学发现等复杂领域[36][37] - 智能体相关能力可能成为未来关键基准,参数规模扩张不再是主要路径[23] - 行业需要改变模型优势的传达方式,超越单纯基准测试分数[24]
开源模型三城记
虎嗅· 2025-07-30 01:58
中国开源大模型竞争格局 - 北京、上海与杭州形成三城演义格局 在AI开源领域展开激烈竞争[1] - 美国对中国开源技术栈日益忌惮 表现为白宫调整开源策略及OpenAI推迟开源模型发布[1] - 全球开源模型性能榜单头部已被中国模型霸占 包括K2、Qwen3-2507系列、Qwen3-Coder、Wan2.2、Step-3等[1] 杭州开源生态建设 - 阿里巴巴密集推出多款开源模型 包括Qwen3-Coder(4800亿总参数/350亿激活参数)、Qwen3-2507系列、Qwen VLo多模态模型及全球首个开源MoE视频生成模型[3] - 开源模型定价具备显著优势 Qwen3-Coder价格仅为Claude 4的1/3[3] - 采用差异化产品策略 区分非思考版Instruct与推理版Thinking模型以贴近社区需求[5] 技术创新突破 - Wan2.2首次将MOE架构引入视频生成 在推理成本不变前提下提升总参数规模[4] - K2采用重述法训练提升学习效率 效果比同一内容重复训练高出约5个百分点[9] - Step 3采用AFD技术实现注意力模块与前馈神经网络解耦 优化硬件适配效率[10] - GLM-4.5实现高效能输出 生成速度达100tokens/s且总参数量3550亿中仅激活320亿参数[11] 企业竞争动态 - DeepSeek引发行业飞轮效应 推动开源模型价格战与技术迭代[2] - 月之暗面发布K2模型并采用自研MuonClip优化器与QK-Clip技术[9] - 阶跃星辰推出Step 3多模态推理模型 总参数3210亿且具备视觉能力[10] - 智谱开源GLM-4.5系列模型 采用MIT许可证支持商业用途[11] 产业生态发展 - 阿里云通过开源策略扩大生态影响力 Qwen系列累计下载超4亿次衍生模型超14万个[13] - 开源成为人才吸引与文化构建方式 DeepSeek证明华人团队在AGI领域的创新贡献[14] - 上海大幅提升智算规划规模 从2025年30EFLOPS提升至2027年200EFLOPS(增长6倍)[15] - 腾讯加入开源竞争 在WAIC上开源混元3D世界模型并公布系列开源计划[16] 地缘战略意义 - 中国通过WAIC展示开源AI部署决心 提出打造跨国开源社区应对美国AI行动计划[16] - 开源模型成为国际软实力新杠杆 新加坡明确欢迎中国高性价比模型覆盖东南亚多语言市场[16] - 中国建立开源技术栈目标明确 力求在token经济层面与美国闭源模型竞争[19]
阿里通义大模型迎“周年庆”:一周开源4款模型
南方都市报· 2025-07-29 12:23
开源战略进展 - 公司正式发布通义大模型三周年 实现全尺寸和全模态全面开源 打破开源与闭源模型技术壁垒[1] - 近一周内连续发布并开源4款重磅大模型 包括7月28日开源的视频生成模型通义万相Wan2.2[1][3] 模型技术突破 - 通义万相Wan2.2开源三款视频生成模型 支持文生视频 图生视频和统一视频生成 可生成5秒高清视频并支持60多个可控参数[3] - 千问3基础模型获权威机构Artificial Analysis评为全球最智能非思考基础模型[3] - 千问3推理模型比肩顶级闭源模型Gemini2.5 pro和o4-mini 斩获推理模型全球开源冠军[3] - AI编程模型Qwen3-Coder在代码能力和Agent调用能力超越GPT4.1和Claude4 登顶Hugging Face总榜冠军[3] 市场反响与生态建设 - 千问API调用量三天突破1000亿Tokens 热度超越GPT Gemini和Claude等顶级模型 包揽OpenRouter趋势榜前三名[4] - 通义千问全球主要模型社区下载量突破4亿 衍生模型数量超过14万个 超越Meta的Llama系列成为全球第一开源模型家族[5] - 开源推动全球开发者众测反馈 直接获得数据和不良案例 加速模型迭代速度[5] 全栈AI能力展示 - 在世界人工智能大会全面展示从AI基础设施到大模型再到平台及应用的完整AI技术栈[4] - 开源战略使公司明确全球市场竞争中的生态位 获得直接技术反馈[5]
超越OpenAI、Meta,阿里千问API调用量跃居全球第四
经济观察网· 2025-07-29 12:18
全球大模型API市场份额 - 中国DeepSeek和阿里通义千问跻身全球前五 通义千问以10.4%市场份额超越OpenAI的4.7%位列第四 [1] 开源模型发展趋势 - OpenRouter平台API调用量榜单显示开源模型加速取代闭源模型 Top10大模型中9个为开源模型 [3] - Qwen3-Coder以近500亿Tokens调用量居首 通义千问包揽前三且前十占五席 [3] - 通义千问模型单周总调用量突破2000亿Tokens [3] 中国开源模型技术进展 - 阿里巴巴上周开源3款大模型 斩获基础模型/编程模型/推理模型三项全球开源冠军 [3] - 开源模型性能逼平Claude4/GPT4.1/o4-mini/Gemini2.5 pro等顶级闭源模型 [3] - 通义团队发布强化学习新算法GSPO 实现"周级迭代"开发加速度 [3]
一周四连发,阿里AI跑出飓风速度
36氪· 2025-07-29 08:48
阿里巴巴一口气连发四个开源模型,包括Qwen3系列Qwen3-235B-A22B-Instruct基础模型、Qwen3-Coder、Qwen3-235B-A22B推理模型和通义万相 Wan2.2。"开源"、"登顶"等关键词频频出现,"日更级"的节奏更是令世界瞠目结舌。 7月22日,阿里开源Qwen3-235B-A22B-Instruct,性能获得基础模型领域冠军,成为 "全球最智能的非思考基础模型"。 7月23日,阿里开源AI编程模型Qwen3-Coder,代码能力及Agent调用能力超越GPT4.1、Claude4等顶尖闭源模型,登顶全球最大开源社区HuggingFace模型 总榜冠军。 近一周,中国AI的速度与激情正在上演。 7月25日,阿里开源千问3推理模型性能比肩顶级闭源模型Gemini2.5 pro,斩获推理模型的全球开源冠军。 7月28日,阿里开源视频生成模型通义万相Wan2.2,共开源文生视频、图生视频和统一视频生成三款模型。 密集的技术迭代和突破,阿里用实际成果打破了"闭源模型是高性能代名词"的固有认知,重新定义开源模型的天花板。 技能突破:性能与开源的双重飞跃 短短四天时间,阿里三款开源模型 ...
湘财证券晨会纪要-20250728
湘财证券· 2025-07-28 02:58
核心观点 报告对宏观策略、北交所、电子、银行、医药、半导体等领域进行分析,认为 A 股市场总体呈“慢牛”态势,8 月或震荡下行调整;北交所流动性上升;电子、银行、医药行业有投资机会;迈富时公司发展前景良好 [5][7][9][19][23][30][36]。 宏观策略 宏观政策 - 2025.07.21 - 2025.07.25 公布公共财政支出、LPR 等宏观数据,6 月公共财政支出当月同比增速 0.38%,上半年累计增速 3.4%,上半年财政收支差额累计 - 25,705.00 亿元高于 2024 年同期,7 月 LPR 保持不变,1 年期 3.00%,5 年期 3.50%,符合市场预期 [2]。 沪深股市 - 2025.07.21 - 2025.07.25,6 个 A 股指数震荡上行,上证指数涨 1.67%、深证成指涨 2.33%等,周振幅最大的是科创综指 4.36% [3]。 - 近期市场上行动力来自雅鲁藏布江下游水电工程推动基建板块及科技板块发力,二季度宏观数据略超预期,上半年 GDP 累积同比增长 5.3%,大盘短期调整压力上升,但总体保持“慢牛”态势 [5]。 - 31 个申万一级行业上周涨多跌少,建筑材料、煤炭周涨幅居前,银行、通信居后;124 个申万二级行业(扣除林业)小金属、水泥周涨幅居前,农商行Ⅱ、股份制银行Ⅱ周跌幅居前 [5][6]。 - 投资建议:长维度 A 股市场大概率“慢牛”运行;中维度关注科技、绿色、消费、基建领域;短维度 8 月市场大概率震荡下行调整,建议关注长期资金入市红利板块及消费相关板块 [7]。 北交所 市场总览 - 截至 2025 年 7 月 25 日,北交所 268 家股票上市交易,本周新增 0 家;总股本均值 378.77 亿股无变化,总自由流通股本均值 151.44 亿股增 0.18%,总市值均值 8520.87 亿元增 2.36%,总自由流通市值均值 3255.09 亿元增 3.00% [9]。 流动性 - 本周北交所流动性较前一周明显上升,总成交量均值 14.27 亿股,上升 39.13%;总成交额均值 310.82 亿元,上升 42.36%;算术平均换手率均值 7.04%,上升 1.98 个百分点;按总市值加权平均换手率均值 6.49%,上升 1.76 个百分点 [10]。 行情及指数走势 - 268 只股票中 190 只上涨,恒立钻具涨幅最高 184.05%,*ST 云创跌幅最高 10.61%;254 只股票累计上涨,星图测控涨幅最高 1317.79%,14 只累计下跌,连城数控跌幅最高 76.19% [11]。 - 7 月 25 日,北证 50 收盘 1458.98 点,涨 2.85%;北证湘财研究全指数收盘 1835.28 点,涨 3.09% [11]。 分行业 - 上周 268 只股票涉及 24 个申万一级行业,建筑装饰、医药生物涨跌幅靠前,交通运输、石油石化靠后 [12]。 估值表现 - 北证 50 当前估值(PETTM)68.19 倍,科创 50 为 143.58 倍,沪深 300 为 13.59 倍;2022 年 4 月 29 日以来,北证 50 处于 95%估值分位数,科创 50 处于 99%,沪深 300 处于 100% [13]。 行业公司 电子 - 市场表现:上周中证人工智能产业指数报收 1479.24 点,涨 1.72%;国证算力基础设施主题指数报收 5805.86 点,涨 3.23%;万得智能体概念指数报收 1897.37 点,涨 2.62% [14]。 - 估值:上周中证人工智能产业指数 PE(TTM,剔除负值)为 41.06X,环比上升 1.03X,PB(LF)为 5.10X,环比上升 0.13X,PE 处于近 7 年 45.89%分位数,PB 处于 52.66%分位数 [16]。 - 行业动态点评:通义千问更新 Qwen3 模型,通用能力显著提升,在多语言长尾知识覆盖等方面进步,长文本提升到 256K,开源模型能力接近顶尖闭源模型,有望推动 AI 应用加速发展 [17][18]。 - 投资建议:看好 AI 基建、端侧 SOC、AI 应用投资机会,维持电子行业“增持”评级,AI 基建关注寒武纪等,端侧 SOC 关注瑞芯微等 [19]。 银行业 - 信贷流向重点支持领域:实体经济融资成本降低,1 - 6 月新发放企业贷款加权平均利率约 3.3%,个人住房贷款利率约 3.1%;重点领域信贷增长快,5 月末普惠小微贷款等均高于全部贷款增速;消费金融有望温和复苏 [21]。 - 投资建议:银行信贷有望平稳增长,息差或趋稳,资产质量将巩固,建议从“高股息 + 区域增长”配置银行股,维持行业“增持”评级 [23]。 医药行业 - 核心要点:关注细分 ADC CDMO 机遇,CXO 板块补涨动力足,全球 ADC 药物市场爆发式增长,催生全链条产业机遇,ADC 技术壁垒高,CDMO 服务成刚需,传统小分子企业布局 ADC CDMO,XDC 开辟新蓝海 [25][26][27]。 - 投资建议:维持医疗服务“买入”评级,建议关注具有 ADC 相关技术储备的 CDMO 公司药明康德等 [30]。 半导体 - 迈富时公司:AI + SaaS 战略驱动平台化、一体化发展,2024 年 AI + SaaS 业务收入 8.42 亿元,占营收 54%,服务客户超 26,600 户,2025 年推动产品升级;精准营销业务构建一站式服务体系,2024 年收入 7.16 亿元,占营收 46% [32][34]。 - 投资建议:预计 2025 - 2027 年公司归母净利润及增速,首次覆盖给予公司“买入”评级 [36]。
中国开源AI三连发,爆击美国闭源高墙
搜狐财经· 2025-07-26 13:16
阿里巴巴AI模型发布 - 公司在2025年7月22日至26日连续发布三款AI模型,包括Qwen3基础模型、Qwen3-Coder编程模型和Qwen3推理模型 [3] - 三款模型分别斩获基础模型、编程模型、推理模型等主流领域的三项全球开源冠军 [3] - Qwen3基础模型被权威AI研究机构Artificial Analysis评为"全球最智能的非思考基础模型" [6] - Qwen3-Coder编程模型使新手程序员一天能完成资深程序员一周的工作,生成品牌官网最快仅需5分钟 [9] - Qwen3推理模型性能比肩Gemini-2.5 pro、o4-mini等顶尖闭源模型 [3][9] 技术实力与市场表现 - 公司AI模型API调用量在过去几天突破1000亿Tokens,在OpenRouter趋势榜上包揽全球前三 [11] - 阿里云AI相关收入连续七个季度保持三位数增长 [12] - 公司运营着中国最大、亚太第一规模的AI基础设施,具备从硬件到软件的垂直整合能力 [11] - 通义实验室是中国AI人才最密集、AI产出最丰厚的AI Lab [12] 开源战略 - 公司本周发布的三款模型全部开源,目前已有三百多个重要模型对外开源 [13][14] - 开源模型可供中国企业免费商用,美国、法国、德国等发达国家的公司也能接入 [14] - 公司开源战略与"让天下没有难做的生意"的愿景一脉相承 [14] - Qwen3-Coder的开源掀起"AI编程"热潮,获得推特创始人和Perplexity CEO等业内人士点赞 [14] 行业竞争格局 - 中国AI开源模型(阿里通义千问、deepseek)与美国闭源模型(GPT、Claude、Gemini)形成对比 [13] - 公司计划未来三年投入3800亿元人民币建设云和AI硬件基础设施,总额超过去十年总和 [15] - 2008年公司提出"去IOE"战略,用云计算替代传统IT架构 [15] - 公司被视为中国参与全球AI全栈体系竞争的重要选手 [15]
实测爆火的阶跃星辰Step 3,性能SOTA,开源多模态推理之王
机器之心· 2025-07-26 08:19
核心观点 - 阶跃星辰在WAIC 2025发布新一代开源多模态基座模型Step 3,性能超越同类开源模型并接近顶尖闭源模型[1][2] - Step 3以"多开好省"为核心设计理念,解决AI商业化应用的三大瓶颈:推理成本高、场景适配难、多模态能力调用不全[7][8][11] - 模型在国产芯片上实现突破性成本优化,推理效率达竞品3倍,为国产算力生态注入强心剂[32][47][52] - 公司联合10家芯片厂商成立"模芯生态创新联盟",推动底层技术协同创新[51][52][59] - 2025年上半年智能终端业务环比增长超800%,预计全年收入近10亿元[54][55] 技术架构 - 采用原创MFA架构:多矩阵分解注意力设计,KV量仅为Qwen GQA的1/3,计算量仅为DeepSeek MLA的1/4[29][31][32] - MoE混合专家架构:总参数量321B(LLM 316B+视觉编码器5B),激活参数量38B,性能对标DeepSeek[33][34][35] - AFD分布式推理方案:比DeepSeek"大EP"模式更先进,实现Attention与FFN计算资源精准匹配[38] - 原生多模态设计:支持文本/视觉输入,具备深度推理能力,在MMMU等基准超越ERNIE 4.5等竞品[39][41] 性能表现 - 基准测试:在MMMU、MathVision等多项多模态基准超越开源竞品[1][41] - 实测案例: - 准确完成"视觉称重"任务,识别三花猫品种并估算体重[14][15] - 解析"Who's Adam?"网络热梗,总结AI研究者审稿质量焦虑[16][17] - 根据主机贴纸照片完成复杂空间推理[19] - 实时识别桌游"Splendor"并处理对话打断[25][26] - 效率指标:国产芯片推理成本为行业领先开源模型的1/3,Hopper架构芯片吞吐量提升70%[18][47] 商业化进展 - 智能终端:Top10国产手机厂商过半已合作,多模态能力落地量产旗舰机型[54] - 汽车领域:端到端语音大模型在吉利银河M9首发上车,联合发布智能座舱Agent OS[54] - 生态布局:与华为昇腾、沐曦等10家芯片厂商成立创新联盟,推动算力-模型协同优化[51][52] - 收入增长:2025H1智能终端调用量环比增800%,全年收入预计10亿元[54][55] 战略演进 - 产品迭代路径:Step-1对标GPT-3.5→Step-2逼近GPT-4→Step-3聚焦商业化效率[45][46] - 行业定位转变:从"多模态卷王"(20/26款为多模态模型)转向推理时代"最优解"提供者[57][58] - 商业模式创新:通过技术而非补贴实现成本革命,避免API价格战[44][59]