Workflow
Llama系列
icon
搜索文档
马斯克收购OpenAI新计划实锤了:找小扎筹千亿美元,果然敌人的敌人就是朋友…
量子位· 2025-08-23 05:06
马斯克收购OpenAI计划 - 马斯克计划以974亿美元价格收购OpenAI 旨在使其回归开源模式[6][9][11] - 马斯克主动邀请扎克伯格加入收购财团 试图联合对抗OpenAI[4][9][12] - 该计划源于法庭文件披露 但最终被OpenAI拒绝并指责为宣传噱头[8][19] Meta的AI战略调整 - Meta在6个月内进行第4次AI组织架构重组 新成立"Meta超级智能实验室"并拆分为四个团队[23][24] - 团队包括TBD实验室(基础大模型)、产品与应用研究(产品转化)、MSL基础设施(AI基础设施)和FAIR(基础研究)[24][38] - 公司冻结"亿元俱乐部"招聘并禁止跨团队调动 重组后解散了AGI Foundations团队[22][25] 人才竞争动态 - Meta从苹果挖角AI云基础设施负责人Frank Chu 其曾向苹果AI主管John Giannandrea汇报[26][28][29] - 扎克伯格通过上亿美元offer从OpenAI挖走首席研究官Mark Chen 导致OpenAI人才流失[22][34][35] - OpenAI首席人事官Julia Villagra在任职1年半后离职 与人才流失压力相关[33][34][36] 企业竞争格局 - 马斯克与扎克伯格曾因Threads与推特竞争公开矛盾 甚至约战"笼斗"[13][15][17] - Meta的Llama 4项目失败后加速AI战略调整 专注于基础设施和人才建设[21][22][24] - OpenAI与Meta形成直接竞争关系 双方在人才争夺和技术路线上的对抗持续升级[4][19][35]
1700亿美元估值!Anthropic融资50亿,AI独角兽争霸战进入新阶段
搜狐财经· 2025-08-23 04:34
融资动态 - Anthropic正在与Iconiq Capital主导的一轮融资进行谈判,拟融资30亿至50亿美元,估值将达到1700亿美元 [1] - 若交易成功,公司将成为全球估值第三高的未上市AI公司,仅次于OpenAI(约3000亿美元)和SpaceX(约4000亿美元) [1] - 本轮融资由Iconiq Capital牵头,该机构预计出资约10亿美元,以管理科技巨头个人财富而闻名 [1] 估值增长 - 公司估值在四个月内从615亿美元(2024年3月融资时)增长至1700亿美元,增幅近三倍 [1] - 此轮融资速度和规模创AI行业纪录,被硅谷投资人称为“AI历史上最快的估值增长” [1] 财务表现 - 年化收入在2025年上半年增长四倍,已超过40亿美元 [2] - 收入增长轨迹:2023年从零至1亿美元,2024年从1亿至10亿美元,2025年上半年从10亿至超过40亿美元 [15] - 2025年千万级和亿级美元大单数量是2024年的三倍,企业客户平均花费增长五倍 [15] 技术优势 - 核心产品Claude系列采用宪法式AI(Constitutional AI)技术,通过预设原则让AI自我改进,无需人工标注有害输出 [4][5] - Claude上下文窗口达200K tokens(约500页文本),优于GPT-4o的128K tokens,坚持“看完全文再回答”原则 [5] - Claude Sonnet 4编程准确率达72.7%,优于ChatGPT与Gemini,为AI编程工具Cursor提供支持,后者12个月内收入达1亿美元 [7] - 宪法AI框架提供可追溯决策过程,在政府、金融、医疗等监管严格行业具有合规优势 [5][12] 商业化策略 - 专注于企业级市场,客户包括辉瑞、美联航、AIG、Novo Nordisk等行业巨头 [15] - 企业应用案例:Novo Nordisk使用Anthropic技术将监管报告处理时间从15天压缩至10分钟;辉瑞科学家年节约1.6万小时手动工作时间 [15] - 与Amazon Connect合作,助DoorDash在2个月内构建语音操作AI联络中心解决方案 [15] 成本与亏损 - 2025年预计亏损约30亿美元,因训练和运行模型成本高昂 [16] - 毛利率落后于典型云软件公司,推理成本需进一步优化以提升盈利能力 [16] 行业竞争格局 - AI行业形成三足鼎立格局:OpenAI(约3000亿美元)、Anthropic(1700亿美元)、SpaceX(约4000亿美元) [18] - 技术路线分化:OpenAI追求通用人工智能(AGI)和消费级应用;Anthropic专注AI安全与企业级市场;Meta等公司推动开源生态 [19] - 商业模式多样化:API服务(OpenAI、Anthropic)、垂直整合(谷歌、微软)、开源生态(Meta) [19] 估值合理性分析 - 市销率(Revenue Multiple)为60倍,低于OpenAI的80倍与xAI的400倍 [17] - 对比AI应用层公司Figma AI(上市估值680亿美元,市销率54倍,营收增长46%),估值被认为在合理范围内 [17] - 技术优势与安全定位在政府和企业客户中具不可替代性,但高估值依赖收入高速增长,若增长放缓可能面临回调风险 [17] 地缘政治因素 - Anthropic首席执行官正逆转对中东资金态度,认为需利用海湾主权财富基金以保持技术前沿地位 [19] - OpenAI也在寻求中东市场,计划融资400亿美元(其中300亿美元待募),与阿联酋企业G42合作在阿布扎比建设数据中心 [19] - 中东主权基金成为AI全球扩张的重要资金后盾 [20] 技术对比(Claude vs GPT-5) - 上下文窗口:GPT-5以400K tokens领先,适合超长文档处理;Claude在输出长度上更灵活 [9] - 编程能力:GPT-5工具调用准确率96.7%,在复杂编程任务中领先;Claude以保守可靠风格受企业开发欢迎 [10] - 事实准确性:GPT-5错误率比前代降低80%,适用于高准确性专业领域;Claude通过宪法AI框架提供可追溯决策 [12] - 定价策略:GPT-5分层定价(输入1.25美元/百万tokens至输出10美元/百万tokens);Claude输入成本极低(Claude 3.5 Sonnet输入免费),输出成本适中 [13]
DeepSeek开源V3.1:Agent新纪元开启,哪些企业会受益?
36氪· 2025-08-22 09:35
技术升级 - 上下文窗口从64K提升至128K 可处理相当于30万汉字的长文本 为长文档分析、复杂代码生成和深度多轮对话提供支持 [2] - 模型在工具调用、函数执行及复杂推理任务中的表现提升约40% 在数学证明、编程协作与多模态任务规划方面展现出色能力 [2] - 架构升级为双模式:DeepSeek-Chat模式适用于即时响应场景 DeepSeek-Reasoner模式支持完整思维链推导 提高复杂问题解答准确性和透明度 [3] - 新增strict模式工具调用能力 严格保证输出格式符合预定义参数schema 兼容Anthropic API格式 可无缝接入Claude Code开发生态 [4] 国产芯片适配 - 采用UE8M0 FP8参数精度格式 针对下一代国产芯片设计 [6] - FP8格式相比FP16降低50%-75%显存占用 支持更大批次或更长上下文长度 显著提升国产芯片使用效率 [7] - 国产AI芯片厂商寒武纪、华为昇腾、海光、沐曦、中昊芯英等显著受益 寒武纪股价大涨20% 总市值跃居科创板头名 [8] - 推动国产芯片与模型生态协同进步 强化国内AI产业全栈自研能力 减少对国外芯片和技术依赖 [11][12] 开源生态影响 - 采用Apache 2.0许可证 允许免费商用及修改 显著降低企业部署和研发门槛 [13] - 三类公司显著受益:应用层和智能体开发公司(如字节跳动、阿里巴巴、昆仑万维)成本大幅下降 云计算和硬件厂商(如英伟达、AWS、阿里云)算力需求增长 拥有数据和应用场景的传统企业实现数字化转型 [14] - 对国际闭源模型厂商(如OpenAI、Anthropic)构成竞争压力 可能迫使闭源厂商调整API定价或开放更多技术细节 [11] - 对其他开源模型提供商(如Meta、Mistral AI)设立更高技术基准 需持续跟进优化版本以维持生态吸引力 [11][15] - 激发全球开发者参与热情 支持源代码自由查看和个性化定制 汇聚全球智慧提升模型性能 [19]
小扎“亿元俱乐部”车门焊死!被曝冻结招聘,禁止内部人员流动
量子位· 2025-08-22 00:59
公司战略调整 - Meta超级智能实验室冻结招聘并禁止跨团队调动 公司发言人证实此为基本组织规划 旨在为超级智能工作创建坚实结构[1] - 公司首席AI官Alexandr Wang澄清称对超级智能实验室的投资将持续增加 否认冻结招聘的负面报道[1] - 招聘冻结政策要求任何例外需经首席AI官Alexandr Wang批准[6] 人才招聘动态 - 截至8月中旬 Meta从OpenAI招聘20多名研究人员和工程师 其中13名来自谷歌 3名来自苹果 3名来自xAI 2名来自Anthropic 总计50多名新员工[4] - 新招聘高管团队包括Nat Friedman(前GitHub CEO)任超级智能实验室副总裁 Daniel Gross任产品副总裁 Yann Le Cun继续担任首席AI科学家[5] - 新聘研究人员主要来自DeepMind、OpenAI和谷歌等机构 涵盖视觉变换器、扩散模型、多模态对齐等前沿领域[5] 内部管理挑战 - 新老员工因薪酬待遇悬殊产生摩擦 部分研究人员威胁辞职[7] - 高薪新员工与现有员工的文化冲突削弱工作动力和忠诚度[8] - 公司面临整合新旧团队与化解内部矛盾的运营挑战[9] 组织架构重组 - AI部门在六个月内进行第四次重组 新成立"Meta超级智能实验室"拆分为四个独立小组[10][11] - TBD实验室由Alexandr Wang负责 专注高风险创新技术及Llama大语言模型开发[12][15] - 产品与应用研究组由Nat Friedman领导 推动技术产品化落地[12][15] - 基础设施组由Aparna Ramani负责 支持AI研发所需的硬件和平台[12][15] - 基础人工智能研究组由Robert Fergus领导 专注长期基础科学研究[12][15] - 此前为推进Llama模型成立的"AGI Foundations"团队被解散 成员分配至新团队[12] 行业环境与财务表现 - MIT报告显示95%的公司在AI投资上零回报[14] - OpenAI CEO Sam Altman将当前AI热潮比作互联网泡沫[17] - Meta2025年第二季度营收达475.2亿美元 同比增长22% 净利润183.4亿美元 同比增长36%[19][20] - AI驱动的广告推荐系统使Instagram广告转化率提升5% Facebook提升3% 用户停留时间分别增加6%和5%[18] - 2025年资本支出预测为660亿-720亿美元 2026年费用增长率将超过2025年[20] - 摩根士丹利警告薪酬激增可能在没有明确创新收益的情况下稀释股东价值[20] 战略展望 - 招聘冻结未给出明确时间表[21] - 公司在AI竞赛中需调整节奏并评估战略 为下一阶段冲刺做准备[22]
小扎“亿元俱乐部”刚组就被拆!千人AI团队面临裁员,高管也得走
量子位· 2025-08-20 01:13
公司AI部门重组 - Meta在6个月内进行第4次AI部门重组 将AI部门Meta Superintelligence Labs拆分为四个子部门 [2][3] - 新架构包含TBD实验室(负责人Alexandr Wang)、产品与应用研究(负责人Nat Friedman)、基础设施(负责人Aparna Ramani)和基础人工智能研究FAIR(负责人Robert Fergus) [3] - 重组后公司股价连续两日下跌4.29% 一度成为美股科技七巨头中跌幅最大 [3] 组织架构调整细节 - Alexandr Wang担任首席人工智能官并主导重组 直接负责TBD实验室 该部门名称"待定"体现其探索性定位 [7][8][9] - 赵晟佳担任首席AI科学家 老员工需通过其面试以在新架构中定位 [11][12] - 原AGI Foundations Group被解散 其负责人转向Wang汇报 原AI产品组负责人Connor Hayes调任管理Threads [21][23] 人力资源与战略调整 - 重组伴随高管离职和规模缩减 数千人团队面临洗牌 可能裁员或转岗 [24][25][27] - 新老员工存在摩擦 新人获天价薪酬包 老员工面临调整 [28][29] - 公司探索使用第三方AI模型支持产品 包括开源模型和闭源授权 [29] 行业竞争与战略定位 - 频繁重组反映公司在AI军备竞赛中追求速度 通过快速迭代寻找最优解 [4][6] - FAIR实验室多次调整定位 从元宇宙到生成式AI再到AGI 图灵奖得主Yann LeCun从公司首席科学家降级为FAIR部门首席科学家 [30][31]
大模型究竟是个啥?都有哪些技术领域,面向小白的深度好文!
自动驾驶之心· 2025-08-05 23:32
大语言模型(LLM) - 大语言模型是基于海量文本数据训练的深度学习模型,核心能力在于理解并生成自然语言文本,参数量通常达数十亿至数千亿级别,训练数据量可达TB级[3] - 现代LLM核心特征包括大规模参数(如GPT-3有1750亿参数)、Transformer架构、预训练+后训练范式以及多任务适应性[6] - LLM核心能力包括理解和生成两方面,技术基础是Transformer神经网络架构特别是自注意力机制[6] Transformer架构 - Transformer是LLM核心技术基础,由Google于2017年提出,包含Encoder和Decoder两部分,关键创新是自注意力机制[9] - Encoder-only架构仅保留编码器部分,典型代表是BERT模型,适合文本理解任务[10] - Decoder-only架构是现代LLM主流选择,如GPT系列、Llama系列,适合文本生成任务[11] LLM核心能力 - 文本生成与创作:如GPT-4可生成技术文档,Claude 4在工程文档生成方面比GPT-4.1高42%[12] - 代码生成与辅助编程:Claude 4 Opus在SWE-bench测试中得分80.2%,Qwen2.5-Max中文代码采纳率达82%[12] - 知识问答与推理:Gemini 2.5 Pro凭借200万token上下文窗口在实时数据分析中表现优异[12] - 文本理解与转换:Llama 3.1 8B在德语医疗文本结构化任务中准确率达89.3%[13] - 多模态处理:前沿模型如Gemini 2.5 Pro支持文本、图像、视频多模态输入输出[14] 代表性LLM工作 - GPT系列:由OpenAI开发,GPT-3有1750亿参数,GPT-5预计将具备2000万token上下文窗口[15][16][20] - Llama系列:由Meta开发的开源模型,Llama 4首次采用MoE架构,包含三个版本[17][21] - Qwen系列:阿里巴巴开发的中国最具影响力开源大模型,已开源200多款模型[18][22] - DeepSeek系列:以创新架构设计和高效推理著称,DeepSeek-V3采用MoE架构[19][23] 视觉基础模型 - 视觉基础模型是通过大规模数据预训练、具备通用视觉理解或生成能力的深度学习模型[25] - 主流架构包括视觉Transformer(ViT)、CNN与Transformer混合架构如ConvNeXt和MobileViT[26][27] - 核心任务包括图像分类与识别、跨模态理解、目标检测与定位、图像分割等[27][29] 语音大模型 - 语音大模型是经过大规模语音数据预训练的大型神经网络模型,参数规模庞大,训练数据量达百亿甚至万亿级别[31] - 主流架构以Transformer为主,采用序列到序列结构,如Whisper模型[32] - 适用任务包括语音识别、语音翻译、语音到语音翻译、文本到语音合成等[36] 多模态大模型(MLLM) - 多模态大模型能同时处理和理解文本、图像、语音、视频等多种模态信息[39] - 主流架构为"预训练模态编码器+可训练模态连接器+大语言模型+模态解码器"组合模式[40] - 适用任务包括视觉问答、图文生成、跨模态检索、视觉定位与分割等[41] - 代表性工作包括LLaVA、Qwen2.5-VL、GPT-4o等[41][42] 推理大模型 - 推理大模型聚焦于通过优化提示方式、引入外部知识或改进推理流程提升大模型推理能力[43] - 主流架构以"基础模型+增强模块"为核心,不改变原模型主干结构[45] - 核心技术方向包括提示工程、上下文学习、思维链与慢思考、检索增强生成等[46] - 代表性工作包括自动提示优化(OPRO)、思维链(CoT)、DeepSeek-R1等[47][48]
变现时刻:AI助推核心业务增长,微软、Meta投入加码
21世纪经济报道· 2025-07-31 23:08
核心财务表现 - Meta二季度营收475.2亿美元同比增长22% 净利润183.4亿美元同比增长36% 营业利润率43% [1] - 微软二季度营收764.4亿美元同比增长18% 净利润272.3亿美元同比增长24% 智能云业务收入298.8亿美元同比增长26% [1][3] - Azure云服务收入同比增长39%创两年半最高增速 2025财年Azure及其他云服务营收超750亿美元同比增长34% [3] AI业务驱动 - 微软AI相关业务年化收入运行率达130亿美元同比增长175% 为增长最快板块 [4] - GitHub Copilot用户总数突破2000万 过去三个月新增500万用户 在全球90%财富100强企业中应用 [4] - 微软Copilot产品线月活跃用户超1亿 包括企业版和个人版 [4] - Meta广告收入465.6亿美元占总营收98% 同比增长21% AI驱动广告推荐系统提升转化率 [4] - Instagram广告转化率提高约5% Facebook广告转化率提高3% 用户使用时间Facebook增5% Instagram增6% [5] 资本支出与投资 - Meta预计2025年资本支出660-720亿美元 计划投资数千亿美元建设超大规模数据中心 [2][7] - 微软2025年计划投入800亿美元建设AI智算中心 二季度资本支出242亿美元同比增长27% [2][9] - Meta将2026年资本支出预期上调至显著增长水平 全年总支出预计1140-1180亿美元 [8][9] - 微软过去12个月新增超2吉瓦数据中心容量 在全球70个地区运营超400个数据中心 [9] 战略布局与人才竞争 - Meta从竞争对手挖角多位行业重量级人物 包括Scale AI创始人Alexandr Wang和前GitHub CEO Nat Friedman等 [6] - 微软裁员约9000人占全球员工4% 重点调整销售与游戏业务 将资源集中投入AI领域 [6] - 微软已有20%-30%代码由AI生成 通过AI提升员工工作效率 [6] - Meta开源大模型Llama系列在商业化落地和用户体验方面仍落后于OpenAI与谷歌 [7] 未来业绩指引 - Meta预计第三季度营收475-505亿美元 高于华尔街462亿美元预期 [5] - 微软预计2026财年营收实现两位数增长 Azure营收预计同比增长37% [5] - 微软拥有3680亿美元合同积压订单 供需失衡态势可能延续至年底 [9]
腾讯研究院AI速递 20250801
腾讯研究院· 2025-07-31 16:01
GPT-5泄露与功能曝光 - 大量用户在ChatGPT、MacOS应用、Cursor、微软Copilot及OpenAI API平台发现GPT-5痕迹,预计最快下周发布 [1] - GPT-5将整合GPT系列和o系列,实现多模态和推理能力大一统,包括主模型(代号"nectarine"或"o3-alpha")、mini版(代号"lobster")和nano版(代号"starfish") [1] - GPT-5将支持100万tokens上下文窗口、MCP协议与并行工具调用,其中mini版本Lobster特别强化编程能力 [1] DeepSeek R2核心技术突破 - DeepSeek与北京大学联合完成的《Native Sparse Attention》论文获ACL最佳论文奖,实现模型处理长文本速度提升11倍 [2] - 首创"原生稀疏注意力"机制,将模型从"割裂拼接"推向"有机融合",在不牺牲性能的情况下大幅提升效率 [2] - NSA技术已完成27B、MoE架构上的完整预训练验证,通过三种阅读策略(压缩块、选择性精读、滑动窗口)和门控机制 [2] 谷歌AlphaEarth基础模型 - Google DeepMind推出AlphaEarth Foundations,将多源地球观测数据整合为统一数字表征,实现10米级精度地球观测 [3] - 系统整合卫星图像、雷达扫描、3D激光测绘等多种数据,以10×10米网格分析全球陆地及近海,所需存储空间仅为同类AI系统的1/16 [3] - 多项技术创新包括自适应解码架构、空间密集型时序瓶颈和地理文本精准对齐 [3] Moonvalley视频生成技术 - AI视频生成公司Moonvalley宣布旗舰模型Marey正式支持Sketch-to-Video功能,用户可通过手绘草图一键生成电影级视频 [4] - 该功能支持人物动作或摄像机运动路径定义,自动生成连贯视频 [5] - 目前支持1080p@24fps输出,订阅价格14.99美元/月起 [5] Ollama可视化界面升级 - Ollama 0.10.1版本正式上线可视化图形界面,同步支持Mac和Windows [6] - 新版本提供全新对话界面,支持下载模型、与PDF和文档对话、多模态交互和文档编写功能 [6] - 内置新的多模态引擎,支持发送图片给大语言模型 [6] 1688 AI版转型 - 1688推出全新AI版App,上线免费企业查询工具"88查"和全新商家数字人Agent [7] - 1688 AI版聚焦创业与拿货场景,集成AI搜索、选品、创款、图搜、查企等功能 [7] - 商家数字人已有40万商家使用,带动平台GMV和询盘增长18% [7] 逐际动力人形机器人 - 逐际动力推出LimX Oli全尺寸人形机器人,身高165cm、拥有31个主动自由度 [8] - 该机器人软硬件设计贯彻"模块化"与"全开放"理念,提供完整SDK系统 [8] - 推出Lite、EDU及Super三个版本,起售价15.8万元 [8] Meta超级智能愿景 - Meta CEO扎克伯格发布公开信,表示已开始看到AI系统自我改进迹象 [9] - Meta正改变AI模型发布策略,暗示Llama系列不再全部开源 [9] - Meta在第二季度财报中宣布将于2025年斥资高达720亿美元用于AI基础设施建设 [9] a16z AI投资新标准 - a16z合伙人Martin Casado认为AI投资不再看模型性能,而是平台是否能持续交付业务结果 [10] - 平台竞争分化的三要素为组织模式、资源配置与产品策略 [10] - AI估值逻辑回归具体场景,基于悲观、中性、乐观三种场景进行拆解模拟 [10]
特朗普造访美联储:手里一本账,心里一本账;清华校友赵晟佳出任Meta超级智能首席科学家;泰柬边境冲突已致双方共32人死亡 | 一周国际财经
搜狐财经· 2025-07-26 05:22
美联储与特朗普会面事件 - 特朗普成为近20年来首位造访美联储的美国总统,打破白宫与美联储保持距离的惯例 [5][6] - 特朗普与鲍威尔就25亿美元装修预算超支事件交锋,美联储解释成本上涨因关税和材料价格上涨 [7][9] - 特朗普重申降息诉求但否认有意罢免鲍威尔,估算降息3个百分点可为美国节省1万亿美元 [9] - 市场反应显示美联储7月维持利率不变概率高达97.4%,9月降息概率仅62.1% [10] - 法律层面罢免鲍威尔面临重大障碍,美联储历史上从未有主席在任期内被罢免 [12] Meta人事变动 - Meta任命清华校友赵晟佳为超级智能实验室首席科学家,直接向扎克伯格汇报 [20] - 赵晟佳曾深度参与OpenAI GPT系列开发,Meta计划在AI领域投入数千亿美元 [21] - 扎克伯格强调赵晟佳已取得多项突破性成果,将推进下一代基础模型研发 [21] 泰柬边境冲突 - 泰柬边境冲突已致双方共32人死亡,包括19名泰国人和13名柬埔寨人 [22][24] - 双方互相指责对方率先开火,马来西亚调解努力因泰国改变立场而失败 [24][25] - 冲突导致柬埔寨西北部奥多棉吉省至少8名平民死亡,50人受伤 [24] 美欧贸易关系 - 美欧首脑计划7月27日会晤讨论贸易合作及争议问题 [25][27] - 特朗普威胁对欧盟商品征收新关税,欧盟准备对931亿欧元美国产品加征反制关税 [27] - 若8月7日前无法达成协议,欧盟反制关税将正式生效 [27] SpaceX星链中断 - SpaceX星链系统发生故障导致全球约6.1万用户断网2.5小时 [29] - 故障由"运行核心网络的关键内部软件服务"问题导致,马斯克公开致歉 [29] - 业内猜测原因包括软件缺陷、更新失误或黑客攻击 [29] 金融市场表现 - 美股三大指数齐涨,标普500和纳指创新高,道指涨1.26% [30][35] - 现货白银价格突破39美元/盎司创14年新高,年内涨幅32%超过黄金 [32] - 美元指数本周下跌约0.8%,报97.67 [32][35] 全球公司动态 - 谷歌A本周上涨4.39%,亚马逊涨2.35%,特斯拉跌4.12% [31][37] - 礼来股价达812.95美元,博通报290.18美元 [37] - 软银创始人孙正义财富增加35亿美元,农夫山泉董事长钟睒睒财富增加42亿美元 [39][40]
2025上半年大模型使用量观察:Gemini系列占一半市场份额,DeepSeek V3用户留存极高
Founder Park· 2025-07-09 06:11
大模型API市场总览 - 2025年第一季度OpenRouter总Token使用量环比增长4倍,之后稳定在每周2T Token水平[7] - 谷歌以43.1%市场份额居首,DeepSeek和Anthropic分别占19.6%和18.4%[8] - 其他模型合计份额不足10%,Llama系列已萎缩至峰值1/5[11] 头部模型表现 - Gemini-2.0-Flash凭借0.4美元/百万Token低价稳居前三,Gemini-2.5-Flash有望接替其位置[7] - DeepSeek-V3发布后持续Top 10,用户留存率极高,合并免费/付费版使用量可达第二[3][7] - Claude-Sonnet-4接替旧版但增长停滞,OpenAI无稳定Top 10模型[7][8] 细分领域格局 编程领域 - Claude-Sonnet-4占据44.5%绝对优势,Gemini-2.5-Pro以17.6%居次[14] - 前20名中GPT-4o-mini增速达139%,Qwen2.5 Coder增速107%[15] 文本翻译 - Gemini-2.0-Flash以45.7%领跑,前10名中7款为谷歌模型[17] - 第二名"Others"类别占比20.1%,显示长尾需求显著[17] 角色扮演 - 市场高度碎片化,26.6%份额由小众模型占据[21] - DeepSeek-V3以25.2%居首,Gemini-2.0-Flash占18.5%[21] 营销领域 - GPT-4o以32.5%绝对领先,Llama-3.3-70B增速达1,454%[23][24] 技术接口趋势 - 代码编写工具主导接口使用,Cline和RooCode位列前二[25] - liteLLM路由库排名第三,反映开发者生态活跃[25] 厂商战略差异 - 谷歌通过多价位产品矩阵覆盖全场景,Gemini系列价格优势明显[26] - Anthropic专注编程领域实现版本平稳过渡[26] - OpenAI因准入限制和定价问题市场表现弱势[26] - DeepSeek-V3因响应速度优势超越R1版本[26]