Workflow
Artificial Intelligence
icon
搜索文档
Counterpoint:预计2030年全球生成式AI消费支出将达到6990亿美元
智通财经· 2025-12-25 06:32
根据Counterpoint Research最新发布的《全球AI消费支出预测(2024–2030)》报告,消费者在生成式AI领域的支出正加速重塑全球科技产业格局。预计全球 生成式AI消费支出将从2023年的2250亿美元增长至2030年的6990亿美元,复合年增长率(CAGR)达21%。 研究总监Marc Einstein表示:"未来几年AI硬件支出仍将保持强劲,但真正决定新一代AI生态系统成败的关键,在于软件支出的增长。尽管我们预计未来 五年内AI软件市场将实现大幅扩张,但短期内行业中不可避免地也将会出现赢家与输家之分。" 报告还深入分析了平台层面的竞争格局。尽管OpenAI预计仍将保持用户规模领先地位,但在预测期内,Google和Microsoft的月活跃用户增长速度预计将 最为显著。同时,除AI对话平台之外的AI应用市场——包括AI艺术生成工具、AI陪伴型应用以及照片编辑软件——同样具备强劲的增长动能。 从结构来看,AI硬件仍将占据整体消费支出的最大比重。推动这一增长的核心动力在于AI功能在个人终端设备中的集成。报告预测,2023至2030年间, 全球生成式AI智能手机出货量将以26%的复合年增长率增 ...
第一个赴考的人:拆解智谱AI的上市答卷
36氪· 2025-12-25 06:31
引言:浪起之时,为什么智谱必须上岸 2025年的中国大模型市场,像是一片退潮的海滩。 那些曾经高喊"颠覆一切"的创业者,如今开始盘点手里的现金流;那些热衷"讲故事"的资本方,也学会 了读财报。 浪依然在——但浪的方向,已经变了。 两年前,当ChatGPT点燃全球科技市场时,智谱AI是最早站上浪尖的公司之一。它背靠清华的科研体 系,推出了中国第一批可商用的大模型——GLM系列,一度被誉为"最像OpenAI的中国公司"。 短短两年,它从科研项目变成了被寄予厚望的独角兽,从"算法先锋"到"六小龙"之一,再到如今——中 国大模型第一家冲刺IPO的企业。 但故事的转折,往往发生在浪头最高的时候。 当智谱在资本市场"谋求上岸",整个行业却依然在波动。 OpenAI、Anthropic、Mistral的生态飞轮已经进入商业收割期,而中国的大模型创业公司,还在亏损、 还在补贴、还在等待被证明。 智谱的困境,正是这个时代最真实的写照:它有技术、有融资、有品牌、有故事,却始终被一个问题追 问——"技术公司能否在商业化中活下来?" 上市,表面上是通往安全的彼岸;但对智谱而言,更像是一场不得不做的自救。 在那个算法为王的时代,智谱代 ...
浪潮信息刘军:AI产业不降本难盈利,1元钱/每百万Token的成本还远远不够!
环球网资讯· 2025-12-25 06:30
行业背景与核心挑战 - 全球AI产业已从模型性能竞赛进入智能体规模化落地的关键阶段,“降本”成为决定企业盈利与行业突破的核心命脉[1] - 当前AI推理成本依然高昂,主流大模型如Claude、Grok输出百万token价格在10-15美元,国内模型也多在10元以上,高昂成本使大规模商业化面临严峻ROI挑战[10] - 未来token消耗量将呈指数级增长,复杂任务需求可能激增数十倍,若成本下降速度跟不上消耗增长,企业将面临更高费用投入,经济学中的“杰文斯悖论”正在token经济中重演[1][3] - 来自行业的数据佐证了token消耗的激增趋势:字节跳动豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍,较2024年5月推出时增长达417倍;谷歌各平台每月处理token用量达1300万亿(日均43.3万亿),而一年前月均仅为9.7万亿[4] - 当使用量达到“百万亿token/月”量级时,每百万token成本仅下降1美元,就可能带来每月1亿美元的成本差异,token成本直接决定了智能体的盈利能力[7] 成本高企的结构性瓶颈 - 现阶段token成本80%以上来自算力支出,阻碍成本下降的核心矛盾在于推理负载与训练负载不同,沿用旧架构导致“高配低效”[7] - 瓶颈一:算力利用率严重倒挂,训练阶段MFU可达50%以上,而推理阶段因自回归解码特性,GPU大部分时间在等待数据搬运,实际MFU仅为5%-10%,造成巨大算力闲置[8] - 瓶颈二:“存储墙”瓶颈在推理场景下被放大,随着上下文长度增加,KV Cache呈指数级增长,占用大量显存并导致高功耗,存算分离及对昂贵HBM的依赖成为成本下降障碍[8] - 瓶颈三:网络通信与横向扩展代价高昂,当模型规模突破单机承载能力时,跨节点通信可能占据总推理时间的30%以上,企业被迫堆砌更多资源以维持响应速度,推高总拥有成本[8] 解决方案与架构革新方向 - 降低token成本的核心不是“把一台机器做得更全”,而是围绕目标重构系统,将推理流程拆细,支持P/D分离、A/F分离、KV并行、细粒度专家拆分等策略,让不同计算模块在不同卡上按需配置并发,打满每张卡负载,降低“卡时成本”,提高“卡时产出”[9] - 需要推动计算架构的根本性革新,将AI产业的产品技术创新从规模导向转为效率导向,从根本上重新思考和设计AI计算系统,发展AI专用计算架构,探索开发大模型芯片,推动算法硬件化的专用计算架构创新,实现软硬件深度优化[16] 浪潮信息元脑HC1000产品突破 - 浪潮信息推出元脑HC1000超扩展AI服务器,基于全新设计的全对称DirectCom极速架构,采用无损超扩展设计,可高效聚合海量本土AI芯片,支持极大推理吞吐量,将推理成本首次击穿至1元/每百万token[1][12] - 该产品创新设计DirectCom极速架构,每计算模组配置16颗AIPU,采用直达通信设计,解决传统架构的协议转换和带宽争抢问题,实现超低延迟;计算通信1:1均衡配比,实现全局无阻塞通信;全对称系统拓扑支持灵活的PD分离、AF分离方案,按需配置计算实例,最大化资源利用率[14] - 产品支持超大规模无损扩展,通过算网深度协同、全域无损技术实现推理性能1.75倍提升,并通过计算流程细分和模型结构解耦实现计算负载灵活按需配比,单卡MFU最高可提升5.7倍[16] - 产品通过自适应路由和智能拥塞控制算法,提供数据包级动态负载均衡,实现KV Cache传输和All to All通信流量的智能调度,将KV Cache传输对Prefill、Decode计算实例影响降低5-10倍[16] 未来展望与行业意义 - 当前1元/每百万token的成本突破仅是阶段性胜利,面对未来token消耗的指数级增长,现有成本水平仍难支撑AI的普惠落地[1] - 要让AI真正成为如同“水电煤”般的基础资源并进入规模化普惠阶段,token成本必须在现有基础上实现数量级的跨越[1][7] - 成本能力将从“核心竞争力”进一步升级为“生存入场券”,直接决定AI企业在智能体时代的生死存亡[1] - 此次成本突破有望打通智能体产业化落地“最后一公里”的成本障碍,并将重塑AI产业竞争的底层逻辑[1]
上海:打造人工智能国际开源社区 推动开源平台持续丰富预训练模型、人工智能应用等多样化资源
证券时报网· 2025-12-25 06:24
人民财讯12月25日电,上海市人民政府办公厅印发《上海市加强开源体系建设实施方案》。《方案》提 出,打造人工智能国际开源社区。推动开源平台持续丰富预训练模型、训练数据集、开发工具、人工智 能应用等多样化资源,不断提升开源项目运营服务与商业推广能力,满足模型"开发—训练—测试—托 管—运营"全链条需求。支持开源平台发布海外站,开发多语种模块,积极组织海外活动。强化算力 券、模型券等联动支持,有序提供政策性算力等资源支持。 ...
全球生成式 AI 消费支出将大幅增长, 2030 年逼近 7000 亿美元,但能否满足投资者预期仍存疑
Counterpoint Research· 2025-12-25 06:14
以下文章来源于Counterpoint 咨询 ,作者Counterpoint Counterpoint 咨询 . Counterpoint Research 是一家专注于科技行业的全球性研究公司,在全球主要的市场有着强大的影响 力。我们致力于为合作伙伴提供准确、及时的市场数据,帮助他们做出明智的决策。 全球 AI 消费支出 来源:Counterpoint Research 根据 Counterpoint Research 最新发布的《全球 AI 消费支出预测(2024–2030)》报告 ,消费者在 生成式 AI 领域的支出正加速重塑全球科技产业格局。该报告于 2025 年 11 月 23 日发布,指出无论 是面向消费者的 AI 软件,还是其运行所需的硬件设备,未来几年内都将迎来快速增长。 从结构来看,AI 硬件仍将占据整体消费支出的最大比重。推动这一增长的核心动力在于 AI 功能在 个人终端设备中的集成。报告预测,2023 至 2030 年间,全球生成式 AI 智能手机出货量将以 26% 的复合年增长率增长,相应收入的复合年增长率为 16%。 研究总监 Marc Einstein 表示:"未来几年AI 硬件支 ...
MiniMax、智谱密集发布新模型 同步冲刺港股IPO
证券日报网· 2025-12-25 06:12
值得注意的是,两家企业均已通过港交所聆讯处于上市关键期,预计2026年1月份上市。 MiniMax最新发布Coding&Agent模型MiniMaxM2.1。该模型采用混合专家架构,在Multi-SWE-bench多 语言软件工程能力榜单中取得49.4%的成绩,超越Claude Sonnet 4.5等头部模型。作为10月底M2模型的 迭代版本,M2.1进一步扩展了编程语言支持范围,增强了Web与移动端开发能力,并优化了复合指令约 束遵循能力。 智谱发布GLM 4.7旗舰模型。该版本在多项主流公开基准测试中位列开源模型首位,在百万用户参与的 盲测平台Code Arena编码评估系统中,GLM 4.7排名位于前列。此次升级面向编码场景强化了代码生 成、长程任务规划与工具协同能力,同时在对话、写作及角色扮演等综合性能方面亦有提升。 日前,两家冲刺港股IPO的国内大模型独角兽MiniMax、智谱先后发布其新一代旗舰模型MiniMax M2.1、GLM4.7,进一步提升国产文本大模型能力上限。 ...
消息称OpenAI正探讨广告方案:回复中给赞助内容更多权重
搜狐财经· 2025-12-25 06:00
12 月 24 日消息,今天晚间,据 The Information 援引知情人士消息称,OpenAI 员工正在研究调整 AI 模型的方式,在用户提出与消费相关的问 题时,让赞助信息更容易出现在 ChatGPT 的回答中。譬如,当用户咨询睫毛膏推荐时,可能会看到由丝芙兰赞助的产品信息。与此同时,团队 也在设计多种广告展示原型,探索广告在 ChatGPT 界面中的呈现形态。 奥尔特曼曾在公开场合多次"淡化"打造广告帝国的想法,而与此同时,OpenAI 过去一年却持续吸纳广告行业老将,并逐步引入购物功能,为零 售广告奠定基础。 By Sri Muppidi 由斯里·穆皮迪撰写 and Stephanie Palazzolo 和 斯蒂芬妮·帕拉佐洛 Exclusive 独家 OpenAI's Ads Push Starts Taking Shape OpenAl 的广告攻势初见雏形 What can Art by Clark Miller. 克拉克 ·米勒的艺术作 【来源:IT之家】 ww.ithome.co Dec 24, 2025, 6:00am PST OpenAI 内部认为,ChatGPT 有机会催生一种不 ...
无需再训练微调,一个辅助系统让GPT-5.2准确率飙到创纪录的75%
机器之心· 2025-12-25 05:26
文章核心观点 - 决定AI性能上限的关键因素可能正从底座模型本身,转向外围的“推理编排”系统[1] - 初创公司Poetiq开发的“元系统”在不改变大语言模型的前提下,通过一套智能的Agentic System,显著提升了AI在复杂推理任务上的表现[1][15] - 该系统展示了强大的泛化能力,能够适配不同模型并实现跨版本、跨模型族的性能提升,为AI能力提升提供了新路径[15] Poetiq公司及其技术 - Poetiq是一家由6位研究员和工程师组成的初创公司,核心成员多来自Google DeepMind[12] - 公司开发了一套名为“元系统”的AI推理和自我改进系统,该系统不依赖特定大模型,可与GPT、Gemini、Grok等前沿模型配合使用[15] - 该系统采用迭代式推理过程,包含“迭代式问题求解循环”和“自我审计”两大核心机制,通过多步骤自我改进来构建和完善答案,并能自主判断终止时机以控制成本[16] 性能测试结果 - 在ARC-AGI-2测试集上,GPT-5.2 X-High结合Poetiq系统在PUBLIC-EVAL数据集上的成绩达到75%,比之前的SOTA高出约15%[3] - 每个问题的解决成本低于8美元[3] - 在测试中,X-High版本比High版本成本更低,原因是能更快收敛到正确答案[11] - 系统处理问题的时间范围较广,最简单问题约8-10分钟完成,最难问题需在12小时时限内终止[9] 技术特点与行业意义 - 该系统的核心优势在于“模型交换”能力,无需对系统或模型进行大规模调整或重新训练,即可切换不同模型应对不同任务[7] - 系统所有适配工作在新模型发布前完成,且未直接接触过ARC-AGI任务集,表明其对推理策略具有良好的泛化能力[15] - 行业评论认为,在模型之上构建智能而非在模型内部构建,是“非常高明”的做法,意味着可以在几小时内适配新模型,并捕捉到推理过程本身的基本规律[15] - OpenAI总裁Greg Brockman转推确认,GPT-5.2在ARC-AGI-2上超越了人类基准成绩[8]
The 2025 IPO Comeback Tour
Yahoo Finance· 2025-12-25 05:26
Welcome to Motley Fool Money. I'm your host Emily Flippen. Today, I'm joined by Fool analysts Jason Hall and Sanmeet Dao to discuss the IPO market. We'll be taking a look back at what reopened the IPO window over the course of the past year, run the biggest IPOs of 2025 through a rule Breakers lens, and make a few predictions for the 2026 IPO markets, including discussing if it really never makes sense to buy into an IPO. Now, the IPO market in 2025 was obviously much hotter than 2024. The third quarter of ...
政策利好不断,AI人工智能ETF(512930)交投活跃
新浪财经· 2025-12-25 05:15
截至2025年12月25日 13:01,中证人工智能主题指数(930713)成分股方面涨跌互现,北京君正(300223)领 涨4.61%,中科星图(688568)上涨4.41%,同方股份(600100)上涨4.05%;芯原股份(688521)领跌。AI人工 智能ETF(512930)最新报价2.16元。 消息面上,国家数据局相关负责人发文指出,以高质量数据集建设赋能人工智能发展,推动人工智能与 产业发展、民生保障、社会治理深度融合。牵住数字关键核心技术自主创新这个"牛鼻子",加强数据要 素学科专业建设,布局建设一批重点实验室、技术研发中心等创新平台,重点攻关数据可信流通利用、 高质量数据集建设评测关键技术和设备。强化算力、算法、数据等高效供给,夯实数据基础设施,推进 全国一体化算力网建设和高效集约利用,完善数据标准化生态体系。 AI人工智能ETF紧密跟踪中证人工智能主题指数,中证人工智能主题指数选取50只业务涉及为人工智能 提供基础资源、技术以及应用支持的上市公司证券作为指数样本,以反映人工智能主题上市公司证券的 整体表现。 数据显示,截至2025年11月28日,中证人工智能主题指数(930713)前十大权重 ...