Workflow
DeepSeek模型
icon
搜索文档
美媒:中国降低全球迈入AI时代的门槛
环球网资讯· 2025-12-19 23:06
除了财务,中国的开源革命还回应了全球对数字主权的关键诉求。对多数全球南方国家而言,依赖单一 封闭式模型将带来不可接受的地缘政治风险。中国的开源模型开辟了一条不同道路:即"公共产品"之 路。由于模型权重可公开下载,无论是巴西大学还是南非金融机构,都能在本土服务器上运行这些模 型。有关技术一旦被下载,便成为他们自己的资产。这种模式培育了"黑箱式"专有系统无法提供的信任 感与持久性。此外,开源代码的透明性使本地安全研究人员能自主检测系统,确保其符合本土安全标 准。 这种协作模式的实际成效已在全球各地的本土应用中显现。2025年10月,乌干达基于通义千问架构推出 自主大语言模型"向日葵",旨在为4600万人口弥合数字鸿沟,使农民能以当地的卢干达语获取农业指 导。由于其底层的中国技术支持100多种语言——包括常被英语主导的西方数据边缘化的语言,实现了 前所未有的语言包容性。同样,马来西亚推出的本土大语言模型NurAI,其系统是通过优化中国的基础 模型而实现的。这标志着"主权人工智能"新时代的到来——各国利用高质量的全球基础模型,构建体现 自身独特价值的系统。 这场转变具有结构性意义。全球顶尖风投机构发现,其投资组合中高 ...
12月19日热门路演速递 | 人工智能、AI算力、周期与韧性的2026新蓝图
Wind万得· 2025-12-18 22:45
01 《财经》年会 2026 :预测与战略暨 2025 全球财富管理论坛 —— 变局中的中国定力 ( 3 ) 9:00-12:00 核心看点: 深入探讨人工智能从技术突破到社会再造的全局影 响,解析具身智能如何驱动产业变革,并在"十五 五"绿色转型关键期,寻求人工智能与低碳目标协同 推进的路径。 孟祥峰丨宁德时代党委书记、副总裁 李婷丨落基山研究所常务董事兼北京代表处首席代 表 刘敦楠丨华北电力大学教授、博士生导师,中国能 源研究会能源互联网专委会秘书长 扫码预约 02 【行业洞察】国盛计算机刘高畅:再谈模型、算力、应用与空天 10:00-11:00 嘉宾: Terrence Sejnowski(特伦斯・谢诺夫斯基)丨美国 四大国家学院(国家科学院、国家医学院、国家工 程院、国家艺术与科学学院)院士 薛澜丨国家新一代人工智能治理专业委员会主任, 清华大学苏世民书院院长、人工智能国际治理研究 院院长 张正友丨腾讯首席科学家、Robotics X 实验室主 任、福田实验室主任 周剑丨优必选创始人、董事会主席兼首席执行官 马克丨《财经》杂志执行主编 张望才丨北京市发改委节能中心主任 扫码预约 核心看点: 2026 ...
在这个开源「从夯到拉」榜单,我终于明白中国 AI 为什么能逆袭
新浪财经· 2025-12-17 14:25
文章核心观点 中国开源大模型在2024年至2025年间实现了全球范围内的领导地位,以DeepSeek、Qwen、Kimi、智谱和MiniMax为代表的国产模型,在性能、价格、生态和可用性等维度上快速逼近甚至超越闭源巨头,正在改变全球AI行业的格局和运行规则 [3][5][116] 全球开源模型排名与格局演变 - 根据AI研究员Nathan Lambert等人的排名,全球开源模型前五名均为中国公司:DeepSeek、Qwen、Kimi、智谱和MiniMax,而OpenAI仅位列第四梯队,Meta的Llama仅获荣誉提名 [3][114] - 2024年曾是Llama主导的天下,但到2025年,国产开源模型已成为全球开发者的默认选择,持续刷新行业选项 [5][116] - 在Hugging Face的热门模型趋势榜上,前四名均为国产开源模型 [86][89] 主要中国开源模型厂商及其技术亮点 - **DeepSeek**:通过混合注意力等机制显著降低成本,打开了高效推理的突破口 [29][98] - **Qwen(阿里巴巴)**:凭借庞大的生态规模,覆盖从4800亿参数到6亿参数的各种尺寸模型,以及视觉语言、代码编写等多领域,几乎渗透整个开源市场 [23][131] - **Kimi(Moonshot AI)**:2025年11月发布万亿参数的混合专家模型Kimi K2 Thinking,采用交错思考技术,一次性能执行300次工具调用,在多个榜单上超越GPT-5和Claude 4.5 [11][122][135] - **MiniMax**:2025年10月底发布MiniMax M2混合专家模型,在综合榜单排名第五,超越Gemini 2.5 Pro和Claude Opus 4.1,其API定价为每百万输入/输出token 0.3美元/1.2美元 [14][124][127][185] - **智谱(Zhipu AI)**:发布GLM系列模型,如GLM-4.5和GLM-4.6,丰富了国产开源生态 [9][10][120] 国产开源模型的竞争优势与市场反馈 - **性能与成本**:国产模型在保持高性能的同时,具备极具竞争力的价格,例如MiniMax M2的价格仅为Anthropic Sonnet模型的1/12 [127][185] - **开发者认可**:海外社交媒体上广泛认可国产模型“好用、便宜”,成为小公司和副业项目的开发首选 [14][124] - **企业应用**:爱彼迎CEO公开表示,中国的开源模型Qwen比OpenAI更适合其实际工作,且更便宜 [25][134] - **具体能力展示**:实测显示,MiniMax M2能一次性生成功能齐全的棋类应用或网站,在处理包含20714个岗位、大小10MB的Excel数据时也表现出色 [16][18][30][35][138][141] 技术路径选择:全注意力与高效注意力之争 - MiniMax M2选择了传统的“全注意力机制”,而非当前流行的稀疏或高效注意力机制,主要原因是全注意力在工业级系统中的性能和可靠性仍然更高 [38][75][144][181] - 高效注意力机制(如线性、稀疏注意力)的核心目标是节省有限的计算资源,但其在复杂推理任务中可能存在隐藏缺陷,且相关基础设施尚不成熟 [41][44][57][147][150][163] - 随着上下文长度需求增长和GPU算力增速放缓,高效注意力的优势未来可能显现,但当前阶段,在质量、速度、价格三角中寻求平衡是关键 [62][75][168][181] 国产开源崛起的驱动因素与行业影响 - **内部竞争与算力限制**:国内模型厂商众多、竞争激烈,且面临算力紧张、芯片受限的困境,开源成为共享算力、避免重复建设、吸引开发者的有效策略 [93] - **构建完整生态**:各厂商通过不同的技术路线(如DeepSeek的成本控制、Qwen的生态规模、MiniMax的智能体能力)共同构建了一个庞大而完整的开源系统,形成了合力 [29][84][97][98] - **改变全球格局**:国产开源模型已成为全球AI生态的底座,全球小团队使用Qwen微调、用DeepSeek做推理基座、用MiniMax做智能体验证已成为常态,导致全球开源生态中心向中国倾斜 [98][109] - **数据佐证**:a16z数据显示,国产开源模型的累计下载量已超过美国模型,且领先优势持续扩大;斯坦福大学2025年AI指数报告也预示国产开源性能将超过闭源和美国模型 [95][97]
广发证券:本轮港股春季躁动会缺席吗?
智通财经网· 2025-12-14 23:29
核心观点 - 广发证券认为,尽管存在对美联储新任主席偏鹰派言论的担忧,但市场预期其最终将偏鸽,因此今年港股“春季躁动”行情不会缺席,并可能因流动性宽松或增量资金超预期而成为较强年份 [1][18] - 报告指出,港股春季躁动(圣诞节前至春节前)具有高胜率的历史规律,是增强收益的一种方式,并分析了行情较强的条件及当前流动性担忧不足为虑的原因 [9][16][18] - 明年年初可关注DeepSeek的模型进展及国内互联网大厂C端应用进展,可能对恒生科技指数基本面产生正向催化 [1][18] 港股春季躁动历史规律与特征 - 港股春季躁动时间窗口为圣诞节前至春节前,与A股(春节后至两会期间)有明显差异 [2] - 过去十五年,港股春季躁动期间,恒生科技指数上涨概率为72.7%,涨幅中位数为6.3%,涨幅均值为4.7%;恒生指数上涨概率为80.0%,涨幅中位数为4.7%,涨幅均值为3.8% [2] - 过去97年标普500圣诞行情上涨概率为81%,过去59年恒生指数圣诞行情上涨概率为77%,长期季节性规律可能形成“自我实现预言”的动量效应 [5] - 从历史任意时点构建专注投资恒指春季躁动的策略,持有至今均能盈利,显示其高胜率特性 [9] - 历史仅2014年因海外流动性冲击导致春季躁动缺失;2016年(熔断&减持禁令到期)和2024年(雪球集中敲入&DMA爆仓)因风险事件冲击导致躁动行情后移至春节后 [12] 春季躁动行情强弱驱动因素 - 行情较强的年份通常具备两个条件之一:一是流动性宽松或增量资金超预期(如2021年、2023年);二是短期宏观经济数据超预期或上市公司盈利向上(如2017年、2019年) [16] - 报告列举了强春季躁动年份主要指数涨跌幅:2017、2019、2021、2023年恒生科技指数涨幅分别为10.7%、8.9%、27.6%、13.5%;恒生指数涨幅分别为7.1%、8.7%、14.7%、15.1% [17] 对当前流动性担忧的研判 - 日本套息交易平仓冲击无需过分担忧,因市场对日本加息和美联储降息预期充分,套息交易存量头寸已明显收缩,流动性冲击大概率偏弱 [18] - 港股解禁高峰已过,压力较小:12月限售股解禁规模为1260亿港元,1月已回落至约500亿港元以下 [18] - 新任美联储主席降息路径表述偏鹰无需担心,此前热门人选哈赛特发表鹰派言论后,当选概率从78%暴跌至54%,表明市场预期下一任主席将偏鸽,且出现极度鹰派表述的可能性小 [1][18]
这是2025年度AI十大趋势,4个维度10大结论,“开源AI进入中国时间”
搜狐财经· 2025-12-10 15:20
文章核心观点 - 报告指出,2025年AI正从“工具时代”迈向“伙伴时代”,其发展将深刻重塑经济结构、社会形态和人类生活方式 [3] - 中国AI正从“参与者”转向“领导者”,在开源生态、芯片自主、AGI路径等基础层面加速布局,展现出从“跟跑”到“并跑”乃至“领跑”的体系化能力 [28][31] 算力与芯片 - 算力已成为影响国家和企业战略的关键资源,算力经济是智能产业第一大引擎,全球AI算力需求推动超大规模数据中心建设进入算力工厂时代 [5][6] - “东数西算”、“太空超级计算机”等国家工程正系统构建高效、绿色的全国一体化算力网络 [6] - 芯片层面,GPU主导地位受到挑战,NPU在端侧普及,ASIC/FPGA迎来增长 [8] - 中国正加速构建自主可控的算力生态,国产“芯片+SDK+框架”方案已在千亿级模型训练中得到验证,DeepSeek等模型针对昇腾芯片深度优化,标志着全栈国产化能力迈入新阶段 [11] 大模型技术与架构 - 预训练决定大模型格局梯队,架构创新决定预训练水平 [5] - 混合专家模型成为主流选择,其“大参数、小激活”的设计让模型可在不显著增加成本的情况下扩充容量,中国头部模型团队正普遍采用这一思路 [13] - 为突破Transformer的O(n²)复杂度瓶颈,线性注意力和稀疏注意力等新架构快速发展,让模型能够更高效地处理长文本、视频理解等需要长程依赖的任务 [13] - 2025年,大模型落地进入“推理时间”,模型在多模态深度推理、自适应推理、边缘推理加速等方面持续突破,任务复杂度推动推理框架持续进化 [15] 应用与交互范式 - 信息AI处于应用期,物理AI处于研发期,具身智能成合流风口 [5][17] - 世界模型与VLA(视觉-语言-动作)框架成为技术焦点,具身智能正从小规模商业订单走向更广泛的应用探索 [17] - 自变量机器人自主研发的“Great Wall”模型系列已实现从感知到高精度操作的端到端控制,在复杂任务中展现出了强大的泛化能力 [20] - AI正在重塑流量入口,从PC互联网、移动互联网迈向Agentic互联网,AI智能体具备感知、规划、决策、执行的闭环能力,正逐步取代传统App,操作系统亦向超级Agent演进 [5][20] - 构建智能助手的关键在于对用户个性化知识的理解与调用,例如腾讯的ima知识库允许用户构建专属知识库并与大模型深度结合,实现“知识即能力”的模式 [22] 多模态与硬件 - 多模态成为AI应用落地关键,视频、3D、代码依次展现生产力,新一代AI系统能够同时处理和理解文本、图像、声音、视频等多种信息类型,实现跨模态的关联理解和生成 [5][22] - 报告预测,未来2-3年内,随着技术能力成熟,AI会成为相关产业的标准工具 [22] - AI硬件百端齐放,轻量化模型和边缘计算技术成熟,推动AI能力向手机、汽车、IoT设备等终端普及,端侧AI解决了数据隐私、网络延迟和成本效率三大核心问题 [5][22] 科研与开源生态 - AI正从科研工具升级为科研主体,开启自主科学发现新范式,在材料、化学、生物、医疗等领域,AI的复杂问题解决能力已触及博士水平 [5][25] - 腾讯与广州呼吸健康研究院联合开发的DeepGEM病理大模型,仅通过常规病理切片图像即可在1分钟内高精度预测肺癌基因突变,将检测成本降低数倍 [27] - 开源AI进入中国时间,DeepSeek、Qwen等开源模型在全球社区影响力迅速提升,下载量位居前列 [5][28] - 在AGI领域,中国正通过开源生态、自主芯片、国家算力网络与产学研协同,走出一条独特的“中国路线” [30]
梁文锋,Nature全球年度十大科学人物!
具身智能之心· 2025-12-10 00:03
文章核心观点 - 权威科学期刊《自然》公布2025年度十大科学人物榜单,两位中国科学家梁文锋和杜梦然入选,分别代表了人工智能和深海科学领域的重大突破与影响力 [1][6][7] 梁文锋与DeepSeek入选详情 - 梁文锋因DeepSeek模型对AI领域的重要贡献与变革性影响入选,被《自然》形容为“科技颠覆者” [3][4] - 其金融从业者背景被提及:在投资界声名鹊起后,创立了DeepSeek [4] - 梁文锋为人低调,拒绝了《自然》的采访请求,其模型开放程度与个人神秘程度形成对比 [5] DeepSeek的技术与行业影响 - 年初DeepSeek的横空出世给整个AI行业带来了冲击 [8] - 凭借出色的“性价比”策略,将模型成本降至行业难以置信的水平,并提升了国产大模型在全球社区的技术声量 [9] - 证明了不一定要堆数据、堆参数、堆服务器,也能做出具备一线水准能力的大模型 [10] - 近期发布并开源了V3.2系列模型,在Agent评测中达到了当前开源模型的最高水平 [11][12] 梁文锋的个人背景与职业轨迹 - 1985年出生于广东湛江,17岁以“高考状元”成绩考入浙江大学电子信息工程专业,后攻读同专业研究生,师从项志宇教授研究机器视觉 [14][16] - 2008年毕业后投身量化投资创业,2010年乘沪深300股指期货推出的东风,团队自营资金很快超过5亿元 [17] - 2015年与校友共同创立幻方量化,一年后推出首个AI模型,使用GPU生成并执行交易仓位 [18] - 2021年,幻方量化成为国内首家突破千亿规模的量化私募,被称为“四大天王”之一 [19] - 2023年5月,瞄准通用人工智能,成立独立组织“深度求索”,DeepSeek项目正式启动 [21] 杜梦然入选详情 - 中国科学院深海科学与工程研究所研究员杜梦然入选,被《自然》形容为“深潜者” [22][23] - 入选理由:在2024年,于日本东北部的千岛—堪察加海沟底部,使用“奋斗者号”载人潜水器发现了地球上已知最深的基于化学合成的生命群落,挑战了现有关于深海极端生命和碳循环的模型 [25] 杜梦然的个人背景与研究 - 1987年出生于安徽亳州,现任中国科学院深海科学与工程研究所研究员、中国科学院大学专任教师、深海科学研究部副主任 [28] - 本科毕业于中国海洋大学海洋化学专业,后获国家资助赴美国Texas A&M University攻读博士学位 [29][31] - 主要研究方向为深海深潜科学与探测技术,包括深海流体释放研究和深海原位实验与探测技术 [33] - 曾跟随“蛟龙”号、“深海勇士”、“奋斗者”号载人潜水器下潜20余次,研究成果发表于《Science》等顶级期刊 [33] 其他入选者概览 - Susan Monarez:前美国CDC主任,因坚守科学底线被解职,引发对科学独立性的反思 [35] - Achal Agrawal:印度自由数据科学家,通过揭露学术不端推动印度国家院校排名体系改革 [36] - Tony Tyson:薇拉·鲁宾天文台的构想与推动者,该望远镜将用于透视暗物质与宇宙演化 [37] - Precious Matsoso:成功引导WHO近200个成员国就首份《全球大流行病条约》草案达成一致 [38] - Sarah Tabrizi:亨廷顿病研究领军人物,其团队在基因疗法临床试验中取得延缓疾病进程的关键证据 [39] - Luciano Moreira:在巴西建造全球最大“蚊子工厂”,通过生物防控有效降低登革热发病率 [40] - Yifat Merbl:从蛋白酶体中发现由数千种潜在抗菌肽构成的新免疫防御系统 [41] - KJ Muldoon:身患超罕见病,在六个月大时接受首例高度个性化的CRISPR基因编辑疗法 [42]
梁文锋,Nature全球年度十大科学人物
36氪· 2025-12-09 06:59
梁文锋及DeepSeek入选《自然》年度人物 - 梁文锋入选《自然》杂志2025年度十大科学人物榜单,因其创立的DeepSeek模型对AI领域的重要贡献与变革性影响[1][2] - 《自然》给予梁文锋“科技颠覆者”的评价,并提及他此前在金融投资界的背景[3] - 另一位中国入选者是中国科学院深海科学与工程研究所研究员杜梦然,因其团队发现了地球上已知最深的基于化学合成的生命群落[3][6][8] DeepSeek模型的技术与市场影响 - DeepSeek模型凭借出色的“性价比”策略,将模型成本降至行业难以置信的水平,并提升了国产大模型在全球社区的技术声量[4] - DeepSeek的出现证明了大模型不一定要堆数据、堆参数、堆服务器,也能做出一线水准的能力[4] - DeepSeek近期发布并开源了其V3.2系列模型,在Agent评测中达到了当前开源模型的最高水平[4] 梁文锋的个人背景与职业历程 - 梁文锋1985年出生于广东湛江,17岁以“高考状元”成绩考入浙江大学电子信息工程专业,后攻读同专业研究生,师从项志宇教授研究机器视觉[5] - 2008年从浙大毕业后投身量化投资创业,其团队在2010年后乘上量化投资东风,自营资金很快超过5亿元人民币[6] - 2015年,梁文锋与校友共同创立幻方量化,一年后推出首个AI模型用于交易[6] - 2021年,幻方量化成为国内首家突破千亿规模的量化私募机构[6] - 2023年5月,瞄准通用人工智能,幻方量化成立独立新组织“深度求索”,即DeepSeek[6] 杜梦然的研究成果与个人背景 - 研究员杜梦然及其团队于2024年在日本千岛—堪察加海沟底部,使用“奋斗者号”载人潜水器发现了地球上已知最深的基于化学合成的生命群落,挑战了现有关于深海极端生命和碳循环的模型[6][8] - 杜梦然1987年出生于安徽亳州,现任中国科学院深海科学与工程研究所研究员、中国科学院大学专任教师、深海科学研究部副主任[10] - 她在中国海洋大学取得海洋化学学士学位,后赴美国Texas A&M University攻读博士学位,回国后加入中国科学院深海科学与工程研究所[10] - 其主要研究方向为深海深潜科学与探测技术,曾跟随“蛟龙”号、“深海勇士”、“奋斗者”号载人潜水器下潜20余次,研究成果发表在《科学》等顶级期刊[11] 《自然》年度榜单其他入选者概览 - Susan Monarez:因坚守科学底线被解职的美国疾控中心前主任,其离职引发对科学独立性的反思[13] - Achal Agrawal:印度自由数据科学家,通过揭露学术不端推动印度国家院校排名体系将论文撤稿纳入考核[14] - Tony Tyson:薇拉·鲁宾天文台的构想与推动者,该望远镜将以前所未有规模透视暗物质与宇宙演化[15] - Precious Matsoso:成功引导世卫组织近200个成员国就首份《全球大流行病条约》草案达成一致的谈判者[16] - Sarah Tabrizi:亨廷顿病研究领军人物,其团队在基因疗法临床试验中取得了延缓疾病进程的关键证据[17] - Luciano Moreira:在巴西建造全球最大“蚊子工厂”,通过释放携带沃尔巴克氏体的蚊子有效降低登革热发病率[18] - Yifat Merbl:从蛋白酶体中发现一个由数千种潜在抗菌肽构成的全新免疫防御系统[19] - KJ Muldoon:一名身患超罕见病的婴儿,在六个月大时接受了首例高度个性化的CRISPR基因编辑疗法[20]
梁文锋,Nature全球年度十大科学人物!
量子位· 2025-12-09 01:21
梁文锋与DeepSeek入选《自然》年度人物 - 权威科学期刊《自然》公布2025年度十大科学人物榜单,DeepSeek创始人梁文锋因模型对AI领域的重要贡献与变革性影响成功当选[1][3] - 《自然》给予梁文锋的形容词为“Tech disruptor”(科技颠覆者),并提及他金融从业者的身份[4] - 梁文锋为人低调,拒绝了《自然》的采访请求,其模型开放程度与其个人神秘程度形成对比[5] DeepSeek的技术与行业影响 - DeepSeek模型凭借出色的“性价比”策略,将模型成本降至行业难以置信的水平,并提升了国产大模型在全球社区的技术声量[8][9] - DeepSeek的出现证明,大模型不一定要堆数据、堆参数、堆服务器,也能达到一线水准的能力[10] - DeepSeek近期发布并开源了V3.2系列模型,在Agent评测中达到了当前开源模型的最高水平[11][12] 梁文锋的个人背景与职业历程 - 梁文锋1985年出生于广东湛江,17岁以“高考状元”成绩考入浙江大学电子信息工程专业,后攻读同专业研究生,师从项志宇教授研究机器视觉[14][16] - 2008年毕业后投身量化投资创业,其团队在2010年沪深300股指期货推出后乘势发展,自营资金很快超过5亿元[17] - 2015年,梁文锋与校友共同创立幻方量化,一年后推出首个AI模型,使用GPU进行深度学习生成交易仓位[18] - 2021年,幻方量化成为国内首家突破千亿规模的量化私募,被称为国内量化私募“四大天王”之一[19] - 2023年5月,瞄准通用人工智能,幻方量化成立独立新组织“深度求索”,即DeepSeek[21] 另一位中国入选者杜梦然 - 中国科学院深海科学与工程研究所研究员杜梦然同样入选《自然》2025年度十大科学人物,其形容词为“Deep diver”(深潜者)[6][22][23] - 2024年,杜梦然团队在日本东北部的千岛—堪察加海沟底部,使用载人潜水器“奋斗者号”发现了地球上已知最深的基于化学合成的生命群落,挑战了现有深海极端生命和碳循环模型[25] - 杜梦然1987年出生于安徽亳州,拥有中国海洋大学学士学位、硕士学位,后赴美国Texas A & M University攻读博士学位[28][29][31] - 她曾跟随载人潜水器“蛟龙”号、“深海勇士”号、“奋斗者”号下潜20余次,研究成果发表在《Science》等顶级期刊[33] 《自然》年度其他入选者概览 - Susan Monarez:美国疾病控制与预防中心前主任,因坚守科学底线被解职,引发对科学独立性与公共卫生政策的反思[35] - Achal Agrawal:印度自由数据科学家,通过揭露学术不端推动印度国家院校排名体系将论文撤稿纳入考核指标[36] - Tony Tyson:薇拉·鲁宾天文台的构想者与推动者,该望远镜将以前所未有的规模透视暗物质与宇宙演化[37] - Precious Matsoso:成功引导世界卫生组织近200个成员国就首份《全球大流行病条约》草案达成一致[38] - Sarah Tabrizi:亨廷顿病研究领军人物,其团队在基因疗法临床试验中取得了延缓疾病进程的关键证据[39] - Luciano Moreira:在巴西建造全球最大“蚊子工厂”,通过释放携带沃尔巴克氏体的蚊子有效降低登革热发病率[40] - Yifat Merbl:从蛋白酶体中发现一个由数千种潜在抗菌肽构成的全新免疫防御系统,颠覆了免疫机制认知[41] - KJ Muldoon:身患超罕见病,在六个月大时接受了首例高度个性化的CRISPR基因编辑疗法,标志着基因医学迈向“一人一药”的精准时代[42]
a16z 100万亿Token研究揭示的真相:中国力量重塑全球AI版图
36氪· 2025-12-08 08:33
报告核心观点 - 基于超过100万亿个真实生产环境Token数据的实证研究,揭示了AI领域正经历三大根本性转变:从单一模型竞争走向多元化生态系统;从简单文本生成迈向智能体推理范式;从西方中心向全球分布式创新格局演进 [3] 行业范式转变:从文本预测到机器思考 - 2024年12月5日OpenAI发布o1模型,标志着AI从“模式补全”转向“结构化内部认知”的关键转折点,该模型引入了扩展的推理时计算过程,包含内部多步思考、潜在规划和迭代优化 [6] - 推理优化模型所处理的Token量已从近乎零增长至占总量的50%以上,意味着半数以上的AI交互不再是简单问答,而是涉及多步思考、状态管理和工具调用的复杂过程 [4][18] - 交互序列长度显著增加,平均输入Token数从约1,500增长到超过6,000,输出Token数也从150左右增加到约400,反映了用户正在将更复杂的上下文交给AI处理 [20] 市场格局重塑:开源崛起与多元化竞争 - 开源模型使用量显著上升,打破了少数闭源巨头主导的市场格局,其中中国开源力量崛起尤为引人注目,其周使用量占比从2024年底的1.2%跃升至2025年后期某些周度的近30% [4][7][9] - 截至2025年底,开源模型市场呈现健康的多元化态势,没有任何单一开源模型能持续占据超过25%的市场份额,流量均匀分布在五到七个主要竞争者之间 [11] - 中型模型(参数规模在150亿至700亿之间)崛起,在能力与效率之间取得了更好的平衡,满足了大量实际应用场景的需求 [12] 主要参与者与市场份额 - 根据2024年11月至2025年11月的总Token使用量,DeepSeek以14.37万亿Token位居榜首,其次是Qwen(5.59万亿)、Meta LLaMA(3.96万亿)、Mistral AI(2.92万亿)和OpenAI(1.65万亿) [12] - 中国模型提供商如Minimax(1.26万亿)、Z-AI(1.18万亿)、Moonshot AI(0.92万亿)也进入了前十名,显示出中国在全球AI版图中的重要地位 [12] 应用场景分化:从生产力到情感陪伴 - 超过一半(约52%)的开源模型使用量流向了角色扮演、故事创作等创意对话场景,这一比例甚至超过了编程辅助,揭示了AI作为情感伙伴与创作引擎的巨大需求 [4][15] - 编程相关的查询量在2025年实现了稳定增长,从年初占总Token量的约11%攀升至年底的超过50%,成为推动输入Token增长的主要动力 [4][17][20] - 编程相关的提示平均长度是其他类别的3-4倍,且增长速率更快,表明软件开发者正以激进的方式探索AI能力的边界 [20] 全球化与区域市场动态 - 亚洲在全球AI使用量中的份额已从约13%显著提升至31%,反映了该区域企业采纳AI技术的加速和本地创新生态的成熟 [23] - 按大洲划分,北美以47.22%的份额领先,亚洲(28.61%)和欧洲(21.32%)紧随其后 [24] - 按国家/地区划分,美国以47.17%的份额占据绝对主导,新加坡(9.21%)、德国(7.51%)、中国(6.01%)位列其后 [24] - 从语言分布看,英语仍占据主导地位(82.87%的Token使用),但中文(简体)以4.95%的占比成为第二大使用语言 [25] 定价策略与市场分层 - 高端市场由Anthropic的Claude系列和OpenAI的GPT系列等闭源模型主导,其每百万Token成本在2美元(Claude)至35美元(GPT-4/5)之间,但在关键业务场景中用户对性能和质量的要求超过对成本的敏感 [29] - 大众市场以Google Gemini Flash、DeepSeek V3等高效模型为代表,以低于0.4美元每百万Token的成本吸引了海量日常使用 [29] - 市场呈现出复杂的价值分层,而非简单的成本驱动,研究显示价格弹性较弱,降价10%仅能带来0.5-0.7%的使用量增加 [29] - “技术”类查询的平均成本显著高于其他所有类别,但使用量依然保持高位,反映了高复杂性、高价值任务的特殊需求 [32] 用户行为与留存模式 - 报告提出“灰姑娘水晶鞋”理论,即当新模型恰好满足一类长期存在的高价值工作负载需求时,会形成“完美契合”,产生强大的用户锁定效应 [33][34] - 数据支持该理论,例如Claude 4 Sonnet在2025年5月的用户群体,在五个月后依然保持了约40%的留存率,显著高于后续用户群体 [34] - DeepSeek模型展现出“回旋镖效应”,部分用户在尝试其他模型后,会重新回归DeepSeek,暗示其在某些特定能力维度上建立了难以替代的优势 [4][35] 未来竞争焦点 - 行业竞争焦点正从对单一“最佳模型”的追逐,转向构建灵活、多样、适应性强的模型生态系统 [36] - 未来竞争将进一步转向运营卓越性,包括精确衡量真实场景下的任务完成率、降低模型性能波动、使AI行为更好对齐生产环境实际需求等 [36] - 开源模型的持续进步正在对闭源市场构成“底线压力”,推动整个行业的技术进步和成本优化 [32]
2025年第四季投资展望:把握人工智能崛起及减息机遇
搜狐财经· 2025-11-25 14:22
核心投资观点 - 风险资产表现强劲,多个股票指数创历史新高,主因经济韧性和人工智能驱动的盈利增长[3] - 美联储降息周期预计9月启动,焦点转向经济增长风险[3] - 债券市场受惠于降息,投资级别债券观点上调至“偏高”,对冲基金下调至“中性”[3] - 美元可能走弱,利好非美货币[3] - 关税政策引发波动但企业适应能力增强,人工智能创新真实存在并推动生产力提升[4] 亚洲投资趋势 - 亚洲受惠于美联储降息、本地刺激政策及人工智能投资,看好中国和新加坡股市[5] - 中国创新领军企业聚焦人工智能自给自足、开源创新(如DeepSeek模型),涵盖软件、半导体、生物科技[6] - 亚洲(日本以外)股权收益率预计从2024年10.8%升至2026年12.2%[7] - 偏好科技、金融、非必需消费品板块的行业领导者[8] - 优质亚洲债券受惠于降息,青睐金融债券、印度本币债券等[9] 科技颠覆趋势 - 人工智能处于崛起阶段,焦点从大型语言模型转向人工智能基建和应用[10] - 数据中心市场规模预计从2023年3020亿美元增长至2030年6220亿美元(复合年增长率10.5%)[11] - 生成式人工智能支出中80%用于硬件,2028年前复合年增长率达133%[13] - 中国每10,000名工人配备470台工业机器人(全球第三高)[13] - 国防支出上升,受人口增长、财富增加和地缘政治推动[13] 气候行动趋势 - 可再生能源投资加速,2025年洁净能源投资预计2.2万亿美元,高于化石燃料[13] - 太阳能、风能等可再生能源到2050年或满足全球67%电力需求[14] - 生物多样性及循环经济市场规模约4.5万亿美元,企业转向闭环系统以减少浪费[16] 社会演进趋势 - 性别多元化高管团队盈利能力高39%[16] - 流媒体份额(45%)已超越传统电视,订阅经济规模预计从2025年5650亿美元增长至2034年2.1万亿美元[16] 盈利与降息机遇 - 企业盈利强劲,标普500指数81%成分股盈利超预期[17] - 降息利好工业和金融板块,美国政策推动制造业回流利好工业、建筑、物流板块[18] - 金融股估值低,受惠于降息和资本市场活动[18] 资产类别配置 - 美国股市看好科技股(占标普500市值48%),再工业化主题支撑工业板块[19] - 亚洲股市中国受惠于供给侧改革和AI创新,新加坡具防御性和高股息[19] - 偏好投资级别债券,美联储降息利好美元债券[19] - 美元可能走弱,看好欧元、澳元;黄金受惠于美元疲弱和降息[19] - 零售房地产空置率低表现领先,办公室市场分化但优质资产有潜力[19] 优先投资策略 - 利用优质债券布局美联储降息,锁定收益率,久期7-10年,分散外汇风险[20] - 捕捉人工智能应用及商业化趋势,聚焦AI生态系统(芯片、软件、基建)[21] - 通过另类投资降低风险,使用对冲基金、黄金、私募市场等工具管理波动[22] - 把握亚洲政策顺风,利用央行降息、结构性改革投资亚洲股债[23]