BloombergGPT
搜索文档
“力量平衡变了,中国AI愈发成为硅谷技术基石”
观察者网· 2025-12-01 00:19
文章核心观点 - 中国开源AI模型(如DeepSeek、阿里巴巴通义千问)凭借低成本、高定制化、强隐私保护及完善的开发者生态等优势,在过去一年中被越来越多美国硅谷AI初创公司采用,部分场景下性能已接近甚至比肩OpenAI、Anthropic等美国闭源旗舰模型,引发了美国业界对其“封闭”路线的质疑 [1] - 美国AI初创企业的估值正创下纪录,但许多公司的技术根基却建立在可免费下载的低成本中国AI模型之上,这给依赖巨额投资的美国闭源AI产业带来了挑战 [1][4] 中国开源AI模型的优势与采用情况 - **性能接近前沿**:中国开源AI模型与前沿水平的差距“触手可及”,新一代模型正推动中国乃至全球人工智能的前沿发展 [1][2] - **成本与速度优势**:在许多情况下,在自有硬件上运行中国模型,比使用OpenAI的GPT-5或谷歌的Gemini等大型模型速度更快、成本更低 [4] - **具体案例**:估值7亿美元的AI搜索公司Exa表示,使用中国模型比GPT-5或Gemini更快、更便宜 [4] 效率工具Dayflow约40%的用户选择使用开源模型,因为为用户使用闭源模型付费每人每年可能带来高达1000美元的成本,开源模型对生存能力至关重要 [6] - **隐私保护优势**:开源模型可在用户个人电脑上本地处理数据,对注重隐私、不愿将数据上传至云端的用户颇具吸引力 [6][7] 技术生态与开发者支持 - **生态系统优势**:中国模型在在线开发者资源中占据主导地位,拥有丰富的培训指南和社区支持,例如Airbnb也“大量”依赖中国模型 [7] - **易于定制与适配**:开发者发现从开源模型入手,用自己的数据对其进行适配,添加特定技能或知识变得更简单高效,这使中国模型成为定制开发的默认起点 [7] - **市场渗透**:在热门编程应用Kilo Code用户最青睐的20款模型中,有7款是中国模型,其中6款为开源模型 [8] 中美AI发展路径对比 - **美国路径**:AI发展由私营部门主导(如OpenAI、Anthropic),奉行闭源模型路线 [8] - **中国路径**:更积极地规划国家AI发展愿景,呼吁加强“开源技术合作”,实验室通常会公开发布其模型 [9] - **发布速度**:中国公司产品推出速度更快,例如阿里巴巴大约每20天就发布一款新模型,而Anthropic的平均发布间隔为47天 [9] 美国业界的反应与竞争 - **性能认可与担忧**:行业专家指出,过去12个月里,力量平衡发生了迅速转变,中国是AI领域真正的创新者 [9][10] 但同时有硅谷人士认为闭源模型在性能、实用性和生态系统上仍有显著优势 [10] - **美国开源模型的觉醒**:为应对挑战,美国开始鼓励开源模型发展,例如白宫发布《人工智能行动计划》呼吁鼓励开源模型发展,OpenAI发布了五年来首款开源模型,艾伦研究所发布了最新开源模型Olmo 3并发起了“ATOM计划” [11][12][13] - **竞争意识**:美国业界认识到已失去在开源模型领域的领先地位,无论是性能还是采用率,并担忧进一步落后 [13]
从理念到执行:用战略企业架构实现 AI 价值创造
36氪· 2025-11-21 05:42
AI投资价值实现的核心挑战 - 人工智能投资与实际业务价值存在巨大差距,仅4%的公司获得显著回报,26%的公司创造了任何价值 [2] - AI项目失败的主要原因是技术决策未能与组织的战略企业架构(SEA)对齐,包括使命、人才、流程和现有技术 [2] - AI部署常因技术迷恋或错失恐惧症驱动,而非基于与业务的契合度分析 [2] 战略企业架构(SEA)的重要性 - 战略企业架构强调技术架构必须与企业更广泛结构对齐,包括使命、战略、流程和运营模式 [7] - SEA为组织提供共同语言和愿景,是跨部门统一思考、交流和规划的基石 [5][7] - 早期技术创新仅在部门层面实施,而AI项目会在整个企业架构中引发连锁反应 [3] 业务架构的关键组成部分 - 组织宗旨与商业战略:AI项目需直接推进使命、愿景、核心价值观和战略目标 [10] - 人员与文化:成功需要合适的领导力模型、人才结构和技能画像,并与文化价值观一致 [11] - 流程与运营结构:AI开发必须与企业的工作流程、决策框架和治理模式保持一致 [12] - 现有技术架构:新技术必须与当前系统、数据资产、基础设施和技术债务相结合 [13] AI技术栈与对齐考量 - 当代AI技术栈由五个相互关联层组成,成功部署需在每一层确保与组织需求一致 [14][16] - 关键考量包括部署模式、开放与封闭系统取舍、算力需求及数据基础设施要求 [16] - 数据基础设施成熟的组织可比存在数据孤岛的企业更快速高效实施AI [16] 错位与对齐的典型案例 - Stability AI年云计算成本近1亿美元,运营成本5400万美元,但收入仅1100万美元,成本结构与变现战略严重错位 [18] - 三星员工使用外部ChatGPT导致源代码泄露,数据治理政策与AI使用不匹配 [19] - 《体育画报》AI生成文章署虚构作者名,与其"可信信息提供者"品牌承诺背离,侵蚀读者信任 [20] - Adobe使用自有图像训练AI避免知识产权侵权,将客户法律风险降到最低 [21] - 彭博推出BloombergGPT专用金融模型,在自身基础设施中控制数据流,强化高端客户价值主张 [22] AI项目对齐评估清单 - 项目需直接推进战略优先事项并带来清晰可衡量成果,否则仅为技术实验 [23] - 领导层和员工必须做好变革准备,否则需先制定能力提升路线图 [24] - 项目需能与现有流程和运营模式无缝融合 [25] - 技术方法必须与组织技术生态系统、数据流及安全要求兼容 [26] 长期AI投资组合管理 - 企业建立AI项目管道后,需采用投资组合管理方法在SEA框架下系统评估和优先排序项目 [27] - 成功实施的基本原则是将AI项目与战略企业架构对齐,而非仅关注技术本身 [28]
AI赋能资产配置(十八):LLM助力资产配置与投资融合
国信证券· 2025-10-29 14:43
核心观点 - 大语言模型通过强大的文本理解与逻辑推理能力,将舆情、政策、财报等非结构化信息转化为结构化因子,重塑资产配置的信息基础,显著提升投研响应速度与前瞻性 [1] - 真正的落地不依赖单一模型性能,而是依赖“LLM+实时数据+优化器”的协作机制,通过模型分工形成可执行、可解释的投资Agent [1] - 当前LLM在舆情信号提取、财报解析、投资推理和Agent构建等多个环节已具备可操作路径,具备增强传统资产配置体系的现实基础 [1] - 未来LLM将从“辅助工具”走向“核心推理与交互中枢”,资产配置将从静态决策向智能化、动态演进转变,重塑买方投研与策略执行逻辑 [1] 信息优势重构 - LLM使得舆情、财报、政策文本等软信息可以被高效提取、量化并嵌入配置模型,FinBERT、FinGPT、BloombergGPT、PloutosGPT等模型在情绪识别、文本解析与投资推理上展现出明确优势 [2][11] - 非结构化信息的系统化利用增强了市场预期感知能力,使策略具备更高的灵敏度与前瞻性 [2][11] - 传统金融建模长期依赖结构化数值数据,难以捕捉文本信息中的市场预期、情绪变化与定性洞察,LLM为处理海量非结构化文本提供了全新解法 [11] - 在实际投资工作中,从信息收集、信号提取到收益预测、组合配置和风险管理,几乎每一个环节都可以嵌入LLM模块,显著强化信息敏感性、决策解释性以及配置灵活性 [12] 技术落地路径 - 通过模块化设计,LLM与API、RAG、数值优化器形成分工协作:LLM负责文本理解与逻辑推理;外接API与RAG提供实时行情、财报与宏观变量;优化器完成资产配权与约束求解 [2][13][16] - 这种结构既提升了策略的稳定性与可解释性,也具备较强的可扩展性,适用于多资产配置 [2][16] - LLM存在知识时间滞后、难以处理高频金融数据及输出幻觉风险等结构性局限,需通过提示工程、外接API与RAG以及专业数值优化器来形成优势互补 [13][15][16] - 最终可形成具有实际操作性的“投资Agent”:LLM负责理解投资者目标并生成任务;外部数据层提供实时信息;数值优化器完成配权计算;LLM输出投资说明与风险提示 [17] 具体应用案例:舆情信号增强 - 策略核心是通过LLM从财经新闻、社交媒体及公司公告中提取情绪信号,并转化为结构化的“情绪因子”,嵌入Black-Litterman或均值-方差优化等资产配置框架 [21][22] - 具体流程包括:使用FinBERT、FinGPT、FLANG等模型对文本进行情绪打分并聚合为“行业情绪指数”,再通过阈值识别极端情绪状态 [22] - 在配置模型中,当某行业情绪显著上行时,可上调该行业预期超额收益0.5%~1.0%,再由优化器更新组合权重;市场整体情绪转负时则自动降低权益敞口 [23][24] - 此方法能提前捕捉市场预期变化,响应灵敏,但需注意舆情信号存在噪声和潜在偏差,需配合风险约束与置信度控制机制 [24] 具体应用案例:财报信号驱动 - 利用LLM在财报发布后快速提取关键财务与非财务信号,并将其嵌入收益预测与资产配置模型,形成高效的财报驱动动态配置框架 [25][26] - 解析主力模型包括BloombergGPT、GPT-4与PloutosGPT,用于财报摘要、要点提取和多模态信息融合;FinGPT与Mengzi-BERTbase-fin适用于中文财报解析 [25][26] - 解析结果被量化为财报因子,与时间序列模型结合对未来1-3个月的行业或资产收益率进行短期预测,研究显示PloutosGPT在市场波动期的预测准确率显著优于单纯统计方法 [26] - 预测结果作为输入被纳入资产配置框架,财报发布时间同步触发组合再平衡,增强了对盈利周期变化的响应速度 [27][29] 具体应用案例:投资Agent全流程 - 案例构建了一个整合LLM、实时数据接口与数值优化器的Agent系统,实现从信息→信号→优化→执行的全链条投资应用 [20][31] - 核心思路是模块化分工:LLM负责认知与逻辑推理;API与RAG提供实时信息支撑;数值优化器完成配权计算;最终由LLM输出可解释的投资建议 [31][34] - 具体实施包括:通过提示工程和多轮采样构建稳定的“备选资产池”;使用CVXPY建模和CPLEX求解器计算最优投资组合;利用LangGraph协调模块化工作流 [33][34] - 该Agent系统体现了LLM的真正价值在于强化传统量化框架的认知与推理能力,形成清晰的责任边界和可复用的策略流程,是目前机构投资者实现智能化投研落地的现实路径 [35] 未来展望 - LLM与强化学习、Auto-Agent、多智能体系统及个性化投研平台的深度结合,将推动资产配置从工具化向系统化、从线性流程向智能演进过渡 [3][39] - 投研人员与模型将通过高频对话、情景推演与策略反馈形成闭环,资产配置将从静态决策走向动态演进,迈入下一代智能化资产管理的新阶段 [3][39] - LLM在资产配置中的角色正从“辅助工具”逐步演变为“核心推理与交互中枢”,为机构构建信息优势与策略护城河的核心技术路径 [3][37]
AI 赋能资产配置(十九):机构 AI+投资的实战创新之路
国信证券· 2025-10-29 07:16
核心观点 - 大语言模型正将海量非结构化文本转化为可量化的Alpha因子,从根本上拓展了传统投研的信息边界[1] - 从大语言模型的信号提取、深度强化学习的动态决策到图神经网络的风险建模,AI赋能资产配置的全链条技术栈已具备现实基础[1] - AI正从辅助工具转向决策中枢,推动资产配置从静态优化迈向动态智能演进,重塑买方的投研与执行逻辑[1] - 头部机构的竞争已升维至“AI原生”战略,其核心是构建专有、可信且能驾驭复杂系统的AI核心技术栈[2] - 对国内资管机构而言,破局之道在于战略重构与组织变革,走差异化、聚焦式的技术落地路径[3] AI技术对资产配置范式的重塑 大语言模型的应用与挑战 - 大语言模型凭借自注意力机制能够精准捕捉词汇在句子中的复杂关系与上下文含义,实现更精准的金融情绪判断,将投资分析从数字领域拓展至语义领域[11][12] - 金融专用大语言模型的开发遵循预训练加微调的两步范式,业界已开发出BloombergGPT(500亿参数)、FinGPT、FinBERT与FinLlama等专用模型[13] - 大语言模型可直接为算法交易系统提供情绪信号,并实现7×24小时不间断监控全球信息流以识别潜在风险早期信号[14] - 大语言模型应用面临数据偏见与模型幻觉、高昂计算成本、可解释性难题等挑战,金融专用大语言模型的竞争正演变为围绕专有数据与微调专业知识的军备竞赛[15][16] 深度强化学习的革新价值 - 深度强化学习采用“智能代理”与“环境”交互的学习范式,目标是在长期内实现最优回报的决策策略,而非一次性精准预测[17][18] - 主流深度强化学习算法包括演员-评论家方法、近端策略优化和深度确定性策略梯度,其中深度确定性策略梯度专为连续行动空间设计,非常适合投资组合管理任务[19][20] - 深度强化学习面临数据依赖与过拟合风险、市场周期适应性难题、高昂计算成本以及现实世界约束整合等发展瓶颈[21][22] 图神经网络的风险建模能力 - 图神经网络将整个金融系统抽象为网络,其中“节点”代表金融机构,“边”代表它们之间的相互关联,能够捕捉风险通过网络进行“传染”的动态过程[23] - 图神经网络通过“消息传递”机制让每个节点聚合其邻居节点信息,从而感知其在网络中的局部和全局环境,为监管部门提供强大的压力测试模拟工具[24][25] - 图神经网络可帮助投资者识别高度关联的“公司集群”,构建更有效的投资组合对冲策略,实现对整个“社区”风险的对冲[26] 头部资管机构的AI实践 贝莱德的AlphaAgents系统 - AlphaAgents系统通过模拟人类投资委员会的“协作与辩论”机制,设立基本面分析、情绪分析和估值分析三个具有明确角色分工的AI智能体[30][31] - 系统选择GPT-4o作为核心模型,在事实分析基础上进入对抗性辩论与共识辩论环节,通过多轮讨论直至所有智能体达成一致共识[31][33] - 回测实验显示,在风险中性策略下,多代理投资组合的累计回报和夏普比率显著优于所有单代理组合及市场基准,而在风险规避策略下成功实现了规避下行风险的策略目标[34][35] - AlphaAgents代表了人机协作模式的根本性升级,其多智能体辩论机制提高了分析严谨性并减少AI幻觉问题,为AI决策的可解释性提供重要支撑[39] 摩根大通的AI原生战略 - 摩根大通每年在AI上投入20亿美元,2025年技术预算高达180亿美元,其中AI是核心部分,通过设立专门AI研究部门系统性地推进金融AI基础研究[42][43] - 2024至2025年间,摩根大通AI部门共发表140篇出版物,包括15篇期刊论文和63篇会议论文,其中8篇发表于AAAI顶级会议[44] - 摩根大通的AI战略围绕三大支柱:构建专有可信的AI核心技术、通过模拟与自动化决策掌控复杂系统、从物理与另类数据中创造信息优势[45][53][58] - 在可信AI领域,摩根大通研究在不直接接触敏感数据前提下实现模型公平性的方法,以及开发具备数学上可证明隐私保护能力的合成数据[46][47] 对国内资管机构的启示 - 国内资管机构应进行顶层设计并寻求差异化破局,成立跨部门AI战略委员会,制定符合公司特色的转型路线图,采取“聚焦突破”策略[63] - 技术实施层面应采取“三步走”策略:夯实数据基础、基于开源框架进行模型选择、确立“人机协同”原则将AI定位为投研团队的“智能副手”[64] - 必须打破传统部门壁垒,构建融合投资洞察、数据科学和工程实现的跨职能团队,采取“外部引进与内部培养”双轨制进行人才建设[65][66] - 需要建立覆盖模型全生命周期的治理框架,特别关注大语言模型的“幻觉”问题,前瞻性布局“可信AI”能力建设[67]
中国AI模型超美国模型,靠AI炒股的时代来了吗?
36氪· 2025-10-26 09:20
实验概述 - 全球首次AI炒币实盘对决在Alpha Arena平台进行,六大中美顶级AI模型各获1万美元实盘资金,自由买卖BTC、ETH、SOL等主流加密货币[1] - 实验旨在测试AI模型在最真实、不可预测的金融市场中的表现,而非静态知识评估,模型需分析数据和市场情绪,如同真实交易员[2] - 实验提供了观察AI在真实市场中博弈的窗口,重点在于分析其买卖标的、持仓时长及止盈止损策略,而非仅关注收益结果[11] 参赛模型表现 - 开赛6天后,Qwen3 Max以20倍杠杆、近乎全仓的激进策略实现总收益13.41%,现金余额一度仅剩96.8美元,领先其他模型一天多[7] - DeepSeek Chat v3.1收益率曾接近40%,盈利超4000美元,后随大盘下跌回吐部分收益,收益率稳定在10%左右,位列前两名[3] - GPT-5亏损高达68.9%,表现持续下行;Grok-4因高频激进、涨跌均不割肉的策略,在实现超40%盈利后迅速跳水;Claude因理性保守、仓位轻、止损严,总收益为负17.46%[4] 模型能力背景分析 - DeepSeek由幻方量化团队训练,在金融和数学方面有积累,但此次大赛前的小规模测试中,GPT和Grok实现盈利,DeepSeek反而出现亏损[7] - 实验作为基准测试仍缺乏大样本、长时间、跨市场的数据积累,以及透明可复现的设置,存在较大随机性和不可靠性[9] AI在投资领域的应用现状 - 据路透社消息,至少十分之一的散户投资者已开始依赖ChatGPT或Gemini等聊天机器人筛选投资标的[12] - 券商eToro指出,使用AI选股要求使用者具备一定金融知识,否则试错成本高昂,且目前并无市场公允推荐的能高成功率预测市场的模型[12] - 多家券商已推出收费AI选股服务,如中国银河证券的“财富星AI投顾”包含AI选股、数据等功能;东方财富“妙想”模型分体验版、进阶版和专业版,季度费用从518元至818元不等[16][18] 金融大模型发展历程 - 2023年彭博社发布500亿参数的BloombergGPT,但其成本高昂、系统封闭,普通开发者无法触及,模型为黑箱运作,金融预测性提升感知不强[14] - 2025年8月清华大学发布开源项目Kronos,旨在利用时间序列大模型预测K线走势,但使用者反馈其观点判断过于平均市场化或臆造,预测结果难以信服[14] AI投资的局限性 - 大模型往往从市面挖掘有效因子,对矛盾之处缺乏深入推理,导致策略趋同,难以跑赢资金体量更大、信息调研更强的量化机构[15] - AI更擅长技术面分析,如趋势、成交量等;基本面分析多重复新闻和研报,仍需用户自行分析行业前景和盈利能力[21] - AI难以判断“黑天鹅”风险,对“灰犀牛”事件认知滞后,面对全新商业模式或颠覆性技术等“未知的未知”时可能犯灾难性错误[23][24] - 知名投资人段永平将AI投资定义为“高级的看图看线”,认为其是在优化“猜人心”的游戏,而非实践“估价值”的投资[23] 有效使用AI投资的要点 - 用户需比AI更懂投资,明确自身炒股目标和纪律,并注意AI数据的可靠性,具备被投资行业的常识[20][22][23] - AI输出质量高度取决于数据质量和提示词设计,用户需反复与AI解释强调以达成定义共识,例如对价值投资和“护城河”的理解[20][21] - 利用AI进行上市公司财报总结和行情基本分析是高效趋势,可将繁琐的文本图表任务交给AI,但选择模型不应以名气判断,而应根据自身目标考察完成度准确性,并保持频繁使用和调换[18][22]
中国AI模型超美国模型,靠AI炒股的时代来了吗?
首席商业评论· 2025-10-25 03:52
全球首次AI炒币混战概述 - 一场使用真实资金的AI投资对决在Alpha Arena平台展开,六大AI模型各获得1万美元实盘资金,在加密市场自由买卖主流币种,无人类干预[3] - 实验旨在测试AI在真实金融市场中的表现,区别于静态能力排行榜,市场被视为由信息和情绪构成的生命体,要求模型具备分析数据和市场情绪的能力[3] - 实验已进行6天,经历了市场波动,排名和收益率出现显著变化[5] 各AI模型交易表现与策略分析 - DeepSeek Chat v3.1在前三天收益率一度接近40%,盈利超过4000美元,但随市场下跌回吐部分收益,收益率稳定在10%左右,保持前两名[5] - GPT-5表现最差,亏损高达68.9%,且持续下行,可能最先出局[5] - 马斯克的Grok-4采用高频激进策略,几乎满仓操作,曾实现超40%盈利,但随市场变化迅速跳水[6] - Claude表现为理性保守派,仓位轻、杠杆低、止损严格,但因过于谨慎错失行情,总收益为负17.46%[6] - Qwen3 Max凭借比Grok-4更激进的策略实现反超,使用20倍杠杆、几乎全仓操作,现金余额一度仅剩96.8美元,总收益13.41%,领先DeepSeek Chat v3.1二十个点以上[8] AI模型表现差异原因分析 - DeepSeek由幻方量化团队训练,在金融和数学方面有积累,但并非遥遥领先,大赛前的小规模测试中GPT和Grok盈利而DeepSeek亏损[8] - GPT-5和Gemini 2.5 Pro作为通用模型,被训练用于聊天、写代码等任务,学习了互联网上相互矛盾的分析和情绪化内容,其"散户式"高频交易可能源于学习了过多"噪音"[11] - 实验意义在于观察AI在真实市场中的博弈行为,包括买卖选择、持仓时长、止盈止损策略,而非单纯关注收益结果[13] AI在投资领域的应用现状与挑战 - 至少十分之一的散户投资者开始依赖ChatGPT或Gemini等聊天机器人筛选投资标的,但成功使用要求使用者具备一定金融知识[15] - 金融大模型发展可追溯至2023年,彭博社发布的BloombergGPT因成本高昂、系统封闭、提升感知有限而未能广泛推广[17] - 清华大学2025年发布的Kronos开源项目试图利用时间序列大模型预测金融市场走势,但使用者反馈其观点判断过于平均或臆造,难以令人信服[17] - 大模型往往从公开信息挖掘有效因子,对矛盾之处缺乏深入推理,导致策略趋同,难以跑赢资金体量更大、信息调研更强的量化机构[18] - 各大券商推出收费AI选股服务,如中国银河证券的财富星AI投顾和东方财富的"妙想"大模型,月费从几百到3888元不等[18][21] 有效使用AI进行投资的策略建议 - 选择模型不应以名气判断,而应根据自身目标考察完成度和准确性,需反复使用和调换模型[21] - 明确炒股目标和纪律至关重要,DeepSeek在比赛中完全按照预设交易计划执行,行情波动也不做盘中调整,注重风控结构和盈亏比[22] - AI输出质量高度取决于数据质量和提示词设计,当前更擅长技术面分析,基本面分析多重复新闻和研报,仍需用户自行分析行业前景和盈利能力[23] - 使用者需比AI更懂投资,注意AI数据的可靠性,具备被投资行业的常识,AI难以判断"黑天鹅"风险和认知"灰犀牛"事件[24] - AI被定义为"高级的看图看线",优化"猜人心"的游戏而非实践"估价值"的投资,面对充满不确定性的未来可能犯下灾难性错误[24] - AI可回溯过去数据找到完美相关关系,但无法真正理解品牌价值或企业文化力量,对全新商业模式和颠覆性技术可能应对失误[25]
全世界都在寻找AI超级应用
21世纪经济报道· 2025-10-10 07:54
Sora2的市场表现与行业意义 - OpenAI最新发布的Sora2及其社交应用在有限邀请制下,短短几天登上美国App Store免费应用榜首位,超越了绝大多数国际主要AI应用产品的早期表现[2] - Sora2的迅速走红印证了市场对AI视频生成的高度热情,反映出全球科技企业共同关注如何在AI浪潮中找到引爆市场的“超级应用”[2] - 有的影视公司使用Sora2后,单部短剧成本降幅达百分之三四十,有的广告公司利用Sora2生成20秒以上的广告视频并已获得大厂追加订单[6] AI领域的两大发展路线 - AI领域正分化为通用大模型和垂直模型两大阵营,尽快实现商用是它们的共同目标[5] - 通用大模型如ChatGPT、Sora2正加速从技术提供商向应用平台服务商转变,OpenAI不再满足于仅提供API接口,而是直接推出社交应用并集成即时购物功能[5] - 垂直模型利用行业数据和知识在特定领域提供精准解决方案,例如彭博社开发金融专属大模型BloombergGPT,Cohere发布侧重数据隐私保护的企业级大模型Command-R[5] 通用大模型与垂直模型的竞争格局 - 通用大模型的优势在于平台潜力和扩展性,例如OpenAI通过与Shopify、Etsy等电商平台合作,在ChatGPT中集成无需跳转的即时购物功能[6] - 垂直模型凭借行业深耕积攒的数据壁垒构筑自身IP,例如AI编程模型Cursor年重复经常性收入已超5亿美元,美图秀秀的AI工具驱动公司整体付费率从2.9%增加至5.5%[7] - 业界认为通用大模型与垂直模型可能平行共生,通用大模型成为基础架构和流量入口,垂直模型在特定领域深耕形成互补优势[7][8] 中国厂商的AI应用发展机遇 - 中国厂商凭借卓越的工程优化能力展现后发优势,DeepSeek的横空出世震撼AI界,其核心优势在于不可思议的低成本[10][11] - 中国拥有广阔的应用场景,在电商和手游领域已实现超越,2024年中国电商零售规模是美国的3倍,电商渗透率约为美国的2倍,贡献全球移动游戏近40%的市场规模[10] - 中国AI产品具备巨大成本优势,Sora2生成5秒视频需要0.5~2.5美元,比可灵等国产模型高出80%左右,高性价比使国产模型在大规模推广和出海方面具备明显优势[11] 中国企业的具体进展与生态建设 - 科大讯飞2025年上半年海外AI硬件同比增长超3倍,AI办公本在日本上市两个月即成为日本最大众筹平台平板类销售额历史TOP1,在韩国Wadiz平台也成为同期全品类TOP1[11] - 包括通义千问、腾讯混元、字节豆包、文心一言在内的中国先进大模型已开始构建属于自己的技术、标准等生态[11] - 中国公司在AI应用运营推广上有独特优势,抖音“给豆包一张平平无奇的照片”热度超过1400万,可灵“快来惹毛我”话题播放量达7.2亿次,主打大众化、平民化[10]
全世界都在寻找AI超级应用
21世纪经济报道· 2025-10-10 07:46
文章核心观点 - AI视频生成应用Sora2在有限邀请制下迅速登上美国App Store免费应用榜首位,显示市场对AI视频生成的高度热情,全球科技企业正共同寻找能引爆市场的“超级应用” [1] - AI领域正分化为通用大模型和垂直模型两大阵营,2025年被视为人工智能应用元年,AI超级应用可能不止一个,中国厂商凭借应用场景和工程优化能力有望占据全球第一梯队 [3][5][10] AI行业发展路线 - 通用大模型如ChatGPT、Sora2正加速从技术提供商向应用平台服务商转变,通过构建生态系统和收购硬件公司(如OpenAI花65亿美元收购io)来扩大影响力 [3] - 垂直模型利用行业数据和知识在特定领域提供精准解决方案,例如彭博社的BloombergGPT和Cohere的Command-R模型 [5] - 业界普遍认为2025年是人工智能应用元年,AI正快速渗透各行各业,有影视公司使用Sora2后单部短剧成本降幅达30%-40% [5] - 通用大模型和垂直模型可能平行共生,通用大模型成为基础架构和流量入口,垂直模型在特定领域深耕形成互补优势 [6] - AI编程模型Cursor年重复经常性收入(ARR)已超5亿美元,美图秀秀的AI工具驱动公司整体付费率从2023年上半年的2.9%增加至2025年上半年的5.5% [6] 中国AI应用前景 - 中国科技公司拥有从1到N的产品能力,2024年中国电商零售规模已是美国的3倍,电商渗透率50%约为美国的2倍 [8] - 中国公司拥有AI应用运营推广优势,抖音“给豆包一张平平无奇的照片”热度超过1400万,可灵“快来惹毛我”话题播放量达7.2亿次 [9] - 中国AI产品具有成本优势,Sora2生成5秒视频需要0.5-2.5美元,比可灵等国产模型高出80%左右 [9] - 科大讯飞2025年上半年海外AI硬件同比增长超3倍,AI办公本在日本和韩国众筹平台成为销售额TOP1产品 [9] - 包括通义千问、腾讯混元、字节豆包、文心一言在内的中国先进大模型已开始构建自主技术生态 [9]
Sora2爆火,全世界都在寻找超级应用
21世纪经济报道· 2025-10-09 10:36
AI视频应用市场热度 - OpenAI发布Sora 2及其社交应用,在有限邀请制下几天内登上美国App Store免费应用榜首位[1] - 用户使用Sora App戏仿OpenAI创始人照片生成视频推广旅游景点,显示市场对AI视频生成高度热情[1] - 影视公司使用Sora 2后单部短剧成本降幅达30%-40%,广告公司利用其生成20秒以上广告视频并获得大厂追加订单[3] AI行业技术路线分化 - AI领域分化为两大阵营:通用大模型(如ChatGPT、Sora2)和垂直模型,共同目标是尽快实现商用[2] - 通用大模型加速从技术提供商向应用平台服务商转变,OpenAI直接推出社交应用并集成即时购物功能[2] - 垂直模型利用行业数据在特定领域提供精准解决方案,如彭博社开发金融专属大模型BloombergGPT[2] 通用大模型发展策略 - OpenAI积极构建生态系统,目标是成为AI时代的iOS商城和Google Play,今年5月收购前苹果设计师的AI设备初创公司以进军硬件领域[2] - 通用大模型通过平台合作(如Shopify、Etsy)在ChatGPT中集成即时购物功能,用户无需跳转即可直接购买[3] - 通用大模型可作为基础架构和流量入口,与垂直模型形成互补共生关系[4] 垂直模型应用案例 - AI编程模型Cursor年重复经常性收入已超5亿美元[4] - 美图秀秀AI美颜工具驱动公司整体付费率从2023年上半年2.9%增加至2025年上半年5.5%[4] - 小鹏汽车以图灵AI智驾为核心的基座模型将推广到全球其他国家[4] 中国AI产业发展优势 - 中国电商零售规模2024年已是美国3倍,电商渗透率50%约为美国2倍[5] - 中国贡献全球移动游戏近40%的市场规模,成为全球手游领导者[5] - 国产AI模型拥有巨大成本优势,Sora2生成5秒视频需0.5-2.5美元,比可灵等国产模型高出80%左右[5] 中国企业国际化进展 - 科大讯飞2025年上半年海外AI硬件同比增长超3倍,AI办公本在日本上市两个月即成为日本最大众筹平台平板类销售额历史第一[6] - 中国AI产品在海外市场表现突出,在韩国Wadiz平台成为同期全品类第一[6] - 包括通义千问、腾讯混元、字节豆包、文心一言在内的中国大模型正在构建自主技术生态[6] 中国市场推广优势 - 抖音"给豆包一张平平无奇的照片"话题热度超过1400万,可灵"快来惹毛我"话题播放量达7.2亿次[5] - 中国公司主打大众化、平民化推广策略,在AI应用运营上具有独特优势[5] - DeepSeek凭借卓越工程优化能力和低成本优势震撼AI界,展现显著后发优势[5]
AI卷疯了,唯独炒股不灵
36氪· 2025-09-05 04:06
大模型在金融预测领域的失效 - 2025年8月A股市场出现显著上涨行情 上证指数创十年新高 北证指数创历史纪录 单日成交额达2.8万亿元[1] - 主流金融大模型均未能预测此轮行情 BloombergGPT及国内量化模型未作出反应 K线预测工具集体失灵[1] - 用户按大模型炒股教程操作反而加速亏损 实际应用效果与回测表现出现严重背离[1][3] 金融大模型的发展历程 - 行业始于2023年BloombergGPT发布 该模型使用彭博数十年积累的金融文档训练 具备专业金融语言理解能力[2] - 2024年开源浪潮推动金融大模型普及 出现中文金融模型和K线预测框架 功能从新闻分析扩展至代码生成与趋势预测[2] - Kronos等预测模型上线初期引发关注 但两周内即因预测不准问题被用户反馈淹没[3] 金融数据的本质特征 - 金融市场每日产生数十亿条价格变动和新闻数据 但有效信号占比极低 99%信息属于噪声[6][7] - 金融规律存在自毁特性 任何有效信号被识别后会被迅速套利直至失效 即Alpha衰减现象[8][9][12] - 历史K线数据已被全球开发者深度挖掘 缺乏预测未来的剩余价值 导致模型仅能进行历史数据拟合[9][10] 金融AI的应用转向 - 行业从预测转向研究辅助 重点应用于财报分析 公告解读 数据清洗和回测代码生成[4][15][16] - BloombergGPT实际定位为数据处理器 将非结构化金融信息转化为结构化数据供研究员使用[15] - 开源领域转向开发数据助手工具 通过AutoGPT抓取市场情绪 用LangChain整合财报 接入n8n实现工作流自动化[15] 人机协作的新范式 - 有效模式为"人类策略+AI效率"组合 AI承担信息处理等基础工作 人类专注认知判断与决策[16][17][18] - 大模型核心价值在于提升信息处理速度 实现秒级财报查询 公告解读和策略回测[16] - 金融核心能力仍依赖对不确定性的判断和市场博弈感知 这些能力尚未被AI取代[19]