Workflow
智能体
icon
搜索文档
烧掉千亿,卷完参数卷落地:中国 AI 生存之战路在何方?
搜狐财经· 2025-12-17 17:26
出品 | 大力财经 但市场规律无情,2025年的中国大模型市场正经历一场静默却深刻的洗牌。 当行业从追求规模转向注重落地时,一些初创公司由于缺乏明确的技术积累和商业化路径,逐渐淡出主流视野。 作者 | 杨洲 一夜之间,似乎所有人都在谈论"智能"。但喧嚣背后,真正的较量早已不是谁的技术词汇更炫目。 当风口渐渐平稳,一个更现实的问题浮出水面:钱往哪里烧,力往何处使?这场被视为"国力之争"的竞赛,参赛者们并未挤在同一条跑道上。 看似混战的局面下,暗流早已划分出清晰的河床。 2023年底,中国AI市场曾同时涌现出400多个大模型项目,一场被称为 "百模大战" 的激烈竞争如火如荼。资金、人才和技术密集涌入,厂商们比拼参数 规模,展示技术实力。 经过近两年的市场筛选与行业洗牌,中国大模型产业已从"百模并起"的草莽时代,走向了市场格局收敛的新阶段。 曾几何时,2023年被业界称为"百模大战"的爆发年。据不完全统计,当时中国市场上涌现的基础大模型数量高达 478个。 "六小虎"曾是这场混战中的佼佼者,包括月之暗面、阶跃星辰、智谱、MiniMax、零一万物与百川智能等创新企业。这些公司一度被视为中国版的 OpenAI,获得了大 ...
全场景+智能体双轮驱动,金融创新大展“鸿”图
第一财经· 2025-12-17 13:21
文章核心观点 - 鸿蒙操作系统通过其全场景适配能力与智能体技术,为金融机构解决多终端体验割裂、开发效率低下及服务模式被动等痛点,助力行业开启第二增长曲线 [2][18] 全场景适配:打造无缝金融服务体验 - 鸿蒙系统基于“1+8+N”全场景战略,实现手机、电脑、平板、穿戴、车机等设备的全面覆盖与无缝协同,其“一次开发、多端部署”能力为金融机构解决多端适配难题提供支持 [4] - 兴业证券推出鸿蒙手表版App(优理宝),用户可通过手机一键同步自选股至手表,实现抬腕掌控行情,打破投资场景限制 [5] - 中金财富App已实现直板机、折叠机、平板等多端设备的无缝适配,开发效率极高,具备“一次开发、多端受惠”的特性 [5] - 同花顺、广发易淘金、大智慧、指南针股票、东方财富等多家专业金融软件及网银已推出鸿蒙电脑版本,更多伙伴将于今年年底至明年年初上线 [5] - Wind金融终端、东方财富等PC版金融应用已上线华为Mate XTs折叠屏手机,实现“将PC版金融应用装入手机”的重大突破 [6] - 国有六大行、同花顺、东方财富、大智慧、京东金融等专业金融应用全面适配鸿蒙平板;国泰海通证券、兴业证券优理宝等应用上线鸿蒙穿戴设备 [6] - 通过鸿蒙分布式技术,工商银行实现用户摇一摇手机即可导航至网点,达成手机银行App与智能座舱联动,未来绝大部分金融服务可在多设备无缝接续 [7] 小艺与智能体:开启金融服务智能化新时代 - 传统金融服务模式存在交互路径冗长、功能分散、服务被动等瓶颈,智能化转型成为破局关键 [9] - 小艺助手和鸿蒙应用智能体为金融机构注入智能化动力,多家机构正通过它们提供个性化服务以重构体验 [10] - 兴业证券接入鸿蒙意图框架后,用户通过语音向小艺说出一句话指令即可一步直达股票行情、理财服务、交易操作等核心功能 [10] - 兴业证券基于小艺智能体平台打造兴业证券智能体,集成开户指引、业务问答、特色功能等一站式服务,提供“随时随地”的智慧投资陪伴 [10] - 小艺推动金融服务从“被动响应”向“主动陪伴”转型,能根据用户习惯和偏好提供精准服务,帮助金融机构紧跟市场变化 [11] - 目前鸿蒙系统上金融智能体呈百花齐放之势,包括东方财富“妙想”、华泰证券“华泰股市助手”、国泰海通“国泰海通灵犀”、中金财富“中金财富投资助手”等均已上架小艺智能体广场 [11] - 东方财富“妙想”智能体在Mate X7折叠屏手机上带来“左屏通过小艺调用智能体盯盘看股,右屏打开东方财富App并提供实时服务”的创新体验 [11] 协同创新:助力金融机构抢占生态先发优势 - 鸿蒙生态的开放性和包容性为金融机构提供了广阔的合作平台,通过协同创新可探索金融服务新模式、新场景,抢占市场先发优势 [13] - 早期拥抱鸿蒙的金融机构已收获显著成果,中金财富鸿蒙版应用在一年内完成十次升级迭代,功能覆盖越来越全,客户满意度非常高 [16] - 国信证券自2024年1月加入鸿蒙生态,同年6月推出行业首批鸿蒙版国信金太阳App,鸿蒙团队采纳并改进了其提出的90多项建设性建议 [16] - 工商银行主流App(手机银行、E生活及员工办公App)均已完成鸿蒙适配,并以技术专家和代码贡献者身份融入生态,开源基础组件并提供仓颉语言金融行业解决方案 [16] - 通过与鸿蒙团队协作,工商银行构筑了图片识别、人脸检测、语音唤醒等多模态交互新能力,其效能和用户体验提升非常明显 [16] - 对于中小型金融机构,鸿蒙提供丰富的开发工具、完善的技术支持甚至现金激励,降低了开发成本和难度,使其能快速提升数字化能力 [17] - 在鸿蒙这一全新生态中,流量和资源快速增长,金融机构应抓住机会,实现“多端覆盖,全场景体验升级”与“智能化服务”的双重突破 [17] - 鸿蒙适配开发不应只视为成本投入,而应看作是获取“稀缺资产” [17]
全场景+智能体双轮驱动,金融创新大展“鸿”图
第一财经· 2025-12-17 13:09
在数字化浪潮席卷全球的今天,金融行业正面临着前所未有的挑战与机遇。 一方面,用户对便捷性、安全性、智能化的要求日益提高,传统金融服务模式逐渐难以满足市场期待; 另一方面,金融机构想要提升服务质量,需要克服多终端之间形成的信息孤岛、体验割裂、应用开发费 时费力等困难,这些难题也制约着金融机构的创新速度。 自鸿蒙操作系统5发布以来,便与金融伙伴协同发力,为上述痛点提供解决方案。 这件事现在进展如何,成效如何?在近日举行的鸿蒙生态金融行业论坛上,众多金融领域专家和企业代 表给出了各具特色的答案。尤其在圆桌环节中,工行软件开发中心金融科技专家朱国平、中金财富副总 裁陈明、国信证券首席信息官吴士荣、兴业证券首席信息官蒋剑飞、深创投执行总经理陶志红等头部机 构代表分享了各自与鸿蒙合作的实践经历与心得感受,坦陈了鸿蒙的优势、不足、前景与建议,为业界 了解鸿蒙在金融领域应用的真实情况提供了可靠的干货。 我们发现,嘉宾们对鸿蒙为金融机构带来的技术红利和市场红利抱有强烈的信心与期待,对鸿蒙全场景 适配与智能体等技术创新,反馈尤其热烈。当鸿蒙与金融机构牵手共创、协同创新,"止痛"与"生长"将 同时发力,有望开启金融服务的第二增长曲 ...
“天才少女”罗福莉首秀:小米MiMo大模型,比DeepSeek更便宜、推理速度快三倍
钛媒体APP· 2025-12-17 07:15
小米大模型技术进展 - 小米AI实验室大模型团队负责人罗福莉首次公开亮相,详述了公司在大模型领域的最新进展[2] - 公司推出了全新一代面向智能体的基座模型MiMo-V2-Flash,其总参数为309B,激活参数为15B[2] - MiMo-V2-Flash在代码能力和智能体能力上已进入全球开源模型Top 1-2行列,其大部分评估基准已超过或与DeepSeek-V3、Kimi、Qwen等模型相当,而这些模型的总参数量通常是MiMo-V2-Flash的两到三倍[2] 模型性能与成本优势 - 在推理价格和速度方面,MiMo-V2-Flash比DeepSeek-V3.2更便宜,且推理速度约为其三倍[3] - 与综合性能相当、推理速度差不多的Gemini 2.5 Pro相比,MiMo-V2-Flash的推理成本便宜了整整20倍[3] 开源战略与下一代智能体愿景 - MiMo-V2-Flash已经开源了所有模型权重,同步了技术报告细节,并提供了API供开发者接入Web Coding IDE[5] - 公司认为下一代智能体系统需要从“回答问题”转变为“完成任务”,这需要记忆、推理、规划及全模态感知能力,以便无缝嵌入智能终端[5] - 下一代智能体需要构建物理模型,以理解物理规律和推演世界运作逻辑,实现与真实环境的交互,这是AI能力的本质跨越[5] 研发投入与生态建设 - 公司宣布未来五年将在研发上投入2000亿元,长期目标是成为全球硬核科技的引领者[6] - 具体到2025年,预计研发投入将达到320-330亿元,2026年预计投入约400亿元[6] - 自2025年4月以来,公司陆续推出了Xiaomi MiMo语言、多模态、语音系列基座大模型并开源,11月还发布了智能家居方案Xiaomi Miloco和具身大模型MiMo-Embodied,同样全面开源[6] 操作系统与平台生态数据 - 公司为物联网定制的轻量化操作系统Xiaomi Vela的开源版本openvela,其全球合作伙伴已突破100家,深度赋能1500个种类产品,搭载该系统的设备数已超过1.6亿台[6] - 公司全球月活跃用户数达到7.42亿[7] - 硬件生态方面,小米AIoT平台连接设备数达到10.4亿,硬件合作伙伴数量突破15000家[7] - 软件生态方面,全球开发者规模达到120万,国内应用生态每月应用分发量突破11亿[7] 汽车生态开放进展 - 小米汽车CarIoT已向汽车行业全面开放,为汽车厂商和硬件制造伙伴提供统一的生态硬件接口和车载生态件产品[7] - 目前CarIoT已开放品类超过30种,并与比亚迪、广汽丰田等4家车企达成深度合作[7]
“天才少女”罗福莉小米首秀:国内外模型代差从三年缩至数月
贝壳财经· 2025-12-17 04:01
新京报贝壳财经讯(记者陈维城)12月17日,95后AI"天才少女"罗福莉以小米MiMo大模型负责人的身 份首秀2025小米"人车家全生态"合作伙伴大会。罗福莉认为,下一代智能体系统不是一个"语言模拟 器",而是一个真正理解我们世界,并与之共存的"智能体"。 当年年底,有媒体报道,罗福莉被小米集团创始人、董事长兼CEO雷军以千万年薪挖走,或将担任小米 AI实验室的大模型团队负责人。 今年11月,罗福莉在朋友圈官宣加入小米。12月初,小米集团合伙人、总裁卢伟冰回应罗福莉相关问题 时表示,小米在前几个季度已开始在AI上的压强式投入,进展远超预期。小米希望能够给优秀的人才 提供好的发展平台。 编辑 杨娟娟 校对 杨利 罗福莉进一步解释,"智能体"要有两个能力,一是Agent执行,从"回答问题"到"完成任务",包括记 忆、推理、自主规划、决策、执行;二是Omni 感知,统一多模态感知(为理解物理世界打基础)嵌入 眼镜等智能终端,融入日常工作流。 罗福莉表示,在2020年,中国开源模型距离世界顶尖闭源模型的代差至少有三年。如今,大家都能看 到,中国的开源模型,距离世界顶尖闭源模型的差距可能仅有数月。 2024年,AI大模 ...
Google全链路赋能出海:3人团队调度千个智能体,可成独角兽|MEET2026
量子位· 2025-12-17 03:38
编辑部 整理自 凹非寺 量子位 | 公众号 QbitAI 未来应该是智能体之间自主协同,解决复杂问题、自动化工作流程、自主下达任务,创建一种全新的商业模式。 MEET2026智能未来大会是由量子位主办的行业峰会,近30位产业代表与会讨论。线下参会观众近1500人,线上直播观众350万+,获得了 主流媒体的广泛关注与报道。 核心观点 初创企业在全球化过程中面临不同侧重点与挑战,Google的全链路生态在每一阶段都可以为初创企业助力,赋能高效出海。 Gemini 3是一次真正的突破,在多个权威榜单中排名第一,标志着从"辅助工具"向"自主智能体"的跨越。 谷歌主导推出了A2A协议(Agent-to-Agent Protocol,智能体间通信协议),旨在打通跨企业、跨系统的智能体协同。 商业模式正在从SaaS按月订阅转向Outcome-based按结果付费,这是智能体时代的底层逻辑变化。 3到10人的初创团队完全可能通过调度大量智能体成长为独角兽,但需要重视数据壁垒、行业深度集成以及法律合规。 初创出海的五个阶段与Google全链路解决方案 在演讲开篇, Dennis系统梳理了初创企业出海的五个阶段,以及谷歌在每个阶 ...
无问芯穹正式发布智能体服务平台,助力每一个能改变世界的智能体
IPO早知道· 2025-12-16 13:44
文章核心观点 - 无问芯穹公司正式发布其战略级AI基础设施产品——无问芯穹智能体服务平台,旨在为企业提供从智能体定制优化、部署托管到商业化变现的全链路陪伴式落地服务,以加速企业从创造力到生产力的进化[3] - 公司认为,未来每个企业都将实现“智能代理化(Agentic)”,智能体将极大扩展组织的创造能力,使微小团队也能释放强大影响力[3] - 智能体时代正在加速企业创造力的规模化(Scaling),压缩从创意到产业的链路,而驾驭智能体实现规模化创造将成为未来组织的核心竞争力[5][6] 智能体时代的企业挑战与机遇 - 传统企业的成长和创新能力是线性、渐进式的,而智能体时代正在飞速压缩“从Idea到Industry”的链路[6] - 企业在实现智能体规模化落地时面临四大核心困境:生产级效果难实现、稳定可靠运行难保障、建设与业务成本难控制、商业化落地难闭环[8] - 解决上述问题,弥合基础设施与智能体发展需求之间的鸿沟,是帮助企业级智能体完成从创造力到生产力进化的关键[8] 无问芯穹智能体服务平台的核心能力 - 平台提供开箱即用的Agent能力模板和稳定可靠的托管服务,并与底层算力及模型基础设施深度链接,提供全链路陪伴式落地服务[9] - **生产效果优化**:平台内置包括代码、研究和多模态等5种以上的Agent能力模板,将行业知识模板化,使中小企业能复用大型客户的经验[11] 同时,平台以Day0级的前沿模型追踪力,为客户动态适配最佳模型方案,并通过定制化工具调用、提示词优化等技术提升应用效果[11] - **稳定性与可靠性保障**:依托遍布全国的算力储备,平台提供稳定托管服务[13] 通过弹性扩缩容与自动化排障,千卡集群模型服务稳定性高达99.5%,并将百毫秒级的沙箱调度速度提至十毫秒级,领先行业水平50%以上[13] 平台提供可观测大盘,支持企业对智能体全链路数据100%的追踪[13] - **业务成本控制**:平台汇聚并实时更新20+主流、前沿优质大模型,并长期针对顶尖开源模型进行深度推理优化[15] 针对千亿、万亿参数规模模型,平台采用大规模PD分离方案服务线上业务,相比传统模式,推理效率提升3~5倍[15] 基于全栈式软硬件协同优化能力,平台支持模型定制与系统级调优,在性能与成本间寻得最优解[15] - **商业化落地提效**:平台通过支持接入丰富的工具集,帮助减少70%以上的Agent工具集成与冗余劳动[17] 平台将复杂业务流程封装为独立业务模块以支持版本管理,并提供微信、飞书、小红书等第三方裂变与支付渠道的快捷接入,系统性补足工具链、升级链与推广链的断点[17] 平台应用案例与价值验证 - 无问芯穹与某运维服务企业共研共建了企业系统开发智能体“SysCoding Agent”,允许通过自然语言对话创建、修改并托管各类业务系统[19] - 该智能体在首轮生成中,产出内容的主流程完整性大于95%,规范遵从度超过90%,且堵塞性bug发生率低于3%[21] 仅需1人投入1周时间,即可完成1个生产级系统的开发与上线,单系统建设成本最低只要5元[21] - 类似的智能体生产力兑现正在求职、旅游、教育等多个行业同步发生,平台正以更高性价比和可规模化的模式,帮助各行业客户实现技术能力向业务价值的转化[23] 公司愿景与未来方向 - 无问芯穹致力于成为企业智能体转型的长期伙伴,助力各行业将组织知识转化为可持续的价值产出与原生动力,定义下一代生产新范式[25] - 未来,公司将继续以Agentic基础设施支撑数字与物理世界的智能体应用效能突破,并通过产学研协同,构建智能体创新的“产业链+创新链”闭环,让智能体成为各行各业创造力Scaling的最强加速器[27]
用企业级智能体落地,还有谁没踩这四种大坑?无问芯穹的系统性解法来了
量子位· 2025-12-16 11:52
衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 最近和几家公司的技术负责人闲聊,兜兜转转都会聊到Agent话题。 给出的反馈几乎一致:智能体确实已经嵌进了不少工作流,但实际水平,最好也就是个实习生水平。 能做些自动化处理,偶尔还能让团队眼前一亮。但很多团队还是会下意识地把它排除在主要职责之外。 用是会用,说完全放心肯定谈不上 。 更别提把它当成自己团队可信赖的数字员工了。 与此同时,行业的关注重心已经发生转移,仅依靠模型性能领先,已无法支撑AI应用的企业级落地,工程红利和场景红利开始上桌。这堪称AI 行业在2025年最大的心态变化之一。 然而整体落地情况并不顺利,真正能在生产环境稳定运行、持续产生价值的智能体项目数量,比预期少得多。 几乎每一家企业都踩过好几个共性很强的坑。 最先暴露的是效果问题 。 智能体使用起来,模型选择、提示词、检索链路、工具调用逻辑……每一个环节都有可能成为影响效果的因素。 即使一开始表现不错,随着业务更新或数据变化,效果也常常出现衰减。 在这样的背景下,无问芯穹给出了版本答案: 无问芯穹智能体服务平台 。 这个平台旨在帮助企业应对智能体落地过程中会反复遇到的一系列问题,包括从0 ...
无问芯穹首曝智能体服务平台,以基础设施加速企业级「智能体自由」
机器之心· 2025-12-16 10:22
核心观点 - 智能体(Agentic AI)是未来组织的核心竞争力,能够将企业从创意到产业的链路飞速压缩,实现规模化创造 [5] - 无问芯穹发布企业级智能体服务平台,旨在通过提供全链路服务,解决智能体生产级落地面临的四大核心困境,助力企业完成从创造力到生产力的进化 [3][7][9] - 该平台通过模板化能力、稳定托管、成本控制和商业化闭环等核心功能,帮助企业将智能体内化为原生动能,已在多个行业验证其价值 [10][11][14][16][19][23] 行业趋势与机遇 - 智能体时代,Agentic AI正在加速企业创造力的规模化(Scaling),使得“从Idea到Industry”的链路被飞速压缩 [5] - 未来每个企业都将走向智能代理化,企业内部将活跃10个、100个乃至1000个智能体,从而无限放大组织的创造能力,即使微小团队也能释放强大影响力 [1] 企业面临的挑战 - 企业在驾驭智能体实现规模化创造时面临高门槛,核心困境包括:生产级效果难实现、稳定可靠运行难保障、建设与业务成本难控制、商业化落地难闭环 [7] 无问芯穹智能体服务平台解决方案 平台定位与目标 - 作为面向智能体时代的战略级AI基础设施产品,致力于为企业提供从智能体定制优化、部署托管到商业化变现的全链路陪伴式落地服务 [3][9] - 目标是打造下一代生产力基座,加速企业完成从创造力到生产力的进化 [3] 核心功能与优势 1. 效果优化与快速启动 - 提供开箱即用的Agent能力模板,内置包括代码、研究和多模态等5种以上的模板,帮助智能体在从0到1阶段就拥有优秀基础效果 [10] - 将服务大型行业客户的经验沉淀为标准模板,赋能中小企业 [10] - 持续以Day0级的前沿模型追踪力,为客户动态适配最佳模型方案 [10] - 通过定制化工具调用、创新提示词优化等技术,进一步提升智能体应用效果 [10] 2. 稳定可靠的托管服务 - 依托遍布全国的算力储备,为每个智能体提供稳定可靠的托管服务 [11] - 系统韧性显著领先行业,千卡集群模型服务稳定性高达99.5% [11] - 将百毫秒级的沙箱调度速度提至十毫秒级,领先行业水平50%以上 [11] - 提供可观测大盘,支持企业对自身智能体全链路数据100%的追踪,保障安全运行与拓展迭代 [11] 3. 成本控制 - 与底层基础设施深度集成,依托完备的模型集成资源、强大的推理优化技术和全栈式软硬协同能力,灵活控制业务成本 [14] - 汇聚并实时更新20+主流、前沿优质大模型,并长期针对顶尖开源模型进行深度推理优化 [14] - 针对千亿、万亿参数规模模型(如DeepSeek、Kimi-K2-Instruct),采用大规模PD分离方案服务线上业务,相比传统模式推理效率提升3~5倍 [14] - 基于原生的全栈式软硬件协同优化能力,支持模型定制与系统级调优,在性能与成本间寻求最优解 [14] 4. 商业化闭环 - 针对智能体落地过程中的工具链、升级链与推广链断裂难题,提供系统性解决方案 [16] - 支持接入丰富的社区或自研工具集,帮助减少70%以上的Agent工具集成与冗余劳动 [16] - 将复杂业务流程封装为独立业务模块以支持版本管理与更新 [16] - 提供微信、小红书等第三方裂变与支付渠道的快捷接入,补足商业化断点 [16] - 以全链路陪伴式服务,帮助企业平滑跨越从产品实现到商业闭环的每一步 [16] 应用案例与价值验证 - 与某运维服务企业共研共建“SysCoding Agent”企业系统开发智能体 [19] - 该智能体首轮生成产出内容的主流程完整性大于95%,规范遵从度超过90%,堵塞性bug发生率低于3%,用户通过首次交互即可获得满足大部分需求的可用版本 [21] - 该智能体已稳定上线,轻松应对高峰期并发请求,实际应用中仅需1人投入1周时间即可完成1个生产级系统的开发与上线,单系统建设成本最低只要5元 [21] - 类似的生产力兑现正在求职、旅游、教育等多个行业同步发生 [23] - 平台正以更高性价比和可规模化的服务模式,为多种行业客户构建智能体服务,帮助企业将行业积淀与技术能力转化为长远业务价值 [23] 公司愿景与未来方向 - 致力于成为企业智能体转型的长期伙伴,以强大的智能体基础设施助力各行业将组织知识转化为可持续的价值产出与原生动力 [25] - 未来将继续坚定以Agentic infra支撑数字与物理世界的智能体应用效能突破与持续进化 [27] - 通过产学研协同,以生态连接构建智能体创新的“产业链+创新链”闭环,让智能体成为各行各业创造力Scaling的最强加速器 [27]
Codex负责人打脸Cursor CEO“规范驱动开发论”!18天造Sora爆款,靠智能体24小时不停跑,曝OpenAI狂飙内幕
AI前线· 2025-12-16 09:40
文章核心观点 - OpenAI的编程智能体Codex实现了爆发式增长,其成功不仅源于模型能力的提升,更关键的是构建了一个由模型、API和框架三层紧密咬合的系统,使其能够处理长时、复杂的编程任务,并深刻改变了软件开发的流程与效率 [2][6][27] - Codex的定位正从“被动工具”向“主动队友”演进,其最终目标是参与软件开发的完整生命周期,而不仅仅是编写代码,这代表了人工智能智能体的未来发展方向 [17][29][33] - 当前人工智能生产力提升的最大瓶颈并非模型能力,而是人类自身的输入与审查速度,解除这一瓶颈是迈向通用人工智能(AGI)的关键一步 [7][11][74] Codex的增长表现与市场影响 - 自2024年8月GPT-5发布以来,Codex用户增长**20倍**,每周处理**数万亿**tokens,成为OpenAI最受欢迎的编码模型 [2][21] - 在业务实战中表现惊人,例如帮助Sora团队在**28天**内从零开发并上线安卓应用,并登顶App Store排行榜 [5][11][55] - 内部使用显著加速开发,例如Atlas浏览器项目中,过去需**2-3名工程师花费2-3周**完成的功能,现在**1名工程师1周**即可完成 [56] Codex的产品演进与关键调整 - 早期产品(Codex Cloud)因采用远程异步交互方式而“太过未来”,对新手不友好 [6][11] - 关键拐点是将Codex从云端迁回本地,使其直接在工程师的IDE中工作,此举引爆了增长 [6][11][24] - 目前Codex被比喻为“聪明但不会主动的实习生”,写代码速度很快,但尚不能完全自主工作 [6][17] 三层系统结构:技术突破的核心 - Codex的能力飞跃源于模型、API和框架三层的共同优化与紧密整合,而非单一模型改进 [2][27][33] - 为支持长时任务(如连续运行**24到60多个小时**),团队设计了“压缩”机制:模型负责提炼关键信息,API承接任务链路,框架负责稳定运行 [2][11][27] - 公司对Codex有明确的技术主张(如在沙盒环境中仅使用shell),这避免了模型行为冲突,实现了快速迭代 [27][30] OpenAI的组织文化与运作方式 - 公司文化以“速度”和“野心”著称,迭代速度“闻所未闻”,其模式被概括为“先射击,再瞄准”(即先发布再根据反馈优化) [6][13] - 组织架构高度自下而上,汇聚了世界顶尖人才,个人动力与自主性极强,这是其高速发展的关键 [6][14] - 公司内部深度实践“dogfooding”(自产自用),Codex在过去一年显著加速了公司自身的工程进程 [25][56] Codex对软件开发流程的重塑 - 改变了工程师的工作内容:从享受编写代码的创造性过程,转向花费更多时间审查AI生成的代码 [11][42] - 推动了“聊天驱动开发”等新模式,智能体未来将更自然地融入团队的日常沟通流,而不仅依赖正式规范 [44] - 使角色边界模糊化,例如OpenAI的设计师现在可以编写并发布自己的代码,工程师仅在复杂环节介入 [11][54] 人工智能智能体的未来愿景 - 终极形态是成为“情境化助手”和“超级助手”,能够默认提供帮助,每天提供数千次协助,而不仅响应几十次指令 [18][33][34] - 编写代码被认为是人工智能完成任务的“通用方式”和“最自然、最高效的行动方式”,未来几乎所有强大的智能体都将具备编码能力 [11][36] - 智能体将通过编写代码构建可组合、可复用的能力,形成能够随团队成长而不断累积的知识体系 [37] 对行业与从业者的影响 - 人工智能不会取代工程师,但会改变工作性质,系统设计、架构理解和团队协作等能力将变得更加重要 [41][70] - 产品开发速度的极大提升,使得“深刻理解特定客户问题”比“擅长产品开发”更具竞争优势,垂直领域AI初创公司前景看好 [11][60] - 学习编程依然重要,但理由从“打字写程序”转向理解系统结构、具备判断力以及配置与协作AI智能体的能力 [70] AGI发展的视角与预判 - 当前限制AGI发展的主要因素不是模型能力,而是人类的输入速度、审查速度等多任务处理能力 [7][74] - 预判第一批生产力出现“曲棍球棒式”陡增的用户将在明年出现,其后的变化会加速扩散 [8][75] - 当增长曲线变得异常陡峭时,可能意味着已经站在AGI的门口 [8]