Workflow
Gemini 3
icon
搜索文档
中原证券晨会聚焦-20251226
中原证券· 2025-12-26 00:16
核心观点 报告认为,当前A股市场处于震荡上行格局,上证指数围绕4000点蓄势整固的可能性较大,市场风格在周期与科技之间轮动,中长期适合布局[7][8][9][11][12]。中央经济工作会议定调“重科技、强产业”,人工智能、商业航天、量子科技、6G等未来产业是明确的中长期方向[7][8][9][11]。多个行业正迎来景气拐点或结构性机会,包括动画电影、自动驾驶、锂电池、AI手机、半导体、化工及电力等[13][16][18][21][24][31][39][43]。 市场表现与宏观环境 - **国内市场**:截至2025年12月25日,上证指数收于3,959.62点,日涨幅0.47%,深证成指收于13,531.41点,日涨幅0.33%[3]。创业板指收于2,022.77点,日跌幅0.47%[3]。两市成交活跃,12月25日成交金额达19,441亿元,处于近三年日均成交量中位数区域上方[7]。 - **国际市场**:同日,美股主要指数下跌,道琼斯指数收于30,772.79点,跌幅0.67%,标普500指数收于3,801.78点,跌幅0.45%[4]。 - **宏观要闻**:离岸人民币汇率升破7.0大关,为2024年9月以来首次[5][7]。美国宣布对部分中国半导体产品加征301关税,目前税率为0%,计划于2027年6月提高税率[5][7]。TikTok已与三家投资者签署协议,将成立新的美国合资公司以确保在美运营[5][7]。 - **估值水平**:当前上证综指平均市盈率为16.19倍,创业板指数平均市盈率为49.94倍,处于近三年中位数平均水平上方,报告认为适合中长期布局[7]。 行业分析摘要 动画电影行业 - **市场地位跃升**:2025年动画电影票房占比近50%,截至12月24日总票房已超250亿元[13]。2025年度上映影片票房TOP10和TOP15中,动画影片票房占比分别达64.97%和62.77%[13]。 - **国产片崛起**:2019-2025年,国产动画电影票房占同期动画电影总票房的67.59%,远高于2013-2019年的32.28%[14]。2025年在《哪吒2》(票房154.46亿元)带动下,国产动画影片票房占比超77%[13][15]。 - **内容质量提升**:《哪吒之魔童闹海》、《罗小黑战记2》、《浪浪山小妖怪》豆瓣评分分别为8.4、8.7和8.5分,位列2025年评分最高华语电影第2-4名[15]。 - **投资建议**:国内动画电影已从边缘品类成长为中流砥柱,内容实现低龄向、全年龄向、成人向的多元升级[15]。报告建议关注在动画电影领域深度布局的光线传媒[16]。 汽车与自动驾驶行业 - **行业增长稳健**:2025年11月,汽车产销分别完成353.16万辆和342.90万辆,同比分别增长2.76%和3.40%,月度产量首次超350万辆创新高[17]。新能源汽车11月产销分别完成188万辆和182.3万辆,渗透率达53.16%,环比提升1.52个百分点[18]。 - **出口创新高**:11月汽车出口量达72.77万辆,创历史新高,同比增长48.45%[17]。 - **L3级自动驾驶商业化**:我国首批L3级有条件自动驾驶车型获得准入许可,标志着自动驾驶技术正式迈入商业化应用初期[18]。 - **投资建议**:报告维持行业“强于大市”评级,建议关注具备智驾技术创新优势的自主品牌车企,以及汽车智能化网联化核心零部件公司[18]。 锂电池行业 - **景气度向上**:2025年11月,锂电池板块指数上涨3.22%,强于沪深300指数[21]。同期我国新能源汽车销售182.30万辆,同比增长20.57%,月度销量占比达53.16%[21]。 - **动力电池装机量大增**:11月我国动力电池装机93.50GWh,同比增长39.14%,宁德时代、比亚迪和中创新航位居前三[21]。 - **投资建议**:报告结合行业景气度,维持锂电池行业“强于大市”投资评级,建议持续关注板块投资机会[21]。 通信与AI手机行业 - **行业表现强劲**:2025年11月,通信行业指数上涨1.44%,跑赢上证指数(-1.67%)、沪深300指数(-2.46%)等主要指数[24]。 - **电信业务与AI手机发展**:1-10月电信业务收入累计完成14,670亿元,同比增长0.9%[24]。2025年10月通讯器材类零售额同比增长23.2%[25]。Canalys预计2025年AI手机渗透率将达34%[25]。豆包AI手机(努比亚M153)已发布工程样机[25]。 - **光模块与算力需求**:25Q3北美四大云厂商资本开支合计达1,124.3亿美元,同比增长76.9%[26]。TrendForce预计2025年全球800G以上光收发模块达2,400万支,2026年将达近6,300万支,同比增长162.5%[26]。 - **投资建议**:报告维持通信行业“强于大市”评级,建议关注光芯片/光器件/光模块、AI手机及电信运营商等方向[27]。 半导体行业 - **行业处于上行周期**:2025年10月全球半导体销售额同比增长27.2%,已连续24个月同比增长[32]。WSTS预计2025年全球半导体销售额同比增长11.2%[32]。25Q3北美四大云厂商资本支出同比增长67%[32]。 - **存储器价格加速上涨**:2025年11月,DRAM现货价格指数环比上涨约52%,NAND Flash现货价格指数环比上涨约61%[32]。 - **谷歌AI产业链机会**:谷歌发布新一代大模型Gemini 3,其TPU系统采用光互连(ICI)和光路交换机(OCS)技术[33]。Gemini月活跃用户从2025年7月的4.5亿迅速增长至10月的6.5亿[33]。 - **投资建议**:报告看好谷歌AI产业链投资机会,建议关注光芯片、OCS、PCB、铜连接等领域[33]。 化工行业 - **景气寻底,边际回暖**:行业利润下滑态势逐步放缓,未来在供给约束加强和需求复苏驱动下,景气有望边际回暖[43]。 - **结构性机会**:报告建议关注三类机会:一是反内卷背景下供需格局有序的有机硅和涤纶长丝行业;二是受益储能需求增长的磷化工行业;三是受益双碳政策的生物燃料行业[44]。 - **投资建议**:报告维持行业“同步大市”评级,建议关注万华化学、卫星化学、宝丰能源等一体化龙头,以及上述结构性机会[45]。 食品饮料行业 - **板块反弹**:2025年11月,食品饮料板块录得反弹,预制食品、烘焙、乳品、肉制品延续涨势,白酒板块出现反弹[28]。 - **个股表现分化**:11月个股上涨比例达50%,上涨个股主要集中在预制食品、烘焙、乳业、零食和白酒等领域[29]。 - **投资建议**:报告推荐关注2025年12月软饮料、保健品、烘焙、酵母、复调及零食等板块的投资机会[31]。 电力及公用事业行业 - **用电量增长较快**:2025年10月全社会用电量8,572亿千瓦时,同比增长10.4%,其中充换电服务业以及信息传输、软件和信息技术服务业用电量增长较快[39]。 - **能源结构变化**:截至2025年10月底,我国风电、太阳能装机合计占比达46.1%,首次超过火电(占比40.4%)[40]。 - **投资建议**:报告维持行业“强于大市”评级,建议从长期视角关注盈利能力稳健的大型水电企业和部分高股息率的火电企业[42]。 重点数据与市场动态 - **活跃个股**:2025年12月25日,沪深港通前十大活跃A股包括工业富联(成交金额135.46亿元)、航天电子(115.88亿元)、中国卫星(102.41亿元)等[48]。 - **限售股解禁**:近期有多家公司有限售股解禁,例如萤石网络将于2025年12月29日解禁37,800万股,占总股本比例48.00%[46]。山外山将于2025年12月26日解禁8,676.21万股,占总股本比例27.15%[47]。
深度讨论 2026 年 AI 预测:最关键的下注点在哪?|Best Ideas
海外独角兽· 2025-12-25 12:04
最近我们 复盘 了去年「2025 AI Best Ideas」提出的 20 个关键预测,发现绝大部分关于技术方向与 格局演化的 AI 预测已经兑现。而站在当下看 2026 年这个关键时间节点,市场已经显现出了更明显 的分歧:Gemini 3 发布后,Google 能否保持长期领先?OpenAI 是否有机会在 2026 年实现逆转?在 AI 入口竞争中,是操作系统占优,还是超级 APP 更具潜力? 因此我们组织了一场「2026 AI Best Ideas」社群讨论,AI researchers、创业者、产品经理和一二级 投资人围绕 2026 年 AI 公司竞争格局、AI 应用与 Agent 形态、算力与 infra 瓶颈,以及 AI 在具体 行业中的落地路径等关键问题,展开了一次深入的讨论。 本篇文章并不是一份单一视角的年度判断,而是来自拾象 Best Ideas 社群集体讨论的精华开源。我 们希望它不仅是一份年度预测,更能帮助读者理解:AI 是一次真实且长期的生产力革命,在模型 厂商交替领先的格局中,真正的赢家不仅要关注技术实力,更要在高度不确定的环境中实现长期价 值。 ⬇️ 滑动或点击查看大图 ⬇️ 讨论主 ...
Why the AI rally (and the bubble talk) could continue next year
The Economic Times· 2025-12-25 03:57
AI对经济与市场的宏观影响 - 2025年AI投资可能占美国上半年GDP增长的一半[2] - 2025年AI技术以新的强大方式改变了市场和全球经济[1] - 政策层面将AI优势作为商业议程支柱 并警告监管机构不得拖慢该行业发展[2] 市场表现与估值动态 - 截至2025年12月中旬 晨星全球下一代人工智能指数上涨约40% 涨幅是科技股为主的纳斯达克综合指数的两倍[17] - 2025年10月下旬 英伟达成为历史上首家市值达到5万亿美元的公司[5] - 所谓的“科技七巨头”在2025年12月中旬占标普500指数总市值的34%[17] - 德意志银行年度调查显示 57%的受访者认为对AI热情的减弱和科技股估值下跌是牛市的最大威胁[17] 关于“AI泡沫”的争论 - 有观点认为 历史上所有变革性技术都伴随资产泡沫 AI也不例外[1] - 德意志银行策略师指出 至少存在估值、投资和技术三个层面的泡沫迹象 但目前仍处于早期阶段[5] - 晨星高级分析师认为目前不存在AI泡沫 2026年也不太可能出现 因为需求仍超过供应[11] - 与互联网泡沫时期不同 AI芯片的高成本和快速迭代可能抑制企业过度投资[10] 基础设施投资与挑战 - 为支持AI发展 数据中心建设热潮已对地方资源造成压力并引发债务驱动的支出狂潮[6] - 科技巨头已同意在未来几年投入总计约5000亿美元租赁数据中心 其中甲骨文一家就承诺了2480亿美元[9] - 国际能源署预测 到2030年美国数据中心的电力消耗将比去年总量增加一倍以上[7] - 电力需求推高了日常用电成本 并可能成为中期选举的主要议题[7] - 谷歌母公司Alphabet以47.5亿美元全现金收购清洁能源开发商Intersect Power 旨在为其数据中心供电[8] 行业领先公司:OpenAI - ChatGPT拥有约8亿活跃用户 但只有一小部分是付费用户[12] - OpenAI首席执行官表示 公司年化收入运行率在年底有望达到200亿美元[12] - 公司已承诺在未来八年投入1.4万亿美元建设数据中心[12] - 2024年3月 SoftBank领投的一轮融资使其估值达3000亿美元 10月的最新融资估值达5000亿美元[13] - 据报道 OpenAI正在洽谈一轮1000亿美元的融资 估值可能达8300亿美元 并可能在2027年进行IPO[13] 竞争格局与技术发展 - 谷歌的Gemini 3在行业基准性能测试中排名已超过ChatGPT[14] - 竞争对手Anthropic专注于企业应用 其最新版Claude聊天机器人可在极少监督下自主工作30小时[14] - 中国初创公司DeepSeek和阿里巴巴的Qwen等开源AI模型正吸引一批初创公司基于其架构进行开发[14] - 分析师指出 AI在机器人和智能体AI领域可能成为游戏规则改变者[5] - 技术以指数级速度进步 而人类以线性速度采用 但预计2026年AI将开始取代某些工作岗位 硅谷以外的公司将开始收获效率提升的回报[15]
中国大模型团队登Nature封面,刘知远语出惊人:期待明年“用AI造AI”
36氪· 2025-12-25 01:24
过去半个世纪,全球科技产业的资本开支与创新节奏,都和一个规律紧密相连,那就是摩尔定律——芯片性能每18个月翻一番。 在摩尔定律之外,还有一个"安迪-比尔定律",它讲的是,摩尔定律所主导的硬件性能提升的红利,会迅速被软件复杂度的增加所抵消。安迪指的是英特 尔前CEO安迪·格鲁夫,而比尔,指的是微软创始人比尔·盖茨。 这种"硬件供给、软件消耗"的螺旋上升,驱动了PC与互联网时代的产业进化。 时移世易,安迪、比尔都已经退出产业一线,但是规律的底层逻辑并未改变,而且被新的"安迪·比尔"推向更高的极致。 ChatGPT的爆发拉开了生成式人工智能时代的大幕,在Scaling Law(规模法则)的主导下,模型参数指数级膨胀,软件对算力的索取远超摩尔定律的供给速度, AI发展的边际成本急剧上升。 当硬件供给遭遇能源、数据等天花板时,旧的"安迪比尔"式增长范式开始失效。 产业需要一场逆向革命。大模型作为AI时代的"软件",需要通过极致的算法与工程化重构,在现有硬件上爆发更强的能力。 2025年,中国大模型公司成为这一路径的最坚定实践者。 从DeepSeek V3通过细粒度混合专家(MoE)架构以1/10算力成本对标顶尖模型,到 ...
被AI改写的“美国梦”
吴晓波频道· 2025-12-25 00:29
点击按钮▲预约直播 " 如今的 AI 巨头们各有分工,英伟达们埋头造芯片, OpenAI 们专注修炼 大模型 ,微软和亚马逊的云业务部门当起 AI 房东,将 GPU 数据中心租给 AI 公司使用。大家 各司其职,互有竞争与合作。而谷歌是一个稀有的全栈自研玩家。 " 文 /巴九灵(微信公众号:吴晓波频道) 蜜月 特朗普喜欢在他的社交账号上使用AI。 一张合成的照片中,他打扮成了教皇。一个合成的视频里,他身处白宫,冷眼旁观特工逮捕前总统奥巴马。夏天美国人游行抗议时,他还发了个伪 造的视频,总统先生坐在战斗机里,向抗议者们倾倒粪便。 2025年,美国的AI巨头们继续卷算力、卷参数,比拼谁家模型更聪明,技术的进步,已经能搞出以假乱真的视频和语音。内容创作成本的降低, 带来的一个后果,就是升级了特朗普的政治宣传武器。他可以更轻松直观地抹黑对手、自我加冕与歌颂、传播其政治主张。 另外一个后果,就是垃圾的批量化生产。韦氏词典和《经济学人》选出的2025年度关键词是"slop"。"slop"并非新造词,其历史可追溯至15世 纪,原意为稀烂食物或泔水。而今,它成了AI生成内容的代名词:海量、平庸、毫无个性,正在堵塞互联网。 图 ...
Dwarkesh最新播客:AI 进展年终总结
36氪· 2025-12-24 23:15
AI发展现状与AGI时间线 - 以强化学习为核心的“中训练”正成为大型语言模型的重点突破方向,前沿科技公司正通过此方法将大量具体技能预先植入模型[3] - 当前对强化学习中训练的极度乐观态度与宣称AGI临近的观点存在根本矛盾,如果模型已接近类人学习者,这种基于“可验证结果”的训练路径是走不通的[14] - 为模型预置大量具体技能的做法,恰恰是AGI还很远的证据,因为如果模型泛化能力很强,就不需要单独构建那么多强化学习环境来教它操作特定工具[3][16] AI模型能力与泛化挑战 - 人类劳动力的价值在于其训练成本不笨重,能根据需要灵活掌握新技能,而当前AI缺乏稳健高效的方法来习得工作中大量需要的公司特定、情境特定技能[4][23] - 每天人类需处理上百件需要判断力、情境感知及工作中习得技能的事情,仅靠预置一组固定技能,连一份工作都无法完全自动化[24] - 在机器人等领域,根本问题是算法而非硬件或数据,人类只需很少训练就能远程操控硬件完成有用工作,这反衬出当前AI缺乏类人学习核心[19] AI经济扩散与市场潜力 - 企业有很强动机雇佣AI劳动力,因为经过验证的AI员工可以无损无限复制,且不存在招聘中的“柠檬市场”问题[5][29] - 当前AI未在企业广泛部署、未在编程外创造大量价值,本质是模型能力不足,而非技术扩散需要时间,所谓“经济扩散滞后”是为能力不足找借口[6][28] - 如果AI能力真达到AGI水平,其扩散速度会快得惊人,企业完全愿意每年花费数万亿美元购买token,因为知识工作者年总薪酬高达数十万亿美元[29] 技术演进路径与规模定律 - 预训练阶段的扩展定律非常清晰,算力数量级提升会导致损失函数稳定下降[10] - 但将预训练规模化的乐观经验移植到带可验证奖励的强化学习上缺乏依据,有研究指出,要强化学习获得类似GPT级别的提升,总算力规模可能需要提升到一百万倍[11][33] - 持续学习将是AGI之后模型能力提升的主要驱动力,预计前沿团队明年会发布持续学习雏形功能,但达到人类水平可能还需5到10年[13][40] 评估框架与未来影响 - 将AI模型智能与“中位数人类”对比会系统性高估其能创造的价值,因为知识工作的巨大价值来自最顶尖的一小撮人[12][35] - 一旦模型真正达到顶级人类水平,其影响力可能是爆炸式的,因为这意味着服务器上运行着数十亿个类人智能体,能复制、融合彼此全部学习成果[12][25] - 模型在“看起来很厉害”上的进步速度符合短时间线派预测,但在“真正变得有用”上的进展速度更符合长时间线派判断[32]
META's $75B AI Bet: Patience and Metrics for 2026 Investors
Youtube· 2025-12-24 17:20
Welcome back to Trading 360. I'm Marley Kaden. It's time now for the 360 round.For that, let's bring in our panel to discuss Meta and the year of this MAG7 name in 2025. Joining us today, Dave Nicholson, the chief research officer at Futurum, and Ali Moar Robbie, the senior equity analyst at West End Capital Management. Appreciate you both taking the time to be with us today.Dave, let's start with you. You know, when you look back at Meta and the year that they've had in 2025, what sticks out to you most. U ...
谁还敢说谷歌掉队?2025年,它打了一场漂亮的翻身仗
机器之心· 2025-12-24 09:30
公司核心AI战略与年度表现 - 公司在2025年通过一系列里程碑式发布,成功扭转了此前在AI大模型领域“掉队”的舆论印象,证明其AI能力已从聊天机器人进化为能写代码、做科研、攻克科学难题的“合作伙伴”[1] - 公司展现了强大的“系统性工程能力”,在算力、模型、应用各层面实现突破,利用其全栈生态完成了补课与追赶,在AI竞争转向产业链落地的下半场展现出核心竞争力[51] AI模型进展 - **旗舰模型Gemini 3**:于11月正式发布,被视为公司目前的巅峰之作,在模型推理、多模态理解及运行效率上实现实质性跨越[10] - **逻辑推理**:Gemini 3 Pro在Humanity‘s Last Exam测试中取得37.5%的准确率(无工具),使用搜索和代码执行后提升至45.8%[12] - **数学能力**:在MathArena Apex测试中以23.4%的准确率刷新纪录[10] - **多模态理解**:在MMMU-Pro测试中达到81.0%的准确率[12] - **代码能力**:在LiveCodeBench Pro测试中获得2439的Elo评分[12] - **高性价比模型Gemini 3 Flash**:于12月发布,其综合质量超越前代Gemini 2.5 Pro,但成本大幅降低,输入价格为每百万token 0.50美元,输出价格为每百万token 3.00美元[13][14] - **开源模型Gemma 3**:实现从纯文本到多模态的转型,成为开发者在本地部署高性能AI的首选工具之一,特别是8月发布的Gemma 3 270M参数模型,以极小规模提供超高效率[15] 硬件与算力突破 - **第七代TPU Ironwood**:于4月发布,专为推理时代设计,单芯片内存带宽达7.2 TB/s,显存容量达192GB,峰值计算能力达4614 TFLOPs[33] - **集群算力**:每个Pod扩展至9216块芯片时可提供42.5 exaflops的AI算力,远超全球最快超级计算机El Capitan的1.7 exaflops[33] - **生产目标**:计划到2027年实现年产500万颗TPU的目标,已获得如Anthropic等客户超过100万颗的预订[34] - **量子计算**:Quantum Echoes(量子回声)算法于10月登上《Nature》,在量子处理器上实现首次可验证的量子优越性,能以比最快超级计算机快13000倍的速度解决特定问题[31] 产品与应用重构 - **AI Agent与协作**:推动AI从辅助工具向“核心效能”跨越,通过在全线产品注入Agentic能力,重新定义人机协作[18] - **软件开发**:11月发布的Google Antigravity将开发流程从“工具辅助”升级为“智能体协作”[18] - **搜索**:3月扩展AI Overviews并引入全新AI Mode,重塑信息获取与处理方式[20] - **硬件终端**:8月发布的Pixel 10深度整合AI原生功能,成为最智能实用的手机[20] - **研究助手**:11月NotebookLM加入Deep Research功能,进化为专业级智能研究助手[20] - **创意生成与媒体** - **视频生成**:5月发布的Veo 3首次实现原生音频生成,终结AI视频“默片时代”;10月Veo 3.1版本提升物理一致性并强化“首尾帧控制”功能[22] - **图像生成**:8月Nano Banana以高指令遵循能力解决细节丢失问题;11月Nano Banana Pro引入“深度思考”模式,实现高保真文字渲染与专业级构图[23] - **机器人技术** - **Gemini Robotics**:3月推出,通过融合视觉、语言和动作模态,首次实现“感知-决策-动作”全闭环操作[37] - **Gemini Robotics 1.5**:9月发布,初步具备类人思考规划能力,通过ER模型与VLA模型协作[37] - **边缘部署**:6月发布Gemini Robotics On-Device,让VLA模型完全离线运行在机械臂和人形机器人上,并配套开放SDK[39] 科学研究突破 - **生命科学与医疗** - **AlphaFold**:迎来五周年,已为超过2亿个蛋白质预测结构,助力全球300多万名研究人员,并因此荣获2024年诺贝尔化学奖[26] - **AlphaGenome**:发布基因组理解模型,可同时处理多达1兆碱基对的高分辨率DNA序列[28] - **DeepSomatic**:利用卷积神经网络以极高精度识别癌症相关遗传变异,助力精准医疗[28] - **Cell2Sentence-Scale 27B**:基于Gemma的270亿参数模型,用于单细胞分析,帮助发现新的潜在癌症治疗途径[48] - **数学与逻辑推理** - **Gemini Deep Think**:在第66届国际数学奥林匹克(IMO)中以35分(总分42分)达到金牌表现,解决6道难题中的5道[29] - **Gemini 2.5 Deep Think**:在2025年国际大学生程序设计竞赛(ICPC)总决赛中达到金牌水平,在12道题目中解出10道[29] - **科学发现工具** - **AlphaEvolve**:基于大模型的编程智能体,用于寻找和验证理论计算机科学中的复杂组合结构,在验证过程上实现1万倍加速[28] - **AI co-scientist**:基于Gemini 2.0构建的多智能体协作系统,能独立生成研究假设、设计实验方案并撰写研究提案[29] 世界模型与模拟 - **Genie 3**:被视为世界模型的新高峰,首次将实时交互、长期一致性和语言可控性合成在同一个生成式系统中[41] - **性能**:以每秒24帧、720p的边生成边交互方式运行,具备长达几分钟的空间记忆[41] - **意义**:有望成为智能体训练环境、内容生产工具及科学模拟沙盒,为通往通用智能提供可交互、可长期演化的模拟路径[42] 社会影响与垂类应用 - **气候**:洪水预警系统已覆盖150个国家、20多亿人口;天气预报模型WeatherNext 2速度是以前的8倍,可做到按小时预测[45] - **教育**:在Gemini AI中推出“Guided Learning”功能,通过提问、步骤讲解等方式帮助深入理解知识;打造融入学习科学原理的生成式AI模型LearnLM;基于Gemini增强翻译与实时语音对话翻译能力[52]
大模型“缩放定律”悖论:RL(强化学习)越强,AGI(通用智能)越远?
硬AI· 2025-12-24 08:10
文章核心观点 - 知名科技博主Dwarkesh Patel提出,当前AI行业过度依赖基于可验证奖励的强化学习路径,通过耗费巨资为模型“预制”特定技能,这恰恰证明当前大模型缺乏人类般的通用学习能力,距离真正的通用人工智能仍很遥远 [2][3][4] - 通往AGI的真正关键驱动力在于“持续学习”能力,即模型能够像人类一样从经验和反馈中自主学习,而非依赖预先排练好的脚本,这一能力的完善可能需要5到10年甚至更长时间 [4][9][29] 对当前AI发展路径的批判 - **技能预制的悖论**:顶尖AI实验室正耗费数十亿美元,通过强化学习在模型中“预烘焙”或“预制”如操作Excel、浏览网页等特定技能,这种做法本身与AGI应具备的通用学习能力相矛盾,暴露了当前模型的根本缺陷 [3][5][11] - **机器人学问题的本质**:机器人技术普及的障碍本质上是算法问题而非硬件问题,如果拥有类人的学习能力,机器人早应普及,而无需在特定环境下进行百万次重复训练 [6][13] - **经济扩散迟缓的根源**:以“技术扩散需要时间”来解释AI未广泛部署是托词,根本原因在于模型缺乏产生广泛经济价值所必需的能力,如果模型真具备类人智能,其整合速度将远超人类员工 [7][19][20] AGI实现的关键瓶颈与未来展望 - **持续学习是关键瓶颈**:AGI的真正瓶颈在于“持续学习”能力,而非单纯的强化学习算力堆叠,真正的类人智能可能需要未来10到20年才能实现 [9][18] - **能力与市场收入的落差**:全球知识工作者每年创造数十万亿美元价值,而当前AI模型的收入与之相差数个数量级,这证明模型能力尚未达到替代人类知识工作者的临界点 [8][22] - **持续学习将渐进式发展**:解决持续学习问题不会是一蹴而就的单一成就,而会是一个渐进过程,类似于“上下文学习”能力的逐步演进,预计人类水平的“在岗学习”能力可能需要5到10年才能解决 [4][27][29] 对行业竞争与研发趋势的观察 - **强化学习扩展的悲观前景**:有分析指出,基于可验证奖励的强化学习可能需要在大约100万倍的总计算规模上进行扩展,才能获得类似于单一GPT级别的性能提升,这表明该路径的扩展效率可能很低 [25][26] - **行业竞争保持激烈**:模型公司之间的竞争预计将保持相当激烈,此前所谓的飞轮效应在拉开竞争差距方面收效甚微,单个实验室难以获得失控的领先优势 [30]
谷歌2025「复仇爽文」大结局,从至暗时刻到王者归来
36氪· 2025-12-24 03:01
公司年度表现与战略定位 - 公司在2025年上演了从被外界质疑到重回巅峰的逆转,年底通过Gemini 3和Nano Banana的组合拳实现了降维打击[1] - 公司AI业务在2025年实现了全面突围,将科研变为现实,并在八大领域秀出肌肉[4][5] - 公司通过涵盖底层芯片、核心模型到顶层应用的成绩单,宣告其已重回令对手窒息的领先地位[34] 核心模型进展与性能 - 公司于11月发布了迄今为止最强大的AI模型Gemini 3,具备前所未有的多模态推理能力,彻底解决了推理能力瓶颈[5][66] - Gemini 3在多项基准测试中表现卓越:在“人类终极考试”基准测试中,Gemini 3 Pro和Flash版本在使用工具后分别达到45.8%和43.5%的准确率[6] - 在科学知识测试GPQA Diamond中,Gemini 3 Pro和Flash分别达到91.9%和90.4%的准确率[6] - 在数学测试AIME 2025中,Gemini 3 Pro在使用代码执行后达到100%准确率,Flash版本达到99.7%[6] - 在多模态理解测试MMMU-Pro中,Gemini 3 Pro和Flash分别达到81.0%和81.2%的准确率[6] - 在具身智能编码测试Terminal-bench 2.0中,Gemini 3 Pro和Flash分别达到54.2%和47.6%的成功率[6] - 公司于12月推出了专为速度打造的Gemini 3 Flash,在保持高性能的同时极大降低了响应延迟[67][68] - 模型定价具备竞争力:Gemini 3 Flash的输入和输出价格分别为每百万token 0.50美元和3.00美元[6] 开发者工具与平台 - 公司推出了颠覆软件开发的Google Antigravity,这不再是简单的代码补全工具,而是真正的智能体[7][8] - 公司发布了开源AI智能体工具Gemini CLI,允许开发者在命令行中直接调用Gemini构建智能体[59] - 公司向所有开发者免费提供了Gemini Code Assist编程助手,降低了开发门槛[45] - 公司面向开发者开放了Gemini 3的API,邀请全球开发者基于新模型构建应用[66] 创意与媒体生成工具 - 公司在生成式媒体领域取得突破,Nano Banana Pro和Veo 3.1让图像编辑和视频生成进入专业级时代[9] - 公司推出了由Veo 3驱动的AI电影制作工具Flow,提供好莱坞级别的视频生成和编辑能力[58] - 公司发布了图像生成模型Imagen 3的增强版,在细节和文字渲染上达到新高度[57] - 公司将Nano Banana轻量级图像模型集成到搜索、NotebookLM和相册等多个产品中[65] 科学研究与突破 - 公司的AlphaFold团队在2025年迎来五周年,其贡献助力相关科学家斩获诺贝尔奖[13] - 公司员工Michel Devoret在2025年荣获诺贝尔物理学奖[15] - 公司分享Gemma模型帮助发现了癌症治疗的新路径,展示了开源模型在生物医学领域的科研价值[65] 硬件与基础设施 - 公司发布了首款专为“推理时代”打造的TPU Ironwood,大幅提升AI推理效率[53] - 公司利用AI设计AI芯片,通过AlphaChip设计方法实现了软硬一体的能效和算力优势[19][22][24] - 公司正式发布了Pixel 10系列手机,搭载最新TPU芯片,是首款为“全天候AI”设计的终端设备[63] 具身智能与机器人 - 公司发布了Gemini Robotics 1.5和Genie 3,标志着通用世界模型的新前沿,让AI能够理解和操纵物理世界[23][27] - 公司推出了Gemini 2.5 ComputerUse模型,该模型可以像人一样查看屏幕、移动光标并执行复杂操作[65] 产品集成与用户体验 - 公司在搜索中首次推出AI模式,处理复杂查询并提供深度解答[46][49] - 公司将Gemini 3 Flash集成到全球搜索中,为用户提供瞬间生成的AI智能摘要[69] - 公司在Android 16操作系统中深度集成AI,提升系统流畅度与个性化体验[59] - 公司为Pixel用户通过软件更新推送最新的AI功能[63] - 公司将最先进的Gemini翻译能力引入谷歌翻译,实现同声传译级别的实时翻译效果[72] 行业应用与影响力 - 公司最新的Weather Next 2模型能以惊人精度预测天气,其洪水预报覆盖了全球20亿人[29] - 公司在购物中引入AI模式,支持利用生成式AI进行虚拟试衣[58] - 公司推出了AI驱动的航班搜索工具FlightDeals,智能预测票价趋势[63] - 公司发布了AI驱动的网络安全防御系统,利用大模型实时检测并防御复杂网络攻击[55] - 公司推出了Google Earth AI,这是最先进的地理空间AI模型[31] 安全与责任框架 - Gemini 3被称为公司迄今为止最安全的模型,通过了最全面的红队测试和安全评估[33] - 公司在提升模型能力的同时,持续升级工具链、资源体系与安全框架,以预见并降低潜在风险[33]