Workflow
Artificial Intelligence
icon
搜索文档
深圳计算科学研究院首席科学家樊文飞:大模型具有缺陷 并非AI发展的必经之路
新浪财经· 2025-12-21 08:03
专题:2025年深圳香蜜湖金融年会 2025年12月20-21日,第二届"深圳香蜜湖金融年会"将在深圳市福田区隆重举行,本届年会以"识变局, 开新局——促进粤港澳大湾区科技-产业-金融良性循环"为主题。深圳计算科学研究院首席科学家、中 国科学院外籍院士樊文飞出席并发表关于人工智能技术发展的见解,指出AI发展单一性路径的隐忧。 专题:2025年深圳香蜜湖金融年会 2025年12月20-21日,第二届"深圳香蜜湖金融年会"将在深圳市福田区隆重举行,本届年会以"识变局, 开新局——促进粤港澳大湾区科技-产业-金融良性循环"为主题。深圳计算科学研究院首席科学家、中 国科学院外籍院士樊文飞出席并发表关于人工智能技术发展的见解,指出AI发展单一性路径的隐忧。 樊文飞指出,当前被视为主流的大模型(基于统计机器学习)存在一系列难以克服的根本性缺陷:可解 释性差、存在"幻觉"、在准确性、公平性与稳定性三者间难以兼得、逻辑表达能力有限,且严重依赖海 量数据。他引用国际学界共识及《自然》杂志近期论文指出,大模型并非AI未来发展的唯一或必经之 路。 同时,他回顾了AI发展的两条历史路径:基于符号的逻辑推理(如IBM DeepBlue ...
冲刺“全球大模型第一股”,智谱靠什么?
贝壳财经· 2025-12-21 07:32
在以"全球大模型第一股"为终点线的赛跑中,来自北京的智谱率先迈出了一步。 12月19日,港交所官网公布北京智谱华章科技股份有限公司(下称"智谱")聆讯后资料集,智谱IPO的进度条再次刷新。 智谱招股书披露,根据弗若斯特沙利文的资料,2024年,智谱的收入在中国独立通用大模型开发商中排名第一,在所有通用大模型开发商中位列第二,市场 份额占到6.6%;截至2025年6月30日,智谱累计为超过8000家机构客户提供大模型服务。 不过,该招股书也显示,自2019年成立以来,智谱"烧钱"状况也愈演愈烈,收入连年稳步增长的同时,亏损也逐年扩大。尤其是智谱在2023年亏损7.88亿元 后,2024年亏损直接"增长了一个数量级"至29.58亿元。 智 谱主要财务数据对比 新京报贝壳财经记者张晓慧根据招股书制作 从营收方式来看,智谱通过其一体化MaaS(模型即服务)平台提供大模型服务获取收入,根据客户需求提供本地化部署和云端部署两种部署方式。 招股书显示,智谱本地化部署与云端部署所带来的收入比重经历过较大变动。2024年以前,本地化部署一直是智谱收入的绝对主力,2022年,本地化部署收 入占其当年收入的95.5%;2023年为 ...
智能眼镜成“无感偷拍”工具,清洗AI标识黑灰产隐现
南方都市报· 2025-12-21 06:32
"安全是最大的豪华。"何延哲抛出这句出自新能源汽车圈的口号,提醒AI行业的从业者:在安全问题上 稍有失足,有可能导致满盘皆输。 何延哲来自中国电子技术标准化研究院,长期关注网络安全。他在12月18日南都"第九届啄木鸟数据治 理论坛"上表示,安全性的价值在于,把好用的AI产品变得让公众敢用。 2025年,AI加速向物理世界渗透。从可以拍照和"看一下支付"的AI眼镜,到能够自主点外卖的AI手 机,再到准备去工厂、进家庭的具身智能机器人,AI应用落地的想象空间被打开。 当许多人沉浸于技术变革带来的新奇感时,一些网络安全的从业者则追问和验证:炫酷的AI产品究竟 安全可靠吗? 12月18日,南都"第九届啄木鸟数据治理论坛"的圆桌讨论环节。图:南都 具身智能安全防护机制"千疮百孔" 对AI硬件产品的安全测试结果并不乐观。 网络安全研究机构DARKNAVY·深蓝的肖轩淦提到,利用安全缺陷,植入攻击代码,就能让一款市面上 热门AI眼镜变成"无感偷拍"的工具。部分眼镜的"看一下支付"功能,基于采集用户语音并通过声纹匹配 来核验转账。但如果攻击者利用智能眼镜的安全缺陷,取得其完全控制权,可能可以窃取并伪造用户声 纹,暗中完成转账 ...
深度|DeepMind CEO Demis: AGI还需5-10年,还需要1-2个关键性突破
搜狐财经· 2025-12-21 06:05
公司战略与核心优势 - 公司将其独特优势归结为将世界级的研究、工程能力和基础设施三者结合 在AI前沿领域 同时具备这三者的机构非常少 [8] - 公司采用科学方法作为核心思维方式 并将其应用于研究、工程乃至商业领域 这构成了其工作的严谨性与精确性的来源 [7][8] - 公司在发展路径上保持务实 会追随实证证据的指引 例如在看到scaling laws显现效果后 逐步将更多资源投入到该研究路径上 [27][28] 产品与技术路线图 - 公司的核心基础模型Gemini从一开始就是多模态的 能够同时处理图像、视频、文本和音频 并越来越多地生成这些类型的输出 [10] - 接下来12个月的重点方向包括:多模态能力融合取得显著进展、视频能力与语言模型融合产生有趣的能力组合、以及开发更可靠的基于Agent的系统 [10] - 公司的长期愿景是将Gemini打造成“通用助手” 使其出现在更多设备上 并成为用户日常生活结构的一部分 提升工作效率和改善个人生活 [11] - 最新发布的Gemini 3模型在推理深度、细腻度以及“性格”上表现出色 能够简洁直接地回答 并在观点不合理时温和提出异议 [24] - Gemini 3展现出对高层次指令的深度理解能力 以及生成高度细节化输出的能力 在前端开发、网站构建和一次性生成游戏方面表现突出 [25][26] - 公司有一个名为Genie 3的“世界模型”或交互式视频模型 用户可以在生成的视频中“行走” 并在一分钟内保持整体一致性 [10] 行业竞争格局 - 在AI领域 美国和西方整体在基准测试和最先进系统方面仍处于领先地位 但这种领先优势可能仅以“月”为单位 而非“年” [21] - 中国在AI领域并未落后太多 拥有出色的模型和有能力的团队 但在算法创新和原创性方面 西方目前仍然具有优势 [21] - AI行业正经历一场可能是科技史上最激烈的竞争 [8] - AI产业某些部分可能存在泡沫 例如一些规模极其夸张的早期融资 但从长期看 AI被认为是人类历史上最具变革性的技术之一 投入将被证明是值得的 [31] - 行业人才争夺战相当激烈 但最优秀的科学家和工程师希望参与最前沿的工作 持续的技术领先地位将形成吸引力正反馈 [31] 通用人工智能发展预测 - 通用人工智能可能还需要五到十年的时间才能实现 [6][29] - 对AGI的标准设定很高 要求系统能展现出人类所具备的全部认知能力 包括发明和创造能力 并在各个维度上具备一致性 而非当前“锯齿状”的智能形态 [29] - 实现AGI可能不仅需要将现有系统的scaling能力推到极限 还需要一到两个类似Transformer或AlphaGo的范式级关键突破 [29][30] - 当前系统缺乏一些关键能力 如持续学习、在线学习、长期规划和推理能力 这些能力最终会具备 但可能需要关键性突破 [6][29] 技术应用与市场潜力 - AI在网络安全领域的应用受到高度重视 旨在用AI强化防御体系以应对网络威胁 [17] - 在商业和企业领域 随着AI变得重要 企业客户会对Agent的行为保障提出明确要求 这可能会自然地奖励那些更负责任的供应商 [18] - AI在体育领域有巨大应用潜力 因为体育拥有丰富数据并追求极致精英表现 例如AI可以优化角球进攻中球员的精确站位以增加头球进球 [35][36] - 多模态理解能力 尤其是视频理解能力被严重低估 例如Gemini能够对视频内容进行概念层面的理解和哲学解读 [22] - 像Gemini Live这样的功能 允许用户用手机摄像头对准物体获得实时协助 其多模态能力的强大尚未被充分认识 [23] 技术发展现状与挑战 - 目前基于Agent的系统还不够可靠 无法独立完成完整任务 但预计一年后会开始看到接近这一能力水平的Agent出现 [10][12] - 创新和进步的速度非常快 以至于模型的创造者可能都来不及探索现有系统十分之一的潜力 用户常常将模型能力发挥到远超内部测试的程度 [27] - 随着AI系统变得更复杂和更具自主性 存在偏离最初设定指令或目标的空间 如何确保其始终保持在安全边界内是一个活跃的研究领域 [18] - 存在AI被恶意行为者滥用的风险 例如制造病原体或对关键基础设施发动网络攻击 这是必须严密防范的场景 [15][16][17]
LeCun离职前的吐槽太猛了
量子位· 2025-12-21 05:45
一水 鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 好一个一吐为快! 年底就要正式离开Meta的LeCun,这下真是啥都不藏了。 不看好大语言模型能通往AGI,他就言辞犀利地指出: 通往超级智能之路——只需训练大语言模型,用更多合成数据训练,雇佣成千上万的人在后训练中"教育"你的系统,发明强化学习的新 花招—— 我认为这完全是胡说八道。这根本行不通 。 看不惯即将成为"前任"的Meta的封闭作风,他也直言不讳: Meta正在变得更加封闭……FAIR被推动去从事一些比传统上更偏向短期的项目。 而且还顺带剧透,自己将要创办的新公司仍会继续坚持开放。 以上内容来自LeCun最新参与的一档播客节目。在接近两小时的对谈中,他主要回答了: 总结起来就是,不管是在Meta接近12年的研究经历,还是接下来要创办的新公司,抑或是未来想要实现的AGI,通通都在这里了。 为什么硅谷对扩展语言模型的痴迷是一条死路? 为什么AI领域最难的问题是达到狗的智能水平,而非人类的智能水平? 为什么新公司选择构建在抽象表示空间中进行预测的世界模型,而非直接生成像素的模型? …… 人生下一程:创办新公司AMI 告别工作十二年的老东家,Le ...
骗了全网流量的“吃豆包”图背后:AI虚拟内容传播怎么治?
南方都市报· 2025-12-21 05:08
12月19日,一张"阿里千问全员会"图片在网络流传,图中疑似阿里千问员工聚集在广场上手举豆包,广 场一侧有"干死豆包"标语。相关信息迅速扩散,随后阿里千问官方微信公众号辟谣,确认图片为AI生 成,并调侃"大家都是干AI的,相煎何太急"。该事件再次让AI伪造图的传播隐患与治理难题进入公众视 野。 AI伪造图片乱象频发 网传图片显示"阿里千问全员会"现场,员工身着统一服装高举豆包,背景标语为"干死豆包",并传言员 工现场"掰开豆包吃掉"以表决心。图片因涉及阿里巴巴旗下"千问"与字节跳动旗下"豆包"两款AI应用的 竞争关系,迅速引发热议。 阿里内部人士及千问官博当天回应称图片系AI伪造,指出多处细节错误:工牌、千问LOGO设计是错 的,现场的人群规模和行为模式不符合真实企业活动逻辑等。此后,阿里千问在官方公众号发了很多 AI生成的梗图,并话锋一转,欢迎大家多来玩千问App的生图功能。 阿里千问官方公众号辟谣文章截图。 出品:南都大数据研究院 AI新治向工作室 采写:南都研究员 方晓林 南都大数据研究院留意到,此类AI伪造图片事件并非孤例。今年以来,以AI伪造图片频繁现身,引发 多起不良社会影响:西藏定日县6.8级地 ...
【数智周报】MiniMax和智谱通过港交所聆讯;OpenAI据悉计划以8300亿美元估值筹资至多1000亿美元;寒武纪:拟使用27.78亿元资本公积金弥补亏损
钛媒体APP· 2025-12-21 04:23
行业观点与战略动向 - 埃隆·马斯克公开质疑核聚变发电的经济性,认为建造小型反应堆是浪费,并计划每年部署规模堪比美国全国电力四分之一的100GW太阳能AI卫星 [2] - 腾讯升级大模型研发架构,新成立AI Infra部、AI Data部、数据计算平台部,任命前OpenAI研究员姚顺雨为首席AI科学家并兼任AI Infra部、大语言模型部负责人 [6][7] - TikTok CEO周受资发布内部信,更新美国业务方案:将成立由甲骨文、银湖及MGX等投资者持股45%的新合资公司负责数据安全,字节跳动保留19.9%股份并继续控制电商、广告等商业活动,相关事宜计划在2026年1月22日前完成 [28][29] 国内大模型与AI应用进展 - MiniMax(稀宇科技)已通过港交所聆讯,计划于2026年1月挂牌上市,若成功将成为全球从成立到IPO最快的AI公司,目前服务超200个国家2.12亿用户及超10万企业客户 [5][6] - 智谱华章已通过港交所上市聆讯 [6] - 字节跳动正推进与联想合作,为其AI手机预装AIGC插件 [8] - 豆包大模型1.8发布,面向多模态Agent场景优化,工具调用与复杂指令遵循能力增强 [9] - 千问APP开始接入阿里生态,首站接入高德地图,可调用导航、打车等底层服务 [10] - 阿里发布通义万相2.6系列模型,是国内首个支持角色扮演功能的视频模型,支持音画同步、多镜头生成 [11] - 生数科技推出可商用的一站式AI视频Agent解决方案Vidu Agent,能自动产出15秒/30秒完整广告片 [12] - 百度发布文心健康管家,定位“全能家庭医生”,覆盖全周期健康服务,并推出“原子计划”向行业免费开放100+AI能力 [13][14] - 美团发布并开源SOTA级虚拟人视频生成模型LongCat-Video-Avatar,支持音频、文本、图像生成视频等多种功能 [18] 芯片、算力与基础设施 - 中科曙光发布并真机展出了国产万卡级AI集群系统scaleX万卡超集群 [3] - 紫光国微成立中央研究院,主要研究方向包括面向具身机器人等应用的端侧AI芯片新架构 [3] - 沐曦股份在科创板挂牌上市,发行价104.66元/股,募集资金41.97亿元,开盘后股价大涨,收盘报829.90元/股,涨幅692.95%,总市值突破3300亿元 [17][20] - 壁仞科技通过港交所上市聆讯 [21] - 寒武纪公告拟使用27.78亿元资本公积金弥补亏损 [4] - 商汤日日新Seko系列模型已完成对国产AI芯片寒武纪的适配 [20] - 百度旗下昆仑芯即将完成股改,加速推进冲刺上市步伐 [20] - 小米开源总参数309B(激活15B)的MoE模型MiMo-V2-Flash,其API定价为输入0.7元/百万tokens,输出2.1元/百万tokens,推理价格仅为Claude Sonnet 4.5的2.5% [16] - 上海交通大学科研团队在《科学》杂志发表成果,实现新一代光计算芯片LightGen,实测算力和能效相比顶尖数字芯片提升2个数量级 [19][20] - 日本印刷株式会社(DNP)成功开发出相当于1.4纳米等级的NIL纳米压印技术,计划2027年量产 [29] 海外巨头动态 - 英伟达CEO黄仁勋透露,作为向OpenAI投资1000亿美元计划的一部分,目前尚未支付任何款项 [22] - 英伟达发布采用混合型Mamba-Transformer专家混合架构的Nemotron 3开源模型系列,其Nano版本吞吐量较前代提升4倍 [23] - OpenAI计划以高达8300亿美元估值筹资至多1000亿美元,最早于2025年第一季度末完成 [24] - OpenAI发布新一代图像模型GPT-image-1.5,性能提升最多4倍,成本便宜约20%,并全面接管ChatGPT中的图像生成功能 [25] - 前OpenAI首席技术官Mira Murati创办的Thinking Machines Lab估值达500亿美元,其产品Tinker新增接入万亿参数级推理模型Kimi K2 Thinking [26][27] - 谷歌推出最新人工智能模型双子座3 Flash,性能超越双子座2.5 Pro,速度提升约3倍,运行成本更低 [28] - 甲骨文一个价值100亿美元的密歇根数据中心项目因融资谈判陷入僵局而停滞 [27] - 苹果据称计划到2027年秋季将其iPhone产品线从五款扩展至七款,包括首款可折叠iPhone和20周年纪念版“全屏”iPhone [27] - OpenAI正洽谈从亚马逊融资至少100亿美元,并使用其人工智能芯片 [29] - 英特尔计划以约16亿美元收购AI芯片初创公司SambaNova [30] 融资与并购 - 多模态AI企业智象未来完成A+轮融资,京东集团等参投,已启动B轮融资筹备 [31] - 银河通用机器人完成3亿美元新一轮融资,创具身智能领域单轮融资纪录,由中国移动链长基金领投 [32] - 格蓝若机器人完成数千万元A+轮融资,由湖北省人形机器人产业投资基金领投 [33] - 首形科技完成新一轮融资,由中国互联网投资基金与蚂蚁集团联合领投 [34] - 星源智机器人完成超亿元天使+轮融资,由赛富基金与凯联资本领投 [35] - 云深处科技完成超5亿元C轮融资,由招银国际和华夏基金联合领投 [36] - 众擎机器人完成10亿元A1+及A2轮融资,由黄浦江资本等领投 [37] 合作与生态 - 爱诗科技与阿里云达成全栈AI合作,阿里云将为爱诗科技旗下用户破亿的PixVerse视频生成大模型提供全球化算力及模型服务支持 [15]
从“大而强”到“小而美”,长三角竞速“超级个体”经济
北京日报客户端· 2025-12-21 04:03
转自:北京日报客户端 AI技术的蓬勃发展正深刻重塑创业的底层逻辑:当ChatGPT能生成专业级代码,Midjourney可秒出高水 准设计,智能体(Agent)甚至能自主跑通复杂的销售与运营流程,创业的最小可行单元正从"团队"浓 缩为"个人"——超级个体(One Person Company,以下简称OPC)新范式由此应运而生。 当这一趋势与长三角深厚的产业基础、活跃的数字生态和持续优化的制度环境深度耦合,在12月催生出 一场集中爆发的区域竞速——上海领头起跑,江苏多点引爆,浙江聚焦引领,安徽初具雏形。这一"先 发示范、梯队跟进、全域铺开"的格局,不仅折射出地方政府招商逻辑正集体从一味追逐"大企业、大项 目"向兼而重视"小微主体、个体创新"转变,更在全国率先探索出一条激活微观创新单元的可复制、可 推广路径。 先发阵营:临港"超级个体288"奠基,苏州成立OPC服务联盟 OPC并非传统意义上的自由职业者或数字游民,而是以个人或极小团队为核心、依托生成式AI、普惠算 力与全球化协作工具,独立完成从创意、研发到营销、交付全链路闭环的微型科创企业。他们凭借高度 专业化能力与AI赋能,以前所未有的效率参与全球市场竞争— ...
大模型挣钱有多难,看看智谱亏掉的 62 亿
钛媒体APP· 2025-12-21 03:49
文章核心观点 - 中国大模型创业公司资本化进程迅猛,智谱AI与MiniMax已通过港交所上市聆讯,争夺“全球大模型第一股” [1] - 大模型行业面临沉重资金压力,一级市场融资降温,推动创业公司加速上市进程 [1] - 智谱AI作为观察大模型商业化的样本,虽收入快速增长但亏损急剧扩大,上市成为其应对高研发投入和现金消耗的必然选择 [2][4][15] 公司概况与资本进程 - 智谱AI成立于2019年,核心创始团队来自清华,被称为“清华帮” [4] - 公司成立6年融资8轮,累计筹资超83亿元人民币,IPO前最新投后估值超240亿元 [5] - 智谱AI是内地企业赴港上市“报备制”落地后最快通过聆讯的公司之一,与MiniMax双双通过聆讯,争夺“全球大模型第一股” [1] - 截至2025年6月30日,公司期末现金及现金等价物约为25.52亿元,但流动负债净额为70.89亿元,其中新增28.88亿元来自面向投资者发行的金融工具 [5] - 公司近期获得多个地方国资的战略投资 [5] - 截至2025年6月30日,公司共有员工883名,此前高峰期超1000人,今年一度缩减上百人,10月曾传出裁员消息 [15] 财务表现与经营状况 - **收入增长**:过去三年收入年复合增长率超过130% [2];2022年、2023年、2024年及2025年上半年收入分别为5740.9万元、1.24538亿元、3.12414亿元及1.90877亿元 [3] - **亏损严重**:从2022年至2025年上半年,三年半累计收入6.85亿元,同期累计亏损超62亿元 [2];亏损占收入比重从2022年的250.2%一路走高至2025年上半年的1235.3% [2];2025年上半年净亏损达23.57852亿元 [3] - **高额研发投入**:过去三年累计研发开支达28.09亿元,2025年上半年进一步攀升至15.94661亿元,三年半合计研发投入已超过44亿元 [4][12];研发开支中,超7成用于算力服务费,2024年及2025年上半年该比例分别为70.7%和71.8% [12][13] - **销售与营销开支**:从2022年的0.15亿元增至2025年上半年的2.09亿元,三年半累计营销开支约7.12亿元,超过同期累计收入 [4] - **毛利率水平**:公司毛利率始终保持在50%以上 [9];2024年本地化部署毛利率达66%,云端部署仅为3.4%;2025年上半年本地化部署毛利率为59.1%,云端部署为负0.4% [9] - **客户集中度高**:服务机构客户超8000家,但前五大客户收入长期占据公司营收近五成,2022年、2023年、2024年及2025年上半年占比分别为55.4%、61.5%、45.5%及40% [9] 市场地位与商业模式 - **市场排名**:按2024年收入计算,智谱AI位列中国独立通用大模型开发商第一,在所有通用大模型开发商中位列第二,市场份额约为6.6% [6] - **收入结构**:收入主要来自B端政企客户的本地化部署,过去三年该部分收入长期占总收入的约85%及以上 [7];2025年上半年本地化部署收入占比仍达84.8%,云端部署仅为15.2% [9] - **云端业务发展**:公司强调云端MaaS和订阅业务呈现“指数级增长”,付费流量收入“超所有国产模型之和”,面向全球开发者的模型服务业务年度经常性收入已突破1亿元人民币 [10] - **海外拓展**:自2024年开始向海外提供本地化部署服务,2025年上半年海外收入占比达11.6% [10] - **供应商集中度**:2022年至2025年上半年,前五大供应商采购额分别占采购总额的54.5%、53.6%、47.3%及50.2% [14] 行业竞争与挑战 - **行业特点**:大模型行业处于高投入、低产出的发展初期,科技巨头资金雄厚,可承受亏损并持续加码算力和人才投入 [11] - **竞争焦点**:模型性能仍是决定AI竞赛的关键,科技巨头通过加强研发和人才争夺保持竞争力 [11] - **创业公司压力**:面对科技巨头的竞争,创业公司在资金和人力上处于弱势,需不断证明其模型性能的领先地位和护城河 [14] - **商业化局限**:中国大模型市场商业化落地主要局限于B端政企客户,2024年53亿元市场规模中,机构客户贡献47亿元,个人客户收入仅为6亿元 [7] - **资本动态**:除智谱AI和MiniMax外,其他国产大模型创业公司如月之暗面也传出计划明年IPO的消息 [15]
深度|DeepMind CEO Demis: AGI还需5-10年,还需要1-2个关键性突破
Z Potentials· 2025-12-21 02:24
文章核心观点 - Google DeepMind联合创始人兼CEO Demis Hassabis认为,通用人工智能(AGI)可能在五到十年内实现,但仍需一到两个关键性突破,公司正致力于推进多模态AI、Agent系统和世界模型等前沿方向,以构建一个在日常生活中真正有用的通用助手 [6][30][31] - 公司认为AI是人类历史上最具变革性的技术之一,其最佳前景是带来“激进式丰裕”,解决能源、疾病等重大问题,但同时也需严肃应对AI安全、恶意滥用及系统失控等风险 [14][15][20] - 公司将其在激烈竞争中的优势归因于植根于科学方法的严谨性,以及将世界级研究、工程能力和基础设施相结合的能力 [9] 科学家与诺奖得主:从科学方法到公共责任 - Demis Hassabis获得诺贝尔奖后,其最大的变化在于该荣誉成为与领域外人士(包括政府高层)沟通时的“捷径”,能迅速确立其专家身份,这为其就AI安全等关键议题发声提供了重要平台 [5][7] - 公司强调科学方法是其面对一切问题的默认思维方式,认为这是人类历史上最重要的思想之一,并尝试将这种方法推向极致,这成为其作为研究组织和工程组织的优势来源 [9] - 除了长期AGI安全,公司关注的议题还包括当下AI的负责任使用,以及让整个社会为即将到来的变革做好准备,认为各国政府及其他关键领导者将发挥决定性作用 [6][8] 接下来的一年:多模态与Agent - 公司在接下来12个月将全力推进多模态能力的融合,其核心基础模型Gemini从一开始就是多模态的,能够同时处理并生成图像、视频、文本和音频,多模态本身正在带来有价值的交叉增益 [11] - 公司正在重点投入世界模型方向,例如其Genie 3系统是一种交互式视频模型,用户不仅可生成视频,还能在其中“行走”并保持长达一分钟的整体一致性 [11] - 公司希望Gemini最终成为一种“通用助手”,在接下来一年中会出现在更多设备上,可能通过眼镜等设备真正伴随用户生活,目标是打造一个每天都会被多次求助、成为生活结构一部分的系统 [12] - 目前Agent还不够可靠,无法独立完成完整任务,但预计一年后会开始看到接近这一能力水平的Agent出现 [11][13] 理想与担忧:AI带来的乌托邦与失控 - 公司设想的AI最佳前景是带来一种“激进式丰裕”状态,解决当今社会和人类面临的许多重大问题,如实现廉价可持续的清洁能源、治愈大量疾病,使人类进入后稀缺时代并真正繁荣 [14] - 公司担忧的风险主要来自两个方面:一是恶意行为者利用AI从事有害活动(如制造病原体、发动网络攻击);二是当AI接近AGI、变得更具自主性时,可能在某种情况下“失控”并对人类造成伤害 [15][18] - 公司认为AI突破安全边界的风险概率并非零,因此必须投入大量资源和注意力去应对,但精确量化这种灾难性风险(如P(doom))是没有意义的 [6][20] - 在AI安全研究上,随着具备持续学习能力的系统变得更具自主性,如何确保其始终保持在设定的安全边界内是一个活跃的研究领域,同时市场机制(如企业要求行为保障)也会自然奖励更负责任的参与者 [19] 行业竞争与现状 - 目前美国和西方在AI整体上仍然处于领先位置,但领先优势并不遥远,中国并没有落后太多,当前的领先可能只是以“月”为单位 [21] - 在算法创新和原创性方面,西方仍然具有优势,中国的模型或公司在快速跟进最先进技术方面做得非常出色,但在展示超越当前最前沿水平的原创突破方面目前仍略逊一筹 [22] - AI产业中的某些部分可能确实存在泡沫,例如一些规模极其夸张的早期融资看起来并不太可持续,但从长期来看,AI作为最具变革性的技术之一,其投入将被证明是完全值得的 [32] - AI领域的人才争夺战相当激烈,公司更看重那些被使命驱动的人才,并相信始终站在技术最前沿会形成对顶尖人才的吸引力正反馈 [33] Gemeni3: 实证引导下的强大模型 - 公司对近期发布的Gemini 3模型非常满意,认为其在智能水平和实用性上带来了明显跃迁,其回答风格简洁直接,并能在用户观点不合理时温和地提出不同意见 [25] - Gemini 3体现了对高层次指令的深度理解以及生成高度细节化输出的能力,其在前端开发和网站构建方面表现尤为突出,在美学、创造力和技术实现上都达到了很高水平 [26][27] - 公司认为创新速度过快,以至于在发布新版本时,内部甚至还没来得及探索现有系统十分之一的潜力,最终往往是用户将模型能力发挥到远超内部测试的程度 [28] - 公司决定全力押注LLM是基于科学方法和实证证据的指引,当看到scaling开始显现效果时,便逐步将更多资源投入到这条研究路径上 [28][29] AGI的十年之约:还需关键突破 - 公司认为目前尚未达到AGI,但已相当接近,预计还需要五到十年的时间 [6][30] - 公司对AGI的标准设得相当高,定义为一个系统能够展现出人类所具备的全部认知能力(包括发明和创造),且在各个维度上都具备一致性,而非当前“锯齿状”的智能形态 [30] - 当前系统缺乏一些关键能力,如持续学习、在线学习、长期规划和推理能力,这些能力可能还需要一到两个关键性突破才能实现 [6][31] - 实现AGI的路径上,必须把现有系统的scaling能力推到极限,但公司更倾向于认为除了scaling之外,还需要一到两个类似Transformer或AlphaGo那样的范式级重大突破 [31] 其他洞察与展望 - 公司认为当前AI最令人震撼却被严重低估的一点是模型所具备的多模态理解能力,尤其是多模态视频理解,能够在概念层面理解视频中发生的事情 [23][24] - 公司对人类大脑的适应能力充满信心,认为人类大脑已成功从狩猎采集社会适应到现代文明,理应具备持续适应AI变革的能力,未来或可通过脑机接口等新技术保持竞争力 [34] - 体育领域拥有极其丰富的数据且追求极致精英表现,天然适合引入AI进行优化,例如在角球进攻中,AI系统可通过分析球员的精确站位来帮助进更多的头球 [37][38]