大语言模型
搜索文档
Meta首席AI科学家LeCun被曝将离职创业,与扎克伯格“超智能”路线理念分歧
华尔街见闻· 2025-11-11 12:46
公司核心人事变动 - Meta首席人工智能科学家Yann LeCun计划在未来数月内离职并创立自己的初创公司 [1] - 此次离职凸显了其与扎克伯格在AI发展路径上的根本分歧 [1] - 2024年以来Meta高管层持续动荡,AI研究副总裁Joelle Pineau已离职,AI研究部门裁员约600人 [4] 公司AI战略分歧 - LeCun主张开发全新一代AI系统“世界模型”,认为当前以大语言模型为核心的AI路线永远无法实现人类级推理和规划 [1][2] - 扎克伯格则强调快速产品化和“超智能”团队战略,在Llama 4模型表现不佳后决定加速AI产品迭代并减少长期基础研究投入 [2] - 战略重组导致LeCun的汇报关系发生变化,从向首席产品官Chris Cox汇报改为向新任“超智能”团队领导Alexandr Wang汇报 [2] 公司战略转型与资源投入 - 扎克伯格斥资143亿美元聘请28岁的Alexandr Wang领导新的“超智能”团队,并收购其数据标注初创公司Scale AI 49%的股权 [2] - 公司组建名为TBD Lab的专属团队,以1亿美元的薪酬包从OpenAI和Google等竞争对手挖来人才,负责推进大语言模型的下一代开发 [2] - 公司以数亿美元年薪吸引新一代AI领军人物,包括OpenAI ChatGPT联合创作者Shengjia Zhao,后者已担任Meta“超智能实验室”首席科学家 [4] 公司面临的竞争与财务压力 - Meta在AI竞争中面临压力,其Llama 4模型表现不及OpenAI和Anthropic [1] - Meta AI聊天机器人市场反响平淡 [2] - 扎克伯格面临来自华尔街的日益增长的压力,需要证明其在成为“AI领导者”方面的数十亿美元投资将获得回报并推动收入增长 [4]
AI教母李飞飞:空间智能才是走向AGI的唯一路径
虎嗅APP· 2025-11-11 10:52
文章核心观点 - 当前大语言模型存在根本性局限,被描述为“能言善辩却缺乏经验,知识渊博却脱离现实”的“睁眼瞎”,无法真正理解物理世界[4][7][28] - AI发展的下一步关键方向是赋予机器“空间智能”,即理解和交互物理世界的能力,这被视为通往通用人工智能(AGI)的唯一路径[4][17][28] - 空间智能的载体是全新的“世界模型”,其具备生成性、多模态和交互性三大核心能力,将取代以语言模型为中心的发展路线[17][18][38] AI当前局限与空间智能定义 - 大语言模型在需要物理世界理解的简单任务上表现不佳,例如无法准确回答杯子旋转90度后的样子或预测物体运动轨迹[5][8][36] - AI生成内容(如视频)经常出现违背物理定律的“穿帮”镜头,例如人物多出手指或物体穿墙而过,暴露了其缺乏对物理规律的基本认知[6][36] - 空间智能是人类与生俱来的基础认知能力,是想象力和创造力的“脚手架”,使人类能够进行侧方停车、接住抛来的钥匙、在黑暗中倒水等日常活动[12][14][32][34] - 人类历史上的重大科学发现和发明创造,如埃拉托斯特尼计算地球周长、沃森和克里克发现DNA双螺旋结构,都深刻依赖于空间智能[21][34] 世界模型的核心特征与技术挑战 - 世界模型必须同时具备三种基本能力:生成性(创造符合物理和几何规律的3D世界)、多模态(处理文本、图像、视频、深度信息、手势等多种输入)、交互性(预测动作指令下的世界状态变化)[18][22][39][40][41] - 构建世界模型的技术挑战远超语言模型,因为世界是四维(三维空间+时间)且受无数复杂物理定律约束,而语言只是一维的序列化信号[18][42] - 关键技术障碍包括:定义能同时反映几何和物理定律的通用训练任务函数、从海量互联网图像和视频等二维数据中提取深层空间信息、开发全新的三维或四维模型架构[44][45][46] 空间智能的应用前景与行业影响 - 在创意产业,World Labs的Marble模型将赋能电影制作人、游戏设计师和建筑师,通过自然语言提示词快速创建和迭代可交互的3D世界,大幅降低专业3D软件的使用门槛[23][49] - 在机器人技术领域,世界模型能通过模拟环境为机器人提供海量训练数据,使其掌握成千上万种实用技能,从而成为家庭、医院等场景中得力的助手和看护[23][52] - 在科学研究中,空间智能系统可模拟人类无法亲临的环境(如深海、外太空),并行测试假设,加速在材料科学、气候科学和医学等领域的发现进程[27][56] - 在教育领域,学生可通过沉浸式体验“走进”古罗马街道或细胞内部,教师能利用互动环境进行个性化教学,专业人士可在高度逼真的仿真环境中练习复杂技能[27][56]
AI应用的“革命”会在苹果下一个大模型吗?
华尔街见闻· 2025-11-11 08:14
苹果AI战略核心 - 公司战略核心并非单纯追逐更大的语言模型,而在于构建革命性的"端云协同"智能体(Agent)框架 [1] - 该"协作智能体模型"是革命性的,能执行的任务复杂度和实用性远超当前任何单一的大语言模型(LLM) [1] - 该策略旨在解决当前AI应用的核心痛点:在利用云端强大算力的同时,安全、高效地调用用户的个人数据 [1] 技术架构:云端大脑与终端特工 - 公司可能将一个强大的云端大模型(传言为谷歌的1.2万亿参数模型)作为"高阶推理大脑" [1][2] - 云端超级大模型扮演"高阶推理智能体"角色,负责理解复杂指令,而真正的执行者是一系列在设备上本地运行的"端侧智能体" [2] - 该架构设计有离线备用方案,设备上的"简单推理智能体"可在离线时保证基础功能可用性 [2] - 这种架构能极大节省计算资源和内存带宽,因为传递给端侧智能体的指令是经过压缩的数据 [2] CAMPHOR模型与五大智能体 - 公司近期发表的《CAMPHOR:用于多输入规划和设备上高阶推理的协作智能体》论文揭示了系统内部运作机制 [3] - 系统由一个云端"高阶推理智能体"和五个在设备上运行的专业智能体协同工作 [3] - 五个端侧智能体包括:个人情境智能体、设备信息智能体、用户感知智能体、外部知识智能体、任务完成智能体 [3] - 该模式能合法且高效地利用纯云端LLM无法触及的个人和设备特定数据,提供真正个性化服务 [6] 工作流程示例 - 当用户发出复杂指令时,高阶推理智能体首先解析指令 [6] - 随后调动设备信息智能体获取当前月份等信息,调用个人情境智能体从用户数据中找出特定联系人 [6] - 最后指令任务完成智能体去票务应用搜索并完成通知等操作 [6] 行业影响与未来机遇 - 这一策略标志着"端侧AI"(Edge AI)真正进入大规模实际应用阶段,其意义远超现有能力 [1][7] - 预计从2026年开始,可能引爆新一轮硬件升级周期,利好更高性能的处理器、内存及无线通信技术 [1][9] - 未来的赢家是那些能够在端侧实现高效、低功耗、高安全性计算,并成功构建起软硬件协同生态的企业 [9] - 技术进步关键领域包括:个性化与隐私保护、即时响应性能提升、个人数据广度扩展至健康等新领域 [8][9] - 该模型有望成为被大众高频使用的日常工具,预示着真正智能的个人助理时代或将到来 [7][9]
美团AI新品,专为程序员配送:不挑Python还是C++
猿大侠· 2025-11-11 04:11
美团AI Coding工具CatPaw发布 - 公司推出一款名为Meituan CatPaw的AI IDE编程工具,通过Agent驱动编程体验革新,旨在提升项目交付效率[3][4] - 该工具当前阶段对所有人完全免费,新用户注册后可获得500次对话额度[7] - 工具支持macOS 10.15以上系统,Windows版本预计近期上线,并全面兼容Python、C++、Java、JavaScript、TypeScript、Go、Rust等主流编程语言[7] CatPaw核心功能 - 具备基础补全和NextEdit(基于历史编辑内容预测下一次编辑)两种代码自动补全能力,支持批量编辑多行代码[11][15] - 提供Agent问答生成功能,以侧边栏对话形式展开,包含Ask模式(智能问答助手)、Agent模式(全能执行助手)和用户自定义模式(个性化工作流)三种模式[19][24] - 内置浏览器预览调试功能,集成DevTools调试工具,无需切换外部窗口即可查看页面元素、调试代码和分析网络请求[22][25] - 提供项目级代码分析功能,通过简单指令(如@Codebase)即可分析整个项目代码结构,帮助开发者快速理解陌生项目[27][29] 美团AI与大模型战略布局 - 公司AI战略建立在三个层面:AI at work(用AI提升内部员工效率)、AI in products(打造AI原生产品并改造现有产品服务)、Building LLM(持续投资构建内部大语言模型)[47] - 模型迭代路线明确,分三步走:速度优先(优化模型响应等基础体验)、专业深耕(在复杂逻辑推理等专业领域优化)、从单一语言模型进阶成多模态[45] - 编程工具CatPaw上线后,美团内部研发人员的周活占比超过80%,每周新增代码中由AI生成的占比达到约50%[40] 内部工具孵化与协同 - CatPaw是公司对标Copilot、从2022年开始研发的项目,而2024年投入的NoCode产品则由CatPaw研发团队孵化[33] - NoCode与CatPaw在产品层面不会快速合并,因解决的问题和用户场景有所区别,但技术架构和Agent发展方向会逐步协同[33] - CatPaw AI IDE背后的核心引擎是公司自研的LongCat大模型,Auto模式下自动推荐LongCat-Flash模型[36]
李飞飞最新长文火爆硅谷
量子位· 2025-11-11 00:58
文章核心观点 - 空间智能是人工智能的下一个前沿领域,其核心在于构建能够理解、推理、生成并与物理世界交互的“世界模型”,这将推动AI实现从处理抽象知识到理解物理现实的质的飞跃 [1][6][28] - 当前以大语言模型为代表的AI在空间智能方面存在根本性局限,无法像人类一样进行空间推理、物理规律预测和连贯的世界生成 [22][23][24] - 具备空间智能的世界模型必须拥有三项核心能力:生成性(创造物理一致的世界)、多模态(处理图像、视频、动作等输入)、交互性(预测世界随互动演变的状态) [5][31] - 空间智能的应用潜力巨大,将彻底革新创造力(如叙事、游戏设计)、机器人技术、科学发现、医疗和教育等多个领域 [4][27][51] 空间智能的定义与重要性 - 空间智能是支撑人类认知的脚手架,驱动着人类的推理、规划及与世界互动的方式,体现在日常动作(如停车、接钥匙)和极端情况(如消防员救援)中 [14][15][20][21] - 人类通过空间智能推动文明进步,历史案例包括埃拉托色尼计算地球周长、珍妮纺纱机的发明、DNA双螺旋结构的发现 [18][19] - 空间智能是人类想象力与创造力的基石,从原始洞穴壁画到现代电影、电子游戏,都依赖于以空间为根基的想象 [17] 当前AI在空间智能方面的局限 - 多模态大语言模型虽具备初步空间感知能力,但在估计距离、方向、大小等任务上表现不佳,无法进行“心智旋转”或预测基本物理规律 [23] - 顶级AI擅长阅读、写作和模式识别,但在对物理世界的表征或交互上存在根本性局限,生成的视频常在几秒后失去连贯性 [23][24] - AI缺乏人类整体性理解世界的方式,即同时理解物体在空间上的关系、语义意义及现实重要性 [25] 世界模型的核心能力与构建挑战 - **生成性**:模型需能生成具有几何、物理与动态一致性的虚拟世界,其输出应允许生成显式、可观测的世界状态,并保持时间上的连贯 [31][32][33] - **多模态**:模型需能处理图像、视频、深度图、文本指令、手势、动作等多种形式的输入,并以多样的方式输出 [34][35][36][37] - **交互性**:当动作或目标作为输入时,模型需能生成与世界先前状态、物理规律相一致的下一个状态,未来甚至能预测下一步行动 [38] - 构建世界模型面临巨大技术壁垒,因其需要协调语义、几何、动力学与物理等远比语言复杂的多维规则 [39][40][41][42] World Labs的研究进展与方向 - 公司致力于世界模型的基础性突破,研究方向包括定义新的通用训练任务函数、利用大规模图像视频数据、开发新的模型架构与表征学习 [43][44] - 开发了基于帧的实时生成模型RTFM,以空间为基础的帧作为记忆形式,实现高效实时生成并保持一致性 [45] - 推出了Marble的早期版本,这是全球首个可通过多模态输入生成并保持一致性3D环境的世界模型,旨在让用户探索和构建创意世界 [46] 空间智能的应用潜力 - **创造力**:工具如Marble平台将空间表达能力赋予电影人、游戏设计师等,使其能快速创造、迭代三维世界,实现多维叙事体验 [51][52][53] - **机器人**:空间智能是实现具身智能的关键,将使机器人能理解、导航并与世界交互,中期目标是完善感知与行动的闭环 [54][55][60] - **科学**:具备空间智能的系统可模拟实验、验证假设,探索从深海到外星的环境,变革气候科学、材料研究等领域的计算建模 [56] - **医疗**:AI可通过多维建模加速药物研发,辅助影像诊断,支持环境感知式监护系统,并发挥机器人在辅助医护方面的潜力 [56] - **教育**:能实现沉浸式学习,让抽象概念可感知,学生可多维探索细胞或“亲历”历史,专业人士可在仿真环境中练习技能 [57] 行业影响与未来愿景 - 空间智能模型将推动造世界的权力从专业团队扩展到个体创作者、教育者,结合VR/XR设备带来全新的沉浸与互动体验 [59] - 世界模型生成的仿真数据将极大促进机器人学习,缩小模拟与现实的差距,使其能在海量状态和环境中学习 [60] - 未来的创新将来自多样化的机器人设计(如纳米机器人、软体机器人),世界模型需对环境与机器人感知进行一体化建模 [60] - 该技术旨在增强而非取代人类,目标是让AI成为拓展人类能力、加速发现、放大关怀的力量,提升生命价值 [47][50][57][62][63]
西安交大丁宁:大模型是“智能基建”,资本与技术融合重塑AI版图
21世纪经济报道· 2025-11-10 23:12
行业宏观定位 - 当前处于以人工智能和大数据为代表的第四次工业革命,人工智能有望成为未来世界不可或缺的核心技术 [1] - 2022年底ChatGPT的出现标志着人工智能发展的转折点,开启了大模型的产业化竞争 [2] 大模型技术演进趋势 - 大模型发展从早期盲目追求参数量扩张回归理性,转向注重结构设计、训练方法和数据质量 [2] - 模型性能提升遵循“规模法则”,即参数量、算力和数据规模增加与性能提升呈幂律关系,但成本能耗等因素促使行业转向结构创新和精细训练 [2] - 模型正从单模态(仅文本)向图像、语音、代码等多模态融合演进,使AI能感知和生成来自不同世界的信息 [2][3] - 训练方式从“预训练+监督微调”向持续学习和参数高效微调演化,目标是用更少算力实现更快适配,推动AI从技术突破走向可负担的产业落地 [3] - 主流大模型仍以Transformer架构为基础 [3] 技术与资本互动关系 - 资本是技术的放大器,技术是资本的倍增器,大模型训练前期成本极高,需资本介入才能形成高质量基础模型 [1][4] - 没有技术洞见和研发积累,资本也难以真正驱动产业升级 [4] 全球竞争格局与中国现状 - 美国在头部企业、算力中心和生态层面仍领先 [4] - 中国在人工智能领域论文数量占全球41%,专利数全球占比达到69% [4] - 算力是制约中国AI发展的关键瓶颈,模型“幻觉”、表达精度不足、产业链协同难等问题仍待突破 [4] 未来发展方向 - 多模态融合,即文字、图像、语音、传感数据全面打通 [4] - 大规模与轻量化并行,在追求能力极限的同时推动端侧部署 [4] - 发展具身智能,使AI与物理世界交互,催生机器人新生态 [4][5] - 探索通用人工智能(AGI),使其具备通用认知和自学习能力,成为长期目标 [5] - 超级智能是更前瞻的概念,指超过最有天赋人类的系统,目前仍处于理论探讨阶段 [5]
Gartner:AI大模型触达天花板,警惕“贴牌智能体”
21世纪经济报道· 2025-11-10 14:35
市场趋势与阶段转变 - 生成式AI和代理型AI是塑造中国AI市场发展的两大核心主题[2] - 大语言模型已越过市场期望顶峰,热度趋冷并开始滑向“泡沫破裂低谷期”,市场在经历“百模大战”后趋于理性[2] - AI市场趋势正从“模型”向“智能体”转移,因大语言模型能力已到天花板,性能边际提升有限[4] - 中国企业将生成式AI部署到生产环境的比例从2023至2024年的6%至8%,在2025年暴涨至40%,预计当前已达60%至70%[6] - 2025年企业对生成式AI的“尝鲜期”结束后,2026年将正式进入“AI下半场”[6] 技术发展与竞争格局 - 国际AI模型评测显示,OpenAI从2022至2023年保持领先,但已进入“Frog Leap”式混战,国内DeepSeek、千问、Kimi等模型已进入第一梯队[5] - 各家模型性能提升空间有限,领先优势微乎其微,实际使用起来区别不大[5] - 模型厂商数量正在减少,出现收购、并购和价格战[5] - 未来模型发展方向是从“大”转向“精”,通过小语言模型和领域专业模型实现精细化、场景化突破[5] - 大语言模型并非万能,未来更强的AI系统需要结合多种技术,混合系统比只依赖大模型更有效[6] 企业应用与价值实现 - 中国AI产业正从尝鲜期进入价值兑现期,数据质量与治理能力将取代模型性能成为核心竞争力[4] - 到2027年,优先考虑准备AI就绪型数据而非生成式AI模型开发的中国企业中,80%实现的业务价值将是同行的两倍[4][6] - 传统企业在AI应用上仍面临巨大挑战,AI是系统工程,涉及企业方方面面的改造,部分企业光做数字化转型就要三年[7] - 互联网和高科技企业在AI应用上将走得更快,因其系统架构新、API友好、数据管理规范、企业文化接受度高[7] - 生成式AI时代对高质量数据有很高要求,企业若无法提供高质量的“上下文”数据,再强的模型也无法产生价值[6] AI智能体现状与挑战 - 行业存在严重的“Agent Washing”现象,即把普通聊天机器人宣称为智能体,市面号称的智能体可能10个里面有8个名不副实[8] - AI智能体演进经历了三个阶段:聊天机器人、智能助手、智能体,当前可能刚刚跨入智能体的大门,处于从助手向智能体过渡的阶段[8] - 真正的AI智能体需具备三要素:感知世界、自主决策、执行行动,最终与环境形成闭环反馈[9] - 大模型在语言理解上可评四星半,行动能力四星,但针对企业复杂场景的决策能力只有三星,仍然较弱[9] - 市面上很多所谓智能体为了可靠性,仍基于写死的工作流程,难以做到智能化,根本原因是智能体可靠性不足,完全依赖大语言模型做决策像“算命”[9] - MCP的理想状态是互联网中智能体和工具处于开放状态,可通过统一协议调用,但其价值被高估,实际应用中的异常处理、安全、性能都是问题[9]
美团AI新品,专为程序员配送:不挑Python还是C++
量子位· 2025-11-10 07:42
美团AI IDE产品CatPaw发布 - 公司推出一款名为Meituan CatPaw的AI IDE编程工具,通过Agent驱动编程体验革新,旨在提升项目交付效率[3][4] - 该工具当前阶段对所有人完全免费,新用户注册后可获得500次对话额度[7] - 产品支持macOS 10.15以上系统,Windows版本预计本周五上线,并全面兼容Python、C++、Java、JavaScript、TypeScript、Go、Rust等主流编程语言[7] CatPaw核心功能 - 具备基础补全和NextEdit两种代码自动补全能力,NextEdit可基于历史编辑内容预测下一次编辑[10][11] - 支持批量编辑多行代码,AI能检测并一次性展现适用于多行代码的修改,并预测接下来可能要修改的整个代码块[15][16] - 提供Agent问答生成功能,以侧边栏对话形式展开,无需频繁切换窗口[19][20] - 内置浏览器预览调试功能,集成DevTools调试工具,用户可在IDE内查看页面元素、调试JavaScript代码、分析网络请求,项目运行后自动弹出可用端口提示[20][21][22] - 提供项目级代码分析功能,通过简单指令即可分析整个项目代码并梳理项目结构[25][26][27] 美团AI Coding战略布局 - 公司在AI Coding方向上持续投入,今年6月10日正式推出首款AI Coding Agent产品NoCode,CatPaw是NoCode研发团队孵化的产品[28][29][30] - AI Coding的核心竞争力在于模型,CatPaw背后的核心引擎是公司自研的LongCat大模型,Auto模式下自动推荐LongCat-Flash模型[33][34] - 公司AI战略路线明确,主打从内到外、从专到全且速度优先,内部工具经过验证后逐步开放给外部公众[35][36][37] 美团大模型迭代进展 - 今年9月初发布大语言模型LongCat-Flash-Chat,月底上线LongCat-Flash-Thinking模型,奠定思考/非思考的基础对话能力[39][40] - 10月上线LongCat-Video视频生成模型,拓展语言能力外的边界,随后推出主打全面多模态的LongCat-Flash-Omni模型[41][42] - 模型迭代分三步走:速度优先确保模型响应和实时生成丝滑不卡;专业深耕优化复杂逻辑推理和嘈杂语音识别等领域;最终从单一语言模型进阶成多模态[43] 内部应用成效 - CatPaw上线后,公司内部研发人员的周活占比超过80%,每周新增代码中由AI生成的占比达到约50%[38]
黄仁勋、李飞飞、Yann LeCun等六位AI顶级大佬最新对话:AI到底有没有泡沫?
AI前线· 2025-11-10 06:54
文章核心观点 - 六位AI领域奠基性人物回顾了AI从神经网络到生成式AI的发展历程,并探讨了技术对社会与经济的深远影响[2] - 当前AI热潮与互联网泡沫存在本质区别,其需求由真实价值驱动,行业正处于智能基础设施建设的起步阶段[20][21] - AI技术未来演进路径广阔,大语言模型仅是组成部分,需在多模态、空间智能等新范式上取得突破以实现更大发展[22][27][28][29] 回顾职业生涯的关键时刻 - Yoshua Bengio受Geoffrey Hinton早期论文启发进入该领域,并在ChatGPT问世后因对AI失控的担忧彻底转变研究方向[7] - Bill Dally在90年代末突破"内存墙"难题的构想催生了流处理器架构和GPU计算基础,并在2011年通过复现斯坦福实验确认GPU对深度学习的巨大潜力[7][8] - Geoffrey Hinton在1984年通过微型语言模型实验发现模型能自发学习词语语义特征,这被视为当今大语言模型的前身[8][9] - 黄仁勋在2010年前后意识到深度学习网络构建方法与芯片设计方法论相似,预见可将芯片设计规模化经验用于构建可扩展软件体系[9][10] - 李飞飞在2006-2007年认识到数据匮乏是机器视觉识别关键瓶颈,耗时三年构建包含1500万张图像、2.2万个类别的ImageNet数据集[13] - Yann LeCun在80年代与Geoffrey Hinton就无监督学习与监督学习价值进行辩论,当前大语言模型的自监督训练本质验证了其早期观点[16][17] AI领域是否会出现泡沫破裂 - 当前AI需求与互联网泡沫存在本质区别,互联网泡沫时期光纤建设远超实际需求,而如今几乎每块GPU都在全速运转并创造价值[20] - AI与传统软件根本差异在于AI需实时生成情境感知智能,这需要投入数千亿美元建设"智能工厂"基础设施以支撑未来数万亿美元产业[21] - AI技术形态已从单纯语言模型演变为能通过交互步骤达成目标的智能体,其应用边界正持续拓展,目前可能只开发了最终需求的1%[24][26] - 从市场规律看任何领域都会有阶段性调整,但AI作为年轻学科仍有无数新边疆待开拓,特别是在超越语言维度的空间智能等领域[27][28] - 某种程度泡沫体现在认为仅靠现有LLM范式就能实现人类级别智能的预期,要真正突破仍需多项根本性理论进展[29] AI智能水平发展预期 - 未来五到十年可能在新范式探索上取得重大进展,但实现根本性突破可能需要比预期更长时间[30] - 机器智能在某些特定能力(如识别2.2万种物体、翻译上百种语言)上已超越人类,但人类智能在文明社会中具有不可替代价值[31] - 现有通用智能水平已足以在未来数年转化为海量社会应用,关键在于持续应用并优化技术解决重大课题[31] - 若以"机器能在任何辩论中胜过人类"作为通用人工智能标准,很可能在二十年内实现这一目标[32] - AI在不同时间维度上的规划能力正呈指数级增长,若保持趋势预计五年内AI就能达到普通雇员的工程类任务工作水平[33]
Cell重磅:AI大模型,设计生成人类单克隆抗体,对抗新型病毒
生物世界· 2025-11-10 04:05
人工智能驱动的抗体药物发现技术突破 - 研究团队开发了名为MAGE(单克隆抗体生成器)的First in Class人工智能模型,该模型基于蛋白质语言模型(PLM),无需初始抗体模板即可根据目标抗原序列生成配对的人类抗体可变重链与轻链序列[6][8] - MAGE模型通过对Progen2(一种通过普通蛋白质序列预训练的自回归解码器大语言模型)进行微调实现,利用自注意力机制捕获输入序列中的复杂依赖关系,通过下一标记预测策略从氨基酸序列中学习规律[8] - 该技术能够生成具备多样化序列特征的抗体,包括不同的重/轻链可变区基因使用模式、体细胞超突变(SHM)程度以及在训练数据中未曾出现的新型互补决定区(CDR)[8] 模型验证与实验效果 - 针对SARS-CoV-2野生型受体结合域(RBD),在实验验证的20个MAGE生成抗体中,有9个(45%)成功确认结合特异性,其中1个抗体对SARS-CoV-2的体外中和效力优于10纳克/毫升[9] - 针对训练数据中代表性不足的呼吸道合胞病毒A(RSV-A)融合前F蛋白,MAGE生成的23个抗体中有7个(30%)通过实验验证了结合活性[9] - 针对未在训练数据中出现的H5/TX/24流感病毒血凝素(HA)抗原,18个MAGE设计抗体中有5个(28%)通过验证,展现了模型的零样本学习新抗原的能力[10] 技术优势与应用前景 - MAGE是首创的无需提供抗体序列模板即可设计出具有明确靶标结合功能的新型人类抗体的AI模型,突破了现有方法仅限于抗体重新设计且需要初始抗体模板的限制[4][6] - 冷冻电镜(cryo-EM)结构解析表明,MAGE生成的抗体具有多样化的结合模式,并能在关键结合界面引入影响功能的关键氨基酸残基[10] - 该技术标志着抗体开发从传统的基于发现的实验方法向计算驱动方法的重大转变,有望解决传统抗体发现过程费力、缓慢且成本效益低的问题[3]