Workflow
蛋白质设计
icon
搜索文档
Nature系列综述:乔治·丘奇绘制 AI 蛋白质设计路线图,逐步指导利用AI工具设计蛋白质
生物世界· 2025-09-14 04:05
AI驱动蛋白质设计的革命性进展 - AI彻底改变了蛋白质设计方式 以前所未有的精准度和速度设计具有定制功能的新型蛋白质 将蛋白质设计从反复试验过程转变为预测性学科 [2][7][9] - 蛋白质序列空间极其庞大 典型350个氨基酸组成的蛋白质有约10^455种可能序列 远超可观测宇宙总原子数量(约10^82个) 传统方法无法高效遍历 [6] - AI工具在定向进化中准确预测有益突变 从序列预测功能 在理性设计中以接近实验精度从序列预测结构 并从头生成新蛋白质 [7] 蛋白质设计策略与AI增强 - 传统蛋白质设计主要依赖定向进化和理性设计两种策略 定向进化通过随机突变和筛选模拟自然选择 理性设计基于结构和功能数据进行针对性修改 [6] - 定向进化费时费力 理性设计受限于结构信息可用性和准确性 两种方法都无法高效遍历巨大序列空间 [6] - AI增强这两种策略: 在定向进化中缩短实验周期 在理性设计中实现无模板结构预测和蛋白质生成 生物分子共折叠模型可预测多分子复合物 [7] AI工具包分类与应用 - AI工具分为七大工具包: T1蛋白质数据库搜索 T2结构预测 T3功能预测 T4序列生成 T5结构生成 T6虚拟筛选 T7DNA合成 [17][22] - T2结构预测包括单链折叠(AlphaFold2 ESMFold) 复合物预测(RoseTTAFold AF-Multimer) 生物分子共折叠(NeuralPLexer) 结构稳定性预测 [21] - T4序列生成包含进化引导(UniRep ESM系列) 功能到序列(ProGen POET) 结构到序列(ProteinMPNN ESM-IF)三种生成方式 [21] 蛋白质设计工作流程 - 蛋白质设计项目从明确目标开始 通过功能 结构和可开发性三个维度评估 指导设计策略制定 [16] - 工作流程分为三个阶段: 确定策略(定向进化或理性设计) 库设计(设计序列文库) 筛选与优化(实验验证) 形成迭代循环 [16] - AI工具支持每个工作流程阶段 从策略定义到蛋白质数据库搜索 结构功能预测 序列结构生成 虚拟筛选和DNA合成 [17] AI驱动案例研究 - AAV衣壳定向进化中 AI模型从10^10个序列的虚拟文库中筛选出20426个序列 其中110689个(58.1%)实验验证为存活 包含最多29个突变的设计 [27] - 抗体定向进化使用ESM模型生成突变体 两轮过程后四个抗体结合亲和力提高多达7倍 三个不成熟抗体提高多达160倍 [27] - 从头设计荧光素酶使用trRosetta生成新NTF2框架 ProteinMPNN优化序列 LuxSit变体表现出色 热稳定性>95°C且具有高度特异性 [28] 技术挑战与未来方向 - 训练数据偏差或缺失会扭曲预测结果 需要全面训练库 严格验证和偏差缓解策略 动态整合新实验数据 [29][30] - 可解释性是关键障碍 许多AI工具如黑箱运作 需要可解释AI方法阐明设计基础 稀疏自动编码器显示发现可解释特征的前景 [30] - AI有望开启精准治疗新时代 将"不可成药"靶点向蛋白质药物开放 微调结合特异性 增强稳定性 溶解性和可制造性 [31] - AI开始设计自然界不存在的全新蛋白质和生物系统 如family-wide hallucination RFDiffusion和AlphaProteo策略实现高精度从头生成结合蛋白 [32]
Nature:蛋白质设计新革命!AI一次性设计出高效结合蛋白,免费开源、人人可用
生物世界· 2025-08-29 04:29
技术突破 - 开发名为BindCraft的开源自动化蛋白质从头设计平台 实现功能性结合蛋白的一次性计算设计 无需实验优化或高通量筛选 [2][3] - 通过逆向改造AlphaFold2模型 利用反向传播算法从目标蛋白结构直接生成匹配的全新结合蛋白 颠覆传统耗时数月且成功率不足1%的方法 [2][5] - 采用动态建模同步优化靶点与结合蛋白结构 智能进化迭代优化表面氨基酸 双重过滤机制确保设计可靠性 [5] 性能表现 - 设计成功率高达10%-100% 平均达46.3% 结合强度达纳摩尔级 相当于抗体药物水平 [2][3][5] - 成功靶向细胞表面受体(PD-1/PD-L1/IFNAR2/CD45) 常见过敏原(Bet v1/Der f7/Derf 21) 从头设计蛋白质及多结构域核酸酶(CRISPR-Cas9) [3][7] 应用验证 - 设计桦树花粉过敏原Bet v1结合蛋白 患者血清测试显示阻断50%过敏抗体结合 [7] - 针对尘螨过敏原Der f7和Derf 21设计的结合蛋白 晶体结构证实与设计模型误差仅0.3纳米 [7] - 设计Cas9抑制蛋白精准结合REC1核酸结合域 显著降低HEK293细胞基因编辑活性 [8] - 中和产气荚膜梭菌穿孔毒素CpE 完全消除毒素导致的细胞死亡 效果等同天然抑制剂 [8] - 设计靶向HER2和PD-L1的微型结合蛋白整合至AAV衣壳 实现特异性靶向癌细胞 [8] 行业影响 - 实现"one design-one binder"方法突破 在治疗学 诊断学和生物技术领域具有巨大潜力 [3][9] - 开源技术使普通实验室可设计定制蛋白质 有望重塑药物开发 疾病诊断和治疗领域未来 [9]
Nature Chemistry:西湖大学曹龙兴团队实现可逆光响应蛋白的从头设计
生物世界· 2025-08-28 10:00
研究背景与挑战 - 蛋白质设计领域在2024年迎来高光时刻 蛋白质设计先驱David Baker教授获得诺贝尔化学奖 人工智能技术加持下领域发展突飞猛进 [5] - 编程设计全新环境响应蛋白质仍面临重大挑战 需实现不同结构状态切换 光响应性因瞬时性 非侵入性和可逆调控性成为特别机制 [5] - 天然光响应蛋白质存在持续光照需求 逆向过程耗时长 光响应作用单一 折叠复杂 分子量大 波长固定 热稳定性有限等局限性 [6] - 改造天然光蛋白质存在工程化困难 光感应谱和动力学控制复杂 异源系统表达难度大等问题 [6] - 传统蛋白质设计依赖20种标准氨基酸 这些氨基酸对光照不敏感 需光敏感色素基团并协调发色团激发与构象转换的相互作用 [6] 技术突破与创新 - 研究团队开发整合AI深度学习的蛋白质对接程序 适用于非天然氨基酸 通过密码子扩展技术整合光响应非天然氨基酸AzoF [3][7] - 实现精确设计可逆光响应性蛋白质 包括同源多聚体和异源二聚体等多种对称性特征复合体 [3][7] - 设计方法结合基于物理能量的蛋白质对接与AI深度学习 首次从头设计出结构丰富多样的光响应蛋白质 [12] 性能特征与优势 - 光响应蛋白能在不同光照条件下快速切换复合物状态与单体态 异源二聚体LRD-7亲和力变化达167倍 [8] - 蛋白质单体仅由65个氨基酸构成 分子量小 可作为光控标签工程化靶蛋白 [8] - 具备极强热稳定性 95°C加热恢复后保持原有二级结构 未经优化产量达40 mg/L [8] - 设计出的同源寡聚光响应蛋白可制备光响应性蛋白水凝胶 具备优良固态-液态转化特性 [10] - 光响应异源二聚体可控制受体传递的基因表达信号 [10][14] 研究意义与应用前景 - 研究为光调控蛋白-蛋白相互作用的从头设计提供新方法和思路 [12] - 为从头设计光响应靶标结合蛋白和光响应分子机器奠定坚实基础 [12] - 验证了在生物材料和细胞信号通路方向的广泛应用潜力 [12]
David Baker最新论文:AI从头设计大环肽,高亲和力靶向目标蛋白
生物世界· 2025-06-23 06:58
蛋白质设计领域新突破 - 开发了从头设计大环肽的新框架RFpeptides 实现了精确设计与目标蛋白质具有高亲和力的大环肽 [3] - 该研究由诺贝尔奖得主David Baker团队发表在Nature Chemical Biology 标志着蛋白质设计领域的重要进展 [2] 大环肽的 therapeutic potential - 大环肽介于小分子药物和大分子生物制剂之间 能够调控传统治疗手段无法触及的分子靶点 [6] - 生物制剂限于细胞外靶点 小分子难以靶向缺乏深疏水口袋的蛋白质 大环肽可填补这一治疗空白 [6] - 传统肽类药物研发依赖天然产物发现或高通量筛选 存在合成困难 稳定性差 耗时耗资等局限 [6] RFpeptides技术优势 - 扩展RoseTTAFold2和RFdiffusion框架 引入循环相对位置编码 实现基于去噪扩散的大环肽设计流程 [12] - 针对MCL1 MDM2 GABARAP RbtA四种蛋白质测试 均获得中高亲和力结合剂 其中RbtA结合剂Kd<10nM [13] - X射线晶体显示设计的大环肽-靶蛋白复合物结构与计算模型高度吻合 Cα RMSD<1.5Å [14] 人工智能在蛋白质设计的应用 - 生成式AI突破被用于大环结合剂设计 RFdiffusion模型已成功设计蛋白质单体及结合剂 [10] - 现有AI方法因训练数据有限难以直接应用于肽设计 RFpeptides框架克服了这一挑战 [11] - 该技术为快速定制诊断/治疗用大环肽提供系统性框架 具有广泛 therapeutic application [16]