行业背景与核心挑战 - 人体内最大的蛋白质肌联蛋白(titin)由超过3.4万个氨基酸组成,其化学全名长达189,819个字母,自1954年发现以来,其完整结构在70多年间一直未知,传统实验方法几乎无法解析[1] - 解析蛋白质三维结构的传统方法(如核磁共振、X射线晶体学、冷冻电镜)成本高昂,设备动辄上百万美元,耗时数月到数年,对于肌联蛋白这种拥有三百多个结构域的超级蛋白质更是难以应对[3] - 在浩瀚的蛋白质世界中,人类通过实验解析出的蛋白质结构不到20万个,在所有人体蛋白质中,也只有约35%的结构被实验解析,且很多残缺不全[6] 技术突破:AlphaFold的出现与能力 - 2020年11月30日,DeepMind推出的AlphaFold2在“全球蛋白质结构预测比赛”(CASP)中,凭借氨基酸序列预测蛋白质结构的准确率超过了90%,直逼实验方法[6] - AlphaFold数据库中的蛋白质预测结构已超过2亿个,涵盖了人类蛋白质组98.5%的结构,来自190多个国家的上百万科研人员正在使用这一开源工具[6] - 2024年,谷歌发布了AlphaFold3,能精准预测蛋白质与DNA、RNA等其他生命分子的相互作用,并推出了能主动设计定制蛋白质的AlphaProteo[23] - 2025年,谷歌推出了AlphaGenome,将预测能力延伸至DNA层面,可从DNA序列预测基因突变对生物学过程的影响[23] - 在蛋白质结构预测领域,除AlphaFold外,还有RoseTTAFold、ESMFold和I‑TASSER等AI模型也在不断突破[23] 应用领域:医药研发与疾病治疗 - 在2020年新冠疫情爆发初期,DeepMind利用开发中的AlphaFold2预测了新冠病毒部分蛋白质的结构,帮助研究者迅速了解病毒生理机制并筛选潜在治疗药物[8] - 生物技术公司Insilico Medicine将AlphaFold2整合进其AI药物发现平台Pharma.AI,通过该全流程AI方法,在几年内发现了治疗特发性肺纤维化的候选药物Rentosertib,该药物已进入II期临床试验,成为全球首个完全由AI发现靶点并设计化合物的试验药物[18][20] - 英国牛津大学的研究团队利用AlphaFold2找到了疟原虫蛋白质的关键结合位点,为开发能切断疟疾传播链的疫苗提供了新思路[10] - 马耳他大学的科学家使用AlphaFold研究基因突变对骨质疏松的影响,通过对比正常与突变蛋白质的结构模型来观察功能破坏的可能性[11] - 2023年,DeepMind基于AlphaFold推出了AlphaMissense模型,利用其对结构的“直觉”来判断错义突变是否可能致病,成功归类了人类所有错义突变中的89%,生成了“人类错义突变目录”,以帮助锁定罕见遗传病及糖尿病等复杂疾病的遗传因素[13] 应用领域:环境保护与工业设计 - AlphaFold2能帮助科学家重新设计蛋白质,以完成如高效降解一次性塑料等过去难以做到的任务[14] - 英国朴次茅斯大学的科学家利用AlphaFold,在短短几天内获得了上百种来自微生物的候选降解酶的三维结构,并基于这些结构设计反应更快、稳定性更高、成本更低的酶,以更有效地分解塑料垃圾[17] 具体案例:肌联蛋白研究的进展 - AlphaFold2将肌联蛋白的序列切分成166个“重叠群”(contig),每个长达上千个氨基酸,并分别给出了结构预测,科学家已将这些结构整合,得到了肌联蛋白中所有相互串联的双结构域的三维蓝图[21] - 科学家借助AlphaMissense等工具,评估了肌联蛋白不同突变的潜在致病性,使这个此前几乎无法触及的研究对象变得有迹可循[21] - 2024年,科学家发现了一种比肌联蛋白还要大25%的蛋白质PKZILLA-1,刷新了自然界已知最大蛋白质的纪录[23]
这才是 AI 近年来最有价值的成就,却被很多人忽视
36氪·2025-12-01 00:15