AI指导的蛋白质设计

搜索文档
OpenAI重大发现:GPT-4b micro改造诺奖研究,山中因子重编程效率提高50倍
机器之心· 2025-08-23 10:51
合作与技术突破 - OpenAI与生物科技初创公司Retro Bio合作研发新模型GPT-4b micro,设计出新型山中因子变体 [2] - 新变体在体外的重编程效率比标准OSKM蛋白提高50倍 [2] - 合作始于一年前,Sam Altman个人向Retro注资1.8亿美元 [3] 模型特性 - GPT-4b micro与GPT-4o架构相同,但采用新训练方法和自定义生物学数据集 [9] - 模型推理上下文长度达64000个token,在蛋白质序列模型中属首次 [12] - 模型出现与语言模型类似的scaling laws,更大数据集训练带来可预测提升 [12] 蛋白质设计优化 - 直接优化蛋白质序列极困难,SOX2含317个氨基酸、KLF4含513个氨基酸,可能变体数量达10^1000 [14] - 传统定向进化技术每次仅能对少量残基突变,设计空间探索有限 [14] - 模型生成RetroSOX序列与野生型SOX2相差超100个氨基酸,但超30%序列优于野生型,命中率超传统方法10%下限 [15] 实验效果验证 - 对KLF4改造时,模型生成变体有14种优于最佳RetroSOX组合,命中率近50% [18] - 最优RetroSOX和RetroKLF变体组合使晚期标志物出现时间比野生型OSKM方案提前数天 [20] - 第10天碱性磷酸酶染色显示变体表现出强劲AP活性,为多能性重要指标 [22] 临床潜力验证 - 采用mRNA替代病毒载体及间充质基质细胞验证,7天内超30%细胞表达关键多能性标志物 [24] - 第12天出现大量类iPSC细胞集落,超85%细胞激活内源性表达关键干细胞标志物 [24] - RetroFactor衍生iPSC成功分化为三胚层,扩增细胞系经传代证实健康核型及基因组稳定性 [24] 安全性与效率提升 - RetroSOX/KLF混合物处理细胞γ-H2AX强度明显低于标准OSKM或荧光对照,表明更有效减少DNA损伤 [27][28] - AI指导蛋白质设计显著加速干细胞重编程研究进展,证据包括高命中率、深度序列编辑等 [26] 行业意义 - 专业化模型在特定领域能更快取得科学突破,领域知识与语言模型结合使数年问题可能在数天内进展 [32]