文章核心观点 - 微软研究院团队开发了一个名为GigaTIME的多模态人工智能框架,该框架能够从常规的H&E病理切片预测生成虚拟的多重免疫荧光图像,从而低成本、高通量地大规模建模肿瘤免疫微环境,为癌症研究和个性化医疗开辟了新途径[3][4] 传统技术的局限与AI的突破 - 多重免疫荧光技术能提供丰富的蛋白质空间表达信息,但成本高昂、流程复杂,难以大规模应用[7] - H&E染色作为病理学常规检查,成本低廉且广泛应用,但无法直接显示蛋白质活性[8] - 研究核心是探索能否通过AI技术,从H&E切片中提取足够信息来预测蛋白质的空间表达[9] GigaTIME技术框架 - GigaTIME是一个通过连接细胞形态和状态来进行大规模群体肿瘤免疫微环境建模的多模态AI框架,该工具已免费开源[4] - 该框架在包含4000万个细胞的配对H&E和mIF数据上进行训练,成功实现了从H&E切片到21种蛋白质mIF图像的跨模态转换[4][10] - 输入一张H&E切片,AI模型能同时输出21个蛋白质通道的虚拟mIF图像,实现像素级的蛋白质激活状态预测[10] 大规模验证与应用 - 研究团队将GigaTIME应用于普罗维登斯健康系统的14256名患者数据,涵盖24种癌症类型和306种亚型[12] - 最终生成了299376张虚拟mIF图像,构建了迄今为止最大的肿瘤免疫微环境虚拟群体[12] - GigaTIME在DAPI核染色通道上的Dice分数达到0.72,显著优于传统CycleGAN方法的0.03[12] 临床发现与洞察 - 从生成的虚拟群体中,研究团队识别了1234个统计学显著的蛋白质-生物标志物关联,涵盖泛癌、癌症类型和亚型三个层次[13][14] - 在泛癌水平,研究证实了TMB-H和MSI-H基因型与CD138、CD20等免疫标志物的正相关,并发现KMT2D突变与CD3、CD8、CD20等免疫浸润标志物呈正相关[14] - GigaTIME能捕捉蛋白质的空间分布模式,其空间指标相比简单的激活密度能揭示更强的临床关联[16] - 研究探索了蛋白质组合效应,例如CD138和CD68的组合在预测生物标志物时表现出协同效应[16] 临床应用前景与验证 - 整合所有21个蛋白质通道的GigaTIME特征在预测患者生存方面优于单个蛋白质通道,强调了多重分析的重要性[19] - 在TCGA数据库的10200名患者中进行独立验证,虚拟蛋白质激活与普罗维登斯数据高度相关,Spearman相关系数达0.88,两个群体共享80个显著的蛋白质-生物标志物关联,显示了良好的可重复性[19] 未来展望 - 研究团队计划未来探索更多蛋白质通道,并整合细胞分割模型来研究细胞间相互作用,进一步揭示肿瘤微环境的复杂规则[21] - GigaTIME代表了多模态AI在数字病理学中的重要进展,为以更低成本、更大规模探索肿瘤微环境复杂性并开发更有效治疗策略奠定了基础[22]
微软最新Cell论文:AI 将常规病理切片转化为肿瘤免疫图谱,最终目标是生成“虚拟患者”,加速癌症治疗
生物世界·2025-12-15 04:33