Workflow
BioEmu
icon
搜索文档
AI for Science,走到哪一步了?
36氪· 2025-12-03 09:15
科学智能技术演进与谷歌DeepMind引领作用 - 谷歌DeepMind凭借以TPU为核心的AI算力基础设施和以Gemini为基础的大模型底座,持续深耕科学智能技术超过十年,引领全球技术演进[4] - AlphaFold标志着蛋白质结构预测问题的实质性解决,不仅斩获2024年诺贝尔化学奖,更成为现代生物学的数字基础设施[4] - AlphaProteo推动生物学研究正式跨入生成式生物学时代,结合AlphaMissense精准预测基因突变致病性,打通"靶点发现—结构解析—药物设计"全链路[4] - WeatherNext 2模型在99.9%的预测变量与时间跨度上准确率均优于欧洲中期天气预报中心的HRES系统,且推理速度提升了数个数量级[5] - GNoME预测了数百万种稳定的新材料结构,规模相当于人类过去几十年实验发现总和的数倍,为电池技术与超导材料研发提供庞大候选库[5] - AlphaEvolve引入进化计算范式,自动搜索发现更高效的机器学习算法与损失函数,实现从"人工设计"到"自动发现"的元层级跨越[6] 生物学领域科学智能突破 - 谷歌和耶鲁大学联合发布270亿参数单细胞分析基础模型C2S-Scale,生成关于癌细胞行为的全新假设并在体外实验中得到验证[8] - 微软BioEmu模型在蛋白质动力学模拟方面实现高达10万倍的模拟速度提升,中科院团队提出整合结构和进化约束的反向折叠蛋白质预测模型[9] - 谷歌通过10年持续研发构建了从基因测序、读取到疾病基因检测和诊断的AI基因组学研究和应用体系[9] - 腾讯DeepGEM病理大模型只需常规病例切片图像即可在1分钟内完成肺癌基因突变预测,精准度达78%至99%[10] - 谷歌发布DeepSomatic工具集用于肿瘤细胞基因变异识别,适用于白血病、乳腺癌、肺癌等癌症类型[10] - AI优化候选药物MTS-004已完成III期临床研究,成为国内首款完成III期临床的AI赋能制剂新药,突破过去几年AI驱动药物发现鲜有突破临床II期的瓶颈[10] 多学科科学智能应用拓展 - Periodic Labs开展新型超导材料等AI自动化发现,CuspAI获1亿美元A轮融资研发AI平台用于发现碳捕获新材料[11] - DeepMind飓风AI模型成功预测"梅利莎"等超强飓风路径和强度变化,黑洞理论物理学家利用GPT-5在半小时内推导出黑洞理论新特性[11] - 数学研究人员利用GPT5探索解决历史数学难题埃尔德什难题,英伟达开源模型系统GenCluster获得IOI 2025竞赛金奖[12] - OpenAI内部模型、Gemini Deep Think和DeepSeek Math-V2等大模型不断刷新AI在奥林匹克数学竞赛的金奖成绩[12] 科学智能科研范式重构 - 通用基础大模型成为科学智能的"操作系统",提供强大理解、推理、分析及生成能力,帮助科研人员大幅提升日常科研效率[14] - 科研专用大模型作为垂直科研领域的"专用引擎",融合特定领域相关知识以及研究方法与经验,谷歌在此方面综合实力处于全球领先[14] - AI智能体从被动工具转变为科学家的合作者甚至主动发现者,ToolUniverse平台包含超过600个科学工具并兼容主流基础大模型[15] - AlphaEvolve是具有编码能力的进化型AI智能体,可进行数学和计算通用算法的主动发现和自动化优化,已应用于谷歌内部实际场景[15] 自主实验室平台化发展 - MIT等美国多家科研高校和国家实验室已建成自主实验室,英国利物浦大学的材料创新工厂是欧洲最先进的自主实验室之一[16] - 美国《创世使命》计划将科研算力、AI基础模型、数据集及自主实验室体系集成为科学与安全平台,作为科研智能基础设施[16] - 晶泰科技的AI+机器人平台已成为核心竞争力,中科院"ChemBrain智能体+ChemBody机器人"和北京科学智能研究院Uni-Lab-OS加速推动国内自主实验室研发[17] - 磐石·科学基础大模型实现对数据和模型等资源的管理及科研工具调度,已在生命科学、高能物理和力学研究领域进行应用[17]
字节Seed发布PXDesign:蛋白设计效率提升十倍,进入实用新阶段
量子位· 2025-10-01 03:03
核心观点 - 字节跳动Seed团队Protenix项目组提出新一代蛋白设计方法PXDesign,在生成效率与湿实验成功率方面达到领域领先水平[1][3] - PXDesign采用“生成+过滤”组合技术路线,其中基于Diffusion的PXDesign-d方案在生成质量、通量和结构多样性方面表现最佳[13][16] - 团队推出公开免费的在线设计服务PXDesign Server及标准化评估工具箱PXDesignBench,显著降低蛋白设计门槛并推动领域标准化发展[4][27][32] 技术突破与性能表现 - PXDesign在24小时内可生成数百个高质量候选蛋白,生成效率较业界主流方法提升约10倍[3] - 在多个靶点上实现20%-73%的湿实验成功率,相同靶点相较DeepMind的AlphaProteo提升2-6倍[3][10] - 针对VEGF-A、H1、TNF-α等高难度靶点,PXDesign-d效率较以往方法提升数倍甚至数百倍[16] 方法架构优势 - PXDesign-d采用复杂度为O(N²)的DiT网络结构,相比RFdiffusion的O(N³)模块可实现更大规模数据训练和更高生成效率[17] - 对比Hallucination路线(需多轮迭代调用结构预测模型),PXDesign-d无需反向传播优化,速度显著提升[18] - 过滤环节结合自研Protenix模型与AlphaFold 2,构建更稳定精准的筛选标准,Protenix-Mini模型将200步扩散过程简化为2步,效率提升数倍[22][24][25] 工具与服务创新 - PXDesign Server提供Preview模式(20-30分钟返回5-25个候选)和Extended模式(生成更多高质量候选),支持一站式binder设计[28][30][31] - PXDesignBench整合主流评估指标与流程,开源评估框架助力领域公平比较与方法迭代[32] - 免费网页服务突破计算开销限制,使高水平binder设计成为常规科研工具[4][20][29] 行业背景与意义 - 2024年诺贝尔化学奖授予蛋白结构预测与计算设计领域,凸显“反向设计”新蛋白的学术与产业价值[6][7] - AI蛋白设计有望替代传统高通量实验筛选(需数万候选分子),为癌症、感染等疾病带来全新疗法[8][9][12] - 科技巨头加速布局生物计算领域(如微软BioEmu、苹果SimpleFold),预示AI驱动生物制药行业成为新竞争高地[33][34]
微软研究院BioEmu登上Science,用生成式AI重塑蛋白质功能研究
机器之心· 2025-07-11 08:27
微软BioEmu生成式深度学习模型研究 - 微软研究院AI for Science团队在《Science》发表论文,提出名为BioEmu的生成式深度学习模型,能高效模拟蛋白质构象变化 [1][6] - 该研究为理解蛋白质功能机制和加速药物发现开辟新路径 [6] 技术突破与创新 - BioEmu结合AlphaFold静态结构、200毫秒分子动力学模拟数据和50万条蛋白稳定性实验数据训练而成 [8] - 模型可在单张GPU上每小时生成上千个独立蛋白质结构 [8] - 基于扩散模型架构,结合AlphaFold的evoformer编码器和二阶积分采样技术 [12] - 能模拟蛋白质功能过程中的关键结构变化,如隐性口袋、局部解折叠和结构域重排 [12] - 自由能预测误差达1 kcal/mol,与实验数据高度一致 [14] - 对突变体稳定性变化预测表现出色,平均绝对误差低于1 kcal/mol,Spearman相关系数超0.6 [16] 应用与资源开放 - 研究团队在GitHub和HuggingFace开源模型参数和代码 [19] - 发布超过100毫秒的MD模拟数据,涵盖数千个蛋白系统和数万个突变体 [19] - 模型已部署在Azure AI Foundry和ColabFold等平台 [19] 未来发展前景 - 当前主要建模对象为单体蛋白质,未来计划扩展到蛋白质复合物、蛋白-配体相互作用等更复杂生物体系 [21] - 有望成为连接结构与功能、理论与实验的桥梁,应用于蛋白质科学、药物设计和合成生物学等领域 [21]