Multimodal Language Model

搜索文档
Nature Biotechnology:西湖大学原发杰/常兴团队等开发ProTrek,以自然语言“导航”蛋白质宇宙
生物世界· 2025-10-03 01:00
编辑丨王多鱼 排版丨水成文 想象一下,在未来,我们寻找功能特定的蛋白质,能像使用搜索引擎一样便捷 —— 只需输入一段自然语言 描述,即可在浩瀚的蛋白质宇宙中进行精准定位。 如今,这一设想正变为现实。西湖大学 原发杰 、 常兴 教授团队联合香港科技大学(广州) 卢泓远 教授 团队,成功开发出了 新型三模态蛋白质语言模型 —— ProTrek ,为蛋白质科学研究带来了新的范式。 这项研究成果于 2025 年 10 月 日,发表在了国际顶尖学术期刊 Nature Biotechnology 上,论文题为 : A trimodal protein language model enables advanced protein searches 。 蛋白质研究的挑战与机遇 蛋白质 作为生命活动的主要执行者,其序列、结构与功能之间的复杂关系 ( SSF 关系) 是现代分子科学 和药理学研究的基石 。然而,破译这一关系充满挑战。传统的分析工具,如 BLAST 和 Foldseek ,虽然 功能强大,但它们本质上被限制在单一模态内部进行成对比较,无法发现序列、结构与功能之间的跨模态 联系 。 这种方法的局限性,加上许多工具为 ...