Nat Mach Intell|基于文本引导的蛋白质设计框架
智药邦
2025-04-03 08:00
文章摘要
本文介绍了ProteinDT,一个基于文本引导的蛋白质设计多模态框架。背景方面,当前AI辅助蛋白质设计主要依赖蛋白质序列和结构信息,而人类整理的文本中蕴含的高层次蛋白质功能知识尚未被充分利用。研究目的是探索文本描述在蛋白质设计中的应用,并验证其有效性。ProteinDT包括三个关键步骤:ProteinCLAP(对齐文本与蛋白表示)、表示生成器(由文本生成蛋白表示)和序列解码器(将表示转化为蛋白序列)。研究结果表明,ProteinDT在文本生成蛋白、零样本蛋白编辑和蛋白性质预测三项任务中表现优异,准确率超过90%,并在多项基准任务中取得领先表现。结论指出,ProteinDT为无需实验数据、仅靠文本描述即可定制功能蛋白的设计路径奠定了基础。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。