阿里云&中大:全新模型有助于解码生物学语言 |《自然-机器智能》论文
Springer Nature科研服务
2025-07-08 08:30
文章摘要
本文介绍了阿里云和中山大学研究团队在《自然-机器智能》上发表的论文,该论文提出了一种名为LucaOne的预训练基础模型,旨在解码生物学语言。生物学语言被编码在DNA、RNA和蛋白质中,但由于其复杂性,解码工作一直具有挑战性。传统方法难以整合这些分子中的信息,限制了全面理解生物系统。LucaOne通过在169,861个物种的核酸和蛋白质序列数据上进行训练,利用大规模数据集成和半监督学习,展现出对DNA翻译成蛋白质等关键生物学原理的理解。该模型在小样本学习中表现优异,为生物信息学研究和解读生命的复杂性提供了灵活的框架。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。