Nat Commun丨8亿参数单细胞转录组基础模型推动智能分析新范式——CellFM
BioArt
2025-05-27 17:30
文章摘要
本文介绍了中山大学杨跃东教授团队联合重庆大学曾远松团队、华为、新格元生物科技,依托国家超算广州中心“天河星逸”超算系统,成功研发出全球规模最大的单细胞基础大模型CellFM。该模型整合了超1亿人类单细胞数据,构建了8亿参数的深度学习框架,在生物表征学习和跨数据集泛化能力上取得重要进展。CellFM在细胞注释、扰动预测和基因功能预测等下游应用中性能显著优于现有模型。此外,CellFM能够模拟细胞对基因敲除、过表达或药物处理的响应,快速筛选潜在的药物作用机制或基因调控结果。研究团队通过混合精度训练与梯度累积策略,快速实现了CellFM的高效训练与优化。CellFM的成功构建为通用型单细胞基础模型开发提供了新范式,有望加速单细胞组学在多场景中的应用拓展,推动生命科学与智能计算的深度融合。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。