iMetaOmics | 北京科技大学杜宏武组-细胞类型映射注释
Wiley生命科学
2026-01-21 10:42
文章摘要
背景:单细胞RNA测序(scRNA-seq)技术快速发展,产生了大量单细胞图谱,但不同研究在细胞类型命名上存在巨大差异,使用缩写、模糊术语或实验室特定命名法,导致数据整合和比较分析困难。研究目的:为解决细胞类型注释不一致问题,开发一个名为CellOntologyMapper的计算框架,利用自然语言处理(包括句子嵌入模型和大型语言模型Agent系统)技术,自动将用户定义的细胞类型名称映射到标准化的细胞本体(CL)和细胞分类学(CT)标识符,以实现注释标准化。结论:CellOntologyMapper在多个不同规模和复杂度的数据集中表现出高映射准确度(CL为0.835,CT为0.911),能有效处理缩写和复杂发育谱系等挑战,并提供了Python包和在线网站,便于集成到现有单细胞分析工作流中,促进大规模元分析和跨研究整合。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。