文章摘要
背景:传统人类基因组注释主要关注约19,500个经典蛋白编码基因。但近期研究表明,众多非经典开放阅读框(ncORFs)实际上可被翻译产生微蛋白或微肽,它们在疾病、免疫应答中扮演重要角色。然而,由于这些产物长度短、丰度低、保守性弱,现有蛋白注释标准难以对其进行准确评估,导致可能遗漏大量功能性小蛋白。研究目的:TransCODE Consortium团队旨在建立一套更为系统、灵活的证据评估框架,以判断哪些ncORFs可被视为真正的蛋白编码基因。为此,他们分析了GENCODE支持的7,264个ncORFs,利用PeptideAtlas中的大规模质谱数据(包括常规蛋白消化质谱和HLA免疫肽组学)进行验证,并提出了ORBL方法评估进化约束。结论:通过新建的分级框架,研究最终确定了15个高置信度的Tier 1A候选ncORFs,其中3个已被注释为蛋白编码基因。此外,研究提出“peptidein”概念,用以描述具有明确翻译证据但功能或保守性尚不足以定为经典基因的ncORF产物。以lncRNA OLMALINC上的c10riboseqorf92为例,CRISPR敲除实验显示其编码的123氨基酸peptidein在多个细胞系中影响增殖或存活,表明此类ncORF产物具有重要生物学功能。该工作为微蛋白与peptideins的注释和功能研究提供了系统性框架,并提示部分lncRNA的功能可能源于其编码的短肽。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。