您好,欢迎光临武汉贝纳科技有限公司
027-62435310 | service@benagen.com | 中文 | English 咨询客服
您现在的位置:主页 > 市场与支持 > 文献解读 >

文献解读| 直接RNA测序联合蛋白组检测揭示植物lncRNA编码的谱系特异性微蛋白

真核生物基因组的普遍转录导致长非编码RNA(lncRNAs)的表达,其中大多数lncRNAs在进化过程中保守性差,似乎没有功能。然而,一些lncRNAs已被证明具有特定的功能,尤其是转录调节,位于lncRNAs上的成千上万个小型开放阅读框(smORFs,< 100个密码子)可能被翻译成肽或微蛋白。本研究通过Nanopore转录组测序和蛋白组检测技术证明smORFs编码的微蛋白是植物蛋白质组中一个主要的、功能多样的组成部分。

 

图片

 

文章题目:A vast pool of lineage-specific microproteins encodedby long non-coding RNAs in plants

发表期刊:Nucleic Acids Research

IF:16.971

发表时间:2021.09

 

研究背景

 

有研究表明动植物某类型细胞在某些发育阶段基因组碱基全部转录,这些转录产物中的绝大多数(98–99%)似乎是非编码RNA。其中主要的一类是lncRNAs,传统上被定义为长度超过200个核苷酸(nt)的转录物,没有编码潜能;只有少数lncRNA在染色质重塑和基因表达调节中发挥特定功能。那么,所有lncRNAs都是非编码的吗?最近的研究表明lncRNAs中的潜在翻译区是smORFs,smORFs编码的一些肽或微蛋白已被证明具有多种生物学功能。该研究人员使用苔藓的lncRNAs作为参考集,对植物分类群中的smORFs保留进行了全面分析,鉴定出数千种进化保守的smORFs,并通过蛋白组学验证了大量smORFs转化为肽或蛋白质的过程。

 

材料方法

 

材料:公开的lncRNA数据集(CANTATdb数据库2.0的1498,GreeNC的9418, P. patens NCBI注释的lncRNAs3018,Lung 等人论文中的lncRNAs 1512, Simopoulos等人的论文中的4648 lncRNA) ;苔藓原丝体和配子体

方法:smORFs的预测和分类;直接RNA测序

 

主要结果

 

1、 lncRNA-smORFome的综合生物信息学特征(模式植物苔藓smORF

首先根据数据库中的注释定义模式植物苔藓的lncRNAs,之后使用MIPEPD来预测AUG密码子起始的smORFs(10到100个aa),NCBI ORF finder来定义具有非规范起始、UUG和CUG起始的smORFs。根据smORFs 区域相似度和长度将smORFs划分为未分类、 微蛋白和新smORFs等3类(图1C)。AUG起始的smORFs编码的微蛋白/肽的氨基酸组成与功能性蛋白组的组成不同,特别是在一些疏水性氨基酸的含量上(图1E)。蛋氨酸和半胱氨酸频率的增加以及丙氨酸、谷氨酸和天冬氨酸的频率降低与哺乳动物lncRNAs中smORFs的特征相似。

 

图片

图1  smORFs的预测与分类

 

2、 许多lncRNA smORFs在不同植物谱系中是保守的

植物lncRNA的进化保守性分析显示,与lncRNA相比,mRNA的转录在不同植物之间保守性要高得多(图2A)。在微小mRNAs中,保守区的中位数略大于lncRNA,但微小mRNAs显示出更强的进化保守(图2A-B)。接着分析了氨基酸序列水平的smORFs保守性。在从苔藓向其他植物谱系过渡中,smORFs的保守性迅速下降,特别是“新” smORFs的快速耗尽。注释蛋白(包括微小CDS)比smORFs更广泛地保存,而在古老的植物群中,保守蛋白的数量只下降了一小部分(图2C),这些发现与先前描述动物基因组中smORFs快速转换的结果一致。

 


图2 lncRNA和smORFs的进化守恒

 

3、 lncRNA和smORFs的进化速率和选择

接下来,作者分析了P. patens和Physcomitrium sp.之间4022个smORF重叠保守lncRNA区域的进化速率,结果表明存在一组smORF,它们可能编码广泛保守的小蛋白,通过正选择在相对密切相关的群体或微生物中维持,这和“动物基因间lncRNA的保守区域富含翻译的smORF”相符。

 

图3 lncRNAs、mRNAs、smORFs和蛋白质编码基因的进化率和选择机制

 

4、植物微蛋白的结构特征

本研究发现许多含有低复杂度区域(LCR)的微蛋白在植物蛋白质组注释中可能被忽略(图4)。

 

图4 smORFs编码的微蛋白的低复杂性区域

 

许多lncORF smORFs包含跨膜结构域和信号肽。低复杂性区域在分泌和跨膜微蛋白起源和进化中的作用还不清楚。通过LCR - smORF富含非极性氨基酸的特性,识别出32%的LCR - smorf,均包含分泌或跨膜肽(图5J)。一个89-aa的微蛋白smORF包含一个与信号肽重叠的LCR和另一个在c端富含脯氨酸的LCR。在没有低复杂度过滤的情况下,TBLASTN搜索显著扩大了苔藓物种中已识别同源基因的数量,表明这种smORF的广泛保守(图5K)。

 

图5 具有跨膜或信号肽的smORFs

 

5、lncRNAs的表达和smORFs的翻译

为了分析苔藓中不同lncRNAs的表达,并进一步将其与mRNA进行比较,作者对P. patens原丝体和配子体的polyA RNA进行了纳米孔直接RNA测序,该分析证实了57%的lncRNA编码位点的转录。结合前期的质谱分析结果来识别翻译后的smORFs,共获得了195个smorf的翻译证据,包括56个高置信的smORFs。大约44%被翻译的smORFs属于新的smORFs(图6)。大约31%的新翻译的smORFs不是保守的,表明微蛋白的快速周转。

 

图6 smORFs的转录和翻译分析

 

研究结论

 

本研究分析揭示了smORFs的出现和随后演变的几个可能过程。首先,一些被鉴定的保守smORFs是真正的微蛋白或分泌肽的前体。这种情况下,相应的转录本被错误地识别为长链非编码RNA或具有双重功能的转录本。第二,大部分smORFs要么是偶然出现在一个物种中,要么是只在接近的物种中出现或消失。这些smORFs中有一部分可以被翻译成smORFs编码肽(SEPs),但各自lncRNA的表达水平和翻译水平都很低。这些可译但保守性差的多肽通过正选择出现功能性微蛋白。第三,有一个smORFs的子集在核苷酸水平上是保守的,但不显示蛋白质选择信号。

 

参考文献

Igor Fesenko,et al. A vast pool of lineage-specific microproteins encoded by long non-coding RNAs in plants. Nucleic Acids Research,2021

 

 

 

Copyright © 2018 武汉贝纳科技有限公司 . All Rights Reserved. Designed by 鄂ICP备2021008976号-2技术支持:中网维优