您好,欢迎光临武汉贝纳科技服务有限公司
027-62435310 | service@benagen.com | 中文 | English 咨询客服
您现在的位置:主页 > 市场与支持 > 文献解读 >

Direct RNA 测序(DRS)揭示拟南芥mRNA加工和m6A


研究背景
 
mRNA前体的加工和碱基修饰决定了真核生物mRNA的编码潜力和命运。可变转录本是同一基因由于转录起始位点、剪接位点和Poly(A)长度以及剪切到成熟mRNA的外显子组合等因素产生的。RNA修饰在基因表达上下游的活动中起着关键的作用,m6A是mRNA最丰富的修饰,传统的RNA-seq无法识别m6A修饰。


实验设计

人工合成RNA评估方法的可行性
人工合成的已知含量和Poly(A)长度不含有修饰位点的RNA MALAT1 Cntrl和只含有一个m6A修饰位点的RNA MALAT1 m6A。使用Nanopore对RNA直接进行测序(Direct RNA 测序,简称DRS),评估Direct RNA 测序能否准确鉴定Poly(A)长度和对RNA准确定量。同时开发m6A分析方法。




对样品进行分析

分别选取野生型拟南芥(Col-0),m6A修饰缺陷突变体(vir-1)和在vir-1中线性表达缺失蛋白恢复功能的补体(VIRc)。分别进行Direct RNA 测序和Illumina RNA测序,对isoform、正反义链、可变剪切、Poly(A)长度、m6A修饰进行分析。
 


研究结果
 
数据统计


对4个生物学重复的Col-0幼苗含有Poly(A) 的RNA进行富集,将外部合成的RNA(ERCC)加入样品中。使用Nanopore直接对RNA进行测序;同时使用Illumina 进行RNA测序。Direct RNA测序每个样品产生1M左右的reads。mRNA的最长reads比对为12.7kb,跨越63个外显子;和12.8kb,跨越58个外显子,代表了从拟南芥中测序的一些最长的连续mRNA。最短的序列是非编码RNA序列。
 

使用2个ERCC(MALAT1 m6A和MALAT1 Cntrl)对测序数据准确性进行评估,定量一致性是92%。使用Illumina纠错后,定量一致性提高。

 
在纳米孔DRS中假反义很少见或不存在

Direct RNA 测序0.02%的ERCC reads 比对到了反义链,19665条高表达的RUBISCO ACTIVASE序列没有1条比对到反义链。因此可以确定假反义RNA在Direct RNA数据中是罕见的或不存在的。这简化了对真实反义RNA的解释,这在拟南芥中很重要,因为cDNA的测序方式对于正反链的识别是很困难的。通过Direct RNA测序,可以识别拟南芥的非编码反义RNA,例如PIN4和PIN7的反义RNA。


Direct RNA 测序可以准确识别3’末端的位置并估计了Poly(A)尾长

 

 

首先使用合成的ERCC RNA评估Poly(A)长度的准确性,ERCC-00002的预期Poly(A)尾长为24nt,ONT测序得到的中值为23.3nt;ERCC-00074的预期Poly(A)尾长为24nt,ONT测序中值为27.4nt。结论是,对Poly(A)尾长的估计的中位值在几个碱基内是准确的,但是有个别read 有很大误差。

分别对总mRNA、叶绿体和线粒体编码RNA的poly长度进行评估,长度的中位数和范围分别是,68nt(13-200nt);13nt(3.1-56);20nt(4.1-73)。细胞器转录本的Poly(A)长度与RNA衰变符合。还发现Poly(A) 长度与基因表达负相关。
 



可变剪切分析和isoform

在全基因组范围内比较Direct RNA 测序和作者以前使用Helicos数据比对到3’末端的位置,发现总体分布类似(二者之间的平均距离为0±13 nt)。
 
二代RNA-seq对于Poly(A)的位点和真实特征容易造成误判,在DRS数据中,是非常罕见或不存在的。在10116条序列中,只有4条具有13nt内的reads比对。其中,2条进行纠错后未被检测到(这表明它们是由对齐错误引起的),另外2条映射到编码序列注释的末端外显子,这表明它们可能是真实的3’末端。因此DRS对3’末端的检测是准确的。
 



DRS揭示了复杂的RNA剪切

在单reads中,Nanopore测序揭示了拟南芥已报道的最复杂的剪接组合。例如,纠错后的reads揭示了由63个外显子组成的12.7kb序列的剪接模式,与Araport11中注释的AT1G48090.4亚型完全一致。还检测到FLM(AT1G77080)的互斥选择性剪接,一些是已经注释的,其中11个是新发现亚型。使用Illumina数据纠错后的数据鉴定的39061个剪切位点(13%)是数据库中没有注释的,因此纠错后的数据是可以对拟南芥的剪切类型进行准确鉴定的。
Direct RNA测序在4个Col-0样品中检测到的多数剪切位点(Araport11注释的75%和AtRTD2注释中的69%)是在Illumina RNA-seq 也可以检测到,其中81%是典型的GU/AG位点。Direct RNA测序和Illumina RNA-seq同时发现了3234个新的剪切位点,对其中3个RT-PCR和Sanger 测序进行验证,发现是真实的剪切位点。



因此,这种方法定义了由已知剪接位点的替代组合产生的剪接模式(包括内含子保留)。发现了8659个新的剪切形式,其中的50%(4293)由已知剪接位点(Araport11或AtRTD2注释的剪切位点)的替代组合产生的剪切模式(包括内含子保留)。




接下来,作者研究DRS检测的可变剪切的是否具有功能。作者确定了新无义介导的mRNA降解(NMD)和提前终止密码子(PTC)。 例如,编码KH结构域蛋白的mRNA处的外显子跳跃(AT5G56140)和编码XRCC的mRNA处的AT1G80420)PTC插入。
 
总之DRS可以揭示全长mRNA背景下更复杂的剪切类型,不过需要二代数据进行纠错。

m6A修饰检测

基于合成的RNA,作者开发了m6A修饰鉴定的方法,并在全转录组范围内绘制m6A修饰图谱。发现使用抗体富集的方法无法检测的新的motif类型AGAUU。为确定检测m6A修饰检测的有效性,使用miCLIP分析了2个Col-0样品。66%的DRS检测位点落在miCLIP峰的5nt范围内。得出结论,DRS数据可以在转录组范围内检测m6A修饰。作者同时对测序覆盖深度和甲基化的检测做了评估。
 
缺陷m6A扰乱基因表达模式并延长昼夜节律

通过定量分析发现vir-1中基因整体的表达水平较VIRc低。因此m6A有利于mRNA稳定与人类促进mRNA衰变不同。正确控制生物节律、开花时间和FLC的调节模块最终需要m6A的修饰,并且与Poly(A)长度有关。
 


m6A的缺失干扰RNA 3’末端形成

在vir-1中RNA 3’末端形成明显缺陷。在vir-1突变体中鉴定了3579个基因中Poly(A) 发生变化, 3008变短,只有571变长。与Illumina测序的结果一致(3408个基因的Poly(A)变短,166个变长)。同时发现了vir-1突变体3'末端位置的改变可能是m6A缺失造成的。
 

参考文献

Parker M T. et al. Nanopore direct RNA sequencing maps the complexity of Arabidopsis mRNA processing and m6A modification. eLIFE 2020 9: e49658. DOI:https://doi.org/10.7554/eLife.49658.
 
 
Copyright © 2018 武汉贝纳科技服务有限公司 . All Rights Reserved. Designed by 鄂ICP备13016520号-1技术支持:中网维优