您好,欢迎光临武汉贝纳科技服务有限公司
027-62435310 | service@benagen.com | 中文 | English 咨询客服
您现在的位置:主页 > 市场与支持 > 文献解读 >

人类poly-A转录组的Nanopore Direct RNA测序


 
随着测序技术的发展,转录组测序已成为研究基因表达调控的重要手段。传统的转录组测序需经过RNA反转录后,进行PCR,对PCR结果进行测序。这种方法,丢失了生物体内RNA的原始信息,且碱基修饰无法保留。最近出现的基于Nanopore 平台的Direct RNA测序技术,是对RNA直接测序,与传统转录组测序不同的是,Direct RNA测序能够保留并检测RNA碱基修饰信息,并能相对准确的估算ploy(A)尾长,还原真实的RNA特征。
 
下面我们以2019年11月发表在《Nature Methods》上的一篇文章为例,详细介绍Direct RNA测序的研究思路。

发表期刊:Nature Methods
发表时间:2019年11月
影响因子:28.467
 
研究材料
分别来自英国哥伦比亚大学、加拿大安大略癌症研究所、美国约翰霍普金斯大学、美国加州大学圣克鲁兹分校、英国诺丁汉大学、英国伯明翰大学的6个人B淋巴细胞系(GM12878)。
 
研究思路
从人B淋巴细胞系GM12878中分离RNA,进行Direct RNA测序,同时取相同的样品进行cDNA测序,应用MinION平台对每个研究机构的样品各测5张芯片,一共测30张芯片。获得的结果用于下游分析:isoform分析,等位基因分析,poly(A)尾长度分析,碱基修饰分析等。

图1 Nanopore Direct RNA 测序流程

研究方法
对分离的RNA,富集含有Poly-A序列,反转录成第一条cDNA链,加测序接头,再加马达蛋白,直接对RNA测一张芯片,获得RNA序列和修饰信息,详见图1a。
 
研究结果
 
Direct RNA数据统计

一共测序30张芯片,获得13M条reads,过滤后得到10.3M条reads。每张芯片过滤后的reads N50为1,334bp,中位数为771bp。比对到GRCh38人基因组上的reads数超过9,900,000条。
 
Nanopore Direct RNA测序数据中位数一致性为86±0.86%(图2a)。错配、插入和缺失分别为2.4%、4.3%和4.4%。G-for-C和C-for-G的错误率分别为0.38%和0.47%;C-to-U和U-to-C的错误率分别为3.62%和2.23%(图2b)。将得到的reads长度与GENCODE v27中已知转录本长度进行比较,结果基本一致(图2c)。


图2 Nanopore Direct RNA 测序性能统计
 
与Nanopore cDNA测序的结果相比,中位数一致性为85%,与最近发表的Nanopore DNA结果一致。cDNA测序数据的替换错误类型与Direct RNA测序数据相似。
 

线粒体RNA评估纳米孔的测序性能

线粒体 RNA 因其含量丰富,单外显子,长度差异大(349-2379 nt)的特性,可被用于评估纳米孔的测序性能,结果表明,约10%的reads与线粒体基因组一致(图3a)。


图3 线粒体 poly(A) 转录本

线粒体RNA(MT-RNA) reads 长度分析显示,比对到MT-CO2和MT-ND4L/MT-ND4上的优势reads长度与预期相符(图3b)。
 

isoform 检测和分析

Nanopore 长读长可以提高RNA外显子与外显子连接区域的分辨率,从而挖掘未注释的isoform。应用Nanopore Direct RNA测序,结合FLAIR工具,鉴定到10793个基因,这些基因一共注释到33984个isoform,52.6%未注释到剪切位点 (占总reads的13.0%)(图4a)。
 
研究发现非编码基因的剪切类型比编码基因更为复杂(图4b),这与之前的研究结果一致。


图4 Direct RNA测序的isoform分析
 

等位基因鉴定

长读长Nanopore RNA reads更容易鉴定等位基因,因为遇到杂合SNP的几率更大。本研究发现了3751个基因,其中3707个来自常染色体,44个来自X染色体。且23个特异的X-连锁基因中有22个来自于母系等位基因,唯一的父系表达的X-连锁基因,编码长链非编码RNA XIST,可以调控女性的X失活。
 
同时,鉴定到5个isoform来自不同亲本的基因。例如IFIH1基因中,来自父本isoform保留了外显子8,而来自母本的isoform不保留(图4d)。该转录本在等位基因分配中,最近的SNV距离可变剪接事件长达886 nt,而用短读长测序无法检测到的。
 

3′ poly(A) 分析

poly(A)尾在转录后调控中发挥重要作用,包括mRNA稳定性和翻译有效性。这些均聚物长达数百个核苷酸,所以短读长测序数据很难检测到。本研究使用与3' poly (A)相关的低方差电流信号(图1b),利用nanopolish-polya算法,通过校正RNA分子通过纳米孔的速度,估算poly (A)尾长度。
 
结果显示,线粒体poly(A)的长度分布集中在~50 nt,不超过100 nt,转录本poly(A)平均长度为52 nt。这与其他人细胞系的线粒体poly(A) RNA结果一致。而核转录本的长度分布更加广泛,峰值为58 nt,平均值为112 nt,大量poly(A) 尾大于200 nt。
 
该方法还发现了同一个基因的不同isoform之间poly(A)尾的区别。例如DDX5的两个isoform,一个是内含子保留型,poly(A)尾中位数长度为327nt,另外一个是编码蛋白型,poly(A)尾中位数长度为125 nt(图5c)。



图5 利用nanopolish-polya算法估算poly(A)尾长度
 

作者继续探索poly(A)尾长度与内含子保留之间的关系,结果表明,内含子保留型转录本的ploy(A)尾比不含内含子的转录本长(中位数分别为232nt 和91nt)(图5d)。

 
修饰检测

Nanopore测序可以鉴定DNA 和RNA的碱基修饰。m6A是最常见的一种mRNA内部修饰,与RNA代谢的许多方面相关。m6A失调被发现与肥胖症和癌症等人疾病相关。
 
本研究重点关注m6A甲基转移酶复合物的一个亚基—甲基转移酶3的GGACU结合序列,图6a将EEF2中假定的m6A位点的原始电流信号与体外转录复制的信号进行对比,发现m6A导致了电流信号的改变。为了验证这个结果,通过合成寡聚物(图6b)进行比较,同样检测到明显的电流差(图6c)。
 

图6 Nanopore Direct RNA测序检测m6A修饰
 

对同一个基因的不同isoform之间 m6A修饰分析,结果显示86个基因(198个isoform)的电流水平在isoform之间存在显著差异。例如SNHG8基因(图6d)。
 

总结

该研究使用Nanopore测序技术对人细胞系进行Direct RNA测序,检测到52.6%未注释到isoform,甚至可以鉴定到等位基因特异性isoform。估算了poly (A)尾长度,确认内含子保留型ploy(A)尾比不含内含子的长。并鉴定到了m6A碱基修饰信息,发现isoform之间 m6A修饰存在显著差异。结果表明,Nanopore Direct RNA测序在研究转录后调控方面具有重要作用。
Copyright © 2018 武汉贝纳科技服务有限公司 . All Rights Reserved. Designed by 鄂ICP备13016520号-1技术支持:中网维优