您好,欢迎光临武汉贝纳科技有限公司
027-62435310 | service@benagen.com | 中文 | English 咨询客服
您现在的位置:主页 > 市场与支持 > 文献解读 >

文献解读 | NBT发表基于Nanopore测序对全长circRNA进行综合分析成果

正文

 

鉴于环状RNAs(circRNAs)和其相应的线性mRNAs的相似性,短片段测序重构circRNAs序列具有挑战性,无法实现对全长circRNAs的高通量检测。本研究提出了一种实验和计算方法(CIRI-long),利用纳米孔测序技术(ONT)对全长circRNAs进行广泛的分析。该方法在检测和重建circRNA的效率和可靠性方面比目前可用的方法有相当大的优势,并对circRNA的多样性和生物合成提供了新的见解。

 

图片

 

文章题目:Comprehensive profiling of circular RNAs with nanopore sequencing and CIRI-long

发表期刊:Nature Biotechnology

IF:36.558

发表时间:2021.04

 

研究背景

 

circRNAs是一大类具有共价环状结构的RNAs,参与许多生物过程的调控。对circRNAs进行鉴定,现有的工具大多数依赖于Illumina测序(RNA-seq)短reads的比对,检测能力受到读长的限制。长读长测序技术包括PacBio和ONT,允许对cDNA分子进行全长测序,利于转录产物的异构体鉴定。然而,这些大多数研究中,cDNA是用oligo(dT)引物进行测序的,并不适合circRNA的检测。

 

材料方法

 

材料:2只小鼠的脑组织样本

测序平台:Nanopore MinION

 

技术路线

主要结果

 

1、优化后的高效识别circRNAs的测序方案

为了有效地富集circRNAs,使用RiboZero试剂盒从提取的总RNA中去除核糖体RNA(rRNA)。然后在RNase R酶消化前先添加poly(A)-tailing处理,以提高线性RNA的降解效率。之后,用随机引物和SMARTer反转录酶进行滚环扩增,通过产生含有多个全长circRNA序列拷贝的长cDNA分子来扩增circRNAs。在这一步骤中,SMARTer测序适配器被添加到cDNA分子的两端,以使这些长cDNA的有效扩增没有poly(A)尾。最后,筛选片段大小构建纳米孔测序文库,使用MinION平台进行测序。

 

图片

图1 circRNA测序文库构建和分析流程

 

作者开发了一种新的算法-CIRI-long,从ONT数据中对circRNA进行表征和异构体定量(图1b)。首先基于k-mer的方法,从测序Reads中识别出测序Reads中包含的circRNA全长序列的多重拷贝片段,得到高准确度的circRNA全长一致性序列(CCS)。将CCS序列和参考基因组进行比对,对其中的反向剪切位点及内部可能存在的可变剪切进行匹配,从而实现全长circRNA的准确识别和重构。

 

2、捕获全长circRNAs分析流程的测试与优化

为了系统评估纳米孔测序和CIRI-long分析方法的整体准确性和效率,研究者采用2只小鼠的脑组织样本,每只小鼠进行两批次实验,每个批次实验按照带或不带poly(A)-tailing,SMARTer或Maxima逆转录,用或不用RNase H消化等因素设定4个condition。第一批次实验在4个condition基础上设置了RNase H处理和不处理的条件,所得样品不经过片段长度富集。第二批次实验4种condition不经过RNase H 处理,但会分别筛选中、长度片段。这样一共获得32个ONT文库。此外每组生物学重复还分别作了RNase R处理与不处理的Illumina二代测序,用于对比分析。对比结果显示相对于二代测序,ONT测序结合CIRI-long分析方法可将circRNA检出率提高20多倍。使用纳米孔测序技术进行circRNA检测的最佳策略应包括加poly(A)和RNase R消化的总RNA处理以及随后在RNase H-条件下用SMARTer RT进行逆转录。最佳片段大小的选择应该是大约1kb。

 

图片

图2 捕获全长circRNA的实验优化

 

3、使用模拟和Illumina RNA-seq数据集对circRNA进行验证

为了评估CIRI-long的可靠性,研究人员对比了NanoSim模拟数据集,用CIRI-long描述模拟数据中的circRNAs,F1得分达到0.92,CIRI-long检测到的CCS的长度也与模拟数据集的长度高度相关(图3a)。对于绝大多数(96.57%)识别到的circRNAs,CIRI-long能够准确地确定junction的位置。考虑到纳米孔测序数据的错误率相对较高,作者评估了原始序列和CCS的准确性。随着片段长度的增加,全长CCS的覆盖率也相应增加,使得CCS的准确性可达92.6%到98.1%之间。以上结果表明,优化的ONT测序策略结合CIRI-long算法方法可以提高ONT测序检测circRNA的准确性。

 

使用CIRI-long算法对32个ONT测序数据集进行分析,结果显示两只小鼠分析结果具有高度重复性。重复样本的circRNAs表达Pearson相关系数为0.91。Illumina和ONT数据集分别检测到32,223和140,588个circRNAs(图3d),两个数据集中检测到共有的circRNAs为15,673个,占Illumina RNA-seq数据的86.42%(图3e)。大量的circRNAs只存在于ONT数据集中,这些ONT特异的circRNAs一般表达水平较低,说明该ONT测序体系具有更高的灵敏度,可以检出更多的circRNA分子。作者随机选取了16个circRNA进行QPCR验证,结果与本批ONT数据结果的趋势高度一致,证明了CIRI-long对circRNA检测和定量的准确性。

 

 

图3 使用模拟和Illumina数据集验证circRNAs

 

4、CIRI-long揭示circRNA可变剪切多样性

在这批ONT数据中,检测出15905个基因来源的circRNA发生了115,755种可变剪切事件,四种类型的可变剪切都存在,而Illumina RNA-seq数据只确定了6,928个来源基因的circRNA发生25,159个剪切事件。例如,纳米孔测序数据中,Rims2基因检测到65个高置信度的circRNA全长异构体(≥10个支持读数)(图4b)。而Illumina RNA-seq数据仅检测到10个异构体的完整序列。表明ONT测序对复杂的circRNA异构体和剪接事件的检出的灵敏度更高。

 

图片

图4 circRNA的可变剪切多样性

 

5、内含子自连接的circRNAs

鉴定到的circRNA分为两大类:能够匹配注释(Annotated)和不能被注释的(Novel),其中Novel类型包括完全由内含子来源的,基因间区或反义链来源的。本批数据发现一定比例的内含子来源circRNAs。作者将内含子circRNAs分为三类:内含子外显子circRNAs、内含子自连接circRNAs和套索结构内含子circRNAs(图5b)。内含子外显子circRNAs使用典型的AG/GT剪接信号,保守性较低;内含子自连接的circRNAs,其内部的GT/AG剪接信号与大多数外显子和内含子circRNA的侧翼AG/GT信号截然不同,保守性很强,表明这些circRNAs具有不同的生物合成机制。

 

图片

图5一种新型的内含子自连的circRNAs

 

研究结论

 

本研究提出了一个使用ONT测序直接检测全长circRNA异构体的实验方案和算法。通过不同的数据集对CIRI-long进行综合评估,证明了该体系在解码circRNA异构体和剪切复杂度等方面的可靠性。

 

文献链接

https://dx.doi.org/10.1038/s41587-021-00842-6

 

 

 

Copyright © 2018 武汉贝纳科技有限公司 . All Rights Reserved. Designed by 鄂ICP备2021008976号-2技术支持:中网维优