您好,欢迎光临武汉贝纳科技有限公司
027-62435310 | service@benagen.com | 中文 | English 咨询客服
您现在的位置:主页 > 市场与支持 > 文献解读 >

文献解读| Direct RNA测序应用于系统生物学研究所需的最低重复样本数量


本研究采用ssGSEA和singscore两种pathway评分方法评估了DRS检测的基因丰度是否适合于单一样本的可靠估计,结果表明这两种算法均至少需要两个ONT重复样本才能获得可重现的pathway分数。

 

图片

 

文章题目:Oxford Nanopore MinION Direct RNA-Seq for Systems Biology

发表期刊:Biology

发表时间:2021.12

 

研究背景

 

Illumina的RNA-seq方案是临床应用研究的主要优势。然而,短读长不适合对长转录本进行测序,增加亚型识别映射错误的可能性。DRS允许检测核苷酸修饰和估计多聚-A尾长度,在识别选择性剪接异构体方面具有显著优势,无需进行读取映射或组装。

 

临床研究已经开发了几种单样本算法ssGSEA和singscore来推断单个患者的激活分数。本研究利用这两种方法测试了单重复样本的直接RNA测序数据,通过关注蛋白质编码基因和转录本,评估了ONT技术重复的重现性,并对其与Illumina平台在所需重复数量方面进行了比较。该结果可能对临床上计划通过直接RNA测序分析基因丰度的研究人员有帮助。

 

材料方法

 

材料:HepG2细胞系。

测序平台: Nanopore MinlON,Illumina NovaSeq 6000

 

主要结果

 

1、 工作流程

使用ONT MinION进行5个技术重复的测序,使用Illumina NovaSeq 6000进行3个技术重复的测序。结果表明,与其他使用Illumina和ONT平台的实验数据基本一致,单个Illumina RNA-seq实验产生大约3000万reads,而使用MinION/GridION进行直接RNA测序,可以获得大约100万reads。

 



图1  实验的总体工作流程

 

2、 平台内和平台间的可重现性

接下来,作者对单个重复的基因量化重复性进行评价。数据仅限于在每个平台的所有重复样本中观察到的基因。Illumina平台的中位变异系数(CV)为27.34%,而ONT的中位CV更高,为33.93%(图2A)。在ONT(平均R = 0.952,图2B)和Illumina(平均R = 0.969,图2c)中,重复间的Spearman系数测量的平台间相关性都很高。平台间平均基因rank之间的Pearson相关性为R = 0.914(图2D)。低表达基因中可以看到更明显的测序平台偏差。另外,有554个基因未在Illumina重复中检测到,1850个基因未在ONT复制体中检测到。总的来说,与其他研究结果一致,该研究显示了良好的平台间和平台内一致性。但与ONT相比,Illumina平台在重现性方面表现得更好。

 


图2 Illumina和ONT平台内和平台间变异的比较

 

3、 用于基因/转录本鉴定的ONT重复数量

本研究试图估计检测HepG2细胞中表达的大多数蛋白编码转录本所需的ONT重复样本数量。作者采用以下方法模拟纳米孔RNA-seq实验的不同重复样本数量。对于每种重复数量,nrep,采取了所有可能的实验重复组合。例如,对于nrep=4,有以下ONT重复样本组合:(1,2,3,4),(1,2,3,5),(1,2,4,5),(1,3,4,5)和(2,3,4,5)。如果在组合中包含至少一个复制中检测到了转录本或基因,则称其表达。模拟结果如图3所示。

 

图片

图3 不同重复数量下检测到的特征(转录本/基因)总数

 

当改变重复数时,通过评估表达的转录本和基因的数量来评估测序性能。对于单个ONT复制,我们平均检测到34517±557个蛋白质编码转录本和12353±158个蛋白质编码基因。对于两个ONT复制,共有37172±1196个转录本和12906±212个基因。正如预期的那样,复制数量的增加量化了更多表达的基因和转录本,对于五个复制,我们检测到总计40093个转录本和13655个基因。检测趋势显示,从一个复制到两个复制的量化基因数量显著增加,而导致更多复制的优势相对较小。因此,为了权衡样本重复的数量和量化的转录本/基因的数量,至少2个生物学重复是比较合理的。

 

4、 用于量化通路激活的ONT重复样本数量

接下来,研究人员评估了通过直接RNA测序获得的基因丰度是否足够稳健用于预测pathway和基因集。以Illumina获得的数据用作参考,分析ONT不同重复数量组合生成的各种数据集。利用两种流行方法(singscore和SSGSEA)对单个样本的分子特征(基因集,pathway)进行评分。根据每一对pathway之间的Spearman相关性,评估pathway再现性。对于多个ONT重复样本的所有成对组合,整个过程重复多次。对Illumina数据也进行同样的处理,模拟结果如图4所示。

 

图4 pathway得分之间的两两相关性

 

两种评分算法得到的结果是基本一致的。如前所述,随着重复次数的增加,pathway分数的再现性越高。对于不同的单个ONT重复,singscore算法得到的pathway间的平均相关性为0.858±0.070;而对于2个重复,则为 0.955±0.023,做3个重复,pathway得分之间的平均相关系数为0.974±0.011。ONT重复数量的增加仅有相对较小的再现性改善。ssGSEA算法的结果显示了相同的模式。

 

5、 使用公布的数据确认结果

除了评估以上基于HepG2细胞株转录组的分析结果以外,作者也对其他类型细胞的数据做了模拟。对于HCT116细胞株, Illumina NovaSeq 6000进行了3个重复样本测序,MinION进行了4个重复样本的直接RNA测序。HCT116细胞株的模拟结果见图5,对于单一重复,singscore通路得分之间的平均相关性为0.910±0.037。添加第3个重复样本后,重复性改善较小,为0.980±0.006。ssGSEA算法的结果也呈现出相同的规律。总的来说,本研究HepG2转录组分析结果可以使用已公布数据进行重现。

 

图片

图5 使用已发表的HCT 116细胞系数据,对不同重复数量组合的pathway评分进行两两Spearman相关性分析

 

研究结论

 

本研究目的旨在评估利用ONT MinION平台进行的直接RNA测序在系统生物学应用中的性能,即单样本的pathway定量得分。结果发现至少需要两个实验重复才能获得可重复的结果。该发现可为ONT直接RNA测序的实验策略提供参考。

 

参考文献

Mikhail A Pyatnitskiy,et al. Oxford Nanopore MinION Direct RNA-Seq for Systems Biology. Biology, 2021

 

 

Copyright © 2018 武汉贝纳科技有限公司 . All Rights Reserved. Designed by 鄂ICP备2021008976号-2技术支持:中网维优