Q:全长转录组测序的取样建议?
全长cDNA细胞总量≥ 1 X 107个起送,全长转录组植物组织送样量须达到至少0.5g,动物取新鲜组织,组织体积要小,尽量长宽高≤0.5cm ,所切组织块的大小可参考绿豆颗粒的大小,送样量须达到至少0.2g。血液样本通常建议送新鲜血样,哺乳动物全血:2.5-5ml;鱼类、禽类、两栖类全血:0.5-1.0ml 及以上。
Total RNA的送样要求:

Q:全长转录组测序必须做生物学重复么?需要几个重复?
生物学重复是生物实验所必须的,全长转录组测序也不例外,至少3次生物学重复。生物学重复的设置需要考虑研究成本、样本采集难度、数据分析能力、预期研究水平等多方因素。
Q:全长转录组测序推荐的测序数据量?
全长转录组测序所需数据量与所研究物种的基因组大小有关,基因组越大,则所需数据量越大。一般来说:常规物种一般建议6G数据即可;基因组较大的物种推荐8G以上数据,人类样本建议10G数据起,甘蔗甘薯建议15G起,小麦建议20G起。
Q:如何判断差异基因在两个样品间的差异大小?
差异的显著情况可通过矫正后的pvalue来看,矫正后的pvalue越小,差异越显著。也可通过|log2Foldchange|来判断差异的大小情况,|log2Foldchange|越大,差异倍数越大。
Q:样品间的相关性有何意义?如何计算?
样品间的相关性反应了样品间的相似程度,即不同处理或组织的样品在表达水平方面的相似度。相关系数越接近1,样品间的相似度越高,样品间的差异基因也越少。生物学重复间的样品的相关系数应大于生物学重复外的样品的相关系数。相关系数的计算方法有三种:A.Pearson correlation;B.Spearman rank correlation;C.Kendall’sT。贝纳使用R语言进行Pearson 相关系数的计算。
案例一
Nanopore全长转录组揭示牦牛生长发育机制(International Journal of Biological Macromolecules, lF=7.7)
牦牛是青藏高原的重要家畜,为牧民提供肉、奶、毛皮等资源,但低繁殖效率(如季节性发情、低怀孕率)限制了其生产力。睾丸发育对提高繁殖效率至关重要,然而短读长RNA测序的局限性使牦牛睾丸发育的分子机制尚未完全阐明。
本研究以6月龄、18月龄、30月龄、4岁的公牦牛和4岁的杂交牛为研究对象,各年龄阶段选取3个个体的睾丸样本,进行ONT全长转录组测序。每个样本产生了9,100,484到13,084,496条clean reads,平均读长为937.7 bp。通过与参考基因组比对,鉴定到24,480个基因和40,038个新转录本,其中大部分为新转录本,且9,568个新转录本通过功能注释得到解析。随机选取10个新转录本进行PCR验证,结果显示PCR扩增产物的大小与目标一致,表明ONT测序结果准确。
研究鉴定出15,355个可变剪接事件,分为7种类型,包括外显子跳跃、3'和5’可变剪接等。不同年龄阶段的剪接事件分布差异显著,6月龄的可变剪接事件较少,可能与该阶段睾丸尚未进入减数分裂期有关。
通过不同发育阶段的比较,鉴定得到多个差异表达转录本(DETs),通过不同发育阶段的比较,鉴定得到多个差异表达转录本(DETs),表明睾丸组织中的转录本表达变化更为显著。
通过WGCNA方法构建的基因共表达网络分析,得到21个共表达模块。其中,蓝色模块与6月龄阶段相关性最高,深灰色模块与18月龄阶段紧密相关。KEGG通路富集分析显示,不同发育阶段与特定信号通路相关:6月龄阶段主要涉及细胞结构、激素合成和蛋白质合成通路;18月龄和30月龄阶段涉及代谢和Hippo信号通路;4岁阶段则与代谢和激素合成通路相关,这些通路的活跃可能为精子发生创造适宜的微环境。

本研究通过ONT全长转录组测序,揭示了牦牛睾丸发育的分子机制,为改善牦牛繁殖效率提供了重要理论依据。
参考文献:
Wang X, et al. Complete characterization of the yak testicular development using accurate full-lenath transcriptome sequencing.International Journal of Biological Macromolecules, 2024
案例二
项目案例 Nanopore全长转录组揭示可变剪接调控植物光形态建成的分子机理(The Plant Cell,IF=12.085)

选择性剪接(AS)是一个关键的转录后过程,可调控基因转录翻译成不同的蛋白质变体,多用于蛋白质组多样性和基因调控研究。本研究发现拟南芥RNA解旋酶UAP56在体内外与光信号通路中的核心角色E3泛素连接酶COP1相互作用,并通过Nanopore全长转录组测序技术阐明UAP56和COP1共同调节许多基因的表达水平以及许多常见前信使RNA(mRNA)的剪接。
UAP56和COP1共同调节基因表达
为了研究UAP56和COP1如何共同调控光形态发生,对d3#2和cop1-4以及Col-0进行了Nanopore全长转录组测序分析。在黑暗和红光照射1小时后,与Col-0相比,在d3#2系中发现了也受COP1的调控基因。UAP56和COP1共同调节与光合作用及光应答相关的基因表达,以及黑暗或光明中的激素反应。
UAP56和COP1控制mRNA的选择性剪接
d3#2和cop1-4中的剪接模式在黑暗和光明中与Col-0相比有很大不同。414和503个AS事件分别在黑暗和红光照射中由UAP56与COP1共同控制。共调节AS事件的基因在uap56和cop1系中部分重叠。
UAP56和COP1调节光介导的AS
比较d3#2和cop1-4中受光-暗调节的AS事件,发现433和599 AS事件分别受到黑暗和光明中UAP56突变的特异性影响。d3#2和cop1-4背景中剪接效率的变化与Col-0有很大不同。
结论:
该研究一方面鉴定到光形态建成的新成员UAP56,另一方面发现了COP1作为可变剪接调节因子的新功能,揭示了UAP56与COP1共同通过调节下游基因可变剪接来调控光形态建成的分子机制和调控网络,增加了对植物光信号转导机制的认识。
参考文献:
Yang Li, et at. The RNA helicase UAP56 and the E3 ubiquitin ligase COP1 coordinately regulate alternative splicing to repress photomorphogenesis in Arabidopsis. The Plant Cell,2022
利用 gffcompare,将非冗余转录本与基因组的已知转录本进行比较,发现新的转录本和新基因,对现有注释进行补充,使用七个数据库进行转录本功能注释,包括:Nr、Pfam、Uniprot、KEGG、GO、KOG/COG、PATHWAY。

样品中新转录本类型的数量分布图、
对基因包含转录本的数目进行统计,基因包含转录本数目大于8个,统一记为一类,从已知和所有两个方面进行统计绘图。

包含不同数目转录本的基因数目图
基因转录生成的前体 mRNA(pre-mRNA),有多种剪接方式,选择不同的外显子,产生不同的成熟 mRNA,从而翻译为不同的蛋白质,构成生物性状的多样性。这种转录后的 mRNA 加工过程称为可变剪接或选择性剪接(Alternative splicing)。通过 suppa2软件获取每个样品存在的可变剪接类型,对转录本发生可变剪接事件情况进行统计。

可变剪接类型分布图
可变剪切的差异分析就是对可变剪切产生的 isofrom 进行定量,然后进行差异分析。使用 suppa2(DiffSplice) 鉴定组间差异可变剪切,差异可变剪切数量统计如下表。
表 差异可变剪切类型统计表


利用表达定量得到的转录本在各个样品中的表达量 reads count 数据,进行差异表达分析。差异表达分析的软件为 DESeq2 ,筛选阈值为 padj < 0.05 且 |log2FoldChange| > 1.0,鉴定的差异表达转录本数目。

差异表达转录本火山图
富集分析统计学方法一般使用超几何检验,找出差异基因/转录本相对于所有有注释的基因/转录本显著富集的 GO Term 或 KEGG Pathway,KEGG富集分析软件为 clusterProfiler,GO富集分析软件为topGO。

差异表达转录本 GO 富集分析 dotplot 图

差异表达转录本 PATHWAY 富集分析 barplot 图