Q1:T2T 基因组与以往的参考基因组相比有哪些改进?
T2T(Telomere-to-Telomere)基因组代表了参考序列的最新研究阶段,目标是获得从染色体一端端粒到另一端端粒的完整序列。
与以往常规高质量染色体水平基因组的版本不同,T2T 基因组几乎消除了所有未解析的“空白区”,特别是覆盖了此前难以测序的高重复和高 GC 含量区域,如端粒与着丝粒,从而使染色体结构的解析更加连续和准确。
Q2:T2T 基因组的测序通常采用哪些技术?
T2T 基因组构建主要依赖第三代长读长测序技术,例如 PacBio HiFi 和 ONT ultra-long测序技术。这类平台可获得跨越重复序列的超长读段,显著提升组装的连续性与完整性。
Q3:T2T 基因组在科研中的主要应用场景有哪些?
T2T 基因组的高完整性和高精度,使其在多个研究方向中具有广泛应用价值。例如:
· 基因功能解析与结构变异研究:帮助识别此前遗漏或错误注释的基因和变异位点;
· 染色体结构与基因调控研究:为端粒、着丝粒以及重复区的表观调控与结构动力学分析提供精确模板;
· 比较与进化基因组学:可作为高质量参考用于不同物种或群体间的比较,揭示基因组演化模式;
· 医学与人类遗传学研究:助力发现与疾病相关的复杂变异及结构重排。
Q4:T2T 基因组组装的主要技术难点有哪些?
T2T 组装需要应对多个层面的挑战:
· 复杂重复序列的解析(尤其是卫星 DNA 和转座元件)
· 端粒与着丝粒等特殊区域的完整覆盖
因此,成功的 T2T 组装通常依赖高质量超长测序reads、充足的测序深度以及优化的组装算法设计与挂载分析方法。
Q5:T2T 基因组的完成对生命科学研究有何推动作用?
T2T 基因组提供了一个前所未有的完整参考框架,使研究者能够从端粒到着丝粒全面解析基因组结构。
这不仅有助于发现以往未被识别的基因与结构变异,也为功能基因组学、遗传多样性研究、疾病相关位点定位及进化机制解析提供了更高精度的数据基础。
Q6:T2T 基因组对端粒和着丝粒研究的价值体现在哪些方面?
· 端粒(Telomeres):
端粒位于染色体末端,起到保护作用并调控细胞衰老。T2T 基因组的完整覆盖让研究者能够系统地分析端粒结构、变异与功能动态,从而揭示与衰老、癌症等相关的分子机制。
· 着丝粒(Centromeres):
着丝粒是染色体分裂时确保正确分配的关键结构。借助 T2T 基因组数据,可以深入研究着丝粒的卫星序列组成、进化特征以及其在染色体稳定性与异常分离中的作用。
项目案例一
Plant Communications发表辣椒“遵辣1号”T2T基因组(IF=9.4)
本研究利用三代测序数据PacBio HiFi(103.54 Gb)和ONT ultra-long(75.56 Gb),结合Hi-C数据将序列挂载到12条染色体上,最终组装了无间隙的“遵辣1号”T2T基因组(Zunla-1 v3.0)。该基因组大小为3.08 Gb,N50大小为167.63 Mb,BUSCO评估基因组完整性为98.76%,转座子占比84.58%。通过基因组注释,获得39,068个蛋白编码基因,并且鉴定了1,024个抗病相关的基因。
根据着丝粒的特异性三维互作模式,研究团队鉴定了12个着丝粒,并通过基于着丝粒特异性组蛋白CenH3的ChIP-seq实验进行了验证。此外,研究团队还根据端粒特异性重复序列,鉴定了24个端粒,进一步验证了Zunla-1 v3.0基因组组装的高完整性。
结合基因结构、重复序列密度、表观和三维基因组学等特征,研究团队将染色体划分为染色体臂区和近着丝粒区。在Zunla1 v3.0 基因组中,Gypsy元件在近着丝粒区域富集,Copia元件相对集中在染色体臂区,这种差异可能与两种元件的表观修饰模式相关。研究团队通过CUT&Tag实验描绘了Gypsy和Copia的表观修饰特征,发现H3K27me3可能在Copia元件沉默中发挥了与DNA甲基化互补的作用。

项目案例二
鲁山冬凌草高质量T2T基因组组装揭示两种冬凌草的基因组结构差异(IF=11.8)
研究团队使用PB HiFi测序(30.55 Gb,87.54 X)+ONT 50K超长测序(19.37 Gb,55.5 X)+Hi-C测序(89.15Gb,255.44X),组装得到了鲁山冬凌草T2T参考基因组(L.rubescens-LS),基因组大小为349 MB。
研究团队使用Orthofinder 对所选物种的所有氨基酸序列进行聚类,发现冬凌草(Lsodon rubescens(Hemsl.))和鲁山冬凌草(Lsodon rubescensf.lushanensis)基因组之间共享的基因家族占其基因组中总基因家族的75%,并且大部分基因都较为保守,这种关系表明两种冬凌草在亲缘关系上极为近缘。
通过筛选两种冬凌草特有的基因家族,并对其进行功能注释共得到14个基因,其富集功能在二萜合成途径中。为了研究鲁山冬凌草和冬凌草基因组SV对二萜类活性物质合成的影响,研究团队对鲁山冬凌草和冬凌草基因组进行共线性比对,对全基因组范围基因组PAVs和SVs进行分析,发现二萜合成相关基因的变异可能是冬凌草活性物质化学结构变异的驱动力之一。

参考文献:
Zhang K, et al. The gap-free assembly of pepper genome reveals transposable-element-driven expansion and rapidevolution ofpericentromeres.PlantCommun.2025.
Yang H, et al. High-quality assembly of the T2T genome for lsodon rubescens f.lushanensis reveals genomic structurevariations between 2 typical forms oflsodon rubescens.Gigascience.2024.