您好,欢迎光临武汉贝纳科技服务有限公司
027-62435310 | service@benagen.com | 中文 | English 咨询客服
您现在的位置:主页 > 市场与支持 > 文献解读 >

利用Nanopore高通量测序技术解析污水处理体系可移

 
发表期刊:Microbiome
发表时间:2019年7月
影响因子:10.46
 

研究背景
 
抗生素抗性基因(ARG)的出现和广泛传播严重影响了人类的身体健康,污水处理厂作为一个连接人类活动和自然生态系统的重要节点,具有丰富的微生物遗传多样性,可通过基因水平转移(HGT)促进ARG的交流。污水中残留的抗生素以及其它共选择筛选压力,使其对抗生素抗性基因的水平转移起到了重要作用。
 
目前有多种可移动遗传元件,包括质粒(Plasmid)、整合性结合元件(ICEs)、转座子(Transposon)、以及整合子(Integron) 能够介导抗性基因的转移。为了能够全面了解污水处理体系中抗生素抗性基因以及多重耐药菌株的动态传播过程,解析不同抗生素抗性基因的遗传背景、宿主信息并且追踪它们在整个污水处理体系过程中的变化是十分必要的。
 
然而不管是基于传统的耐药菌株分离培养的方法,还是基于二代测序组装、或者epicPCR的方法都不能达到理想的效果。随着三代测序技术的发展,长读长的特点可以弥补上述技术的缺点。作者开发了一套基于高通量测序的抗生素抗性基因遗传背景解析、宿主鉴定的分析流程,确定了三个污水处理厂进水和出水中多重耐药细菌的表型和基因型之间的相关性,为解析复杂的遗传元件提供了可能性。
 

材料和方法
 
1.测序样品
一共11个样品,包括9个水样:香港沙田、石湖墟、史丹利的3个污水处理厂的进水口、活性污泥、出水口样品,和2个对污水处理体系进水和出水中的多重耐药菌株进行分离培养的样品。
 
2.样品处理
进水口和活性污泥样品在取样现场使用同等体积的100%乙醇固定。另外,从每个污水处理厂收集了50 mL未固定的进水口样品,以进一步分离具有多重耐药性的细菌。所有样品均在2小时内被运送到实验室进行立即处理。对于每个进水样品,取5000 mL样品在室温下5000 rpm离心15分钟后收集沉淀。对于每个出水口样品,取1 L样品通过0.45 μm硝酸纤维素膜过滤后收集固体。DNA提取前,所有处理过的样品均保存在-20℃冰箱。
 
3.多重耐药菌的培养
对于每种无乙醇固定的进水样品,取100μL接种到添加100 mg / L氨苄青霉素,50 mg / L卡那霉素,20 mg / L四环素和25 mg / L氯霉素的LB培养基平板上。对于出水口样品,将膜上的细菌沉淀物重悬于1 mL LB培养基中,然后将100μL重悬液铺在如上所述的相同类型的LB琼脂平板上。在37℃下孵育过夜(12 h)后,使用LB洗涤孵育在LB平板上生长的菌落/分离物(大约500个菌落/分离物)三次,收集用于DNA提取和下游分析的混合多重耐药培养物。
 
4.DNA提取与建库
使用FastDNA® Spin Kit for Soil提取污水处理厂样品的DNA,用DNeasy PowerSoil试剂盒从每个培养皿中提取混合分离物的总基因组DNA,电泳后,提取大于8kb的DNA片段,使用Monarch®DNA凝胶提取试剂盒进行回收。用AMPure XP磁珠对DNA进行纯化。用Nanodrop对DNA纯度进行检测,使用OD 260/280 约1.8 和OD 260/230 在2.0–2.2的样品进行文库构建。三代测序使用MinION测序,每个样品平均得到3.4Gb的数据,二代测序使用Illumina Hiseq4000平台进行PE150测序,每个样品平均得到14.5Gb数据。
 
5.MinION文库构建测序
使用LSK108连接试剂盒构建1D类型DNA文库,按照以下步骤进行文库制备,对于单个DNA样品,使用琼脂糖凝胶纯化方式回收的1.5–2.0μg DNA。
 
① 末端修复:使用NEBNext Ultra II End-Repair/dA-tailing进行,将7行,Next Ultra II End-缓冲液,3冲液,ext Ultra II End-酶混合物,1.2物,xt Ul体积50ul)混合,首先在20,首下孵育20分钟,然后在65,下再孵育15分钟;
② 
③ 磁珠纯化:使用60ul  AMPure XP进行纯化;
 
④ 连接:混合20ul Adaptor Mix和50 0L of Blunt/TA Ligation Master Mix加入30 μL dA-tailed DNA进行连接,室温下孵育15分钟;
 
⑤ 再次纯化:使用40纯化:育daptor M珠粒和ABB缓冲液进行另一次纯化以除去接头序列,使用25液进行另一次重悬纯化连接DNA,然后通过Qubit测量浓度,以确保保留了≥量浓度,以确的DNA;
 
⑥ 测序:使用R9.4芯片进行MinION测序,所有样品总共进行了11次独立的MinION测序。
 
6.MinION分析
MinION数据下机后使用Albacore (v2.1.10)进行base-called,使用PoreChop软件(--discard_middle)处理得到Passed reads。使用Nano-Pack对数据进行统计和可视化。
 
抗性基因的鉴定使用LAST软件(version 926,-a 1 -b 1 -q 2)比对SARG数据库。过滤参数:比对的长度覆盖度(cover)>ARG长度的95%,相似度(similarity)>80%,当overlapped ARG-containing regions (> 80%)时选取最好的比对结果。
 
使用PlasFlow软件推断质粒的ARGs。使用Centrifuge(v1.0.3)的Nr库对携带ARGs的reads进行物种分类分析,使用Pavian对结果进行可视化。
 
使用LAST工具(version 926)对位于携带ARG的reads上的转座子和整合子进行鉴定,比对NCBI的RefSeq数据库,保留alignments >60%,identity ≥sentof the marker protein (transposase or integrase) length的reads。ICE携带的ARG是基于reads比对ICEs数据库得到的,参数设置相似性(similarity)> 80%确定。同时对比对长度>50%的ARG总长进行预过滤,最后通过blast比对Nr数据库交叉验证和手工检查确定。
 

7.Illumina数据分析
Illumina下机数据过滤得到clean data, 使用CLC的Genomic Workbench (version 6.04, 默认参数)对每个样本进行组装,共生成4062135个contigs。
 
使用Prodigal (v2.6.3)预测ORF序列。使用BLASTN对上述ARG-like ORF序列比对SARG数据库,设参数similarity of 80%;coverage of 95%。
 
使用PlasFlow预测所有带有ARGs的contigs的质粒序列。为了比较Illumina和Nanopore测序平台对混合的多重耐药性培养物的物种分类,使用Centrifuge对Illumina序列进行物种分类。
 
使用Ribotagger对宏基因组数据中16S序列的V4-V6区域进行群落分析,然后使用EMIRGE重构近全长16S rRNA序列(40 iterations)。通过在线BLAST比对Nt数据库对16S rRNA序列进行系统发育注释,并利用EMIRGE对重构基因的相对丰度进行估算。
 
8.比较Nanopore  Illumina测序定量结果
为了比较Illumina和Nanopore测序产生的结果,使用每百万碱基对的ARG数进行定量。得到ARGs-like的reads后,根据基因长度和测序深度计算丰度和标准化,使用person相关系数和线性回归进行分析。
 

研究结果
 
1.测序结果统计
 
Nanopore测序平均每个样品测得3.4Gb的数据,N50为5,872~10,674bp,单条reads最长达到73,530bp。与这些环境样品的直接测序相比,2个培养的多重耐药菌样品测得了更长的reads(N50:16,578bp)和更高的数据量。但是,通过选择不同的DNA提取策略和文库制备方法,可以得到更长的reads。
 
值得注意的是,Nanopore reads长度(平均5.3 kb;N50 8.1 kb)比平均深度达到14.5 Gb的Illumina拼接出的contigs (平均 1.4 kb; N50 1.7 kb)还长,表明其有助于分析这些ARGs的相关信息。


Fig S1  Nanopore reads 统计 


Table S1 Nanopore结果与Illumina测序拼接结果比较




2.携带抗性基因的质粒和整合性结合元件在污水处理体系抗性基因组中占主导地位

鉴定出1791个带有ARGs的Nanopore reads(平均长度为8.5 kb),远远大于从Illumina序列组装的316个ARGs的contigs(平均2.9 kb),表明很难通过二代Illumina序列来评估ARGs的遗传背景。
 
基于抗性基因的移动潜力,该研究将检测到的ARGs分为两大类,第一类:能够在细胞间水平转移的可移动抗性基因组,这类抗性基因位于能够介导细胞间转移的移动元件上,包括质粒和整合性结合元件;第二类为基因组(染色体)上携带的低移动风险抗性基因组。
 
Nanopore结果显示,相比于少量位于基因组上的抗性基因(29%),大部分抗性基因由质粒和整合性结合元件携带(55%),并且在携带抗性基因的质粒上,其它的移动元件,包括转座子和整合子比位于基因组上的分布更加广泛,这些移动元件对于质粒上抗性基因的快速富集和积累至关重要。
 
某些样品中的几种ARGs类型仅通过Illumina测序检测到,但Nanopore测序未检测到的这些ARGs的相对丰度非常低(占总抗性基因组的4%)。说明即使是低深度的Nanopore测序也可以充分覆盖主要的ARG类型,且除了多重耐药ARG以外,所有其他检测到的ARG都主要由质粒携带,这些都是污水处理厂抗性基因的重要组成部分(图1),并且与Illumina分析结果一致, 说明污水处理厂的微生物群落可以包含大量编码,对几乎所有临床相关抗生素具有抗性的质粒。


Fig 1 抗生素抗性基因遗传背景解析
 

除了质粒携带的ARG外,还发现ICEs携带了13个抗性基因亚型,包括氨基糖苷类(aadE)、βa内酰胺类(CfxA、CfxA2和CfxA3)、氯霉素类(catQ)、MLS类(ermB、mefA/E、ermF、ermG和ermC)以及四环素类(tetQ、tetM和tetO),其中位于ICEs上的四环素和MLS类的抗生素具有相对较高的丰度,分别占相应ARG类型的22%和17%,因此ICEs对于抗性基因的传播或许会起到重要作用。有研究报道,由ICEs携带的ARGs在驱动不同的革兰氏阳性和革兰氏阴性病原体的多重耐药性中起关键作用。
 
转座子(不含接合性转座子)和整合子所携带的ARGs无法在细胞间移动,但可以通过“搭便车”进入细胞间的移动元件增加基因水平转移的可能性。
 
一般而言,比起染色体上的,在质粒上的转座子和整合子常被发现与ARG有着更紧密的联系(图1)。质粒携带6种类型(甲氧苄氨嘧啶,氯霉素,磺酰胺,四环素,β氧内酰胺和氨基糖苷)与整合子和转座子密切相关的ARB,但染色体只检测到2类(氯霉素和磺酰胺)。表明质粒和ICEs携带了污水处理厂耐药基因组的大部分ARG,而转座子和整合子可能进一步增加了质粒介导的ARG的流动性。
 
对整个处理过程中ARGs进行动态分析,结果表明出水口中携带ARGs的质粒和ICE的比例(62 to 66%)要比进水口(54 to 57%)和活性污泥(41 to 53%)样品中的更高(P < 0.01)。这与Petrovich的研究结果一致,即与进水口样品相比,出水口样品中与MGE相关的ARG的相对丰度增加了。这可能说明废水处理厂产生的废水对与MGE相关的ARGs在出水中的扩散构成了挑战。
 
3.通过移动原件和宿主追踪识别广谱可持续抗性基因
 
由于观察到了显著的耐药基因转移,因此本研究对携带抗性基因的可移动元件和基因组进行追踪。结果发现8种类型的29个由质粒携带的抗性基因亚型在至少一个污水处理厂的进水和出水中同时存在,其中有23个存在于该研究所分析的三个污水处理厂中,10个(aadA,aadA2,blaA,VEB-3,catB,cmlA,mefC,mphD,sul1和tetA)在出水口样品中检测到(图3)。
 
值得注意的是,质粒携带的tetA(四环素抗性)基因和sul1(磺酰胺抗性)基因在三个污水处理厂的所有区室中都存在。但是由于它们能够跨不同物种进行基因水平转移,因此仅仅基于宏基因组测序目前无法确定质粒宿主,未来可通过Nanopore宏基因组和Hi-C结合帮助此类研究。
 
研究还跟踪了ICEs携带的ARGs,结果显示在三个污水处理厂都能检测到四个ARG(cfxA,mefA/,tetQ和tetM)。其中cfxA和tetQ基因均由来自拟杆菌的ICE携带。由于基因水平转移的存在,拟杆菌中的tetQ已从大约30%急剧增加到80%以上。拟杆菌作为人类结肠中最主要的厌氧菌,当释放到污水处理厂中时可作为积累ARG的宿主。
 
此外,本研究还检测到了携带mef(A/E)和tetM基因的类Tn916链球菌ICE。因此,ICEs在污水处理厂中的普遍存在使其成为在人类病原体和环境细菌之间传播各种ARG的重要载体。
 
本研究还确定了位于染色体上的ARG的宿主和分布模式(图2c)。结果表明,整个污水处理厂中所有宿主包含了相同的ARG亚型,并显示出高稳定性。这些具有高移动风险的抗性基因在污水处理厂中的多样性很高,可能是造成水体中抗性基因传播的重要原因。


Fig 2 通过移动原件和宿主追踪识别广谱可持续抗性基因
 

4.快速鉴定污水处理体系潜在耐药致病菌群

快速识别抗生素耐药菌群对于污水处理中实现病原体有效控制是十分必要的,纳米孔测序可以实时、快速的检测并跟踪污水处理厂潜在的ARP。本研究共检测到16种相对丰度大于2%的物种,其中10种是潜在的致病菌,占所有已鉴定ARB的48.7%(图3a)。这些细菌大部分属于Gammaproteobacteria类(74.4%),包括Aeromonas、Escherichia、Klebsiella、Acinetobacter和Pseudomonas。大部分致病菌为多重耐药菌株,所携带的抗性基因涵盖了6大抗性类型(图3b).
 
在此之前,已经通过基于培养技术报道了这些潜在的ARPs在污水处理厂中普遍存在的抗性基因,包括对碳青霉烯耐药的鲍曼不动杆菌,对多重耐药的粪肠球菌和产生CTX-M的肺炎克雷伯菌。作为全世界医院感染的主要原因,减少这些ESKAPE病原体的检测时间对于风险管理至关重要。纳米孔测序可以在收到样品后不到24小时内显示ARPs信息,这大大减少了从样品收集到结果交付所需的时间。
 

 
Fig 3 快速破译潜在耐药致病菌群

 
通过追踪监测这些潜在致病菌群,结果与预期的一致,进水样品具有最高的ARP多样性。 然而,在所有处理阶段都发现了5个种群,包括3种ESKAPE病原体(图3c),而艰难梭菌仅在进水和出水中检测到。这些结果表明,这些多重耐药致病菌株很有可能通过污水处理厂的处理过程进入下游接收环境,进一步强调了有效污水消毒的重要性。

 
5.基因型表型关联分析揭示质粒对于多重耐药菌株的重要贡献

表型与基因型的结合被用于进一步验证细菌携带的质粒在污水处理厂中的持久性。从三个污水处理厂的进水和出水培养物中鉴定出可同时对四种不同的抗生素家族(包括氨苄青霉素,卡那霉素,四环素和氯霉素)产生抗性的细菌。这些多重耐药菌株主要分布于8个物种(图4a),其中大部分属于人类潜在致病菌。
 
其中最主要的成员是大肠杆菌,分别占所有鉴定出的耐药菌的67.5%和72.9%。在处理过程中,有效去除了进水中的Citrobacter and Elizabethkingia。 此外,出水口培养物中肺炎克雷伯菌的相对丰度增加(从6.7%增加到15%)。

 

Fig 4进出水多抗耐药菌株基因型表型关联分析


为了验证基于纳米孔测序的微生物群落分析的准确性,对混合进水的多重耐药培养物进行了Illumina宏基因组测序。结果表明,使用Illumina测序数据生成的分类结果在优势种水平上与纳米孔测序获得的分类结果基本一致。用宏基因组序列和16S rRNA(V4和V6的区域)基因在科水平的分类结果一致。
 


Fig S3 在Illumina和Nanopore测序平台上,分别从种水平和科水平对混合的多重耐药性混合培养细菌的丰度进行了比较。
 

此外,成功重建了相对高丰度物种的近全长的16S rRNA序列。抗性基因谱与给定筛选抗生素的表型高度相关,其中氨基糖苷类抗性基因最为丰富,其次是β列内酰胺类、四环素和氯霉素。除此之外,还检测到五种与磺胺类、奎诺酮类、甲氧苄啶类,利福霉素类和博来霉素相关的抗性基因,说明多种抗性基因的共现性普遍存在于该研究所筛选的多重耐药菌株中(图4b)。
 
 

Fig 4 进出水多重耐药菌株基因型表型关联分析

 
最为重要的是,除了acrD 和AmpC抗性基因,其它检测到的抗性基因由质粒携带(图4c), 这表明持久的抗药性主要是由质粒赋予的。在检测到的ARG类型中,检测到的氨基糖苷亚型(十个亚型)比β个内酰胺(五个亚型),氯霉素(五个亚型)和四环素(四个亚型)更多(图4c)。
 
然而,还检测到几种氨基糖苷亚型,例如aph(3h还-Ib,aadA和aph(6)-Id,但预测能造成对链霉素产生抗药性,而不是对卡那霉素产生抗药性,这表明氨基糖苷抗性基因,它们更可能与ARGs的其他亚型同时出现,这与图4b中观察到的高丰度一致。但是由于目前尚无法通过构建一致性序列来提高Nanopore reads的准确性,因此将原始的未修饰reads用于上述分析可能更好。
 

6.质粒携带的多耐药基因簇 

最后研究了位于质粒上的ARG的排列,考虑到本研究中使用的抗生素,仅对在进水和出水培养物中同时编码至少四种类型的ARG的reads进行了分析。这些reads包含与质粒接合有关的基因,说明在多重耐药菌中存在结合质粒,多个ARGs常常同时定位在同一个接合质粒上,这使得多重耐药性相对容易传播。
 
例如,reads_1 (42,639 bp)携带11个ARGs,这些ARGs可能导致对多种抗生素类的耐药性。此外,还鉴定出一个完整的1类整合子携带AAC(6 ')-Ib-cr、ar-3、drfA和aadA16。这种多重耐药基因簇的复杂结构很容易在纳米孔超长reads的基础上得到解决。
 
此外,不同的氨基糖苷ARG亚型在同一质粒上同时出现(图5),如在read_4上同时出现三种亚型(APH(6)-Id、APH(3”)-Id和APH(3’)-I),在其他reads上也有类似的排列。除了ARG亚型间的共现模式外,Nanopore长序列还鉴定了编码汞抗性的基因簇(merA、merC、merD、merE、merP和merR)。
 


Fig 5 质粒携带的多重耐药基因簇

 
值得注意的是许多类型的插入序列(IS)和可转座(Tn)元件在这些接合质粒上显示出镶嵌分布,这可能会增加基因转移水平的可能性。实际上,这些丰富的重复序列会导致Illumina reads 的组装困难,而使用纳米孔测序技术可以在很大程度上克服这一困难。
 

7.基于NanoporeIllumina测序进行抗性基因定量比较

将通过Nanopore测序得到的主要ARG类型的丰度(以每百万碱基对的ARG数量计)与通过Illumina测序的丰度进行比较,结果表明,除了两个活性污泥样本(STAS和SWHAS),两个测序平台分析的ARG的定量结果具有相似性。测序深度不足,活性污泥中高度复杂的群落和相对较低的ARGs丰度可能是到导致活性污泥样本的巨大差异。
 
过去使用不同的测序策略对ARG的定量也有不同的报道,其中一些ARG亚型仅通过Nanopore测序检测到,另一些ARG亚型仅通过Illumina测序鉴定到。此外,平台差异和不同的ARG预测算法也可能影响ARGs的定量结果。



Fig S2 Nanopore 和 Illumina 定量结果相关性分析

总结
 
该研究充分利用了Nanopore测序长读长、实时测序的优势,结合Illumina测序,开发了一套基于高通量测序的抗性基因遗传背景解析、宿主鉴定的分析流程 。Nanopore极大地促进了多重耐药性结合质粒的研究,分析流程不仅使我们对污水处理体系可移动抗性基因组有了全新的见解,同时为进一步解析耐药菌株的产生以及传播机制提供了重要参考。

 
Copyright © 2018 武汉贝纳科技服务有限公司 . All Rights Reserved. Designed by 鄂ICP备13016520号-1技术支持:中网维优