一种基于测序技术的血浆病毒检测分析方法

未命名 07-19 阅读:81 评论:0


1.本发明涉及病原检测分析领域,特别涉及一种基于测序技术的血浆病毒富集及去污染检测分析方法。


背景技术:

2.临床血流感染检测一直具有人源宿主影响大、病原丰度低的难点,而且实验交叉污染和人源等物种序列中有大量和病毒高度一致的序列会导致病毒的假阳性检出,这都为临床病毒的检测带来很大挑战。虽然现在已有超滤离心、随机锚定扩增可以针对低起始量核酸进行建库测序,但临床常规血浆样本中人源cfdna和人源细胞含量极高,通常高达99%以上,使病原数据受到人源数据严重干扰,并且由于病毒颗粒极其微小,病毒基因占总样本丰度极低,通常低于1%,甚至低于0.1%,难以有效的对其进行富集,因此常规血浆mngs测序对血中微量病原核酸的检出不友好,尤其是血中含量极低的病毒。
3.在病原检测分析方面,现有测序技术对测序结果污染序列(环境污染,试剂污染,气溶胶污染)判读通常是通过同一批数据中加做阴性对照,后期计算标准化rpm后通过样本reads数/阴性对照reads数计算rpm-ratio。但仅通过阴性对照的方法仍有许多污染序列无法去除,样本间交叉污染和样本内物种特异性仍很难解决,对最终结果判读造成较大干扰。
4.鉴于此,提出本发明。


技术实现要素:

5.本发明提供一种基于测序技术的血浆病毒检测分析方法,包括如下技术方案:实施方式1. 一种基于测序技术的血浆病毒检测分析方法,其特征在于,包括:富集血浆样本病毒颗粒,和病毒检测分析;其中,所述富集血浆样本病毒颗粒如下进行:离心步骤:将采集的血液离心,制备离心血浆;核酸酶处理步骤:用全能核酸酶处理所述离心血浆;过滤步骤:将用全能核酸酶处理后的所述离心血浆过滤,制得过滤后血浆;超滤离心浓缩步骤:用超滤离心过滤装置将所述过滤后血浆离心,得到浓缩后血浆;所述病毒检测分析如下进行:对所述浓缩后血浆进行病毒测序获得测序结果;对所述测序结果进行病毒测序分析获得测序分析结果;对所述测序分析结果进行病毒组去污染分析,其中,所述对所述测序结果进行病毒组去污染分析包括:批内污染过滤:去除同批测序样本中的批内污染序列;非特异性病毒序列过滤:去除病毒与其他微生物、人源共有的非特异性病毒序列;非人源宿主病毒过滤:去除非人源宿主的病毒,得到病毒检测结果。
6.实施方式2. 根据实施方式1所述的基于测序技术的血浆病毒检测分析方法,其特征在于,所述离心步骤包括:先以低速离心去除沉淀后再进行高速离心,保留上清液,制得离心血浆。
7.实施方式3.根据实施方式1所述的基于测序技术的血浆病毒检测分析方法,其特征在于,所述过滤步骤中,采用pes过滤器对用全能核酸酶处理后的所述离心血浆进行过滤。
8.实施方式4.根据实施方式1所述的基于测序技术的血浆病毒检测分析方法,其特征在于,所述病毒测序如下进行:提取病毒核酸并进行预扩增;用建库试剂盒进行文库构建;采用测序平台上机测序。
9.实施方式5.根据实施方式1所述的基于测序技术的血浆病毒检测分析方法,其特征在于,所述病毒测序分析如下进行:(1)对测序得到的原始数据进行数据质控,去除低质量和较短序列,得到cleandata;(2)将cleandata使用比对软件进行人源基因组比对,去除比对上人源的序列,得到去人源后序列;(3)将所述去人源后序列使用比对软件进行病毒数据库比对,然后进行病毒物种注释;(4)根据比对结果统计得到每个样本中病毒物种的reads信息、depth信息和基因组coverage。
10.实施方式6.根据实施方式1所述的基于测序技术的血浆病毒检测分析方法,其特征在于,所述批内污染序列选取同批测序样本中比对上同一物种同一基因组位置出现频率大于50%的序列。
11.实施方式7.根据实施方式1所述的基于测序技术的血浆病毒检测分析方法,其特征在于,所述非特异性病毒序列包括病毒与其他物种的共有序列,所述其他物种包括选自人源、细菌、真菌、寄生虫中的一种或多种,所述病毒与其他物种的共有序列通过将病毒数据库分别与人源、细菌、真菌、寄生虫数据库中的一个或多个进行比对,选取病毒序列中比对上任一所述人源、细菌、真菌、寄生虫数据库中的序列或序列区域获得。
12.实施方式8.根据实施方式1所述的基于测序技术的血浆病毒检测分析方法,其特征在于,所述方法还包括:在同批测序样本中添加阴性对照样本用于病毒组去污染分析;所述病毒组去污染分析还包括:同批测序每个样本去除在阴性对照样本中检出丰度高于该同批测序样本的病毒物种。
13.实施方式9.一种计算机可读介质,其存储有计算机程序,所述计算机程序被处理器执行时,实现实施方式1至8中任一项所述方法。
14.实施方式10.一种电子设备,其特征在于,包括处理器以及存储器,所述存储器上存储一条或多条可读指令,所述一条或多条可读指令被所述处理器执行时,实现实施方式1至8中任一项所述方法。
15.本发明有益的技术效果包括:1.本发明针对临床样本中病毒颗粒体积、重量微小、基因组相对含量低、难富集的特性,首次提出“病毒组四步富集法”有效的对其进行富集,极大的提高了对病毒的检测能力和检测准确度。2.本发明提出非特异性病毒序列构建方法,并应用于病毒的鉴定过程,大大降低了因外源物种引入的假阳性,提高了检测的准确度。3.本发明提出批内污染过滤方法,在不需要空白对照样本的情况下即可对同批次的样本检出病原序列进行污染过滤。4.本发明巧妙利用病毒宿主信息,对非人源宿主病毒进行过滤,进一步提高检出病毒的准确性,更适合临床应用。本发明的方法可极大提高样本中病毒组分的丰度,并通过合理的污染处理方法,在提高病毒检出能力的同时降低富集建库扩增中引入的偏好和假阳性结果,提高临床病原检测能力。
附图说明
16.为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
17.图1为本发明“病毒组四步富集法”及相关提取建库流程图。
18.图2为本发明数据分析质控及“病毒组去污染法”去污染流程图。
具体实施方式
19.下面将结合实施例对本发明的实施方案进行详细描述,但是本领域技术人员将会理解,下列实施例仅用于说明本发明,而不应视为限制本发明的范围,并且所述实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
20.部分术语定义除非在下文中另有定义,本发明具体实施方式中所用的所有技术术语和科学术语的含义意图与本领域技术人员通常所理解的相同。虽然相信以下术语对于本领域技术人员很好理解,但仍然阐述以下定义以更好地解释本发明。
21.如本发明中所使用,术语“包括”、“包含”、“具有”、“含有”或“涉及”为包含性的(inclusive) 或开放式的,且不排除其它未列举的元素或方法步骤。术语“由

组成”被认为是术语“包含”的优选实施方案。如果在下文中某一组被定义为包含至少一定数目的实施方案,这也应被理解为揭示了一个优选地仅由这些实施方案组成的组。
22.本发明中的术语“大约”、“大体”表示本领域技术人员能够理解的仍可保证论及特征的 技术效果的准确度区间。该术语通常表示偏离指示数值的
±
10%,优选
±
5%。
23.在提及单数形式名词时使用的不定冠词或定冠词例如“一个”或“一种”,“所述”,包括该名词的复数形式。
24.此外,说明书和权利要求书中的术语第一、第二、第三、(a)、(b)、(c)以及诸如此类,是用于区分相似的元素,不是描述顺序或时间次序必须的。应理解,如此应用的术语在适当的环境下可互换,并且本发明描述的实施方案能以不同于本发明描述或举例说明的其它顺序实施。
25.以下术语或定义仅仅是为了帮助理解本发明而提供。这些定义不应被理解为具有小于本领域技术人员所理解的范围。
26.本发明中的部分技术术语解释如下:本发明所述的“reads”是指测序后得到的测序序列;本发明所述的“clean data”是指经过质控后得到的测序序列;本发明所述的“taxid”或“taxonomy_id”是指taxonomy数据库中的id号;本发明所述的“depth”是指测序序列在比对上某物种基因组或基因组上某区域的深度;本发明所述的“coverage”是指测序序列在比对结果比对上某物种基因组的覆盖度;
27.可以理解的是,任何包含上述设计方法的流程、程序、软件、系统等应用都在本发明的保护范围之内。
28.本发明提供一种基于测序技术的血浆病毒检测分析方法,其特征在于,包括:富集血浆样本病毒颗粒,和病毒检测分析;其中,所述富集血浆样本病毒颗粒如下进行:(1)离心步骤:将采集的血液离心,例如临床新鲜采集edta抗凝血,制备离心血浆;(2)核酸酶处理步骤:用全能核酸酶处理所述离心血浆;(3)过滤步骤:将用全能核酸酶处理后的所述离心血浆过滤,制得过滤后血浆;(4)超滤离心浓缩步骤:用超滤离心过滤装置将所述过滤后血浆离心,得到浓缩后血浆;所述病毒检测分析如下进行:对所述浓缩后血浆进行病毒测序获得测序结果;对所述测序结果进行病毒测序分析获得测序分析结果;对所述测序分析结果进行病毒组去污染分析,其中,所述对所述测序结果进行病毒组去污染分析包括:(1)批内污染过滤:去除同批测序样本中的批内污染序列,得到过滤后序列;所述批内污染序列选取同批测序样本一同分析后,根据该批测序样本比对上同一物种同一基因组位置出现频率大于阈值的序列。阈值可由本领域技术人员进行合理选取设置,例如选取30%,或者40%,或者50%,或者60%,或者70%;(2)非特异性病毒序列过滤:去除病毒与其他微生物、人源共有的非特异性病毒序列,本技术所述,或者60%,或者细菌、真菌、寄生虫等微生物,本技术所述非特异性病毒序列包括病毒与其他物种的共有序列;(3)非人源宿主病毒过滤:去除非人源宿主的病毒,得到病毒检测结果。
29.本技术所述富集血浆样本病毒颗粒包括离心步骤、核酸酶处理步骤、过滤步骤、和超滤离心浓缩四个步骤,即“病毒组四步富集法”,通过离心步骤可去除人源细胞干扰,通过核酸酶处理步骤可去除血浆中的cfdna,通过过滤步骤可去除可能存在的细胞碎片和细菌、真菌等,通过超滤离心浓缩高速离心进一步富集病毒颗粒,该方法可有效富集病毒颗粒,解决血浆中病毒含量低、难富集的问题,所述浓缩后的血浆中病毒含量大大提高,适用于进行后续测序分析和去污染分析,极大的提高了病毒的检测能力和检测准确度。进一步地,本技术通过“病毒组去污染法”,即批内污染过滤、非特异性病毒序列过滤、非人源宿主病毒过滤,将样本中reads长度合格的原始病毒序列减去批内污染序列和共有序列,得到去污染后物种信息,在不需要空白对照样本的情况下即可对同批的样本检出病原序列进行污染过滤,同时大大降低因外源物种引入的假阳性,提高了检测的准确度,再通过病毒宿主信息过滤,得到最终病毒组检测结果,进一步提高检出病毒的准确性,更适合临床应用。
30.在一些实施方式中,所述离心步骤包括:先以低速离心去除沉淀后再进行高速离心,保留上清液,制得离心血浆。本技术所述低速离心、高速离心具有本领域技术人员通常理解的含义,本领域技术人员基于对特定样本类型所已知的经验值可以设置合理的离心转速和离心时间,例如所述低速离心的转速为2000-5000r/min,优选为3000r/min,所述高速离心转速为10000r/min-20000r/min,优选为12000r/min;例如离心时间为5分钟-2小时,优选为10分钟。通过两步离心,可以最大程度去除人源细胞干扰,用于后续处理。
31.在一些实施方式中,所述过滤步骤中采用pes过滤器对用全能核酸酶处理后的所述离心血浆进行过滤。优选地,所述pes过滤器为0.45μm pes过滤器。
32.在一些实施方式中,所述病毒测序如下进行:(1)提取病毒核酸并进行预扩增;(2)用建库试剂盒进行文库构建,优选地,采用vazyme 5ng起始量基因组片段化建库试剂盒进
行文库构建;(3)采用测序平台上机测序,优选地,采用采用ngs测序平台pe150策略进行上机测序。
33.在一些实施方式中,所述病毒核酸仅包含dna病毒,可采用dna流程扩增病毒,具体操作可参考如下:取一定量提取的核酸,用随机锚定引物,takara酶进行一链合成和二链合成,使用锚定引物和takara酶进行20-25轮与扩增富集;在一些实施方式中,所述病毒核酸仅包含rna病毒,采用rna流程扩增病毒,具体操作可参考如下:取一定量提取的核酸,用随机锚定引物,逆转录酶进行一链合成,用klenow fragment进行二链合成,进一步的使用锚定引物和takara酶进行20-25轮与扩增富集;在一些实施方式中,用建库试剂盒进行文库构建如下进行:用vazyme 5ng起始量基因组片段化建库试剂盒进行文库构建,按照试剂盒说明书进行;随后采用ngs测序平台pe150策略,进行上机测序,优选的,每个样本测6g原始数据;进一步的,采用第三代测序平台,如pacbio或ont测序平台进行测序。
34.在一些实施方式中,所述病毒测序分析如下进行:(1)对测序得到的原始数据进行数据质控,去除低质量和较短序列,得到clean data;(2)将clean data使用比对软件进行人源基因组比对,去除比对上人源的序列,得到去人源后序列;(3)将所述去人源后序列使用比对软件进行病毒数据库比对,然后进行病毒物种注释,优选采用taxonomy关系进行病毒物种注释;(4)根据比对结果统计得到每个样本中病毒物种的reads信息、depth信息和基因组coverage,优选采用samtools、bedtools进行结果统计。
35.本技术通过“病毒组四步富集法”富集病毒颗粒后,进行核酸提取、随机扩增、建库上机测序得到测序序列。测序序列进行质控后去除人源序列、病毒鉴定分析和统计计算,进一步通过“病毒组去污染法”进行污染去除,得到最终病毒检测结果。
36.在一些实施方式中,所述批内污染序列选取同批测序样本中比对上同一物种同一基因组位置出现频率大于50%的序列。
37.在一些实施方式中,所述非特异性病毒序列包括病毒与其他物种的共有序列,所述其他物种包括选自人源、细菌、真菌、寄生虫中的一种或多种,所述病毒与其他物种的共有序列通过将病毒数据库分别与人源、细菌、真菌、寄生虫数据库中的一个或多个进行比对,选取病毒序列中比对上任一所述人源、细菌、真菌、寄生虫数据库中的序列或序列区域获得。
38.在一些实施方式中,所述方法还包括:在同批测序样本中添加阴性对照样本用于病毒组去污染分析;所述病毒组去污染分析还包括:同批测序每个样本去除在阴性对照样本中检出丰度高于该同批测序样本的病毒物种。通过阴性对照样本可以去除试剂、实验室背景等引入的污染,降低假阳性结果。
39.本技术还公开了一种计算机可读介质,其存储有计算机程序,所述计算机程序被处理器执行时,实现前述任一项所述方法。
40.本技术还公开了 一种电子设备,其特征在于,包括处理器以及存储器,所述存储器上存储一条或多条可读指令,所述一条或多条可读指令被所述处理器执行时,实现前述任一项所述方法。
41.通过本技术“病毒组四步富集法”,可有效提高血流病毒检出lod约100倍,极大提升了临床血流病毒组的检测效果,有力推动了测序技术在临床感染的检测应用。通过“病毒
组去污染法”不仅仅可以降低假阳性结果,并且可以避免因为常规分析方法中判定为假阴性结果,既提升了阳性结果的准确检出,又有效降低了假阳性结果,保证在临床应用中的准确度,更有利于血流病毒感染在临床上的精准诊断检测。
42.本发明通过附图和如下实施例进一步描述,所述的附图和实施例只是为了例证本发明的特定实施方案,不应理解为以任何方式限制本发明范围之意。除非另外说明,本发明中所公开的实验方法均采用本技术领域常规技术,实施例中所用的试剂和原材料均可由市场购得。
43.可以理解的是本发明的核心思路并不受限于测序平台,理由在于对血浆病毒富集和后续的序列分析并不受测序平台的限制,因此本发明的“病毒组四步富集法”和“病毒组去污染法”适用的测序平台包括一代、二代、三代或四代测序数据;优选的,所述测序数据为二代测序数据。
实施例实施例1病毒组四步富集法优化后病毒检测lod评估
44.取临床阴性血浆,采用spike-in的方式加入cmv、hcv、hbv和sars-cov-2病毒标准品,分为5copies/ml、5
×
10copies/ml、5
×
102copies/ml、5
×
103copies/ml、5
×
104copies/ml、5
×
105copies/ml共5个10倍梯度,每个梯度有3个重复,分别采用本发明方法和传统提取建库方法作为对照平行进行lod评估。
45.本发明方法步骤如下:1.“病毒组四步富集法”富集病毒颗粒(参照图1):1)两步离心:临床新鲜采集edta抗凝血4ml,取最少2ml血浆,以3000r/min离心10分钟后再以12000r/min离心10分钟,保留上清血浆,制得离心血浆;2)核酸酶处理:用universalbenzonuclease全能核酸酶处理所述离心血浆,37℃孵育1h,得到去除cfdna的血浆;3)滤膜过滤:使用0.45μmpes过滤器(millex)对上步得到的去除cfdna血浆进行过滤,得到滤膜过滤后血浆;4)超滤离心浓缩:用amiconultra超滤离心过滤装置将滤膜过滤后血浆进行高速离心,得到浓缩后血浆,进一步富集病毒颗粒。
46.2.病毒核酸提取取200ul浓缩后血浆,用purelinktmviralrna/dnaminikit进行病毒核酸提取,按照试剂盒说明书进行。
47.3.预扩增病毒核酸随机锚定扩增分为dna和rna两个工作流程1)dna流程取提取的核酸20ul,用随机锚定引物(添加引物序列),takara酶进行一链合成和二链合成;2)rna流程取提取的核酸11ul,用随机锚定引物(添加引物序列),逆转录酶进行一链合成,用
klenow fragment进行二链合成;将上述dna流程和rna流程产物混合,使用锚定引物和takara酶进行20-25轮预扩增富集。
48.4.文库构建和测序用vazyme 5ng起始量基因组片段化建库试剂盒(td501/td502)进行文库构建,按照试剂盒说明书进行;随后采用ngs测序平台pe150策略,进行上机测序,每个样本测6g原始数据。
49.5. 测序数据分析1)数据质控:对建库测序得到的原始数据使用fastp进行数据质控,按默认参数去除低质量和较短序列,得到clean data;2)去除人源序列:将clean data使用比对软件进行人源基因组grch38比对,去除比对上的序列来进行人源序列的去除,得到去人源后序列;3)病毒鉴定:将去人源后序列使用比对软件进行病毒数据库比对,然后用r中的taxonomizrlibrary包对病毒物种进行taxonomy关系注释;4)用samtools、bedtools根据比对结果进行处理得到每个样本鉴定出病毒物种的reads信息、depth信息和基因组coverage。
50.6.“病毒组去污染法”去除污染序列1)批内污染过滤:同批测序样本一同分析,根据比对结果提取同批样本中比对上同一物种同一基因组位置出现频率大于50%的碱基序列,即批内污染序列,将这些同批中出现概率极高的序列(批内污染序列)去除,得到过滤后序列;2)非特异性病毒序列过滤:将病毒数据库分别与人源、细菌、真菌、寄生虫数据库进行blast比对,得到病毒与其他微生物、人源的共有序列,即为非特异性病毒序列,将比对上该部分非特异性病毒序列区域的序列去除;3)非人源宿主病毒过滤:将上步过滤后序列比对上的病毒物种的宿主信息,将非人源宿主的病毒去除,得到病毒检测结果。
51.根据以上步骤得到的本发明的病毒检测lod实验结果如下表1所示:表1 病毒组四步法富集组lod
52.根据传统方法提取建库后,根据该实施例同样的数据分析步骤(即5.测序数据分析)和去污染步骤(即6.“病毒组去污染法”去除污染序列)进行分析,得到病毒检测lod实验结果如下表2所示:表2 常规mngs病毒检测组lod
53.从以上病毒检测结果可以得出,无论是dna病毒还是rna病毒,本发明都可以极大提高病毒检测能力,平均lod检测限提高约100倍,甚至lod可以低至5copies/ml的检测限,极大的适用于临床样本中极低丰度的病毒病原的检测。
54.实施例2病毒富集及去污染分析方法临床应用取临床全血进行本发明方法和常规方法的比较,常规mngs方法采用全血离心提取后建库上机,其分析过程同本实施例中数据分析方法,本实施例的详细处理见以下描述。
55.1.构建人源及各类物种比对数据库:1)人源数据库:在ncbi下载grch38全基因组。
56.2)细菌、真菌、寄生虫数据库:在ncbi下载taxid物种的taxonomy信息(包含界门纲目科属种分类信息),从microbial-nt数据库中下载数据。根据细菌/古菌、真菌、寄生虫来分类,得到每个大类的taxid。根据taxid比对到seqid2taxid文件(nt库),得到每个序列的seqid,进一步对数据库中序列做以下过滤:i)删除掉1k以下的序列;ii)细菌/古菌和真菌:删除未分类和环境微生物序列;iii)寄生虫:删除未分类和环境序列与外寄生虫/昆虫序列;iv)数据去冗余,每个物种只选一个基因组,按照referencegenome,representativegenome,completegenome排序,按照顺序优先选择。
57.3)病毒数据库:viralzone下载真核病毒数据库completevirussequences。
58.基于以上三大类数据库,通过分别构建去人源比对数据库、共有序列构建数据库和病毒鉴定数据库。
59.2.“病毒组四步富集法”富集病毒颗粒:1)两步离心:临床新鲜采集edta抗凝血4ml,取最少2ml血浆,以3000r/min离心10分钟后再以12000r/min离心10分钟,保留上清血浆,制得离心血浆;2)核酸酶处理:用universalbenzonuclease全能核酸酶处理所述离心血浆,37℃孵育1h,得到去除cfdna的血浆;3)滤膜过滤:使用0.45μmpes过滤器(millex)对上步得到的去除cfdna血浆进行过滤,得到滤膜过滤后血浆;4)超滤离心浓缩:用amiconultra超滤离心过滤装置将滤膜过滤后血浆进行高速离心得到浓缩后血浆,进一步富集病毒颗粒。
60.3.病毒核酸提取取200ul浓缩后血浆,用purelinktmviralrna/dnaminikit进行病毒核酸提取,按照试剂盒说明书进行。
61.4.预扩增病毒核酸随机锚定扩增分为dna和rna两个工作流程
1)dna流程取提取的核酸20ul,用随机锚定引物,takara酶进行一链合成和二链合成;2)rna流程取提取的核酸11ul,用随机锚定引物,逆转录酶进行一链合成,用klenowfragment进行二链合成;将上述dna流程和rna流程产物混合,使用锚定引物和takara酶进行20-25轮预扩增富集。
62.5.文库构建和测序用vazyme5ng起始量基因组片段化建库试剂盒(td501/td502)进行文库构建,按照试剂盒说明书进行;随后采用ngs测序平台pe150策略,进行上机测序,每个样本测6g原始数据。
63.6.测序数据分析1)数据质控:对建库测序得到的原始数据使用fastp进行数据质控,按默认参数去除低质量和较短序列,得到cleandata;2)去除人源序列:将cleandata使用比对软件进行人源基因组grch38比对,去除比对上的序列来进行人源序列的去除,得到去人源后序列;3)病毒鉴定:将去人源后序列使用比对软件进行病毒数据库比对,然后用r中的taxonomizrlibrary包对病毒物种进行taxonomy关系注释;4)用samtools、bedtools根据比对结果进行处理得到每个样本鉴定出病毒物种的reads和depth信息;5)根据比对结果对样本中检测到的病毒物种进行分析,得到每个物种的reads数及其基因组coverage。
64.7.“病毒组去污染法”去除污染序列1)批内污染过滤:同批测序样本一同分析,根据比对结果提取同批样本中比对上同一物种同一基因组位置出现频率大于50%的碱基序列,即批内污染序列,将这些同批中出现概率极高的序列(批内污染序列)去除,得到过滤后序列;2)非特异性病毒序列过滤:将病毒数据库分别与人源、细菌、真菌、寄生虫数据库进行blast比对,得到病毒与其他微生物、人源的共有序列,即为非特异性病毒序列,将比对上该部分非特异性病毒序列区域的序列去除;3)非人源宿主病毒过滤:将上步过滤后序列比对上的病毒物种的宿主信息,将非人源宿主的病毒去除,得到病毒检测结果。
65.通过常规血浆mngs测序和本发明实施例方法的分析数据结果如下表3所示:表3常规mngs测序和病毒组四步富集法mngs测序对比
66.从表中可以看到最终本发明实施例中方法富集的病毒序列占比比常规方法提升100倍以上,对病毒进行显著富集,极大提高了临床病毒组的检测能力。
[0067] 实施例3病毒组去污染方法与传统过滤方法对比取临床全血采用本发明方法进行病毒富集后建库上机测序,然后分别采用本发明的“病毒组去污染法”与常规mngs数据过滤分析方法,根据结果来平行比较“病毒组去污染法”的优势,本实施例的详细处理见以下描述(参照图2)。
[0068]
1.构建人源及各类物种比对数据库:1)人源数据库:在ncbi下载grch38全基因组。
[0069]
2)细菌、真菌、寄生虫数据库:在ncbi下载taxid物种的taxonomy信息(包含界门纲目科属种分类信息),从microbial-nt数据库中下载数据。根据细菌/古菌、真菌、寄生虫来分类,得到每个大类的taxid。根据taxid比对到seqid2taxid文件(nt库),得到每个序列的seqid,进一步对数据库中序列做以下过滤:i)删除掉1k以下的序列;ii)细菌/古菌和真菌:删除未分类和环境微生物序列;iii)寄生虫:删除未分类和环境序列与外寄生虫/昆虫序列;iv)数据去冗余,每个物种只选一个基因组,按照referencegenome,representativegenome,completegenome排序,按照顺序优先选择。
[0070]
3)病毒数据库:viralzone下载真核病毒数据库completevirussequences。
[0071]
基于以上三大类数据库,通过分别构建去人源比对数据库、共有序列构建数据库和病毒鉴定数据库。
[0072]
2.“病毒组四步富集法”富集病毒颗粒:1)两步离心:临床新鲜采集edta抗凝血4ml,取最少2ml血浆,以3000r/min离心10分钟后再以12000r/min离心10分钟,保留上清血浆,制得离心血浆;2)核酸酶处理:用universalbenzo nuclease全能核酸酶处理所述离心血浆,37℃孵育1h,得到去除cfdna的血浆;3)滤膜过滤:使用0.45μm pes过滤器 (millex)对上步得到的去除cfdna血浆进行过滤,得到滤膜过滤后血浆;4)超滤离心浓缩:用amicon ultra超滤离心过滤装置将滤膜过滤后血浆进行高速离心得到浓缩后血浆,进一步富集病毒颗粒。
[0073]
3.病毒核酸提取取200ul浓缩后血浆,用purelinktm viral rna/dna mini kit进行病毒核酸提取,按照试剂盒说明书进行。
[0074]
4.预扩增病毒核酸随机锚定扩增分为dna 和rna两个工作流程1)dna流程取提取的核酸20ul,用随机锚定引物,takara酶进行一链合成和二链合成;2)rna流程取提取的核酸11ul,用随机锚定引物,逆转录酶进行一链合成,用klenow fragment进行二链合成;将上述dna流程和rna流程产物混合,使用锚定引物和takara酶进行20-25轮预扩增富集。
[0075]
5.文库构建和测序用vazyme5ng起始量基因组片段化建库试剂盒(td501/td502)进行文库构建,按照试剂盒说明书进行;随后采用ngs测序平台pe150策略,进行上机测序,每个样本测6g原始数据。
[0076]
6.测序数据分析1)数据质控:对建库测序得到的原始数据使用fastp进行数据质控,去除低质量和较短序列,得到clean data;2)去除人源序列:将clean data使用比对软件bowtie2与构建的人源序列数据库进行比对,去除比对上人源序列,得到去人源后序列;3)病毒鉴定:将去人源后序列使用比对软件进行病毒数据库比对,然后用r中的taxonomizrlibrary包对病毒物种进行taxonomy关系注释;4)用samtools、bedtools根据比对结果进行处理得到每个样本的reads信息、depth信息和基因组coverage。
[0077]
7.“病毒组去污染法”去除污染序列1)批内污染过滤:同批测序样本一同分析,根据比对结果提取同批样本中比对上同一物种同一基因组位置出现频率大于50%的碱基序列,即批内污染序列,将这些同批中出现概率极高的序列(批内污染序列)去除,得到过滤后序列;2)非特异性病毒序列过滤:将病毒数据库分别与人源、细菌、真菌、寄生虫数据库
进行blast比对,得到病毒与其他微生物、人源的共有序列,即为非特异性病毒序列,将比对上该部分非特异性病毒序列区域的序列去除;3)非人源宿主病毒过滤:将上步过滤后序列比对上的病毒物种的宿主信息,将非人源宿主的病毒去除,得到病毒检测结果。
[0078]
通过本实施例中的“病毒组去污染法”与常规根据reads或rpm-ratio值进行过滤的分析数据结果如下表4所示:表4 传统过滤方法和病毒组去污染方法比对
[0079]
*传统rpm-ratio方法阈值为10;“+”:阳性结果;
“‑”
:阴性结果根据上面结果表可以得出,常规方法中在sample1样本中临床阳性的cmv病毒判定为阴性,而通过“病毒组去污染法”能准确判定为阳性,分别在sample2、sample3和sample4样本对应的cmv、cmv和ebv临床阳性结果中,常规方法判定为阳性(假阳性结果),而“病毒组去污染法”能准确判定为阴性。以上表明,“病毒组去污染法”比常规方法能更准确的判定临床样本病毒的检测,大大降低了判定结果的假阳性。
[0080]
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,但本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

技术特征:
1.一种基于测序技术的血浆病毒检测分析方法,其特征在于,包括:富集血浆样本病毒颗粒,和病毒检测分析;其中,所述富集血浆样本病毒颗粒如下进行:离心步骤:将采集的血液离心,制备离心血浆;核酸酶处理步骤:用全能核酸酶处理所述离心血浆;过滤步骤:将用全能核酸酶处理后的所述离心血浆过滤,制得过滤后血浆;超滤离心浓缩步骤:用超滤离心过滤装置将所述过滤后血浆离心,得到浓缩后血浆;所述病毒检测分析如下进行:对所述浓缩后血浆进行病毒测序获得测序结果;对所述测序结果进行病毒测序分析获得测序分析结果;对所述测序分析结果进行病毒组去污染分析,其中,所述对所述测序结果进行病毒组去污染分析包括:批内污染过滤:去除同批测序样本中的批内污染序列;非特异性病毒序列过滤:去除病毒与其他微生物、人源共有的非特异性病毒序列;非人源宿主病毒过滤:去除非人源宿主的病毒,得到病毒检测结果。2.根据权利要求1所述的基于测序技术的血浆病毒检测分析方法,其特征在于,所述离心步骤包括:先以低速离心去除沉淀后再进行高速离心,保留上清液,制得离心血浆。3.根据权利要求1所述的基于测序技术的血浆病毒检测分析方法,其特征在于,所述过滤步骤中,采用pes过滤器对用全能核酸酶处理后的所述离心血浆进行过滤。4.根据权利要求1所述的基于测序技术的血浆病毒检测分析方法,其特征在于,所述病毒测序如下进行:提取病毒核酸并进行预扩增;用建库试剂盒进行文库构建;采用测序平台上机测序。5.根据权利要求1所述的基于测序技术的血浆病毒检测分析方法,其特征在于,所述病毒测序分析如下进行:(1)对测序得到的原始数据进行数据质控,去除低质量和较短序列,得到clean data;(2)将clean data使用比对软件进行人源基因组比对,去除比对上人源的序列,得到去人源后序列;(3)将所述去人源后序列使用比对软件进行病毒数据库比对,然后进行病毒物种注释;(4)根据比对结果统计得到每个样本中病毒物种的reads信息、depth信息和基因组coverage。6.根据权利要求1所述的基于测序技术的血浆病毒检测分析方法,其特征在于,所述批内污染序列选取同批测序样本中比对上同一物种同一基因组位置出现频率大于50%的序列。7.根据权利要求1所述的基于测序技术的血浆病毒检测分析方法,其特征在于,所述非特异性病毒序列包括病毒与其他物种的共有序列,所述其他物种包括选自人源、细菌、真菌、寄生虫中的一种或多种,所述病毒与其他物种的共有序列通过将病毒数据库分别与人源、细菌、真菌、寄生虫数
据库中的一个或多个进行比对,选取病毒序列中比对上任一所述人源、细菌、真菌、寄生虫数据库中的序列或序列区域获得。8.根据权利要求1所述的基于测序技术的血浆病毒检测分析方法,其特征在于,所述方法还包括:在同批测序样本中添加阴性对照样本用于病毒组去污染分析;所述病毒组去污染分析还包括:同批测序每个样本去除在阴性对照样本中检出丰度高于该同批测序样本的病毒物种。9.一种计算机可读介质,其存储有计算机程序,所述计算机程序被处理器执行时,实现权利要求1至8中任一项所述方法。10.一种电子设备,其特征在于,包括处理器以及存储器,所述存储器上存储一条或多条可读指令,所述一条或多条可读指令被所述处理器执行时,实现权利要求1至8中任一项所述方法。

技术总结
本发明提供一种基于测序技术的血浆病毒检测分析方法,包括:富集血浆样本病毒颗粒,和病毒检测分析;其中,所述富集血浆样本病毒颗粒如下进行:离心步骤;核酸酶处理步骤;过滤步骤;超滤离心浓缩步骤;所述对所述测序结果进行病毒组去污染分析包括:批内污染过滤;非特异性病毒序列过滤;非人源宿主病毒过滤。采用本发明的方法可降低假阳性结果,提高病毒检测能力,实验结果表明本发明的方法平均LoD检测限提高约100倍,甚至可以低至5 Copies/ml的检测限,适用于临床样本中极低丰度的病毒病原的检测。检测。检测。


技术研发人员:王辉 马帅 王舒意 郭一凡 尹玉瑶
受保护的技术使用者:北京大学人民医院
技术研发日:2023.06.14
技术公布日:2023/7/18
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐