同时包含已知和潜在未知转化途径的抗生素转化产物识别方法

未命名 10-28 阅读:352 评论:0


1.本发明属于抗生素检测与分析技术领域,更具体地,涉及一种同时包含已知和潜在未知转化途径的抗生素转化产物识别方法。


背景技术:

2.抗生素已广泛应用于人类和动物疾病的预防和治疗,并通过污水、工业废水和地表径流等多种途径排放到地表水中。在人和动物体内、水处理过程中或自然水体中,抗生素会代谢或转化成各种产物。研究发现,在污水处理厂出水或自然环境中某些抗生素的转化产物比其母体化合物含量更高,且持久性、迁移性和毒性都更大。例如,两种磺胺甲恶唑的代谢产物(4-羟基磺胺甲恶唑和4-亚硝基磺胺甲恶唑)比磺胺甲恶唑具有更高的抗菌活性。因此,全面识别自然环境中的抗生素转化产物是十分必要的。
3.已有研究已经探讨了某些常用抗生素的转化途径,并识别了其部分转化产物。如,实验室研究已经明确了阿莫西林光解与水解途径中产生的,以阿莫西洛酸和阿莫西林哌嗪-2,5-二酮为代表的52种转化产物。这些实验室内模拟实验获得的转化途径以及识别出的转化产物,为复杂环境样品中抗生素转化产物的识别奠定了一定基础。
4.值得注意的是,目前在水环境中检出的母体抗生素有上百种,而实验室有关抗生素转化产物的研究涉及的母体抗生素种类有限,尚不能完全覆盖这些已经检出的母体抗生素。而且,实际环境体系比实验室单一体系更复杂,仅依靠实验室确定的已知转化途径与已知转化产物对实际样品中抗生素转化产物进行筛查,必然会造成转化产物的遗漏。因此,为了对抗生素类物质的转化产物进行全面的识别,综合考虑已知转化途径信息和潜在未知转化途径是非常必要的。
5.现有技术文件1(cn107884507b)公开了一种同时快速筛查废水中农药、药物及其转化产物的方法,在对转化产物进行鉴定时,主要步骤包括:1)对已经鉴定的农药、药物的母体化合物进行转化产物预测,获取母体化合物可能的转化产物,进行疑似筛查。2)将母体化合物及转化产物中出现频率最高的碎片离子作为诊断离子,进行非靶向筛查。该现有技术文件1的不足之处在于,非靶向筛查的基础为软件预测的已知转化产物或已知转化途径下的未知转化产物,会忽略未知转化途径下的转化产物信息。
6.现有技术文件2(cn111707741a)公开了一种环境介质中微量有机污染物转化产物的非靶向识别方法,主要使用分子网络的方法对各种环境介质中的微量有机污染物,包括:药品及个人护理品、持久性有机污染物、多氯联苯、多环芳烃、有机农药、全氟化合物有机污染物的转化产物进行识别。基于分子网络的非靶向筛查可以特异性地识别结构类似的质谱峰,在缺乏转化产物相关信息的基础上识别新的未知产物。该现有技术文件2的不足之处在于,在识别过程中可能会因缺少转化过程相关信息而造成产物的遗漏。


技术实现要素:

7.为解决现有技术中存在的不足,本发明提供一种同时包含已知和潜在未知转化途径的抗生素转化产物识别方法,用于全面识别实际样品中的抗生素转化产物。
8.本发明采用如下的技术方案。本发明提供了一种同时包含已知和潜在未知转化途径的抗生素转化产物识别方法,包括以下步骤:步骤1:采集目标区域多个点位样品,提取抗生素及其转化产物,进行超高效液相色谱-高分辨质谱非靶向数据采集,对数据进行预处理得到峰列表;步骤2:基于步骤1获得的质谱数据,实施识别已知转化途径的抗生素转化产物的步骤a,以及识别未知转化途径的抗生素转化产物的步骤b;步骤a包括:收集已知抗生素的结构信息,建立抗生素母体信息清单,构建转化产物疑似清单;步骤b包括:搭建分子网络,提取母体所在子网络包含的所有特征,获取未知途径转化产物;步骤3:综合步骤2获得的已知途径转化产物和未知途径的转化产物,得到候选转化产物清单,并进行转化产物结构注释;步骤4:根据步骤3所得的转化产物结构注释提取特征碎片,并以特征碎片对峰列表进行搜索,补充未知途径的转化产物;步骤5:综合以上转化产物结果进行结构注释后,得到最终鉴定产物清单。
9.优选地,步骤a包括:步骤a.1:收集已知抗生素的结构信息建立抗生素母体信息清单;步骤a.2:对步骤a.1所得抗生素母体,得到所有转化产物的疑似清单;步骤a.3:清理和合并步骤a.2所得转化产物预测结果。
10.优选地,步骤a.2中,根据已知转化途径,构建的转化产物疑似清单中,包括已知的转化产物以及已知途径预测出的转化产物。
11.优选地,步骤a.3中,去除与母体结构相似度小于设定值以及具有相同分子描述符的转化产物,用以清理和合并步骤a.2所得转化产物预测结果。
12.优选地,步骤b具体包括:步骤b.1:对步骤1获得的质谱数据进行预处理,获得特征定量量化表和ms/ms信息摘要文件;步骤b.2:使用步骤b.1获得的特征量化表和ms/ms摘要建立分子网络;步骤b.3:使用步骤b.2获得的分子网络提取抗生素母体的未知途径转化产物质谱峰信息。
13.优选地,步骤b.2中,将步骤b.1获得的特征量化表和ms/ms摘要导出到全球天然产物社会分子网络平台,使用基于特征的分子网络工作流程创建分子网络;设置最小匹配片段离子和余弦分数。
14.优选地,步骤b.3中,在步骤b.2构建的分子网络图中,根据分子网络中节点上所展示的母离子质荷比,定位抗生素母体及已知转化产物所在区域,从而提取子网络包含的所有特征,获得该抗生素母体的未知途径转化产物质谱峰。
15.优选地,步骤3中,对未知途径的转化产物进行结构注释,对所有转化产物结构分配对应置信度,levels 1-5。
16.优选地,步骤4中,将母体抗生素及样本中已筛查出的转化产物中出现频率最高的碎片离子作为特征碎片。
17.优选地,步骤5中,选取置信度levels 1-3的转化产物得到最终鉴定产物清单。
18.与现有技术相比,本发明的有益效果至少包括:(1)本发明采用转化产物疑似清单与分子网络相结合的方法,从而识别同时包含已知和潜在未知转化途径的抗生素转化产物。
19.(2)在疑似清单与分子网络筛查结果的基础上,在所有转化产物的结果中提取特征碎片集,此特征碎片集同时包含已知和潜在未知转化途径信息。再次使用特征碎片进行非靶向筛查,从而全面地识别抗生素的转化产物。
附图说明
20.图1是本发明提供的同时包含已知和潜在未知转化途径的抗生素转化产物识别方法的流程图。
具体实施方式
21.为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明的技术方案进行清楚、完整地描述。本技术所描述的实施例仅仅是本发明一部分的实施例,而不是全部实施例。基于本发明精神,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明的保护范围。
22.如图1所示,本发明的实施例1提供了一种同时包含已知和潜在未知转化途径的抗生素转化产物识别方法,包括以下步骤:步骤1:采集目标区域多个点位水体样品,提取抗生素及其转化产物,进行超高效液相色谱-高分辨质谱非靶向数据采集,对数据进行预处理得到峰列表。
23.在本发明优选但非限制性的实施方式中,步骤1具体包括:步骤1.1:采集目标区域多个点位样品,进行预处理,以达到富集和净化的目的,提取抗生素及其转化产物。
24.进一步优选地,收集9个地表水样本,编号为s1-s9。将样品收集在1升干净的棕色玻璃瓶中,并立即用冰冷却器运送到实验室,并在4℃的黑暗环境中保存。在采集后24小时内,使用滤膜过滤去除样品中的颗粒物,固相萃取纯化样品,并进行洗脱、氮气吹扫和定容。样本数量是任意的,对样本的操作是相同的。
25.步骤1.2:对步骤1.1所得多个样品进行超高效液相色谱-高分辨质谱非靶向数据采集,对数据进行预处理得到峰列表。
26.进一步优选地,采用超高效液相色谱-静电场轨道阱高分辨质谱联用仪进行非靶向分析。
27.更优选地,在正负电离模式下均进行ms全扫描,质量范围为m/z 100-1500,分辨率为140,000;以及3次数据依赖性的ms/ms采集,分辨率为17,500。
28.步骤2:基于步骤1获得的质谱数据,实施识别已知转化途径的抗生素转化产物的步骤a,以及识别未知转化途径的抗生素转化产物的步骤b;步骤a包括:收集已知抗生素的结构信息,建立抗生素母体信息清单,构建转化产
物疑似清单;步骤b包括:搭建分子网络,提取抗生素母体所在子网络包含的所有特征,获取未知途径转化产物。
29.值得注意的是,步骤a和步骤b的执行顺序不存在先后关系,可以先执行步骤a或先执行步骤b,也可以同时执行步骤a和步骤b。
30.在本发明优选但非限制性的实施方式中,步骤a具体包括:步骤a.1:收集已知抗生素的结构信息,建立抗生素母体信息清单。
31.具体地,对比抗生素母体信息清单与质谱数据,筛出样品中包含的抗生素母体。已知的抗生素母体信息清单例如但不限于,从各个技术团队已有抗生素清单、文献、norman suspect list exchange数据库、《中国药品统计年鉴》中得到抗生素母体信息清单,以及目前市售所有抗生素的结构信息。
32.值得注意的是,抗生素母体信息清单的范围可以根据实际样品情况进行优选,比如针对养殖废水样品,只建好兽用抗生素清单再进行后续操作步骤即可。
33.步骤a.2:对步骤a.1所得抗生素母体,得到所有转化产物的疑似清单。
34.值得注意的是,可以使用文献中已经确定的转化途径,也可以使用任意预测工具对抗生素母体根据已知转化途径进行转化产物预测,在本发明申请日之前,优选但不限于,使用biotransformer 3.0对样品中存在的抗生素母体的已知转化途径产生的转化产物进行预测。在本发明申请日之后,使用任意新的预测工具执行步骤a.2,对抗生素母体根据已知转化途径进行转化产物预测也属于本发明的范围之内。biotransformer3.0仅是一种示例性的预测工具,而非唯一工具。
35.步骤a.3:清理和合并步骤a.2所得转化产物预测结果。
36.进一步优选地,去除与母体结构相似度小于设定值以及具有相同分子描述符的转化产物,用以清理和合并步骤a.2所得转化产物预测结果。
37.更优选地,使用r语言patroon 2.0包在批处理模式下去除与母体结构相似度《50%和具有相同分子描述符的转化产物。
38.在本发明优选但非限制性的实施方式中,步骤b具体包括:步骤b.1:对步骤1获得的质谱数据进行预处理,获得特征量化表和ms/ms摘要。
39.进一步优选地,原始质谱数据首先通过reifycs基础文件转换器转换为abf文件格式,并在ms-dial 4.9054软件中进行预处理,最后导出为特征定量表(txt格式)和ms/ms信息摘要文件(mgf格式)。
40.步骤b.2:使用步骤b.1获得的特征定量表和ms/ms信息摘要文件建立分子网络。
41.进一步优选地,将步骤b.1获得的特征定量表和ms/ms信息摘要文件输出到gnps平台 (https://gnps.ucsd.edu,global natural products social molecular networking,全球天然产物社会分子网络),使用基于特征的分子网络(fbmn,feature-based molecular networking)工作流程创建分子网络。
42.更优选地,最小匹配片段离子和余弦分数分别设置为5和0.6。最后使用cytoscape 3.9.1对分子网络进行可视化。其中余弦分数是指一对ms/ms谱图的余弦相似度。
43.步骤b.3:使用步骤b.2获得的分子网络提取抗生素母体的未知途径转化产物质谱峰信息。
44.进一步优选地,在步骤b.2构建的分子网络图中,根据分子网络中节点上所展示的
母离子质荷比,定位抗生素母体及已知转化产物所在区域,从而提取子网络包含的所有特征(二级谱图类似性较大),即可能为该抗生素母体的未知途径转化产物质谱峰。
45.步骤3:综合步骤2获得的已知和未知转化途径的转化产物,得到候选转化产物单,并进行转化产物结构注释。
46.在本发明优选但非限制性的实施方式中,根据计算机预测质谱碎裂工具对未知途径的转化产物进行结构解析,例如但不限于,metfrag和mass frontier 7.0。对所有转化产物结构分配对应置信度,levels 1-5。
47.步骤4:根据步骤3所得的转化产物结构注释提取特征碎片,并以特征碎片对峰列表进行搜索,再次补充未知途径的转化产物。
48.在本发明优选但非限制性的实施方式中,将母体抗生素及转化产物中出现频率最高的碎片离子作为特征碎片。
49.进一步优选地,以设定质量偏差和离子丰度进行搜索,在ms/ms谱图中包含特征碎片的特征被优先作为候选未知途径的转化产物进行进一步的结构解析。
50.更优选地,在进行特征碎片搜索时,质量偏差为0.01 da,离子丰度为10%。
51.步骤5:综合以上转化产物结果进行结构注释后,得到最终鉴定产物清单。
52.在优选的但非限制性的实施方式中,选取levels 1-3的转化产物得到最终鉴定产物清单。
53.为了更加清楚地介绍本发明的技术方案及其能够取得的有益技术效果,以下介绍实施本发明的实例,包括以下步骤:采集目标区域9个点位地表水样品,编号为s1-s9,将样品收集在1升干净的棕色玻璃瓶中,并立即用冰冷藏并运送到实验室,并在4℃的黑暗环境中保存。在采集后24小时内,使用滤膜过滤去除样品中的颗粒物,固相萃取纯化样品,并进行洗脱、氮气吹扫蒸发和定容。提取抗生素及其转化产物。
54.采用超高效液相色谱-静电场轨道阱高分辨质谱联用仪进行非靶向分析,在正负电离模式下均进行ms全扫描,质量范围为m/z 100-1500,分辨率为140,000;以及3次数据依赖性的ms/ms采集,分辨率为17,500。
55.编制包含663种化合物的抗生素母体清单, 使用biotransformer 3.0对所得663种抗生素母体根据已知转化途径进行转化产物预测,共预测出80924个转化产物。
56.使用r语言patroon 2.0包在批处理模式下去除与母体结构相似度《50%和具有相同分子描述符的转化产物,总共有882个疑似转化产物用于后续筛查。
57.原始质谱数据首先通过reifycs基础文件转换器转换为abf文件格式,并在ms-dial 4.9054软件中进行预处理,最后导出为txt格式的特征定量表和mgf格式的ms/ms信息摘要文件。
58.将txt格式的特征定量表和mgf格式的ms/ms信息摘要文件输出到gnps平台,使用基于特征的fbmn工作流程创建分子网络,最小匹配片段离子和余弦分数分别设置为5和0.6。最后使用cytoscape 3.9.1对分子网络进行可视化。
59.在构建的分子网络图中,根据分子网络中节点上所展示的母离子质荷比,定位抗生素母体及已知转化产物所在区域,从而提取子网络包含的所有特征,即可能为该抗生素母体的未知途径转化产物质谱峰。共收集了138个质谱峰信息。
60.综合获得的已知途径转化产物和未知途径的转化产物,得到候选转化产物单,并进行转化产物结构注释。根据metfrag和mass frontier 7.0对未知途径的转化产物进行结构解析。对所有转化产物结构分配对应置信度levels 1-5。
61.将母体抗生素及转化产物中出现频率最高的碎片离子作为特征碎片,在ms-dial 4.9054中使用“ms/ms碎片搜索器”功能进行特征碎片搜索,质量偏差为0.01 da,离子丰度为10%。在ms/ms谱图中包含特征碎片的特征被优先作为候选未知途径的转化产物进行进一步的结构解析。
62.综合上述步骤的转化产物结果进行结构注释后,选取levels 1-3的转化产物,在样品中共筛选出176种置信等级在1-3的抗生素转化产物。
63.本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。
64.最后应当说明的是,以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

技术特征:
1.一种同时包含已知和潜在未知转化途径的抗生素转化产物识别方法,其特征在于,包括以下步骤:步骤1:采集目标区域多个点位样品,提取抗生素及其转化产物,进行超高效液相色谱-高分辨质谱非靶向数据采集,得到峰列表;步骤2:基于步骤1获得的质谱数据,实施识别已知转化途径的抗生素转化产物的步骤a,以及识别未知转化途径的抗生素转化产物的步骤b;步骤a包括:收集已知抗生素的结构信息,建立抗生素母体信息清单,构建转化产物疑似清单;步骤b包括:搭建分子网络,提取母体所在子网络包含的所有特征,获取未知途径转化产物;步骤3:综合步骤2获得的已知途径转化产物和未知途径的转化产物,得到候选转化产物清单,并进行转化产物结构注释;步骤4:根据步骤3所得的转化产物结构注释提取特征碎片,并以特征碎片对谱图中的数据进行搜索,补充未知途径的转化产物;步骤5:综合以上转化产物结果进行结构注释后,得到最终鉴定产物清单。2.如权利要求1所述的一种同时包含已知和潜在未知转化途径的抗生素转化产物识别方法,其特征在于:步骤a包括:步骤a.1:收集已知抗生素的结构信息,建立抗生素母体信息清单;步骤a.2:对步骤a.1所得抗生素母体,得到所有转化产物的疑似清单;步骤a.3:清理和合并步骤a.2所得转化产物预测结果。3.如权利要求2所述的一种同时包含已知和潜在未知转化途径的抗生素转化产物识别方法,其特征在于:步骤a.2中,根据已知转化途径,构建的转化产物疑似清单中,包括已知的转化产物以及已知途径预测出的转化产物。4.如权利要求2或3所述的一种同时包含已知和潜在未知转化途径的抗生素转化产物识别方法,其特征在于:步骤a.3中,去除与母体结构相似度小于设定值以及具有相同分子描述符的转化产物,用以清理和合并步骤a.2所得转化产物预测结果。5.如权利要求1至3中的任意一项所述的一种同时包含已知和潜在未知转化途径的抗生素转化产物识别方法,其特征在于:步骤b具体包括:步骤b.1:对步骤1获得的质谱数据进行预处理,获得特征定量表和ms/ms信息摘要文件;步骤b.2:使用步骤b.1获得的特征量化表和ms/ms摘要建立分子网络;步骤b.3:使用步骤b.2获得的分子网络提取抗生素母体的未知途径转化产物质谱峰信息。6.如权利要求5所述的一种同时包含已知和潜在未知转化途径的抗生素转化产物识别方法,其特征在于:步骤b.2中,将步骤b.1获得的特征量化表和ms/ms摘要导出到全球天然产物社会分子
网络平台,使用基于特征的分子网络工作流程创建分子网络;设置最小匹配片段离子和余弦分数。7.如权利要求6所述的一种同时包含已知和潜在未知转化途径的抗生素转化产物识别方法,其特征在于:步骤b.3中,在步骤b.2构建的分子网络图中,根据分子网络中节点上所展示的母离子质荷比,定位抗生素母体及已知转化产物所在区域,从而提取子网络包含的所有特征,获得该抗生素母体的未知途径转化产物质谱峰。8.如权利要求1至3中的任意一项所述的一种同时包含已知和潜在未知转化途径的抗生素转化产物识别方法,其特征在于:步骤3中,对未知途径的转化产物进行结构注释,对所有转化产物结构分配对应置信度,levels 1-5。9.如权利要求1至3中的任意一项所述的一种同时包含已知和潜在未知转化途径的抗生素转化产物识别方法,其特征在于:步骤4中,将母体抗生素及样本中已筛查出的转化产物中出现频率最高的碎片离子作为特征碎片,利用特征碎片对峰列表进行搜索,补充未知途径的转化产物。10.如权利要求8所述的一种同时包含已知和潜在未知转化途径的抗生素转化产物识别方法,其特征在于:步骤5中,选取置信度levels 1-3的转化产物得到最终鉴定产物清单。

技术总结
一种同时包含已知和潜在未知转化途径的抗生素转化产物识别方法,包括以下步骤:步骤1:采集目标区域多个点位样品,提取抗生素及其转化产物,进行超高效液相色谱-高分辨质谱非靶向数据采集,对数据进行预处理得到峰列表;步骤2:实施识别已知转化途径的抗生素转化产物的步骤A,以及识别未知转化途径的抗生素转化产物的步骤B;步骤3,综合步骤2获得的已知途径转化产物和未知途径的转化产物,得到候选转化产物清单,并进行转化产物结构注释;步骤4,根据步骤3所得的转化产物结构注释提取特征碎片,并以特征碎片对谱图中的数据进行搜索,补充未知途径的转化产物;步骤5:综合以上转化产物结果进行结构注释后,得到最终鉴定产物清单。单。单。


技术研发人员:孙卫玲 胡景润 刘一 邓敏杰 姬明飞 李玉英
受保护的技术使用者:南阳师范学院
技术研发日:2023.09.05
技术公布日:2023/10/15
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐