基于超图矩阵三分解的抗病毒药物筛选方法及系统与流程

未命名 09-18 阅读:79 评论:0


1.本发明涉及生物信息学、计算生物学与人工智能交叉的技术领域,尤其涉及基于超图矩阵三分解的抗病毒药物筛选方法及系统。


背景技术:

2.从头开发新药存在耗时长、风险高等诸多困难,需要采用一种新的药物发现策略,使用计算方法发掘已获批药物在原始医学适应症范围之外的治疗作用,此类方法能够极大地减少时间消耗和劳动力成本。
3.已经报道的抗病毒药物计算筛选方法可分为以下三类,但分别存在以下不足:(1)分子对接方法,在原子水平上模拟配体和靶蛋白之间的相互作用,存在参数多、对经验要求高等不足;(2)动力学模拟法,通过热力学方法确认配体-蛋白质的稳定相互作用,一般计算量大且对硬件条件要求高;(3)深度学习模型,预测抗病毒药物存在解释性差的问题。随着数据挖掘技术逐步发展,相关的机器学习方法能够整合公开生物医学数据库的多种信息,高效、准确地完成药物筛选任务。


技术实现要素:

4.本发明提供基于超图矩阵三分解的抗病毒药物筛选方法及系统,可以根据病毒-药物关联、病毒基因组序列和药物化学结构数据,准确高效地筛选出抗病毒药物。
5.本说明书实施例的第一方面公开了基于超图矩阵三分解的抗病毒药物筛选方法,包括如下步骤:s1.构建病毒-药物关联的邻接矩阵;s2.基于所述病毒-药物关联的邻接矩阵,计算病毒高斯距离相似矩阵和药物高斯距离相似矩阵;s3.基于病毒基因组序列计算病毒基因序列相似矩阵,基于药物化学结构计算药物化学结构相似矩阵;s4.基于所述病毒高斯距离相似矩阵和病毒基因序列相似矩阵,使用快速核学习方法,整合得到病毒整合相似矩阵;基于所述药物高斯距离相似矩阵和药物化学结构相似矩阵,使用快速核学习方法,整合得到药物整合相似矩阵;s5.使用频谱偏移法处理病毒整合相似矩阵和药物整合相似矩阵,得到病毒核矩阵和药物核矩阵;s6.基于超图学习的矩阵三分解构造损失函数,求解得到病毒-药物预测得分矩阵;s7.基于所述病毒-药物预测得分矩阵,筛选出目标病毒所在行的得分,排序后得到最终预测结果。
6.在本说明书公开的实施例中,在s1中:输入已知的病毒-药物关联对,构建病毒-药物关联的邻接矩阵a;
若为已知关联对,则对应位置为1,否则为0;所述邻接矩阵a的行数为病毒数量nv,列数为药物数量nd。
7.在本说明书公开的实施例中,在s2中:若药物d(i)与某个病毒之间存在关联,则对应位置记为1,否则记为0,形成一个1
×
nv大小的0或1构成的向量,记之为药物d(i)的向量谱ip(d(i)),然后计算药物d(i)和d(j)之间的高斯距离相似性:;上式中,参数γd用于控制核带宽,通过归一化新带宽参数γ’d
获得:;以类似的方式定义病毒v(i)和v(j)之间的高斯距离相似性,得到1
×
nd大小的0或1构成的向量,记之为病毒v(i)的向量谱ip(v(i)),计算病毒v(i)和v(j)之间的高斯距离相似性:;参数γv用于控制核带宽,通过归一化新带宽参数γ’v
获得:;以上γ’d
和γ’v
都是常数。
8.在本说明书公开的实施例中,在s3中:基于病毒基因组序列,使用多序列比方法计算病毒基因序列相似矩阵;基于药物的化学结构,得到药物maccs指纹,采用谷本系数(即jaccard相似度)计算药物化学结构相似矩阵。
9.在本说明书公开的实施例中,在s4中:所述快速核学习方法的半正定规划式为:;式中,第一项为重构损失范数项,表示相似矩阵的整合误差大小;第二项为正则化项,作用是避免过拟合;其中a为病毒-药物关联邻接矩阵,s
jv
(j=1,2)分别表示病毒高斯距离相似矩阵和病毒基因序列相似矩阵,μv为正则化参数,λv∈r1×2为待求解的系数,通过λv得到病毒整合相似矩阵:;同理,按照上述可获得药物化学结构相似矩阵与药物高斯距离相似矩阵集成参数λd∈r1×2,然后计算药物整合相似矩阵:
;其中s
jd
(j=1,2)分别表示药物高斯距离相似矩阵和药物化学结构相似矩阵。
10.在本说明书公开的实施例中,在s5中:使用频谱偏移法处理病毒整合相似矩阵sv得到病毒核矩阵k
*v
,使用频谱偏移法处理药物整合相似矩阵sd得到药物核矩阵k
*d
,具体计算方法为按分解病毒或药物的整合相似度矩阵s,其中u是正交矩阵,λ是实特征值构成的对角矩阵,即λ = diag(λ1, λ2,
ꢀ…
, λn),λ
min
(s)表示输入矩阵s的最小特征值,i表示单位矩阵,t表示矩阵的转置;采用频谱偏移法处理病毒整合相似度矩阵sv矩阵以及药物整合相似性sd矩阵,目的是在不改变任何两个样本之间的相似性的前提下,加强sv和sd矩阵自相似性。
11.在本说明书公开的实施例中,在s6中:使用基于超图学习的矩阵三分解构造损失函数,求解得到病毒-药物预测得分矩阵;首先使用基于超图学习的矩阵三分解构造目标函数如下:;其中为已知的病毒-药物关联矩阵,f为待求的预测得分矩阵;表示将关于变量的右侧式子值记为j,min表示求最小值,表示投影矩阵,其中r
nv
和r
nd
分别表示病毒潜在特征空间的维度和药物潜在特征空间的维度,‖
·
‖f指矩阵的f范数,tr(
·
)表示矩阵的迹,λ1和λ2是正则化系数;基于病毒核矩阵k
*v
,通过奇异值分解svd方法求解得到低秩近似矩阵w,具体为;表示病毒的超图归一化拉普拉斯矩阵,计算方式为,其中i是单位矩阵,d
vv
和d
ve
分别是病毒对应的顶点度和超边度的对角矩阵,矩阵hv为病毒超图关联的对角矩阵,av为病毒超边权重的对角矩阵;基于药物核矩阵k
*d
,通过奇异值分解svd方法求解得到低秩近似矩阵h,具体为具体为表示药物的超图归一化拉普拉斯矩阵,计算方式为,其中i是单位矩阵,d
dv
和d
de
分别是药物的顶点度和超边度的对角矩阵,矩阵hd为药物超图关联的对角矩阵,ad为药物超边权重的对角矩阵;求导后令得到,求解,
,其中是单位矩阵,矩阵p、q和c为无特殊含义的中间过程变量,使用西尔维斯特方程通用解法得到矩阵;计算病毒-药物预测得分矩阵。
12.在本说明书公开的实施例中,在s7中:根据病毒-药物关联对预测分数,筛选出目标病毒所在行的得分,排序后得到最终预测结果。
13.本发明实施例的第二方面公开了基于超图矩阵三分解的抗病毒药物筛选系统,包括:邻接矩阵构建模块,用于构建病毒-药物关联的邻接矩阵;高斯距离相似矩阵计算模块,用于基于所述病毒-药物关联的邻接矩阵,计算病毒高斯距离相似矩阵和药物高斯距离相似矩阵;病毒基因序列相似矩阵与药物化学结构相似矩阵计算模块,用于基于病毒基因组序列计算病毒基因序列相似矩阵,基于药物化学结构计算药物化学结构相似矩阵;整合相似矩阵计算模块,用于基于所述病毒高斯距离相似矩阵和病毒基因序列相似矩阵,使用快速核学习方法,整合得到病毒整合相似矩阵;基于所述药物高斯距离相似矩阵和药物化学结构相似矩阵,使用快速核学习方法,整合得到药物整合相似矩阵;损失函数构造模块,用于使用频谱偏移法处理病毒整合相似矩阵和药物整合相似矩阵,使用超图学习的矩阵三分解构造损失函数;损失函数求解模块,用于求解所述损失函数,得到病毒-药物预测得分矩阵;预测模块,用于基于所述病毒-药物预测得分矩阵,筛选出目标病毒所在行的得分,排序后得到最终预测结果。
14.在本说明书公开的实施例中,所述基于超图矩阵三分解的抗病毒药物筛选系统还包括:处理器,分别与所述邻接矩阵构建模块、高斯距离相似矩阵计算模块、病毒基因序列相似矩阵与药物化学结构相似矩阵计算模块、整合相似矩阵计算模块、损失函数构造模块、损失函数求解模块和预测模块连接;存储器,与所述处理器连接,并存储有可在所述处理器上运行的计算机程序;其中,当所述处理器执行所述计算机程序时,所述处理器控制所述邻接矩阵构建模块、高斯距离相似矩阵计算模块、病毒基因序列相似矩阵与药物化学结构相似矩阵计算模块、整合相似矩阵计算模块、损失函数构造模块、损失函数求解模块和预测模块工作,以实现上述中任意一项所述的基于超图矩阵三分解的抗病毒药物筛选方法。
15.综上所述,本发明至少具有以下有益效果:本发明构通过构建病毒-药物关联的邻接矩阵,分别计算病毒高斯距离相似矩阵和药物高斯距离相似矩阵;使用病毒基因组序列计算病毒基因序列相似矩阵,使用药物的化学结构信息计算药物化学结构相似矩阵;使用快速核学习法计算病毒整合相似矩阵、药物整合相似矩阵;结合频谱偏移法、超图学习的矩阵三分解构建损失函数,求解得到病毒-药物关联预测得分矩阵,筛选、排序得到最终结果。本发明能快速、高效地筛选出病毒有效治疗药物,弥补生物医学实验方法耗时长、成本高的不足,为特定情况下应急解决方案提供
了思路。
附图说明
16.为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
17.图1为本发明中所涉及的基于超图矩阵三分解的抗病毒药物筛选方法的步骤示意图。
18.图2为本发明中所涉及的基于超图矩阵三分解的抗病毒药物筛选方法的流程示意图。
19.图3为本发明中所涉及的基于超图矩阵三分解的抗病毒药物筛选方法与基线方法五折交叉验证的结果比较图。
20.图4为本发明中所涉及的基于超图矩阵三分解的抗病毒药物筛选系统的示意图。
具体实施方式
21.在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本发明实施例的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。
22.下文的公开提供了许多不同的实施方式或例子用来实现本发明实施例的不同结构。为了简化本发明实施例的公开,下文中对特定例子的部件和设置进行描述。当然,它们仅仅为示例,并且目的不在于限制本发明实施例。此外,本发明实施例可以在不同例子中重复参考数字和/或参考字母,这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施方式和/或设置之间的关系。
23.下面结合附图对本发明的实施例进行详细说明。
24.需要注意的是,本说明书的实施例中所使用的已知人类药物-病毒关联数据是从有关文献中收集的,先使用文本挖掘技术对文献报道的经过实验验证的药物-病毒相互作用对进行整理后,获得455个已证实的人类病毒-药物相互作用,涉及34种病毒与219种药物(文献doi:10.1016/j.asoc.2021.107135);药物化学结构从drugbank数据库下载,病毒基因组核苷酸序列从美国国家生物技术信息中心ncbi数据库获得。
25.如图1和图2所示,本说明书实施例的第一方面公开了基于超图矩阵三分解的抗病毒药物筛选方法,包括如下步骤:s1.构建病毒-药物关联的邻接矩阵。
26.输入已知的病毒-药物关联对,构建病毒-药物关联的邻接矩阵a;;得到的邻接矩阵a元素为0或1,大小为34行
×
219列,i与j的取值范围满足1≤i≤34,1≤j≤219。
27.s2.基于病毒-药物关联的邻接矩阵,计算病毒高斯距离相似矩阵和药物高斯距离
相似矩阵。
28.若药物d(i)与某个病毒之间存在关联,则对应位置记为1,否则记为0,形成一个1
×
34大小的0或1构成的向量,记之为药物d(i)的向量谱ip(d(i)),然后计算药物d(i)和d(j)之间的高斯距离相似性:;上式中,ip(d(j))为药物d(j)的向量谱;参数γd用于控制核带宽,通过归一化新带宽参数γ’d
获得:;以类似的方式定义病毒v(i)和v(j)之间的高斯距离相似性,若某一个病毒v(i)与某药物之间存在关联,则对应位置记为1,否则记为0,形成一个1
×
219大小的0或1构成的向量,记之为病毒v(i)的向量谱ip(v(i)),然后计算病毒v(i)和v(j)之间的高斯距离相似性:;上式中ip(v(j))为病毒v(j)的向量谱,参数γv用于控制核带宽,通过归一化新带宽参数γ’v
获得:;以上γ’d
和γ’v
都是常数,取γ’d
=γ’v
=1。
29.其中nv表示病毒的数量,此例中为34,nd表示药物的数量,此例中为219,此步计算后得到大小为34
×
34的对称矩阵s
1v
(病毒高斯距离相似矩阵)和大小为219
×
219的对称矩阵s
1d
(药物高斯距离相似矩阵),且这两个矩阵元素值全都在0到1之间。
30.s3.基于病毒基因组序列计算病毒基因序列相似矩阵,基于药物化学结构计算药物化学结构相似矩阵。
31.输入病毒基因组序列,使用多序列比对工具mafft计算得到病毒基因序列相似矩阵s
2v
;输入smiles编码表示的药物化学结构,然后用化学信息学软件rdkit或open babel获得药物的分子访问系统指纹(maccs),再使用r包rxnsim计算tanimoto相似度,得到药物化学结构相似矩阵s
2d
,具体计算方法是,对d(i)和d(j)两种药物,将此两种药物的maccs片段二进制表示的字符串集分别记为d(i)和d(j),d(i)和d(j)间的相似度s
dij
值可以用下面公式计算:;s4.基于病毒高斯距离相似矩阵和病毒基因序列相似矩阵,使用快速核学习方法,整合得到病毒整合相似矩阵;基于药物高斯距离相似矩阵和药物化学结构相似矩阵,使用快速核学习方法,整合得到药物整合相似矩阵。
32.使用快速核学习方法整合病毒基因序列相似矩阵和病毒高斯距离相似矩阵,具体是通过求解下面的半正定规划式:
;式中,第一项为重构损失范数项,表示相似矩阵的整合误差大小;第二项为正则化项,作用是避免过拟合;其中a为病毒-药物关联邻接矩阵,s
jv
(j=1,2)分别表示病毒高斯距离相似矩阵和病毒基因序列相似矩阵,μv为正则化参数,λv∈r1×2为待求解的系数,使用matlab软件中的cvx工具箱求解得到病毒整合相似矩阵:;同理,按照上述可获得药物化学结构相似矩阵与药物高斯距离相似矩阵集成参数λd∈r1×2,然后计算药物整合相似矩阵:;其中s
jd
(j=1,2)分别表示药物高斯距离相似矩阵和药物化学结构相似矩阵。
33.s5.使用频谱偏移法处理病毒整合相似矩阵和药物整合相似矩阵,得到对应核矩阵k
*v
和k
*d
;具体计算方法为按分解病毒或药物的整合相似度矩阵s,其中u是正交矩阵,λ是实特征值构成的对角矩阵,即λ = diag(λ1, λ2,
ꢀ…
, λn),λ
min
(s)表示输入矩阵s的最小特征值,i表示单位矩阵,t表示矩阵的转置;采用频谱偏移法处理病毒整合相似度矩阵sv矩阵以及药物整合相似性sd矩阵,目的是在不改变任何两个样本之间的相似性的前提下,加强sv和sd矩阵自相似性。
34.s6.使用基于超图学习的矩阵三分解构造损失函数,求解得到病毒-药物预测得分矩阵;首先使用基于超图学习的矩阵三分解构造目标函数如下:;其中为已知的病毒-药物关联矩阵,f为待求的预测得分矩阵;表示将关于变量的右侧式子值记为j,min表示求最小值,表示投影矩阵,其中r
nv
和r
nd
分别表示病毒潜在特征空间的维度和药物潜在特征空间的维度,‖
·
‖f指矩阵的f范数,tr(
·
)表示矩阵的迹,λ1和λ2是正则化系数;基于病毒核矩阵k
*v
,通过奇异值分解svd方法求解得到低秩近似矩阵w,具体为;表示病毒的超图归一化拉普拉斯矩阵,计算方式为,其中i是单位矩阵,d
vv
和d
ve
分别是病毒对应的
顶点度和超边度的对角矩阵,矩阵hv为病毒超图关联的对角矩阵,av为病毒超边权重的对角矩阵;基于药物核矩阵k
*d
,通过奇异值分解svd方法求解得到低秩近似矩阵h,具体为;表示药物的超图归一化拉普拉斯矩阵,计算方式为,其中i是单位矩阵,d
dv
和d
de
分别是药物的顶点度和超边度的对角矩阵,矩阵hd为药物超图关联的对角矩阵,ad为药物超边权重的对角矩阵;求导后令得到,求解,,其中是单位矩阵,矩阵p、q和c为无特殊含义的中间过程变量,使用西尔维斯特方程通用解法得到矩阵;计算病毒-药物预测得分矩阵。
35.s7.根据病毒-药物关联对预测分数,筛选出目标病毒所在行的得分,排序后得到最终预测结果。
36.在上述算法的实现过程中,取正则化参数λ1=λ2=1;使用matlab编程实现时,求核矩阵k
*v
和k
*d
的svd分解使用svds函数,涉及矩阵p、q和c的求逆运算使用pinv函数,求关于矩阵的西尔维斯特方程使用sylvester函数。
37.本发明的有效性验证:如图1和图2所示的基于超图矩阵三分解的抗病毒药物筛选方法,采用五重交叉验证进行预测性能评估,具体实施方式为:先将所有已知的药物-病毒关联随机平均分成5组,再将其中每组依次设为测试样本,其他组作为训练样本(测试样本选取情况不同时,依赖测试样本计算所得的高斯距离相似矩阵亦随之改变)。使用训练样本作为本方法的输入得到预测结果,最后将该组中每个测试样本的预测分数与候选样本的分数进行比较。为了减少生成测试样本的过程中随机划分对结果造成的影响,进行了100次五折交叉验证。
38.使用matlab编程计算后获得了如下数据,如图3所示为本方法hgrtmfvda与现已报道的几种病毒-药物筛选模型之间的auroc(roc曲线下面积)值比较。本方法在五折交叉验证中取得了0.8315
±
0.0084的auroc值,表现出了比几种经典模型更加出色的预测性能。
39.另外一方面,对具体某种病毒,如新型冠状病毒(sars-cov-2)使用本方法来做预测,筛选评分矩阵中sars-cov-2对应的行即取得新冠相关药物的预测得分,将其降序排列后中前20个药物有17个能够得到已报道文献的支持。
40.下表展示了预测结果前20个药物名称和支持文献的pmid号或doi号。
41.序号药物名称支持证据1nitazoxanidepmid:363323612mizoribinepmid:173365193chloroquinepmid:339065144hydroxychloroquinepmid:32926573,339065145ribavirinpmid:33689451
6n4-hydroxycytidinepmid:354922187amodiaquinepmid:363323618niclosamidepmid:346641629maribavirdoi:10.1021/acsbiomedchemau.2c0003910memantinepmid:3282826911quinacrinepmid:3347737612mycophenolic acidpmid:3257925813disulfirampmid:3385527714dasatinibpmid:3670483915mycophenolate mofetil暂未找到16chlorphenoxamine暂未找到17camostatpmid:3569222018umifenovirpmid:3624585119vismodegib暂未找到20nelfinavirdoi:10.26434/chemrxiv.12039888.v1综上,本发明的优点:通过在矩阵三分解中引入超图正则化方法,能充分获取高维流形结构信息提升预测性能,使得病毒-药物关联预测结果更准确、更具有鲁棒性。
42.如图4所示,本发明实施例的第二方面公开了基于超图矩阵三分解的抗病毒药物筛选系统,包括:邻接矩阵构建模块,用于构建病毒-药物关联的邻接矩阵;高斯距离相似矩阵计算模块,用于基于病毒-药物关联的邻接矩阵,计算病毒高斯距离相似矩阵和药物高斯距离相似矩阵;病毒基因序列相似矩阵与药物化学结构相似矩阵计算模块,用于基于病毒基因组序列计算病毒基因序列相似矩阵,基于药物化学结构计算药物化学结构相似矩阵;整合相似矩阵计算模块,用于基于病毒高斯距离相似矩阵和病毒基因序列相似矩阵,使用快速核学习方法,整合得到病毒整合相似矩阵;基于药物高斯距离相似矩阵和药物化学结构相似矩阵,使用快速核学习方法,整合得到药物整合相似矩阵;损失函数构造模块,用于基于病毒-药物关联的邻接矩阵、病毒整合相似矩阵和药物整合相似矩阵,使用基于超图学习的矩阵三分解构造损失函数;损失函数求解模块,用于求解损失函数,得到病毒-药物预测得分矩阵;预测模块,用于基于病毒-药物预测得分矩阵,筛选出目标病毒所在行的得分,排序后得到最终预测结果。
43.在本说明书公开的实施例中,基于超图矩阵三分解的抗病毒药物筛选系统还包括:处理器,分别与邻接矩阵构建模块、高斯距离相似矩阵计算模块、病毒基因序列相似矩阵与药物化学结构相似矩阵计算模块、整合相似矩阵计算模块、损失函数构造模块、损失函数求解模块和预测模块连接;存储器,与处理器连接,并存储有可在处理器上运行的计算机程序;其中,当处理器执行计算机程序时,处理器控制邻接矩阵构建模块、高斯距离相似
矩阵计算模块、病毒基因序列相似矩阵与药物化学结构相似矩阵计算模块、整合相似矩阵计算模块、损失函数构造模块、损失函数求解模块和预测模块工作,以实现上述中任意一项的基于超图矩阵三分解的抗病毒药物筛选方法。
44.以上所述实施例是用以说明本发明,并非用以限制本发明,所以举例数值的变更或等效元件的置换仍应隶属本发明的范畴。
45.由以上详细说明,可使本领域普通技术人员明了本发明的确可达成前述目的,实已符合专利法的规定。
46.尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,应当指出的是,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
47.应当注意的是,上述有关流程的描述仅仅是为了示例和说明,而不限定本说明书的适用范围。对于本领域技术人员来说,在本说明书的指导下可以对流程进行各种修正和改变。然而,这些修正和改变仍在本说明书的范围之内。
48.上文已对基本概念做了描述,显然,对于阅读此申请后的本领域的普通技术人员来说,上述发明披露仅作为示例,并不构成对本技术的限制。虽然此处并未明确说明,但本领域的普通技术人员可能会对本技术进行各种修改、改进和修正。该类修改、改进和修正在本技术中被建议,所以该类修改、改进、修正仍属于本技术示范实施例的精神和范围。
49.同时,本技术使用了特定词语来描述本技术的实施例。例如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本技术至少一个实施例有关的某一特征、结构或特性。因此,应当强调并注意的是,本说明书中在不同位置两次或以上提及的“一实施例”或“一个实施例”或“一替代性实施例”并不一定是指同一实施例。此外,本技术的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
50.此外,本领域的普通技术人员可以理解,本技术的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的过程、机器、产品或物质的组合,或对其任何新的和有用的改进。因此,本技术的各个方面可以完全由硬件实施、可以完全由软件(包括固件、常驻软件、微代码等)实施、也可以由硬件和软件组合实施。以上硬件或软件均可被称为“单元”、“模块”或“系统”。此外,本技术的各方面可以采取体现在一个或多个计算机可读介质中的计算机程序产品的形式,其中计算机可读程序代码包含在其中。
51.本技术各部分操作所需的计算机程序代码可以用任意一种或以上程序设计语言编写,包括如java、scala、smalltalk、eiffel、jade、emerald、c++、c#、vb.net、python等的面向对象程序设计语言、如c程序设计语言、visualbasic、fortran2103、perl、cobol2102、php、abap的常规程序化程序设计语言、如python、ruby和groovy的动态程序设计语言或其它程序设计语言等。该程序代码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或服务器上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(lan)或广域网(wan),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(saas)。
52.此外,除非权利要求中明确说明,本技术所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本技术流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本技术实施例实质和范围的修正和等价组合。例如,尽管上述各种组件的实现可以体现在硬件设备中,但是它也可以实现为纯软件解决方案,例如,在现有服务器或移动设备上的安装。
53.同理,应当注意的是,为了简化本技术披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本技术的实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。然而,本技术的该方法不应被解释为反映所申明的客体需要比每个权利要求中明确记载的更多特征的意图。相反,发明的主体应具备比上述单一实施例更少的特征。

技术特征:
1.基于超图矩阵三分解的抗病毒药物筛选方法,其特征在于,包括如下步骤:s1.构建病毒-药物关联的邻接矩阵;s2.基于所述病毒-药物关联的邻接矩阵,计算病毒高斯距离相似矩阵和药物高斯距离相似矩阵;s3.基于病毒基因组序列计算病毒基因序列相似矩阵,基于药物化学结构计算药物化学结构相似矩阵;s4.基于所述病毒高斯距离相似矩阵和病毒基因序列相似矩阵,使用快速核学习方法,整合得到病毒整合相似矩阵;基于所述药物高斯距离相似矩阵和药物化学结构相似矩阵,使用快速核学习方法,整合得到药物整合相似矩阵;s5.使用频谱偏移法处理所述病毒整合相似矩阵和药物整合相似矩阵,分别得到病毒核矩阵和药物核矩阵;s6.使用基于超图学习的矩阵三分解构造损失函数,求解得到病毒-药物预测得分矩阵;s7.基于所述病毒-药物预测得分矩阵,筛选出目标病毒所在行的得分,排序后得到最终预测结果;所述s1的具体实现方法为:输入已知的病毒-药物关联对,构建病毒-药物关联的邻接矩阵a;若为已知关联对,则对应位置为1,否则为0;所述邻接矩阵a的行数为病毒数量nv,列数为药物数量nd;所述s2的具体实现方法为:若药物d(i)与某个病毒之间存在关联,则对应位置记为1,否则记为0,形成一个1
×
nv大小的0或1构成的向量,记之为药物d(i)的向量谱ip(d(i)),nv为病毒数量;然后计算药物d(i)和d(j)之间的高斯距离相似性:;上式中,ip(d(j))为药物d(j)的向量谱;参数γ
d
用于控制核带宽,通过归一化新带宽参数γ’d
获得:;其中,nd为药物数量;以类似的方式定义病毒v(i)和v(j)之间的高斯距离相似性,得到1
×
nd大小的0或1构成的向量,记之为病毒v(i)的向量谱ip(v(i)),计算病毒v(i)和v(j)之间的高斯距离相似性:;其中,ip(v(j))为病毒v(j)的向量谱;参数γ
v
用于控制核带宽,通过归一化新带宽参数γ’v
获得:;
以上γ’d
和γ’v
都是常数;所述s3的具体实现方法为:基于病毒基因组序列,使用多序列比方法计算病毒基因序列相似矩阵;基于药物的化学结构,得到药物maccs指纹,采用谷本系数计算药物化学结构相似矩阵;所述s4的具体实现方法为:所述快速核学习方法的半正定规划式为:;式中,第一项为重构损失范数项,表示相似矩阵的整合误差大小;第二项为正则化项,作用是避免过拟合;其中a为病毒-药物关联邻接矩阵,s
jv
(j=1,2)分别表示病毒高斯距离相似矩阵和病毒基因序列相似矩阵,μ
v
为正则化参数,λ
v
∈r1×2为待求解的系数,通过λ
v
得到病毒整合相似矩阵s
v
:;同理,按照上述可获得药物化学结构相似矩阵与药物高斯距离相似矩阵集成参数λ
d
∈r1×2,然后计算药物整合相似矩阵s
d
:;其中s
jd
(j=1,2)分别表示药物高斯距离相似矩阵和药物化学结构相似矩阵;所述s5的具体实现方法为:使用频谱偏移法处理病毒整合相似矩阵s
v
得到病毒核矩阵k
*v
,使用频谱偏移法处理药物整合相似矩阵s
d
得到药物核矩阵k
*d
,具体计算方法为按分解病毒或药物的整合相似度矩阵s,其中u是正交矩阵,λ是实特征值构成的对角矩阵,λ
min
(s)表示输入矩阵s的最小特征值,i表示单位矩阵,t表示矩阵的转置;在s6中:使用基于超图学习的矩阵三分解构造目标函数如下:;其中为已知的病毒-药物关联矩阵,f为待求的预测得分矩阵;表示将关于变量的右侧式子值记为的右侧式子值记为j,min表示求最小值,表示投影矩阵,其中r
nv
和r
nd
分别表示病毒潜在特征空间的维度和药物潜在特征空间的维度,‖
·

f
指矩阵的f范数,tr(
·
)表示矩阵
的迹,λ1和λ2是正则化系数;基于病毒核矩阵k
*v
,通过奇异值分解svd方法求解得到低秩近似矩阵w,具体为;表示病毒的超图归一化拉普拉斯矩阵,计算方式为,其中i是单位矩阵,d
vv
和d
ve
分别是病毒对应的顶点度和超边度的对角矩阵,矩阵h
v
为病毒超图关联的对角矩阵,a
v
为病毒超边权重的对角矩阵;基于药物核矩阵k
*d
,通过奇异值分解svd方法求解得到低秩近似矩阵h,具体为;表示药物的超图归一化拉普拉斯矩阵,计算方式为,其中i是单位矩阵,d
dv
和d
de
分别是药物的顶点度和超边度的对角矩阵,矩阵h
d
为药物超图关联对的角矩阵,a
d
为药物超边权重的对角矩阵;求导后令得到,求解,,其中是单位矩阵,矩阵p、q和c为无特殊含义的中间过程变量,使用西尔维斯特方程通用解法得到矩阵θ;计算病毒-药物预测得分矩阵。2.基于超图矩阵三分解的抗病毒药物筛选系统,其特征在于,包括:邻接矩阵构建模块,用于构建病毒-药物关联的邻接矩阵;高斯距离相似矩阵计算模块,用于基于所述病毒-药物关联的邻接矩阵,计算病毒高斯距离相似矩阵和药物高斯距离相似矩阵;病毒基因序列相似矩阵与药物化学结构相似矩阵计算模块,用于基于病毒基因组序列计算病毒基因序列相似矩阵,基于药物化学结构计算药物化学结构相似矩阵;整合相似矩阵计算模块,用于基于所述病毒高斯距离相似矩阵和病毒基因序列相似矩阵,使用快速核学习方法,整合得到病毒整合相似矩阵;基于所述药物高斯距离相似矩阵和药物化学结构相似矩阵,使用快速核学习方法,整合得到药物整合相似矩阵;损失函数构造模块,用于基于所述病毒-药物关联的邻接矩阵、病毒整合相似矩阵和药物整合相似矩阵,基于超图学习的矩阵三分解,构造损失函数;损失函数求解模块,用于求解所述损失函数,得到病毒-药物预测得分矩阵;预测模块,用于基于所述病毒-药物预测得分矩阵,筛选出目标病毒所在行的得分,排序后得到最终预测结果;处理器,分别与所述邻接矩阵构建模块、高斯距离相似矩阵计算模块、病毒基因序列相似矩阵与药物化学结构相似矩阵计算模块、整合相似矩阵计算模块、损失函数构造模块、损失函数求解模块和预测模块连接;存储器,与所述处理器连接,并存储有可在所述处理器上运行的计算机程序;其中,当所述处理器执行所述计算机程序时,所述处理器控制所述邻接矩阵构建模块、高斯距离相似矩阵计算模块、病毒基因序列相似矩阵与药物化学结构相似矩阵计算模块、
整合相似矩阵计算模块、损失函数构造模块、损失函数求解模块和预测模块工作,以实现如权利要求1所述的基于超图矩阵三分解的抗病毒药物筛选方法。

技术总结
本发明提供了基于超图矩阵三分解的抗病毒药物筛选方法及系统,属于生物信息学、计算生物学与人工智能交叉技术领域,方法通过系统实现,方法包括:S1.构建病毒-药物关联的邻接矩阵;S2.计算病毒高斯距离相似矩阵和药物高斯距离相似矩阵;S3.计算病毒基因序列相似矩阵和药物化学结构相似矩阵;S4.使用快速核学习方法,整合得到病毒整合相似矩阵和药物整合相似矩阵;S5.使用频谱偏移法,得到病毒核矩阵和药物核矩阵;S6.使用基于超图学习的矩阵三分解构造损失函数,求解得到病毒-药物预测得分矩阵;S7.基于病毒-药物预测得分矩阵,筛选、排序后得到最终预测结果。本发明能高效、迅速地筛选出病毒有效治疗药物。地筛选出病毒有效治疗药物。地筛选出病毒有效治疗药物。


技术研发人员:汤永 王珊 刘建超 李顺飞 刘丽华
受保护的技术使用者:中国人民解放军总医院
技术研发日:2023.08.21
技术公布日:2023/9/16
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐