一种面向真实世界的多SNP位点介导的抗精神病药物疗效预测与精准决策系统

未命名 08-05 阅读:141 评论:0

一种面向真实世界的多snp位点介导的抗精神病药物疗效预测与精准决策系统
技术领域
1.本发明属于生物医学和数据处理技术领域,具体涉及一种面向真实世界的多snp位点介导的抗精神病药物疗效预测与精准决策系统。


背景技术:

2.公开该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解,而不必然被视为承认或以任何形式暗示该信息构成已经成为本领域一般技术人员所公知的现有技术。
3.精神分裂症是一种常见的慢性重型精神障碍,我国人群终生患病率为5.44

,其主要临床特征是认知、语言、思维、情感反应、行为等多方面精神活动异常。多数患者出现认知功能与社会功能损害,给家庭与社会带来极大的负担。抗精神病药物是精神分裂症的主要治疗方法,也用于治疗其他精神障碍的精神病症状。全世界超过1%的人口服用抗精神病药物。然而,抗精神病药物的反应存在极大的个体差异,约有30-50%患者的抗精神病药物治疗效果不理想,并产生副反应。因而,识别影响抗精神病药物反应的相关因素,并针对不同的精神分裂症患者选择个性化治疗方案尤为重要。
4.药物从进入人体内到发挥作用直至被清除,是一个较为复杂的过程,包括药物的吸收、转运、代谢、结合、与靶分子相互作用以及清除等环节。患者对同一种药物反应方式的差异是影响药物代谢和药物作用的多种因素共同作用的结果。在这个过程中,任何一个环节出现问题都可能引起药物反应的异常。造成患者对抗精神病药物反应个体差异的原因是多方面的,许多非遗传因素可能是导致药物反应个体差异的原因,如患者的年龄、性别、疾病的发生机制和严重程度等,另一方面,抗精神病药物个体反应差异有着复杂的遗传背景,遗传因素在药物反应的个体差异中也起着重要的作用。在药物代谢动力学方面,已有大量研究表明,cyp2d6、cyp1a2等代谢酶基因及转运体基因abcb1上的基因多态性位点与抗精神病药物血药浓度有关;而在药效动力学方面,药物基因组学研究已发现多个神经递质受体基因上的snp位点与抗精神病药物反应有关,且部分基因位点已在独立研究中进行了验证。目前,已有第三方检验机构开始提供细胞色素p450代谢酶基因及部分抗精神病药物反应相关位点检验,为精神科医生选择治疗药物及确定给药剂量提供了有力的参考工具。然而,第三方机构选择的药物基因组检测位点通常来自基于外国人群的研究,这些基因座是否适用于中国精神分裂症人群,以及它们与抗精神病药物疗效之间的相关性在真实世界中是否真实可靠,仍缺乏研究证据。同时,现阶段药物基因组检测服务价格仍相对昂贵,药物基因组检测服务在真实世界场景下能否改善精神分裂症患者住院治疗效果,精神分裂症患者能否从中获益也需要进一步研究。此外,在抗精神病药物基因组检测服务中,其遗传信息解读多基于单个snp位点进行用药指导,也无法综合考量多个snp位点与抗精神病药物相互作用对抗精神病药物反应的影响,大大降低了药物基因组检测服务的临床效用。


技术实现要素:

5.针对上述现有技术的不足,本发明提供一种面向真实世界的多snp位点介导的抗精神病药物疗效预测与精准决策系统。本发明构建了回顾性精神分裂症患者临床治疗队列。基于该队列,探究了药物基因组检测其他snp位点与抗精神病药物疗效的关系,并结合精神分裂症患者一般情况、疾病特征、抗精神病药物用药情况及抗精神病药物疗效相关位点构建了可应用真实世界场景下的抗精神病药物疗效预测模型,从而为抗精神病药物个性化用药提供更多支持。基于上述研究成果,从而完成本发明。
6.本发明是通过如下技术方案实现的:
7.本发明的第一个方面,提供一种面向真实世界的多snp位点介导的抗精神病药物疗效预测与精准决策系统,所述系统至少包括:
8.获取模块,其被配置为:获取受试者相关数据信息;
9.数据处理模块,其被配置为:根据获取模块所获得的数据信息基于内置的预测模型,预测所述受试者的抗精神病药物疗效;所述预测模型是通过将预先采集的患者的相关数据信息采用统计算法进行模型训练后获得。
10.输出模块,其被配置为:根据所述数据处理模块信息,输出抗精神病药物疗效预测和/或治疗精准决策信息。
11.其中,所述受试者相关数据包括但不限于受试者一般情况、疾病特征、抗精神病药物用药情况及抗精神病药物疗效相关位点。
12.具体的,所述受试者相关数据包括但不限于年龄、性别、受教育程度、婚姻状况、吸烟情况、饮酒情况等一般人口学特征和生活习惯;患病年限、住院治疗次数、精神疾病家族史、起病特点、首发年龄等精神分裂症疾病特征;奥氮平、利培酮、氨磺必利、阿立哌唑、氯氮平、喹硫平、齐拉西酮、氟哌啶醇片、舒必利、氟哌啶醇注射液及洛沙平等抗精神病药物用药天数;丙戊酸钠、丙戊酸镁、碳酸锂、拉莫三嗪、奥卡西平等心境稳定剂用药天数;西酞普兰、米氮平、文拉法辛、氟西汀、帕罗西汀、阿戈美拉汀、氟伏沙明等抗抑郁药物用药天数;佐匹克隆、坦度螺酮、度洛西汀、奥沙西泮、劳拉西泮等抗焦虑药物用药天数;基线panss总分、阴性症状评分、阳性症状评分、一般精神病理评分等;量表测评时的入院天数;rs7122133、rs2344131、rs114634519、rs1800497、rs1079597、rs8059865、rs114193356、rs2372198、rs12475478、rs74810367、rs1806201、rs489693、rs6313等与利培酮、奥氮平、氨磺必利、阿立哌唑及氯氮平疗效有关的snp位点;
13.更具体的,所述受试者相关数据包括但不限于基线panss总分、基线精神病理评分、入院天数、基线panss阴性分、基线panss阳性分、患病年限、性别、奥氮平、住院次数、利培酮、首发年龄、碳酸锂、氨磺必利、丙戊酸钠、丙戊酸镁、rs74810367、年龄、奋乃静、rs12475478、氯氮平、rs1806201、rs6313、rs1079597、婚姻状况、rs114193356、喹硫平、rs114634519、佐匹克隆、rs2372198、rs8059865、rs1800497、rs2344131、rs489693、吸烟、受教育程度、rs7122133、丁螺环酮、洛沙平、阿立哌唑、饮酒。
14.需要说明的是,所述预测模型中,预先采集的患者的相关数据信息与受试者相关数据相同。
15.在预测模型中,所述统计算法是本领域技术人员公知的。例如,学习统计分类系统包括能够适用于复杂数据集(例如,感兴趣标记物嵌板)并且基于此类数据集做出决策的机
器学习算法技术。
16.在一些实施方式中,使用单一学习统计分类系统例如分类树(例如,随机森林)。在其它实施方式中,也可以使用2、3、4、5、6、7、8、9、10种或更多学习统计分类系统的组合,优选以串联方式。
17.学习统计分类系统的实例统计学算法是学习统计学分类器系统。学习统计学分类器系统可以选自随机森林(rf)、分类和回归树(c&rt)、boosted树(xgboost、梯度提升树)、神经网络(nn)、支持向量机(svm)、一般卡方自动交互式检测器模型(general chi-squared automatic interaction detector model)、交互树(interactive tree)、多元自适应回归样条(mutiadaptive regression spline)、机器学习分类器、及其组合。在一些情况下,学习统计学分类器系统是基于树的统计学算法(例如rf,c&rt等)和/或nn(例如人工nn等)。其他学习统计分类系统包括支持向量机(例如,核方法)、多元自适应回归样条(mars)、列文博格-马夸特算法、高斯-牛顿算法、高斯混合模型、线性混合效应模型、梯度下降算法和学习向量量化(lvq)。
18.更具体的,所述预测模型其是拟合了基于线性混合效应模型、梯度提升树、支持向量机、随机森林、贝叶斯累加回归树及xgboost算法的预测模型,同时以nnls为损失函数,利用十折交叉验证确定使上述模型组合交叉验证风险最小的一组权重向量,上述模型的权重分别为0.000、0.000、0.000、0.277、0.000和0.723,从而构建了基于super learner的针对精神分裂症总体症状改善的抗精神病药物疗效预测模型。
19.所述抗精神病药物包括但不限于奥氮平、利培酮、氨磺必利、阿立哌唑、氯氮平和喹硫平。
20.所述治疗精准决策信息包括但不限于精准推荐抗精神病药物推荐用药。
21.本发明第二个方面,提供一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如本发明第二方面所述系统的功能。
22.本发明第三个方面,提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本发明第四方面所述系统的功能。
23.以上一个或多个技术方案的有益技术效果:
24.上述技术方案基于panss量表重复测量数据,研究药物基因组检测其他snp位点与抗精神病药物疗效的关系,并结合精神分裂症患者一般情况、疾病特征、抗精神病药物用药情况及抗精神病药物疗效相关位点构建了可应用真实世界场景下的抗精神病药物疗效预测模型,为抗精神病药物个性化用药提供更多支持,因此具有良好的实际应用之价值。
附图说明
25.构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
26.图1为本发明实施例中用药情况编码及疗效定义示意图;其中a为假设药物治疗效果随着患者用药天数的变化而不断变化的情况;b为考虑药物疗效的延迟效应的情况。
27.图2为本发明实施例中super learner构建流程图。
28.图3为本发明实施例中基于quant软件的数量性状遗传关联分析样本量计算。
29.图4为本发明实施例中不同数量候选变量时rmse比较图。
30.图5为本发明实施例中基于随机森林的预测变量重要性评分。
31.图6为本发明实施例中基于随机森林(a:训练集十折交叉;b:验证集)、xgboost(c:训练集十折交叉;d:验证集)及super learner模型(e:训练集十折交叉;f:验证集)panss总分预测值与实际观测值散点图。
具体实施方式
32.应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
33.需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。应理解,本发明的保护范围不局限于下述特定的具体实施方案;还应当理解,本发明实施例中使用的术语是为了描述特定的具体实施方案,而不是为了限制本发明的保护范围。下列具体实施方式中如果未注明具体条件的实验方法,通常按照本领域技术内的分子生物学的常规方法和条件,这种技术和条件在文献中有完整解释。
34.以下通过实施例对本发明做进一步解释说明,但不构成对本发明的限制。应理解这些实施例仅用于说明本发明而不用于限制本发明的范围。另外,实施例中未详细说明的分子生物学方法均为本领域常规的方法,具体操作可参看分子生物指南或产品说明书。
35.实施例
36.一、资料与方法
37.1.1研究对象
38.研究对象为2019年3月至2021年9月在山东省精神卫生中心就诊的精神分裂症患者。本研究的纳入标准如下:(1)根据《中国精神障碍分类与诊断标准(第3版)》(chinese classification and the diagnose criterion of mental disorder,ccmd3)诊断为精神分裂症;(2)有至少两次阳性与阴性症状量表(positive and negative syndrome scale,panss)评分;(3)进行了药物基因组检测;(4)住院时间≥7天;(5)有完整的临床治疗记录。排除标准:(1)基线panss总分低于30分;(2)首次量表评估在入院7天内进行;(3)住院期间减分率小于-30%;(4)患有严重的不稳定躯体疾病;
39.1.2资料收集
40.1.2.1基本信息
41.本研究从山东省精神卫生中心电子病例系统(emr)中获取精神分裂症患者的基本信息。基本信息包括一般人口学特征:年龄、性别、体重、受教育程度、婚姻状况;共患病:糖尿病、高血压、冠心病和脑卒中等疾病;生活习惯:吸烟、饮酒;精神疾病特征:疾病诊断、首次发病日期、病程特点(急性、亚急性、缓慢起病)、精神疾病家族史、住院次数、住院天数等。
42.1.2.2临床治疗数据
43.本研究从山东省精神卫生中心电子病历系统中住院医嘱部分获取精神障碍患者
住院期间的治疗情况,包括药物治疗信息,如药物名称、给药时间、给药频次、给药剂量等;其他治疗方式,如心理疗法、改良电抽搐疗法、经颅磁刺激等。
44.1.2.3住院治疗费用数据
45.本研究从山东省精神卫生中心电子病历系统中获取精神障碍患者住院期间的费用情况,主要包括:(1)综合医疗服务类费用:一般医疗服务费用、一般治疗操作费、护理费、床位费及其他;(2)诊断类费用:影像学诊断费、实验室检测费、住院诊查费、量表测评费及其他;(3)治疗类费用:心理咨询费、物理治疗费、辅助治疗(工娱、家庭、心理、情绪宣泄等)费及其他;(4)药品费用:中药费、西药费;(5)耗材费用:检查或治疗用一次性医用材料费。
46.1.2.4疗效评估数据
47.为了获取研究对象住院治疗量表评估数据,本研究在病案室中查找研究对象住院病历,采用人工录入的方式获得了精神分裂症患者住院治疗过程中的panss量表评估数据,包括各量表总分及测评日期,并将其作为精神分裂症患者住院治疗疗效评估的依据。在量表数据录入过程中,通过每日随机核查量表录入数据进行质量控制。panss量表主要用于评定精神症状的有无及各项症状的严重程度,由专业的精神科医生对患者进行精神检查,并综合临床检查与知情人提供的相关信息进行评定。panss由7项阳性症状量表、7项阴性症状量表和16项一般精神病理量表组成,每个条目采用1-7分的7级评分标准,各级分别对应无、很轻、轻度、中度、偏重、重度和极重度,上述3个分量表的总分范围分别为7-49分、7-49分和16-112分,3个分量表评分之和为panss总分。
48.1.2.5dna血样采集及基因位点分型
49.采集患者左手无名指血液,使用天根生化的dna提取试剂盒(磁珠法)提取基因组后,采用飞行时间质谱法(maldi-tof)进行snp位点基因分型。
50.1.3数据整理与分析
51.1.3.1数据整理
52.1.原始数据整合。由于原始数据来自于多个信息系统,为便于统计分析,我们将研究对象基本信息、临床治疗数据、量表评估数据、实验室检查数据及基因分型数据以住院号为唯一标识码进行合并。此外,由于部分患者长时间住院,其住院期间可能办理多次出入院手续,在病案首页中记录为多次住院记录。因而,若病案首页中同一名患者相邻若干次住院记录的间隔天数均不足5天,我们将这若干次相邻住院记录合并为一次完整的住院过程。
53.2.数据编码。参照相关文献并咨询临床医生,将原始数据进行编码以转变为便于统计分析的可用数据。值得注意的是,绝大多数精神疾病患者在是住院期间进行药物基因组检测,若药物基因组检测是在某次住院期间前50%时间段进行,在进行变量编码时将该次住院治疗整体视为药物基因组检测后的治疗过程。表1为本研究变量编码规则。
54.表1变量编码表
55.56.[0057][0058]
1.3.2统计描述
[0059]
本研究从两方面进行了统计描述:(1)从整体上描述研究对象的一般人口学特征、生活习惯、共患病、精神分裂症疾病特征、住院记录及量表评估情况;(2)描述研究对象住院期间抗精神病药物、心境稳定剂、抗焦虑及抗抑郁药物的用药情况,包括用药方案、用药天数、用药剂量分布情况及住院期间用药方案更换情况;(3)描述量表基线评分及量表评分减分率在不同特征亚组的中分布情况。分类变量用频数(百分比)表示,采用卡方检验进行组间差异比较;服从正态分布的变量用均值
±
标准差表示,采用t检验或方差分析进行组间差异比较;不服从正态分布的变量采用中位数(四分位数间距)表示,采用wilcoxon秩和检验进行组间差异比较。
[0060]
1.3.3基于lmm的遗传标记与药物疗效的关联性分析
[0061]
与基于随机对照设计的临床试验相比,真实世界中精神疾病患者住院过程中的治疗流程更为复杂,联合用药处方复杂且多数患者在治疗过程中往往多次调整用药。传统研究多采用量表减分率评估药物疗效,但该种方式仅利用了治疗前后两次的量表评分,无法充分利用住院期间量表评估信息。参照edwin j.c.g.等人提出的方法,本研究以量表评分为因变量,采用线性混合效应模型(lmm)进行遗传标记与药物疗效的关联性分析,主要包括3步:(1)药物暴露编码,确定其以何种形式纳入模型能够达到最佳的模型拟合效果;(2)协变量筛选以提高治疗效果估计的精度;(3)将药物暴露与基因突变位点的交互项纳入混合效应模型进行统计学检验。
[0062]
1.3.3.1药物暴露编码及疗效定义
[0063]
在重复测量数据中,我们将药物使用情况编码为连续累积用药天数,即在某次量表测量时特定药物已用药天数。我们考虑了以下两种情况:(1)第一种情况是假设药物治疗效果随着患者用药天数的变化而不断变化。如图1a所示,药物反应测量指标与用药天数呈线性关系,b
ik
表示的是个体i接受药物k治疗时每天panss评分的变化。如果b
ik
<0,则panss
评分降低,表明症状改善;若b
ik
>0,则panss评分升高,表明症状恶化。(2)第二种情况是考虑到药物疗效的延迟效应(lagged effect),即从开始接受药物治疗到出现药物反应中间往往需要间隔一段时间c,在间隔的这段时间里drug
ijk
<c,则drug
ijk
赋值为0。如图1b所示。在本研究中,我们参照临床医生意见,选用第二种药物暴露编码方式,考虑药物疗效延迟效应将延迟时间c设置为7天,而抗精神病药物连续累积用药超过60天,则认为其进入维持治疗阶段。
[0064]
1.3.3.2协变量调整
[0065]
本研究在线性回归模型中加入协变量以提高药物治疗个体反应估计的精度和模型统计效能。候选协变量包括年龄、性别、基线测量值、入院天数、患病年限、住院次数、共患病(糖尿病、高血压、心血管疾病)、生活习惯(吸烟、饮酒)及合并用药等。在线性混合效应模型拟合过程中,我们采用逐步筛选的方法确定哪些协变量纳入线性混合效应模型。
[0066]
1.3.3.3基于lmm筛选药物疗效相关snp
[0067]
线性混合效应模型是一般线性模型的扩展,其允许观察数据之间具有相关性和多样性的协方差矩阵,已经应用于多个领域的重复测量资料分析。该模型包含了固定效应和随机效应,随机效应有两种方式影响模型,一种是对截距项的影响,另一种是对截距项和固定效应斜率的影响。该部分研究中采用后一种设定。混合效应模型的一般形式为:
[0068]yn*1
=x
n*m
β+z
n*p
u+e
n*1
[0069][0070]
其中y表示观察值向量,x
n*m
为固定效应设计矩阵,β为固定效应参数向量;z
n*p
为随机效应设计矩阵,u为随机效应参数向量;e
n*1
为随机误差向量。固定效应部分x
n*m
β相当于最小二乘回归的线性预测量;而对于随机效应部分z
n*p
u+e
n*1
,假设u具有方差-协方差矩阵g且u与e正交:
[0071][0072]
考虑到z
n*p
u+e
n*1
的组合误差,y属于多元正态分布,其均值为xβ,方差-协方差矩阵为:
[0073]
为了评估基因突变位点与药物反应的关系,本研究将基因突变位点与药物反应的交互项纳入线性混合效应模型,从而估计特定基因突变位点对抗精神病药物(奥氮平、利培酮、喹硫平、氯氮平、氨磺必利、阿立哌唑等)及抗抑郁药物(西酞普兰、米氮平等)疗效的影响,则方程形式可写为:
[0074][0075]
其中,β0表示固定效应截距项;βk是药物k的固定效应,是对接受药物k治疗效应的估计;u
0i
为随机效应的截距项;y
ij
表示个体i第j次的panss量表评分;截距β0+u
0i
表征了症状严重程度;drug
ijk
表示个体i在第j次观测时药物k的使用情况;snpm为特定的基因突变位点,是特定基因位点对药物治疗效应影响的估计。
[0076]
1.3.4抗精神病药物疗效预测模型构建
[0077]
目前,已有针对抗精神病药物疗效的预测模型,但上述模型多基于单药治疗队列构建,然而在真实世界中单药治疗的精神分裂症患者占比极小,上述模型应用极为有限。在
learner预测模型。
[0084]
1.3.4.3模型评价与验证
[0085]
本研究中,我们随机抽取200人次的精神分裂症患者住院记录作为验证集,剩余部分作为训练集,同时我们在训练集内部进行十折交叉验证。首先我们采用均方误差(mse)、均方根(rmse)和校正决定系数(adj.r2)评估模型的预测效果。然而,在临床场景中,临床医生往往更关注患者的量表评分减分率及基于量表评分减分率定义的疗效。因此,从临床应用的角度,我们将预测模型预测的量表评分转化为减分率,并参照其他文献,我们设定减分率20%作为抗精神病药物有效的最低阈值,将预测结局与观察结局均转化为二分类结局-有效与无效,从而采用灵敏度、特异度及符合率等指标评价模型在不同减分率阈值情况下的真实性和可靠性。
[0086]
为进一步评价模型在临床抗精神病药物疗效预测中的应用效果,本研究将全程单用奥氮平、氨磺必利、利培酮、喹硫平及氯氮平治疗的精神分裂症住院记录抽取出来作为验证集,使用其他用药方案的精神分裂症患者作为训练集,构建针对精神分裂症总体症状改善的抗精神病药物疗效预测模型。super learner模型构建完成后,可通过以下方式估计每个患者全程使用奥氮平、氨磺必利、利培酮、喹硫平及氯氮平治疗时的预测疗效:(1)以利培酮为例,首选抽取全程使用利培酮的精神分裂症患者,将其复制四组,将四组精神分裂症患者患者利培酮暴露均设为0;(2)将上述四组分别设定为全程使用奥氮平、氨磺必利、喹硫平及氯氮平用药方案;(3)重复上述过程,从而获得分别全程使用奥氮平、氨磺必利、利培酮、喹硫平、氯氮平用药方案的虚拟验证集;(4)利用super learner模型预测虚拟验证集中精神分裂症患者出院时的panss总分,计算减分率后按照减分率》20%阈值定义有效,从而获得虚拟验证集中精神分裂症患者出院时的预测疗效。根据同一个患者全程使用上述五种药物的预测疗效,预测有效的药物即为super learner模型建议用药。根据super learner模型建议用药与实际用药是否一致将验证集精神分裂症患者分为两组,一组为实际用药与建议用药一致,另一组为实际用药与建议用药不一致,进而比较两组患者住院治疗的有效率。。
[0087]
1.3.5统计软件
[0088]
本研究使用r4.0.2(https://www.r-project.org/)软件进行数据整理与统计分析。其中,利用lmertest包构建线性混合效应模型,利用geepack包构建gee模型,利用mice包进行多重插补。
[0089]
二、试验结果
[0090]
2.1统计效能估计及药物基因组检测snp位点
[0091]
本研究采用南加州大学开发的样本量和统计效能计算软件quanto对基因突变位点与抗精神病药物疗效关联性研究的统计学检验效能进行了粗略估计。由于本研究的表型(量表评分)是属于数量性状,我们进行了数量性状遗传关联分析样本量计算,要求80%的统计效能够检测到等位基因频率在5%以上且对表型差异贡献大于1.2%的位点。参数设置过程如下:首先在outcome/design下面选择continuous,然后选择independent individuals;在hypothesis中选择gene only模式;在gene g中,将allele-frequency设为0.05,并选择additive模式;在outcome model中设置r-squared为0.01-0.02;最后,power选项置为0.8,且满足双尾0.05显著即可。最终计算结果如图3所示,同时,考虑到药物-snp
及snp-snp间交互作用,所需样本量一般是每个因素单独作用时样本量的2-4倍。因而,考虑交互作用的情况下,样本量至少需要达到1562例能够满足80%的统计效能够检测到等位基因频率在5%以上且对表型差异贡献大于1%的位点;样本量至少需要达到778例能够满足80%的统计效能够检测到等位基因频率在5%以上且对表型差异贡献大于2%的位点。在本研究中,使用频次较高的4种药物是奥氮平、利培酮、氨磺必利、喹硫平和氯氮平,在上述药物治疗期间分别共评估了panss量表4171、2259、1838和1445,1448次,基本能够满足数量性状遗传关联分析的样本量要求。
[0092]
药物基因组检测共纳入了62个候选snp位点,按照哈迪温伯格平衡检验p》0.05及最小等位基因频率(maf)》0.05的条件进行筛选。其中rs1414334、rs518147、rs113332494、rs2032582、rs10484555及rs6435681等6个位点不符合哈迪温伯格平衡;rs1414334、rs10484555、rs962369、rs144012689、rs2235040、rs2032583、rs4792888等7个位点maf《0.05,因而,我们剔除了上述11个snp位点,保留了51个snp位点进行下一步的关联性分析,结果见表2。
[0093]
表2snp位点哈迪温伯格检验和maf
[0094][0095][0096]
2.2基于super learner的抗精神病药物疗效预测
[0097]
已有研究构建了针对抗精神病药物疗效的预测模型,如岳伟华等人基于gwas研究
发现的5个snp位点构建了抗精神病药物疗效预测模型,但该模型基于单药治疗队列构建,然而在真实世界中抗精神病用药复杂多样,单药治疗的精神分裂症患者占比极小,模型应用场景极为有限。而在抗精神病药物基因组检测服务中,其遗传信息解读多基于单个snp位点进行用药指导,也无法综合考量多个snp位点与抗精神病药物相互作用对抗精神病药物反应的影响。为了充分利用药物基因组检测信息,本研究结合精神分裂症患者一般情况、疾病特征、抗精神病药物用药情况及抗精神病药物疗效相关位点构建了可应用真实世界场景下的抗精神病药物疗效预测模型,为抗精神病药物个性化用药提供更多支持。
[0098]
2.2.1模型变量筛选
[0099]
在本研究中,候选的待研究变量主要包括年龄、性别、受教育程度、婚姻状况、吸烟情况、饮酒情况等一般人口学特征和生活习惯;患病年限、住院治疗次数、精神疾病家族史、起病特点、首发年龄等精神分裂症疾病特征;奥氮平、利培酮、氨磺必利、阿立哌唑、氯氮平、喹硫平、齐拉西酮、氟哌啶醇片、舒必利、氟哌啶醇注射液及洛沙平等抗精神病药物用药天数;丙戊酸钠、丙戊酸镁、碳酸锂、拉莫三嗪、奥卡西平等心境稳定剂用药天数;西酞普兰、米氮平、文拉法辛、氟西汀、帕罗西汀、阿戈美拉汀、氟伏沙明等抗抑郁药物用药天数;佐匹克隆、坦度螺酮、度洛西汀、奥沙西泮、劳拉西泮等抗焦虑药物用药天数;基线panss总分、阴性症状评分、阳性症状评分、一般精神病理评分等;量表测评时的入院天数;rs7122133、rs2344131、rs114634519、rs1800497、rs1079597、rs8059865、rs114193356、rs2372198、rs12475478、rs74810367、rs1806201、rs489693、rs6313等与利培酮、奥氮平、氨磺必利、喹硫平及氯氮平疗效有关的snp位点。
[0100]
2.2.1.1基于线性混合效应模型逐步回归的变量筛选
[0101]
我们将上述候选的待研究变量以及snp位点与相关药物的交互项纳入线性混合效应模型,采用逐步筛选法选择预测变量。表3为多因素线性混合效应模型结果,结果显示,饮酒、性别、患病年限、panss基线总分、精神病理基线评分、西酞普兰、米安色林、利培酮、氯氮平、奥氮平、氨磺必利、齐拉西酮、氟哌啶醇片、阿立哌唑、喹硫平、奋乃静、丙戊酸钠、碳酸锂、拉莫三嗪、奥卡西平、坦度螺酮、丁螺环酮、氯氮平与rs114634519、氯氮平与rs12475478、利培酮与rs2344131、利培酮与rs8059865、利培酮与rs489693、氨磺必利与rs8059865、氨磺必利与rs114634519、奥氮平与rs7122133、奥氮平与rs1079597、喹硫平与rs2344131及喹硫平与rs1806201之间的交互作用也与精神分裂症患者住院期间panss总分评分显著相关(p《0.05)。抗精神病药物用药天数与snp位点交互作用结果解释以利培酮与rs489693的交互作用为例,对于rs489693位点基因分型为a/a的患者,在调整了其他协变量后,利培酮用药天数每增加一天,panss总分降低0.505分;而对于rs489693位点基因分型为c/a和c/c的患者,利培酮用药天数每增加一天,panss总分分别降低0.166(β
利培酮

利培酮*rs489693c/a
)分和0.236(β
利培酮

利培酮*rs489693c/c
)分。其他位点的结果解释同上。
[0102]
表3 多元线性混合效应模型逐步回归分析结果
[0103]
[0104][0105]
2.2.1.2基于递归特征消除算法的变量筛选
[0106]
我们采用基于随机森林的递归特征消除算法筛选预测变量用于机器学习建模。基于随机森林利用不同数量候选变量建模时的十折交叉验证rmse见图4。由图4可知,纳入变
量重要性排序前40位的预测变量时,随机森林算法十折交叉验证的rmse最小,则基于随机森林的递归特征消除算法筛选的预测变量包括基线panss总分、基线精神病理评分、入院天数、基线panss阴性分、基线panss阳性分、患病年限、性别、奥氮平、住院次数、利培酮、首发年龄、碳酸锂、氨磺必利、丙戊酸钠、丙戊酸镁、rs74810367、年龄、奋乃静、rs12475478、氯氮平、rs1806201、rs6313、rs1079597、婚姻状况、rs114193356、喹硫平、rs114634519、佐匹克隆、rs2372198、rs8059865、rs1800497、rs2344131、rs489693、吸烟、受教育程度、rs7122133、丁螺环酮、洛沙平、阿立哌唑、饮酒。上述预测变量将被用于基于随机森林、贝叶斯累加回归树等机器学习方法的预测模型构建。
[0107]
2.2.2模型拟合与评价
[0108]
本研究分别拟合了基于线性混合效应模型、梯度提升树、支持向量机、随机森林、贝叶斯累加回归树及xgboost算法的预测模型,同时以nnls为损失函数,利用十折交叉验证确定了使上述模型组合交叉验证风险最小的一组权重向量,上述模型的权重分别为0.000、0.000、0.000、0.277、0.000和0.723,从而构建了基于super learner的针对精神分裂症总体症状改善的抗精神病药物疗效预测模型。super learner中各单独算法权重及参数设置见表4。
[0109]
表4各单独算法在super learner中权重及参数设置
[0110][0111]
注:表4中未列出的各算法参数均设定为r包默认值。
[0112]
本研究中,我们随机抽取200人次的精神分裂症患者住院记录作为验证集,剩余部分作为训练集,同时我们在训练集内部进行十折交叉验证。在训练集十折交叉验证中,super learner、线性混合效应模型、梯度提升树、支持向量机、随机森林、贝叶斯累加回归树及xgboost算法的rmse分别为6.67、11.72、9.05、8.98、7.18、8.36和6.75,校正决定系数分别为0.90、0.69、0.82、0.82、0.88、0.84、0.90、0.90;综合训练集十折交叉验证中rmse和校正决定系数表现,xgboost为最优单独算法。在验证集中,super learner及最优单独算法(xgboost)的rmse和校正决定系数分别为9.33、9.80和0.81、0.79。super learner在训练集和验证集中均表现良好。
[0113]
表5super learner模型评价效果
[0114][0115]
在临床场景中,临床医生往往更关注患者的量表评分减分率及基于量表评分减分率定义的疗效。因此,从临床应用的角度,我们将预测模型预测的量表评分转化为减分率,并参照其他文献,我们设定减分率20%、30%、40%及50%作为抗精神病药物有效的最低阈值,将预测结局与观察结局均转化为二分类结局-有效与无效,从而采用灵敏度、特异度及符合率等指标评价模型在不同减分率阈值情况下的真实性和可靠性。疗效结局转换为二分类后预测模型评价结果见表6,结果显示,设定减分率20%、30%、40%为抗精神病药物有效的最低阈值将预测结局与观察结局均转化为二分类结局时,模型各项评价指标表现较好。
[0116]
表6疗效结局转换为二分类后预测模型评价结果
[0117][0118]
2.2.3基于反事实框架的模型评价
[0119]
验证集中实际用药为奥氮平的精神分裂症患者共149例,其中奥氮平为建议用药的患者66人,有效率为83.33%;建议用药为其他药物的患者83人,有效率为59.04%,两组有效率差异有统计学意义(p《0.05);验证集中实际用药为氨磺必利的精神分裂症患者共60例,其中氨磺必利为建议用药的患者21人,有效率为76.19%;建议用药为其他药物的患者39人,有效率为69.23%,但两组有效率差异无统计学意义(p》0.05);验证集中实际用药为喹硫平的精神分裂症患者共36例,其中喹硫平为建议用药的患者15人,有效率为86.67%;议用药为其他药物的患者21人,有效率为57.14%,两组有效率差异无统计学意义(p》0.05);验证集中实际用药为利培酮的精神分裂症患者共99例,其中利培酮为建议用药的患者35人,有效率为97.14%;建议用药为其他药物的患64人,有效率为62.62%,两组有效率差异有统计学意义(p《0.05);验证集中实际用药为氯氮平的精神分裂症患者共51例,其中氯氮平为建议用药的患者19人,有效率为63.16%;建议用药为其他药物的患者32人,有效率为53.12%,两组有效率差异无统计学意义(p》0.05)。
[0120]
表7验证集患者按建议用药分组后的疗效
[0121][0122][0123]
检验;*fisher确切概率法;校正χ2检验
[0124]
应注意的是,以上实例仅用于说明本发明的技术方案而非对其进行限制。尽管参照所给出的实例对本发明进行了详细说明,但是本领域的普通技术人员可根据需要对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围。

技术特征:
1.一种面向真实世界的多snp位点介导的抗精神病药物疗效预测与精准决策系统,其特征在于,所述系统至少包括:获取模块,其被配置为:获取受试者相关数据信息并进行数据处理;数据处理模块,其被配置为:根据获取模块所获得的数据信息基于内置的预测模型,预测所述受试者的抗精神病药物疗效;所述预测模型是通过将预先采集的患者的相关数据信息采用统计算法进行模型训练后获得;输出模块,其被配置为:根据所述数据处理模块信息,输出抗精神病药物疗效预测和/或治疗精准决策信息。2.如权利要求1所述的系统,其特征在于,所述受试者相关数据包括受试者一般情况、疾病特征、抗精神病药物用药情况及抗精神病药物疗效相关位点。3.如权利要求2所述的系统,其特征在于,所述受试者相关数据包括年龄、性别、受教育程度、婚姻状况、吸烟情况、饮酒情况等一般人口学特征和生活习惯;患病年限、住院治疗次数、精神疾病家族史、起病特点、首发年龄等精神分裂症疾病特征;奥氮平、利培酮、氨磺必利、阿立哌唑、氯氮平、喹硫平、齐拉西酮、氟哌啶醇片、舒必利、氟哌啶醇注射液及洛沙平等抗精神病药物用药天数;丙戊酸钠、丙戊酸镁、碳酸锂、拉莫三嗪、奥卡西平等心境稳定剂用药天数;西酞普兰、米氮平、文拉法辛、氟西汀、帕罗西汀、阿戈美拉汀、氟伏沙明等抗抑郁药物用药天数;佐匹克隆、坦度螺酮、度洛西汀、奥沙西泮、劳拉西泮等抗焦虑药物用药天数;基线panss总分、阴性症状评分、阳性症状评分、一般精神病理评分等;量表测评时的入院天数;rs7122133、rs2344131、rs114634519、rs1800497、rs1079597、rs8059865、rs114193356、rs2372198、rs12475478、rs74810367、rs1806201、rs489693、rs6313与利培酮、奥氮平、氨磺必利、阿立哌唑及氯氮平疗效有关的snp位点。4.如权利要求3所述的系统,其特征在于,所述受试者相关数据包括基线panss总分、基线精神病理评分、入院天数、基线panss阴性分、基线panss阳性分、患病年限、性别、奥氮平、住院次数、利培酮、首发年龄、碳酸锂、氨磺必利、丙戊酸钠、丙戊酸镁、rs74810367、年龄、奋乃静、rs12475478、氯氮平、rs1806201、rs6313、rs1079597、婚姻状况、rs114193356、喹硫平、rs114634519、佐匹克隆、rs2372198、rs8059865、rs1800497、rs2344131、rs489693、吸烟、受教育程度、rs7122133、丁螺环酮、洛沙平、阿立哌唑和饮酒。5.如权利要求1所述系统,其特征在于,在预测模型中,所述统计算法选自随机森林、分类和回归树、boosted树(xgboost、梯度提升树)、神经网络、支持向量机、一般卡方自动交互式检测器模型、交互树、多元自适应回归样条、机器学习分类器、支持向量机、多元自适应回归样条、列文博格-马夸特算法、高斯-牛顿算法、高斯混合模型、线性混合效应模型、梯度下降算法和学习向量量化及其组合。6.如权利要求2所述系统,其特征在于,所述预测模型其是采用super learner集成线性混合效应模型、梯度提升树、支持向量机、随机森林、贝叶斯累加回归树及xgboost算法构建而得,进一步的,所述线性混合效应模型、梯度提升树、支持向量机、随机森林、贝叶斯累加回归树及xgboost算法在预测模型中的权重分别为0.000、0.000、0.000、0.277、0.000和0.723。7.如权利要求1所述系统,其特征在于,所述抗精神病药物至少包括奥氮平、利培酮、氨磺必利、阿立哌唑、氯氮平和喹硫平。
8.如权利要求1所述系统,其特征在于,所述治疗精准决策信息包括但不限于精准推荐抗精神病药物推荐用药。9.一种计算机可读存储介质,其上存储有程序,其特征在于,所述程序被处理器执行时实现如权利要求1-8任一项所述系统的功能。10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-8任一项所述系统的功能。

技术总结
本发明属于生物医学和数据处理技术领域,具体涉及一种面向真实世界的多SNP位点介导的抗精神病药物疗效预测与精准决策系统。本发明基于PANSS量表重复测量数据,研究药物基因组检测其他SNP位点与抗精神病药物疗效的关系,并结合精神分裂症患者一般情况、疾病特征、抗精神病药物用药情况及抗精神病药物疗效相关位点构建了可应用真实世界场景下的抗精神病药物疗效预测模型,为抗精神病药物个性化用药提供更多支持,因此具有良好的实际应用之价值。值。值。


技术研发人员:薛付忠 李吉庆 于天贵
受保护的技术使用者:山东大学
技术研发日:2023.03.02
技术公布日:2023/8/4
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐