一种鉴别判断脊柱感染患者感染类型的方法、系统及介质
未命名
09-22
阅读:81
评论:0

1.本发明涉及健康风险评估领域,尤其涉及一种鉴别判断脊柱感染患者感染类型的方法、系统及介质。
背景技术:
2.脊柱结核是结核病的一种肺外表现形式,目前脊柱结核的诊断均需要通过手术、穿刺这些侵入性的检查来取得病灶标本,进而通过结核分枝杆菌培养、xpert等技术来确定,这些检查往往在病人住院的后期执行。如果病人能在疾病早期得到更准确的诊断意见,那么脊柱外科医生可以建议患者早期通过抗结核药物然进而行治疗,从而改善患者的预后。但是一些贫困偏远地区的医院缺乏相关的技术和人员,导致这些地方的脊柱感染患者难以诊断出是否为脊柱结核。
3.脊柱结核的早期诊断对于减少患者术后并发症的发生至关重要,然而由于脊柱结核患者缺乏典型的早期临床症状;在影像学检查中也难以将检查结果与化脓性脊柱炎、脊柱肿瘤等其他脊柱感染的疾病区分,导致脊柱结核的早期诊断一直存在困难,漏诊或者误诊的情况经常发生。
4.目前采用干扰素γ释放试验(igras)对于脊柱结核的早期诊断表现出较好的诊断效能,但是,单凭igras一个指标仍无法满足临床对脊柱结核诊断准确率的需求。
技术实现要素:
5.本发明要解决的技术问题就在于:针对现有技术存在的技术问题,本发明提供一种鉴别判断脊柱感染患者感染类型的方法、系统及介质,联合使用患者入院的常规实验室血清学检查的多个指标,使得贫困偏远地区的医院也能够对脊柱感染患者是否为脊柱结核进行较为准确的早期诊断。
6.为解决上述技术问题,本发明提出的技术方案为:
7.一种鉴别判断脊柱感染患者感染类型的方法,包括以下步骤:
8.获取每个已知脊柱感染患者的常规实验室检查数据得到与已知脊柱感染患者一一对应的第一变量组,所述已知脊柱感染患者为脊柱结核患者或非脊柱结核患者;
9.对第一变量组中的变量进行筛选得到第二变量组;
10.根据所有已知脊柱感染患者的第二变量组建立第一诊断模型;
11.将第二变量组在第一诊断模型中不具有显著性的变量排除,得到第三变量组;
12.根据所有已知脊柱感染患者的第三变量组建立第二诊断模型;
13.根据第二诊断模型绘制列线图;
14.获取待判断脊柱感染患者的常规实验室检查的数据,将所述数据匹配列线图得到待判断脊柱感染患者为脊柱结核的概率与非脊柱结核的概率。
15.进一步的,对第一变量组中的变量进行筛选得到第二变量组时,包括:将所有已知脊柱感染患者的第一变量组进行汇总,使用min-max转换将汇总的第一变量组中的连续性
变量进行标准化,然后使用r语言的glmnet包并设置参数,对汇总的第一变量组依据lasso回归进行筛选,将筛选出的变量作为第二变量组中的变量。
16.进一步的,根据所有已知脊柱感染患者的第二变量组建立第一诊断模型和根据所有已知脊柱感染患者的第三变量组建立第二诊断模型时,包括:
17.随机抽取预设比例的已知脊柱感染患者,将被抽取的已知脊柱感染患者的目标变量组作为训练集,通过r语言的rms包,用训练集的所有变量训练logistics回归模型,得到训练好的logistics回归模型作为目标诊断模型。
18.进一步的,得到训练好的logistics回归模型作为目标诊断模型之后还包括,将未被抽取的其他已知脊柱感染患者的目标变量组作为验证集,通过r语言的rms包,用验证集评价目标诊断模型的预测性能,若预测性能不满足要求,调整预设比例,重新执行随机抽取预设比例的已知脊柱感染患者的步骤。
19.进一步的,所述第一诊断模型的数学表达式如下:
20.y1=2.0705*tb.antibody+4.9898*igras-0.1850*wbc+1.2867*rbc-0.0746*lymph%+0.2030*mono%+0.4413*rdw+0.1297*a-0.0262*ast-0.3032*bun-0.3085*tg+0.3632*pt-20.7880
21.其中,y1表示脊柱结核的概率,对于结核杆菌抗体tb.antibody,阳性记为1,阴性记为0,对于干扰素-γ释放试验igras,阳性记为1,阴性记为0,wbc表示白细胞计数,rbc表示红细胞计数,lymph%表示淋巴细胞百分比,mono%表示单核细胞百分比,rdw表示红细胞分布宽度,a表示白蛋白,ast表示谷草转氨酶,bun表示血尿素氮,tg表示甘油三酯,pt表示凝血酶原时间。
22.进一步的,将第二变量组在第一诊断模型中不具有显著性的变量排除之前,包括:通过r语言的rms包,计算第二变量组中每个变量在第一诊断模型中的p值,将p值大于预设阈值的变量作为不具有显著性的变量。
23.进一步的,所述第二诊断模型的数学表达式如下:
24.y2=2.5214*tb.antibody+4.6271*igras+0.879*rbc+0.2181*mono%+0.4476*rdw-0.0255*ast-0.299*bun-13.1348
25.其中,y2表示脊柱结核的概率,对于结核杆菌抗体tb.antibody,阳性记为1,阴性记为0,对于干扰素-γ释放试验igras,阳性记为1,阴性记为0,rbc表示红细胞计数,mono%表示单核细胞百分比,rdw表示红细胞分布宽度,ast表示谷草转氨酶,bun表示血尿素氮。
26.本发明还提出一种鉴别判断脊柱感染患者感染类型的系统,包括:
27.数据获取单元,用于获取每个已知脊柱感染患者的常规实验室检查数据得到与已知脊柱感染患者一一对应的第一变量组,所述已知脊柱感染患者为脊柱结核患者或非脊柱结核患者;
28.第一数据筛选单元,用于对第一变量组中的变量进行筛选得到第二变量组;
29.第一模型构建单元,用于根据所有已知脊柱感染患者的第二变量组建立第一诊断模型;
30.第二数据筛选单元,用于将第二变量组在第一诊断模型中不具有显著性的变量排除,得到第三变量组;
31.第二模型构建单元,用于根据所有已知脊柱感染患者的第三变量组建立第二诊断
模型;
32.列线图绘制单元,用于根据第二诊断模型绘制列线图;
33.鉴别判断单元,用于获取待判断脊柱感染患者的常规实验室检查的数据,将所述数据匹配列线图得到待判断脊柱感染患者为脊柱结核的概率与非脊柱结核的概率。
34.本发明还提出一种鉴别判断脊柱感染患者感染类型的系统,包括计算机设备,所述计算机设备被编程或配置以执行任一所述的鉴别判断脊柱感染患者感染类型的方法。
35.本发明还提出一种计算机可读存储介质,所述计算机可读存储介质存储有被编程或配置以执行任一所述的鉴别判断脊柱感染患者感染类型的方法的计算机程序。
36.与现有技术相比,本发明的优点在于:
37.本发明首先获取脊柱感染患者入院治疗时的常规实验室检查数据得到第一变量组,然后对第一变量组中的变量进行筛选,用筛选得到的第二变量组建立第一诊断模型,然后将第二变量组在该模型中不具有显著性的变量排除得到第三变量组,最后用第三变量组重新建立第二诊断模型,并根据该模型绘制列线图。通过该列线图就可以基于脊柱感染患者的常规实验室检查数据来判断脊柱感染患者为脊柱结核的概率,由于该列线图是通过结合多个指标得到,因此提高了诊断结果的准确性,使得贫困偏远地区的医院使用该线列图,就能基于脊柱感染患者的常规实验室检查数据进行较为准确的脊柱结核的早期诊断。
附图说明
38.图1为本发明实施例的流程图。
39.图2为脊柱结核患者与非脊柱结核患者的第一变量组中单因素指标的auc结果。
40.图3为本发明实施例中采用lasso回归对第一变量组中的变量进行筛选的结果示意图。
41.图4为本发明实施例中建立第一诊断模型的结果示意图。
42.图5为本发明实施例中建立第二诊断模型的结果示意图。
43.图6为本发明实施例中第二诊断模型的校准曲线以及在训练集队列与验证集队列的roc曲线。
44.图7为本发明实施例中绘制的列线图。
具体实施方式
45.以下结合说明书附图和具体优选的实施例对本发明作进一步描述,但并不因此而限制本发明的保护范围。
46.实施例一
47.在常规实验室检查中,血沉、白细胞计数、c反应蛋白等炎症指标对于结核病的诊断缺乏特异性,在化脓性脊柱炎中同样出现炎症指标升高。干扰素γ释放试验(igras)表现出较好的诊断效能,但是仅靠igras一个指标仍无法满足临床对脊柱结核诊断准确率的需求。同时,igras不能区分活动性和潜伏性结核病,且与病程相关,对于脊柱结核的诊断具有一定的局限性。
48.针对目前的状况,本实施例一种鉴别判断脊柱感染患者感染类型的方法,如图1所示,包括以下步骤:
49.s1)获取每个已知脊柱感染患者的常规实验室检查数据得到与已知脊柱感染患者一一对应的第一变量组,所述已知脊柱感染患者为脊柱结核患者或非脊柱结核患者;
50.s2)对第一变量组中的变量进行筛选得到第二变量组;
51.s3)根据所有已知脊柱感染患者的第二变量组建立第一诊断模型;
52.s4)将第二变量组在第一诊断模型中不具有显著性的变量排除,得到第三变量组;
53.s5)根据所有已知脊柱感染患者的第三变量组建立第二诊断模型;
54.s6)根据第二诊断模型绘制列线图;
55.s7)获取待判断脊柱感染患者的常规实验室检查的数据,将所述数据匹配列线图得到待判断脊柱感染患者为脊柱结核的概率与非脊柱结核的概率。
56.通过上述步骤,本实施例首先获取脊柱感染患者入院治疗时的常规实验室检查数据得到第一变量组,然后对第一变量组中的变量进行筛选,用筛选得到的第二变量组建立第一诊断模型,然后将第二变量组在该模型中不具有显著性的变量排除得到第三变量组,最后用第三变量组重新建立第二诊断模型,从而完善诊断模型并根据该模型绘制列线图。通过该列线图就可以基于脊柱感染患者的常规实验室检查数据来判断脊柱感染患者为脊柱结核的概率,由于该列线图是通过结合多个指标得到,因此提高了诊断结果的准确性,使得贫困偏远地区的医院使用该线列图,就能基于脊柱感染患者的常规实验室检查数据进行较为准确的脊柱结核的早期诊断。
57.下面对于各步骤进行详细说明。
58.在步骤s1)中,我们收集了三个医院疑似脊柱结核的患者,删除掉含有缺失值和不符合纳入标准和诊断标准的数据后,一共纳入了206名符合要求的疑似脊柱结核的患者进行分析。患者如果符合以下条件的其中一条,就判定诊断为脊柱结核(stb患者):
59.1.手术或穿刺取得的病灶组织进行结核分支杆菌培养阳性;
60.2.结核分支杆菌分子检测阳性(包括xpert和mngs);
61.3.符合相关的病理组织学特征(至少符合干酪样坏死、抗酸染色阳性和肉芽肿性炎症这三个特征的其中一项),并且抗结核治疗有效。
62.患者如果符合以下条件的其中一条,就判定诊断为非脊柱结核外的其他疾病(nstb患者):
63.1.微生物学证据表明病灶感染部位是由其他细菌、真菌或病毒引起;
64.2.病理组织学诊断为脊柱其他病变(包括化脓性炎和肿瘤)。
65.从而基于上述分析,得到105名stb患者和101名nstb患者,进一步对stb患者和nstb患者的38项常规实验室检查的结果进行单因素分析,38项常规实验室检查的结果包括:
66.tubercle bacillus antibody(tb.antibody),结核杆菌抗体(结核抗体);
67.interferon-γrelease assays(igras),干扰素-γ释放试验;
68.white blood cell(wbc),白细胞计数;
69.red blood cell(rbc),红细胞计数;
70.hemoglobin(hgb),血红蛋白(hgb);
71.platelet(plt)血小板计数;
72.neutrophil(neut)中性粒细胞;
73.lymphocyte(lymph)淋巴细胞;
74.eosinophil(eo)嗜酸性粒细胞;
75.basophil(baso)嗜碱性粒细胞;
76.monocyte(mono)单核细胞;
77.neutrophil%(neut%)中性粒细胞百分比;
78.lymphocyte%(lymph%)淋巴细胞百分比;
79.basophil%(baso%)嗜碱性粒细胞百分比;
80.eosinophil%(eo%)嗜酸性粒细胞百分比;
81.monocyte%(mono%)单核细胞百分比;
82.red blood cell distribution width(rdw)红细胞分布宽度;
83.platelet volume(pct)血小板体积;
84.mean platelet volume(mpv)平均血小板体积;
85.total protein(tp)总蛋白;
86.albumin(a)白蛋白;
87.globulin(g)球蛋白;
88.albumin/globulin(ag)白球比;
89.alanine aminotransferase(alt)谷丙转氨酶;
90.aspartate aminotransferase(ast)谷草转氨酶;
91.blood urea nitrogen(bun)血尿素氮;
92.creatinine(cr)肌酐;
93.triglyceride(tg)甘油三酯;
94.cholesterol(chol)胆固醇;
95.high-density lipoprotein(hdl)高密度脂蛋白;
96.low-density lipoprotein(ldl)低密度脂蛋白;
97.glucose(bs)葡萄糖;
98.prothrombin time(pt)凝血酶原时间;
99.activated partial thromboplatin time(aptt)活化部分凝血活酶时间;
100.international normalized ratio(inr)国际标准化比值;
101.d dimer(d_dimer)d二聚体;
102.erythrocyte sedimentation rate(esr)血沉;
103.c-reactive protein(crp)c反应蛋白。
104.对于上述常规实验室检查的结果,我们使用r语言软件进行单因素分析。r语言软件的“cbcgrps”包被用于基线表的绘制,其中,分类变量使用卡方检验(或者fisher确切概率法)对两组之间的分布差异进行分析,符合正态分布的连续资料通过均值(
±
标准差)的形式描述并使用t检验对两组之间的差异进行分析,不符合正态分布的资料使用中位数(百分位数)的形式描述并使用秩和检验对两组之间的差异进行分析,组间比较的结果均使用p值表示。变量之间的相关性热图通过“corrplot”包计算并绘制。
105.通过对于上述结果进行单因素分析,我们观察到两组患者在tb.antibody,rbc,mono%,lymph,igras具有很大的统计学差异(p<0.001)。另外,bs,lymph%,a,bun,ag,
alt,tg,hgb在两组患者之间均具有显著统计学差异(p<0.05)。我们通过这些单因素指标绘制了roc曲线,并将其auc的结果用lollipop chart展示,如图2所示。通过图2我们观察到,在脊柱结核的早期诊断中应用单因素的分析时,仅igras的诊断效力较高,auc=0.8326,超过了0.80,其他指标的单因素诊断效力较低,auc均未超过0.7,在脊柱结核的诊断中无法发挥足够的作用。越来越多的研究表明,单凭一个指标往往无法做出有效而准确的诊断。多指标联合使用将是应用趋势。为了满足临床实际需要,最大限度地降低试验成本,我们考虑联合多个常规实验室检查以提高脊柱结核的早期诊断效力能够更好地应用于贫困偏远地区的脊柱结核患者。
106.因此,本实施例中,第一变量组纳入了上述38个常规实验室检查变量以及患者的年龄和性别这2个变量,对于这些选择的变量,各级医院一般都有能力进行检测。
107.在步骤s2之前,我们对第一变量组中的各个变量之间进行相关性分析,发现在相关性热图上可以观察到很多变量之间具有很高的相关性。当原始变量中存在多重共线性时,lasso回归可以有效地对存在多重共线性的变量进行筛选。为了尽量降低变量之间的共线性对于诊断模型中各指标权重的影响,在步骤s2中,我们采用了lasso回归进行变量的筛选,本实施例中对第一变量组中的变量进行筛选得到第二变量组时,包括以下步骤:
108.将所有已知脊柱感染患者的第一变量组进行汇总;
109.进入lasso回归的连续性变量需要使用min-max转换的方法对数据进行标准化,因此使用min-max转换将汇总的第一变量组中的连续性变量进行标准化;
110.使用r语言软件的“glmnet”包,将设置nfolds设置为20,取one standard error away(一个标准误距离)对应的变量数为最佳变量数,从而筛选出对应的变量作为第二变量组中的变量。如图3所示,我们通过r语言软件,采用lasso回归对第一变量组中的40个变量进行筛选,筛选出了12个可用于后续预测模型拟合的指标,包括:
111.tb.antibody,结核杆菌抗体(结核抗体);
112.igras,干扰素-γ释放试验;
113.wbc,白细胞计数;
114.rbc,红细胞计数;
115.lymph%,淋巴细胞百分比;
116.mono%,单核细胞百分比;
117.rdw,红细胞分布宽度;
118.a,白蛋白;
119.ast,谷草转氨酶;
120.bun,血尿素氮;
121.tg,甘油三酯;
122.pt,凝血酶原时间。
123.在步骤s3中根据所有已知脊柱感染患者的第二变量组建立第一诊断模型和在步骤s5中根据所有已知脊柱感染患者的第三变量组建立第二诊断模型时,使用r语言软件的“rms”包来建立logistics回归模型,“rms”包被用于logistics回归模型的建立,纳入logistics回归变量的选择根据lasso回归筛选结果,建立第一诊断模型和建立第二诊断模型均包括以下步骤:
124.从所有已知脊柱感染患者中随机抽取预设比例的已知脊柱感染患者,将被抽取的已知脊柱感染患者的目标变量组作为训练集,本实施例中随机抽取85%的病例,将他们的第二变量组或者第三变量组作为训练集用作对应的第一诊断模型或者第二诊断模型的建立,通过r语言的rms包,用训练集的所有变量训练logistics回归模型,得到训练好的logistics回归模型作为目标诊断模型。
125.此外,本实施例中,所有已知脊柱感染患者中剩余病例的第二变量组或者第三变量组作为验证集来进行模型的内部验证。因此进一步的,在得到训练好的logistics回归模型作为目标诊断模型之后还包括,将未被抽取的其他已知脊柱感染患者的目标变量组作为验证集,通过r语言的rms包,用验证集评价目标诊断模型的预测性能,若预测性能不满足要求,调整预设比例(例如将85%调整为90%来增加训练集的样本数量),重新执行随机抽取预设比例的已知脊柱感染患者的步骤。
126.如图4所示,本实施例中,训练好的第一诊断模型的数学表达式如下:
127.y1=2.0705*tb.antibody+4.9898*igras-0.1850*wbc+1.2867*rbc-0.0746*lymph%+0.2030*mono%+0.4413*rdw+0.1297*a-0.0262*ast-0.3032*bun-0.3085*tg+0.3632*pt-20.7880
128.其中,y1表示脊柱结核的概率,对于结核杆菌抗体tb.antibody,阳性记为1,阴性记为0,对于干扰素-γ释放试验igras,阳性记为1,阴性记为0,wbc表示白细胞计数,rbc表示红细胞计数,lymph%表示淋巴细胞百分比,mono%表示单核细胞百分比,rdw表示红细胞分布宽度,a表示白蛋白,ast表示谷草转氨酶,bun表示血尿素氮,tg表示甘油三酯,pt表示凝血酶原时间。
129.r语言软件的“rms”包在训练logistics回归模型时还会计算每个变量在模型中的p值,p值表示变量在模型中显著性的高低,p值越大,显著性越低。本实施例的步骤s4将第二变量组在第一诊断模型中不具有显著性的变量排除之前,还包括:通过r语言软件的“rms”包,计算第二变量组中每个变量在第一诊断模型中的p值,将p值大于预设阈值的变量作为不具有显著性的变量。本实施例中预设阈值为0.1,将图5中p值大于0.1的变量从第二变量组中剔除后,第三变量组中的变量包括tb.antibody,igras,rbc,mono%,rdw,ast,bun这七个变量。
130.相对应的,如图5所示,步骤s5中用上述七个变量重新训练得到的第二诊断模型的数学表达式如下:
131.y2=2.5214*tb.antibody+4.6271*igras+0.879*rbc+0.2181*mono%+0.4476*rdw-0.0255*ast-0.299*bun-13.1348
132.其中,y2表示脊柱结核的概率,对于结核杆菌抗体tb.antibody,阳性记为1,阴性记为0,对于干扰素-γ释放试验igras,阳性记为1,阴性记为0,rbc表示红细胞计数,mono%表示单核细胞百分比,rdw表示红细胞分布宽度,ast表示谷草转氨酶,bun表示血尿素氮。
133.对于第二诊断模型,我们在该模型的训练集中使用r语言软件的“caret”包绘制了模型的校准曲线,如图6中a图所示,通过校准曲线,我们观察到第二诊断模型有很好的拟合优度。此外,我们通过使用r语言软件的“proc”和“ggplot2”包,分别在第二诊断模型的训练集合验证集中计算和绘制训练集绘制了对应的roc曲线,如图6中b图所示,第二诊断模型在训练队列中roc曲线的auc值为0.9468。由于该模型是基于训练集拟合,所以我们将另外的
验证集用于进一步评价模型的预测性能。如图6中c图所示,第二诊断模型在验证队列中的roc曲线的auc值为0.9188。说明第二诊断模型具有很不错的诊断效力。
134.本实施例的步骤s6中使用r语言软件的“regplot”包,根据第二诊断模型绘制了一个可用于临床实践的列线图,如图7所示,只需要将待判断的脊柱感染患者的常规实验室检查数据中tb.antibody,igras,rbc,mono%,rdw,ast,bun这七个检查结果匹配该列线图,就可以得到患者为脊柱结核的概率y,相对的,患者为非脊柱结核的概率为1-y。
135.实施例二
136.本实施例基于实施例提出一种鉴别判断脊柱感染患者感染类型的系统,包括:
137.数据获取单元,用于获取每个已知脊柱感染患者的常规实验室检查数据得到与已知脊柱感染患者一一对应的第一变量组,所述已知脊柱感染患者为脊柱结核患者或非脊柱结核患者;
138.第一数据筛选单元,用于对第一变量组中的变量进行筛选得到第二变量组;
139.第一模型构建单元,用于根据所有已知脊柱感染患者的第二变量组建立第一诊断模型;
140.第二数据筛选单元,用于将第二变量组在第一诊断模型中不具有显著性的变量排除,得到第三变量组;
141.第二模型构建单元,用于根据所有已知脊柱感染患者的第三变量组建立第二诊断模型;
142.列线图绘制单元,用于根据第二诊断模型绘制列线图;
143.鉴别判断单元,用于获取待判断脊柱感染患者的常规实验室检查的数据,将所述数据匹配列线图得到待判断脊柱感染患者为脊柱结核的概率y,并计算待判断脊柱感染患者为非脊柱结核的概率1-y。
144.实施例三
145.本实施例基于实施例一提出一种鉴别判断脊柱感染患者感染类型的系统,包括计算机设备,所述计算机设备被编程或配置以执行实施例一所述的鉴别判断脊柱感染患者感染类型的方法。
146.本实施例还提出一种计算机可读存储介质,所述计算机可读存储介质存储有被编程或配置以执行实施例一所述的鉴别判断脊柱感染患者感染类型的方法的计算机程序。
147.综上所述,本发明收集了脊柱感染患者入院常规实验室血清学检查,通过lasso回归筛选变量,通过logistics回归建立模型,并根据这个模型绘制了一个用于早期诊断脊柱结核的列线图,该图包含了tb.antibody,igras,rbc,mono%,rdw,ast,bun这七个常规实验室指标,具有不错的诊断效力。贫困偏远地区的无更多检查手段的医院通过该列线图可以极大提高脊柱结核早期诊断的能力。
148.上述只是本发明的较佳实施例,并非对本发明作任何形式上的限制。虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明。因此,凡是未脱离本发明技术方案的内容,依据本发明技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均应落在本发明技术方案保护的范围内。
技术特征:
1.一种鉴别判断脊柱感染患者感染类型的方法,其特征在于,包括以下步骤:获取每个已知脊柱感染患者的常规实验室检查数据得到与已知脊柱感染患者一一对应的第一变量组,所述已知脊柱感染患者为脊柱结核患者或非脊柱结核患者;对第一变量组中的变量进行筛选得到第二变量组;根据所有已知脊柱感染患者的第二变量组建立第一诊断模型;将第二变量组在第一诊断模型中不具有显著性的变量排除,得到第三变量组;根据所有已知脊柱感染患者的第三变量组建立第二诊断模型;根据第二诊断模型绘制列线图;获取待判断脊柱感染患者的常规实验室检查的数据,将所述数据匹配列线图得到待判断脊柱感染患者为脊柱结核的概率与非脊柱结核的概率。2.根据权利要求1所述的鉴别判断脊柱感染患者感染类型的方法,其特征在于,对第一变量组中的变量进行筛选得到第二变量组时,包括:将所有已知脊柱感染患者的第一变量组进行汇总,使用min-max转换将汇总的第一变量组中的连续性变量进行标准化,然后使用r语言的glmnet包并设置参数,对汇总的第一变量组依据lasso回归进行筛选,将筛选出的变量作为第二变量组中的变量。3.根据权利要求1所述的鉴别判断脊柱感染患者感染类型的方法,其特征在于,根据所有已知脊柱感染患者的第二变量组建立第一诊断模型和根据所有已知脊柱感染患者的第三变量组建立第二诊断模型时,包括:随机抽取预设比例的已知脊柱感染患者,将被抽取的已知脊柱感染患者的目标变量组作为训练集,通过r语言的rms包,用训练集的所有变量训练logistics回归模型,得到训练好的logistics回归模型作为目标诊断模型。4.根据权利要求3所述的鉴别判断脊柱感染患者感染类型的方法,其特征在于,得到训练好的logistics回归模型作为目标诊断模型之后还包括,将未被抽取的其他已知脊柱感染患者的目标变量组作为验证集,通过r语言的rms包,用验证集评价目标诊断模型的预测性能,若预测性能不满足要求,调整预设比例,重新执行随机抽取预设比例的已知脊柱感染患者的步骤。5.根据权利要求1所述的鉴别判断脊柱感染患者感染类型的方法,其特征在于,所述第一诊断模型的数学表达式如下:y1=2.0705*tb.antibody+4.9898*igras-0.1850*wbc+1.2867*rbc-0.0746*lymph%+0.2030*mono%+0.4413*rdw+0.1297*a-0.0262*ast-0.3032*bun-0.3085*tg+0.3632*pt-20.7880其中,y1表示脊柱结核的概率,对于结核杆菌抗体tb.antibody,阳性记为1,阴性记为0,对于干扰素-γ释放试验igras,阳性记为1,阴性记为0,wbc表示白细胞计数,rbc表示红细胞计数,lymph%表示淋巴细胞百分比,mono%表示单核细胞百分比,rdw表示红细胞分布宽度,a表示白蛋白,ast表示谷草转氨酶,bun表示血尿素氮,tg表示甘油三酯,pt表示凝血酶原时间。6.根据权利要求1所述的鉴别判断脊柱感染患者感染类型的方法,其特征在于,将第二变量组在第一诊断模型中不具有显著性的变量排除之前,包括:通过r语言的rms包,计算第二变量组中每个变量在第一诊断模型中的p值,将p值大于预设阈值的变量作为不具有显著性的变量。
7.根据权利要求1所述的鉴别判断脊柱感染患者感染类型的方法,其特征在于,所述第二诊断模型的数学表达式如下:y2=2.5214*tb.antibody+4.6271*igras+0.879*rbc+0.2181*mono%+0.4476*rdw-0.0255*ast-0.299*bun-13.1348其中,y2表示脊柱结核的概率,对于结核杆菌抗体tb.antibody,阳性记为1,阴性记为0,对于干扰素-γ释放试验igras,阳性记为1,阴性记为0,rbc表示红细胞计数,mono%表示单核细胞百分比,rdw表示红细胞分布宽度,ast表示谷草转氨酶,bun表示血尿素氮。8.一种鉴别判断脊柱感染患者感染类型的系统,其特征在于,包括:数据获取单元,用于获取每个已知脊柱感染患者的常规实验室检查数据得到与已知脊柱感染患者一一对应的第一变量组,所述已知脊柱感染患者为脊柱结核患者或非脊柱结核患者;第一数据筛选单元,用于对第一变量组中的变量进行筛选得到第二变量组;第一模型构建单元,用于根据所有已知脊柱感染患者的第二变量组建立第一诊断模型;第二数据筛选单元,用于将第二变量组在第一诊断模型中不具有显著性的变量排除,得到第三变量组;第二模型构建单元,用于根据所有已知脊柱感染患者的第三变量组建立第二诊断模型;列线图绘制单元,用于根据第二诊断模型绘制列线图;鉴别判断单元,用于获取待判断脊柱感染患者的常规实验室检查的数据,将所述数据匹配列线图得到待判断脊柱感染患者为脊柱结核的概率与非脊柱结核的概率。9.一种鉴别判断脊柱感染患者感染类型的系统,其特征在于,包括计算机设备,所述计算机设备被编程或配置以执行权利要求1~8任一所述的鉴别判断脊柱感染患者感染类型的方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有被编程或配置以执行权利要求1~8任一所述的鉴别判断脊柱感染患者感染类型的方法的计算机程序。
技术总结
本发明公开了一种鉴别判断脊柱感染患者感染类型的方法、系统及介质,方法包括:获取每个已知脊柱感染患者的常规实验室检查数据得到对应的第一变量组;对第一变量组中的变量进行筛选得到第二变量组;根据所有已知脊柱感染患者的第二变量组建立第一诊断模型;将第二变量组在第一诊断模型中不具有显著性的变量排除,得到第三变量组;根据所有已知脊柱感染患者的第三变量组建立第二诊断模型;根据第二诊断模型绘制列线图;获取待判断脊柱感染患者的常规实验室检查的数据,将数据匹配列线图得到待判断脊柱感染患者为脊柱结核的概率与非脊柱结核的概率。本发明能够帮助贫困偏远地区的医院进行较为准确的脊柱结核早期诊断。医院进行较为准确的脊柱结核早期诊断。医院进行较为准确的脊柱结核早期诊断。
技术研发人员:高琪乐 胡小江
受保护的技术使用者:中南大学湘雅医院
技术研发日:2023.06.29
技术公布日:2023/9/20
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/