一种EMPI患者信息比对方法及系统与流程

未命名 09-15 阅读:49 评论:0

一种empi患者信息比对方法及系统
技术领域
1.本发明涉及医疗信息技术领域,特别是涉及一种empi患者信息比对方法及系统。


背景技术:

2.随着医疗信息化的深化改革,为了更好的服务患者,医院内构建统一的患者信息模型迫在眉睫。既往的方案多是在数据清洗前生成企业级患者主索引(enterprisemasterpatientindex,empi),数据清洗后再进行数据比对以及empi融合。这种模式从一定程度上解决了多源异构的问题,但是在一定程度上拖慢了empi比对的效率,且无法针对医院情况的不同进行比对规则调整。


技术实现要素:

3.本发明的目的是提供一种empi患者信息比对方法及系统,可以提高empi比对的效率以及针对医院情况的不同进行比对规则调整。
4.为实现上述目的,本发明提供了如下方案:
5.一种empi患者信息比对方法,所述方法包括:
6.步骤s1:获取权重初筛规则库;所述权重初筛规则库用于维护属性权重、初筛规则、合并权重值和疑似权重值;所述属性权重为属性所占的相似度值;所述初筛规则为根据疑似权重值设置的属性组合;所述合并权重值为达到合并关系的最小数值;所述疑似权重值为达到疑似关系的最小数值;
7.步骤s2:获取第k条结构化患者基本信息数据,将第k条结构化患者基本信息数据放入未比对数据集合中;所述结构化患者基本信息数据包括多个属性;k的初始值为2;初始的未比对数据集合是一个只包括第1条结构化患者基本信息数据的未必对数据集合;
8.步骤s3:根据所述权重初筛规则库,将第k条结构化患者基本信息数据与所述未比对数据集合中除第k条结构化患者基本信息数据外每条结构化患者基本信息数据分别进行各属性的比对,累加相同属性对应的属性权重,得到第k条结构化患者基本信息数据对应的权重值累加和,当第k条结构化患者基本信息数据对应的权重值累加和大于所述疑似权重值时,将第k条结构化患者基本信息数据从所述未比对数据集合中取出,放到优先处理的队列中;
9.步骤s4:判断k是否达到最大值h;若否,则令k=k+1,返回步骤s2;若是,则获取所述优先处理的队列和所述未比对数据集合;
10.步骤s5:根据所述权重初筛规则库和本地存储库,对所述优先处理的队列中每条结构化患者基本信息数据进行各属性的比对,基于比对结果得到所述优先处理的队列中每条结构化患者基本信息数据的empi,更新所述本地存储库;所述本地存储库包括已经分配了empi的多条结构化患者基本信息数据;
11.步骤s6:判断所述未比对数据集合中结构化患者基本信息数据的总数据量是否大于预设的一个线程处理的数据量;
12.若否,则执行步骤s7:根据所述权重初筛规则库和所述本地存储库,对所述未比对数据集合中每条结构化患者基本信息数据进行各属性的比对,基于比对结果得到所述未比对数据集合中每条结构化患者基本信息数据的empi,更新所述本地存储库;
13.若是,则执行步骤s8:采用fork-join技术分而治之,将所述未比对数据集合拆分成多个子集合,针对每个所述子集合,根据所述权重初筛规则库和所述本地存储库,对所述子集合中每条结构化患者基本信息数据进行各属性的比对,基于比对结果得到所述未比对数据集合中每条结构化患者基本信息数据的empi,更新所述本地存储库。
14.可选地,根据所述权重初筛规则库和本地存储库,对所述优先处理的队列中每条结构化患者基本信息数据进行各属性的比对,基于比对结果得到所述优先处理的队列中每条结构化患者基本信息数据的empi,更新所述本地存储库,具体包括:
15.步骤s51:根据所述初筛规则自动生成所述优先处理的队列对应的查询条件,将所述优先处理的队列中的结构化患者基本信息数据和所述优先处理的队列对应的查询条件组成最终的查询语句到本地存储库中进行查询,得到所述优先处理的队列对应的查询结果;所述优先处理的队列对应的查询结果包括与所述优先处理的队列中的结构化患者基本信息数据具有相同属性的分配了empi的结构化患者基本信息数据;
16.步骤s52:将所述优先处理的队列中第i条结构化患者基本信息数据与所述优先处理的队列对应的查询结果中每条分配了empi的结构化患者基本信息数据分别进行各属性的比对,累加相同属性对应的属性权重,得到第i条结构化患者基本信息数据对应的权重值累加和;i的初始值为1;
17.步骤s53:将第i条结构化患者基本信息数据对应的权重值累加和与所述疑似权重值和所述合并权重值进行比对;当第i条结构化患者基本信息数据对应的权重值累加和小于所述疑似权重值时,为第i条结构化患者基本信息数据创建新的empi,更新所述本地存储库;当第i条结构化患者基本信息数据对应的权重值累加和大于所述疑似权重值且小于所述合并权重值时,在第i条结构化患者基本信息数据与已有的empi之间构建疑似关系,并为第i条结构化患者基本信息数据创建新的empi,更新所述本地存储库;当第i条结构化患者基本信息数据对应的权重值累加和大于所述合并权重值时,复用已有的empi,将第i条结构化患者基本信息数据与已经分配了empi的结构化患者基本信息数据进行融合,更新所述本地存储库;
18.步骤s54:判断i是否达到所述优先处理的队列中结构化患者基本信息数据条数的最大值;若否,则令i=i+1,返回步骤s52;若是,则获取所述未比对数据集合中结构化患者基本信息数据的总数据量。
19.可选地,根据所述权重初筛规则库和所述本地存储库,对所述未比对数据集合中每条结构化患者基本信息数据进行各属性的比对,基于比对结果得到所述未比对数据集合中每条结构化患者基本信息数据的empi,更新所述本地存储库,具体包括:
20.步骤s71:根据所述初筛规则自动生成所述未比对数据集合对应的查询条件,将所述未比对数据集合中的结构化患者基本信息数据和所述未比对数据集合对应的查询条件组成最终的查询语句到所述本地存储库中进行查询,得到所述未比对数据集合对应的查询结果;所述未比对数据集合对应的查询结果包括与所述未比对数据集合中的结构化患者基本信息数据具有相同属性的分配了empi的结构化患者基本信息数据;
21.步骤s72:将所述未比对数据集合中第j条结构化患者基本信息数据与所述未比对数据集合对应的查询结果中每条分配了empi的结构化患者基本信息数据分别进行各属性的比对,累加相同属性对应的属性权重,得到第j条结构化患者基本信息数据对应的权重值累加和;j的初始值为1;
22.步骤s73:将第j条结构化患者基本信息数据对应的权重值累加和与所述疑似权重值和所述合并权重值进行比对;当第j条结构化患者基本信息数据对应的权重值累加和小于所述疑似权重值时,为第j条结构化患者基本信息数据创建新的empi,更新所述本地存储库;当第j条结构化患者基本信息数据对应的权重值累加和大于所述疑似权重值且小于所述合并权重值时,在第j条结构化患者基本信息数据与已有的empi之间构建疑似关系,并为第j条结构化患者基本信息数据创建新的empi,更新所述本地存储库;当第j条结构化患者基本信息数据对应的权重值累加和大于所述合并权重值时,复用已有的empi,将第j条结构化患者基本信息数据与已经分配了empi的结构化患者基本信息数据进行融合,更新所述本地存储库;
23.步骤s74:判断j是否达到所述未比对数据集合中结构化患者基本信息数据条数的最大值;若否,则令j=j+1,返回步骤s72;若是,则得到更新后的所述本地存储库。
24.可选地,采用fork-join技术分而治之,将所述未比对数据集合拆分成多个子集合,针对每个所述子集合,根据所述权重初筛规则库和所述本地存储库,对所述子集合中每条结构化患者基本信息数据进行各属性的比对,基于比对结果得到所述未比对数据集合中每条结构化患者基本信息数据的empi,更新所述本地存储库,具体包括:
25.步骤s81:将所述未比对数据集合中结构化患者基本信息数据的总数据量除2,分成两个集合分别采用fork-join技术分而治之,由fork-join将两个集合分别拆分成多个无法再继续拆分的子集合;
26.步骤s82:针对每个所述子集合,根据所述初筛规则自动生成所述子集合对应的查询条件,将所述子集合中的结构化患者基本信息数据和所述子集合对应的查询条件组成最终的查询语句到所述本地存储库中进行查询,得到所述子集合对应的查询结果;所述子集合对应的查询结果包括与所述子集合中的结构化患者基本信息数据具有相同属性的分配了empi的结构化患者基本信息数据;
27.步骤s83:将所述子集合中第m条结构化患者基本信息数据与所述子集合对应的查询结果中每条分配了empi的结构化患者基本信息数据分别进行各属性的比对,累加相同属性对应的属性权重,得到第m条结构化患者基本信息数据对应的权重值累加和;m的初始值为1;
28.步骤s84:将第m条结构化患者基本信息数据对应的权重值累加和与所述疑似权重值和所述合并权重值进行比对;当第m条结构化患者基本信息数据对应的权重值累加和小于所述疑似权重值时,为第m条结构化患者基本信息数据创建新的empi,更新所述本地存储库;当第m条结构化患者基本信息数据对应的权重值累加和大于所述疑似权重值且小于所述合并权重值时,在第m条结构化患者基本信息数据与已有的empi之间构建疑似关系,并为第m条结构化患者基本信息数据创建新的empi,更新所述本地存储库;当第m条结构化患者基本信息数据对应的权重值累加和大于所述合并权重值时,复用已有的empi,将第m条结构化患者基本信息数据与已经分配了empi的结构化患者基本信息数据进行融合,更新所述本
地存储库;
29.步骤s85:判断m是否达到所述子集合中结构化患者基本信息数据条数的最大值;若否,则令m=m+1,返回步骤s83;若是,则得到更新后的所述本地存储库。
30.可选地,所述获取第k条结构化患者基本信息数据,将第k条结构化患者基本信息数据放入未比对数据集合中,之前还包括:
31.获取多源异构的患者数据;
32.创建统一的结构化数据通用模型;
33.基于所述结构化数据通用模型对多源异构的患者数据进行模型转换,得到结构化患者基本信息数据。
34.可选地,基于所述结构化数据通用模型对多源异构的患者数据进行模型转换,得到结构化患者基本信息数据,之后还包括:
35.将所述结构化患者基本信息数据按照预设标准进行数据清洗,得到统一的标准化的结构化患者基本信息数据并标记为未比对。
36.本发明还提供了如下方案:
37.一种empi患者信息比对系统,所述系统包括:
38.权重初筛规则库获取模块,用于获取权重初筛规则库;所述权重初筛规则库用于维护属性权重、初筛规则、合并权重值和疑似权重值;所述属性权重为属性所占的相似度值;所述初筛规则为根据疑似权重值设置的属性组合;所述合并权重值为达到合并关系的最小数值;所述疑似权重值为达到疑似关系的最小数值;
39.结构化患者基本信息数据获取模块,用于获取第k条结构化患者基本信息数据,将第k条结构化患者基本信息数据放入未比对数据集合中;所述结构化患者基本信息数据包括多个属性;k的初始值为2;初始的未比对数据集合是一个只包括第1条结构化患者基本信息数据的未必对数据集合;
40.结构化患者基本信息数据属性比对模块,用于根据所述权重初筛规则库,将第k条结构化患者基本信息数据与所述未比对数据集合中除第k条结构化患者基本信息数据外每条结构化患者基本信息数据分别进行各属性的比对,累加相同属性对应的属性权重,得到第k条结构化患者基本信息数据对应的权重值累加和,当第k条结构化患者基本信息数据对应的权重值累加和大于所述疑似权重值时,将第k条结构化患者基本信息数据从所述未比对数据集合中取出,放到优先处理的队列中;
41.判断模块,用于判断k是否达到最大值h;若否,则令k=k+1,返回所述结构化患者基本信息数据获取模块;若是,则获取所述优先处理的队列和所述未比对数据集合;
42.优先处理的队列中属性比对模块,用于根据所述权重初筛规则库和本地存储库,对所述优先处理的队列中每条结构化患者基本信息数据进行各属性的比对,基于比对结果得到所述优先处理的队列中每条结构化患者基本信息数据的empi,更新所述本地存储库;所述本地存储库包括已经分配了empi的多条结构化患者基本信息数据;
43.未比对数据集合总数据量判断模块,用于判断所述未比对数据集合中结构化患者基本信息数据的总数据量是否大于预设的一个线程处理的数据量;
44.未比对数据集合中属性比对模块,用于当所述未比对数据集合总数据量判断模块的输出结果为否时,根据所述权重初筛规则库和所述本地存储库,对所述未比对数据集合
中每条结构化患者基本信息数据进行各属性的比对,基于比对结果得到所述未比对数据集合中每条结构化患者基本信息数据的empi,更新所述本地存储库;
45.分而治之模块,用于当所述未比对数据集合总数据量判断模块的输出结果为是时,采用fork-join技术分而治之,将所述未比对数据集合拆分成多个子集合,针对每个所述子集合,根据所述权重初筛规则库和所述本地存储库,对所述子集合中每条结构化患者基本信息数据进行各属性的比对,基于比对结果得到所述未比对数据集合中每条结构化患者基本信息数据的empi,更新所述本地存储库。
46.可选地,所述优先处理的队列中属性比对模块具体包括:
47.本地存储库第一查询单元,用于根据所述初筛规则自动生成所述优先处理的队列对应的查询条件,将所述优先处理的队列中的结构化患者基本信息数据和所述优先处理的队列对应的查询条件组成最终的查询语句到本地存储库中进行查询,得到所述优先处理的队列对应的查询结果;所述优先处理的队列对应的查询结果包括与所述优先处理的队列中的结构化患者基本信息数据具有相同属性的分配了empi的结构化患者基本信息数据;
48.优先处理的队列中属性比对单元,用于将所述优先处理的队列中第i条结构化患者基本信息数据与所述优先处理的队列对应的查询结果中每条分配了empi的结构化患者基本信息数据分别进行各属性的比对,累加相同属性对应的属性权重,得到第i条结构化患者基本信息数据对应的权重值累加和;i的初始值为1;
49.第一权重值比对单元,用于将第i条结构化患者基本信息数据对应的权重值累加和与所述疑似权重值和所述合并权重值进行比对;当第i条结构化患者基本信息数据对应的权重值累加和小于所述疑似权重值时,为第i条结构化患者基本信息数据创建新的empi,更新所述本地存储库;当第i条结构化患者基本信息数据对应的权重值累加和大于所述疑似权重值且小于所述合并权重值时,在第i条结构化患者基本信息数据与已有的empi之间构建疑似关系,并为第i条结构化患者基本信息数据创建新的empi,更新所述本地存储库;当第i条结构化患者基本信息数据对应的权重值累加和大于所述合并权重值时,复用已有的empi,将第i条结构化患者基本信息数据与已经分配了empi的结构化患者基本信息数据进行融合,更新所述本地存储库;
50.第一判断单元,用于判断i是否达到所述优先处理的队列中结构化患者基本信息数据条数的最大值;若否,则令i=i+1,返回所述优先处理的队列中属性比对单元;若是,则获取所述未比对数据集合中结构化患者基本信息数据的总数据量。
51.可选地,所述未比对数据集合中属性比对模块具体包括:
52.本地存储库第二查询单元,用于根据所述初筛规则自动生成所述未比对数据集合对应的查询条件,将所述未比对数据集合中的结构化患者基本信息数据和所述未比对数据集合对应的查询条件组成最终的查询语句到所述本地存储库中进行查询,得到所述未比对数据集合对应的查询结果;所述未比对数据集合对应的查询结果包括与所述未比对数据集合中的结构化患者基本信息数据具有相同属性的分配了empi的结构化患者基本信息数据;
53.未比对数据集合中属性比对单元,用于将所述未比对数据集合中第j条结构化患者基本信息数据与所述未比对数据集合对应的查询结果中每条分配了empi的结构化患者基本信息数据分别进行各属性的比对,累加相同属性对应的属性权重,得到第j条结构化患者基本信息数据对应的权重值累加和;j的初始值为1;
54.第二权重值比对单元,将第j条结构化患者基本信息数据对应的权重值累加和与所述疑似权重值和所述合并权重值进行比对;当第j条结构化患者基本信息数据对应的权重值累加和小于所述疑似权重值时,为第j条结构化患者基本信息数据创建新的empi,更新所述本地存储库;当第j条结构化患者基本信息数据对应的权重值累加和大于所述疑似权重值且小于所述合并权重值时,在第j条结构化患者基本信息数据与已有的empi之间构建疑似关系,并为第j条结构化患者基本信息数据创建新的empi,更新所述本地存储库;当第j条结构化患者基本信息数据对应的权重值累加和大于所述合并权重值时,复用已有的empi,将第j条结构化患者基本信息数据与已经分配了empi的结构化患者基本信息数据进行融合,更新所述本地存储库;
55.第二判断单元,用于判断j是否达到所述未比对数据集合中结构化患者基本信息数据条数的最大值;若否,则令j=j+1,返回所述未比对数据集合中属性比对单元;若是,则得到更新后的所述本地存储库。
56.可选地,所述分而治之模块具体包括:
57.未比对数据集合拆分单元,用于将所述未比对数据集合中结构化患者基本信息数据的总数据量除2,分成两个集合分别采用fork-join技术分而治之,由fork-join将两个集合分别拆分成多个无法再继续拆分的子集合;
58.本地存储库第三查询单元,用于针对每个所述子集合,根据所述初筛规则自动生成所述子集合对应的查询条件,将所述子集合中的结构化患者基本信息数据和所述子集合对应的查询条件组成最终的查询语句到所述本地存储库中进行查询,得到所述子集合对应的查询结果;所述子集合对应的查询结果包括与所述子集合中的结构化患者基本信息数据具有相同属性的分配了empi的结构化患者基本信息数据;
59.未比对数据集合中属性比对单元,用于将所述子集合中第m条结构化患者基本信息数据与所述子集合对应的查询结果中每条分配了empi的结构化患者基本信息数据分别进行各属性的比对,累加相同属性对应的属性权重,得到第m条结构化患者基本信息数据对应的权重值累加和;m的初始值为1;
60.第三权重值比对单元,用于将第m条结构化患者基本信息数据对应的权重值累加和与所述疑似权重值和所述合并权重值进行比对;当第m条结构化患者基本信息数据对应的权重值累加和小于所述疑似权重值时,为第m条结构化患者基本信息数据创建新的empi,更新所述本地存储库;当第m条结构化患者基本信息数据对应的权重值累加和大于所述疑似权重值且小于所述合并权重值时,在第m条结构化患者基本信息数据与已有的empi之间构建疑似关系,并为第m条结构化患者基本信息数据创建新的empi,更新所述本地存储库;当第m条结构化患者基本信息数据对应的权重值累加和大于所述合并权重值时,复用已有的empi,将第m条结构化患者基本信息数据与已经分配了empi的结构化患者基本信息数据进行融合,更新所述本地存储库;
61.第三判断单元,用于判断m是否达到所述子集合中结构化患者基本信息数据条数的最大值;若否,则令m=m+1,返回所述未比对数据集合中属性比对单元;若是,则得到更新后的所述本地存储库。
62.根据本发明提供的具体实施例,本发明公开了以下技术效果:
63.本发明公开的empi患者信息比对方法及系统,根据权重初筛规则库实现empi患者
信息比对,权重初筛规则库维护的属性权重、初筛规则、合并权重值和疑似权重值均针对医院自身的情况,针对医院情况的不同获取不同的权重初筛规则库,根据不同的权重初筛规则库进行比对规则调整,实现empi患者信息比对,可以大大提高医院的数据匹配准确性和更加适应多源数据的情况;由于采用fork-join技术分而治之,针对患者数据进行患者属性的快速比对,针对比对结果进行相似度计算,根据相似度实现同一病人多业务id的关联和患者信息的统一或关联,因此可以提高empi比对的效率。
附图说明
64.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
65.图1为本发明empi患者信息比对方法实施例一的流程图;
66.图2为本发明分而治之实现empi患者信息快速比对的方法流程图。
具体实施方式
67.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
68.本发明的目的是提供一种empi患者信息比对方法及系统,可以提高empi比对的效率以及针对医院情况的不同进行比对规则调整。
69.为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
70.实施例一
71.图1为本发明empi患者信息比对方法实施例一的流程图。如图1所示,本实施例提供了一种empi患者信息比对方法,该方法包括以下步骤:
72.步骤s1:获取权重初筛规则库;权重初筛规则库用于维护属性权重、初筛规则、合并权重值和疑似权重值;属性权重为属性所占的相似度值;初筛规则为根据疑似权重值设置的属性组合;合并权重值为达到合并关系的最小数值;疑似权重值为达到疑似关系的最小数值。
73.该步骤s1中,初筛规则是可以根据疑似权重值来设置的,因为要筛选的大概是有关系的记录,例如医院如果患者身份证号一致的情况下,就意味着两个患者记录是同一个患者的,这种情况就可以把身份证号作为一条初筛规则,再举例来说,还有姓名、出生日期、手机号一致的情况下,也可以视为是同一个患者,姓名、出生日期和手机号这3个也可以作为一组查询条件,之所以选身份证号作为一个初筛规则,选姓名、出生日期、手机号这三个字段为一组作为查询条件,是因为这3个字段的权重值加到一起超过了疑似权重值。根据这些初筛规则组成一个sql,先从一个所有的库(本地存储库)里面筛出相似度比较高的那些数据,再进行比对。
74.步骤s2:获取第k条结构化患者基本信息数据,将第k条结构化患者基本信息数据放入未比对数据集合中;结构化患者基本信息数据包括多个属性;k的初始值为2;初始的未比对数据集合是一个只包括第1条结构化患者基本信息数据的未必对数据集合。
75.该步骤s2之前还包括:
76.获取多源异构的患者数据。
77.创建统一的结构化数据通用模型。
78.基于结构化数据通用模型对多源异构的患者数据进行模型转换,得到结构化患者基本信息数据。
79.基于结构化数据通用模型对多源异构的患者数据进行模型转换,得到结构化患者基本信息数据,之后还包括:
80.将结构化患者基本信息数据按照预设标准进行数据清洗,得到统一的标准化的结构化患者基本信息数据并标记为未比对。
81.步骤s3:根据权重初筛规则库,将第k条结构化患者基本信息数据与未比对数据集合中除第k条结构化患者基本信息数据外每条结构化患者基本信息数据分别进行各属性的比对,累加相同属性对应的属性权重,得到第k条结构化患者基本信息数据对应的权重值累加和,当第k条结构化患者基本信息数据对应的权重值累加和大于疑似权重值时,将第k条结构化患者基本信息数据从未比对数据集合中取出,放到优先处理的队列中。
82.该步骤s3中,累加相同属性对应的属性权重,举例来说,指的是:例如有2条数据比对,姓名设置权重是10,性别设置权重是10,如果两条数据姓名一致,那比对结果就是权重10,发现性别权重也是10,那么这两条数据相似度(权重值累加和)就是10+10=20。
83.步骤s4:判断k是否达到最大值h;若否,则令k=k+1,返回步骤s2;若是,则获取优先处理的队列和未比对数据集合。
84.步骤s5:根据权重初筛规则库和本地存储库,对优先处理的队列中每条结构化患者基本信息数据进行各属性的比对,基于比对结果得到优先处理的队列中每条结构化患者基本信息数据的empi,更新本地存储库;本地存储库包括已经分配了empi的多条结构化患者基本信息数据。
85.该步骤s5具体包括:
86.步骤s51:根据初筛规则自动生成优先处理的队列对应的查询条件,将优先处理的队列中的结构化患者基本信息数据和优先处理的队列对应的查询条件组成最终的查询语句到本地存储库中进行查询,得到优先处理的队列对应的查询结果;优先处理的队列对应的查询结果包括与优先处理的队列中的结构化患者基本信息数据具有相同属性的分配了empi的结构化患者基本信息数据。
87.步骤s52:将优先处理的队列中第i条结构化患者基本信息数据与优先处理的队列对应的查询结果中每条分配了empi的结构化患者基本信息数据分别进行各属性的比对,累加相同属性对应的属性权重,得到第i条结构化患者基本信息数据对应的权重值累加和;i的初始值为1。
88.步骤s53:将第i条结构化患者基本信息数据对应的权重值累加和与疑似权重值和合并权重值进行比对;当第i条结构化患者基本信息数据对应的权重值累加和小于疑似权重值时,为第i条结构化患者基本信息数据创建新的empi,更新本地存储库;当第i条结构化
患者基本信息数据对应的权重值累加和大于疑似权重值且小于合并权重值时,在第i条结构化患者基本信息数据与已有的empi之间构建疑似关系,并为第i条结构化患者基本信息数据创建新的empi,更新本地存储库;当第i条结构化患者基本信息数据对应的权重值累加和大于合并权重值时,复用已有的empi,将第i条结构化患者基本信息数据与已经分配了empi的结构化患者基本信息数据进行融合,更新本地存储库。
89.步骤s54:判断i是否达到优先处理的队列中结构化患者基本信息数据条数的最大值;若否,则令i=i+1,返回步骤s52;若是,则获取未比对数据集合中结构化患者基本信息数据的总数据量。
90.其中,分配了empi的数据,举例来说,指的是:例如去医院挂号,现在挂号的这条记录是一条新的记录(数据),新的记录是一个单一的记录,它跟其它的数据是无法形成一个合并或疑似的关系的,以前的那些记录都会有一个它自己的empiid,如果新的记录和以前的那些记录比对,发现这两个人有合并关系,那就不用再生成自己的empi就可以用已有的empi,用这个empi把所有的记录都串起来,已经分配了empi的数据可以理解为老数据。
91.步骤s6:判断未比对数据集合中结构化患者基本信息数据的总数据量是否大于预设的一个线程处理的数据量。
92.若否,则执行步骤s7:根据权重初筛规则库和本地存储库,对未比对数据集合中每条结构化患者基本信息数据进行各属性的比对,基于比对结果得到未比对数据集合中每条结构化患者基本信息数据的empi,更新本地存储库。
93.该步骤s7具体包括:
94.步骤s71:根据初筛规则自动生成未比对数据集合对应的查询条件,将未比对数据集合中的结构化患者基本信息数据和未比对数据集合对应的查询条件组成最终的查询语句到本地存储库中进行查询,得到未比对数据集合对应的查询结果;未比对数据集合对应的查询结果包括与未比对数据集合中的结构化患者基本信息数据具有相同属性的分配了empi的结构化患者基本信息数据。
95.步骤s72:将未比对数据集合中第j条结构化患者基本信息数据与未比对数据集合对应的查询结果中每条分配了empi的结构化患者基本信息数据分别进行各属性的比对,累加相同属性对应的属性权重,得到第j条结构化患者基本信息数据对应的权重值累加和;j的初始值为1。
96.步骤s73:将第j条结构化患者基本信息数据对应的权重值累加和与疑似权重值和合并权重值进行比对;当第j条结构化患者基本信息数据对应的权重值累加和小于疑似权重值时,为第j条结构化患者基本信息数据创建新的empi,更新本地存储库;当第j条结构化患者基本信息数据对应的权重值累加和大于疑似权重值且小于合并权重值时,在第j条结构化患者基本信息数据与已有的empi之间构建疑似关系,并为第j条结构化患者基本信息数据创建新的empi,更新本地存储库;当第j条结构化患者基本信息数据对应的权重值累加和大于合并权重值时,复用已有的empi,将第j条结构化患者基本信息数据与已经分配了empi的结构化患者基本信息数据进行融合,更新本地存储库。
97.步骤s74:判断j是否达到未比对数据集合中结构化患者基本信息数据条数的最大值;若否,则令j=j+1,返回步骤s72;若是,则得到更新后的本地存储库。
98.若是,则执行步骤s8:采用fork-join技术分而治之,将未比对数据集合拆分成多
个子集合,针对每个子集合,根据权重初筛规则库和本地存储库,对子集合中每条结构化患者基本信息数据进行各属性的比对,基于比对结果得到未比对数据集合中每条结构化患者基本信息数据的empi,更新本地存储库。
99.该步骤s8具体包括:
100.步骤s81:将未比对数据集合中结构化患者基本信息数据的总数据量除2,分成两个集合分别采用fork-join技术分而治之,由fork-join将两个集合分别拆分成多个无法再继续拆分的子集合。
101.步骤s82:针对每个子集合,根据初筛规则自动生成子集合对应的查询条件,将子集合中的结构化患者基本信息数据和子集合对应的查询条件组成最终的查询语句到本地存储库中进行查询,得到子集合对应的查询结果;子集合对应的查询结果包括与子集合中的结构化患者基本信息数据具有相同属性的分配了empi的结构化患者基本信息数据。
102.步骤s83:将子集合中第m条结构化患者基本信息数据与子集合对应的查询结果中每条分配了empi的结构化患者基本信息数据分别进行各属性的比对,累加相同属性对应的属性权重,得到第m条结构化患者基本信息数据对应的权重值累加和;m的初始值为1。
103.步骤s84:将第m条结构化患者基本信息数据对应的权重值累加和与疑似权重值和合并权重值进行比对;当第m条结构化患者基本信息数据对应的权重值累加和小于疑似权重值时,为第m条结构化患者基本信息数据创建新的empi,更新本地存储库;当第m条结构化患者基本信息数据对应的权重值累加和大于疑似权重值且小于合并权重值时,在第m条结构化患者基本信息数据与已有的empi之间构建疑似关系,并为第m条结构化患者基本信息数据创建新的empi,更新本地存储库;当第m条结构化患者基本信息数据对应的权重值累加和大于合并权重值时,复用已有的empi,将第m条结构化患者基本信息数据与已经分配了empi的结构化患者基本信息数据进行融合,更新本地存储库。
104.步骤s85:判断m是否达到子集合中结构化患者基本信息数据条数的最大值;若否,则令m=m+1,返回步骤s83;若是,则得到更新后的本地存储库。
105.下面以一个具体实施例说明本发明的技术方案:
106.本发明empi患者信息比对方法为一种分而治之实现empi患者信息快速比对的方法,其流程如图2所示,该方法依据数据映射规则和国家标准、卫生行业标准针对医院数据进行抽取和标准化,得到统一的结构化患者基本信息,针对患者数据进行患者属性的快速比对,针对比对结果进行相似度计算,根据相似度实现同一病人多业务id的关联和患者信息的统一或关联,并提供了一种自定义的数据融合规则和数据初筛规则。
107.本发明分而治之实现empi患者信息快速比对的方法包括以下步骤:
108.步骤1:创建统一的结构化数据模型(结构化数据通用模型),将多源异构的患者数据进行模型转换得到结构化数据(结构化患者基本信息数据)。
109.该步骤1之前还包括:
110.采集医院系统数据并建立本地原始存储库;医院系统数据为医院的各个独立的临床系统数据;医院系统数据包括多源异构的患者数据。
111.基于本地原始存储库获取患者基本信息数据,并根据患者基本信息数据建立empi患者主索引。
112.基于本地原始存储库和empi患者主索引创建统一的结构化数据通用模型。
113.其中,建立empi患者主索引的步骤包括:验证患者基本信息数据。对验证通过的患者进行统一编号并生成empi患者主索引。
114.患者基本信息数据包括患者的id号、身份证号、护照号、驾驶证号、住院号、门诊号、姓名、性别、出生年月、家庭地址、手机号、门诊数据和住院数据。
115.步骤2:在权重初筛规则库中自定义属性权重(属性所占的相似度值)、初筛规则(根据疑似权重值设置的属性组合)、疑似权重值(达到疑似关系的最小数值)和合并权重值(达到合并关系的最小数值)。
116.步骤3:将结构化数据按照国家标准、卫生行业标准进行清洗(数据清洗),得到统一的标准化的数据(结构化患者基本信息数据)并标记为未比对。
117.其中,数据清洗包括字段清洗、正则表达式清洗和复杂逻辑清洗。
118.步骤4:循环到统一的标准化后的数据中取未比对的数据,每次最多取出2000条。
119.步骤5:从取到的第二条数据开始循环与前面的每一条数据进行比对,分别比对患者属性是否相同,如果相同,则将属性权重值(属性权重)进行累加,得到总相似度(权重值累加和)。
120.步骤6:如果权重值累加和大于设置的疑似权重值,则将当前的患者放到优先处理的队列中,并将当前患者从取到的未比对的患者集合中剔除,将集合长度减一。
121.步骤7:循环优先处理的消息队列,根据初筛规则自动生成查询条件。
122.步骤8:将循环中的患者信息和查询条件组成最终的查询语句到已经分配了empi的数据中进行查询,将当前数据依次与查询结果的数据进行比对。
123.步骤9:分别比对患者属性是否相同,如果相同,则将属性权重值进行累加,得到总相似度。
124.步骤10:将配置的疑似权重值和合并权重值与相似度进行比对。如果相似度小于疑似权重值,则创建新的empi;如果相似度大于疑似权重值、小于合并权重值,在患者信息与已有的empi之间构建疑似关系,并为患者信息创建新的empi;如果相似度大于合并权重值,则复用已有的empi,将患者信息进行融合。
125.步骤11:判断剩余未比对的数据量是否大于设置的一个线程处理的数据量,如果小于一个线程处理的数据量,则循环未比对的数据量,根据当前患者信息数据,以及初筛组合规则组织到数据库查询相同或相似数据的初筛条件;将依据初筛条件筛选出的患者,一一与当前患者信息比对,执行步骤8~步骤10。
126.步骤12:如果大于一个线程处理的数据量,则将总数据量除2,分成两个集合进行分别采用fork-join技术分而治之。由fork-join将两个大任务(集合)分别拆分成若干个不能继续拆分的小任务(子集合),对小任务执行步骤9,等一个个小任务执行结束,将结果汇总。
127.其中,不能继续拆分指的是因进程限制、cpu核数限制等导致不能继续拆分。
128.步骤13:执行步骤8~步骤12,如果没有需要比对的数据,线程进入睡眠状态,等待下一次开启。
129.本发明empi患者信息比对方法,针对医院的情况自定义属性权重值和初筛规则,可以大大提高医院的数据匹配准确性和更加适应多源数据的情况;此外,针对不确定是否需求融合的empi,提供了人工审查机制,大大提高了数据比较的完整性,大大缩小了漏网数
据。
130.实施例二
131.为了执行实施例一对应的方法,以实现相应的功能和技术效果,本发明还提供了一种empi患者信息比对系统,该系统包括如下模块:
132.权重初筛规则库获取模块,用于获取权重初筛规则库;权重初筛规则库用于维护属性权重、初筛规则、合并权重值和疑似权重值;属性权重为属性所占的相似度值;初筛规则为根据疑似权重值设置的属性组合;合并权重值为达到合并关系的最小数值;疑似权重值为达到疑似关系的最小数值。
133.结构化患者基本信息数据获取模块,用于获取第k条结构化患者基本信息数据,将第k条结构化患者基本信息数据放入未比对数据集合中;结构化患者基本信息数据包括多个属性;k的初始值为2;初始的未比对数据集合是一个只包括第1条结构化患者基本信息数据的未必对数据集合。
134.结构化患者基本信息数据属性比对模块,用于根据权重初筛规则库,将第k条结构化患者基本信息数据与未比对数据集合中除第k条结构化患者基本信息数据外每条结构化患者基本信息数据分别进行各属性的比对,累加相同属性对应的属性权重,得到第k条结构化患者基本信息数据对应的权重值累加和,当第k条结构化患者基本信息数据对应的权重值累加和大于疑似权重值时,将第k条结构化患者基本信息数据从未比对数据集合中取出,放到优先处理的队列中。
135.判断模块,用于判断k是否达到最大值h;若否,则令k=k+1,返回结构化患者基本信息数据获取模块;若是,则获取优先处理的队列和未比对数据集合。
136.优先处理的队列中属性比对模块,用于根据权重初筛规则库和本地存储库,对优先处理的队列中每条结构化患者基本信息数据进行各属性的比对,基于比对结果得到优先处理的队列中每条结构化患者基本信息数据的empi,更新本地存储库;本地存储库包括已经分配了empi的多条结构化患者基本信息数据。
137.该优先处理的队列中属性比对模块具体包括:
138.本地存储库第一查询单元,用于根据初筛规则自动生成优先处理的队列对应的查询条件,将优先处理的队列中的结构化患者基本信息数据和优先处理的队列对应的查询条件组成最终的查询语句到本地存储库中进行查询,得到优先处理的队列对应的查询结果;优先处理的队列对应的查询结果包括与优先处理的队列中的结构化患者基本信息数据具有相同属性的分配了empi的结构化患者基本信息数据。
139.优先处理的队列中属性比对单元,用于将优先处理的队列中第i条结构化患者基本信息数据与优先处理的队列对应的查询结果中每条分配了empi的结构化患者基本信息数据分别进行各属性的比对,累加相同属性对应的属性权重,得到第i条结构化患者基本信息数据对应的权重值累加和;i的初始值为1。
140.第一权重值比对单元,用于将第i条结构化患者基本信息数据对应的权重值累加和与疑似权重值和合并权重值进行比对;当第i条结构化患者基本信息数据对应的权重值累加和小于疑似权重值时,为第i条结构化患者基本信息数据创建新的empi,更新本地存储库;当第i条结构化患者基本信息数据对应的权重值累加和大于疑似权重值且小于合并权重值时,在第i条结构化患者基本信息数据与已有的empi之间构建疑似关系,并为第i条结
构化患者基本信息数据创建新的empi,更新本地存储库;当第i条结构化患者基本信息数据对应的权重值累加和大于合并权重值时,复用已有的empi,将第i条结构化患者基本信息数据与已经分配了empi的结构化患者基本信息数据进行融合,更新本地存储库。
141.第一判断单元,用于判断i是否达到优先处理的队列中结构化患者基本信息数据条数的最大值;若否,则令i=i+1,返回优先处理的队列中属性比对单元;若是,则获取未比对数据集合中结构化患者基本信息数据的总数据量。
142.未比对数据集合总数据量判断模块,用于判断未比对数据集合中结构化患者基本信息数据的总数据量是否大于预设的一个线程处理的数据量。
143.未比对数据集合中属性比对模块,用于当未比对数据集合总数据量判断模块的输出结果为否时,根据权重初筛规则库和本地存储库,对未比对数据集合中每条结构化患者基本信息数据进行各属性的比对,基于比对结果得到未比对数据集合中每条结构化患者基本信息数据的empi,更新本地存储库。
144.该未比对数据集合中属性比对模块具体包括:
145.本地存储库第二查询单元,用于根据初筛规则自动生成未比对数据集合对应的查询条件,将未比对数据集合中的结构化患者基本信息数据和未比对数据集合对应的查询条件组成最终的查询语句到本地存储库中进行查询,得到未比对数据集合对应的查询结果;未比对数据集合对应的查询结果包括与未比对数据集合中的结构化患者基本信息数据具有相同属性的分配了empi的结构化患者基本信息数据。
146.未比对数据集合中属性比对单元,用于将未比对数据集合中第j条结构化患者基本信息数据与未比对数据集合对应的查询结果中每条分配了empi的结构化患者基本信息数据分别进行各属性的比对,累加相同属性对应的属性权重,得到第j条结构化患者基本信息数据对应的权重值累加和;j的初始值为1。
147.第二权重值比对单元,将第j条结构化患者基本信息数据对应的权重值累加和与疑似权重值和合并权重值进行比对;当第j条结构化患者基本信息数据对应的权重值累加和小于疑似权重值时,为第j条结构化患者基本信息数据创建新的empi,更新本地存储库;当第j条结构化患者基本信息数据对应的权重值累加和大于疑似权重值且小于合并权重值时,在第j条结构化患者基本信息数据与已有的empi之间构建疑似关系,并为第j条结构化患者基本信息数据创建新的empi,更新本地存储库;当第j条结构化患者基本信息数据对应的权重值累加和大于合并权重值时,复用已有的empi,将第j条结构化患者基本信息数据与已经分配了empi的结构化患者基本信息数据进行融合,更新本地存储库。
148.第二判断单元,用于判断j是否达到未比对数据集合中结构化患者基本信息数据条数的最大值;若否,则令j=j+1,返回未比对数据集合中属性比对单元;若是,则得到更新后的本地存储库。
149.分而治之模块,用于当未比对数据集合总数据量判断模块的输出结果为是时,采用fork-join技术分而治之,将未比对数据集合拆分成多个子集合,针对每个子集合,根据权重初筛规则库和本地存储库,对子集合中每条结构化患者基本信息数据进行各属性的比对,基于比对结果得到未比对数据集合中每条结构化患者基本信息数据的empi,更新本地存储库。
150.该分而治之模块具体包括:
151.未比对数据集合拆分单元,用于将未比对数据集合中结构化患者基本信息数据的总数据量除2,分成两个集合分别采用fork-join技术分而治之,由fork-join将两个集合分别拆分成多个无法再继续拆分的子集合。
152.本地存储库第三查询单元,用于针对每个子集合,根据初筛规则自动生成子集合对应的查询条件,将子集合中的结构化患者基本信息数据和子集合对应的查询条件组成最终的查询语句到本地存储库中进行查询,得到子集合对应的查询结果;子集合对应的查询结果包括与子集合中的结构化患者基本信息数据具有相同属性的分配了empi的结构化患者基本信息数据。
153.未比对数据集合中属性比对单元,用于将子集合中第m条结构化患者基本信息数据与子集合对应的查询结果中每条分配了empi的结构化患者基本信息数据分别进行各属性的比对,累加相同属性对应的属性权重,得到第m条结构化患者基本信息数据对应的权重值累加和;m的初始值为1。
154.第三权重值比对单元,用于将第m条结构化患者基本信息数据对应的权重值累加和与疑似权重值和合并权重值进行比对;当第m条结构化患者基本信息数据对应的权重值累加和小于疑似权重值时,为第m条结构化患者基本信息数据创建新的empi,更新本地存储库;当第m条结构化患者基本信息数据对应的权重值累加和大于疑似权重值且小于合并权重值时,在第m条结构化患者基本信息数据与已有的empi之间构建疑似关系,并为第m条结构化患者基本信息数据创建新的empi,更新本地存储库;当第m条结构化患者基本信息数据对应的权重值累加和大于合并权重值时,复用已有的empi,将第m条结构化患者基本信息数据与已经分配了empi的结构化患者基本信息数据进行融合,更新本地存储库。
155.第三判断单元,用于判断m是否达到子集合中结构化患者基本信息数据条数的最大值;若否,则令m=m+1,返回未比对数据集合中属性比对单元;若是,则得到更新后的本地存储库。
156.本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
157.本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

技术特征:
1.一种empi患者信息比对方法,其特征在于,所述方法包括:步骤s1:获取权重初筛规则库;所述权重初筛规则库用于维护属性权重、初筛规则、合并权重值和疑似权重值;所述属性权重为属性所占的相似度值;所述初筛规则为根据疑似权重值设置的属性组合;所述合并权重值为达到合并关系的最小数值;所述疑似权重值为达到疑似关系的最小数值;步骤s2:获取第k条结构化患者基本信息数据,将第k条结构化患者基本信息数据放入未比对数据集合中;所述结构化患者基本信息数据包括多个属性;k的初始值为2;初始的未比对数据集合是一个只包括第1条结构化患者基本信息数据的未必对数据集合;步骤s3:根据所述权重初筛规则库,将第k条结构化患者基本信息数据与所述未比对数据集合中除第k条结构化患者基本信息数据外每条结构化患者基本信息数据分别进行各属性的比对,累加相同属性对应的属性权重,得到第k条结构化患者基本信息数据对应的权重值累加和,当第k条结构化患者基本信息数据对应的权重值累加和大于所述疑似权重值时,将第k条结构化患者基本信息数据从所述未比对数据集合中取出,放到优先处理的队列中;步骤s4:判断k是否达到最大值h;若否,则令k=k+1,返回步骤s2;若是,则获取所述优先处理的队列和所述未比对数据集合;步骤s5:根据所述权重初筛规则库和本地存储库,对所述优先处理的队列中每条结构化患者基本信息数据进行各属性的比对,基于比对结果得到所述优先处理的队列中每条结构化患者基本信息数据的empi,更新所述本地存储库;所述本地存储库包括已经分配了empi的多条结构化患者基本信息数据;步骤s6:判断所述未比对数据集合中结构化患者基本信息数据的总数据量是否大于预设的一个线程处理的数据量;若否,则执行步骤s7:根据所述权重初筛规则库和所述本地存储库,对所述未比对数据集合中每条结构化患者基本信息数据进行各属性的比对,基于比对结果得到所述未比对数据集合中每条结构化患者基本信息数据的empi,更新所述本地存储库;若是,则执行步骤s8:采用fork-join技术分而治之,将所述未比对数据集合拆分成多个子集合,针对每个所述子集合,根据所述权重初筛规则库和所述本地存储库,对所述子集合中每条结构化患者基本信息数据进行各属性的比对,基于比对结果得到所述未比对数据集合中每条结构化患者基本信息数据的empi,更新所述本地存储库。2.根据权利要求1所述的empi患者信息比对方法,其特征在于,根据所述权重初筛规则库和本地存储库,对所述优先处理的队列中每条结构化患者基本信息数据进行各属性的比对,基于比对结果得到所述优先处理的队列中每条结构化患者基本信息数据的empi,更新所述本地存储库,具体包括:步骤s51:根据所述初筛规则自动生成所述优先处理的队列对应的查询条件,将所述优先处理的队列中的结构化患者基本信息数据和所述优先处理的队列对应的查询条件组成最终的查询语句到本地存储库中进行查询,得到所述优先处理的队列对应的查询结果;所述优先处理的队列对应的查询结果包括与所述优先处理的队列中的结构化患者基本信息数据具有相同属性的分配了empi的结构化患者基本信息数据;步骤s52:将所述优先处理的队列中第i条结构化患者基本信息数据与所述优先处理的队列对应的查询结果中每条分配了empi的结构化患者基本信息数据分别进行各属性的比
对,累加相同属性对应的属性权重,得到第i条结构化患者基本信息数据对应的权重值累加和;i的初始值为1;步骤s53:将第i条结构化患者基本信息数据对应的权重值累加和与所述疑似权重值和所述合并权重值进行比对;当第i条结构化患者基本信息数据对应的权重值累加和小于所述疑似权重值时,为第i条结构化患者基本信息数据创建新的empi,更新所述本地存储库;当第i条结构化患者基本信息数据对应的权重值累加和大于所述疑似权重值且小于所述合并权重值时,在第i条结构化患者基本信息数据与已有的empi之间构建疑似关系,并为第i条结构化患者基本信息数据创建新的empi,更新所述本地存储库;当第i条结构化患者基本信息数据对应的权重值累加和大于所述合并权重值时,复用已有的empi,将第i条结构化患者基本信息数据与已经分配了empi的结构化患者基本信息数据进行融合,更新所述本地存储库;步骤s54:判断i是否达到所述优先处理的队列中结构化患者基本信息数据条数的最大值;若否,则令i=i+1,返回步骤s52;若是,则获取所述未比对数据集合中结构化患者基本信息数据的总数据量。3.根据权利要求1所述的empi患者信息比对方法,其特征在于,根据所述权重初筛规则库和所述本地存储库,对所述未比对数据集合中每条结构化患者基本信息数据进行各属性的比对,基于比对结果得到所述未比对数据集合中每条结构化患者基本信息数据的empi,更新所述本地存储库,具体包括:步骤s71:根据所述初筛规则自动生成所述未比对数据集合对应的查询条件,将所述未比对数据集合中的结构化患者基本信息数据和所述未比对数据集合对应的查询条件组成最终的查询语句到所述本地存储库中进行查询,得到所述未比对数据集合对应的查询结果;所述未比对数据集合对应的查询结果包括与所述未比对数据集合中的结构化患者基本信息数据具有相同属性的分配了empi的结构化患者基本信息数据;步骤s72:将所述未比对数据集合中第j条结构化患者基本信息数据与所述未比对数据集合对应的查询结果中每条分配了empi的结构化患者基本信息数据分别进行各属性的比对,累加相同属性对应的属性权重,得到第j条结构化患者基本信息数据对应的权重值累加和;j的初始值为1;步骤s73:将第j条结构化患者基本信息数据对应的权重值累加和与所述疑似权重值和所述合并权重值进行比对;当第j条结构化患者基本信息数据对应的权重值累加和小于所述疑似权重值时,为第j条结构化患者基本信息数据创建新的empi,更新所述本地存储库;当第j条结构化患者基本信息数据对应的权重值累加和大于所述疑似权重值且小于所述合并权重值时,在第j条结构化患者基本信息数据与已有的empi之间构建疑似关系,并为第j条结构化患者基本信息数据创建新的empi,更新所述本地存储库;当第j条结构化患者基本信息数据对应的权重值累加和大于所述合并权重值时,复用已有的empi,将第j条结构化患者基本信息数据与已经分配了empi的结构化患者基本信息数据进行融合,更新所述本地存储库;步骤s74:判断j是否达到所述未比对数据集合中结构化患者基本信息数据条数的最大值;若否,则令j=j+1,返回步骤s72;若是,则得到更新后的所述本地存储库。4.根据权利要求1所述的empi患者信息比对方法,其特征在于,采用fork-join技术分
而治之,将所述未比对数据集合拆分成多个子集合,针对每个所述子集合,根据所述权重初筛规则库和所述本地存储库,对所述子集合中每条结构化患者基本信息数据进行各属性的比对,基于比对结果得到所述未比对数据集合中每条结构化患者基本信息数据的empi,更新所述本地存储库,具体包括:步骤s81:将所述未比对数据集合中结构化患者基本信息数据的总数据量除2,分成两个集合分别采用fork-join技术分而治之,由fork-join将两个集合分别拆分成多个无法再继续拆分的子集合;步骤s82:针对每个所述子集合,根据所述初筛规则自动生成所述子集合对应的查询条件,将所述子集合中的结构化患者基本信息数据和所述子集合对应的查询条件组成最终的查询语句到所述本地存储库中进行查询,得到所述子集合对应的查询结果;所述子集合对应的查询结果包括与所述子集合中的结构化患者基本信息数据具有相同属性的分配了empi的结构化患者基本信息数据;步骤s83:将所述子集合中第m条结构化患者基本信息数据与所述子集合对应的查询结果中每条分配了empi的结构化患者基本信息数据分别进行各属性的比对,累加相同属性对应的属性权重,得到第m条结构化患者基本信息数据对应的权重值累加和;m的初始值为1;步骤s84:将第m条结构化患者基本信息数据对应的权重值累加和与所述疑似权重值和所述合并权重值进行比对;当第m条结构化患者基本信息数据对应的权重值累加和小于所述疑似权重值时,为第m条结构化患者基本信息数据创建新的empi,更新所述本地存储库;当第m条结构化患者基本信息数据对应的权重值累加和大于所述疑似权重值且小于所述合并权重值时,在第m条结构化患者基本信息数据与已有的empi之间构建疑似关系,并为第m条结构化患者基本信息数据创建新的empi,更新所述本地存储库;当第m条结构化患者基本信息数据对应的权重值累加和大于所述合并权重值时,复用已有的empi,将第m条结构化患者基本信息数据与已经分配了empi的结构化患者基本信息数据进行融合,更新所述本地存储库;步骤s85:判断m是否达到所述子集合中结构化患者基本信息数据条数的最大值;若否,则令m=m+1,返回步骤s83;若是,则得到更新后的所述本地存储库。5.根据权利要求1所述的empi患者信息比对方法,其特征在于,所述获取第k条结构化患者基本信息数据,将第k条结构化患者基本信息数据放入未比对数据集合中,之前还包括:获取多源异构的患者数据;创建统一的结构化数据通用模型;基于所述结构化数据通用模型对多源异构的患者数据进行模型转换,得到结构化患者基本信息数据。6.根据权利要求5所述的empi患者信息比对方法,其特征在于,基于所述结构化数据通用模型对多源异构的患者数据进行模型转换,得到结构化患者基本信息数据,之后还包括:将所述结构化患者基本信息数据按照预设标准进行数据清洗,得到统一的标准化的结构化患者基本信息数据并标记为未比对。7.一种empi患者信息比对系统,其特征在于,所述系统包括:权重初筛规则库获取模块,用于获取权重初筛规则库;所述权重初筛规则库用于维护
属性权重、初筛规则、合并权重值和疑似权重值;所述属性权重为属性所占的相似度值;所述初筛规则为根据疑似权重值设置的属性组合;所述合并权重值为达到合并关系的最小数值;所述疑似权重值为达到疑似关系的最小数值;结构化患者基本信息数据获取模块,用于获取第k条结构化患者基本信息数据,将第k条结构化患者基本信息数据放入未比对数据集合中;所述结构化患者基本信息数据包括多个属性;k的初始值为2;初始的未比对数据集合是一个只包括第1条结构化患者基本信息数据的未必对数据集合;结构化患者基本信息数据属性比对模块,用于根据所述权重初筛规则库,将第k条结构化患者基本信息数据与所述未比对数据集合中除第k条结构化患者基本信息数据外每条结构化患者基本信息数据分别进行各属性的比对,累加相同属性对应的属性权重,得到第k条结构化患者基本信息数据对应的权重值累加和,当第k条结构化患者基本信息数据对应的权重值累加和大于所述疑似权重值时,将第k条结构化患者基本信息数据从所述未比对数据集合中取出,放到优先处理的队列中;判断模块,用于判断k是否达到最大值h;若否,则令k=k+1,返回所述结构化患者基本信息数据获取模块;若是,则获取所述优先处理的队列和所述未比对数据集合;优先处理的队列中属性比对模块,用于根据所述权重初筛规则库和本地存储库,对所述优先处理的队列中每条结构化患者基本信息数据进行各属性的比对,基于比对结果得到所述优先处理的队列中每条结构化患者基本信息数据的empi,更新所述本地存储库;所述本地存储库包括已经分配了empi的多条结构化患者基本信息数据;未比对数据集合总数据量判断模块,用于判断所述未比对数据集合中结构化患者基本信息数据的总数据量是否大于预设的一个线程处理的数据量;未比对数据集合中属性比对模块,用于当所述未比对数据集合总数据量判断模块的输出结果为否时,根据所述权重初筛规则库和所述本地存储库,对所述未比对数据集合中每条结构化患者基本信息数据进行各属性的比对,基于比对结果得到所述未比对数据集合中每条结构化患者基本信息数据的empi,更新所述本地存储库;分而治之模块,用于当所述未比对数据集合总数据量判断模块的输出结果为是时,采用fork-join技术分而治之,将所述未比对数据集合拆分成多个子集合,针对每个所述子集合,根据所述权重初筛规则库和所述本地存储库,对所述子集合中每条结构化患者基本信息数据进行各属性的比对,基于比对结果得到所述未比对数据集合中每条结构化患者基本信息数据的empi,更新所述本地存储库。8.根据权利要求7所述的empi患者信息比对系统,其特征在于,所述优先处理的队列中属性比对模块具体包括:本地存储库第一查询单元,用于根据所述初筛规则自动生成所述优先处理的队列对应的查询条件,将所述优先处理的队列中的结构化患者基本信息数据和所述优先处理的队列对应的查询条件组成最终的查询语句到本地存储库中进行查询,得到所述优先处理的队列对应的查询结果;所述优先处理的队列对应的查询结果包括与所述优先处理的队列中的结构化患者基本信息数据具有相同属性的分配了empi的结构化患者基本信息数据;优先处理的队列中属性比对单元,用于将所述优先处理的队列中第i条结构化患者基本信息数据与所述优先处理的队列对应的查询结果中每条分配了empi的结构化患者基本
信息数据分别进行各属性的比对,累加相同属性对应的属性权重,得到第i条结构化患者基本信息数据对应的权重值累加和;i的初始值为1;第一权重值比对单元,用于将第i条结构化患者基本信息数据对应的权重值累加和与所述疑似权重值和所述合并权重值进行比对;当第i条结构化患者基本信息数据对应的权重值累加和小于所述疑似权重值时,为第i条结构化患者基本信息数据创建新的empi,更新所述本地存储库;当第i条结构化患者基本信息数据对应的权重值累加和大于所述疑似权重值且小于所述合并权重值时,在第i条结构化患者基本信息数据与已有的empi之间构建疑似关系,并为第i条结构化患者基本信息数据创建新的empi,更新所述本地存储库;当第i条结构化患者基本信息数据对应的权重值累加和大于所述合并权重值时,复用已有的empi,将第i条结构化患者基本信息数据与已经分配了empi的结构化患者基本信息数据进行融合,更新所述本地存储库;第一判断单元,用于判断i是否达到所述优先处理的队列中结构化患者基本信息数据条数的最大值;若否,则令i=i+1,返回所述优先处理的队列中属性比对单元;若是,则获取所述未比对数据集合中结构化患者基本信息数据的总数据量。9.根据权利要求7所述的empi患者信息比对系统,其特征在于,所述未比对数据集合中属性比对模块具体包括:本地存储库第二查询单元,用于根据所述初筛规则自动生成所述未比对数据集合对应的查询条件,将所述未比对数据集合中的结构化患者基本信息数据和所述未比对数据集合对应的查询条件组成最终的查询语句到所述本地存储库中进行查询,得到所述未比对数据集合对应的查询结果;所述未比对数据集合对应的查询结果包括与所述未比对数据集合中的结构化患者基本信息数据具有相同属性的分配了empi的结构化患者基本信息数据;未比对数据集合中属性比对单元,用于将所述未比对数据集合中第j条结构化患者基本信息数据与所述未比对数据集合对应的查询结果中每条分配了empi的结构化患者基本信息数据分别进行各属性的比对,累加相同属性对应的属性权重,得到第j条结构化患者基本信息数据对应的权重值累加和;j的初始值为1;第二权重值比对单元,将第j条结构化患者基本信息数据对应的权重值累加和与所述疑似权重值和所述合并权重值进行比对;当第j条结构化患者基本信息数据对应的权重值累加和小于所述疑似权重值时,为第j条结构化患者基本信息数据创建新的empi,更新所述本地存储库;当第j条结构化患者基本信息数据对应的权重值累加和大于所述疑似权重值且小于所述合并权重值时,在第j条结构化患者基本信息数据与已有的empi之间构建疑似关系,并为第j条结构化患者基本信息数据创建新的empi,更新所述本地存储库;当第j条结构化患者基本信息数据对应的权重值累加和大于所述合并权重值时,复用已有的empi,将第j条结构化患者基本信息数据与已经分配了empi的结构化患者基本信息数据进行融合,更新所述本地存储库;第二判断单元,用于判断j是否达到所述未比对数据集合中结构化患者基本信息数据条数的最大值;若否,则令j=j+1,返回所述未比对数据集合中属性比对单元;若是,则得到更新后的所述本地存储库。10.根据权利要求7所述的empi患者信息比对系统,其特征在于,所述分而治之模块具体包括:
未比对数据集合拆分单元,用于将所述未比对数据集合中结构化患者基本信息数据的总数据量除2,分成两个集合分别采用fork-join技术分而治之,由fork-join将两个集合分别拆分成多个无法再继续拆分的子集合;本地存储库第三查询单元,用于针对每个所述子集合,根据所述初筛规则自动生成所述子集合对应的查询条件,将所述子集合中的结构化患者基本信息数据和所述子集合对应的查询条件组成最终的查询语句到所述本地存储库中进行查询,得到所述子集合对应的查询结果;所述子集合对应的查询结果包括与所述子集合中的结构化患者基本信息数据具有相同属性的分配了empi的结构化患者基本信息数据;未比对数据集合中属性比对单元,用于将所述子集合中第m条结构化患者基本信息数据与所述子集合对应的查询结果中每条分配了empi的结构化患者基本信息数据分别进行各属性的比对,累加相同属性对应的属性权重,得到第m条结构化患者基本信息数据对应的权重值累加和;m的初始值为1;第三权重值比对单元,用于将第m条结构化患者基本信息数据对应的权重值累加和与所述疑似权重值和所述合并权重值进行比对;当第m条结构化患者基本信息数据对应的权重值累加和小于所述疑似权重值时,为第m条结构化患者基本信息数据创建新的empi,更新所述本地存储库;当第m条结构化患者基本信息数据对应的权重值累加和大于所述疑似权重值且小于所述合并权重值时,在第m条结构化患者基本信息数据与已有的empi之间构建疑似关系,并为第m条结构化患者基本信息数据创建新的empi,更新所述本地存储库;当第m条结构化患者基本信息数据对应的权重值累加和大于所述合并权重值时,复用已有的empi,将第m条结构化患者基本信息数据与已经分配了empi的结构化患者基本信息数据进行融合,更新所述本地存储库;第三判断单元,用于判断m是否达到所述子集合中结构化患者基本信息数据条数的最大值;若否,则令m=m+1,返回所述未比对数据集合中属性比对单元;若是,则得到更新后的所述本地存储库。

技术总结
本发明公开一种EMPI患者信息比对方法及系统,涉及医疗信息技术领域,根据权重初筛规则库实现EMPI患者信息比对,权重初筛规则库维护的属性权重、初筛规则、合并权重值和疑似权重值均针对医院自身的情况,针对医院情况的不同获取不同的权重初筛规则库,根据不同的权重初筛规则库进行比对规则调整,实现EMPI患者信息比对;采用Fork-Join技术分而治之,针对患者数据进行患者属性的快速比对,针对比对结果进行相似度计算,根据相似度实现同一病人多业务ID的关联和患者信息的统一或关联。本发明可以提高EMPI比对的效率以及针对医院情况的不同进行比对规则调整。进行比对规则调整。进行比对规则调整。


技术研发人员:赵振淋 张新娄 李芝
受保护的技术使用者:南京海泰医疗信息系统有限公司
技术研发日:2023.06.27
技术公布日:2023/9/13
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐