基于机器学习的DIP下降低医疗服务质量风控预警方法与流程

未命名 09-16 阅读:108 评论:0
基于机器学习的dip下降低医疗服务质量风控预警方法
技术领域
1.本发明涉及医疗检测技术领域,尤其涉及基于机器学习的dip下降低医疗服务质量风控预警方法。


背景技术:

2.drg/dip付费方式下,会带来新的基金安全风险,从国际经验教训及地方试点实践看,此类风险的主要表现是医疗不足、转嫁费用、过度医疗、欺诈骗保四种形式。医疗不足是相对于项目付费下的过度医疗而言的,一般指未按诊疗规范提供必要医疗服务及相应药品耗材等行为。医疗不足可以分为三种情形。其一,降低医疗服务质量,或减少必要的医疗服务、药品耗材、检查检验项目的使用,或降低药品、耗材等必需品质量,可以理解为医疗领域的偷工减料,以至于明显降低医疗服务水平,影响治疗效果。相对于过度医疗行为,减少不必要药品、耗材、检查检验项目,属于合理医疗回归,值得鼓励,也是drg/dip改革的目的。但过犹不及,如果过度减少医疗资源消耗导致医疗不足,则会直接损害患者权益,违背drg/dip改革初衷。上述违规行为,具有合理与不合理之间界限的模糊性。如何判断医疗机构是否医疗不足、需要一套标准规范监测监控并对问题苗头及时干预,尤其是需要创新机制加强引导。
3.现有医疗保障基金智能审核依托监控知识库、规则库(以下简称“两库”)对新医保支付体系下的逐渐显现出来医疗不足行为甄别能力有限,需要大量的人工审核。在支付方式改革2025年之前全面铺开的情况下,会出现如下两个问题:
4.1)大量审核任务与现有人工审核不足相矛盾的局面,
5.2)现有监管系统人工审核大量依赖审核人员的专业知识,存在审核标准不一的问题。
6.因此,为提升“医疗不足—降低医疗服务质量”的智能化审核水平。本方案提出一种基于机器学习的“医疗不足—降低医疗服务质量”风控预警引擎,通过
……
,建立覆盖drg/dip全病种“医疗不足—降低医疗服务质量违规行为”智能化监管体系。
7.综上所述,本发明通过设计基于机器学习的dip下降低医疗服务质量风控预警方法来解决存在的问题。


技术实现要素:

8.为了克服现有医保基金智能审核医疗保障基金智能审核和监控知识库、规则库建设不足,本方案提出一种基于机器学习的dip下降低医疗服务质量风控预警方法,用来识别drg/dip付费后医疗不足违规行为。
9.为实现上述目的,本发明提供如下技术方案:
10.基于机器学习的dip下降低医疗服务质量风控预警方法,其特征在于,包括以下步骤:
11.s1,元数据库建设:明确主数据库中各表、表含义、字段和字段含义,完善业务术语
表作为整个系统数据质量把控的核心工具;
12.s2,参考数据库建设:明确主数据库中各表中字段的约束,包括空值约束、数值约束、关联性约束和唯一性约束;建立业务数据字段映射表,以方便数据在不同系统中流转;维护医疗数据值域表,汇集来自学术期刊、行业协会、政府机构的合规数据及规范,作为医疗数据合理性推断的依据;
13.s3,数据收集:从病历系统、医保系统、医疗记录系统和医疗机构药品进销存系统中分别抽取电子病历、交易流水、交易明细数据、医疗服务使用记录、医疗人员工作记录和医疗机构药品售出记录至oltp系统,等待进行批量预处理,分批提取进入待预处理流程后即行销毁;
14.s4,数据预处理:分批量从oltp系统中提取数据进行预处理,进行数据清洗,检查数据中是否存在缺失值、异常值或错误值,对于这些不规则的数据需要进行清洗;
15.在清洗过程中需要注意保护患者隐私信息;将数据转换成标准的格式、去除不必要的信息以及将数据分组;进行数据标准化,解决数据格式、数据元素、数据分类等问;进行数据集成,进行数据变换和数据归一化,以便于后续的分析和建模,将连续数据离散化、数据规范化、数据压缩;进行数据降维以提高数据处理效率,使用主成分分析等技术对数据进行降维处理;进行数据采样,数据可能存在类别不平衡问题,需要进行数据采样,包括过采样、欠采样,并且按照参考数据库中数据对所提取数据进行校验、纠错、删除和补充等,对存疑数据进行退回;
16.s5,微观时序分析:对病患建立从就诊至出院的全流程数据链,以知识库为支撑,借助计算机视觉和自然语言处理技术交叉验证诊断结果、检查结果、手术操作和出院购药记录,明确费用在医疗服务中各阶段的分布,根据大数据分析评判其合理性;
17.s6,以医疗机构和dip病种为分组依据,对区域内病案结算数据进行分组;在组内进行同一分布的均值检验与方差分析,显著性水平不高于5%,筛选出表示不服从该分布的异常数据;在组间进行不同分布的均值检验与方差分析,显著性水平不高于5%,筛选出表示同一分布的异常分组;
18.s7,基于极限梯度提升树的模型:建立医疗质量评估的极限梯度提升回归模型,特征包含:病案结算表中dip病种分值、实际住院天数和各项费用;医保结算明细中各类医疗服务的数量、价格均值;目标为本地dip病种分值;则所建立模型性能满足回归根均方误差不高于dip病种分值的标准差;以dip分组为基本单位,扫描所允许的各特征值域,并根据往期数据建立单侧95%置信区间;新增病案结算数据若超出该区间则标记为疑似医疗服务质量降低;
19.s8,基于序列模式的模型:建立基于序列模式,即时序购物篮分析的模型,扫描病案结算数据库,根据不同dip病种往期三年数据建立序列模式的不同路径,并按不同路径支持度和总费用的乘积倒排,形成序列模式的最低支持度设置与dip分组最小病例数相同,时间跨度,即长度限制为医保结算清单中项目数量的众数;新增病案结算数据的序列模式若与已建立模型不符、不在因支持度不足未进入模型的往期数据序列中且引起费用显著降低的,可标记为疑似医疗服务质量降低;
20.s9,建立基于关联模式的模型,扫描病案结算数据和医保结算明细数据,挖掘出每个dip病种内的核心收费项目;根据同个dip病种内不同收费项目的分布及共现分布,确定
合理的最小支持度和最小置信度阈值,梳理一批高频出现核心收费项目,结合临床路径,生成不同长度、不同支持度、不同置信度的核心项目;一方面用于对临床诊断的辅助支持,另一方面形成对排除在核心收费项目之外的其他项目另行组成挖掘数据集,可做进一步挖掘并分析排除原因,有利于建立地方基础目录。
21.优选的,所述s5中借助计算机视觉具体为基于自然语言处理的病历-诊断匹配检验模型,其步骤具体如下:
22.建立基于深度学习的图像分类预测模型,基于ac-cnn、fasterr-cnn等sota模型,构建适用于医学影像,如x-ray、mri的神经网络分类模型,从医疗机构标准化影像学检查入手,汇集病患检查影像、检查报告、医保结算流水等表单,对图像进行“结构-病变”标注,强化模型对病变区域和病变类型的拟合,精准分析影像检查与诊断的匹配程度。
23.优选的,所述s5中基于自然语言处理的病历-诊断匹配检验模型为建立基于深度学习的文本分类预测模型,其具体步骤如下:
24.基于bert等大型文本预训练模型,构建适用于中/长文本的神经网络分类模型。将icd9/icd10、门诊常用医学术语、病案小结等已有医疗机构信息化建设成果,投入至预训练模型进行进一步训练。
25.与现有技术相比,本发明的有益效果是:
26.基于机器学习的dip下降低医疗服务质量风控预警方法作为dip监管系统核心引擎之一,将在规范指导全国各地市医保部门在dip监管工作方面发挥重要作用,建立起一道医保基金的防火墙,医疗费用不合理增长将得以有效遏制,医保基金运行效率和抗风险能力得以极大提高,从而达到以下效益,具体为:
27.1)经济效益,提高行政管理效能,降低政府行政成本。dip监管系统建成和投入运行后,将在规范指导全省各地市医保部门在dip监管工作方面发挥重要作用,促进全省各地市医保部门提高监管工作的智能化水平。同时,系统建设将借助深度借助医保大数据的技术能力,全省医保基金非现场监督能力和医疗费用智智能监管能力将得以极大提高。从而有效减轻全省省各地市医保监管部门的人力成本、智力成本投入,降低行政成本,提高办事效率,带来直接的经济效益;
28.并且提高医保治理能力,确保基金运行安全。dip监管系统建成和投入运行后,将极大提高dip付费下的医疗服务智能监控能力。信息化在形成新格局下医疗保障战略购买力、规模化优势及专业化能力方面,将发挥巨大的支撑作用。对于医保基金浪费、欺诈情况将得以有效消解,医疗费用不合理增长将得以有效遏制,医保基金运行效率和抗风险能力得以极大提高,能够更好满足人民群众日益增长的医疗保障需求。
29.2)社会效益,根据电子政务工程建设项目管理规范立项,确保工程建设效能,落实电子政务建设工程规范化、集约化、可持续化的政策要求,进行了广泛而充分的项目分析与论证,以此确保项目建设目标明确、项目建设内容合理、项目建设边界清晰、项目必要性分析与可行性论证充分,能够有效支撑全国推动dip支付方式改革的使命,能够有效支撑达成新时代医疗保障事业发展目标;
30.并且提高基金持续保障能力,增强群众安全感。dip监管系统建成和投入运行后,将有效提高医保基金运行效率和抗风险能力,提高医保基金持续保障能力,助力群众“病有所医、病有良医”,增强群众安全感。通过dip付费的实施,推动实行多元复合式医保支付方
式,实行精细化管理,激发医疗机构规范行为、控制成本、合理收治和转诊患者的内生动力,引导医疗资源合理配置和患者有序就医,切实保障广大参保人员基本医疗权益和医保制度长期可持续发展。
具体实施方式
31.下面将结合本发明实施例中,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
32.本发明提供一种技术方案:一种基于机器学习的dip下降低医疗服务质量风控预警方法,具体为:
33.业务实现路径:
34.1、元数据库建设:明确主数据库中各表、表含义、字段和字段含义,完善业务术语表作为整个系统数据质量把控的核心工具。
35.2、参考数据库建设:明确主数据库中各表中字段的约束,包括空值约束、数值约束、关联性约束和唯一性约束等;建立业务数据字段映射表,以方便数据在不同系统中流转;维护医疗数据值域表,汇集来自学术期刊、行业协会、政府机构的合规数据及规范,作为医疗数据合理性推断的依据。
36.3、数据收集:从病历系统、医保系统、医疗记录系统和医疗机构药品进销存系统中分别抽取电子病历、交易流水、交易明细数据、医疗服务使用记录、医疗人员工作记录和医疗机构药品售出记录等至oltp系统,等待进行批量预处理,分批提取进入待预处理流程后即行销毁。
37.4、数据预处理:分批量从oltp系统中提取数据进行预处理。进行数据清洗,检查数据中是否存在缺失值、异常值或错误值,对于这些不规则的数据需要进行清洗。在清洗过程中需要注意保护患者隐私信息;将数据转换成标准的格式、去除不必要的信息以及将数据分组;进行数据标准化,解决数据格式、数据元素、数据分类等问题;进行数据集成,进行数据变换和数据归一化,以便于后续的分析和建模,将连续数据离散化、数据规范化、数据压缩等;进行数据降维以提高数据处理效率,使用主成分分析等技术对数据进行降维处理;进行数据采样,数据可能存在类别不平衡问题,需要进行数据采样,包括过采样、欠采样等。按照参考数据库中数据对所提取数据进行校验、纠错、删除和补充等,对存疑数据进行退回。
38.5、微观时序分析:对病患建立从就诊至出院的全流程数据链,以知识库为支撑,借助计算机视觉(见8.2)和自然语言处理(见8.1)技术交叉验证诊断结果、检查结果、手术操作和出院购药记录,明确费用在医疗服务中各阶段的分布,根据大数据分析评判其合理性。
39.6、宏观统计分析:以医疗机构和dip病种为分组依据,对区域内病案结算数据进行分组。在组内进行同一分布的均值检验与方差分析,显著性水平不高于5%,筛选出表示不服从该分布的异常数据。在组间进行不同分布的均值检验与方差分析,显著性水平不高于5%,筛选出表示同一分布的异常分组。
40.7、基于机器学习的数据挖掘:
41.7.1基于极限梯度提升树的模型:建立医疗质量评估的极限梯度提升回归模型,特
征包含:病案结算表中dip病种分值、实际住院天数和各项费用;医保结算明细中各类医疗服务的数量、价格均值等。目标为本地dip病种分值。则所建立模型性能满足回归根均方误差不高于dip病种分值的标准差。以dip分组为基本单位,扫描所允许的各特征值域,并根据往期数据建立单侧95%置信区间。新增病案结算数据若超出该区间则标记为疑似医疗服务质量降低。
42.7.2基于序列模式的模型:建立基于序列模式(时序购物篮分析)的模型,扫描病案结算数据库,根据不同dip病种往期三年数据建立序列模式的不同路径,并按不同路径支持度和总费用的乘积倒排,形成序列模式的最低支持度设置与dip分组最小病例数相同,时间跨度(长度)限制为医保结算清单中项目数量的众数。新增病案结算数据的序列模式若与已建立模型不符、不在因支持度不足未进入模型的往期数据序列中且引起费用显著降低的,可标记为疑似医疗服务质量降低。
43.7.3基于关联模式的模型:建立基于关联模式的模型,扫描病案结算数据和医保结算明细数据,挖掘出每个dip病种内的核心收费项目。根据同个dip病种内不同收费项目的分布及共现分布,确定合理的最小支持度和最小置信度阈值,梳理一批高频出现核心收费项目,结合临床路径,生成不同长度、不同支持度、不同置信度的核心项目。一方面用于对临床诊断的辅助支持,另一方面形成对排除在核心收费项目之外的其他项目另行组成挖掘数据集,可做进一步挖掘并分析排除原因,有利于建立地方基础目录。
44.8、基于深度学习的预测挖掘:
45.8.1基于自然语言处理的病历-诊断匹配检验模型:建立基于深度学习的文本分类预测模型,基于bert等大型文本预训练模型,构建适用于中/长文本的神经网络分类模型。将icd9/icd10、门诊常用医学术语、病案小结等已有医疗机构信息化建设成果,投入至预训练模型进行进一步训练,通过不断地学习和更新,预训练模型能够更好地适应于实际数据,提高模型的准确性和鲁棒性,精准分析病历与诊断的匹配程度,降低医疗机构病种高套和诊疗不足的可能性。
46.8.2基于计算机视觉的医学影像-诊断匹配模型:建立基于深度学习的图像分类预测模型,基于ac-cnn、fasterr-cnn等sota模型,构建适用于医学影像(如x-ray、mri等)的神经网络分类模型。从医疗机构标准化影像学检查入手,汇集病患检查影像、检查报告、医保结算流水等表单,对图像进行“结构-病变”标注,强化模型对病变区域和病变类型的拟合,精准分析影像检查与诊断的匹配程度,医生可以更准确地诊断病变类型,从而有效地降低医疗机构病种高套的可能性。此外,该模型可以很容易地集成到医疗机构的信息化系统中,实现自动化的病历诊断匹配检验,减少手工操作的时间和错误率,提高医疗服务的效率和准确性。
47.以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

技术特征:
1.基于机器学习的dip下降低医疗服务质量风控预警方法,其特征在于,包括以下步骤:s1,元数据库建设:明确主数据库中各表、表含义、字段和字段含义,完善业务术语表作为整个系统数据质量把控的核心工具;s2,参考数据库建设:明确主数据库中各表中字段的约束,包括空值约束、数值约束、关联性约束和唯一性约束;建立业务数据字段映射表,以方便数据在不同系统中流转;维护医疗数据值域表,汇集来自学术期刊、行业协会、政府机构的合规数据及规范,作为医疗数据合理性推断的依据;s3,数据收集:从病历系统、医保系统、医疗记录系统和医疗机构药品进销存系统中分别抽取电子病历、交易流水、交易明细数据、医疗服务使用记录、医疗人员工作记录和医疗机构药品售出记录至oltp系统,等待进行批量预处理,分批提取进入待预处理流程后即行销毁;s4,数据预处理:分批量从oltp系统中提取数据进行预处理,进行数据清洗,检查数据中是否存在缺失值、异常值或错误值,对于这些不规则的数据需要进行清洗;在清洗过程中需要注意保护患者隐私信息;将数据转换成标准的格式、去除不必要的信息以及将数据分组;进行数据标准化,解决数据格式、数据元素、数据分类等问;进行数据集成,进行数据变换和数据归一化,以便于后续的分析和建模,将连续数据离散化、数据规范化、数据压缩;进行数据降维以提高数据处理效率,使用主成分分析等技术对数据进行降维处理;进行数据采样,数据可能存在类别不平衡问题,需要进行数据采样,包括过采样、欠采样,并且按照参考数据库中数据对所提取数据进行校验、纠错、删除和补充等,对存疑数据进行退回;s5,微观时序分析:对病患建立从就诊至出院的全流程数据链,以知识库为支撑,借助计算机视觉和自然语言处理技术交叉验证诊断结果、检查结果、手术操作和出院购药记录,明确费用在医疗服务中各阶段的分布,根据大数据分析评判其合理性;s6,以医疗机构和dip病种为分组依据,对区域内病案结算数据进行分组;在组内进行同一分布的均值检验与方差分析,显著性水平不高于5%,筛选出表示不服从该分布的异常数据;在组间进行不同分布的均值检验与方差分析,显著性水平不高于5%,筛选出表示同一分布的异常分组;s7,基于极限梯度提升树的模型:建立医疗质量评估的极限梯度提升回归模型,特征包含:病案结算表中dip病种分值、实际住院天数和各项费用;医保结算明细中各类医疗服务的数量、价格均值;目标为本地dip病种分值;则所建立模型性能满足回归根均方误差不高于dip病种分值的标准差;以dip分组为基本单位,扫描所允许的各特征值域,并根据往期数据建立单侧95%置信区间;新增病案结算数据若超出该区间则标记为疑似医疗服务质量降低;s8,基于序列模式的模型:建立基于序列模式,即时序购物篮分析的模型,扫描病案结算数据库,根据不同dip病种往期三年数据建立序列模式的不同路径,并按不同路径支持度和总费用的乘积倒排,形成序列模式的最低支持度设置与dip分组最小病例数相同,时间跨度,即长度限制为医保结算清单中项目数量的众数;新增病案结算数据的序列模式若与已建立模型不符、不在因支持度不足未进入模型的往期数据序列中且引起费用显著降低的,
可标记为疑似医疗服务质量降低;s9,建立基于关联模式的模型,扫描病案结算数据和医保结算明细数据,挖掘出每个dip病种内的核心收费项目;根据同个dip病种内不同收费项目的分布及共现分布,确定合理的最小支持度和最小置信度阈值,梳理一批高频出现核心收费项目,结合临床路径,生成不同长度、不同支持度、不同置信度的核心项目;一方面用于对临床诊断的辅助支持,另一方面形成对排除在核心收费项目之外的其他项目另行组成挖掘数据集,可做进一步挖掘并分析排除原因,有利于建立地方基础目录。2.根据权利要求1所述的基于机器学习的dip下降低医疗服务质量风控预警方法,其特征在于,所述s5中借助计算机视觉具体为基于自然语言处理的病历-诊断匹配检验模型,其步骤具体如下:建立基于深度学习的图像分类预测模型,基于ac-cnn、fasterr-cnn等sota模型,构建适用于医学影像,如x-ray、mri的神经网络分类模型,从医疗机构标准化影像学检查入手,汇集病患检查影像、检查报告、医保结算流水等表单,对图像进行“结构-病变”标注,强化模型对病变区域和病变类型的拟合,精准分析影像检查与诊断的匹配程度。3.根据权利要求1所述的基于机器学习的dip下降低医疗服务质量风控预警方法,其特征在于,所述s5中基于自然语言处理的病历-诊断匹配检验模型为建立基于深度学习的文本分类预测模型,其具体步骤如下:基于bert等大型文本预训练模型,构建适用于中/长文本的神经网络分类模型。将icd9/icd10、门诊常用医学术语、病案小结等已有医疗机构信息化建设成果,投入至预训练模型进行进一步训练。

技术总结
本发明涉及医疗技术领域,尤其为基于机器学习的DIP下降低医疗服务质量风控预警方法,包括以下步骤:S1,元数据库建设;S2,参考数据库建设;S3,数据收集;S4,数据预处理;S5,微观时序分析;S6,以医疗机构和DIP病种为分组依据;S7,基于极限梯度提升树的模型;S8,基于序列模式的模型以及S9,建立基于关联模式的模型,本发明通过基于机器学习的DIP下降低医疗服务质量风控预警方法作为DIP监管系统核心引擎之一,将在规范指导全国各地市医保部门在DIP监管工作方面发挥重要作用,建立起一道医保基金的防火墙,医疗费用不合理增长将得以有效遏制,医保基金运行效率和抗风险能力得以极大提高。大提高。


技术研发人员:姚健 张正卿 赵万鹏 范少良 林桓桓 车惯红 张能运
受保护的技术使用者:联通(上海)产业互联网有限公司
技术研发日:2023.05.17
技术公布日:2023/9/14
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐