一种真实世界数据政务智能登记方法及登记系统与流程
未命名
10-09
阅读:90
评论:0

1.本发明涉及一种真实世界数据政务智能登记方法及登记系统,属于医疗器械真实世界数据登记与处理的技术领域。
背景技术:
2.对于目前的医疗器械数据采集来看,往往是通过物联网方式进行通讯并完成登记,最终用于进行检测和真实数据登记。实施期间,对于文本数据结构化、数据编码和变量字典的构建仍然存在难点。同时,医疗器械相关不良事件和真实数据多数记录在手术记录、病程记录等文本信息中,而对这些文本数据的高效、准确的提取、识别和转化还没有很好的工具和系统。
3.就现有技术来看,真实数据是指从真实世界各种场景下,自然采集同患者相关的医疗干预手段和健康结局的数据,这些数据是从传统临床试验以外的其它来源获取。这些来源包括:前瞻性观察性研究或注册型研究、回顾性数据库分析、病例报告、健康管理报告、电子健康档案等。
4.近年来,真实数据受到全球医疗卫生和监管决策部门的重视,尤其是药械监管决策的需求推动了真实世界证据的产生和使用。在医疗器械领域,真实数据可用于支持说明书修改、形成外部对照、构建单组目标值、作为补充证据支持产品注册等情形,同时也可以用于上市后安全有效性监测。在观察发生率较低的不良事件或长期安全有效性,真实数据具有显著优势。
5.对于真实数据的处理来看,往往涉及到自然语言。自然语言即人们日常使用的语言,自然语言处理是基于自然语言理解和自然语言生成的信息处理技术,它以语言为对象,可利用计算机技术来分析、理解和处理自然语言。同时,能在计算机的支持下对语言信息进行定量化的研究,并提供可供人与计算机之间能共同使用的语言描写。
6.结合现有技术202011299499 .2来看,其提供了一种物联网医疗器械状态监测系统,其特征在于,包括:医疗器械状态监测管理服务端以及与所述医疗设备状态监测管理服务端进行通讯的医疗器械;医疗器械,用于采集用户的使用状态信息,并发送给医疗器械状态监测管理服务端;医疗器械状态监测管理服务端,用于在接收到使用状态信息后,根据使用状态信息生成医疗器械使用状态虚拟图像,并展示。
7.其虽然提及了应用类似的状态检测管理服务端参与数据收集。但是其仅仅是用于单一的数据收集,并没有对数据进行整理,也无法通过自然语言的相关方法来进行解析。
8.目前针对医疗器械真实世界数据的应用越来越普及,其主要在于单一性医疗器械的跟踪数据等相关信息采集,信息应用环境相对封闭,同时其存在数据偏倚和混杂,很难实现数据清洗,尤其是其相对参照样例或缺的情况下,很难通过分层、多变量回归、倾向性分析等方法进行统计处理,使得真实数据统计分析结果存在风险性。
9.而政务系统在进行药械监管决策时,其一般由被监管方提供登记信息,该登记信息一般为有效临床、研究对象数据等信息。该登记信息无真实世界数据或者仅为经过分析
处理后的真实世界数据,其并不能精确反应医疗器械状态,导致观察发生率较低的不良事件或长期安全性不可靠。政务系统又无法实现数据有效甄别、处理,更无法生成有参考意义的数据。
技术实现要素:
10.本发明的目的是解决上述现有技术的不足,针对传统登记系统较难实现真实数据采集分类处理生成有效医疗器械真实参考数据的问题,提出一种真实世界数据政务智能登记方法及登记系统。
11.为了达到上述目的,本发明所采用的技术方案为:一种真实世界数据政务智能登记方法,其特征在于包括如下步骤:s1真实数据采集,对登记用户输入的医疗器械真实世界数据进行数据采集,采集数据包括登记用户信息、与所述登记用户信息相对应的登记医疗器械真实世界数据,所述登记医疗器械真实世界数据包括医疗器械信息、与所述医疗器械信息对应的真实世界数据;s2真实世界数据处理,对真实世界数据进行自然语言处理,获得自然语言真实世界数据;s3分层式存储分类,根据所述医疗器械信息进行分区,形成若干医疗器械信息区,所述医疗器械信息区分为有效数据组、参照数据组、无效数据组,建立有效组样权重筛选机制进行登记用户信息和对应的自然语言真实世界数据的分组,所述有效组样权重筛选机制至少包括有效组样筛选模型、有效组样权重占比,根据有效组样筛选模型进行有效组样筛选,依据有效组样权重占比进行分组;s4数据动态更新,根据有效组样的动态变化进行有效组样权重筛选机制的更新,并对有效数据组和参照数据组进行分组更新。
12.优选地,所述步骤s2中,对真实世界数据进行自然语言处理后进行数据清洗获得清洗后的自然语言真实世界数据。
13.优选地,所述步骤s3中,所述有效数据组和所述参照数据组分别具备若干完整样组栏,所述完整样组栏内具备若干对组样进行分段的分段子栏,建立分段子栏权重筛选机制进行有效数据组和参照数据组的分组,所述分段子栏权重筛选机制包括样例点参照,所述样例点参照至少包括组样内样例点参照权重占比、样例点阈值设定,所述分段子栏权重筛选机制的优先级大于所述有效组样权重筛选机制的优先级。
14.优选地,所述步骤s3中,根据分段子栏权重筛选机制对组样内自然语言真实世界数据进行双向标签标记,所述自然语言真实世界数据包括医疗器械过程数据和医疗器械用户过程数据,对所述医疗器械过程数据和所述医疗器械用户过程数据进行分别的分段和/或分点的标记形成相匹配的样例点。
15.优选地,s5构建关联矩阵,根据更新的有效数据组构建用于外部查询匹配的关联矩阵。
16.本发明还提出了一种真实世界数据政务智能登记系统,包括:真实数据采集单元,用于真实数据采集,对登记用户输入的医疗器械真实世界数
据进行数据采集,采集数据包括登记用户信息、与所述登记用户信息相对应的登记医疗器械真实世界数据,所述登记医疗器械真实世界数据包括医疗器械信息、与所述医疗器械信息对应的真实世界数据;数据处理单元,用于真实世界数据处理,对真实世界数据进行自然语言处理,获得自然语言真实世界数据;分层存储单元,用于分层式存储分类,根据所述医疗器械信息进行分区,形成若干医疗器械信息区,所述医疗器械信息区分为有效数据组、参照数据组、无效数据组,所述分层存储单元内设有组样筛选模块,所述组样筛选模块用于建立有效组样权重筛选机制进行登记用户信息和对应的真实世界数据的分组,所述有效组样权重筛选机制至少包括有效组样筛选模型、有效组样权重占比;动态更新单元,用于数据动态更新,根据有效组样的动态变化进行有效组样权重筛选机制的更新,并对有效数据组和参照数据组进行分组更新。
17.优选地,所述数据处理单元内设有数据清洗模块,所述数据清洗模块用于对真实世界数据进行自然语言处理后进行数据清洗获得清洗后的自然语言真实世界数据。
18.优选地,所述分层存储单元包括与所述有效数据组和所述参照数据组分别对应的用于若干完整样组栏存储的样组栏模块,所述完整样组栏内具备若干对组样进行分段的分段子栏,所述分层存储单元内设有分段子栏权重筛模块,所述分段子栏权重筛模块用于建立分段子栏权重筛选机制进行有效数据组和参照数据组的分组,所述分段子栏权重筛选机制包括样例点参照,所述样例点参照至少包括组样内样例点参照权重占比、样例点阈值设定,所述分段子栏权重筛选机制的优先级大于所述有效组样权重筛选机制的优先级。
19.优选地,所述分层存储单元内设有双向标签标记模块,所述双向标签标记模块用于根据分段子栏权重筛选机制对组样内自然语言真实世界数据进行双向标签标记,所述自然语言真实世界数据包括医疗器械过程数据和医疗器械用户过程数据,对所述医疗器械过程数据和所述医疗器械用户过程数据进行分别的分段和/或分点的标记形成相匹配的样例点。
20.优选地,包括关联矩阵单元,用于构建关联矩阵,根据更新的有效数据组构建用于外部查询匹配的关联矩阵。
21.本发明的有益效果主要体现在:1.能将政务采集数据按照医疗器械信息归类并对其真实世界数据处理后的数据组进行权重分组,提供共性参考。
22.2.满足有效组样与有效数据组的协同需求,使得有效组样权重筛选机制更新更精确可靠,同时满足关联矩阵建立实现查询检索。
23.3.使得政务系统更智能,利于真实世界数据高效汇总应用,同时使得政务监管更精准。
附图说明
24.通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本技术的其它
特征、目的和优点将会变得更明显:图1是本发明一种真实世界数据政务智能登记方法的流程示意图。
25.图2是本发明一种真实世界数据政务智能登记系统的框架示意图。
具体实施方式
26.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
27.下面结合附图和实施例对本技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。
28.本发明提供一种真实世界数据政务智能登记方法,如图1所示,包括如下步骤:s1真实数据采集,对登记用户输入的医疗器械真实世界数据进行数据采集,采集数据包括登记用户信息、与所述登记用户信息相对应的登记医疗器械真实世界数据,所述登记医疗器械真实世界数据包括医疗器械信息、与所述医疗器械信息对应的真实世界数据;s2真实世界数据处理,对真实世界数据进行自然语言处理,获得自然语言真实世界数据;s3分层式存储分类,根据所述医疗器械信息进行分区,形成若干医疗器械信息区,所述医疗器械信息区分为有效数据组、参照数据组、无效数据组,建立有效组样权重筛选机制进行登记用户信息和对应的自然语言真实世界数据的分组,所述有效组样权重筛选机制至少包括有效组样筛选模型、有效组样权重占比;s4数据动态更新,根据有效组样的动态变化进行有效组样权重筛选机制的更新,并对有效数据组和参照数据组进行分组更新。
29.具体地实现过程及原理说明:目前医疗卫生和监管决策部门能进行相关医疗器械真实世界数据的登记与数据采集,从而方便医疗器械管理需求,而传统登记仅仅为数据采集,后端需要进行人工监管,其数据应用较为僵化,无法满足数据灵活及智能化应用需求,而单一医疗器械生产与供应商仅能实现针对性的数据采集与临床数据采集,较难实现关联数据收集与应用。
30.本案中,能对登记用户的医疗器械真实世界数据进行数据采集,其中,政务系统能实现较为广泛的登记用户的数据采集,以便能实现智能化登记管理。
31.具体地,登记用户包括医疗器械供应用户、医疗器械使用用户、医疗器械维护用户、医疗器械监管用户等,各用户均能通过登记用户权限输入各自的医疗器械真实世界数据。
32.本方法中,首先进行输入的医疗器械真实世界数据采集,采集数据包括登记用户信息、与登记用户信息相对应的登记医疗器械真实世界数据,登记医疗器械真实世界数据包括医疗器械信息、与医疗器械信息对应的真实世界数据。
33.而真实世界数据存在大量地报告、运行手册、在线记录等数据,为了使得这些数据能得到有效运用,采用自然语言处理的方式,使得这些真实世界数据转换为自然语言真实世界数据,而此类自然语言处理方式属于现有技术,在实际应用中,一般采用中文命名实体识别方法进行识别,具体地,通过中文命名实体识别方法构建包含预训练编码的双向长短时记忆神经网络,生成神经网络式条件随机场模型,神经网络式条件随机场模型包含bert模型、bilstm模型、crf模型,bert模型对中文中的字词进行编码,bilstm模型通过结合上下文特征对文本数据集进行双向的特征抽取,crf模型求用于进行中文词汇关联结果预测。当然类似此类的自然语言处理方法,均在本案的保护范围之内。
34.当获得此类处理数据后,采用分层式存储分类的方式,进行数据分别归类存储,具体地,根据医疗器械信息进行分区,形成若干医疗器械信息区,医疗器械信息区分为有效数据组、参照数据组、无效数据组,建立有效组样权重筛选机制进行登记用户信息和对应的真实世界数据的分组,有效组样权重筛选机制至少包括有效组样筛选模型、有效组样权重占比,根据有效组样筛选模型进行有效组样筛选,依据有效组样权重占比进行分组。
35.具体地说明,通过针对医疗器械信息的分区,实现针对各类医疗器械的分区管理,每个分区仅对当前医疗器械的数据进行分组。
36.对有效组样权重筛选机制进行说明,各组样分别具备真实世界数据,而真实世界数据中存在与医疗器械信息相对应配合的对应数据,根据不同的医疗器械其对应数据也存在差异,而有效组样权重筛选机制中存在根据医疗器械特性及其对应数据进行的有效组样筛选模型建立,有效组样筛选模型一般包括组样阈值设定、组样片段特征信息点、组样时序特征、组样参照标签等,根据有效组样筛选模型进行有效组样的筛选,再根据有效组样占比进行的相应组样权重占比。
37.对有效组样筛选模型进行说明,其包括涵盖医疗器械生命周期的周期构建结点,医疗器械生命周期一般包含生产、销售、运输、存储、安装、使用、维护、退役、处置等,根据其生命周期形成针对各周期环节的动态构建结点建立,而周期构建结点由若干动态组样构建元构成,依据各周期构建结点能进行相应的动态组样构建元建立,如此形成网络式有效组样筛选模型。
38.有效组样权重占比是按照动态组样构建元的有效数量作为分母,以各医疗器械信息区对应的医疗数据所含有效组的数量作为分子,如此进行一个占比筛选的。
39.一般情况下,生产环节会存在生产合格率等数据,而生产合格率对医疗器械的安全运行有较高地反馈作用,因此,其动态组样构建元中,一般会包括成品组装合格率、构成器件单品合格率等,销售一般为季度销售数量、年度销售数量等,运输一般包括运输损伤率,存储一般为存储时间、存储温湿度等因素项,安装中存在安装归属、安装中故障、故障排除等,使用存在使用异常等,维护中存在维护故障点、维护更换零部件、维护手段等,退役包括平均使用寿命、提前退役比例等,处置一般为有效元器件的记录信息。
40.而在进行有效组样判断时,依据有效组样筛选模型、有效组样权重占比来进行判断,即有效组样筛选模型中动态组样构建元由大量数据训练可以得到预形成模型,并且随着登记数量的变化,其会按照组样权重占比来进行动态变化。而每个有效组样会存在合格率、运输损伤率、使用异常等信息,通过人工设定、或者根据有效组样的合格率均数、异常占比,从而能实现有效性判断,并产生有效性判断的动态标准。
41.如此,依据登录用户输入的数据,能实现自动化归类筛选,满足其分组后提供参照需求。
42.数据动态更新,根据有效组样的动态变化进行有效组样权重筛选机制的更新,并对有效数据组和参照数据组进行分组更新。
43.对有效组样筛选模型进行说明,在医疗器械的真实世界数据进行自然语言处理后,其存在依据片段模型产生的数据段落,此类数据段落即为构建成自然语言真实世界数据的构成,也即为数据组的组样,每个数据组均存在海量的组样,其属于属于现有技术,而有效组样筛选模型即将这些数据组进行周期构建结点、动态组样构建元的建模,再通过有效组样权重占比来实现判断与分组作业。
44.依据共性特征能实现共性组样的归类,而再根据大量地共性组样能实现其有效性模型建立,从而判断组样的有效性,在满足共性数量与有效性的情况下,能实现有效组样的筛选,通过有效组样权重占比进行分组。
45.对组样进行共性整理及对组样的个体判断属于现有技术,在此不在对其进行赘述。
46.另外,本案中,有效组样权重筛选机制存在更新机制,有效组样权重筛选机制的组样权重占比是一个分组变量,在用户数量增加等情况下,其有效组样的权重会产生变化,如此实现灵活的权重分组。
实施例一
47.根据医疗器械信息的差异其产生若干医疗器械信息区。每个医疗器械信息区内又存在依照医疗器械信息分区的真实世界数据组集合,每个真实世界数据组又包括若干个组样。
48.真实世界数据组集合包括a、b、c...e,其中真实世界数据组集合a的组样包括a、b、c、d、e、f、g、h,真实世界数据组集合b的组样包括a、b、c、d、e、h、i、j、k、l,真实世界数据组集合c的组样包括a、b、c、d、f、j、h、m、n,真实世界数据组集合d的组样包括a、b、c、d、e、g、m、o、p,真实世界数据组集合e的组样包括a、b、c、d、e、o、p、r、s。
49.其中,有效组样筛选模型包括阈值判断模型,该阈值判断模型可以针对生产组装合格率、运输报废率、安装故障率等进行建模,也可以采用是与否的判断,例如安装是否出现故障修复、是否定期维护等判断模型,假设a、b、c、d、e、f、g、h、i、j、k、l、m、n、o、p、r、s判断均满足于阈值范围及判断标准需求,设定其组样占数据组总数的50%及以上为有效组样,其有效组样为a、b、c、d、e、h,有效数为6。根据组样阈值进行各真实世界数据组的组样筛选。
50.真实世界数据组集合a的组样包括有效a、有效b、有效c、无效d、无效e、f、g、有效h;其经过组样阈值筛选的有效数为4。
51.真实世界数据组集合b的组样包括有效a、有效b、无效c、有效d、无效e、无效h、i、j、k、l;其经过组样阈值筛选的有效数为3。
52.真实世界数据组集合c的组样包括有效a、有效b、有效c、有效d、f、j、有效h、m、n;其经过组样阈值筛选的有效数为5。
53.真实世界数据组集合d的组样包括无效a、无效b、无效c、无效d、有效e、g、m、o、p;其经过组样阈值筛选的有效数为1。
54.真实世界数据组集合e的组样包括有效a、有效b、有效c、有效d、有效e、o、p、r、s;其经过组样阈值筛选的有效数为5。
55.然后再进行组样权重占比的设定,按照真实世界数据组的有效数与组样阈值中的有效组样数进行比值设定,总数据大于50%为有效组样,不高于20%为无效组样,如此,真实世界数据组集合a、真实世界数据组集合c、真实世界数据组集合e归类为有效数据组,真实世界数据组集合b归类为参照数据组,真实世界数据组集合d归类为无效数据组。
56.在进行数据动态更新时,假定增加了真实世界数据组集合f、真实世界数据组集合g、真实世界数据组集合h。
57.其中真实世界数据组集合f的组样包括a、b、c、d、e、f,真实世界数据组集合g的组样包括a、b、c、d、e、f、n。
58.此时设定其组样占总数据的50%及以上为有效组样,其有效组样为a、b、c、d、e、f,有效数为6。
59.真实世界数据组集合a的组样包括有效a、有效b、有效c、无效d、无效e、无效f、g、h;其经过组样阈值筛选的有效数为3。
60.真实世界数据组集合b的组样包括有效a、有效b、无效c、有效d、无效e、h、i、j、k、l;其经过组样阈值筛选的有效数为2。
61.真实世界数据组集合c的组样包括有效a、有效b、有效c、有效d、有效f、j、h、m、n;其经过组样阈值筛选的有效数为5。
62.真实世界数据组集合d的组样包括无效a、无效b、无效c、无效d、有效e、g、m、o、p;其经过组样阈值筛选的有效数为1。
63.真实世界数据组集合e的组样包括有效a、有效b、有效c、有效d、有效e、o、p、r、s;其经过组样阈值筛选的有效数为5。
64.真实世界数据组集合f的组样包括有效a、有效b、有效c、有效d、有效e、有效f;其经过组样阈值筛选的有效数为6。
65.真实世界数据组集合g的组样包括有效a、有效b、有效c、无效d、有效e、有效f、n;组样阈值筛选的有效数为5。
66.如此,真实世界数据组集合a被重新分配到参照数据组。由此实现动态更新,满足有效数据组、参照数据组、无效数据组的动态更新参考有效性需求。
67.阈值判断模型仅为有效组样筛选模型中的一种,还可以采用特征片段建模、标签建模、时序建模的方式,其中特征片段建模用于组样含特征片段的完整度判断,存在一个完整度阈值,标签建模为存在真实世界数据的标签记录信息,根据该标签记录信息的是否来进行该组样的有效性分辨,而时序建模主要用于存在关联关系的两个数据逻辑关联的特征与否判断,从而对组样有效性判断。
68.仅需要满足对组样有效性判断的筛选模型均在本案的保护范围之内。
实施例二
69.进行有效组样权重筛选机制的建立时,其可以存在有效组样权重差异。
70.在一个具体实施例中,真实世界数据组集合包括a、b、c...e,其中真实世界数据组集合a的组样包括a、b、c、d、e、f、g、h,真实世界数据组集合b的组样包括a、b、c、d、e、h、i、j、
k、l,真实世界数据组集合c的组样包括a、b、c、d、f、j、h、m、n,真实世界数据组集合d的组样包括a、b、c、d、e、g、m、o、p,真实世界数据组集合e的组样包括a、b、c、d、e、o、p、r、s。
71.其中,假定有效组样筛选模型采用阈值筛选与标记组样权重实现,a、b、c、d、e、f、g、h、i、j、k、l、m、n、o、p、r、s的阈值均为x
±
y的有效范围,有效组样筛选模型中组样阈值的有效组样根据人工设定或者占比设定,占比即以组样占总数据组数据的占比,以上述实施例为例,设定其组样占总组数的50%及以上为有效组样,其有效组样为a、b、c、d、e、h。其中组样占总数的100%的组样的权重数为10,组样占总数75%~100%(不含100%)的组样的权重数为8,组样占总数50%~75%(不含75%)的组样的权重为5。此时a、b、c、d的组样权重数均为10,e的组样权重数为8,h的组样权重数为5。此时有效组样的组样总权重数为53。根据组样阈值进行各真实世界数据组的组样筛选。
72.真实世界数据组集合a的组样包括有效a、有效b、有效c、无效d、无效e、f、g、有效h;其经过组样阈值筛选的有效数为35。
73.真实世界数据组集合b的组样包括有效a、有效b、无效c、有效d、无效e、无效h、i、j、k、l;其经过组样阈值筛选的有效数为30。
74.真实世界数据组集合c的组样包括有效a、有效b、有效c、有效d、f、j、有效h、m、n;其经过组样阈值筛选的有效数为45。
75.真实世界数据组集合d的组样包括无效a、无效b、无效c、无效d、有效e、g、m、o、p;其经过组样阈值筛选的有效数为8。
76.真实世界数据组集合e的组样包括有效a、有效b、有效c、有效d、有效e、o、p、r、s;其经过组样阈值筛选的有效数为45。
77.然后再进行组样权重占比的设定,可以按照组样权重占比的权重数作为阈值,假定其有效权重占比为x/53以上,无效权重占比为y/53以下,如此按照x和y的设定进行其分组分类。
78.另外,在一个具体实施例中,登记用户信息存在用于有效组样权重占比的权重标记,即在每个数据组进行有效组样权重计算中,引入其对应登记用户信息的权重标记信息。
79.更具体地说明,登记用户存在医疗器械供应用户、医疗器械使用用户、医疗器械维护用户、医疗器械监管用户差异,各登记用户的登记用户信息中加入了权重标记信息,同时,该权重标记信息并非一个固定信息,其在登记用户对应医疗器械数据组的分组权重或者查询引用数据出现变化时能实现其登记用户的权重标记信息更新。
80.在一个具体实施例中,对真实世界数据进行自然语言处理后进行数据清洗获得清洗后的自然语言真实世界数据。
81.一般情况下,会构建医疗术语数据库、手册关键词数据库、阶段划分归类数据库等,当真实世界数据被自然语言处理后,通过数据库进行清洗,将自然语言真实世界数据中的大部分干扰数据进行清楚,如此减小了真实世界数据组的无效组样项,使得其真实世界数据组集合的组样有效,如此在进行组样阈值设定、组样权重占比的有效组样权重筛选机制建立上更可靠精确,使得其具备较高地参考价值。
82.需要说明的是,在进行有效数据组、参照数据组、无效数据组的分组后,进行数据动态更新进行重新分组时,无效数据组中已排除数据不再作为新组评判依据,其不再重新归类。
83.在一个具体实施例中,医疗器械信息区包括有效组样数据组,根据有效组样权重筛选机制的有效组样筛选模型对有效数据组中的数据组进行组样复制存储至有效组样数据组中,有效组样数据组的复制存储优先级低于所述组样权重占比的分组优先级。
84.具体地说明,一般情况下,有效组样筛选模型其筛选的有效组样是具备较高参考意义的,同时此类有效组样在筛选出以后,能对有效组样筛选模型的建模重新构建起到促进作用,因此,登记方法不仅仅对数据组进行有效性、参照性、无效性分组,还单独对有效组样进行复制独立存储,其能参与有效组样权重筛选机制的更新,且其优先级低于分组,如此满足精确分组后的再存储,其准确性得到较大提升。
85.在一个具体实施例中,有效组样数据组中具备针对各组样的标签标记,标签标记中存在时序特征点,建立时序删除机制对有效组样数据组进行周期性整理,将失效的组样数据迁移至无效数据组中。
86.一般情况下,有效样组存在一定地周期性时序性效用,当超过一定时效时,其对分组精确度存在和数据利用率存在影响,具体地说明,医疗器械中存在有效样组的更迭,即存在有效样组的迭代与模型的重新构建,以心电采集仪为例,其存在一个样组a,该样组a为无线通讯协议包的通信延时数据项,其曾经作为数据包丢失引起监测误差的一个参照项,而随着无限通讯的断点续传等技术发展,不再作为一个主要参照项,当其冗余在有效组样数据中时,其会造成权重比稀释,导致有效数据利用率下降,建立时序删除机制能进行周期性管理,使得有效组样权重筛选机制得到保障与完善。
87.在一个具体实施例中,构建关联矩阵,根据更新的有效数据组及有效组样数据组构建用于外部查询匹配的关联矩阵。
88.即有效数据组和有效组样数据组能实现关联检索,满足检索互联互通需求,提供基于登记智能管理的数据检索应用需求。关联矩阵属于检索现有技术,在此不再赘述。
89.如图2所示,为本发明一种真实世界数据政务智能登记系统的框架结构示意图。具体地包括:真实数据采集单元,用于真实数据采集,对登记用户输入的医疗器械真实世界数据进行数据采集,采集数据包括登记用户信息、与所述登记用户信息相对应的登记医疗器械真实世界数据,所述登记医疗器械真实世界数据包括医疗器械信息、与所述医疗器械信息对应的真实世界数据。
90.数据处理单元,用于真实世界数据处理,对真实世界数据进行自然语言处理,获得自然语言真实世界数据。
91.分层存储单元,用于分层式存储分类,根据医疗器械信息进行分区,形成若干医疗器械信息区,所述医疗器械信息区分为有效数据组、参照数据组、无效数据组。
92.分层存储单元内设有组样筛选模块,所述组样筛选模块用于建立有效组样权重筛选机制进行登记用户信息和对应的自然语言真实世界数据的分组。
93.所述有效组样权重筛选机制至少包括有效组样筛选模型、有效组样权重占比,根据有效组样筛选模型进行有效组样筛选,依据有效组样权重占比进行分组;动态更新单元,用于数据动态更新,根据有效组样的动态变化进行有效组样权重筛选机制的更新,并对有效数据组和参照数据组进行分组更新。
94.在一个具体实施例中,数据处理单元内设有数据清洗模块,所述数据清洗模块用于对真实世界数据进行自然语言处理后进行数据清洗获得清洗后的自然语言真实世界数
据。
95.在一个具体实施例中,分层存储单元包括有效组样复制存储模块,所述医疗器械信息区包括有效组样数据组。
96.有效组样复制存储模块用于根据有效组样权重筛选机制的有效组样筛选模型对有效数据组中的数据组进行组样复制存储至有效组样数据组中,有效组样数据组的复制存储优先级低于所述组样权重占比的分组优先级。
97.在一个具体实施例中,分层存储单元包括标签标记模块和整理模块,所述标签标记模块用于在对有效组样数据组中的各组样进行标签标记,标签标记中存在时序特征点。
98.整理模块用于建立时序删除机制对所述有效组样数据组进行周期性整理,将失效的组样数据迁移至无效数据组中。
99.在一个具体实施例中,包括关联矩阵单元,用于构建关联矩阵,根据更新的有效数据组及有效组样数据组构建用于外部查询匹配的关联矩阵。
100.通过以上描述可以发现,能将政务采集数据按照医疗器械信息归类并对其真实世界数据处理后的数据组进行权重分组,提供共性参考。满足有效组样与有效数据组的协同需求,使得有效组样权重筛选机制更新更精确可靠,同时满足关联矩阵建立实现查询检索。使得政务系统更智能,利于真实世界数据高效汇总应用,同时使得政务监管更精准。
101.术语“包括”或者任何其它类似用语旨在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备/装置不仅包括那些要素,而且还包括没有明确列出的其它要素,或者还包括这些过程、方法、物品或者设备/装置所固有的要素。
102.至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征作出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
技术特征:
1.一种真实世界数据政务智能登记方法,其特征在于包括如下步骤:s1真实数据采集,对登记用户输入的医疗器械真实世界数据进行数据采集,采集数据包括登记用户信息、与所述登记用户信息相对应的登记医疗器械真实世界数据,所述登记医疗器械真实世界数据包括医疗器械信息、与所述医疗器械信息对应的真实世界数据;s2真实世界数据处理,对真实世界数据进行自然语言处理,获得自然语言真实世界数据;s3分层式存储分类,根据所述医疗器械信息进行分区,形成若干医疗器械信息区,所述医疗器械信息区分为有效数据组、参照数据组、无效数据组,建立有效组样权重筛选机制进行登记用户信息和对应的自然语言真实世界数据的分组,所述有效组样权重筛选机制至少包括有效组样筛选模型、有效组样权重占比,根据有效组样筛选模型进行有效组样筛选,依据有效组样权重占比进行分组;s4数据动态更新,根据有效组样的动态变化进行有效组样权重筛选机制的更新,并对有效数据组和参照数据组进行分组更新。2.根据权利要求1所述一种真实世界数据政务智能登记方法,其特征在于:所述步骤s2中,对真实世界数据进行自然语言处理后进行数据清洗获得清洗后的自然语言真实世界数据。3.根据权利要求1所述一种真实世界数据政务智能登记方法,其特征在于:所述步骤s3中,所述医疗器械信息区包括有效组样数据组,根据有效组样权重筛选机制的有效组样筛选模型对有效数据组中的数据组进行组样复制存储至有效组样数据组中,有效组样数据组的复制存储优先级低于所述组样权重占比的分组优先级。4.根据权利要求3所述一种真实世界数据政务智能登记方法,其特征在于:所述步骤s3中,所述有效组样数据组中具备针对各组样的标签标记,标签标记中存在时序特征点,建立时序删除机制对所述有效组样数据组进行周期性整理,将失效的组样数据迁移至无效数据组中。5.根据权利要求4所述一种真实世界数据政务智能登记方法,其特征在于包括:s5构建关联矩阵,根据更新的有效数据组及有效组样数据组构建用于外部查询匹配的关联矩阵。6.一种真实世界数据政务智能登记系统,其特征在于包括:真实数据采集单元,用于真实数据采集,对登记用户输入的医疗器械真实世界数据进行数据采集,采集数据包括登记用户信息、与所述登记用户信息相对应的登记医疗器械真实世界数据,所述登记医疗器械真实世界数据包括医疗器械信息、与所述医疗器械信息对应的真实世界数据;数据处理单元,用于真实世界数据处理,对真实世界数据进行自然语言处理,获得自然语言真实世界数据;分层存储单元,用于分层式存储分类,根据所述医疗器械信息进行分区,形成若干医疗器械信息区,所述医疗器械信息区分为有效数据组、参照数据组、无效数据组,所述分层存储单元内设有组样筛选模块,所述组样筛选模块用于建立有效组样权重筛选机制进行登记用户信息和对应的自然语言真实世界数据的分组,所述有效组样权重筛选机制至少包括有效组样筛选模型、有效组样权重占比,根据有
效组样筛选模型进行有效组样筛选,依据有效组样权重占比进行分组;动态更新单元,用于数据动态更新,根据有效组样的动态变化进行有效组样权重筛选机制的更新,并对有效数据组和参照数据组进行分组更新。7.根据权利要求6所述一种真实世界数据政务智能登记系统,其特征在于:所述数据处理单元内设有数据清洗模块,所述数据清洗模块用于对真实世界数据进行自然语言处理后进行数据清洗获得清洗后的自然语言真实世界数据。8.根据权利要求6所述一种真实世界数据政务智能登记系统,其特征在于:所述分层存储单元包括有效组样复制存储模块,所述医疗器械信息区包括有效组样数据组,所述有效组样复制存储模块用于根据有效组样权重筛选机制的有效组样筛选模型对有效数据组中的数据组进行组样复制存储至有效组样数据组中,有效组样数据组的复制存储优先级低于所述组样权重占比的分组优先级。9.根据权利要求8所述一种真实世界数据政务智能登记系统,其特征在于:所述分层存储单元包括标签标记模块和整理模块,所述标签标记模块用于在对有效组样数据组中的各组样进行标签标记,标签标记中存在时序特征点,所述整理模块用于建立时序删除机制对所述有效组样数据组进行周期性整理,将失效的组样数据迁移至无效数据组中。10.根据权利要求9所述一种真实世界数据政务智能登记系统,其特征在于:包括关联矩阵单元,用于构建关联矩阵,根据更新的有效数据组及有效组样数据组构建用于外部查询匹配的关联矩阵。
技术总结
本发明揭示了一种真实世界数据政务智能登记方法及登记系统,包括如下步骤:数据采集,对真实世界数据进行自然语言处理;根据医疗器械信息进行分区,医疗器械信息区分为有效数据组、参照数据组、无效数据组,建立有效组样权重筛选机制进行登记用户信息和对应的自然语言真实世界数据的分组,根据有效组样的动态变化进行有效组样权重筛选机制的更新。本发明能将政务采集数据按照医疗器械信息归类并对其真实世界数据处理后的数据组进行权重分组,提供共性参考。满足有效组样与有效数据组的协同需求,使得有效组样权重筛选机制更新更精确可靠,关联矩阵实现查询检索。使得政务系统更智能,利于真实世界数据高效汇总应用,同时使得政务监管更精准。政务监管更精准。政务监管更精准。
技术研发人员:曹帆 邢以文 李尧 顾臣贤 储蓉 黄依雯
受保护的技术使用者:苏州市药品检验检测研究中心(苏州市药品不良反应监测中心)
技术研发日:2023.07.18
技术公布日:2023/10/7
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/