一种面向案件的法律法规与标准条文的自动匹配方法与流程

未命名 10-08 阅读:124 评论:0


1.本发明涉及数据处理技术领域,具体涉及一种面向案件的法律法规与标准条文的自动匹配方法。


背景技术:

2.法律法规自动匹配是指根据国家安全生产法律、法规,利用安全生产管理相关方法,对现场勘查进行逐项排查,目的是面向案件发现现场安全,查询比对法律法规的标准条文是否有出入等,以提高现场勘查的安全性,准确性的目的。
3.参照中国专利号为cn110808957a的一种漏洞信息的匹配处理方法及装置,方法包括:获取网络中的漏洞相关信息,对漏洞相关相信进行词性标注和区块提取,得到预处理漏洞信息;将预处理漏洞信息中符合预设语法结构的若干个区块组合为新的名词区块,得到区块漏洞信息;根据预设敏感动词对区块漏洞信息中的动词进行匹配,将匹配到的目标动词所连接的目标名词确定为漏洞信息。
4.结合上述提到的漏洞信息处理方式,会发现安全人员在进行隐患排查时无法精确判断是否存在隐患,且当判断出存在隐患时,无法提供准确、让人信服的法规依据;同时在采用处理方式时不能结合收集的反馈信息进行优化,使结果缺少合理性。
5.而本发明的目的在于提供一种面向案件的法律法规与标准条文的自动匹配方法,解决了上述中问题,从而实现由案件信息查询相关法规文档以及对应法规条例,同时实现法规文档与法规条例查询相关关联的案件信息,从而为化案件提供数据支撑,并有效地实现预防预警。


技术实现要素:

6.针对上述缺陷,本发明所要解决的技术问题在于提供一种面向案件的法律法规与标准条文的自动匹配方法,包括有如下步骤:
7.s1:收集并整理要匹配的条文文本,建立条文文本库;
8.s2:构建条文索引;
9.s3:构建自然语言处理模型;
10.s4:预处理查询文本;
11.s5:在条文索引中搜索相似条文;
12.s6:对搜索结果进行自然语言处理分析,将提取到条文中的关键信息进行语义分析,以确定条文与查询的匹配度;
13.s7:打分或分类;
14.s8:可视化或其他二次处理;
15.s9:输出格式,将匹配结果以指定的格式输出。
16.在上述一种面向案件的法律法规与标准条文的自动匹配方法的技术方案中,优选地,所述步骤s1中具体有:在开始自动匹配前,需要建立一个条文文本库,可从官方网站、政
府发布的文本、行业标准、公司规章等多个方面收集相关的条文文本,结构化地存储在数据库或文件中。
17.在上述一种面向案件的法律法规与标准条文的自动匹配方法的技术方案中,优选地,所述步骤s2中具体有:用lucene或者elasticsearch等搜索技术,将建立好的条文文本库进行索引化。
18.在上述一种面向案件的法律法规与标准条文的自动匹配方法的技术方案中,优选地,所述步骤s3中具体有:使用一些机器学习框架和工具构建自然语言处理模型,自然语言处理分析包括按照分词、pos(词性标注)、ner(命名实体识别)的标注标准进行处理,然后完成语义分析处理。
19.在上述一种面向案件的法律法规与标准条文的自动匹配方法的技术方案中,优选地,所述步骤s4中具体有:在进行查询前需要对提交的查询文本进行处理,包括:将查询文本分割成多个词语;过滤停用词以节省内存和提高处理效率;词干提取缩小查询范围。
20.在上述一种面向案件的法律法规与标准条文的自动匹配方法的技术方案中,优选地,所述步骤s5中具体有:搜索相似条文时,可以使用lucene提供的fuzzyquery(模糊查询)等api,fuzzyquery根据查询词在条文库中匹配的相似程度来进行排名,返回排名最高的若干条匹配结果用于下一步对条文的处理。
21.在上述一种面向案件的法律法规与标准条文的自动匹配方法的技术方案中,优选地,所述步骤s7中具体有:为了更精准地匹配条文,可在匹配结果上打分或分类,在打分过程中,可以根据条文与查询的匹配程度来对条文进行评分,得分越高则相似度越高,反之则相似度越低,在分类过程中,可以将匹配结果进行分类,分成优先级高、次要问题、建议等多个类别。
22.在上述一种面向案件的法律法规与标准条文的自动匹配方法的技术方案中,优选地,所述步骤s8中具体有:对于匹配结果,可根据需要进行可视化或其他二次处理,例如,可以将查询结果在界面上显示出来,或根据查询结果进行统计分析等,以确保条文查询的精确度和实时性。
23.由上述技术方案可知,本发明提供一种面向案件的法律法规与标准条文的自动匹配方法与现有技术相比,本发明具有以下有益效果:
24.发明实现由案件信息查询相关法规文档以及对应法规条例,同时实现法规文档与法规条例查询相关关联的案件信息,使用图模型的textrank算法计算词语数组的每个词语权重,词组的频次使用统计等,实现由案件信息查询相关法规文档以及对应法规条例,同时实现法规文档与法规条例查询相关关联的案件信息,从而为化案件提供数据支撑,并有效地实现预防预警。
附图说明
25.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对本发明实施例或现有技术描述中所需要使用的附图做出简单地介绍和说明。显而易见地,下面描述中的附图仅仅是本发明的部分实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
26.图1为本发明中一种面向案件的法律法规与标准条文的自动匹配方法示意图。
具体实施方式
27.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,以下所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
28.为了对本发明的技术方案和实现方式做出更清楚地解释和说明,以下介绍实现本发明技术方案的几个优选的具体实施例。
29.需要说明的是,当元件被称为“固定于”或“设置于”另一个元件上,它可以直接在另一个元件上或者间接设置在另一个元件上;当一个元件被称为是“连接于”另一个元件,它可以是直接连接到另一个元件或间接连接至另一个元件上。
30.另外,本文中的术语:“内、外”,“前、后”,“左、右”,“竖直、水平”,“顶、底”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本技术的限制。
31.术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。
32.具体实施例1。
33.参考附图1所示,
34.面向案件的法律法规与标准条文的自动匹配方法;
35.收集并整理要匹配的条文文本,建立条文文本库。在开始自动匹配前,需要建立一个条文文本库。可从官方网站、政府发布的文本、行业标准、公司规章等多个方面收集相关的条文文本,结构化地存储在数据库或文件中。构建条文索引,用lucene或者elasticsearch等搜索技术,将建立好的条文文本库进行索引化。
36.建立条文索引后,查询效率大大提高,能够满足高效率、高精准度的条文查询。构建自然语言处理模型,构建自然语言处理模型,需要使用一些机器学习框架和工具,例如stanfordnlp、opennlp等。自然语言处理分析包括按照分词、pos(词性标注)、ner(namedentityrecognition,命名实体识别)的标注标准进行处理,然后完成语义分析等必要的处理。
37.在使用自动匹配功能时,用户输入的查询文本具有多变性和歧义性。因此,在进行查询前需要对提交的查询文本进行处理,包括:将查询文本分割成多个词语;过滤停用词(如“的”、“是”等)以节省内存和提高处理效率。词干提取来缩小查询范围。
38.搜索相似条文时,可以使用lucene提供的fuzzyquery(模糊查询)等api。fuzzyquery根据查询词在条文库中匹配的相似程度来进行排名。返回排名最高的若干条匹配结果用于下一步对条文的处理。
39.对搜索结果进行自然语言处理分析,将提取到条文中的关键信息,包括词性、词语、关键字等,再进行语义分析,以确定条文与查询的匹配度。
40.为了更精准地匹配条文,可在匹配结果上打分或分类。在打分过程中,可以根据条文与查询的匹配程度来对条文进行评分,得分越高则相似度越高,反之则相似度越低。在分
类过程中,可以将匹配结果进行分类,分成优先级高、次要问题、建议等多个类别。
41.对于匹配结果,根据需要进行可视化或其他二次处理。例如,可以将查询结果在界面上显示出来,或根据查询结果进行统计分析等,以确保条文查询的精确度和实时性。最后,将匹配结果以指定的格式输出,如文本、html或pdf等。使用图模型的textrank算法计算词语数组的每个词语权重,词组的频次使用统计等,实现由案件信息查询相关法规文档以及对应法规条例,同时实现法规文档与法规条例查询相关关联的案件信息,从而为化案件提供数据支撑,并有效地实现预防预警。
42.具体实施例2。
43.面向案件的法律法规与标准条文的自动匹配方法;
44.基于实施例1。
45.使用云计算和大数据技术,对海量的法规文档和案件信息进行存储和处理,提高系统的处理能力和可扩展性;
46.云存储:将海量的法规文档和案件信息上传至云端的存储服务,使用云端存储服务可以通过异地备份、容灾等功能,保证数据的安全和可靠性。
47.分布式计算:利用云平台提供的分布式计算框架,将计算任务划分成多个子任务,分散在不同的计算节点中并行处理,从而提高计算效率和速度。
48.大数据处理:使用大数据技术对海量的法规文档和案件信息进行处理和分析,可以快速提取事实、关系、成本、可能性等信息,并生成相关的结论和推论,帮助法官更好地进行案件研究。
49.机器学习和人工智能:通过对大量数据的学习和分析,使用机器学习和人工智能技术构建智能化的法律判决系统,可以为司法决策提供更准确的法律依据和推荐。
50.为了减少人工查询法规条文的时间,提高隐患排查的工作效率。编写一个java程序,用来读取文件或数据库中的法规条文,并将其转换为计算机可以理解的格式,可以遵循以下步骤:
51.确定法规条文的存储格式,例如文本文件或数据库。
52.根据存储格式,选择合适的javaapi进行读取。例如:
53.1、如果是文本文件,可以使用javai/o流api(如filereader,bufferedreader)读取文件内容。如果是数据库,则需要使用jdbcapi进行数据库连接操作,然后查询数据库中的数据。
54.2、如果是使用框架(如spring等)来连接数据库,则可以利用相应框架提供的api进行数据操作。
55.在java程序中,定义一个类来存储法规条文,包含法律名称、条文编号、条文内容等信息。
56.根据读取到的法规条文内容,适配上述定义的类,将数据存储到该类的对象中。
57.将读取到的法规条文存储到一个集合中,例如list、set、map等,并返回给调用方,以便后续处理。
58.之后,收集并整理要匹配的条文文本,建立条文文本库。构建自然语言处理模型,然后完成语义分析等必要的处理。随后在进行查询前需要对提交的查询文本进行处理,以节省内存和提高处理效率。
59.对搜索结果进行自然语言处理分析,将提取到条文中的关键信息,包括词性、词语、关键字等,再进行语义分析,以确定条文与查询的匹配度。
60.为了更精准地匹配条文,可在匹配结果上打分或分类。在打分过程中,可以根据条文与查询的匹配程度来对条文进行评分,得分越高则相似度越高,反之则相似度越低。最后对于匹配结果,根据需要进行可视化或其他二次处理。
61.最后,还需要说明的是,本说明书附图所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本技术可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本技术所能产生的功效及所能达成的目的下,均应仍落在本技术所揭示的技术内容得能涵盖的范围内。
62.在本文中使用的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
…”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
63.本发明并不局限于上述最佳实施方式,任何人应该得知在本发明的启示下做出的结构变化,凡是与本发明具有相同或相近的技术方案,均落入本发明的保护范围之内。

技术特征:
1.一种面向案件的法律法规与标准条文的自动匹配方法,其特征在于,包括有如下步骤:s1:收集并整理要匹配的条文文本,建立条文文本库;s2:构建条文索引;s3:构建自然语言处理模型;s4:预处理查询文本;s5:在条文索引中搜索相似条文;s6:对搜索结果进行自然语言处理分析,将提取到条文中的关键信息进行语义分析,以确定条文与查询的匹配度;s7:打分或分类;s8:可视化或其他二次处理;s9:输出格式,将匹配结果以指定的格式输出。2.根据权利要求1所述的一种面向案件的法律法规与标准条文的自动匹配方法,其特征在于,所述步骤s1中具体有:在开始自动匹配前,需要建立一个条文文本库,可从官方网站、政府发布的文本、行业标准、公司规章等多个方面收集相关的条文文本,结构化地存储在数据库或文件中。3.根据权利要求1所述的一种面向案件的法律法规与标准条文的自动匹配方法,其特征在于,所述步骤s2中具体有:用lucene或者elasticsearch等搜索技术,将建立好的条文文本库进行索引化。4.根据权利要求1所述的一种面向案件的法律法规与标准条文的自动匹配方法,其特征在于,所述步骤s3中具体有:使用一些机器学习框架和工具构建自然语言处理模型,自然语言处理分析包括按照分词、pos(词性标注)、ner(命名实体识别)的标注标准进行处理,然后完成语义分析处理。5.根据权利要求1所述的一种面向案件的法律法规与标准条文的自动匹配方法,其特征在于,所述步骤s4中具体有:在进行查询前需要对提交的查询文本进行处理,包括:将查询文本分割成多个词语;过滤停用词以节省内存和提高处理效率;词干提取缩小查询范围。6.根据权利要求1所述的一种面向案件的法律法规与标准条文的自动匹配方法,其特征在于,所述步骤s5中具体有:搜索相似条文时,可以使用lucene提供的fuzzyquery(模糊查询)等api,fuzzyquery根据查询词在条文库中匹配的相似程度来进行排名,返回排名最高的若干条匹配结果用于下一步对条文的处理。7.根据权利要求1所述的一种面向案件的法律法规与标准条文的自动匹配方法,其特征在于,所述步骤s7中具体有:为了更精准地匹配条文,可在匹配结果上打分或分类,在打分过程中,可以根据条文与查询的匹配程度来对条文进行评分,得分越高则相似度越高,反之则相似度越低,在分类过程中,可以将匹配结果进行分类,分成优先级高、次要问题、建议等多个类别。8.根据权利要求1所述的一种面向案件的法律法规与标准条文的自动匹配方法,其特征在于,所述步骤s8中具体有:对于匹配结果,可根据需要进行可视化或其他二次处理,例如,可以将查询结果在界面上显示出来,或根据查询结果进行统计分析等,以确保条文查询的精确度和实时性。

技术总结
本发明公开了一种面向案件的法律法规与标准条文的自动匹配方法,本发明涉及数据处理技术领域,现提出如下方案,包括:收集并整理要匹配的条文文本,建立条文文本库;构建条文索引;构建自然语言处理模型;预处理查询文本。本发明中发明实现由案件信息查询相关法规文档以及对应法规条例,同时实现法规文档与法规条例查询相关关联的案件信息,使用图模型的textrank算法计算词语数组的每个词语权重,词组的频次使用统计等,实现由案件信息查询相关法规文档以及对应法规条例,同时实现法规文档与法规条例查询相关关联的案件信息,从而为化案件提供数据支撑,并有效地实现预防预警。并有效地实现预防预警。并有效地实现预防预警。


技术研发人员:王志发 王文东 林峰 陈双福
受保护的技术使用者:广西五毛物联网科技有限公司
技术研发日:2023.06.25
技术公布日:2023/10/5
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐