一种钻完井设计文献搜索方法、系统、设备及介质与流程

未命名 07-29 阅读:99 评论:0


1.本发明涉及知识图谱构建技术领域,特别是关于一种钻完井设计文献搜索方法、系统、设备及介质。


背景技术:

2.传统的钻完井知识库构建方式是通过对文献进行入库属性登记,构建非结构话文本的主数据方式实现的。
3.然而,这种基于属性表单的数据库构建方式存在以下几个问题:1)知识没有关联,不同表单之间形成信息孤岛,在跨表单应用场景中,无法建立知识之间的关联,不能模仿人的联想思维,因此对人思维能力的扩展有限。业务数据以行政管理组织结构为参照建立,每一部门建立自己的数据库,部门之间的数据访问有严格的管理限制,即使内部也无法看到需要的数据,且内部数据系统很多,会出现重复建设、数据分散、应用价值不高的问题。2)知识无法按照业务需要进行组织,在应用时一篇文章的属性描述不全,文献只有项目编号没有统一的业务编号,就无法进入相关业务研究。另外,文献之间也没有关联,搜索得到的文献第一篇和第二篇有词的长短包含关系,没有业务的包含关系。


技术实现要素:

4.针对上述问题,本发明的目的是提供一种能够增加知识与业务之间的关联度的钻完井设计文献搜索方法、系统、设备及介质。
5.为实现上述目的,本发明采取以下技术方案:第一方面,提供一种钻完井设计文献搜索方法,包括:
6.获取项目的某一文献,并对获取的文献进行加工处理,得到文献的属性作为搜索词;
7.将搜索词输入至预先建立的基于知识图谱的知识库中的搜索框上,进行基于知识图谱的扩展搜索,得到对应的文献;
8.将加工处理后的文献加入至基于知识图谱的知识库中。
9.进一步地,所述基于知识图谱的知识库的构建过程包括:
10.建立知识体系,确定知识的概念图谱;
11.采集钻完井数据和钻完井数据库文件数据,建立文献的知识库;
12.根据建立的知识体系和确定的知识概念图谱,对采集的数据进行知识加工和内容提取,得到属性和五元组图谱文件;
13.对已有文献结构化数据库中的正文进行知识加工和内容提取,得到五元组图谱文件,并追加至上述建立的文献的知识库和得到的五元组图谱文件中;
14.在建立的文献的知识库上增加知识扩展,得到基于知识图谱的知识库;
15.根据文献的知识库和基于知识图谱的知识库,建立实例图谱。
16.进一步地,所述基于知识图谱的知识库的构建过程还包括:
17.基于建立的实例图谱,以建立的知识体系为引导,可视化展示知识图谱全景。
18.进一步地,所述知识体系包括知识分类体系、知识模板和知识关系,所述知识分类体系包括业务维度分类指标和技术维度分类指标。
19.进一步地,所述钻完井数据和钻完井数据库文件数据的采集方式包括知识采集方式、接口采集、网络爬虫和模板导入,采用的知识资源包括历史设计报告、现场作业数据、科研报告、标准库和专题报告。
20.进一步地,所述根据建立的知识体系和确定的知识概念图谱,对采集的数据进行知识加工和内容提取,得到属性和五元组图谱文件,包括:
21.对采集的数据进行预处理,得到全文句子序列;
22.通过标签字典对全文句子序列进行处理,将全文句子序列变换为文献内对应的各种标签;
23.通过五元组图谱文件对各种标签进行处理,检索出文献所包括的所有五元组,将正片非结构化的文本变换为五元组图谱文件;
24.将分散在关系型数据库中的各种对象-属性表基于知识关系整理为五元组图谱文件,并保存至上述五元组图谱文件中。
25.第二方面,提供一种钻完井设计文献搜索系统,包括:
26.基础层,用于采用云服务器,提供存储资源服务、计算资源服务和网络资源服务,构建底层平台,设置互联网接口和数据库采集接口,为其他各层提供基础支撑;
27.平台服务层,用于预先构建基于知识图谱的知识库,进行数据采集、知识处理和知识服务;
28.应用层,用于将项目的某一文献的搜索词输入至基于知识图谱的知识库中的搜索框上,得到对应的文献。
29.进一步地,所述平台服务层内设置有:
30.数据采集模块,用于获取知识体系以及采集钻完井数据和钻完井数据库文件数据,建立文献的知识库;
31.知识处理模块,用于根据建立的知识体系和确定的知识概念图谱,对采集的数据进行知识加工和内容提取,得到属性和五元组图谱文件;对已有文献结构化数据库中的正文进行知识加工和内容提取,得到五元组图谱文件,并追加至上述建立的文献的知识库和得到的五元组图谱文件中;在建立的文献的知识库上增加知识扩展,得到基于知识图谱的知识库;根据文献的知识库和基于知识图谱的知识库,建立实例图谱;
32.知识服务模块,用于建立基于知识图谱的知识库的搜索框。
33.第三方面,提供一种处理设备,包括计算机程序指令,其中,所述计算机程序指令被处理设备执行时用于实现上述钻完井设计文献搜索方法对应的步骤。
34.第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序指令,其中,所述计算机程序指令被处理器执行时用于实现上述钻完井设计文献搜索方法对应的步骤。
35.本发明由于采取以上技术方案,其具有以下优点:本发明通过知识图谱对知识进行分类扩展、对象扩展和技术扩展,从3个维度模仿业务人员的专业思维模式,增加了知识管理系统的友好性、可用性和专业性,使得专业人员持续使用该系统的时间增加为30分钟,
远高于传统知识库10分钟的使用持续时间,可以广泛应用于知识图谱构建技术领域中。
附图说明
36.通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。在整个附图中,用相同的附图标记表示相同的部件。在附图中:
37.图1是本发明一实施例提供的搜索方法示意图;
38.图2是本发明一实施例提供的基于知识图谱的知识库构建方法示意图;
39.图3是本发明一实施例提供的知识加工和内容提取示意图;
40.图4是本发明一实施例提供的知识库数据资源示意图;
41.图5是本发明一实施例提供的知识扩展示意图;
42.图6是本发明一实施例提供的基于知识图谱的知识库示意图;
43.图7是本发明一实施例提供的扩展搜索结果示意图;
44.图8是本发明一实施例提供的基于知识图谱的扩展搜索示意图;
45.图9是本发明一实施例提供的概念图谱和实例图谱的示意图;
46.图10是本发明一实施例提供的知识图谱全景展示示意图;
47.图11是本发明一实施例提供的系统的结构示意图。
具体实施方式
48.下面将参照附图更详细地描述本发明的示例性实施方式。虽然附图中显示了本发明的示例性实施方式,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了能够更透彻地理解本发明,并且能够将本发明的范围完整地传达给本领域的技术人员。
49.应理解的是,文中使用的术语仅出于描述特定示例实施方式的目的,而无意于进行限制。除非上下文另外明确地指出,否则如文中使用的单数形式“一”、“一个”以及“所述”也可以表示包括复数形式。术语“包括”、“包含”、“含有”以及“具有”是包含性的,并且因此指明所陈述的特征、步骤、操作、元件和/或部件的存在,但并不排除存在或者添加一个或多个其它特征、步骤、操作、元件、部件、和/或它们的组合。文中描述的方法步骤、过程、以及操作不解释为必须要求它们以所描述或说明的特定顺序执行,除非明确指出执行顺序。还应当理解,可以使用另外或者替代的步骤。
50.尽管可以在文中使用术语第一、第二、第三等来描述多个元件、部件、区域、层和/或部段,但是,这些元件、部件、区域、层和/或部段不应被这些术语所限制。这些术语可以仅用来将一个元件、部件、区域、层或部段与另一区域、层或部段区分开。除非上下文明确地指出,否则诸如“第一”、“第二”之类的术语以及其它数字术语在文中使用时并不暗示顺序或者次序。因此,以下讨论的第一元件、部件、区域、层或部段在不脱离示例实施方式的教导的情况下可以被称作第二元件、部件、区域、层或部段。
51.本发明实施例提供的钻完井设计文献搜索方法、系统、设备及介质,基于知识图谱的方式预先构建钻完井知识库,在传统的表单基础上,构建表单之间的抽象的相互联系,模仿人思维的普遍联系特征,从而实现思维的跨业务、跨地域、跨知识形态之间的广泛联系,
例如钻井和完井分属两个业务领域,其知识记录在两张主数据表中,传统上钻井和完井属于两个部门,其知识的联通具有管理上的困难。但通过在两个业务之上构建包括钻井和完井两个业务的知识图谱,就可以在现有组织架构上实现钻井知识和完井知识的联通,其基本思想是利用知识图谱对知识库数据进行扩展,从而增加知识与业务的关联度。
52.实施例1
53.如图2所示,本实施例提供一种钻完井设计文献搜索方法,包括以下步骤:
54.1)预先构建基于知识图谱的知识库,具体为:
55.1.1)分析钻完井设计业务中的知识应用和诉求,建立知识体系。
56.具体地,根据业务范围和业务规则,分析钻完井设计管理涉及的各项要素,整理各项要素的关联关系,按照一定的原则对知识进行归纳和划分,从而形成全局统一的知识体系。
57.具体地,知识体系包括知识分类体系、知识模板和知识关系。
58.进一步地,知识分类体系包括业务维度分类指标和技术维度分类指标。
59.业务维度分类指标包括已钻井情况分析指标、钻井部署指标、井眼轨道优化设计指标、井身结构设计指标、钻井液设计指标、钻井工程油层保护要求指标、完井设计指标和钻井工程配套方案设计指标,其中,完井设计指标包括套管完井设计指标和完井方式选择指标,钻井工程配套方案设计指标包括钻具组合设计指标、钻具强度校核设计指标、钻柱摩阻扭矩设计指标、钻头选型指标、钻机选型指标和井控技术设计指标。
60.技术维度分类指标包括七级指标,其中,一级指标为井筒工程指标,二级指标为钻井工程指标、三级指标为钻井工艺技术指标,四极指标为钻井方法指标,五级指标包括爆炸钻井指标、侧向钻井指标、超声波钻井指标、冲击钻井指标、吹灰钻井指标、垂直钻井指标和从式钻井指标,六级指标包括中曲率半径侧向钻井指标、套管侧钻指标、悬空侧钻指标和丛式双筒钻井指标,七级指标包括套管开窗侧钻指标和套管段铣侧钻指标。
61.进一步地,知识模板包括标题、摘要、背景、关键词、研究任务、研究对象、主要成果、处理结果、成果报告分类、发表时间、所属项目、适用范围、知识分类和术语标签等,如下表1、表2和表3所示,分别为成果类知识模板、案例类知识模板和标准类知识模板的示例:
62.表1:成果类知识模板
[0063][0064]
表2:案例类知识模板
[0065][0066]
表3:标准类知识模板
[0067][0068]
进一步地,知识关系即对象关系的定义如下表4所示,建立的思想是按照两点一线的要求,将研究对象之间的关系用图来进行表示,其中,节点包括起点和终点,指研究对象。关系方向确定起点和终点在现实中两个研究对象在空间的包含关系和时间的先后顺序的作用关系,关系名称是对这个相互作用在业务中的名称:
[0069]
表4:对象关系定义
[0070][0071]
1.2)基于自然语言处理方式,确定知识的概念图谱。
[0072]
具体地,从nlp角度(自然语言处理),知识是篇章节段句,对应的业务包括业务域、业务主体和业务活动,句子对应业务活动,而句子中的词对应业务对象,业务对象之间的关系为本体关系。知识图谱中的概念指知识分类即业务对象,概念图谱为业务分类树和业务对象之间的关系。知识和业务对象之间通过业务活动进行关联,业务活动之上为知识的层次结构,业务活动之下的对象关系是对象之间的本体关系。
[0073]
1.3)对钻完井设计相关知识资源进行知识采集,采集钻完井数据和钻完井数据库文件数据,建立文献的知识库。
[0074]
具体地,采集方式包括知识采集方式、接口采集、网络爬虫和模板导入等。进一步地,采用的知识资源包括历史设计报告、现场作业数据、科研报告、标准库和专题报告等。
[0075]
1.4)基于自然语言处理理论,结合油气行业业务特点,以“行业语料+行业字典+业务规则+算法模型”的模式,根据步骤1)中建立的知识体系和步骤2)中确定的知识概念图谱(即知识加工中的标签),对步骤3)中采集的数据进行知识加工和内容提取,得到属性和五元组图谱文件。
[0076]
具体地,知识加工和内容提取包括文档碎片化、实体识别、实体融合、属性抽取和数据消岐等。
[0077]
具体地,如图3所示,知识加工和内容提取的具体过程为:
[0078]
1.4.1)对采集的数据进行预处理,得到全文句子序列。
[0079]
具体地,预处理包括将docx文件转化为doc文件格式、按照“。”对文字进行切割等,将正文文献碎片化为全文句子序列。
[0080]
1.4.2)采用算法,通过标签字典对全文句子序列进行处理,将全文句子序列变换为文献内对应的各种标签,包括业务分类、技术分类、研究对象和非地质类对象。
[0081]
具体地,算法包括按频次排序的字典全文查询tire树算法以及技术分类的fasttext算法。
[0082]
1.4.3)采用tire树算法和fasttext算法,通过五元组图谱文件对各种标签进行处理,检索出全文句子序列所包括的所有五元组,由此将正片非结构化的文本变换为五元组图谱文件。
[0083]
1.4.4)将分散在关系型数据库中的各种对象-属性表基于知识关系(概念图谱中的线段)整理为五元组图谱文件,将满足概念图谱中线段的2列改写成五元组的形式,保存至上述步骤1.4.3)的五元组图谱文件中,其中,不包括文献模板定义的关系,例如设计报告

项目之间的所属项目关系。
[0084]
1.5)对已有文献结构化数据库(即图4中的成果文件,包括文献的名称、作者、摘要、技术分类、业务分类等属性)中的正文采用上述步骤1.4)的方式得到五元组图谱文件,并追加至上述步骤1.3)中的文献的知识库和步骤1.4)中的五元组图谱文件中,从而建立项目中所有文献的知识库和知识图谱,扩展文献的知识维度,如图4所示,以专业百科的形式进行展示,并对各专业研究相关的研究成果形成参考案例。
[0085]
1.6)在建立的文献的知识库上增加知识扩展,得到基于知识图谱的知识库。
[0086]
具体地,知识扩展是由业务分类体系、技术分类体系、地质类分类体系和非地质类分类体系组成,其中,扩展的意思是相对于通常几十到100个左右的类别。例如:如图5所示的体系分支在1000及以上,扩展知识体系在不包含上级节点的情况下,业务分类体系包括5级919支,技术分类体系包括6级1042支,非地质类分类体系包括8级2643支;作为对比,地质类分类体系包括9支,这就是通常没有扩展的情况。
[0087]
具体地,基于知识图谱的知识库包括文献的知识库和五元组图谱文件。例如:如图6所示为基于知识图谱的知识库,相对于传统知识库,文献的知识库中的属性如分类、对象等均具有业务内涵,而且它们均在图谱中有自己对应的位置五元组图谱文件在应用中将各个孤立的业务属性和其他属性之间进行关联,从而将知识映射到图谱上,实现一串文字字符到人大脑思维模式之间的转换。
[0088]
1.7)根据步骤1.5)中建立的文献的知识库和步骤1.6)中得到的基于知识图谱的知识库,建立实例图谱。
[0089]
具体地,如图9所示,知识图谱包括概念图谱和实例图谱两部分,概念图谱和实体图谱源自对本体定义中概念和实体的扩展,其中,概念图谱是由上述表4所定义的所有关系构成,它代表了所涉及的业务及对象之间已知关系的全部;实例图谱和概念图谱的关联结构是相同的,但是由于每一实例所处的对象层级不同,因此有可能出现跨级的情况。图9中给出了概念图谱以及实例图谱的案例,从概念图谱中可以看到在业务、盆地和油气田3个概念节点上具有多个出点和入点,代表了人们业务研究和思维关注方面的重点;在实例图谱中,按照文献“渤中19-6凝析气田试验区开发钻完井基本设计”的文字层面的关联,存在“钻完井业务”和“渤中19-6凝析气田”之间的直接关联,但是在概念层面上并没有这样的连接,它们是通过实例图谱左上的一条弯曲虚线构成了业务和油气田之间的曲折的隐含关系,这条曲线是知识图谱推理的基础。
[0090]
具体地,建立的实例图谱是基于概念图谱加工后的数据构成的,概念图谱和实例图谱等效为一个网状的表头和与之对应的网状记录。
[0091]
1.8)基于建立的实例图谱,以建立的知识体系为引导,可视化展示知识图谱全景。
[0092]
具体地,图6所建立的基于知识图谱的知识库,除可以用知识条目一条条罗列展示之外,还可以将整个知识库采用图谱进行关联展示,这是知识图谱的全景图;但是对于任何一个具体的应用,均是在全景图谱上取一个局部进行研究。人如何进入到知识图谱上去,需要一个引导,正如搜索有一个搜索框一样,在知识图谱的可视化展示中,除搜索框,本发明提供了一种按照业务逻辑进行属性逐级展开的引导方式。
[0093]
具体地,知识图谱全景展示以知识体系为引导,对钻完井设计知识关联的其他要素进行可视化展示,支撑知识与设计人员、项目类型、项目流程动态匹配,协助用户查看、扩
展任意知识与设计人员、项目类型、项目流程数据及关系,如图10所示。
[0094]
2)获取项目的某一文献,并对获取的文献进行加工处理,得到文献的属性作为搜索词。
[0095]
3)如图8所示,基于用户背景、理解各专业业务流程、专业学科和成果资料类型等,在基于知识图谱的知识库中搜索框query搜索语句上,输入搜索词进行基于知识图谱的扩展搜索,得到对应的文献,如图7所示,相对于基于关键词或字符串查询的传统搜索引擎,本实施例中基于知识图谱的扩展搜索能够增加对客户意图的理解。
[0096]
具体地,基于知识图谱的扩展搜索包括一站式搜索、全文检索、高级检索和热词搜索等功能。
[0097]
具体地,基于知识图谱的扩展搜索的具体过程为:
[0098]
3.1)通过标签字典,对基于知识图谱的知识库中的搜索框query搜索语句,进行搜索词识别。
[0099]
3.2)通过上述步骤1.4.4)中预先整理得到的五元组图谱文件,对搜索词进行一层关联扩展。
[0100]
3.3)采用搜索平台,根据基于知识图谱的知识库和对象扩展结果,对搜索词进行扩展搜索,得到对应的文献。
[0101]
例如:如图8所示,加入搜索“渤中完井”,首先通过标签字典,对该搜索语句进行搜索词识别,得到“渤中”和“完井”两个搜索词,如果不进行扩展直接用这2个搜索词进行搜索,则得到的第一篇文献为“渤中某区块储层保护钻井液体系研究及应用”。由于线性序列的文字只适合文字记录,但是由于人的大脑神经触突是个空间点状关联结构,因此知识图谱能更好地描述人的思维过程,通过五元组图谱文件对“渤中/完井”进行对象扩展,可以看到“完井”代表人们思考的重点。选取1层的对象词构成新的扩展词,在搜索平台上进行扩展搜索,由此得到的第一篇文献是“渤中19-6凝析气田试验区开发钻完井基本设计报告”。对于搜索平台而言,扩展搜索也是关键词搜索,但是由于扩展词加入了很多基于理解的词,而不限于搜索语句本身,因此整个搜索结果代表了理解的结果。
[0102]
4)将加工处理后的文献加入至基于知识图谱的知识库中。
[0103]
实施例2
[0104]
如图11所示,本实施例提供一种钻完井设计文献搜索系统,包括基础层iaas、平台服务层paas和应用层saas。
[0105]
基础层iaas用于采用云服务器,提供存储资源服务、计算资源服务和网络资源服务,构建底层平台,设置与平台服务层paas连接的互联网接口和数据库采集接口,为其他各层提供基础支撑。
[0106]
平台服务层paas用于预先构建基于知识图谱的知识库,进行数据采集、知识处理和知识服务,采集钻完井数据和钻完井数据库文件数据,并根据预先建立的知识体系和知识概念图谱,得到基于知识图谱的知识库,完成知识从外部资源到系统资源以及提供服务的全流程知识转化过程。
[0107]
应用层saas用于将项目的某一文献的搜索词输入至基于知识图谱的知识库中的搜索框上,得到对应的文献,并进行图谱全景展示、知识智能搜索和智能推送,为用户提供个性化专业化服务。
[0108]
在一个优选的实施例中,平台服务层paas采用智通云联的语义魔方和通图产品工具。
[0109]
在一个优选的实施例中,基础层iaas内设置有存储资源服务模块、计算资源服务模块和网络资源服务模块。
[0110]
存储资源服务模块用于将物理存储进行虚拟化处理,提供统一的存储分配和相关权限处理。
[0111]
计算资源服务模块用于将cpu/gpu等计算资源进行统合后分配给各自的云虚拟机,为应用的运行提供基础计算服务。
[0112]
网络资源服务模块用于对虚机提供虚拟局域网构建,设定虚拟路由器,管理公网地址/局域网ip,提供成套的网络虚拟服务。
[0113]
在一个优选的实施例中,平台服务层paas内设置有数据采集模块、知识处理模块和知识服务模块。
[0114]
数据采集模块用于获取知识体系以及采集钻完井数据和钻完井数据库文件数据,建立文献的知识库。
[0115]
知识处理模块用于根据建立的知识体系和确定的知识概念图谱,对采集的数据进行知识加工和内容提取,得到属性和五元组图谱文件;对已有文献结构化数据库中的正文进行知识加工和内容提取,得到五元组图谱文件,并追加至上述建立的文献的知识库和得到的五元组图谱文件中;在建立的文献的知识库上增加知识扩展,得到基于知识图谱的知识库;根据文献的知识库和基于知识图谱的知识库,建立实例图谱。
[0116]
知识服务模块用于建立基于知识图谱的知识库的搜索框query搜索语句。
[0117]
实施例3
[0118]
本实施例提供一种与本实施例1所提供的钻完井设计文献搜索方法对应的处理设备,处理设备可以是用于客户端的处理设备,例如手机、笔记本电脑、平板电脑、台式机电脑等,以执行实施例1的方法。
[0119]
所述处理设备包括处理器、存储器、通信接口和总线,处理器、存储器和通信接口通过总线连接,以完成相互间的通信。存储器中存储有可在处理设备上运行的计算机程序,处理设备运行计算机程序时执行本实施例1所提供的钻完井设计文献搜索方法。
[0120]
在一些实现中,存储器可以是高速随机存取存储器(ram:random access memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。
[0121]
在另一些实现中,处理器可以为中央处理器(cpu)、数字信号处理器(dsp)等各种类型通用处理器,在此不做限定。
[0122]
实施例4
[0123]
本实施例提供一种与本实施例1所提供的钻完井设计文献搜索方法对应的计算机程序产品,计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本实施例1所述的钻完井设计文献搜索方法的计算机可读程序指令。
[0124]
计算机可读存储介质可以是保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是但不限于电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意组合。
[0125]
上述各实施例仅用于说明本发明,其中各部件的结构、连接方式和制作工艺等都是可以有所变化的,凡是在本发明技术方案的基础上进行的等同变换和改进,均不应排除在本发明的保护范围之外。

技术特征:
1.一种钻完井设计文献搜索方法,其特征在于,包括:获取项目的某一文献,并对获取的文献进行加工处理,得到文献的属性作为搜索词;将搜索词输入至预先建立的基于知识图谱的知识库中的搜索框上,进行基于知识图谱的扩展搜索,得到对应的文献;将加工处理后的文献加入至基于知识图谱的知识库中。2.如权利要求1所述的一种钻完井设计文献搜索方法,其特征在于,所述基于知识图谱的知识库的构建过程包括:建立知识体系,确定知识的概念图谱;采集钻完井数据和钻完井数据库文件数据,建立文献的知识库;根据建立的知识体系和确定的知识概念图谱,对采集的数据进行知识加工和内容提取,得到属性和五元组图谱文件;对已有文献结构化数据库中的正文进行知识加工和内容提取,得到五元组图谱文件,并追加至上述建立的文献的知识库和得到的五元组图谱文件中;在建立的文献的知识库上增加知识扩展,得到基于知识图谱的知识库;根据文献的知识库和基于知识图谱的知识库,建立实例图谱。3.如权利要求2所述的一种钻完井设计文献搜索方法,其特征在于,所述基于知识图谱的知识库的构建过程还包括:基于建立的实例图谱,以建立的知识体系为引导,可视化展示知识图谱全景。4.如权利要求2所述的一种钻完井设计文献搜索方法,其特征在于,所述知识体系包括知识分类体系、知识模板和知识关系,所述知识分类体系包括业务维度分类指标和技术维度分类指标。5.如权利要求2所述的一种钻完井设计文献搜索方法,其特征在于,所述钻完井数据和钻完井数据库文件数据的采集方式包括知识采集方式、接口采集、网络爬虫和模板导入,采用的知识资源包括历史设计报告、现场作业数据、科研报告、标准库和专题报告。6.如权利要求2所述的一种钻完井设计文献搜索方法,其特征在于,所述根据建立的知识体系和确定的知识概念图谱,对采集的数据进行知识加工和内容提取,得到属性和五元组图谱文件,包括:对采集的数据进行预处理,得到全文句子序列;通过标签字典对全文句子序列进行处理,将全文句子序列变换为文献内对应的各种标签;通过五元组图谱文件对各种标签进行处理,检索出文献所包括的所有五元组,将正片非结构化的文本变换为五元组图谱文件;将分散在关系型数据库中的各种对象-属性表基于知识关系整理为五元组图谱文件,并保存至上述五元组图谱文件中。7.一种钻完井设计文献搜索系统,其特征在于,包括:基础层,用于采用云服务器,提供存储资源服务、计算资源服务和网络资源服务,构建底层平台,设置互联网接口和数据库采集接口,为其他各层提供基础支撑;平台服务层,用于预先构建基于知识图谱的知识库,进行数据采集、知识处理和知识服务;
应用层,用于将项目的某一文献的搜索词输入至基于知识图谱的知识库中的搜索框上,得到对应的文献。8.如权利要求7所述的一种钻完井设计文献搜索系统,其特征在于,所述平台服务层内设置有:数据采集模块,用于获取知识体系以及采集钻完井数据和钻完井数据库文件数据,建立文献的知识库;知识处理模块,用于根据建立的知识体系和确定的知识概念图谱,对采集的数据进行知识加工和内容提取,得到属性和五元组图谱文件;对已有文献结构化数据库中的正文进行知识加工和内容提取,得到五元组图谱文件,并追加至上述建立的文献的知识库和得到的五元组图谱文件中;在建立的文献的知识库上增加知识扩展,得到基于知识图谱的知识库;根据文献的知识库和基于知识图谱的知识库,建立实例图谱;知识服务模块,用于建立基于知识图谱的知识库的搜索框。9.一种处理设备,其特征在于,包括计算机程序指令,其中,所述计算机程序指令被处理设备执行时用于实现权利要求1-6中任一项所述的钻完井设计文献搜索方法对应的步骤。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,其中,所述计算机程序指令被处理器执行时用于实现权利要求1-6中任一项所述的钻完井设计文献搜索方法对应的步骤。

技术总结
本发明涉及一种钻完井设计文献搜索方法、系统、设备及介质,其特征在于,包括:获取项目的某一文献,并对获取的文献进行加工处理,得到文献的属性作为搜索词;将搜索词输入至预先建立的基于知识图谱的知识库中的搜索框上,进行基于知识图谱的扩展搜索,得到对应的文献;将加工处理后的文献加入至基于知识图谱的知识库中,本发明可以广泛应用于知识图谱构建技术领域中。术领域中。术领域中。


技术研发人员:刘兆年 岳家平 谢仁军 范白涛 幸雪松 李中 王宁 刘宇沛 王名春 仝刚 姬煜晨 张兴全 潘豪
受保护的技术使用者:中海石油(中国)有限公司北京研究中心
技术研发日:2023.03.30
技术公布日:2023/7/28
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐