一种工包文档管理方法及系统与流程

未命名 07-27 阅读:95 评论:0


1.本发明涉及文档管理技术领域,尤其涉及一种工包文档管理方法及系统。
技术背景:
2.当前国内企业对设备操作、维修、维护、试验、巡检等作业活动中使用海量的纸质工包文件,是工作人员每天现场执行各项活动,以工程项目技术文档为例,如填写、修改、审批、签发、打印、存档、作废所必须使用的实物介质,各专业文档中带有的数据参数比较多,传统的专业文档按照专业领域不同文档版面格式及技术指标表达形式也不尽相同,对数据的精度要求也不统一,因此这类文档虽满足专业使用习惯,但文档规范化程度、数据精度要求很难通过人工控制手段来有效控制。同时,由于文档的种类繁多且都是非结构化,文档数据的采集和提取方面,目前采用语义分析和提取能够有效发现关键字,但很难准确提取到符合工程要求的参数、数据及描述信息。而工作文件包的执行效率直接影响工作人员的操作效率、质量和进度,因此单靠人工控制、提取和转换已不能满足电厂领域对文档的需求。


技术实现要素:

3.针对上述现有技术的不足,本技术提供了一种工包文档管理方法及系统,以解决现有技术无法同时满足电厂领域文档的传统使用需求和文档规范化控制、关键指标参数精度控制、自动化提取文档数据和知识发现及提取的问题。
4.为解决上述问题,本发明提供了一种工包文档管理方法,包括以下步骤:
5.根据规范化标准,按照工作类型、文档类型构建不同框架结构的工包文档标准化框架;
6.利用工包文档标准化框架生成和管理工包文档;
7.提取工包文档结构化数据,并转化为json结构体数据和文档属性字段;
8.将json结构体数据和文档属性字段嵌入到目标格式文档中;
9.按照嵌入体格式特征读取目标格式文档。
10.进一步地,所述根据规范化标准,按照工作类型、文档类型构建不同框架结构的工包文档标准化框架包括:
11.按照框架结构与目标内容的对应关系,关联结构化数据标签、可扩展的半结构化数据标签。
12.进一步地,所述提取结构化数据,并转化为json结构体数据和文档属性字段包括:
13.将生成的工包文档数据按照工包文档标准化框架中相对应的结构化数据标签及可扩展的半结构化数据标签关联。
14.进一步地,所述将json结构体数据和文档属性字段嵌入到目标格式文档的步骤包括:
15.将json结构体数据和文档属性字段按照嵌入体格式进行封装,并根据目标文档文件存储格式的特性,预先通过嵌入点可靠性验证,确定结构体数据在目标文档中的嵌入位
置,并将其嵌入到目标格式文档中。
16.进一步地,所述按照嵌入体格式特征读取目标格式文档包括:
17.按照嵌入体格式特征提取目标格式文档中的结构体数据并获取文档的相关属性字段,根据相关属性字段匹配到相应工包文档标准化框架,以此工包文档标准化框架提供的框架结构为特征,读取目标格式文档中的结构化数据和可扩展的半结构化数据。
18.进一步地,所述利用工包文档标准化框架生成和管理工包文档包括:
19.根据工作类型、文档类型选取相对应的工包文档标准化框架,预加载到内置的工包文档编辑器中,根据用户输入的数据和指令完成工包文档的生成与管理。
20.进一步地,所述文档属性字段包括但不限于文档标题、文档主题分类、框架信息、作者、关键字、数字签名人信息及数字签名。
21.本发明还提供了一种工包文档管理系统,包括:
22.工包文档标准化框架构建模块;
23.所述工包文档标准化框架构建模块由框架生成器、工包文档编辑器、标准化框架库组成;
24.结构化数据嵌入模块;
25.所述结构化数据嵌入模块由结构化数据提取器、结构化数据控制器、数据认证处理器和数据提取与转换接口组成;
26.工包文档读取模块。
27.进一步地,所述工包文档编辑器由加载文档框架单元、文档编辑与显示单元、结构化数据标签化编辑与显示单元、结构化文档生成单元组成。
28.进一步地,所述结构化数据控制器由结构体数据封装单元和嵌入位置控制单元组成。
29.有益效果:
30.电厂是由诸多部门与岗位组成的综合型企业,与现有技术相比,本发明按照工作类型、文档类型构建出不同框架结构的工包文档标准化框架,能够在不改变原文档格式的前提下,提取与文档相关及相一致的结构化数据,方便电厂内不同专业领域的用户使用,适用性强,大大提升了工作效率。另外,本发明将结构化数据嵌入至目标文档中,可以使其在不进行任何预先处理的前提下,由现有文档格式类型相关联的软件正常读取和显示。同时,文档的结构化数据体不易被人为篡改,使文档数据具备真实性和不可抵赖性。因此,本发明即能满足电厂用户的编辑和查阅需求,又可通过结构化的提取方式提取文档中嵌入的结构化和半结构化数据信息,实现嵌入结构化数据的工包文档的自动化采集与处理,并可有效控制工包文档的规范化程度。
附图说明:
31.此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
32.图1为本发明实施例中工包文档管理方法的流程示意图;
33.图2为本发明实施例中工包文档管理系统的结构框架图。
具体实施方式:
34.为使本发明的上述目的、特征和优点能够更加明显易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其它实施例,均属于本发明保护的范围。
35.实施例1:
36.如图1所示,本发明实施例提供了一种工包文档管理方法,该方法包括以下步骤:
37.首先,构建工包文档标准化框架,这一过程的关键在于所构建的工包文档标准化框架应满足所涉及工作类型、文档类型的框架结构要求,并按照准化框架与目标内容的对应关系,建立结构化数据标签、可扩展的半结构化数据标签。使其能够起到建立标准化文档、便于提取结构化数据、规范文档关键描述及指标参数、重复利用的作用。
38.与现有技术相比,该实施例将具体的编写要求以结构化标签及属性的形式,作为文档编辑时的控制指标,规范所编辑的内容。其中,结构化标签用于标记文档中已明确的描述和关键指标参数,通常属于编写要求的一部分,例如:电厂内部设备维修文档中通常会涉及的场地位置、故障位置、报修配件等关键性描述和指标参数。而可扩展的半结构化标签则用于标记文档中无法明确的描述和关键指标参数,例如:设备故障的特殊性及相关指标参数。另外,工包文档中的描述和关键指标参数的数据精度预先由标准化框架相应标签属性来约定,以便在工包文档编辑时进行提取和控制数据。
39.然后利用工包文档标准化框架生成和管理文档,这一过程由工包文档准化框架内置的工包文档编辑器完成,以实现工包文档准化框架的工包文档生成及结构化数据提取操作。
40.进一步地,提取工包文档结构化数据,并转化为json结构体数据和文档属性字段,将生成的工包文档数据按照工包文档标准化框架中相对应的结构化数据标签及可扩展的半结构化数据标签关联。其中,文档属性字段包括但不限于文档标题、文档主题分类、框架信息、作者、关键字、数字签名人信息及数字签名。
41.更进一步地,将json结构体数据和文档属性字段嵌入到目标格式文档中。具体地,将获得的json结构体数据和文档属性字段按照嵌入体格式进行封装,并根据目标文档文件存储格式的特性,预先通过嵌入点可靠性验证,确定结构体数据在目标文档中的嵌入位置,并将其嵌入到目标格式文档中,最终完成工包文档的归档。
42.如需调用、阅读相关工包文档,可按照嵌入体格式特征读取目标格式文档,具体地,本发明实施例可按照嵌入体格式特征提取目标格式文档中的结构体数据并获取文档的相关属性字段,根据相关属性字段中的框架信息匹配到相应工包文档标准化框架,以此工包文档标准化框架提供的框架结构为特征,读取目标格式文档中的结构化数据和可扩展的半结构化数据。
43.与现有技术相比,本发明实施例按照工作类型、文档类型构建出不同框架结构的工包文档标准化框架,能够在不改变原文档格式的前提下,提取与文档相关及相一致的结构化数据,方便电厂内不同专业领域的用户使用,适用性强,大大提升了工作效率。另外,本发明将结构化数据嵌入至目标文档中,可以使其在不进行任何预先处理的前提下,由现有
文档格式类型相关联的软件正常读取和显示。同时,文档的结构化数据体不易被人为篡改,使文档数据具备真实性和不可抵赖性。因此,本发明即能满足电厂用户的编辑和查阅需求,又可通过结构化的提取方式提取文档中嵌入的结构化和半结构化数据信息,实现嵌入结构化数据的工包文档的自动化采集与处理,并可有效控制工包文档的规范化程度。
44.实施例2:
45.如图2所示,本发明实施例提供了一种工包文档管理系统,包括:
46.工包文档标准化框架构建模块,该模块由框架生成器、工包文档编辑器、标准化框架库组成。其中,工包文档编辑器由加载文档框架单元、文档编辑与显示单元、结构化数据标签化编辑与显示单元、结构化文档生成单元组成。
47.具体地,用户可根据工作类型和文档类型由框架生成器通过框架匹配模块从标准化框架库中选取已构建好的相应框架,将其送入工包文档标准化框架,通过提取标准化框架中与之相关联的结构化标签、可扩展的半结构化标签,生成能够被文档编辑器所能识别、控制和定位的标签化文本,再发送给工包文档编辑器的加载文档框架单元。动态完成与工包文档框架结构相对应的结构化数据标签、可扩展的半结构化数据标签的编辑与管理。其中,加载文档框架单元负责标签化文本的加载与分配,其将加载后的标签化文本分配给结构化数据标签化编辑与显示单元。再由结构化数据标签化编辑与显示单元启动文档编辑与显示单元,并通过与用户交互的方式动态地完成标签及属性所约定的关键描述和指标参数的收集,确保在满足文档规范化控制和关键指标参数精度控制要求的同时完成文档内容编辑。当文档编辑与显示单元启动后,按照文档类型调取相应的文档编辑组件,用于与结构化数据标签化编辑与显示单元同步并完成保存。
48.结构化数据嵌入模块,该模块由结构化数据提取器、结构化数据控制器、数据认证处理器和数据提取与转换接口组成。其中,结构化数据控制器由结构体数据封装单元和嵌入位置控制单元组成。
49.具体地,当用户发出归档指令后,由工包文档编辑器将生成的工包文档发送给结构化数据提取器,当完成数据接收后,提取工包文档中的文档属性字段和json结构体数据,并将提取后的文档属性字段发送给结构化数据控制器。值得注意的是,数据认证处理器负责对结构化数据提取器输出的json结构体数据进行数字签名。具体地,数据认证时通过文档属性字段提供的签名人信息,匹配系统认可的签名人数字证书,来完成验证。当签名人是系统认可的而且数字签名与json结构体数据相匹配,此时签名状态信息为验证通过。通过以上过程确保json结构体数据的真实性和不可抵赖性。完成签名后,将签名后的json结构体数据和签名状态信息发送给结构化数据控制器。实现签名后的json结构体数据和文档属性字段由结构体数据封装单元按照嵌入体格式进行封装,据目标文档文件存储格式特性,在不影响和干扰目标文件存储格式的前提下,预先通过嵌入点可靠性验证,确定结构化数据体在目标文档中的嵌入位置,并将其嵌入到目标格式文件中得到嵌入结构化数据的文档并进行归档。
50.工包文档读取模块,该模块可以按照嵌入体格式特征提取目标格式文档中的结构体数据并获取文档的相关属性字段,根据相关属性字段匹配到相应的工包文档标准化框架,以此工包文档标准化框架提供的框架结构为特征,读取目标格式文档中的结构化数据和可扩展的半结构化数据。
51.以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

技术特征:
1.一种工包文档管理方法,其特征在于,包括以下步骤:根据规范化标准,按照工作类型、文档类型构建不同框架结构的工包文档标准化框架;利用工包文档标准化框架生成和管理工包文档;提取工包文档结构化数据,并转化为json结构体数据和文档属性字段;将json结构体数据和文档属性字段嵌入到目标格式文档中;按照嵌入体格式特征读取目标格式文档。2.根据权利要求1所述的工包文档管理方法,其特征在于,所述根据规范化标准,按照工作类型、文档类型构建不同框架结构的工包文档标准化框架包括:按照框架结构与目标内容的对应关系,关联结构化数据标签、可扩展的半结构化数据标签。3.根据权利要求2所述的工包文档管理方法,其特征在于,所述提取结构化数据,并转化为json结构体数据和文档属性字段包括:将生成的工包文档数据按照工包文档标准化框架中相对应的结构化数据标签及可扩展的半结构化数据标签关联。4.根据权利要求1所述的工包文档管理方法,其特征在于,所述将json结构体数据和文档属性字段嵌入到目标格式文档的步骤包括:将json结构体数据和文档属性字段按照嵌入体格式进行封装,并根据目标文档文件存储格式的特性,预先通过嵌入点可靠性验证,确定结构体数据在目标文档中的嵌入位置,并将其嵌入到目标格式文档中。5.根据权利要求1所述的工包文档管理方法,其特征在于,所述按照嵌入体格式特征读取目标格式文档包括:按照嵌入体格式特征提取目标格式文档中的结构体数据并获取文档的相关属性字段,根据相关属性字段匹配到相应的工包文档标准化框架,以此工包文档标准化框架提供的框架结构为特征,读取目标格式文档中的结构化数据和可扩展的半结构化数据。6.根据权利要求1所述的工包文档管理方法,其特征在于,所述利用工包文档标准化框架生成和管理工包文档包括:根据工作类型、文档类型选取相对应的工包文档标准化框架,预加载到内置的工包文档编辑器中,根据用户输入的数据和指令完成工包文档的生成与管理。7.根据权利要求1所述的工包文档管理方法,其特征在于,所述文档属性字段包括但不限于文档标题、文档主题分类、框架信息、作者、关键字、数字签名人信息及数字签名。8.一种工包文档管理系统,其特征在于,包括:工包文档标准化框架构建模块;所述工包文档标准化框架构建模块由框架生成器、工包文档编辑器、标准化框架库组成;结构化数据嵌入模块;所述结构化数据嵌入模块由结构化数据提取器、结构化数据控制器、数据认证处理器和数据提取与转换接口组成;工包文档读取模块。9.根据权利要求8所述的工包文档管理系统,其特征在于,所述工包文档编辑器由加载
文档框架单元、文档编辑与显示单元、结构化数据标签化编辑与显示单元、结构化文档生成单元组成。10.根据权利要求8所述的工包文档管理系统,其特征在于,所述结构化数据控制器由结构体数据封装单元和嵌入位置控制单元组成。

技术总结
本发明提供了一种工包文档管理方法及系统,包括以下步骤:根据规范化标准,按照工作类型、文档类型构建不同框架结构的工包文档标准化框架;利用工包文档标准化框架生成和管理工包文档;提取工包文档结构化数据,并转化为json结构体数据和文档属性字段;将json结构体数据和文档属性字段嵌入到目标格式文档中;按照嵌入体格式特征读取目标格式文档。本发明按照工作类型、文档类型构建出不同框架结构的工包文档标准化框架,能够在不改变原文档格式的前提下,提取与文档相关及相一致的结构化数据,方便电厂内不同专业领域的用户使用,适用性强,大大提升了工作效率。大大提升了工作效率。大大提升了工作效率。


技术研发人员:孙玉 张欢 赵笑禹 刘君豪 何成财 何海洋 赵玉珠
受保护的技术使用者:源讯信息技术(中国)有限公司
技术研发日:2023.04.04
技术公布日:2023/7/25
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐