一种文件云存储自动化归档的方法和系统与流程

未命名 09-20 阅读:49 评论:0


1.本发明涉及数据云存储技术领域,特别涉及一种文件云存储自动化归档的方法和系统。


背景技术:

2.在大数据、云计算的时代背景下,企业和个人的文件数量庞大、类型繁多,无法统一管理、快速检索共享,给工作生活造成诸多的不便。目前市面上有很多品牌的在线网盘系统,但这些单纯的文件存储服务把办公生活文件夹杂在一起,未能很好地将工作和生活文件区分,用户不能在短时间内有效地检索到想要的文件。


技术实现要素:

3.本发明实施例提供了一种文件云存储自动化归档的方法和系统,以至少解决相关技术中文件分区不便检索的技术问题。
4.根据本发明实施例的一方面,提供了一种文件云存储自动化归档的方法,包括:接收文件,将所述文件存储于服务器内存中备用;
5.采集所述文件的文件特征,根据所有采集的文件特征建立信息特征库;
6.对采集的文件特征对进行分类整合;
7.根据分类整合的结果对文件生成特征伪连接,所述伪链接只对文件进行路径标识,具有相同一特征的文件标识于一个分类,每个特性分类归档相同特性分类的文件链接;
8.将存储于服务器内存中的文件取出中,存入分布式文件系统,并根据伪链接将文件进行链接路由形成分身文件,完成对文件归档。
9.可选地,还包括对使用者提供控制权限的账户和密码,用于对云存储的文件进行管理。
10.可选地,所述文件特征包括:文件所属业务系统、所属人、文件名、文件类型、文件大小及文件权限。
11.可选地,根据所有采集的文件特征建立信息特征库包括:对每次接收文件进行文件特征采集,并将采集到的文件特征归集到已建立的特征库中。
12.可选地,对采集的文件特征对进行分类整合包括:对采集的文件特征对进行分类形成特征树,并将文件关联到叶子节点。
13.可选地,所述分身文件只包含源文件的地址和文件在该路径下的特征。
14.可选地,还包括:在用户操作删除存储在分布式文件系统中的文件时,将文件置为待删除状态并放入回收站中,采用定时清理状态为待删除文件的机制进行文件实际删除。
15.根据本发明实施例的另一方面,还提供了一种文件云存储自动化归档的系统,包括:
16.服务器,用于接收和存储文件;
17.第一数据处理模块,用于采集所述文件的文件特征,根据所有采集的文件特征建
立信息特征库;
18.第二数据处理模块,用于对采集的文件特征对进行分类整合;
19.第三数据处理模块,用于根据分类整合的结果对文件生成特征伪连接,所述伪链接只对文件进行路径标识,具有相同一特征的文件标识于一个分类,每个特性分类归档相同特性分类的文件链接;
20.分布式文件系统,用于将存储于服务器内存中的文件取出中,存入分布式文件系统,并根据伪链接将文件进行链接路由形成分身文件,完成对文件归档。
21.根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行上述任意一项所述的文件云存储自动化归档的方法。
22.根据本发明实施例的另一方面,还提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述任意一项所述的文件云存储自动化归档的方法。
23.与现有的技术相比,本发明具有如下有益效果:
24.1、本发明所提供的文件云存储自动化归档的方法,通过采集文件的文件特征,对采集的文件特征对进行分类,根据分类结果对文件生成特征伪连接,将文件存储在分布式文件系统中,并根据伪链接将文件进行链接路由形成分身文件,完成对文件归档,从而能获得一个文件实际存储地址和文件所有特征的伪地址,文件的伪地址即是文件的特征归档地址。依据文件特征制定文件存储目录规则,便于对文件做分类管理,方便归档和查阅文件。根据文件特征制定文件存储目录规则,便于对文件做分类管理,方便归档和查阅文件。且通过将文件存在分布式文件系统中,使文件以多副本形式存储在底层存储系统中,保证文件的唯一与安全。
25.2、通过将文件存在分布式文件系统中,使文件以多副本形式存储在底层存储系统中,保证文件的唯一与安全。
26.3、文件所有特征的伪地址为依据文件特征制定文件存储目录,将文件以软链接的形式放置于基于特征树生成的目录下便于对文件做分类管理,也可由业务系统通过api参数指定基于自己系统所在目录下的文件目录层级,再依据文件特征进行分类链接到文件。
27.4、采用定时清理文件为文件采用逻辑删除机制,逻辑删除的文件保留一段时间后定期清理,便于支持找回近期误删文件
附图说明
28.为了更清楚地说明本发明的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一个实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
29.图1是根据本发明实施例的一种文件云存储自动化归档的方法的流程图。
具体实施方式
30.需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本技术。
31.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的
附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分的实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本技术保护的范围。
32.需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
33.实施例1
34.根据本发明实施例,提供了一种文件云存储自动化归档的方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
35.如图1是根据本发明实施例的一种文件云存储自动化归档的方法的流程图,如图1所示,文件云存储自动化归档的方法包括如下步骤:
36.s1、接收文件,将所述文件存储于服务器内存中备用。
37.s2、采集所述文件的文件特征,根据所有采集文件特征建立信息特征库,即每次接收文件都将进行文件特征采集流程,并将采集到的文件特征归集到已建立的特征库中;
38.其中,文件特征包括但不限于:文件所属业务系统、所属人、文件名、文件类型、文件大小及文件权限。
39.s3、对采集的文件特征对进行分类整合,形成特征树,并将文件关联到叶子节点;
40.s4、根据步骤s3的分类整合的结果对文件生成特征伪连接,所述伪链接只对文件进行路径标识,具有相同一特征的文件标识于一个分类,每个特性分类归档相同特性分类的文件链接;
41.s5、将文件从服务器内存中取出,存入分布式文件系统中,进行持久化存储,并根据伪链接将文件进行链接路由形成分身文件,分身文件只包含源文件的地址和文件在该路径下的特征,完成对文件归档。
42.上述的文件云存储自动化归档的方法,通过接收文件,将所述文件存储于服务器内存中备用;采集所述文件的文件特征,根据所有采集的文件特征建立信息特征库;对采集的文件特征对进行分类整合;根据分类整合的结果对文件生成特征伪连接,所述伪链接只对文件进行路径标识,具有相同一特征的文件标识于一个分类,每个特性分类归档相同特性分类的文件链接;将存储于服务器内存中的文件取出中,存入分布式文件系统,并根据伪链接将文件进行链接路由形成分身文件,完成对文件归档,从而能获得一个文件实际存储地址和文件所有特征的伪地址,文件的伪地址即是文件的特征归档地址。依据文件特征制定文件存储目录规则,便于对文件做分类管理,方便归档和查阅文件。根据文件特征制定文件存储目录规则,便于对文件做分类管理,方便归档和查阅文件。且通过将文件存在分布式文件系统中,使文件以多副本形式存储在底层存储系统中,保证文件的唯一与安全。
43.作为一种可选的实施例,文件云存储自动化归档的方法还包括对使用者提供控制权限的账户和密码,用于对云存储的文件进行管理。具体的,可以在步骤s1之前进行生成账户和密码。实现为接入者分配账户和密钥配置参数,便于实现接口鉴权。
44.作为一种可选的实施例,步骤s2中,根据文件特征分别对文件建立信息特征库包括:通过采集的文件特征对文件进行标注,得到一个包含标签信息化的文件。
45.作为一种可选的实施例,步骤s3中,对采集的文件特征对进行分类整合包括:相似特征提炼上游属性,例如文件的大小、类型上游属性为文件基础信息,文件归属人、文件归属系统上游属性为文件扩展信息;将特征整合构建成一棵特征树,并将文件关联到叶子节点。
46.作为一种可选的实施例,文件云存储自动化归档的方法还包括步骤s6:在用户操作删除存储在分布式文件系统中的文件时,将文件置为待删除状态并放入回收站中,采用定时清理状态为待删除文件的机制进行文件实际删除。例如,每3个月清理一次。文件采用逻辑删除机制,逻辑删除的文件保留一段时间后定期清理,便于支持找回近期误删文件。
47.作为一种可选的实施例,文件云存储自动化归档的方法还包括步骤s7:当已归档的文件有修改时,将使用修改后的文件替换已归档文件进行重新的归档操作,并重复步骤s1-s5本流程生成新的文件特征信息、伪连接、分身文件等,将被替换的文件作为历史版本进行存储。
48.对于文件历史版本,每一次修改文档,系统都会保留一个版本到历史记录,可以列出所有的版本信息,下载任何一个版本做对比。还可以对每一个版本做备注,方便查找。支持自定义设置历史版本数量或保存时间。
49.作为一种可选的实施例,文件云存储自动化归档的方法还包括步骤s8:对需要访问归档文件的用户进行权限校验,权限校验包括:权限低或未登录用户无法获取到已归档的保密程度高的文件,进一步保证文件的私密性以及安全性。
50.实施例2
51.根据本发明实施例的另一方面,还提供了一种文件云存储自动化归档的系统,文件云存储自动化归档的系统应用上述的文件云存储自动化归档的方法,文件云存储自动化归档的系统包括:
52.服务器,用于接收和存储文件;
53.第一数据处理模块,用于采集所述文件的文件特征,根据所有采集的文件特征建立信息特征库;
54.第二数据处理模块,用于对采集的文件特征对进行分类整合;
55.第三数据处理模块,用于根据分类整合的结果对文件生成特征伪连接,所述伪链接只对文件进行路径标识,具有相同一特征的文件标识于一个分类,每个特性分类归档相同特性分类的文件链接;
56.分布式文件系统,用于将存储于服务器内存中的文件取出中,存入分布式文件系统,并根据伪链接将文件进行链接路由形成分身文件,完成对文件归档。
57.本发明不局限于以上的具体实施方式,以上仅为本发明的较佳实施案例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
58.实施例3
59.根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,该计算机可读存储介质包括存储的程序,其中,在程序运行时控制计算机可读存储介质所在设备执行上述中任意一项的文件云存储自动化归档的方法。
60.可选地,在本实施例中,上述计算机可读存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中,上述计算机可读存储介质包括存储的程序。
61.可选地,在程序运行时控制计算机可读存储介质所在设备执行以下功能:接收文件,将所述文件存储于服务器内存中备用;采集所述文件的文件特征,根据文件特征分别对文件建立信息特征库;对采集的文件特征对进行分类;根据分类结果对文件生成特征伪连接,所述伪链接只对文件进行路径标识,具有相同一特征的文件标识于一个分类,每个特性分类归档相同特性分类的文件链接;将文件存储在分布式文件系统中,并根据伪链接将文件进行链接路由形成分身文件,完成对文件归档。
62.实施例4
63.根据本发明实施例的另一方面,还提供了一种处理器,该处理器用于运行程序,其中,程序运行时执行上述中任意一项的文件云存储自动化归档的方法。
64.本发明实施例提供了一种设备,该设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现文件云存储自动化归档的方法的步骤。
65.上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
66.在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
67.在本技术所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的系统实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接可以是电性或其它的形式。
68.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
69.另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
70.所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、只读存储器(rom,read-0nlymemory)、随机存取存
储器(ram,randomaccessmemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
71.以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

技术特征:
1.一种文件云存储自动化归档的方法,其特征在于,包括:接收文件,将所述文件存储于服务器内存中备用;采集所述文件的文件特征,根据所有采集的文件特征建立信息特征库;对采集的文件特征对进行分类整合;根据分类整合的结果对文件生成特征伪连接,所述伪链接只对文件进行路径标识,具有相同一特征的文件标识于一个分类,每个特性分类归档相同特性分类的文件链接;将存储于服务器内存中的文件取出中,存入分布式文件系统,并根据伪链接将文件进行链接路由形成分身文件,完成对文件归档。2.根据权利要求1所述的文件云存储自动化归档的方法,其特征在于,还包括对使用者提供控制权限的账户和密码,用于对云存储的文件进行管理。3.根据权利要求1所述的文件云存储自动化归档的方法,其特征在于,所述文件特征包括:文件所属业务系统、所属人、文件名、文件类型、文件大小及文件权限。4.根据权利要求1所述的文件云存储自动化归档的方法,其特征在于,根据所有采集的文件特征建立信息特征库包括:对每次接收文件进行文件特征采集,并将采集到的文件特征归集到已建立的特征库中。5.根据权利要求1所述的文件云存储自动化归档的方法,其特征在于,对采集的文件特征对进行分类整合包括:对采集的文件特征对进行分类形成特征树,并将文件关联到叶子节点。6.根据权利要求1所述的文件云存储自动化归档的方法,其特征在于,所述分身文件只包含源文件的地址和文件在该路径下的特征。7.根据权利要求1所述的文件云存储自动化归档的方法,其特征在于,还包括:在用户操作删除存储在分布式文件系统中的文件时,将文件置为待删除状态并放入回收站中,采用定时清理状态为待删除文件的机制进行文件实际删除。8.一种文件云存储自动化归档的系统,其特征在于,包括:服务器,用于接收和存储文件;第一数据处理模块,用于采集所述文件的文件特征,根据所有采集的文件特征建立信息特征库;第二数据处理模块,用于对采集的文件特征对进行分类整合;第三数据处理模块,用于根据分类整合的结果对文件生成特征伪连接,所述伪链接只对文件进行路径标识,具有相同一特征的文件标识于一个分类,每个特性分类归档相同特性分类的文件链接;分布式文件系统,用于将存储于服务器内存中的文件取出中,存入分布式文件系统,并根据伪链接将文件进行链接路由形成分身文件,完成对文件归档。9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至7中任意一项所述的文件云存储自动化归档的方法。10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至7中任意一项所述的文件云存储自动化归档的方法。

技术总结
本发明公开了一种文件云存储自动化归档的方法和系统,通过采集文件的文件特征,对采集的文件特征对进行分类,根据分类结果对文件生成特征伪连接,将文件存储在分布式文件系统中,并根据伪链接将文件进行链接路由形成分身文件,完成对文件归档,从而能获得一个文件实际存储地址和文件所有特征的伪地址,文件的伪地址即是文件的特征归档地址。依据文件特征制定文件存储目录规则,便于对文件做分类管理,方便归档和查阅文件。根据文件特征制定文件存储目录规则,便于对文件做分类管理,方便归档和查阅文件。且通过将文件存在分布式文件系统中,使文件以多副本形式存储在底层存储系统中,保证文件的唯一与安全。保证文件的唯一与安全。保证文件的唯一与安全。


技术研发人员:余威 黄永刚 覃琳 韦远露 李凤英 缪全海 林广康 陆霖 吴家武 蒙琳
受保护的技术使用者:广西计算中心有限责任公司
技术研发日:2023.06.29
技术公布日:2023/9/19
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐