基于抽样滤波差分隐私保护模型的时序数据发布方法与流程
未命名
08-22
阅读:98
评论:0

1.本技术涉及信息技术安全领域,特别涉及一种基于抽样滤波差分隐私保护模型的时序数据发布方法、装置、电子设备及计算机可读存储介质。
背景技术:
2.随着大数据、云计算和移动互联网的快速发展和广泛应用,各种信息数据不断的扩大延伸,信息技术的应用在当今社会下已经随处可见,这些再给用户带来个性化服务,提高用户便利度的同时,也带来了用户数据使用的风险。数据泄露事件日渐增多,数据被攻击、窃取、劫持等事件一波接一波,比比皆是。
3.基于正式施行的《中华人民共和国数据安全法》将进一步确保了数据处于有效保护和合法利用的状态,以更好保护个人和组织的合法权益,维护国家主权、安全和发展利益。基于此,需要采取技术与管理双管齐下的方法,提出系统化的应对措施和解决方案,并制定相关标准和实施办法。
4.电力市场作为新型电力系统中重要的一部分,在管理信息大区中,积累了大量的动态电力数据,例如财务数据、营销数据、人资数据、市场信息、生产管理信息等,这些来自于不同用户的数据集中,蕴含着大量的敏感信息。为了保证电力市场的安全效率运行,需要有效地进行电力市场数据交互,在保护用户数据安全性的同时,保护用户数据的可用性。随着新型电力系统建设的推进,未来能源电力市场数据流通与协同应用将面临更多样化、复杂化的场景。因此,在电力市场运行过程中合理进行数据安全保护是当下的关键问题。
5.差分隐私作为一种近些年兴起的一种隐私保护思想,它可以不对攻击者的背景知识做任何的假设,旨在提供一种当从统计数据库查询时,最大化数据查询的准确性,同时最大限度减少识别其记录的机会。差分隐私对隐私泄露风险与隐私保护效果有定量化的表示和证明,具有较高的数学逻辑性,可以科学合理地刻画实现的隐私保护效果。
6.但是,在电力市场化大数据时代,如果要完整地实现在差分隐私的约束下提供较为准确的时序数据隐私保护,还面临许多需要解决的技术问题。
技术实现要素:
7.本技术的目的是提供一种基于抽样滤波差分隐私保护模型的时序数据发布方法、装置、电子设备及计算机可读存储介质。
8.为实现上述目的,本技术在第一方面提供了一种基于抽样滤波差分隐私保护模型的时序数据发布方法,该方法包括:按照多个不同的预设抽样间隔,分别对原始时序数据进行抽样处理,得到抽样数据和非抽样数据;对抽样数据采用相关拉普拉斯机制添加噪声,以得到经噪声添加后满足差分隐私保护要求的噪声添加后数据;运用vmd-维纳滤波技术对噪声添加后数据进行平稳化再修正处理,得到修正后数据;将与相同的预设抽样间隔对应的修正后数据和非抽样数据进行组合,得到与各预设抽样间隔分别对应的待发布数据;通过动态时间规整评价机制对各待发布数据进行评价,确定最优抽样间隔和与最优抽样间隔对
应的最优待发布数据;发布最优待发布数据。
9.为实现上述目的,本技术在第二方面提供了一种基于抽样滤波差分隐私保护模型的时序数据发布装置,该装置包括:自定义间隔抽样单元,被配置成按照多个不同的预设抽样间隔,分别对原始时序数据进行抽样处理,得到抽样数据和非抽样数据;差分隐私保护处理单元,被配置成对抽样数据采用相关拉普拉斯机制添加噪声,以得到经噪声添加后满足差分隐私保护要求的噪声添加后数据;平稳化再修正单元,被配置成运用vmd-维纳滤波技术对噪声添加后数据进行平稳化再修正处理,得到修正后数据;待发布数据组合单元,被配置成将与相同的预设抽样间隔对应的修正后数据和非抽样数据进行组合,得到与各预设抽样间隔分别对应的待发布数据;评价单元,被配置成通过动态时间规整评价机制对各待发布数据进行评价,确定最优抽样间隔和与最优抽样间隔对应的最优待发布数据;发布单元,被配置成发布最优待发布数据。
10.为实现上述目的,本技术在第三方面提供了一种电子设备,该电子设备包括:
11.存储器,用于存储计算机程序;
12.处理器,用于在执行存储于存储器上的计算机程序时可实现如上述第一方面所描述的基于抽样滤波差分隐私保护模型的时序数据发布方法的各步骤。
13.为实现上述目的,本技术在第四方面提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述第一方面所描述的基于抽样滤波差分隐私保护模型的时序数据发布的各步骤。
14.相比于现有技术,本技术所提供的基于抽样滤波差分隐私保护模型的时序数据发布方案,首先,利用固定抽样技术,对抽样点的数据进行加噪及过滤,降低了整个系统的运行时间,提高了系统效率;其次,利用相关拉普拉斯机制对相关时间序列数据进行发布,由于该技术利用了序列不可区分性,通过使用四个高斯白噪声序列通过线性系统相互作用,生成相关的拉普拉斯噪声序列,而不是单独生成独立的噪声序列,使得通过多种不同的高斯白噪声串联,保证了数据的高实用性,并避免了由于普通拉普拉斯噪声具有独立同分布特性而导致的隐私度低于预期的问题;接着,通过采用vmd-维纳滤波技术,对加噪后的数据进行平稳化再修正使得发布数据更加接近原始值,在保证数据隐私性基本不变的前提条件下,使发布数据的可用性更高;最后,将动态时间规整的概念运用在差分隐私中,利用动态时间规整选择最优的抽样间隔,得到时序数据发布隐私性与可用性平衡较优的抽样点。
15.本技术同时还提供了一种基于抽样滤波差分隐私保护模型的时序数据发布装置、电子设备及计算机可读存储介质,具有上述有益效果,在此不再赘述。
附图说明
16.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
17.图1为本技术实施例提供的一种基于抽样滤波差分隐私保护模型的时序数据发布方法的流程图;
18.图2为本技术实施例提供的一种与图1对应的流程示意图;
19.图3为本技术实施例提供的一种利用相关拉普拉斯机制生成噪声的过程示意图;
20.图4为本技术实施例提供的一种进行vmd-维纳滤波的过程示意图;
21.图5为本技术实施例提供的一种基于抽样滤波差分隐私保护模型的时序数据发布装置的结构框图。
具体实施方式
22.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本技术保护的范围。
23.申请人通过对电力市场化大数据时代下的电力相关时序数据进行了解,发现如果要完整地实现在差分隐私的约束下提供较为准确的时序数据隐私保护,则需要解决以下四个关键问题:
24.(1)如何在处理不断变化的动态时序数据时减少运算量,提高系统效率;
25.(2)如何降低查询集之间的相关性,减小差分隐私敏感度和添加的噪声量;
26.(3)如何避免由于动态时序数据不断更新而导致的噪音累积,降低数据的实用性;
27.(4)如何确定最优抽样点。
28.由于差分隐私中的基本拉普拉斯机制是添加独立同分布的拉普拉斯噪声,因此攻击者可以使用一些细化方法(例如过滤),从相关的时间序列中消除这些独立噪声,从而降低预期的隐私保护效果。特别是在数据相互关联的情况下,简单地添加独立同分布的噪声不能提供足够的安全保护,可能会危及个人隐私。
29.同时,时序数据是一种动态数据,随着时间的推移,数据不断更新。由此,更新后的数据发布必然包含了之前发布的噪音,这会导致噪音随时间的累积,使得最终发布的数据与原始数据之间的差异变得很大,显著降低数据的实用性。
30.因此,亟需解决现有差分隐私技术在动态时序数据发布的保护应用场景中存在的数据高度相关问题、噪音累积问题和最优抽样点问题。
31.为解决上述提及的各技术问题,本实施例通过图1提供了一种基于抽样滤波差分隐私保护模型的时序数据发布方法,其包括以下步骤:
32.步骤101:按照多个不同的预设抽样间隔,分别对原始时序数据进行抽样处理,得到抽样数据和非抽样数据;
33.本步骤旨在由适于执行本技术所提供的基于抽样滤波差分隐私保护模型的时序数据发布方法的执行主体(例如用于进行数据处理和分析的本地服务器、云端服务器或安全计算服务器等)按照多个不同的预设抽样间隔,分别对原始时序数据进行多次抽样处理,以分别对应每个预设抽样间隔下的得到一对抽样数据和非抽样数据。
34.其中,抽样数据是指按照预设抽样间隔抽取出的部分时序数据,非抽样数据则是指原始时序数据被抽取出部分之后剩余的部分时序数据。原始时序数据可以为从电力系统的电力市场中,获取到的包含财务数据、营销数据、人资数据、市场信息、生产管理信息中至少一项。
35.应当理解的是,考虑到时序数据通常是将存在时序关联的时序组织为序列的表现
形式,因此本技术所使用的“数据”的表述方式实际上也指相应的序列。
36.步骤102:对抽样数据采用相关拉普拉斯机制添加噪声,以得到经噪声添加后满足差分隐私保护要求的噪声添加后数据;
37.在步骤101的基础上,本步骤旨在由上述执行主体对抽样后的动态时序数据,采用相关拉普拉斯机制添加噪声:^
38.f(centroid(a))=f(centroid(a))+clap(δf/ε),以使其满足差分隐私保护。
39.上式中表示添加噪声后的查询集,f(
·
)表示查询函数,centroid()表示中心值,clap()表示相关拉普拉斯机制函数,δf表示敏感度,ε表示隐私预算。
40.步骤103:运用vmd-维纳滤波技术对噪声添加后数据进行平稳化再修正处理,得到修正后数据;
41.在步骤102的基础上,本步骤旨在由上述执行主体将时序数据基于余量序列与其他模态间的互相关性优化vmd模态个数,然后采用改进vmd算法对加噪后的动态时间序列做平稳化处理,最后采用维纳滤波器模态序列进行修正。
42.vmd(variational mode decomposition,变分模态分解)是一种信号分解技术,能够将非平稳信号分解为多个固有模态函数(intrinsic mode functions,imfs)和一个残差项,而imfs是一种局部振荡模式,其频率随时间变化,且频率带宽自适应,能够有效地描述非平稳信号的时频特征。
43.维纳滤波(wiener filtering)是一种信号处理技术,用于去除信号中的噪声成分,以提高信号的质量。维纳滤波基于信号和噪声的统计特性,通过滤波器将信号和噪声分离开来,从而去除噪声成分。
44.即vmd-维纳滤波技术是将vmd分解得到的imfs和残差项分别进行维纳滤波处理,去除信号中的噪声成分,得到更加清晰的信号。本技术中使用vmd-维纳滤波技术来对加噪后的动态时间序列进行优化。
45.步骤104:将与相同的预设抽样间隔对应的修正后数据和非抽样数据进行组合,得到与各预设抽样间隔分别对应的待发布数据;
46.在步骤103的基础上,本步骤旨在由上述执行主体将与相同的预设抽样间隔对应的修正后数据和非抽样数据进行组合,得到与各预设抽样间隔分别对应的待发布数据。
47.步骤105:通过动态时间规整评价机制对各待发布数据进行评价,确定最优抽样间隔和与最优抽样间隔对应的最优待发布数据;
48.在步骤104的基础上,本步骤旨在由上述执行主体通过动态时间规整评价机制对不同抽样间隔下的数据进行评价,比较原始时序数据和待发布数据之间的关系,确定最优的抽样间隔和对应的最优待发布数据。
49.步骤106:发布最优待发布数据。
50.相较于现有技术,本实施例所提供的基于抽样滤波差分隐私保护模型的时序数据发布方法,首先,利用固定抽样技术,对抽样点的数据进行加噪及过滤,降低了整个系统的运行时间,提高了系统效率;其次,利用相关拉普拉斯机制对相关时间序列数据进行发布,由于该技术利用了序列不可区分性,通过使用四个高斯白噪声序列通过线性系统相互作用,生成相关的拉普拉斯噪声序列,而不是单独生成独立的噪声序列,使得通过多种不同的高斯白噪声串联,保证了数据的高实用性,并避免了由于普通拉普拉斯噪声具有独立同分
布特性而导致的隐私度低于预期的问题;接着,通过采用vmd-维纳滤波技术,对加噪后的数据进行平稳化再修正使得发布数据更加接近原始值,在保证数据隐私性基本不变的前提条件下,使发布数据的可用性更高;最后,将动态时间规整的概念运用在差分隐私中,利用动态时间规整选择最优的抽样间隔,得到时序数据发布隐私性与可用性平衡较优的抽样点。
51.为加深对本方案的理解,还可以参见图2所示的过程示意图,图2是对图所示的上述步骤进行了抽象化和可视化的处理。
52.在本技术的一些其它实施例中,采用相关拉普拉斯机制生成噪声的方法可以为:利用序列不可区分性,使用四个通过线性系统的高斯白噪声序列来生成相关拉普拉斯噪声序列,然后基于该相关拉普拉斯噪声序列生成该噪声。具体的,可以通过下述几个步骤来实现这一过程:
53.通过公式生成参数由灵敏度函数和保护强度确定的独立同分布的四个高斯白噪声序列k1、k2、k3和k4;
54.上式中,ki表示高斯白噪声序列,n为高斯分布,δf表示敏感度,ε表示隐私预算。
55.将k1、k2、k3和k4通过冲激响应函数为的滤波器得到相关的高斯序列,生成新的自相关噪声k1`、k2`、k3`和k4`;
56.上式中,r
xx
(τ)表示时间序列x的自相关函数,n0表示加噪后的时间序列功率谱密度。
57.根据高斯级数生成拉普拉斯级数的原理,生成相关拉普拉斯噪声:clap=k1'2+k2'
2-k3'
2-k4'2。
58.上述过程可参见图3所示的过程示意图。
59.在本技术的一些其它实施例中,运用vmd-维纳滤波技术对噪声添加后数据进行平稳化再修正处理,可具体通过下述几个步骤来实现:
60.采用互相关系数的计算公式确定vmd分解的最优模态个数;其中,n为序列模态个数,m为时间间隔,r
cc
(0)和r
ff
(0)分别为两个模态序列的自相关函数;
61.采用vmd对噪声添加后数据进行分解,获取平稳化并消除高频的余量序列;
62.采用维纳滤波的公式对各最优模态序列分别进行滤波;其中,δ2为白噪声自相关序列值,φ(z)为时间序列的自相关序列z变换,b(z)为维纳滤波的z域求解;
63.对经滤波处理后的各最优模态序列进行重构,得到修正后数据。
64.上述过程可参见图4所示的过程示意图。
65.在本技术的一些其它实施例中,通过动态时间规整评价机制对各所述待发布数据进行评价,确定最优抽样间隔和与所述最优抽样间隔对应的最优待发布数据的过程,可具体参见下述的步骤:
66.自定义初始抽样次数n,自定义互不相同的抽样间隔,进行n次不同时间间隔的固定抽样率抽样;
67.对不同时间间隔抽样序列加噪后,利用平均值法,求出n次加噪后抽样序列的均值序列;
68.计算加噪后的n次不同时间间隔抽样序列与均值序列之间的动态时间规整值,选取最接近均值序列的抽样序列及其抽样点,作为隐私性和实用性都达到较优的抽样点;
69.其中,所述动态时间规整值的计算方式为:
70.通过公式进行计算;
71.其中,q,c为所要计算的两条长度分别为m和n的时间序列,wk为最优路径,即w=w1,w2,
…
,wk,
…
,wk,其中max(m,n)≤k<m+n-1;动态时间规整最优路径所要满足的基本条件包括:边界条件,即所选路径必须从距离矩阵的左下角出发,在矩阵右上角结束;连续性,即路径上的点不能跨过某个点去匹配,保证两条时间序列上的每个点都必须出现在距离矩阵当中;单调性,即矩阵上的点必须是单调递增的,保证路径中不出现相交的现象;动态时间规整算法距离矩阵为:
72.c
1 c2ꢀ…ꢀcn
[0073][0074]
其中,时间序列q={q1,q2,
…
,qm},c={c1,c2,
…
,cn},在遵循各条件后的规整代价最小路径即为所需计算动态时间规整值。
[0075]
因为情况复杂,无法一一列举进行阐述,本领域技术人员应能意识到根据本技术提供的基本方法原理结合实际情况可以存在很多的例子,在不付出足够的创造性劳动下,应均在本技术的保护范围内。
[0076]
下面请参见图5,图5为本技术实施例所提供的一种基于抽样滤波差分隐私保护模型的时序数据发布装置500的结构框图,本实施例作为对应于上述方法实施例的装置实施例存在,该基于抽样滤波差分隐私保护模型的时序数据发布装置500可以包括:
[0077]
自定义间隔抽样单元501,被配置成按照多个不同的预设抽样间隔,分别对原始时序数据进行抽样处理,得到抽样数据和非抽样数据;
[0078]
差分隐私保护处理单元502,被配置成对所述抽样数据采用相关拉普拉斯机制添加噪声,以得到经噪声添加后满足差分隐私保护要求的噪声添加后数据;
[0079]
平稳化再修正单元503,被配置成运用vmd-维纳滤波技术对所述噪声添加后数据进行平稳化再修正处理,得到修正后数据;
[0080]
待发布数据组合单元504,被配置成将与相同的预设抽样间隔对应的修正后数据和非抽样数据进行组合,得到与各所述预设抽样间隔分别对应的待发布数据;
[0081]
评价单元505,被配置成通过动态时间规整评价机制对各所述待发布数据进行评价,确定最优抽样间隔和与所述最优抽样间隔对应的最优待发布数据;
[0082]
发布单元506,被配置成发布所述最优待发布数据。
[0083]
在本实施例的一些其它实现方式中,基于抽样滤波差分隐私保护模型的时序数据发布装置500中还可以包括:
[0084]
原始时序数据获取单元,被配置成从电力系统的电力市场中,获取包含财务数据、营销数据、人资数据、市场信息、生产管理信息中至少一项的所述原始时序数据。
[0085]
在本实施例的一些其它实现方式中,采用所述相关拉普拉斯机制生成噪声的方法包括:
[0086]
利用序列不可区分性,使用四个通过线性系统的高斯白噪声序列来生成相关拉普拉斯噪声序列;
[0087]
基于所述相关拉普拉斯噪声序列生成所述噪声。
[0088]
在本实施例的一些其它实现方式中,所述差分隐私保护处理单元502被进一步配置成:
[0089]
通过公式生成参数由灵敏度函数和保护强度确定的独立同分布的四个高斯白噪声序列k1、k2、k3和k4;
[0090]
将k1、k2、k3和k4通过冲激响应函数为的滤波器得到相关的高斯序列,生成新的自相关噪声k1`、k2`、k3`和k4`;
[0091]
对应的,所述基于所述相关拉普拉斯噪声序列生成所述噪声,包括:
[0092]
根据高斯级数生成拉普拉斯级数的原理,生成相关拉普拉斯噪声:clap=k1'2+k2'
2-k3'
2-k4'2。
[0093]
在本实施例的一些其它实现方式中,所述平稳化再修正单元503被进一步配置成:
[0094]
采用互相关系数的计算公式确定vmd分解的最优模态个数;其中,n为序列模态个数,m为时间间隔,r
cc
(0)和r
ff
(0)分别为两个模态序列的自相关函数;
[0095]
采用vmd对所述噪声添加后数据进行分解,获取平稳化并消除高频的余量序列;
[0096]
采用维纳滤波的公式对各最优模态序列分别进行滤波;其中,δ2为白噪声自相关序列值,φ(z)为时间序列的自相关序列z变换,b(z)为维纳滤波的z域求解;
[0097]
对经滤波处理后的各最优模态序列进行重构,得到所述修正后数据。
[0098]
在本实施例的一些其它实现方式中,所述评价单元505可以被进一步配置成:
[0099]
根据各所述待发布数据,利用平均值法求取得到均值数据;
[0100]
分别计算各所述待发布数据与所述均值数据之间的动态时间规整值,并选择最接近所述均值数据的待发布数据确定为所述最优待发布数据、将所述最优待发布数据的抽样间隔确定为所述最优抽样间隔;
[0101]
其中,所述动态时间规整值的计算方式为:
[0102]
通过公式进行计算;
[0103]
其中,q,c为所要计算的两条长度分别为m和n的时间序列,wk为最优路径,即w=w1,w2,
…
,wk,
…
,wk,其中max(m,n)≤k<m+n-1;动态时间规整最优路径所要满足的基本条件包括:边界条件,即所选路径必须从距离矩阵的左下角出发,在矩阵右上角结束;连续性,即路径上的点不能跨过某个点去匹配,保证两条时间序列上的每个点都必须出现在距离矩阵当中;单调性,即矩阵上的点必须是单调递增的,保证路径中不出现相交的现象;动态时间规整算法距离矩阵为:
[0104]c1 c2ꢀ…ꢀcn
[0105][0106]
其中,时间序列q={q1,q2,
…
,qm},c={c1,c2,
…
,cn},在遵循各条件后的规整代价最小路径即为所需计算动态时间规整值。
[0107]
本实施例作为与上述方法实施例对应的装置实施例存在。相比于现有技术,本实施例所提供的基于抽样滤波差分隐私保护模型的时序数据发布装置,首先,利用固定抽样技术,对抽样点的数据进行加噪及过滤,降低了整个系统的运行时间,提高了系统效率;其次,利用相关拉普拉斯机制对相关时间序列数据进行发布,由于该技术利用了序列不可区分性,通过使用四个高斯白噪声序列通过线性系统相互作用,生成相关的拉普拉斯噪声序列,而不是单独生成独立的噪声序列,使得通过多种不同的高斯白噪声串联,保证了数据的高实用性,并避免了由于普通拉普拉斯噪声具有独立同分布特性而导致的隐私度低于预期的问题;接着,通过采用vmd-维纳滤波技术,对加噪后的数据进行平稳化再修正使得发布数据更加接近原始值,在保证数据隐私性基本不变的前提条件下,使发布数据的可用性更高;最后,将动态时间规整的概念运用在差分隐私中,利用动态时间规整选择最优的抽样间隔,得到时序数据发布隐私性与可用性平衡较优的抽样点。
[0108]
基于上述实施例,本技术还提供了一种电子设备,该电子设备可以包括存储器和处理器,其中,该存储器中存有计算机程序,该处理器调用该存储器中的计算机程序时,可以实现上述实施例所提供的步骤。当然,该电子设备还可以包括各种必要的网络接口、电源以及其它零部件等。
[0109]
本技术还提供了一种计算机可读存储介质,其上存有计算机程序,该计算机程序被执行终端或处理器执行时可以实现上述实施例所提供的步骤。该存储介质可以包括:u盘、移动硬盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
[0110]
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
[0111]
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
[0112]
本文中应用了具体个例对本技术的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本技术的方法及其核心思想。对于本技术领域的普通技术人员来说,在不脱离本技术原理的前提下,还可以对本技术进行若干改进和修饰,这些改进和修饰也落入本技术权利要求的保护范围内。
[0113]
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
技术特征:
1.一种基于抽样滤波差分隐私保护模型的时序数据发布方法,其特征在于,包括:按照多个不同的预设抽样间隔,分别对原始时序数据进行抽样处理,得到抽样数据和非抽样数据;对所述抽样数据采用相关拉普拉斯机制添加噪声,以得到经噪声添加后满足差分隐私保护要求的噪声添加后数据;运用vmd-维纳滤波技术对所述噪声添加后数据进行平稳化再修正处理,得到修正后数据;将与相同的预设抽样间隔对应的修正后数据和非抽样数据进行组合,得到与各所述预设抽样间隔分别对应的待发布数据;通过动态时间规整评价机制对各所述待发布数据进行评价,确定最优抽样间隔和与所述最优抽样间隔对应的最优待发布数据;发布所述最优待发布数据。2.根据权利要求1所述的方法,其特征在于,还包括:从电力系统的电力市场中,获取包含财务数据、营销数据、人资数据、市场信息、生产管理信息中至少一项的所述原始时序数据。3.根据权利要求1所述的方法,其特征在于,采用所述相关拉普拉斯机制生成噪声的方法包括:利用序列不可区分性,使用四个通过线性系统的高斯白噪声序列来生成相关拉普拉斯噪声序列;基于所述相关拉普拉斯噪声序列生成所述噪声。4.根据权利要求3所述的方法,其特征在于,所述利用序列不可区分性,使用四个通过线性系统的高斯白噪声序列来生成相关拉普拉斯噪声序列,包括:通过公式生成参数由灵敏度函数和保护强度确定的独立同分布的四个高斯白噪声序列k1、k2、k3和k4;将k1、k2、k3和k4通过冲激响应函数为的滤波器得到相关的高斯序列,生成新的自相关噪声k1`、k2`、k3`和k4`;对应的,所述基于所述相关拉普拉斯噪声序列生成所述噪声,包括:根据高斯级数生成拉普拉斯级数的原理,生成相关拉普拉斯噪声:clap=k1'2+k2'
2-k3'
2-k4'2。5.根据权利要求1所述的方法,其特征在于,所述运用vmd-维纳滤波技术对所述噪声添加后数据进行平稳化再修正处理,得到修正后数据,包括:采用互相关系数的计算公式确定vmd采用vmd对所述噪声添加后数据进行分解,获取平稳化并消除高频的余量序列;
采用维纳滤波的公式对各最优模态序列分别进行滤波;其中,δ2为白噪声自相关序列值,φ(z)为时间序列的自相关序列z变换,b(z)为维纳滤波的z域求解;对经滤波处理后的各最优模态序列进行重构,得到所述修正后数据。6.根据权利要求1所述的方法,其特征在于,所述通过动态时间规整评价机制对各所述待发布数据进行评价,确定最优抽样间隔和与所述最优抽样间隔对应的最优待发布数据,包括:根据各所述待发布数据,利用平均值法求取得到均值数据;分别计算各所述待发布数据与所述均值数据之间的动态时间规整值,并选择最接近所述均值数据的待发布数据确定为所述最优待发布数据、将所述最优待发布数据的抽样间隔确定为所述最优抽样间隔;其中,所述动态时间规整值的计算方式为:通过公式进行计算;其中,q,c为所要计算的两条长度分别为m和n的时间序列,w
k
为最优路径,即w=w1,w2,
…
,w
k
,
…
,w
k
,其中max(m,n)≤k<m+n-1;动态时间规整最优路径所要满足的基本条件包括:边界条件,即所选路径必须从距离矩阵的左下角出发,在矩阵右上角结束;连续性,即路径上的点不能跨过某个点去匹配,保证两条时间序列上的每个点都必须出现在距离矩阵当中;单调性,即矩阵上的点必须是单调递增的,保证路径中不出现相交的现象;动态时间规整算法距离矩阵为:其中,时间序列q={q1,q2,
…
,q
m
},c={c1,c2,
…
,c
n
},在遵循各条件后的规整代价最小路径即为所需计算动态时间规整值。7.一种基于抽样滤波差分隐私保护模型的时序数据发布装置,其特征在于,包括:自定义间隔抽样单元,被配置成按照多个不同的预设抽样间隔,分别对原始时序数据进行抽样处理,得到抽样数据和非抽样数据;差分隐私保护处理单元,被配置成对所述抽样数据采用相关拉普拉斯机制添加噪声,以得到经噪声添加后满足差分隐私保护要求的噪声添加后数据;平稳化再修正单元,被配置成运用vmd-维纳滤波技术对所述噪声添加后数据进行平稳化再修正处理,得到修正后数据;待发布数据组合单元,被配置成将与相同的预设抽样间隔对应的修正后数据和非抽样数据进行组合,得到与各所述预设抽样间隔分别对应的待发布数据;评价单元,被配置成通过动态时间规整评价机制对各所述待发布数据进行评价,确定
最优抽样间隔和与所述最优抽样间隔对应的最优待发布数据;发布单元,被配置成发布所述最优待发布数据。8.一种电子设备,其特征在于,包括:存储器,用于计算机程序;处理器,用于在执行存储于所述存储器上的计算机程序时可实现如权利要求1至6任一项所述的基于抽样滤波差分隐私保护模型的时序数据发布方法的各步骤。9.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序在被处理器执行后可实现如权利要求1至6任一项所述的基于抽样滤波差分隐私保护模型的时序数据发布方法的各步骤。
技术总结
本申请公开了一种基于抽样滤波差分隐私保护模型的时序数据发布方法、装置、电子设备及可读存储介质,包括:按照多个不同的预设抽样间隔,分别对原始时序数据进行抽样处理,得到抽样数据和非抽样数据;对抽样数据采用相关拉普拉斯机制添加噪声,以得到经噪声添加后满足差分隐私保护要求的噪声添加后数据;运用VMD-维纳滤波技术对噪声添加后数据进行平稳化再修正处理,得到修后数据;将与相同的预设抽样间隔对应的修正后数据和非抽样数据进行组合,得到与各预设抽样间隔分别对应的待发布数据;通过动态时间规整评价机制对各待发布数据进行评价,确定最优抽样间隔和与最优抽样间隔对应的最优待发布数据;发布最优待发布数据,提升了隐私性、安全性。安全性。安全性。
技术研发人员:骆希
受保护的技术使用者:浙江电力交易中心有限公司
技术研发日:2023.05.16
技术公布日:2023/8/21
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
上一篇:一种防破损塑料水果盒的制作方法 下一篇:一种柔性手术操作臂