一种应用于车联网的隐私增强多层联邦学习方法

未命名 10-19 阅读:146 评论:0


1.本发明涉及联邦学习技术领域,特别是涉及一种应用于车联网的隐私增强多层联邦学习方法。


背景技术:

2.车联网的智能化能够帮助缓解道路交通安全等问题,具有极其可观的应用价值,然而目前对于数据隐私的愈发重视使得传统的集中式机器学习方法很难收集到足够的车联网数据进行模型训练。联邦学习作为一种可以在客户端本地进行模型训练,不需要集中收集用户数据的新型机器学习方式,可以有效解决这一问题。但是联邦学习本身也存在隐私泄漏的风险。恶意方可以通过实施成员推断攻击、模型反转攻击等攻击方式来从联邦学习传输的模型参数中获取隐私信息。针对这一缺陷,现有研究提出了很多增强联邦学习隐私保护能力的方案,这些方案大致可以分为基于差分隐私的方案、基于同态加密的方案以及基于安全多方计算的方案。
3.基于差分隐私的方案由于对传输的模型参数进行了不可逆的噪声处理,会导致最终得到的全局模型精度下降;基于同态加密的方案采用了大量的密码学计算,会对客户端造成很高的计算开销;而基于安全多方计算的方案一般需要客户端之间进行多次通信协商,会造成很高的计算开销和通信开销。现有方案会造成训练效果的下降或较高的额外开销,不适用于资源有限的车联网场景。因此,需要设计一种能够增强隐私保护能力,且带来较小额外计算和通信资源开销的联邦学习框架。此外,由于在联邦学习过程中传输的中间参数可能会被外部恶意方篡改,这会导致安全漏洞的存在或训练效果的大幅下降,因此本发明考虑结合区块链技术来检测外部恶意篡改。


技术实现要素:

4.为了解决以上技术问题,本发明提供一种应用于车联网的隐私增强多层联邦学习方法,包括以下步骤
5.s1、构建多层联邦学习系统,多层联邦学习系统包括用于训练本地模型的训练端、基站、服务器、分布式哈希表存储系统以及区块链系统,训练端包括汽车和路侧单元,同时路侧单元还作为低层聚合器,基站作为高层聚合器,服务器作为总聚合器;
6.s2、参与联邦学习的训练端需要向相关机构提交资格申请,相关机构进行资格审查,在判断训练端具有训练资格后向其发送唯一的id、质数p以及相应的原根g;
7.s3、联邦学习开始,由服务器管理联邦学习整体进程的运行,采用diffie-hellman算法在训练端和服务器生成共享密钥;
8.s4、在第t个训练周期,训练端开始本地模型的训练,训练完成后得到本地模型参数;再将共享密钥作为随机种子生成伪随机模型参数;将训练生成的模型参数与伪随机模型参数相加计算出扰动后的模型参数;然后将扰动后的模型参数、相应的id以及数据集大小保存到分布式哈希表中,得到分布式哈希表返回的相应内容的哈希地址;再将扰动后的
模型参数、相应的id以及数据集大小绑定返回的哈希地址一起上传给上层,即汽车上传给路侧单元,而路侧单元上传给基站;
9.s5、将伪随机模型参数作为干扰数据与本地模型参数相加;并上传相加得到的结果;
10.s6、依次通过路侧单元、基站以及服务器的聚合,服务器将接收到的所有id信息和服务器聚合得到的模型参数保存到分布式哈希表中,得到相应的哈希地址;且将所有服务器接收到的训练端id、数据集大小以及相应的哈希地址和服务器从分布式哈希表得到的哈希地址一起上传至区块链;最后服务器去除聚合后的模型参数中的干扰数据,最终得到全局模型参数;
11.s7、继续下一轮的训练,直到满足精度要求或者达到预定的周期数为止。
12.本发明进一步限定的技术方案是:
13.进一步的,步骤s2中,相关机构对训练端进行资格审查,当训练端无恶意行为记录且计算能力达到规定值时,则判断此训练端具有训练资格。
14.前所述的一种应用于车联网的隐私增强多层联邦学习方法,步骤s3中,采用diffie-hellman算法在训练端和服务器生成共享密钥,具体包括以下步骤
15.s3.1、训练端在本地生成随机整数a,计算出a=g^a(mod p),接着将a发送给服务器;
16.s3.2、服务器在本地生成随机整数b,计算出b=g^b(mod p),接着将b发送给训练端;
17.s3.3、最后训练端和服务器计算出共享密钥sk=b^a(mod p)=a^b(mod p)。
18.前所述的一种应用于车联网的隐私增强多层联邦学习方法,步骤s4中,本地模型参数包括汽车端训练生成的模型参数和路侧单元端训练生成的模型参数伪随机模型参数包括汽车端生成的用于扰动的干扰模型参数和路侧单元端生成的用于扰动的干扰模型参数扰动后的模型参数包括汽车端扰动后的模型参数以及路侧单元端扰动后的模型参数
19.前所述的一种应用于车联网的隐私增强多层联邦学习方法,步骤s6具体包括以下分步骤
20.s6.1、汽车直接将汽车端扰动后的模型参数哈希地址、汽车的本地数据集大小以及id上传给距离最近的路侧单元;
21.s6.2、路侧单元将接收到的汽车上传的数据与路侧单元端扰动后的模型参数进行聚合;
22.s6.3、将从汽车处接收到的除扰动后的模型参数外的所有数据打包,与路侧单元聚合得到的模型参数路侧单元的本地数据集大小路侧单元本身的id以及路侧单元扰动后的模型参数对应的哈希地址一起上传给距离最近的基站;
23.s6.4、基站再将接收到的数据进行聚合;
24.s6.5、然后将接收到的除模型参数外的所有数据打包,将其和基站聚合得到的模型参数以及基站接收到的所有数据集大小之和一起上传给服务器;
25.s6.6、服务器进行全局聚合,将接收到的所有id信息和保存到分布式哈希表中,得到相应的哈希地址;
26.s6.7、将所有服务器接收到的训练端id、数据集大小以及相应的哈希值和服务器从分布式哈希表得到的哈希地址一起上传至区块链;
27.s6.8、然后根据接受到的所有id信息,确认最终提交训练结果的所有训练端,记为集合t,据此计算出所有相应的伪随机模型参数和其中vi∈t,rj∈t;最后计算出去除扰动所需的
28.前所述的一种应用于车联网的隐私增强多层联邦学习方法,步骤s6.2中,路侧单元通过下式进行聚合,
[0029][0030]
其中,表示路侧单元聚合得到的模型参数,为路侧单元的本地数据集大小,集合vj为最终向路侧单元rj上传数据的所有汽车。
[0031]
前所述的一种应用于车联网的隐私增强多层联邦学习方法,步骤s6.4中,基站通过下式进行聚合,
[0032][0033]
其中,表示基站聚合得到的模型参数,集合rk表示向基站bk上传数据的所有路侧单元,路侧单元的本地数据集和路侧单元接收到的所有汽车本地数据集的大小之和令基站接收到的所有数据集大小之和
[0034]
前所述的一种应用于车联网的隐私增强多层联邦学习方法,步骤s6.6中,服务器通过下式进行全局聚合,
[0035][0036]
其中,表示服务器聚合得到的模型参数。
[0037]
前所述的一种应用于车联网的隐私增强多层联邦学习方法,步骤s4至步骤s7中,将扰动后的模型参数保存在分布式哈希表中,将相应的哈希地址保存到区块链中来进行中间数据的备份,相关机构通过比对备份数据的聚合结果与实际聚合结果是否一致,判断恶意篡改是否存在,若存在,则利用备份数据的聚合结果进行纠正。
[0038]
本发明的有益效果是:
[0039]
(1)本发明中,增强联邦学习隐私性的同时带来较小的额外开销,适用于资源有限的车联网场景;针对车联网的特性,设计了多层联邦学习架构,更贴合实际应用需求;设计了检测外部恶意篡改的方式,保证了数据的可信度,增强了系统的安全性;
[0040]
(2)本发明中,设计了适用于车联网的多层联邦学习架构,其中车辆和路侧单元rsu作为训练本地模型的训练端,因为两者都具备一定的信息采集能力和计算能力,rsu同时还作为低层聚合器,基站bs作为高层聚合器;若汽车上传训练结果时位置发生改变,只需根据最新位置,将数据发送给距离最近的rsu即可;并且若汽车不能完成训练可随时退出系统,不会对系统的运行造成任何影响;
[0041]
(3)本发明中,结合分布式哈希表dht和区块链技术,设计了一种可以检测外部恶意篡改的方式,首先,利用dht和区块链存储安全的数据备份,确保备份数据可追溯、不可篡改;然后,通过比对备份数据的聚合结果与实际聚合结果是否一致,判断恶意篡改是否存在,若存在,可利用备份数据的聚合结果对其进行纠正,从而抵消外部恶意篡改的影响;
[0042]
(4)本发明中,在训练之前由车企或政府部门等相关机构负责训练端的资格审查,被授予资格的汽车和路侧单元可进行联邦学习训练,这一步为了保证训练端的可信度;然后,联邦学习开始后,由服务器管理联邦学习整体进程的运行,期间,训练端通过与服务器进行协商产生共享密钥,并利用该密钥生成伪随机模型参数来保证训练得出的模型参数的安全;此外,通过将扰动后的模型参数保存在分布式哈希表中,将相应的哈希地址保存到区块链中来进行中间数据的安全备份,从而方便对恶意篡改的检测;结合分布式哈希表是为了扩大存储容量,降低区块链的存储压力,从而减少部署系统的经济成本。
附图说明
[0043]
图1为本发明实施例中多层联邦学习系统的整体示意图。
具体实施方式
[0044]
本实施例提供的一种应用于车联网的隐私增强多层联邦学习方法,如图1所示,包括以下步骤
[0045]
s1、构建多层联邦学习系统,多层联邦学习系统包括用于训练本地模型的训练端、基站、服务器、分布式哈希表存储系统以及区块链系统,训练端包括汽车和路侧单元,同时路侧单元还作为低层聚合器,基站作为高层聚合器。
[0046]
s2、希望参与联邦学习的训练端向车企或政府部门等相关机构提交资格申请,相关机构进行资格审查,当训练端无恶意行为记录且计算能力达到规定值时,则判断此训练端具有训练资格,在判断训练端具有训练资格后向其发送唯一的id、质数p以及相应的原根g,该步骤主要为了确保训练端的可信度和硬件条件符合要求,相关机构向训练端发送的参数用于后续共享密钥的生成。
[0047]
s3、联邦学习开始,由服务器管理联邦学习整体进程的运行,采用diffie-hellman算法在训练端和服务器生成共享密钥,具体包括以下步骤
[0048]
s3.1、训练端在本地生成随机整数a,计算出a=g^a(mod p),接着将a发送给服务器;
[0049]
s3.2、服务器在本地生成随机整数b,计算出b=g^b(mod p),接着将b发送给训练
端;
[0050]
s3.3、最后训练端和服务器计算出共享密钥sk=b^a(mod p)=a^b(mod p)。
[0051]
s4、在第t个训练周期,训练端开始本地模型的训练,训练完成后得到本地模型参数,本地模型参数包括汽车端训练生成的模型参数和路侧单元端训练生成的模型参数再将共享密钥sk作为随机种子生成伪随机模型参数,伪随机模型参数包括汽车端生成的用于扰动的干扰模型参数和路侧单元端生成的用于扰动的干扰模型参数计算出扰动后的模型参数,扰动后的模型参数包括汽车端扰动后的模型参数以及路侧单元端扰动后的模型参数然后将扰动后的模型参数、相应的id以及数据集大小保存到分布式哈希表中,得到分布式哈希表返回的相应内容的哈希地址。
[0052]
s5、将伪随机模型参数作为干扰数据与本地模型参数相加;并上传相加得到的结果。
[0053]
s6、依次通过路侧单元、基站以及服务器的聚合,服务器将接收到的所有id信息和服务器聚合得到的模型参数保存到分布式哈希表中,得到相应的哈希地址;且将所有服务器接收到的训练端id、数据集大小以及相应的哈希值和服务器从分布式哈希表得到的哈希地址一起上传至区块链;最后服务器去除聚合后的模型参数中的干扰数据,最终得到全局模型参数。
[0054]
步骤s6具体包括以下分步骤
[0055]
s6.1、汽车直接将汽车端扰动后的模型参数哈希地址、汽车的本地数据集大小以及id上传给距离最近的路侧单元。
[0056]
s6.2、路侧单元将接收到的汽车上传的数据与路侧单元端扰动后的模型参数进行聚合,
[0057][0058]
其中,表示路侧单元聚合得到的模型参数,为路侧单元的本地数据集大小,集合vj为最终向路侧单元rj上传数据的所有汽车。
[0059]
s6.3、将从汽车处接收到的除扰动后的模型参数外的所有数据打包,与路侧单元聚合得到的模型参数路侧单元的本地数据集大小路侧单元本身的id以及路侧单元扰动后的模型参数对应的哈希地址一起上传给距离最近的基站。
[0060]
s6.4、基站再将接收到的数据进行聚合,
[0061][0062]
其中,表示基站聚合得到的模型参数,集合rk表示向基站bk上传数据的所有路
侧单元,路侧单元的本地数据集和路侧单元接收到的所有汽车本地数据集的大小之和令基站接收到的所有数据集大小之和
[0063]
s6.5、然后将接收到的除模型参数外的所有数据打包,将其和基站聚合得到的模型参数以及基站接收到的所有数据集大小之和一起上传给服务器。
[0064]
s6.6、服务器进行全局聚合,将接收到的所有id信息和保存到分布式哈希表中,得到相应的哈希地址;服务器通过下式进行全局聚合,
[0065][0066]
其中,表示服务器聚合得到的模型参数。
[0067]
s6.7、将所有服务器接收到的训练端id、数据集大小以及相应的哈希值和服务器从分布式哈希表得到的哈希地址一起上传至区块链。
[0068]
s6.8、然后根据接受到的所有id信息,确认最终提交训练结果的所有训练端,记为集合t,据此计算出所有相应的伪随机模型参数和其中vi∈t,rj∈t;最后计算出去除扰动所需的
[0069]
s7、继续下一轮的训练,直到满足精度要求或者达到预定的周期数为止,此处的精度要求和周期数根据实际运用中的联邦学习任务而定。
[0070]
同时,在步骤s4至步骤s7中,将扰动后的模型参数保存在分布式哈希表中,将相应的哈希地址保存到区块链中来进行中间数据的备份,相关机构通过比对备份数据的聚合结果与实际聚合结果是否一致,判断恶意篡改是否存在,若存在,则利用备份数据的聚合结果进行纠正。
[0071]
除上述实施例外,本发明还可以有其他实施方式。凡采用等同替换或等效变换形成的技术方案,均落在本发明要求的保护范围。

技术特征:
1.一种应用于车联网的隐私增强多层联邦学习方法,其特征在于:包括以下步骤s1、构建多层联邦学习系统,多层联邦学习系统包括用于训练本地模型的训练端、基站、服务器、分布式哈希表存储系统以及区块链系统,训练端包括汽车和路侧单元,同时路侧单元还作为低层聚合器,基站作为高层聚合器,服务器作为总聚合器;s2、参与联邦学习的训练端需要向相关机构提交资格申请,相关机构进行资格审查,在判断训练端具有训练资格后向其发送唯一的id、质数p以及相应的原根g;s3、联邦学习开始,由服务器管理联邦学习整体进程的运行,采用diffie-hellman算法在训练端和服务器生成共享密钥;s4、在第t个训练周期,训练端开始本地模型的训练,训练完成后得到本地模型参数;再将共享密钥作为随机种子生成伪随机模型参数;将训练生成的模型参数与伪随机模型参数相加计算出扰动后的模型参数;然后将扰动后的模型参数、相应的id以及数据集大小保存到分布式哈希表中,得到分布式哈希表返回的相应内容的哈希地址;再将扰动后的模型参数、相应的id以及数据集大小绑定返回的哈希地址一起上传给上层,即汽车上传给路侧单元,而路侧单元上传给基站;s5、将伪随机模型参数作为干扰数据与本地模型参数相加;并上传相加得到的结果;s6、依次通过路侧单元、基站以及服务器的聚合,服务器将接收到的所有id信息和服务器聚合得到的模型参数保存到分布式哈希表中,得到相应的哈希地址;且将所有服务器接收到的训练端id、数据集大小以及相应的哈希地址和服务器从分布式哈希表得到的哈希地址一起上传至区块链;最后服务器去除聚合后的模型参数中的干扰数据,最终得到全局模型参数;s7、继续下一轮的训练,直到满足精度要求或者达到预定的周期数为止。2.根据权利要求1所述的一种应用于车联网的隐私增强多层联邦学习方法,其特征在于:所述步骤s2中,相关机构对训练端进行资格审查,当训练端无恶意行为记录且计算能力达到规定值时,则判断此训练端具有训练资格。3.根据权利要求1所述的一种应用于车联网的隐私增强多层联邦学习方法,其特征在于:所述步骤s3中,采用diffie-hellman算法在训练端和服务器生成共享密钥,具体包括以下步骤s3.1、训练端在本地生成随机整数a,计算出a=g^a(mod p),接着将a发送给服务器;s3.2、服务器在本地生成随机整数b,计算出b=g^b(mod p),接着将b发送给训练端;s3.3、最后训练端和服务器计算出共享密钥sk=b^a(mod p)=a^b(mod p)。4.根据权利要求1所述的一种应用于车联网的隐私增强多层联邦学习方法,其特征在于:所述步骤s4中,本地模型参数包括汽车端训练生成的模型参数和路侧单元端训练生成的模型参数伪随机模型参数包括汽车端生成的用于扰动的干扰模型参数和路侧单元端生成的用于扰动的干扰模型参数扰动后的模型参数包括汽车端扰动后的模型参数参数以及路侧单元端扰动后的模型参数5.根据权利要求1所述的一种应用于车联网的隐私增强多层联邦学习方法,其特征在于:所述步骤s6具体包括以下分步骤
s6.1、汽车直接将汽车端扰动后的模型参数哈希地址、汽车的本地数据集大小以及id上传给距离最近的路侧单元;s6.2、路侧单元将接收到的汽车上传的数据与路侧单元端扰动后的模型参数进行聚合;s6.3、将从汽车处接收到的除扰动后的模型参数外的所有数据打包,与路侧单元聚合得到的模型参数路侧单元的本地数据集大小路侧单元本身的id以及路侧单元扰动后的模型参数对应的哈希地址一起上传给距离最近的基站;s6.4、基站再将接收到的数据进行聚合;s6.5、然后将接收到的除模型参数外的所有数据打包,将其和基站聚合得到的模型参数以及基站接收到的所有数据集大小之和一起上传给服务器;s6.6、服务器进行全局聚合,将接收到的所有id信息和保存到分布式哈希表中,得到相应的哈希地址;s6.7、将所有服务器接收到的训练端id、数据集大小以及相应的哈希值和服务器从分布式哈希表得到的哈希地址一起上传至区块链;s6.8、然后根据接受到的所有id信息,确认最终提交训练结果的所有训练端,记为集合t,据此计算出所有相应的伪随机模型参数和其中v
i
∈t,r
j
∈t;最后计算出去除扰动所需的6.根据权利要求5所述的一种应用于车联网的隐私增强多层联邦学习方法,其特征在于:所述步骤s6.2中,路侧单元通过下式进行聚合,其中,表示路侧单元聚合得到的模型参数,为路侧单元的本地数据集大小,集合v
j
为最终向路侧单元r
j
上传数据的所有汽车。7.根据权利要求5所述的一种应用于车联网的隐私增强多层联邦学习方法,其特征在于:所述步骤s6.4中,基站通过下式进行聚合,其中,表示基站聚合得到的模型参数,集合r
k
表示向基站b
k
上传数据的所有路侧单元,路侧单元的本地数据集和路侧单元接收到的所有汽车本地数据集的大小之和令基站接收到的所有数据集大小之和
8.根据权利要求5所述的一种应用于车联网的隐私增强多层联邦学习方法,其特征在于:所述步骤s6.6中,服务器通过下式进行全局聚合,其中,表示服务器聚合得到的模型参数。9.根据权利要求1所述的一种应用于车联网的隐私增强多层联邦学习方法,其特征在于:所述步骤s4至步骤s7中,将扰动后的模型参数保存在分布式哈希表中,将相应的哈希地址保存到区块链中来进行中间数据的备份,相关机构通过比对备份数据的聚合结果与实际聚合结果是否一致,判断恶意篡改是否存在,若存在,则利用备份数据的聚合结果进行纠正。

技术总结
本发明公开了一种应用于车联网的隐私增强多层联邦学习方法,涉及联邦学习技术领域,设计了一种基于Diffie-Hellman算法的参数保护方法,建立起了一种资源友好且能增强数据隐私的多层联邦学习框架。通过本发明可以帮助车联网搭建起保护数据隐私的模型训练环境,满足车联网智能化的发展需求。同时,解决了传统联邦学习中参数可能泄漏隐私信息的问题,大幅增加隐私保护能力的同时只增加了较少的额外开销。此外,本发明还结合分布式哈希表技术和区块链技术,设计了一种用于检测外部恶意篡改的方法,极大增强了系统的安全性。极大增强了系统的安全性。极大增强了系统的安全性。


技术研发人员:罗嘉诚 李栩浩 王昊 吴晓菲 蓝东琬 周璐 方黎明
受保护的技术使用者:南京航空航天大学
技术研发日:2023.07.10
技术公布日:2023/10/15
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐