一种基于Jaccard相似系数的新老变电站匹配方法及装置与流程

未命名 09-13 阅读:70 评论:0

一种基于jaccard相似系数的新老变电站匹配方法及装置
技术领域
1.本发明属于变电站技术领域,尤其涉及一种基于jaccard相似系数的新老变电站匹配方法及装置。


背景技术:

2.当前在对变电站的智能化升级改造时,为满足用户供电需求,仅能通过逐间隔轮流停电的方式进行改造,因此导致变电站的综合自动化改造(以及简称综自改)工程周期较长,往往持续数月乃至超过一年;然而变电站综自改造过程中,变电站存在新旧两套远动系统,新旧两套系统使用各自监控信息点表实现遥测、遥信、遥控、遥调“四遥”功能,改扩建间隔信息点表下发至新系统运行;当前为区别新旧两套系统,常规做法是对新旧系统的变电站名称、通道名称加以区分,然而对于此种方式目前没有相关行业规范和标准,各地变电站主要凭历史经验或习惯进行人工命名,两套系统的命名并无强关联关系,容易给下发待验信息表和后续监控信息的主、厂站联调验收带来通信主站和通道选择错误的问题。
3.目前,缺乏针对在变电站升级改造时,对老变电站进行通道匹配以解决新老电站通信主站和通道选择错误问题方法,现有技术大多围绕对新老变电站负荷转移进行设计研究,例如授权公告号为cn113363968b的中国专利公开了一种新老变电站配电系统不停电转移负荷的方法,该发明虽然解决了新旧变电站单电源运行带来的风险问题,但其无法解决新老电站通信主站和通道选择错误的问题,因此如何准确识别并关联综自改造新旧两套通讯主站及其通道,以保障监控信息点表下发至变电设备信号自助验收平台,以及后续监控信息联调验收选择通讯主站及通道的准确性成为当下待解决重点。
4.鉴于此,本发明提出一种基于jaccard相似系数的新老变电站匹配方法及装置以解决上述问题。


技术实现要素:

5.为了克服现有技术的上述缺陷,本发明的实施例提供一种基于jaccard相似系数的新老变电站匹配方法及装置。
6.为实现上述目的,本发明提供如下技术方案:
7.第一方面,本技术实施例提供了一种基于jaccard相似系数的新老变电站匹配方法,该方法包括:
8.根据ⅰ区集中监控站的监控信息点表生成新电站的第一字符串集合和老电站的第二字符串集合;所述监控信息点表包括新电站监控信息点表和老电站监控信息点表;
9.根据新电站命名信息和老电站命名信息分别生成新电站的第三字符串集合和老电站的第四字符串集合;
10.计算第一字符串集合与第二字符串集合之间的jaccard相似系数,并将所述第一字符串集合与第二字符串集合之间的jaccard相似系数标记为第一相似系数;以及计算第三字符串集合与第四字符串集合的jaccard相似系数,并将第三字符串集合与第四字符串
集合的jaccard相似系数标记为第二相似系数;
11.分别将所述第一相似系数和第二相似系数与预设判定阈值进行比较,根据比较结果获取无关特征数据;所述预设判定阈值包括第一判定阈值和第二判断阈值;
12.提取ⅰ区集中监控站上通信数据中的无关特征数据,根据所述无关特征数据并基于预设通道匹配模型进行匹配,以得到选择对应通道或对应主站;
13.将选择对应通道或对应主站的通讯数据发送至ⅵ区的自主验收客户端。
14.在一种实施方式中,所述根据ⅰ区集中监控站的新老变电站监控信息点表生成新电站的第一字符串集合和老电站的第二字符串集合,包括:
15.提取新电站监控信息点表和老电站监控信息点表中每个被监控设备的四遥信息,所述四遥信息包括遥感、遥测、遥信和遥控;
16.对新电站监控信息点表中每个被监控设备的四遥信息进行字符串转化,将转化后得到m个字符串输入预构建第一字符串集合;
17.对老电站监控信息点表中每个被监控设备的四遥信息进行字符串转化,将转化后得到n个字符串输入预构建第二字符串集合。
18.在一种实施方式中,所述根据新电站命名信息和老电站命名信息分别生成新电站的第三字符串集合和老电站的第四字符串集合,包括:
19.根据新电站命名信息和老电站命名信息分别生成新电站的第三字符串集合和老电站的第四字符串集合,包括:
20.对新电站命名信息进行字符串转化,将转化后得到p个字符串输入预构建第三字符串集合;
21.对老电站命名信息进行字符串转化,将转化后得到q个字符串输入预构建第四字符串集合。
22.在一种实施方式中,所述第一相似系数和第二相似系数通过jaccard相似算法计算得到,所述jaccard相似算法的具体公式如下:
[0023][0024]
式中:|
·
|表示集合中元素的个数,s表示第一字符串集合或第三字符串集合的归一化向量,t表示第二字符串集合或第四字符串集合归一化向量;j(s,t)∈[0,1],当集合j,t都为空时,定义j(s,t)取值为1。
[0025]
在一种实施方式中,所述将相似系数与预设判定阈值进行比较,根据比较结果获取无关特征数据,包括:
[0026]
若所述第一相似系数大于等于设定的第一判定阈值,则判断新电站监控信息点表对应被监控设备的四遥信息与老电站监控信息点表中对应被监控设备的四遥信息具有强相似性,并将对应四遥信息标记为相关特征数据;反之,若所述第一相似系数小于设定的第一判定阈值,则判断新电站监控信息点表对应被监控设备的四遥信息与老电站监控信息点表中对应被监控设备的四遥信息具有弱相似性,并将对应四遥信息标记为无关特征数据;
[0027]
若所述第二相似系数大于等于设定的第二判定阈值,则判断对应新电站命名信息和对应老电站命名信息具有强相似性,并将对应命名信息标记为相关特征数据;反之,若所述第二相似系数小于设定的第二判定阈值,则判断对应新电站命名信息和对应老电站命名
信息具有弱相似性,并将对应命名信息标记为无关特征数据。
[0028]
在一种实施方式中,所述预设通道匹配模型的生成过程如下:
[0029]
获取包含无关特征数据的通信数据,以及若干通道序号或若干主站序号;
[0030]
对包含无关特征数据的通信数据、若干通道序号或若干主站序号进行人为数据集标注;
[0031]
将标注后的包含无关特征数据的通信数据、若干通道序号或若干主站序号作为样本集,并将样本集划分为70%的训练集和30%的测试集;
[0032]
构建cnn神经网络,将所述70%的训练集作为输入数据输入所述cnn神经网络进行训练,以得到训练后的cnn神经网络;
[0033]
利用30%的测试集对所述训练后的cnn神经网络进行模型验证,以输出满足预设准确度的cnn神经网络作为通道匹配模型。
[0034]
第二方面,本技术实施例提供了一种基于jaccard相似系数的新老变电站匹配装置,包括:
[0035]
第一数据生成模块,用于根据ⅰ区集中监控站的监控信息点表生成新电站的第一字符串集合和老电站的第二字符串集合;所述监控信息点表包括新电站监控信息点表和老电站监控信息点表;
[0036]
第二数据生成模块,用于根据新电站命名信息和老电站命名信息分别生成新电站的第三字符串集合和老电站的第四字符串集合;
[0037]
数据挖掘模块,用于计算第一字符串集合与第二字符串集合之间的jaccard相似系数,并将所述第一字符串集合与第二字符串集合之间的jaccard相似系数标记为第一相似系数;以及计算第三字符串集合与第四字符串集合的jaccard相似系数,并将第三字符串集合与第四字符串集合的jaccard相似系数标记为第二相似系数;
[0038]
判断比较模块,用于分别将所述第一相似系数和第二相似系数与预设判定阈值进行比较,根据比较结果获取无关特征数据;所述预设判定阈值包括第一判定阈值和第二判断阈值;
[0039]
通道匹配模块,用于提取ⅰ区集中监控站上通信数据中的无关特征数据,根据所述无关特征数据并基于预设通道匹配模型进行匹配,以得到选择对应通道或对应主站;
[0040]
数据通信模块,用于将选择对应通道或对应主站的通讯数据发送至ⅵ区的自主验收客户端。
[0041]
在一种实施方式中,所述预设通道匹配模型包括:
[0042]
无关特征数据获取模块,用于获取包含无关特征数据的通信数据,以及若干通道序号或若干主站序号;
[0043]
数据集标注模块,用于对包含无关特征数据的通信数据、若干通道序号或若干主站序号进行人为数据集标注;
[0044]
样本集构建模块,用于将标注后的包含无关特征数据的通信数据、若干通道序号或若干主站序号作为样本集,并将样本集划分为70%的训练集和30%的测试集;
[0045]
cnn神经网络构建模块,用于构建cnn神经网络,并将所述70%的训练集作为输入数据输入所述cnn神经网络进行训练,以得到训练后的cnn神经网络;
[0046]
验证模块,用于利用30%的测试集对所述训练后的cnn神经网络进行模型验证,以
输出满足预设准确度的cnn神经网络作为通道匹配模型。
[0047]
第三方面,本技术实施例提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行上述的基于jaccard相似系数的新老变电站匹配方法的步骤。
[0048]
第四方面,本技术实施例提供了一种计算机可读存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述的基于jaccard相似系数的新老变电站匹配方法的步骤。
[0049]
与现有技术相比,具有以下有益效果:
[0050]
本发明通过对新老电站的监控信息点表以及新老电站的命名信息进行字符串转化,然后利用jaccard相似系数对转化后得到字符串集合进行相似性和差异性匹配,有利于挖掘获取其中的无关特征数据,之后通过获取通信数据中的无关特征数据,并基于预训练模型对其进行识别匹配;本发明能够准确识别并关联综自改造新旧两套通讯主站及其通道,以保障监控信息点表下发至变电设备信号自助验收平台,以及后续监控信息联调验收选择通讯主站及通道的准确性,进而解决现有技术无法匹配新老电站通信主站或通道的问题。
附图说明
[0051]
附图作为本发明的一部分,用来提供对本发明的进一步的理解,本发明的示意性实施例及其说明用于解释本发明,但不构成对本发明的不当限定。显然,下面描述中的附图仅仅是一些实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
[0052]
图1为本发明一实施例提供的一种基于jaccard相似系数的新老变电站匹配方法的流程示意图;
[0053]
图2为本发明一实施例提供的基于jaccard相似系数的新老变电站匹配装置的结构示意图。
[0054]
需要说明的是,这些附图和文字描述并不旨在以任何方式限制本发明的构思范围,而是通过参考特定实施例为本领域技术人员说明本发明的概念。
具体实施方式
[0055]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0056]
如图1所示,本实施例公开提供了一种基于jaccard相似系数的新老变电站匹配方法,所述方法包括:
[0057]
步骤1:根据ⅰ区集中监控站的监控信息点表生成新电站的第一字符串集合和老电站的第二字符串集合;所述监控信息点表包括新电站监控信息点表和老电站监控信息点表;
[0058]
具体地,根据ⅰ区集中监控站的监控信息点表生成新表电站的字符串集合和老电
站字符串集合,包括:
[0059]
s101:分别提取新电站监控信息点表和老电站监控信息点表中每个被监控设备的四遥信息,所述四遥信息包括遥感、遥测、遥信和遥控;
[0060]
需要说明的是:所述被监控设备包括一次设备和二次设备;
[0061]
s102:分别针对新电站监控信息点表中每个被监控设备的四遥信息进行字符串转化,将转化后得到m个字符串输入预构建第一字符串集合;
[0062]
s103:分别针对老电站监控信息点表中每个被监控设备的四遥信息进行字符串转化,将转化后得到n个字符串输入预构建第二字符串集合;
[0063]
步骤2:根据新电站命名信息和老电站命名信息分别生成新电站的第三字符串集合和老电站的第四字符串集合;
[0064]
具体地,根据新电站命名信息和老电站命名信息分别生成新电站的第三字符串集合和老电站的第四字符串集合,包括:
[0065]
s201:针对新电站命名信息进行字符串转化,将转化后得到p个字符串输入预构建第三字符串集合;
[0066]
s202:针对老电站命名信息进行字符串转化,将转化后得到q个字符串输入预构建第四字符串集合;
[0067]
步骤3:计算第一字符串集合与第二字符串集合之间的jaccard相似系数,并将所述第一字符串集合与第二字符串集合之间的jaccard相似系数标记为第一相似系数;以及计算第三字符串集合与第四字符串集合的jaccard相似系数,并将第三字符串集合与第四字符串集合的jaccard相似系数标记为第二相似系数;
[0068]
具体地,所述第一相似系数和第二相似系数通过jaccard相似算法计算得到,所述jaccard相似算法的具体公式如下:
[0069][0070]
式中:|
·
|表示集合中元素的个数,s表示第一字符串集合或第三字符串集合的归一化向量,t表示第二字符串集合或第四字符串集合归一化向量;j(s,t)∈[0,1],当集合j,t都为空时,定义j(s,t)取值为1;
[0071]
步骤4:分别将所述第一相似系数和第二相似系数与预设判定阈值进行比较,根据比较结果获取无关特征数据;所述预设判定阈值包括第一判定阈值和第二判断阈值;通过根据比较结果获取无关特征数据本发明能够挖掘出新老电站监控信息点表和新老电站命名信息中计算机程序能够识别的区别特征,从而有利于为后续准确识别并关联综自改造新旧两套通讯主站及其通道提供重要依据,进而有利于解决新老电站通信主站和通道选择错误的问题;
[0072]
具体地,根据比较结果获取无关特征数据,包括:
[0073]
s401:若所述第一相似系数大于等于设定的第一判定阈值,则判断新电站监控信息点表对应被监控设备的四遥信息与老电站监控信息点表中对应被监控设备的四遥信息具有强相似性,并将对应四遥信息标记为相关特征数据;反之,若所述第一相似系数小于第一判定阈值,则判断新电站监控信息点表对应被监控设备的四遥信息与老电站监控信息点表中对应被监控设备的四遥信息具有弱相似性,并将对应四遥信息标记为无关特征数据;
[0074]
s402:若所述第二相似系数大于等于设定的第二判定阈值,则判断对应新电站命名信息和对应老电站命名信息具有强相似性,并将对应命名信息标记为相关特征数据;反之,若所述第二相似系数小于第二判定阈值,则判断对应新电站命名信息和对应老电站命名信息具有弱相似性,并将对应命名信息标记为无关特征数据;
[0075]
步骤5:提取ⅰ区集中监控站上通信数据中的无关特征数据,根据所述无关特征数据并基于预设通道匹配模型进行匹配,以得到选择对应通道或对应主站;通过基于无关特征数据构建预设通道匹配模型,本发明有利于实现对新老电站通信主站和通道的快速匹配,从而满足变电站综合自动化改造过程中任务需求,进而能够提高变电站综合自动化改造的效率;
[0076]
具体地,所述预设通道匹配模型的生成过程如下:
[0077]
s501:获取包含无关特征数据的通信数据,以及若干通道序号或若干主站序号;
[0078]
s502:对包含无关特征数据的通信数据、若干通道序号或若干主站序号进行人为数据集标注;
[0079]
s503:将标注后的包含无关特征数据的通信数据、若干通道序号或若干主站序号作为样本集,并将样本集划分为70%的训练集和30%的测试集;
[0080]
s504:构建cnn神经网络,将所述70%的训练集作为输入数据输入所述cnn神经网络进行训练,以得到训练后的cnn神经网络;
[0081]
s505:利用30%的测试集对所述训练后的cnn神经网络进行模型验证,以输出满足预设准确度的cnn神经网络作为通道匹配模型;
[0082]
步骤6:将选择对应通道或对应主站的通讯数据发送至ⅵ区的自主验收客户端。
[0083]
需要说明的是:现有解决通信主站和通道选择错误的问题大多通过对新旧系统的变电站名称、通道名称进行人为区分,如下表1所示:
[0084]
表1:新旧系统的变电站名称、通道名称命名比对表
[0085][0086]
[0087]
通过上表可以看出,上表的新、旧两套通讯的命名规则是人工根据经验或习惯命名的,人工判断虽然能够判断出来,但若通过人工根据上表进行对应通道或对应主站的人为选择,不仅费时费力,效率低,而且还容易出错,因此本发明通过将四遥信息和命名信息进行字符串化,之后通过jaccard相似系数进行数据挖掘,提取其中无关特征数据作为区别依据,并利用神经网络模型对无关特征数据进行数据匹配,从而能够准确识别并关联综自改造新旧两套通讯主站及其通道,以保障监控信息点表下发至变电设备信号自助验收平台,以及后续监控信息联调验收选择通讯主站及通道的准确性。
[0088]
下述为本发明基于jaccard相似系数的新老变电站匹配装置实施例,可以用于执行本发明基于jaccard相似系数的新老变电站匹配方法实施例。对于本发明基于jaccard相似系数的新老变电站匹配装置实施例中未披露的细节,请参照本发明基于jaccard相似系数的新老变电站匹配方法实施例。
[0089]
请参见图2所示,其示出了本发明一个示例性实施例提供的一种基于jaccard相似系数的新老变电站匹配装置,该装置包括:第一数据生成模块10,用于根据ⅰ区集中监控站的监控信息点表生成新电站的第一字符串集合和老电站的第二字符串集合;所述监控信息点表包括新电站监控信息点表和老电站监控信息点表;
[0090]
具体地,根据ⅰ区集中监控站的监控信息点表生成新表电站的字符串集合和老电站字符串集合,包括:
[0091]
s101:分别提取新电站监控信息点表和老电站监控信息点表中每个被监控设备的四遥信息,所述四遥信息包括遥感、遥测、遥信和遥控;
[0092]
需要说明的是:所述被监控设备包括一次设备和二次设备;
[0093]
s102:分别针对新电站监控信息点表中每个被监控设备的四遥信息进行字符串转化,将转化后得到m个字符串输入预构建第一字符串集合;
[0094]
s103:分别针对老电站监控信息点表中每个被监控设备的四遥信息进行字符串转化,将转化后得到n个字符串输入预构建第二字符串集合;
[0095]
第二数据生成模块20,用于根据新电站命名信息和老电站命名信息分别生成新电站的第三字符串集合和老电站的第四字符串集合;
[0096]
具体地,根据新电站命名信息和老电站命名信息分别生成新电站的第三字符串集合和老电站的第四字符串集合,包括:
[0097]
s201:针对新电站命名信息进行字符串转化,将转化后得到p个字符串输入预构建第三字符串集合;
[0098]
s202:针对老电站命名信息进行字符串转化,将转化后得到q个字符串输入预构建第四字符串集合;
[0099]
数据挖掘模块30,用于计算第一字符串集合与第二字符串集合之间的jaccard相似系数,并将所述第一字符串集合与第二字符串集合之间的jaccard相似系数标记为第一相似系数;以及计算第三字符串集合与第四字符串集合的jaccard相似系数,并将第三字符串集合与第四字符串集合的jaccard相似系数标记为第二相似系数;
[0100]
具体地,所述第一相似系数和第二相似系数通过jaccard相似算法计算得到,所述jaccard相似算法的具体公式如下:
[0101][0102]
式中:|
·
|表示集合中元素的个数,s表示第一字符串集合或第三字符串集合的归一化向量,t表示第二字符串集合或第四字符串集合归一化向量;j(s,t)∈[0,1],当集合j,t都为空时,定义j(s,t)取值为1;
[0103]
判断比较模块40,用于分别将所述第一相似系数和第二相似系数与预设判定阈值进行比较,根据比较结果获取无关特征数据;所述预设判定阈值包括第一判定阈值和第二判断阈值;
[0104]
具体地,根据比较结果获取无关特征数据,包括:
[0105]
s401:若所述第一相似系数大于等于设定的第一判定阈值,则判断新电站监控信息点表对应被监控设备的四遥信息与老电站监控信息点表中对应被监控设备的四遥信息具有强相似性,并将对应四遥信息标记为相关特征数据;反之,若所述第一相似系数小于第一判定阈值,则判断新电站监控信息点表对应被监控设备的四遥信息与老电站监控信息点表中对应被监控设备的四遥信息具有弱相似性,并将对应四遥信息标记为无关特征数据;
[0106]
s402:若所述第二相似系数大于等于设定的第二判定阈值,则判断对应新电站命名信息和对应老电站命名信息具有强相似性,并将对应命名信息标记为相关特征数据;反之,若所述第二相似系数小于第二判定阈值,则判断对应新电站命名信息和对应老电站命名信息具有弱相似性,并将对应命名信息标记为无关特征数据;
[0107]
通道匹配模块50,用于提取ⅰ区集中监控站上通信数据中的无关特征数据,根据所述无关特征数据并基于预设通道匹配模型进行匹配,以得到选择对应通道或对应主站;
[0108]
在本技术实施例中,预设通道匹配模型包括:
[0109]
无关特征数据获取模块,用于获取包含无关特征数据的通信数据,以及若干通道序号或若干主站序号;
[0110]
数据集标注模块,用于对包含无关特征数据的通信数据、若干通道序号或若干主站序号进行人为数据集标注;
[0111]
样本集构建模块,用于将标注后的包含无关特征数据的通信数据、若干通道序号或若干主站序号作为样本集,并将样本集划分为70%的训练集和30%的测试集;
[0112]
cnn神经网络构建模块,用于构建cnn神经网络,并将所述70%的训练集作为输入数据输入所述cnn神经网络进行训练,以得到训练后的cnn神经网络;
[0113]
验证模块,用于利用30%的测试集对所述训练后的cnn神经网络进行模型验证,以输出满足预设准确度的cnn神经网络作为通道匹配模型。
[0114]
数据通信模块60,用于将选择对应通道或对应主站的通讯数据发送至ⅵ区的自主验收客户端。
[0115]
需要说明的是,上述实施例提供的一种基于jaccard相似系数的新老变电站匹配装置在执行一种基于jaccard相似系数的新老变电站匹配方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的一种基于jaccard相似系数的新老变电站匹配装置与一种基于jaccard相似系数的新老变电站匹配方法实施例属于同一构思,其体现实现过程详见一种基于
jaccard相似系数的新老变电站匹配方法实施例,这里不再赘述。
[0116]
在一个实施例中,本发明提出了一种电子设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:根据ⅰ区集中监控站的监控信息点表生成新电站的第一字符串集合和老电站的第二字符串集合;所述监控信息点表包括新电站监控信息点表和老电站监控信息点表;根据新电站命名信息和老电站命名信息分别生成新电站的第三字符串集合和老电站的第四字符串集合;计算第一字符串集合与第二字符串集合之间的jaccard相似系数,并将所述第一字符串集合与第二字符串集合之间的jaccard相似系数标记为第一相似系数;以及计算第三字符串集合与第四字符串集合的jaccard相似系数,并将第三字符串集合与第四字符串集合的jaccard相似系数标记为第二相似系数;分别将所述第一相似系数和第二相似系数与预设判定阈值进行比较,根据比较结果获取无关特征数据;所述预设判定阈值包括第一判定阈值和第二判断阈值;提取ⅰ区集中监控站上传通信数据中的无关特征数据,根据所述无关特征数据并基于预设通道匹配模型进行匹配,以得到选择对应通道或对应主站;根据所述对应通道或对应主站将所述通信数据发送至ⅵ区的自主验收客户端。
[0117]
在另一个实施例中,本发明还提出了一种计算机可读存储介质,该计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行以下步骤:根据ⅰ区集中监控站的监控信息点表生成新电站的第一字符串集合和老电站的第二字符串集合;所述监控信息点表包括新电站监控信息点表和老电站监控信息点表;根据新电站命名信息和老电站命名信息分别生成新电站的第三字符串集合和老电站的第四字符串集合;计算第一字符串集合与第二字符串集合之间的jaccard相似系数,并将所述第一字符串集合与第二字符串集合之间的jaccard相似系数标记为第一相似系数;以及计算第三字符串集合与第四字符串集合的jaccard相似系数,并将第三字符串集合与第四字符串集合的jaccard相似系数标记为第二相似系数;分别将所述第一相似系数和第二相似系数与预设判定阈值进行比较,根据比较结果获取无关特征数据;所述预设判定阈值包括第一判定阈值和第二判断阈值;提取ⅰ区集中监控站上传通信数据中的无关特征数据,根据所述无关特征数据并基于预设通道匹配模型进行匹配,以得到选择对应通道或对应主站;根据所述对应通道或对应主站将所述通信数据发送至ⅵ区的自主验收客户端。
[0118]
上述公式均是去量纲取其数值计算,公式是由采集大量数据进行软件模拟得到最近真实情况的一个公式,公式中的预设参数以及阈值选取由本领域的技术人员根据实际情况进行设置。
[0119]
上述实施例,可以全部或部分地通过软件、硬件、固件或其他任意组合来实现。当使用软件实现时,上述实施例可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令或计算机程序。在计算机上加载或执行所述计算机指令或计算机程序时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以为通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线网络或无线网络方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介
质集合的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质。半导体介质可以是固态硬盘。
[0120]
本领域普通技术人员可意识到,结合本发明中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0121]
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0122]
在本发明所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其他的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其他的形式。
[0123]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0124]
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
[0125]
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
[0126]
最后:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

技术特征:
1.一种基于jaccard相似系数的新老变电站匹配方法,其特征在于,包括以下具体步骤:根据ⅰ区集中监控站的监控信息点表生成新电站的第一字符串集合和老电站的第二字符串集合;所述监控信息点表包括新电站监控信息点表和老电站监控信息点表;根据新电站命名信息和老电站命名信息分别生成新电站的第三字符串集合和老电站的第四字符串集合;计算第一字符串集合与第二字符串集合之间的jaccard相似系数,并将所述第一字符串集合与第二字符串集合之间的jaccard相似系数标记为第一相似系数;以及计算第三字符串集合与第四字符串集合的jaccard相似系数,并将第三字符串集合与第四字符串集合的jaccard相似系数标记为第二相似系数;分别将所述第一相似系数和第二相似系数与预设判定阈值进行比较,根据比较结果获取无关特征数据;所述预设判定阈值包括第一判定阈值和第二判断阈值;提取ⅰ区集中监控站上通信数据中的无关特征数据,根据所述无关特征数据并基于预设通道匹配模型进行匹配,以得到选择对应通道或对应主站;将选择对应通道或对应主站的通讯数据发送至ⅵ区的自主验收客户端。2.根据权利要求1所述的一种基于jaccard相似系数的新老变电站匹配方法,其特征在于,所述根据ⅰ区集中监控站的新老变电站监控信息点表生成新电站的第一字符串集合和老电站的第二字符串集合,包括:提取新电站监控信息点表和老电站监控信息点表中每个被监控设备的四遥信息,所述四遥信息包括遥感、遥测、遥信和遥控;对新电站监控信息点表中每个被监控设备的四遥信息进行字符串转化,将转化后得到m个字符串输入预构建第一字符串集合;对老电站监控信息点表中每个被监控设备的四遥信息进行字符串转化,将转化后得到n个字符串输入预构建第二字符串集合。3.根据权利要求1所述的一种基于jaccard相似系数的新老变电站匹配方法,其特征在于,所述根据新电站命名信息和老电站命名信息分别生成新电站的第三字符串集合和老电站的第四字符串集合,包括:根据新电站命名信息和老电站命名信息分别生成新电站的第三字符串集合和老电站的第四字符串集合,包括:对新电站命名信息进行字符串转化,将转化后得到p个字符串输入预构建第三字符串集合;对老电站命名信息进行字符串转化,将转化后得到q个字符串输入预构建第四字符串集合。4.根据权利要求1所述的一种基于jaccard相似系数的新老变电站匹配方法,其特征在于,所述第一相似系数和第二相似系数通过jaccard相似算法计算得到,jaccard相似算法的具体公式如下:式中:|
·
|表示集合中元素的个数,s表示第一字符串集合或第三字符串集合的归一化
向量,t表示第二字符串集合或第四字符串集合归一化向量;j(s,t)∈[0,1],当集合j,t都为空时,定义j(s,t)取值为1。5.根据权利要求7所述的一种基于jaccard相似系数的新老变电站匹配方法,其特征在于,所述将相似系数与预设判定阈值进行比较,根据比较结果获取无关特征数据,包括:若所述第一相似系数大于等于设定的第一判定阈值,则判断新电站监控信息点表对应被监控设备的四遥信息与老电站监控信息点表中对应被监控设备的四遥信息具有强相似性,并将对应四遥信息标记为相关特征数据;反之,若所述第一相似系数小于设定的第一判定阈值,则判断新电站监控信息点表对应被监控设备的四遥信息与老电站监控信息点表中对应被监控设备的四遥信息具有弱相似性,并将对应四遥信息标记为无关特征数据;若所述第二相似系数大于等于设定的第二判定阈值,则判断对应新电站命名信息和对应老电站命名信息具有强相似性,并将对应命名信息标记为相关特征数据;反之,若所述第二相似系数小于设定的第二判定阈值,则判断对应新电站命名信息和对应老电站命名信息具有弱相似性,并将对应命名信息标记为无关特征数据。6.根据权利要求5所述的一种基于jaccard相似系数的新老变电站匹配方法,其特征在于,所述预设通道匹配模型的生成过程如下:获取包含无关特征数据的通信数据,以及若干通道序号或若干主站序号;对包含无关特征数据的通信数据、若干通道序号或若干主站序号进行人为数据集标注;将标注后的包含无关特征数据的通信数据、若干通道序号或若干主站序号作为样本集,并将样本集划分为70%的训练集和30%的测试集;构建cnn神经网络,将所述70%的训练集作为输入数据输入所述cnn神经网络进行训练,以得到训练后的cnn神经网络;利用30%的测试集对所述训练后的cnn神经网络进行模型验证,以输出满足预设准确度的cnn神经网络作为通道匹配模型。7.一种基于jaccard相似系数的新老变电站匹配装置,其特征在于,包括:第一数据生成模块,用于根据ⅰ区集中监控站的监控信息点表生成新电站的第一字符串集合和老电站的第二字符串集合;所述监控信息点表包括新电站监控信息点表和老电站监控信息点表;第二数据生成模块,用于根据新电站命名信息和老电站命名信息分别生成新电站的第三字符串集合和老电站的第四字符串集合;数据挖掘模块,用于计算第一字符串集合与第二字符串集合之间的jaccard相似系数,并将所述第一字符串集合与第二字符串集合之间的jaccard相似系数标记为第一相似系数;以及计算第三字符串集合与第四字符串集合的jaccard相似系数,并将第三字符串集合与第四字符串集合的jaccard相似系数标记为第二相似系数;判断比较模块,用于分别将所述第一相似系数和第二相似系数与预设判定阈值进行比较,根据比较结果获取无关特征数据;所述预设判定阈值包括第一判定阈值和第二判断阈值;通道匹配模块,用于提取ⅰ区集中监控站上通信数据中的无关特征数据,根据所述无关特征数据并基于预设通道匹配模型进行匹配,以得到选择对应通道或对应主站;
数据通信模块,用于将选择对应通道或对应主站的通讯数据发送至ⅵ区的自主验收客户端。8.根据权利要求7所述的一种基于jaccard相似系数的新老变电站匹配装置,其特征在于,所述预设通道匹配模型包括:无关特征数据获取模块,用于获取包含无关特征数据的通信数据,以及若干通道序号或若干主站序号;数据集标注模块,用于对包含无关特征数据的通信数据、若干通道序号或若干主站序号进行人为数据集标注;样本集构建模块,用于将标注后的包含无关特征数据的通信数据、若干通道序号或若干主站序号作为样本集,并将样本集划分为70%的训练集和30%的测试集;cnn神经网络构建模块,用于构建cnn神经网络,并将所述70%的训练集作为输入数据输入所述cnn神经网络进行训练,以得到训练后的cnn神经网络;验证模块,用于利用30%的测试集对所述训练后的cnn神经网络进行模型验证,以输出满足预设准确度的cnn神经网络作为通道匹配模型。9.一种电子设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,其特征在于,所述计算机可读指令被所述处理器执行时,使得所述处理器执行权利要求1至6任一项权利要求所述基于jaccard相似系数的新老变电站匹配方法的步骤。10.一种计算机可读存储介质,其特征在于,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至6任一项权利要求所述基于jaccard相似系数的新老变电站匹配方法的步骤。

技术总结
本发明公开了一种基于Jaccard相似系数的新老变电站匹配方法及装置,包括:生成第一字符串集合和第二字符串集合、第三字符串集合和第四字符串集合;将第一字符串集合与第二字符串集合之间的Jaccard相似系数标记为第一相似系数;将第三字符串集合与第四字符串集合的Jaccard相似系数标记为第二相似系数;分别将第一相似系数和第二相似系数与预设判定阈值进行比较,获取无关特征数据;提取通信数据中的无关特征数据,并基于预设通道匹配模型进行匹配,得到选择对应通道或对应主站;将选择对应通道或对应主站的通讯数据发送至Ⅵ区的自主验收客户端。本发明能够准确识别并关联综自改造新旧两套通讯主站及其通道,以保障监控信息点表下发至变电设备信号自助验收平台。息点表下发至变电设备信号自助验收平台。息点表下发至变电设备信号自助验收平台。


技术研发人员:王浩 王功臣 娄德章 郑阳 马伸铜 邵飞 滕松 张潇 沈润 肖伟
受保护的技术使用者:国网江苏省电力有限公司双创中心
技术研发日:2023.06.13
技术公布日:2023/9/12
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐