一种调度自动化主站系统异常操作辨识方法及装置与流程
未命名
07-15
阅读:105
评论:0

1.本发明涉及电力系统调度控制技术领域,尤其是涉及一种基于关联分析的调度自动化主站系统异常操作辨识方法及装置。
背景技术:
2.随着构建新型电力系统逐步推进,新能源持续大规模集中接入,特高压交直流工程的不断建成,互联电网规模不断扩大,使得电网运行特性由区域模式转向全局模式,电网运行和调度控制系统作为电网运行控制和调度生产管理的核心支撑系统愈发重要,调度控制系统作为电网数据汇聚、处理和控制的中枢,如何保障调度自动化主站系统调度操作的安全可靠,是电网的安全稳定运行迫切需要解决的重要问题。
3.目前,现有对于调度自动化主站系统异常操作辨识的研究大多都是从管理组织、体系角度考虑,对严格、严肃的辨识方法研究较少;并且针对简单错误和简单异常,当面对复杂的电网异常操作,缺乏快速且精确的辨识方法;随着调度自动化主站系统中含有的数据类型和数据量的增大,以往的方法无法适应,先进的方法缺少研究,各部分的信息以及关联信息的深入挖掘和应用还比较少。
技术实现要素:
4.本发明的目的就是为了提供一种基于关联分析的调度自动化主站系统异常操作辨识方法及装置,充分利用操作数据中的关联信息,快速、精确的识别大量且复杂操作数据中的异常操作,有效抑制异常操作导致的电网安全运行事故,提高电网的安全稳定运行水平。
5.本发明的目的可以通过以下技术方案来实现:
6.一种基于关联分析的调度自动化主站系统异常操作辨识方法,包括以下步骤:
7.s1,获取调度自动化主站系统中调度操作的原始数据;
8.s2,对原始数据进行预处理;
9.s3,对预处理后的数据进行数据增强,增加其中异常操作数据的比例,得到数据增强后的数据集;
10.s4,对数据增强后的数据集中的特定数据进行模糊化处理,得到模糊化处理后的数据集;
11.s5,对模糊化处理后的数据集进行关联分析,得到异常操作的关联分析结果和合规操作的关联分析结果,将异常操作的关联分析结果作为调度操作的异常特征,将合规操作的关联分析结果作为调度操作的合规特征;
12.s6,基于合规特征和异常特征进行异常操作辨识。
13.所述原始数据包括操作单位、操作内容、操作时间、操作人员工号、操作人员职称、操作人员职务。
14.所述s2包括以下步骤:
15.s21,删除带有缺失值或乱码的原始数据;
16.s22,将多个原始数据源合并放到一个数据存储中;
17.s23,对原始数据中文本数据的分词、去停用词处理,其中,所述去停用词指删去文本数据中对数据分析没有作用的词;
18.s24,给出每条数据的标签,即操作结果是合规操作还是异常操作。
19.所述s3包括以下步骤:
20.s31,采集预处理后的原始数据中所有操作结果为异常操作的数据;
21.s32,将采集到的每一条异常操作数据作为输入,利用回译、同义词替换、随机插入、随机交换、随机删除操作生成新的操作数据,其中,每条异常操作数据都会用上述5种方法各生成一条新的操作数据,回译是将异常操作数据里表示操作内容的文本数据翻译成另一种语言,再翻译回原语言;同义词替换是从异常操作数据里表示操作内容的文本数据中随机选取某个词,并随机选取其同义词替换该词;随机插入是随机选取异常操作数据里表示操作内容的文本数据中某个词,并求出其同义词,将该同义词随机插入该文本数据中的一个随机位置;随机交换是随机地选择异常操作数据里表示操作内容的文本数据中两个词并交换它们的位置;随机删除是随机删除异常操作数据里表示操作内容的文本数据中某个词;
22.s33,将步骤s32生成的新的操作数据合并到预处理后的原始数据中,得到数据增强后的数据集。
23.所述s4中的特定数据包括操作内容和操作时间。
24.对操作内容的模糊化处理具体为:采用聚类算法将操作内容分为多个聚类簇,并给出每个聚类簇的标签,用聚类簇的标签替换该聚类簇中的操作内容,其中,所述聚类算法包括以下步骤:
25.s411,选取待聚类的操作内容,表示为a;
26.s412,从某一个聚类簇中随机抽取5项操作内容,表示为集合b{b1;b2;
···
;bk;
···
;b5},其中k是索引变量,bk表示第k个操作内容,若该簇中操作内容少于5项,则取全部,若没有聚类簇,则直接创建一个新聚类簇,将操作内容放入新聚类簇中;
27.s413,采用如下公式,计算操作内容a与操作内容bk的相似度:
[0028][0029]
其中,函数l(x)表示操作内容x中的字符数,s为相似度,c为a和bk中相同的字符;
[0030]
s414,若该聚类簇中随机抽取的所有操作内容bk与操作内容a的相似度都大于预配置的阈值,则将操作内容a放入该聚类簇;若遍历完所有的聚类簇都不满足阈值条件,则新创建一个聚类簇,并将操作内容a放入该聚类簇中;
[0031]
s415,对于每个操作内容,重复步骤s411至步骤s414,完成聚类。
[0032]
对操作时间的模糊化处理具体为把操作时间分为凌晨、上午、下午和晚上四类。
[0033]
所述s5中的关联分析方法包括apriori算法。
[0034]
所述s6具体为:当调度操作出现某个异常特征时,提醒注意调度操作是否存在错误;当调度操作出现合规特征时,则认为调度操作大概率正确,根据需要判断是否需要进行进一步辨识。
[0035]
一种基于关联分析的调度自动化主站系统异常操作辨识装置,包括存储器、处理器,以及存储于所述存储器中的程序,所述处理器执行所述程序时实现如上述所述的方法。
[0036]
与现有技术相比,本发明具有以下有益效果:
[0037]
(1)本发明通过基于统计规则的关联分析方法,从大量且复杂的电网操作数据中识别特征,并综合考虑异常操作的异常特征和合规操作的合规特征,完成调度自动化主站系统异常操作的辨识,提高电网的安全稳定运行水平。
[0038]
(2)本发明考虑到异常操作的原始数据较少的情况,对原始数据进行数据增强,增加其中异常操作比例,还对部分数据进行模糊化处理,有利于更好地提取合规/异常特征,使得调度自动化主站系统异常操作的辨识更加准确。
[0039]
(3)本发明方法简单,没有复杂的算法模型,运行效率高,能够快速的实现异常操作辨识。
附图说明
[0040]
图1为本发明的方法流程图;
[0041]
图2是本发明对原始数据进行预处理的流程示意图;
[0042]
图3是本发明对原始数据进行数据增强的流程示意图;
[0043]
图4是本发明的聚类算法的流程示意图。
具体实施方式
[0044]
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
[0045]
本实施例提供一种基于关联分析的调度自动化主站系统异常操作辨识方法,如图1所示,包括以下步骤:
[0046]
s1,获取调度自动化主站系统中调度操作的原始数据。
[0047]
本实施例获取的原始数据如表1所示。
[0048]
表1原始数据
[0049]
编号1234操作单位**变电站**变电站**变电站**变电站操作内容断开**开关拉开**刀闸断开**断路器合上**刀闸操作时间2022\6\12 21:102022\6\12 21:132022\6\13 11:102022\6\13 11:15操作人员工号a20170811a20170811a20180803a20180803操作人员职称中级职称中级职称助理级职称助理级职称操作人员职务调度正职调度正职调度副职调度副职
[0050]
s2,对原始数据进行预处理,如图2所示,具体包括以下步骤:
[0051]
s21,删除带有缺失值或乱码的原始数据;
[0052]
s22,将多个原始数据源合并放到一个数据存储中;
[0053]
s23,对原始数据中文本数据的分词、去停用词处理,其中,所述去停用词指删去文本数据中对数据分析没有作用的词;
[0054]
s24,给出每条数据的标签,即操作结果是合规操作还是异常操作。
[0055]
s3,对预处理后的数据进行数据增强,增加其中异常操作数据的比例,得到数据增强后的数据集,如图3所示,具体包括以下步骤:
[0056]
s31,采集预处理后的原始数据中所有操作结果为异常操作的数据。
[0057]
s32,将采集到的每一条异常操作数据作为输入,利用回译、同义词替换、随机插入、随机交换、随机删除操作生成新的操作数据,其中,每条异常操作数据都会用上述5种方法各生成一条新的操作数据,回译是将异常操作数据里表示操作内容的文本数据翻译成另一种语言,再翻译回原语言;同义词替换是从异常操作数据里表示操作内容的文本数据中随机选取某个词,并随机选取其同义词替换该词;随机插入是随机选取异常操作数据里表示操作内容的文本数据中某个词,并求出其同义词,将该同义词随机插入该文本数据中的一个随机位置;随机交换是随机地选择异常操作数据里表示操作内容的文本数据中两个词并交换它们的位置;随机删除是随机删除异常操作数据里表示操作内容的文本数据中某个词。
[0058]
s33,将步骤s32生成的新的操作数据合并到预处理后的原始数据中,得到数据增强后的数据集。
[0059]
s4,对数据增强后的数据集中的特定数据进行模糊化处理,得到模糊化处理后的数据集。
[0060]
本实施例中,特定数据取操作内容和操作时间,则s4包括以下步骤:
[0061]
s41,对操作内容的模糊化处理:采用聚类算法将操作内容分为多个聚类簇,并给出每个聚类簇的标签,用聚类簇的标签替换该聚类簇中的操作内容。
[0062]
如图4所示,聚类算法包括以下步骤:
[0063]
s411,选取待聚类的操作内容,表示为a。
[0064]
s412,从某一个聚类簇中随机抽取5项操作内容,表示为集合b{b1;b2;
···
;bk;
···
;b5},其中k是索引变量,bk表示第k个操作内容,若该簇中操作内容少于5项,则取全部,若没有聚类簇,则直接创建一个新聚类簇,将操作内容放入新聚类簇中。
[0065]
s413,采用如下公式,计算操作内容a与操作内容bk的相似度:
[0066][0067]
其中,函数l(x)表示操作内容x中的字符数,s为相似度,c为a和bk中相同的字符。
[0068]
s414,若该聚类簇中随机抽取的所有操作内容bk与操作内容a的相似度都大于预配置的阈值,则将操作内容a放入该聚类簇;若遍历完所有的聚类簇都不满足阈值条件,则新创建一个聚类簇,并将操作内容a放入该聚类簇中。
[0069]
由于各操作内容的相似度较小,因此本实施例中阈值取0.2。
[0070]
s415,对于每个操作内容,重复步骤s411至步骤s414,完成聚类。
[0071]
s42,对操作时间的模糊化处理:以0时、6时、12时、18时为界,把操作时间分为凌晨、上午、下午和晚上四类。
[0072]
s5,基于apriori算法对模糊化处理后的数据集进行关联分析,得到异常操作的关联分析结果和合规操作的关联分析结果,将异常操作的关联分析结果作为调度操作的异常特征,将合规操作的关联分析结果作为调度操作的合规特征。
[0073]
基于apriori算法进行关联分析的过程具体属于本领域的常规设置,为了避免本技术的目的模糊,故在此不再赘述。apriori算法中,本实施例取最小支持度为0.3,最小置信度为0.7。
[0074]
在另一种实施例中,可以采用其他关联分析算法,均能实现本发明目的,即,本发明不对关联分析所采用的方法进行任意限制。
[0075]
s6,基于合规特征和异常特征进行异常操作辨识。
[0076]
当调度操作出现某个异常特征时,提醒注意调度操作是否存在错误;当调度操作出现合规特征时,则认为调度操作大概率正确,根据需要判断是否需要进行进一步辨识。
[0077]
本发明通过基于统计规则的关联分析算法,综合考虑异常操作的异常特征和合规操作的合规特征,完成调度自动化主站系统异常操作的辨识,提高了电网的安全稳定运行水平。
[0078]
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思做出诸多修改和变化。因此,凡本技术领域中技术人员依据本发明的构思在现有技术的基础上通过逻辑分析、推理、或者有限的实验可以得到的技术方案,皆应在权利要求书所确定的保护范围内。
技术特征:
1.一种基于关联分析的调度自动化主站系统异常操作辨识方法,其特征在于,包括以下步骤:s1,获取调度自动化主站系统中调度操作的原始数据;s2,对原始数据进行预处理;s3,对预处理后的数据进行数据增强,增加其中异常操作数据的比例,得到数据增强后的数据集;s4,对数据增强后的数据集中的特定数据进行模糊化处理,得到模糊化处理后的数据集;s5,对模糊化处理后的数据集进行关联分析,得到异常操作的关联分析结果和合规操作的关联分析结果,将异常操作的关联分析结果作为调度操作的异常特征,将合规操作的关联分析结果作为调度操作的合规特征;s6,基于合规特征和异常特征进行异常操作辨识。2.根据权利要求1所述的一种基于关联分析的调度自动化主站系统异常操作辨识方法,其特征在于,所述原始数据包括操作单位、操作内容、操作时间、操作人员工号、操作人员职称、操作人员职务。3.根据权利要求1所述的一种基于关联分析的调度自动化主站系统异常操作辨识方法,其特征在于,所述s2包括以下步骤:s21,删除带有缺失值或乱码的原始数据;s22,将多个原始数据源合并放到一个数据存储中;s23,对原始数据中文本数据的分词、去停用词处理,其中,所述去停用词指删去文本数据中对数据分析没有作用的词;s24,给出每条数据的标签,即操作结果是合规操作还是异常操作。4.根据权利要求2所述的一种基于关联分析的调度自动化主站系统异常操作辨识方法,其特征在于,所述s3包括以下步骤:s31,采集预处理后的原始数据中所有操作结果为异常操作的数据;s32,将采集到的每一条异常操作数据作为输入,利用回译、同义词替换、随机插入、随机交换、随机删除操作生成新的操作数据,其中,每条异常操作数据都会用上述5种方法各生成一条新的操作数据,回译是将异常操作数据里表示操作内容的文本数据翻译成另一种语言,再翻译回原语言;同义词替换是从异常操作数据里表示操作内容的文本数据中随机选取某个词,并随机选取其同义词替换该词;随机插入是随机选取异常操作数据里表示操作内容的文本数据中某个词,并求出其同义词,将该同义词随机插入该文本数据中的一个随机位置;随机交换是随机地选择异常操作数据里表示操作内容的文本数据中两个词并交换它们的位置;随机删除是随机删除异常操作数据里表示操作内容的文本数据中某个词;s33,将步骤s32生成的新的操作数据合并到预处理后的原始数据中,得到数据增强后的数据集。5.根据权利要求2所述的一种基于关联分析的调度自动化主站系统异常操作辨识方法,其特征在于,所述s4中的特定数据包括操作内容和操作时间。6.根据权利要求5所述的一种基于关联分析的调度自动化主站系统异常操作辨识方法,其特征在于,对操作内容的模糊化处理具体为:采用聚类算法将操作内容分为多个聚类
簇,并给出每个聚类簇的标签,用聚类簇的标签替换该聚类簇中的操作内容,其中,所述聚类算法包括以下步骤:s411,选取待聚类的操作内容,表示为a;s412,从某一个聚类簇中随机抽取5项操作内容,表示为集合b{b1;b2;
···
;b
k
;
···
;b5},其中k是索引变量,b
k
表示第k个操作内容,若该簇中操作内容少于5项,则取全部,若没有聚类簇,则直接创建一个新聚类簇,将操作内容放入新聚类簇中;s413,采用如下公式,计算操作内容a与操作内容b
k
的相似度:其中,函数l(x)表示操作内容x中的字符数,s为相似度,c为a和b
k
中相同的字符;s414,若该聚类簇中随机抽取的所有操作内容b
k
与操作内容a的相似度都大于预配置的阈值,则将操作内容a放入该聚类簇;若遍历完所有的聚类簇都不满足阈值条件,则新创建一个聚类簇,并将操作内容a放入该聚类簇中;s415,对于每个操作内容,重复步骤s411至步骤s414,完成聚类。7.根据权利要求5所述的一种基于关联分析的调度自动化主站系统异常操作辨识方法,其特征在于,对操作时间的模糊化处理具体为把操作时间分为凌晨、上午、下午和晚上四类。8.根据权利要求1所述的一种基于关联分析的调度自动化主站系统异常操作辨识方法,其特征在于,所述s5中的关联分析方法包括apriori算法。9.根据权利要求1所述的一种基于关联分析的调度自动化主站系统异常操作辨识方法,其特征在于,所述s6具体为:当调度操作出现某个异常特征时,提醒注意调度操作是否存在错误;当调度操作出现合规特征时,则认为调度操作大概率正确,根据需要判断是否需要进行进一步辨识。10.一种基于关联分析的调度自动化主站系统异常操作辨识装置,包括存储器、处理器,以及存储于所述存储器中的程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-9中任一所述的方法。
技术总结
本发明属于电力系统调度控制技术领域,具体涉及一种基于关联分析的调度自动化主站系统异常操作辨识方法及装置,其中方法包括以下步骤:获取调度自动化主站系统中调度操作的原始数据;对原始数据进行预处理;对预处理后的数据进行数据增强,增加异常操作数据的比例;对数据增强后的数据集中的特定数据进行模糊化处理;对模糊化处理后的数据集进行关联分析,得到异常操作的关联分析结果和合规操作的关联分析结果,将异常操作的关联分析结果作为调度操作的异常特征,将合规操作的关联分析结果作为调度操作的合规特征;基于合规特征和异常特征进行异常操作辨识。与现有技术相比,本发明具有异常操作辨识精度高、可实现性强等优点。点。点。
技术研发人员:陈宏福 王治华 马尉源 高峰 严亚勤 朱南阳 张叶青 韩政 朱江 王智娴 张凯锋
受保护的技术使用者:国网上海市电力公司
技术研发日:2023.03.20
技术公布日:2023/7/12
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/