设备异常使用识别方法、装置、电子设备及存储介质与流程
未命名
08-06
阅读:78
评论:0

1.本技术涉及数据异常识别技术领域,具体涉及一种设备异常使用识别方法、装置、电子设备及计算机可读存储介质。
背景技术:
2.随着电子商务的普及,网上购物已经成为人们生活中必不可少的一部分,因此带动了物流行业的快速发展,快递量每年也呈井喷式的增长。
3.快递运输过程中通常会配置如收派车辆、中转场设备、收派终端设备、便携打印机等各种类型设备,以提高作业效率。但是,物流场景中涉及的设备种类多、数量大、范围广,因此,对于设备是否存在违规等异常使用行为,通过传统人工静态管理方式难以全面、准确地识别出来。
技术实现要素:
4.本技术提供一种设备异常使用识别方法、装置、电子设备及计算机可读存储介质,可以更加准确、全面地识别异常使用设备,提高异常使用设备的识别全面性及识别效率。
5.第一方面,本技术提供一种设备异常使用识别方法,所述方法包括:
6.获取各待识别设备的操作特征;
7.基于所述各待识别设备的操作特征进行离群点检测,得到所述各待识别设备中的离群点设备;
8.基于预设的异常程度预测参数,根据所述离群点设备的操作特征进行预测得到所述离群点设备的异常程度;
9.若所述异常程度大于预设程度阈值,则确定所述离群点设备为异常使用设备。
10.在本技术的一些实施例中,所述基于所述各待识别设备的操作特征进行离群点检测,得到所述各待识别设备中的离群点设备,包括:
11.通过预设的聚类算法,根据所述各待识别设备的操作特征对所述各待识别设备进行聚类,得到所述各待识别设备中的离群点设备。
12.在本技术的一些实施例中,所述基于预设的异常程度预测参数,根据所述离群点设备的操作特征进行预测得到所述离群点设备的异常程度之前,还包括:
13.获取各样本设备的操作特征;
14.根据所述各样本设备的操作特征对预设孤立森林进行训练,得到已训练孤立森林;
15.将所述已训练孤立森林的模型参数作为所述异常程度预测参数。
16.在本技术的一些实施例中,所述基于所述各待识别设备的操作特征进行离群点检测,得到所述各待识别设备中的离群点设备,包括:
17.基于预先学习得到的特征编码参数,对所述各待识别设备的操作特征进行编码,得到所述各待识别设备的操作特征的目标编码特征;
18.通过预先学习得到的特征解码参数,对所述目标编码特征进行解码,得到所述各待识别设备的操作特征的目标解码特征;
19.基于所述各待识别设备的操作特征和所述目标解码特征之间的相似度,确定所述各待识别设备是否为离群点数据,得到所述各待识别设备中的离群点设备。
20.在本技术的一些实施例中,所述获取各待识别设备的操作特征,包括:
21.获取所述各待识别设备的设备使用数据;
22.获取所述各待识别设备的设备统计数据;
23.基于所述各待识别设备的设备使用数据和所述各待识别设备的设备统计数据,获得所述各待识别设备的操作特征。
24.在本技术的一些实施例中,所述获取各待识别设备的操作特征,包括:
25.若所述各待识别设备为联网设备,则通过大数据埋点方式实时采集所述各待识别设备的操作特征;
26.若所述各待识别设备为非联网设备,则通过联网设备实时采集所述各待识别设备的操作特征。
27.在本技术的一些实施例中,所述确定所述离群点设备为异常使用设备之后,还包括:
28.输出所述离群点设备异常使用的提示信息。
29.第二方面,本技术提供一种设备异常使用识别装置,所述设备异常使用识别装置包括:
30.获取单元,用于获取各待识别设备的操作特征;
31.检测单元,用于基于所述各待识别设备的操作特征进行离群点检测,得到所述各待识别设备中的离群点设备;
32.预测单元,用于基于预设的异常程度预测参数,根据所述离群点设备的操作特征进行预测得到所述离群点设备的异常程度;
33.识别单元,用于若所述异常程度大于预设程度阈值,则确定所述离群点设备为异常使用设备。
34.在本技术的一些实施例中,所述检测单元具体用于:
35.通过预设的聚类算法,根据所述各待识别设备的操作特征对所述各待识别设备进行聚类,得到所述各待识别设备中的离群点设备。
36.在本技术的一些实施例中,所述基于预设的异常程度预测参数,根据所述离群点设备的操作特征进行预测得到所述离群点设备的异常程度之前,所述预测单元具体用于:
37.获取各样本设备的操作特征;
38.根据所述各样本设备的操作特征对预设孤立森林进行训练,得到已训练孤立森林;
39.将所述已训练孤立森林的模型参数作为所述异常程度预测参数。
40.在本技术的一些实施例中,所述检测单元具体用于:
41.基于预先学习得到的特征编码参数,对所述各待识别设备的操作特征进行编码,得到所述各待识别设备的操作特征的目标编码特征;
42.通过预先学习得到的特征解码参数,对所述目标编码特征进行解码,得到所述各
待识别设备的操作特征的目标解码特征;
43.基于所述各待识别设备的操作特征和所述目标解码特征之间的相似度,确定所述各待识别设备是否为离群点数据,得到所述各待识别设备中的离群点设备。
44.在本技术的一些实施例中,所述获取单元具体用于:
45.获取所述各待识别设备的设备使用数据;
46.获取所述各待识别设备的设备统计数据;
47.基于所述各待识别设备的设备使用数据和所述各待识别设备的设备统计数据,获得所述各待识别设备的操作特征。
48.在本技术的一些实施例中,所述获取单元具体用于:
49.若所述各待识别设备为联网设备,则通过大数据埋点方式实时采集所述各待识别设备的操作特征;
50.若所述各待识别设备为非联网设备,则通过联网设备实时采集所述各待识别设备的操作特征。
51.在本技术的一些实施例中,所述设备异常使用识别装置还包括输出单元,所述确定所述离群点设备为异常使用设备之后,所述输出单元具体用于:
52.输出所述离群点设备异常使用的提示信息。
53.第三方面,本技术还提供一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时执行本技术提供的任一种设备异常使用识别方法中的步骤。
54.第四方面,本技术还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器进行加载,以执行所述的设备异常使用识别方法中的步骤。
55.本技术中,第一方面,先基于各待识别设备的操作特征进行离群点检测,得到各待识别设备中的离群点设备,可以先初步筛选出可以是异常使用设备对应的离群点设备的操作特征;再基于预设的异常程度预测参数,根据离群点设备的操作特征进行预测得到离群点设备的异常程度,用于识别异常使用设备,从而可以进一步确定离群点设备是否为异常使用设备,因此可以更加准确地识别异常使用设备,减少异常使用情况的误判;第二方面,由于可以自动识别物流场景中涉及的各种类型设备,无需传统人工静态管理方式进行异常使用监控,提高了异常使用设备的识别全面性及识别效率。
附图说明
56.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
57.图1是本技术实施例所提供的设备异常使用识别系统的场景示意图;
58.图2是本技术实施例提供的设备异常使用识别方法的一种流程示意图;
59.图3是本技术实施例中提供的自编码器的结构示意图;
60.图4是本技术申请实施例中异常使用设备识别的一种说明示意图;
61.图5是本技术实施例提供的输出提示信息的一种实施方式示意图;
62.图6是本技术实施例提供的输出提示信息的另一种实施方式示意图;
63.图7是本技术实施例中提供的设备异常使用识别装置的一个实施例结构示意图;
64.图8是本技术实施例中提供的电子设备的一个实施例结构示意图。
具体实施方式
65.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
66.在本技术实施例的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本技术实施例的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
67.为了使本领域任何技术人员能够实现和使用本技术,给出了以下描述。在以下描述中,为了解释的目的而列出了细节。应当明白的是,本领域普通技术人员可以认识到,在不使用这些特定细节的情况下也可以实现本技术。在其它实例中,不会对公知的过程进行详细阐述,以避免不必要的细节使本技术实施例的描述变得晦涩。因此,本技术并非旨在限于所示的实施例,而是与符合本技术实施例所公开的原理和特征的最广范围相一致。
68.本技术实施例设备异常使用识别方法的执行主体可以为本技术实施例提供的设备异常使用识别装置,或者集成了该设备异常使用识别装置的服务器设备、物理主机或者用户设备(user equipment,ue)等不同类型的电子设备,其中,设备异常使用识别装置可以采用硬件或者软件的方式实现,ue具体可以为智能手机、平板电脑、笔记本电脑、掌上电脑、台式电脑或者个人数字助理(personal digital assistant,pda)等终端设备。
69.该电子设备可以采用单独运行的工作方式,或者也可以采用设备集群的工作方式,通过应用本技术实施例提供的设备异常使用识别方法,可以更加准确、全面地识别异常使用设备,提高异常使用设备的识别全面性及识别效率。
70.参见图1,图1是本技术实施例所提供的设备异常使用识别系统的场景示意图。其中,该设备异常使用识别系统可以包括电子设备100,电子设备100中集成有设备异常使用识别装置。例如,该电子设备可以获取各待识别设备的操作特征;基于所述各待识别设备的操作特征进行离群点检测,得到所述各待识别设备中的离群点设备;基于预设的异常程度预测参数,根据所述离群点设备的操作特征进行预测得到所述离群点设备的异常程度;若所述异常程度大于预设程度阈值,则确定所述离群点设备为异常使用设备。
71.另外,如图1所示,该设备异常使用识别系统还可以包括存储器200,用于存储数据,如存储设备的使用数据。
72.需要说明的是,图1所示的设备异常使用识别系统的场景示意图仅仅是一个示例,本技术实施例描述的设备异常使用识别系统以及场景是为了更加清楚的说明本技术实施例的技术方案,并不构成对于本技术实施例提供的技术方案的限定,本领域普通技术人员可知,随着设备异常使用识别系统的演变和新业务场景的出现,本发明实施例提供的技术方案对于类似的技术问题,同样适用。
73.下面,开始介绍本技术实施例提供的设备异常使用识别方法,本技术实施例中以电子设备作为执行主体,为了简化与便于描述,后续方法实施例中将省略该执行主体。
74.参照图2,图2是本技术实施例提供的设备异常使用识别方法的一种流程示意图。需要说明的是,虽然在图2或其他附图所示的流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。该设备异常使用识别方法包括步骤201~步骤204,其中:
75.201、获取各待识别设备的操作特征。
76.其中,待识别设备是指待识别是否异常使用的设备。例如,物流场景中的收派车辆、中转场设备、收派终端设备、便携打印机等各种类型设备。
77.各待识别设备的操作特征是指根据各待识别设备的基本使用数据进行如统计各时段的使用信息等结构化处理后得到的数据表示特征。
78.步骤201中获取各待识别设备的操作特征的方式有多种,示例性地,包括:
79.一、实时采集各待识别设备的操作特征。
80.①
统计如各待识别设备的分时特征等设备使用数据作为各待识别设备的操作特征。
81.其中,各待识别设备的分时特征具体可以是各待识别设备在各时段的基本使用数据的统计信息。例如,过去分小时的操作数据、过去工作日或节假日的分小时平均使用数据等。
82.其中,各待识别设备的设备使用数据是用于反映各待识别设备的被使用、操作情况的数据。
83.②
统计各待识别设备的设备统计数据作为各待识别设备的操作特征。
84.其中,各待识别设备的设备统计数据是设备相关的其他数据,例如,各待识别设备的使用人变更信息、所属成本中心变更信息、购置日期、购置金额、供应商等。
85.③
结合各待识别设备的设备使用数据、设备统计数据,作为各待识别设备的操作特征。此时,步骤201具体可以包括:获取所述各待识别设备的设备使用数据;获取所述各待识别设备的设备统计数据;基于所述各待识别设备的设备使用数据和所述各待识别设备的设备统计数据,获得所述各待识别设备的操作特征。
86.示例性地,一方面,可以获取各待识别设备的过去分小时的操作数据、过去工作日或节假日的分小时平均使用数据等,作为各待识别设备的设备使用数据;另一方面,可以获取各待识别设备的使用人变更信息、所属成本中心变更信息、购置日期、购置金额、供应商等,作为各待识别设备的设备统计数据;然后,将各待识别设备的设备使用数据和设备统计数据按照一定数据结构拼接起来,得到各待识别设备的操作特征。
87.在一些实施例中,步骤201可以每间隔一段时间获取过去一段时间内各待识别设备的操作特征进行识别,以识别是否存在异常使用设备。
88.进一步地,为了提高设备异常使用的识别及时性,在另一些实施例中,还可以实时采集各待识别设备的操作特征。例如,若所述各待识别设备为联网设备,则通过大数据埋点方式实时采集所述各待识别设备的操作特征;若所述各待识别设备为非联网设备,则通过联网设备实时采集所述各待识别设备的操作特征。例如,对于巴枪、办公电脑、便携打印机这些可直接或间接联网设备,通过大数据埋点方式实时采集其操作特征;对于收派车辆、皮
带机等不具有可联网属性的设备,可以通过安装智能模块,通过智能模块与网关通信来采集设备的使用信息(如安装可联网的摄像头拍摄其使用情况)。
89.二、从预设数据库中读取各待识别设备的操作特征。如图5或图6所示,步骤201之前,可以参考上述一中所示的方式,预先采集各设备的操作特征存储在预设数据库中,步骤201中直接从预设数据库中读取各待识别设备的操作特征。
90.202、基于所述各待识别设备的操作特征进行离群点检测,得到所述各待识别设备中的离群点设备。
91.步骤202中确定各待识别设备中的离群点设备的方式有多种,示例性地,包括:
92.(1)基于如optics算法等聚类算法,对各待识别设备的操作特征进行聚类,得到各待识别设备中的离群点设备。此时,步骤202具体可以包括如下步骤2021a:
93.2021a、通过预设的聚类算法,根据所述各待识别设备的操作特征对所述各待识别设备进行聚类,得到所述各待识别设备中的离群点设备。
94.示例性地,在步骤2021a之前,可以先构建基于密度聚类思想的optics算法,用于步骤2021a中根据各待识别设备的操作特征对各待识别设备进行聚类得到各待识别设备中的离群点设备,例如,optics算法的构建过程具体可以包括如下:
95.a1、获取各样本设备的操作特征,得到样本集d。
96.其中,样本集d中的每个样本为一个样本设备的操作特征。
97.a2、设置初始eps参数和minpts参数。
98.其中,eps参数为某一样本的邻域距离阈值,该邻域为eps-邻域,其定义为:对xj∈d,其eps-邻域包含样本集d中与xj的距离不大于eps的子样本集n
eps
。
99.其中,minpts参数为某一样本的eps-邻域n
eps
中样本个数的阈值,即若样本xj的eps-邻域的样本个数不小于minpts时,xj可被定义为核心对象。
100.a3、基于eps参数的预设调参范围和minpts参数的预设调参范围,将eps参数的取值和minpts参数的取值组合为一对输入参数,采用样本集d进行训练,找出最适合样本集d数据分布的一对输入参数。
101.例如,步骤a3中,可以将eps参数的预设调参范围设置为:eps∈(2,3,4,5,6,7,8),将minpts参数的预设调参范围设置为:minpts∈(3,4,5,6,7,8,9,10)。然后,两两组合为一对输入参数进行训练,最终得到最适合样本集d数据分布的一组输入参数eps=3,minpts=5。
102.通过聚类算法根据各待识别设备的操作特征对各待识别设备进行聚类,得到各待识别设备中的离群点设备,由于可以将多个待识别设备同时进行聚类,得到多个待识别设备中的离群点设备,因此可以批量对待识别设备进行异常识别,从而可以在一定程度上提高离群点设备的检测速度,进而提高异常使用设备的识别效率,对于涉及的设备种类多、数量大、范围广的物流场景中在识别效率上的提升更加明显。
103.(2)基于自编码器(autoencoder,ae)基于各待识别设备的操作特征对各待识别设备进行异常检测,得到各待识别设备中的离群点设备。具体地,基于预先学习好正常使用设备的操作特征的自编码器先对各待识别设备的操作特征进行特征编码得到编码后特征,再对编码后特征进行解码得到解码后特征;对比解码后特征与各待识别设备的操作特征间的相似度来确定离群点设备。此时,步骤202具体可以包括如下步骤2021b~步骤2023b,其中:
104.2021b、基于预先学习得到的特征编码参数,对所述各待识别设备的操作特征进行编码,得到所述各待识别设备的操作特征的目标编码特征。
105.其中,目标编码特征是指通过特征编码参数对各待识别设备的操作特征进行编码所得到的编码后特征。
106.其中,特征编码参数用于对各设备的操作特征进行编码,得到各设备的操作特征的编码后特征。特征编码参数通过自编码器进行学习得到,自编码器学习得到特征编码参数的过程在后文中(如步骤c1~步骤c2)将详细介绍,为简化表述,此处不再赘述。
107.在一些实施例中,可以将如下步骤c1~步骤c2中自编码器学习得到的特征编码参数提取出来,通过提取出来的特征编码参数,对各待识别设备的操作特征进行编码,得到各待识别设备的操作特征的目标编码特征。
108.在一些实施例中,可以直接将各待识别设备的操作特征输入至如下步骤c1~步骤c2中已训练的自编码器中,通过自编码器中的特征编码器,根据学习得到的特征编码参数对各待识别设备的操作特征进行编码,得到各待识别设备的操作特征的目标编码特征。
109.2022b、通过预先学习得到的特征解码参数,对所述目标编码特征进行解码,得到所述各待识别设备的操作特征的目标解码特征。
110.其中,目标解码特征是指通过特征解码参数对目标编码特征进行解码所得到的解码后特征。
111.其中,特征解码参数用于对各设备的操作特征的编码后特征进行解码,得到各设备的操作特征的解码后特征。特征解码参数通过自编码器进行学习得到,自编码器学习得到特征解码参数的过程在后文中(如步骤c1~步骤c2)将详细介绍,为简化表述,此处不再赘述。
112.在一些实施例中,可以将如下步骤c1~步骤c2中自编码器学习得到的特征解码参数提取出来,通过提取出来的特征解码参数,对目标编码特征进行解码,得到各待识别设备的操作特征的目标解码特征。
113.在一些实施例中,可以直接将各待识别设备的操作特征输入至如下步骤c1~步骤c2中已训练的自编码器中,通过自编码器中的特征解码器,根据学习得到的特征解码参数对各待识别设备的操作特征的目标编码特征进行解码,得到各待识别设备的操作特征的目标解码特征。
114.2023b、基于所述各待识别设备的操作特征和所述目标解码特征之间的相似度,确定所述各待识别设备是否为离群点数据,得到所述各待识别设备中的离群点设备。
115.示例性地,步骤2023b具体可以包括如下步骤b1~步骤b4:
116.b1、获取所述各待识别设备的操作特征和所述目标解码特征之间的相似度。
117.步骤b1中,获取各待识别设备的操作特征和目标解码特征之间的相似度的方式有多种,例如,可以通过计算各待识别设备的操作特征和目标解码特征之间的余弦距离、曼哈顿距离或汉明距离等,从而得到各待识别设备的操作特征和目标解码特征之间的相似度。
118.b2、获取预设的相似度异常阈值。
119.(1)实时计算得到。此时,步骤b2具体包括如下步骤b21~步骤b25:
120.b21、获取n个样本设备中每个样本设备的操作特征。
121.其中,样本设备是指用于确定相似度异常阈值的各设备,示例性地,也可以将各待
识别设备作为样本设备。
122.其中,样本设备的操作特征是指样本设备的操作数据的表示特征。
123.步骤b21中获取每个样本设备的操作特征的方式,与上述步骤201获取各待识别设备的操作特征的方式类似,具体可以参照上述相关说明,此处不再赘述。
124.b22、通过所述特征编码参数,对所述每个样本设备的操作特征进行编码,得到所述每个样本设备的样本编码特征。
125.步骤b22中获取样本编码特征的方式,与上述步骤2021b获取目标编码特征的方式类似,具体可以参照上述相关说明,此处不再赘述。
126.b23、通过所述特征解码参数,对所述每个样本设备的样本编码特征进行解码,得到所述每个样本设备的样本解码特征。
127.步骤b23中获取样本解码特征的方式,与上述步骤2022b获取目标解码特征的方式类似,具体可以参照上述相关说明,此处不再赘述。
128.b24、获取所述每个样本设备的操作特征和所述样本解码特征之间的样本相似度,得到n个样本相似度。
129.其中,样本相似度是指样本设备的操作特征和所述样本解码特征之间的相似度。
130.步骤b24中获取样本相似度的方式,与上述步骤2023b获取目标编码特征和各待识别设备的操作特征之间相似度的方式类似,具体可以参照上述相关说明,此处不再赘述。
131.b25、基于所述n个样本相似度,确定所述相似度异常阈值。
132.基于n个样本相似度确定相似度异常阈值的方式有多种,示例性地,包括:
133.方式1:基于3σ准则确定相似度异常阈值。其中,基于3σ准则,数值分布在(μ-3σ,μ+3σ)中的为正常值,即可以将小于(μ-3σ)、或大于(μ+3σ)的数值视为异常值;因此,本技术实施例中可以将相似度小于n个样本相似度的(μ-3σ)各待识别设备的操作特征视为异常(即视为离群点设备的操作特征)。此时,步骤b25具体可以包括:获取所述n个样本相似度的均值和标准差;基于所述均值和标准差,确定所述相似度异常阈值。
134.例如,n=5个样本相似度分别为:0.90、0.80、0.98、0.95、0.70。由此可以计算得到n个样本相似度的均值为:μ=0.866、标准差为:σ=0.10307279。此时,可以基于3σ准则、均值和标准差,可以确定相似度异常阈值为:(μ-3σ)=0.556781631。
135.方式2:基于箱线图四分位检测异常值算法确定相似度异常阈值。其中,基于箱线图四分位检测异常值算法,数值分布在(q1-k(q3-q1),q3+k(q3-q1))中为正常值,即可以将小于(q1-k(q3-q1))、或大于(q3+k(q3-q1))的数值视为异常值,其中,q1为下四分位数、q3为上四分位数、k为系数,k为1.5或3。因此,本技术实施例中可以将相似度小于n个样本相似度的(q1-k(q3-q1))各待识别设备的操作特征视为异常(即视为离群点设备的操作特征)。此时,步骤b25具体可以包括:获取所述n个样本相似度的下四分位数和上四分位数;基于所述下四分位数和所述上四分位数,确定所述相似度异常阈值。
136.例如,假设k=3,n=5个样本相似度分别为:0.90、0.80、0.98、0.95、0.70。由此可以计算得到n个样本相似度的上四分位数为:q1=0.8、下四分位数为:q3=0.95。此时,可以基于箱线图四分位检测异常值算法、下四分位数和上四分位数,可以确定相似度异常阈值为:(q1-k(q3-q1))=0.35。
137.由于用于判定各待识别设备是否异常(即是否为离群点设备)的相似度异常阈值,
是通过根据n个样本设备的获取的n个样本相似度来确定的,因此,可以在一定程度上提高相似度异常阈值的取值的合理性,从而提高后续各待识别设备是否异常(即是否为离群点设备)的检测准确度。
138.(2)直接读取得到。例如,预设数据库中存储了通过上述(1)实时计算方式计算得到的相似度异常阈值,步骤b2中可以直接从预设数据库中读取得到预设的相似度异常阈值。
139.b3、当所述相似度小于所述相似度异常阈值时,确定所述各待识别设备的操作特征为离群点设备的操作特征。
140.b4、当所述相似度大于或等于所述相似度异常阈值时,确定所述各待识别设备为正常设备。
141.例如,假设步骤b2中确定的相似度异常阈值为85%,当各待识别设备的操作特征和目标解码特征之间的相似度为80%时,则各待识别设备的操作特征和目标解码特征之间的相似度为80%小于相似度异常阈值为85%,此时可以确定各待识别设备为离群点设备。
142.当各待识别设备的操作特征和目标解码特征之间的相似度为90%时,则各待识别设备的操作特征和目标解码特征之间的相似度为90%大于相似度异常阈值为85%,此时可以确定各待识别设备为正常正常设备。
143.进一步地,为了提高各待识别设备是否异常(即是否为离群点设备)的准确度,可以分别通过判定目标编码特征和各待识别设备的操作特征之间的相似度是否小于基于上述方式1确定的相似度异常阈值、同时小于上述方式2确定的相似度异常阈值,当目标编码特征和各待识别设备的操作特征之间的相似度同时小于上述方式1和方式2确定的相似度异常阈值时,才确定各待识别设备为异常(即为离群点设备)。
144.示例性地,上述自编码器可以通过如下步骤c1~步骤c2学习得到:
145.c1、获取多个正常使用设备的操作特征。
146.c2、将多个正常使用设备的操作特征作为待学习的自编码器的输入,对自编码器进行训练,得到学习后的自编码器。
147.其中,正常使用设备的操作特征是指正常正常使用设备的操作数据的表示特征。
148.其中,自编码器是一个多层层的神经网络,将输入表达x编码为一个新的表达y,然后再将y解码回x。这是一个非监督学习算法,使用反向传播算法来训练网络使得输出等于输入。自编码器是神经网络的一种,经过训练后能尝试将输入复制到输出。自编码器(autoencoder)内部有一个隐藏层h,可以产生编码(code)表示输入。该网络可以看作由两部分组成:一个由函数h=f(x)表示的编码器和一个生成重构的解码器r=g(h)。
149.如图3所示,自编码器包括编码器和解码器两部分。其中,编码器,用于根据各待识别设备的操作特征x进行编码得到编码后特征zy;解码器用于对编码器编码后特征zy进行解码得到并输出解码后特征x’。
150.通过采用正常使用设备的操作特征,对自编码器进行训练得到训练好的自编码器,由于编码器可以基于各正常使用设备的操作特征间的共性学习到的函数h=f(x)、解码器可以基于各正常使用设备的操作特征间的共性学习到的函数r=g(h),从而使得训练好的自编码器可以学习到正常使用设备的操作特征之间的共性。因此,通过已训练的自编码器可以较好地还原正常使用设备的操作特征、相对而言难以准确地还原异常的正常使用设
备的操作特征。故通过学习后的特征编码参数和特征解码参数获取目标解码特征,根据各待识别设备的目标解码特征和各待识别设备的操作特征之间相似度的大小可以准确地检测出各待识别设备是否异常(即是否为离群点设备)。
151.此时,将自编码器中编码器的特征编码参数用于步骤2021b对目标原始特征进行编码得到目标编码特征,将自编码器中解码器的特征解码参数,用于步骤2022b对目标编码特征进行解码得到目标解码特征。
152.203、基于预设的异常程度预测参数,根据所述离群点设备的操作特征进行预测得到所述离群点设备的异常程度。
153.其中,离群点设备是指各待识别设备中,根据各待识别设备的操作特征进行离群点检测,确定为离群点的待识别设备。
154.其中,离群点设备的异常程度用于反映离群点设备被异常使用的概率。
155.步骤203中异常程度预测参数通过对预设模型(如孤立森林iforest模型等无监督学习模型、有监督学习模型)进行学习得到,下面分别举例说明基于无监督学习模型、基于有监督学习模型学习得到异常程度预测参数。
156.1)基于无监督学习得到异常程度预测参数。基于无监督学习得到异常程度预测参数时,只需获取样本的输入特征数据(即样本设备的操作特征),基于无监督学习模型的自我学习能力进行学习,而无需进行数据标注,从而在一定程度上避免大量的数据标注时间成本高的问题。例如,假设无监督学习模型为孤立森林模型,此时,异常程度预测参数具体可以通过如下步骤d1~步骤d3得到:
157.d1、获取各样本设备的操作特征。
158.d2、根据所述各样本设备的操作特征对预设孤立森林进行训练,得到已训练孤立森林。
159.例如,可以基于概率密度函数估计的直接方法(即:设法找到各类别在特征空间的分布参数,再进行分类),采用各样本设备的操作特征对预设孤立森林进行训练,得到已训练孤立森林。
160.又如,可以基于样本间相似性度量的简洁聚类方法(即:设法定出不同类别的核心或初始内核,然后依据样本与核心之间的相似性度量将样本聚集成不同的类别),采用各样本设备的操作特征对预设孤立森林进行训练,得到已训练孤立森林。
161.d3、将所述已训练孤立森林的模型参数作为所述异常程度预测参数。
162.步骤d1~步骤d2训练得到已训练孤立森林的模型参数后,在步骤203中,可以直接将离群点设备的操作特征输入至已训练孤立森林,通过已训练孤立森林中的异常程度预测参数,根据离群点设备的操作特征预测得到离群点设备的异常程度。或者,也可以在步骤d3中,将已训练孤立森林的模型参数提取出来作为异常程度预测参数,步骤203中,根据提取出来的异常程度预测参数根据离群点设备的操作特征预测得到离群点设备的异常程度。
163.2)基于有监督学习得到异常程度预测参数。此时,异常程度预测参数具体可以通过如下步骤e1~步骤e3得到:
164.e1、获取各样本设备的操作特征和各样本设备的使用类别标签。
165.其中,各样本设备的使用类别标签用于指示各样本设备是否被异常使用的实际结果。
166.e2、根据所述各样本设备的操作特征对预设模型进行训练,得到已训练模型。
167.示例性地,首先,通过预设模型(例如可用于分类任务的神经网络模型),根据各样本设备的操作特征进行预测,得到各样本设备是否被异常使用的预测结果;然后,根据各样本设备是否被异常使用的预测结果和各样本设备是否被异常使用的实际结果,确定预设模型的损失值;接着,根据预设模型的损失值对预设模型的模型参数进行调整,直至符合预设的停止训练条件时,得到已训练模型。
168.e3、将所述已训练模型的模型参数作为所述异常程度预测参数。
169.在得到已训练模型之后,基于已训练模型的模型参数,可以根据设备的操作特征进行预测得到设备是否被异常使用的分类结果,并确定设备被异常使用的概率;可以将已训练模型确定的设备被异常使用的概率作为设备的异常程度。
170.此时,步骤203中,可以将离群点设备的操作特征输入至已训练模型,通过已训练模型中的异常程度预测参数,根据离群点设备的操作特征预测得到离群点设备是否被异常使用的分类结果,并确定离群点设备被异常使用的概率作为离群点设备的异常程度。或者,也可以在步骤d3中,将已训练模型的模型参数提取出来作为异常程度预测参数,步骤203中,根据提取出来的异常程度预测参数根据离群点设备的操作特征预测得到离群点设备是否被异常使用的分类结果,并确定离群点设备被异常使用的概率作为离群点设备的异常程度。
171.204、若所述异常程度大于预设程度阈值,则确定所述离群点设备为异常使用设备。
172.其中,预设程度阈值的具体取值可以根据实际情况而设置,此处对预设程度阈值的具体取值不做限制。
173.示例性地,若离群点设备的异常程度(如90%)大于预设程度阈值(如70%),则可以直接确定离群点设备为异常使用设备。若离群点设备的异常程度(如10%)大于预设程度阈值(如70%),则可以直接确定离群点设备为正常使用设备。
174.请参照图4,图4是本技术申请实施例中异常使用设备识别的一种说明示意图,以离群点设备的操作特征通过optics算法检测、异常程度通过iforest模型为例,如图4中(b)所示,步骤203可以依赖于步骤202的执行结果来执行,即在步骤202确定各待识别设备中的离群点设备之后,步骤203中只基于离群点设备的操作特征进行预测,得到离群点设备的异常程度。或者,如图4中(a)所示,步骤202和步骤203可以同时执行,例如,步骤202中在基于各待识别设备的操作特征进行离群点检测的同时,步骤203也基于各待识别设备的操作特征分别进行预测得到各待识别设备的异常程度(其中,包括了离群点设备的异常程度);然后,步骤204中,若识别出为离群点设备、且异常程度大于预设程度阈值的待识别设备(即离群点设备的异常程度大于预设程度阈值)时,则将离群点设备作为异常使用设备。
175.在实际应用中,某些设备因为特殊原因经过报备进入到白名单,进一步地,为了满足业务场景需求,可以在步骤201中滤除此类白名单设备,即将白名单设备从待识别设备中滤除,不作进一步数据处理过程。或者,为了丰富样本数据可以将白名单设备加入至待识别设备中,并在步骤202中识别到离群点设备为白名单设备时直接将离群点设备作为正常使用设备。
176.进一步地,为了便于规范设备的使用,在确定离群点设备为异常使用设备之后,还
可以输出所述离群点设备异常使用的提示信息。
177.其中,提示信息可以是播报语音、显示文字、提示灯亮起等形式来展示,此处对提示信息的具体表现形式不作限制。
178.例如,如图5所示,在确定离群点设备为异常使用设备之后,可以在电子设备本地输出离群点设备异常使用的提示信息,也可以向物流管理的服务终端输出离群点设备异常使用的提示信息。
179.又如,如图6所示,在确定离群点设备为异常使用设备之后,还可以向离群点设备所在场地的管理终端输出设备异常使用的提示信息。例如,假设步骤202中识别出设备3为离群点设备,且在步骤203中检测到设备3的异常程度大于预设程度阈值,则可以确定设备3为异常使用设备,并向设备3所在场地的管理终端3输出设备3异常使用的提示信息,从而便于现场人员可以及时进行管理。
180.由以上内容可以看出,本技术实施例中,第一方面,先基于各待识别设备的操作特征进行离群点检测,得到各待识别设备中的离群点设备,可以先初步筛选出可以是异常使用设备对应的离群点设备的操作特征;再基于预设的异常程度预测参数,根据离群点设备的操作特征进行预测得到离群点设备的异常程度,用于识别异常使用设备,从而可以进一步确定离群点设备是否为异常使用设备,因此可以更加准确地识别异常使用设备,减少异常使用情况的误判;第二方面,由于可以自动识别物流场景中涉及的各种类型设备,无需传统人工静态管理方式进行异常使用监控,提高了异常使用设备的识别全面性及识别效率。
181.为了更好实施本技术实施例中设备异常使用识别方法,在设备异常使用识别方法基础之上,本技术实施例中还提供一种设备异常使用识别装置,如图7所示,为本技术实施例中设备异常使用识别装置的一个实施例结构示意图,该设备异常使用识别装置700包括:
182.获取单元701,用于获取各待识别设备的操作特征;
183.检测单元702,用于基于所述各待识别设备的操作特征进行离群点检测,得到所述各待识别设备中的离群点设备;
184.预测单元703,用于基于预设的异常程度预测参数,根据所述离群点设备的操作特征进行预测得到所述离群点设备的异常程度;
185.识别单元704,用于若所述异常程度大于预设程度阈值,则确定所述离群点设备为异常使用设备。
186.在本技术的一些实施例中,所述检测单元702具体用于:
187.通过预设的聚类算法,根据所述各待识别设备的操作特征对所述各待识别设备进行聚类,得到所述各待识别设备中的离群点设备。
188.在本技术的一些实施例中,所述基于预设的异常程度预测参数,根据所述离群点设备的操作特征进行预测得到所述离群点设备的异常程度之前,所述预测单元703具体用于:
189.获取各样本设备的操作特征;
190.根据所述各样本设备的操作特征对预设孤立森林进行训练,得到已训练孤立森林;
191.将所述已训练孤立森林的模型参数作为所述异常程度预测参数。
192.在本技术的一些实施例中,所述检测单元702具体用于:
193.基于预先学习得到的特征编码参数,对所述各待识别设备的操作特征进行编码,得到所述各待识别设备的操作特征的目标编码特征;
194.通过预先学习得到的特征解码参数,对所述目标编码特征进行解码,得到所述各待识别设备的操作特征的目标解码特征;
195.基于所述各待识别设备的操作特征和所述目标解码特征之间的相似度,确定所述各待识别设备是否为离群点数据,得到所述各待识别设备中的离群点设备。
196.在本技术的一些实施例中,所述获取单元701具体用于:
197.获取所述各待识别设备的设备使用数据;
198.获取所述各待识别设备的设备统计数据;
199.基于所述各待识别设备的设备使用数据和所述各待识别设备的设备统计数据,获得所述各待识别设备的操作特征。
200.在本技术的一些实施例中,所述获取单元701具体用于:
201.若所述各待识别设备为联网设备,则通过大数据埋点方式实时采集所述各待识别设备的操作特征;
202.若所述各待识别设备为非联网设备,则通过联网设备实时采集所述各待识别设备的操作特征。
203.在本技术的一些实施例中,所述设备异常使用识别装置700还包括输出单元(图中未示出),所述确定所述离群点设备为异常使用设备之后,所述输出单元具体用于:
204.输出所述离群点设备异常使用的提示信息。
205.具体实施时,以上各个单元可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单元的具体实施可参见前面的方法实施例,在此不再赘述。
206.由于该设备异常使用识别装置可以执行本技术如图1至图6对应任意实施例中设备异常使用识别方法中的步骤,因此,可以实现本技术如图1至图6对应任意实施例中设备异常使用识别方法所能实现的有益效果,详见前面的说明,在此不再赘述。
207.此外,为了更好实施本技术实施例中设备异常使用识别方法,在设备异常使用识别方法基础之上,本技术实施例还提供一种电子设备,参阅图8,图8示出了本技术实施例电子设备的一种结构示意图,具体的,本技术实施例提供的电子设备包括处理器801,处理器801用于执行存储器802中存储的计算机程序时实现如图1至图6对应任意实施例中设备异常使用识别方法的各步骤;或者,处理器801用于执行存储器802中存储的计算机程序时实现如图7对应实施例中各单元的功能。
208.示例性的,计算机程序可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器802中,并由处理器801执行,以完成本技术实施例。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序在计算机装置中的执行过程。
209.电子设备可包括,但不仅限于处理器801、存储器802。本领域技术人员可以理解,示意仅仅是电子设备的示例,并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如电子备还可以包括输入输出设备、网络接入设备、总线等,处理器801、存储器802、输入输出设备以及网络接入设备等通过总线相连。
210.处理器801可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,处理器是电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分。
211.存储器802可用于存储计算机程序和/或模块,处理器801通过运行或执行存储在存储器802内的计算机程序和/或模块,以及调用存储在存储器802内的数据,实现计算机装置的各种功能。存储器802可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据(比如音频数据、视频数据等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
212.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备异常使用识别装置、电子设备及其相应单元的具体工作过程,可以参考如图1至图6对应任意实施例中设备异常使用识别方法的说明,具体在此不再赘述。
213.本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
214.为此,本技术实施例提供一种计算机可读存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本技术如图1至图6对应任意实施例中设备异常使用识别方法中的步骤,具体操作可参考如图1至图6对应任意实施例中设备异常使用识别方法的说明,在此不再赘述。
215.其中,该计算机可读存储介质可以包括:只读存储器(rom,read only memory)、随机存取存储器(ram,random access memory)、磁盘或光盘等。
216.由于该计算机可读存储介质中所存储的指令,可以执行本技术如图1至图6对应任意实施例中设备异常使用识别方法中的步骤,因此,可以实现本技术如图1至图6对应任意实施例中设备异常使用识别方法所能实现的有益效果,详见前面的说明,在此不再赘述。
217.以上对本技术实施例所提供的一种设备异常使用识别方法、装置、电子设备及计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本技术的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本技术的方法及其核心思想;同时,对于本领域的技术人员,依据本技术的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本技术的限制。
技术特征:
1.一种设备异常使用识别方法,其特征在于,所述方法包括:获取各待识别设备的操作特征;基于所述各待识别设备的操作特征进行离群点检测,得到所述各待识别设备中的离群点设备;基于预设的异常程度预测参数,根据所述离群点设备的操作特征进行预测得到所述离群点设备的异常程度;若所述异常程度大于预设程度阈值,则确定所述离群点设备为异常使用设备。2.根据权利要求1所述的设备异常使用识别方法,其特征在于,所述基于所述各待识别设备的操作特征进行离群点检测,得到所述各待识别设备中的离群点设备,包括:通过预设的聚类算法,根据所述各待识别设备的操作特征对所述各待识别设备进行聚类,得到所述各待识别设备中的离群点设备。3.根据权利要求1所述的设备异常使用识别方法,其特征在于,所述基于预设的异常程度预测参数,根据所述离群点设备的操作特征进行预测得到所述离群点设备的异常程度之前,还包括:获取各样本设备的操作特征;根据所述各样本设备的操作特征对预设孤立森林进行训练,得到已训练孤立森林;将所述已训练孤立森林的模型参数作为所述异常程度预测参数。4.根据权利要求1所述的设备异常使用识别方法,其特征在于,所述基于所述各待识别设备的操作特征进行离群点检测,得到所述各待识别设备中的离群点设备,包括:基于预先学习得到的特征编码参数,对所述各待识别设备的操作特征进行编码,得到所述各待识别设备的操作特征的目标编码特征;通过预先学习得到的特征解码参数,对所述目标编码特征进行解码,得到所述各待识别设备的操作特征的目标解码特征;基于所述各待识别设备的操作特征和所述目标解码特征之间的相似度,确定所述各待识别设备是否为离群点数据,得到所述各待识别设备中的离群点设备。5.根据权利要求1所述的设备异常使用识别方法,其特征在于,所述获取各待识别设备的操作特征,包括:获取所述各待识别设备的设备使用数据;获取所述各待识别设备的设备统计数据;基于所述各待识别设备的设备使用数据和所述各待识别设备的设备统计数据,获得所述各待识别设备的操作特征。6.根据权利要求1所述的设备异常使用识别方法,其特征在于,所述获取各待识别设备的操作特征,包括:若所述各待识别设备为联网设备,则通过大数据埋点方式实时采集所述各待识别设备的操作特征;若所述各待识别设备为非联网设备,则通过联网设备实时采集所述各待识别设备的操作特征。7.根据权利要求1-6任一项所述的设备异常使用识别方法,其特征在于,所述确定所述离群点设备为异常使用设备之后,还包括:
输出所述离群点设备异常使用的提示信息。8.一种设备异常使用识别装置,其特征在于,所述设备异常使用识别装置包括:获取单元,用于获取各待识别设备的操作特征;检测单元,用于基于所述各待识别设备的操作特征进行离群点检测,得到所述各待识别设备中的离群点设备;预测单元,用于基于预设的异常程度预测参数,根据所述离群点设备的操作特征进行预测得到所述离群点设备的异常程度;识别单元,用于若所述异常程度大于预设程度阈值,则确定所述离群点设备为异常使用设备。9.一种电子设备,其特征在于,包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时执行如权利要求1至7任一项所述的设备异常使用识别方法。10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器进行加载,以执行权利要求1至7任一项所述的设备异常使用识别方法中的步骤。
技术总结
本申请提供一种设备异常使用识别方法、装置、电子设备及计算机可读存储介质。该设备异常使用识别方法包括:获取各待识别设备的操作特征;基于所述各待识别设备的操作特征进行离群点检测,得到所述各待识别设备中的离群点设备;基于预设的异常程度预测参数,根据所述离群点设备的操作特征进行预测得到所述离群点设备的异常程度;若所述异常程度大于预设程度阈值,则确定所述离群点设备为异常使用设备。本申请中可以更加准确、全面地识别异常使用设备,提高异常使用设备的识别全面性及识别效率。率。率。
技术研发人员:乔安杰
受保护的技术使用者:顺丰科技有限公司
技术研发日:2022.01.24
技术公布日:2023/8/5
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
上一篇:一种便于连通的保温螺旋管的制作方法 下一篇:一种食品添加剂加工上料机的制作方法