时序数据信息价值评估方法及装置与流程
未命名
09-16
阅读:99
评论:0

1.本发明涉及信息技术领域,尤其涉及时序数据信息价值评估方法及装置。
背景技术:
2.本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
3.工业数据采集系统需要采集和分析时序数据,分析时,主要是等时间间隔分析,或在等时间间隔基础上进行长度折算,后进行等长度分析。但实际情况是,每个时间段或长度段产生的数据提供的信息价值并不一致,对于没有异常的情况,多数不需要分析,而有异常的情况,在分析时又需要针对长时间的大量数据人工拖动时间轴或长度轴一段一段查找,造成时间浪费,而且效率低下。在实际生产过程中,生产上正常生产的时序数据有其固有模式,而非正常生产的往往模式比较特别,分析时的最佳方式是既能关注连续长时间的整个趋势过程,又能关注异常时段的细节部分,提升分析效率。因此,分析系统在展示数据时应该有所取舍,信息价值高的时间段尽可能展示更多的数据,信息价值低的时间段尽可能展示较少的数据,但如何定义信息价值,目前尚没有统一的方法,尤其是对于工业系统而言,单从数据的角度上分析,并不会得到有效的方法,必须结合实际业务场景,才能发挥时序数据信息价值。目前缺少有效、客观的工业时序数据信息价值评估方法,导致时序数据分析效率低。
技术实现要素:
4.本发明实施例提供一种时序数据信息价值评估方法,用以准确快速的定位高信息价值的时序数据,提高时序数据分析效率,该方法包括:
5.根据预先设定的业务分析目标,确定多个价值基准模板;其中,价值基准模板是正常生产模式时产生的时序数据片段,业务分析目标包括:实际生产曲线中任意一个或多个数据指标相比于正常生成曲线中对应数据指标的偏离程度;
6.根据预先设定的业务分析目标,确定时序数据切分点标志;
7.根据切分点标志将待分析时序数据分为多个时序数据片段;
8.针对与业务分析目标无关的第一时序数据片段,赋予信息价值为0;
9.针对与业务分析目标相关的第二时序数据片段,确定每一第二时序数据片段与每一价值基准模板之间的相似度,得到每一第二时序数据片段对应的多个相似度值;
10.将每一第二时序数据片段对应的多个相似度值中的最大值确定为每一第二时序数据片段的特征值;
11.将每一第二时根据对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段在业务分析目标下的信息价值;
12.将每一第二时根据对每一第二时序数据片段的根据待分析时序数据的数据长度、第一时序数据片段的信息价值、第二时序数据片段的信息价值,得到待分析时序数据在业
务分析目标下的信息价值密度。
13.本发明实施例还提供一种时序数据信息价值评估装置,用以准确快速的定位高信息价值的时序数据,提高时序数据分析效率,该装置包括:
14.第一处理模块,用于根据预先设定的业务分析目标,确定多个价值基准模板;其中,价值基准模板是正常生产模式时产生的时序数据片段,业务分析目标包括:实际生产曲线中任意一个或多个数据指标相比于正常生成曲线中对应数据指标的偏离程度;
15.第二处理模块,用于根据预先设定的业务分析目标,确定时序数据切分点标志;
16.第三处理模块,用于根据切分点标志将待分析时序数据分为多个时序数据片段;
17.赋值模块,用于针对与业务分析目标无关的第一时序数据片段,赋予信息价值为0;
18.相似度计算模块,用于针对与业务分析目标相关的第二时序数据片段,确定每一第二时序数据片段与每一价值基准模板之间的相似度,得到每一第二时序数据片段对应的多个相似度值;
19.第四处理模块,用于将每一第二时序数据片段对应的多个相似度值中的最大值确定为每一第二时序数据片段的特征值;
20.第五处理模块,用于将每一第二时根据对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段在业务分析目标下的信息价值;
21.第六处理模块,用于将每一第二时根据对每一第二时序数据片段的根据待分析时序数据的数据长度、第一时序数据片段的信息价值、第二时序数据片段的信息价值,得到待分析时序数据在业务分析目标下的信息价值密度。
22.本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述时序数据信息价值评估方法。
23.本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述时序数据信息价值评估方法。
24.本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述时序数据信息价值评估方法。
25.本发明实施例中,根据预先设定的业务分析目标,确定多个价值基准模板;其中,价值基准模板是正常生产模式时产生的时序数据片段,业务分析目标包括:实际生产曲线中任意一个或多个数据指标相比于正常生成曲线中对应数据指标的偏离程度;根据预先设定的业务分析目标,确定时序数据切分点标志;根据切分点标志将待分析时序数据分为多个时序数据片段;针对与业务分析目标无关的第一时序数据片段,赋予信息价值为0;针对与业务分析目标相关的第二时序数据片段,确定每一第二时序数据片段与每一价值基准模板之间的相似度,得到每一第二时序数据片段对应的多个相似度值;将每一第二时序数据片段对应的多个相似度值中的最大值确定为每一第二时序数据片段的特征值;将每一第二时根据对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段在业务分析目标下的信息价值;将每一第二时根据对每一第二时序数据片段的根据待分析时序数据的数据长度、第一时序数据片段的信息价值、第二时序数据片段的信息价值,得到待分析时序数据在业务分析目标下的信息价值密度。这样根据时序数据的信息价值密度,无
论是数据可视化分析,还是异常点搜索,都可以辅助人员快速定位高信息价值时序数据,提升分析效率。
附图说明
26.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
27.图1为本发明实施例中提供的一种时序数据信息价值评估方法的流程图;
28.图2为本发明实施例中提供的一种价值基准模板的示例图;
29.图3为本发明实施例中提供的一种待分析时序数据的示例图;
30.图4为本发明实施例中提供的一种将每一第二时根据对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段在业务分析目标下的信息价值的方法流程图;
31.图5为本发明实施例中提供的一种将每一第二时根据对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段在业务分析目标下的信息价值的方法流程图;
32.图6为本发明实施例中提供的一种得到待分析时序数据在业务分析目标下的信息价值密度的方法流程图;
33.图7为本发明实施例中提供的一种时序数据信息价值评估装置的示意图;
34.图8为本发明实施例中提供的一种计算机设备的示意图。
具体实施方式
35.为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
36.本技术技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
37.本文中术语“和/或”,仅仅是描述一种关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括a、b、c中的至少一种,可以表示包括从a、b和c构成的集合中选择的任意一个或多个元素。
38.在本说明书的描述中,所使用的“包含”、“包括”、“具有”、“含有”等,均为开放性的用语,即意指包含但不限于。参考术语“一个实施例”、“一个具体实施例”、“一些实施例”、“例如”等的描述意指结合该实施例或示例描述的具体特征、结构或者特点包含于本技术的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。各实施例中涉及的步骤顺序用于示意性说明本技术的实施,其中的步骤顺序不作限定,可根据需要作适当调整。
39.经研究发现,工业数据采集系统需要采集和分析时序数据,分析时,主要是等时间间隔分析,或在等时间间隔基础上进行长度折算,后进行等长度分析。但实际情况是,每个时间段或长度段产生的数据提供的信息价值并不一致,对于没有异常的情况,多数不需要分析,而有异常的情况,在分析时又需要针对长时间的大量数据人工拖动时间轴或长度轴一段一段查找,造成时间浪费,而且效率低下。在实际生产过程中,生产上正常生产的时序数据有其固有模式,而非正常生产的往往模式比较特别,分析时的最佳方式是既能关注连续长时间的整个趋势过程,又能关注异常时段的细节部分,提升分析效率。因此,分析系统在展示数据时应该有所取舍,信息价值高的时间段尽可能展示更多的数据,信息价值低的时间段尽可能展示较少的数据,但如何定义信息价值,目前尚没有统一的方法,尤其是对于工业系统而言,单从数据的角度上分析,并不会得到有效的方法,必须结合实际业务场景,才能发挥时序数据信息价值。目前缺少有效、客观的工业时序数据信息价值评估方法,导致时序数据分析效率低。
40.针对上述研究,如图1所示,本发明实施例提供一种时序数据信息价值评估方法,包括:
41.s101:根据预先设定的业务分析目标,确定多个价值基准模板;其中,价值基准模板是正常生产模式时产生的时序数据片段,业务分析目标包括:实际生产曲线中任意一个或多个数据指标相比于正常生成曲线中对应数据指标的偏离程度;
42.s102:根据预先设定的业务分析目标,确定时序数据切分点标志;
43.s103:根据切分点标志将待分析时序数据分为多个时序数据片段;
44.s104:针对与业务分析目标无关的第一时序数据片段,赋予信息价值为0;
45.s105:针对与业务分析目标相关的第二时序数据片段,确定每一第二时序数据片段与每一价值基准模板之间的相似度,得到每一第二时序数据片段对应的多个相似度值;
46.s106:将每一第二时序数据片段对应的多个相似度值中的最大值确定为每一第二时序数据片段的特征值;
47.s107:将每一第二时根据对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段在业务分析目标下的信息价值;
48.s108:将每一第二时根据对每一第二时序数据片段的根据待分析时序数据的数据长度、第一时序数据片段的信息价值、第二时序数据片段的信息价值,得到待分析时序数据在业务分析目标下的信息价值密度。
49.本发明实施例中,根据预先设定的业务分析目标,确定多个价值基准模板;其中,价值基准模板是正常生产模式时产生的时序数据片段,业务分析目标包括:实际生产曲线中任意一个或多个数据指标相比于正常生成曲线中对应数据指标的偏离程度;根据预先设定的业务分析目标,确定时序数据切分点标志;根据切分点标志将待分析时序数据分为多个时序数据片段;针对与业务分析目标无关的第一时序数据片段,赋予信息价值为0;针对与业务分析目标相关的第二时序数据片段,确定每一第二时序数据片段与每一价值基准模板之间的相似度,得到每一第二时序数据片段对应的多个相似度值;将每一第二时序数据片段对应的多个相似度值中的最大值确定为每一第二时序数据片段的特征值;将每一第二时根据对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段在业务分析目标下的信息价值;将每一第二时根据对每一第二时序数据片段的根据待分析时
序数据的数据长度、第一时序数据片段的信息价值、第二时序数据片段的信息价值,得到待分析时序数据在业务分析目标下的信息价值密度。这样根据时序数据的信息价值密度,无论是数据可视化分析,还是异常点搜索,都可以辅助人员快速定位高信息价值时序数据,提升分析效率。
50.下面对上述时序数据信息价值评估方法加以详细说明。
51.针对上述s101,业务分析目标例如包括:实际生产曲线中任意一个或多个数据指标相比于正常生成曲线中对应数据指标的偏离程度,价值基准模板是正常生产模式时产生的时序数据片段。
52.具体的,技术人员或行业专家需要在产线或设备出现故障时,根据记录的过程数据曲线,进行分析,以查找故障原因,分析曲线相比于正常生产曲线的偏离程度,就可视为业务分析目标。例如,需要定位活套的故障,其中一个业务分析目标就可以是:“分析棒线材活套带载时高度曲线相比于正常生产时的高度曲线异常状况”。分析该业务目标时,根据切分点,可以切分出需要分析的曲线片段。上述活套带载高度曲线的切分点,是指能够划分活套带载与空载之间的临界点。
53.再例如:分析某机架轧机转矩带载时的波动情况,将业务分析目标定为分析转矩是否波动过大,超出设计工作范围。切分点就是该机架轧机带载和空载的之间的临界点(带载时,转矩大,空载时,转矩小,可以通过转矩值找到切分点)。
54.另外,针对同一个分析目标,可以选取多个价值基准模板,例如图2所示,根据业务分析目标选取价值基准模板t1、t2。价值基准模板可以根据实际场景、以及历史经验对正常生产模式时产生的时序数据进行分段选取。
55.针对上述s102,根据预先设定的业务分析目标,确定时序数据切分点标志,例如图3所示,业务分析目标为分析棒线材活套带载时高度曲线的异常状况,用设备带载与空载的切换点作为切分点标志,即图3中数据从接近0开始迅速上升以及从高位迅速降到接近0的位置。
56.针对上述s103,待分析时序数据例如为有长周期时序数据x=(x1,x2…
xn),则根据切分标志分为组,片段1为y1=(x1,x2…
x
120
),片段2为y2=(x
121
,x
122
…
x
260
)等。
57.此处,片段提取以切分标志为准,切分后的时序数据片段长度(时序数据片段内元素数量)可以相等,也可以不相等。
58.针对上述s104,如图3所示,根据切分点标志将待分析时序数据分为5组时序数据片段:y1~y5,对与业务分析目标无关的第一时序数据片段y2、y4,直接赋予信息价值为0,即i2=i4=0,这两段为空载时段曲线,与业务目标要分析的带载时段无关。
59.针对上述s105,相似度的计算例如可以选用相关系数、欧式距离、模式距离、形状距离、dwt等,对于一些算法需要进行数据预处理,例如包括:升采样或降采样算法,以保证数据片段长度与价值基准模板的数据长度一致。
60.因此,如图4所示,本发明实施例提供一种将每一第二时根据对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段在业务分析目标下的信息价值的方法,包括:
61.s401:对每一第二时序数据片段进行采样,得到每一第二时序数据的第一采样数据。
62.s402:对每一价值基准模板进行采样,得到每一价值基准模板的第二采样数据;其中,第一采样数据的数据长度与第二采样数据的数据长度相等。
63.s403:计算每一第二时序数据的第一采样数据与每一价值基准模板的第二采样数据之间的相似度。
64.此外,升采样或降采样算法可选用各种差值、重采样算法。
65.示例性的,如图3所示的时序数据片段,对与业务分析目标相关的第二时序数据片段y1、y3和y5与价值基准模板t1、t2进行相似度计算,以采用下表1和皮尔逊相关系数计算为例:
66.表1时序数据片段列表
[0067][0068]
如表1所示,y1、y3、y5、t1、t2的数据长度均不一致,需要先进行重采样对齐,以保证相同的数据长度。具体执行操作例如包括:y1’[i]=y1[int(i*y1长度/t1长度)]。其中y1’为y1重采样后的时序数据片段,y1’[i]代表,y1’的第i个元素,int代表括号内取整数,则根据重新采样与模板t1对齐后的y1、y3、y5为y1’(t1)、y3’(t1)、y5’(t1),与模板t2对齐后的y1、y3、y5为y1’(t2)、y3’(t2)、y5’(t2),见表1。对齐后的数据分别与模板t1、t2进行相关性计算。相关计算结果见下表2的t1列和t2列:
[0069]
表2相关系数、特征值、信息价值表
[0070] t1t2viy1'0.957310.962000.962000.055888y3'0.949180.930990.949180.075247y5'0.949290.937910.949290.075081
[0071]
针对上述s106,选取与所有价值基准模板相似度最大的值作为该第二时序数据片段的特征值v,例如,表2的v列。若与业务分析目标相关的时序数据片段有k组,则k组时序片段将有k个特征值,分别为v1,v2…vk
。
[0072]
针对上述s107,如图5所示,为本发明实施例提供的一种将每一第二时根据对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段在业务分析目标下的信息价值的方法流程图,包括:
[0073]
s501:对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段的归一化特征值。
[0074]
具体的,对每一第二时序数据片段的特征值进行归一化处理,折算到0-1区间,得到每一第二时序数据片段的归一化特征值。
[0075]
s502:对每一第二时序数据片段的归一化特征值取负对数值,得到每一第二时序数据片段在业务分析目标下的信息价值。
[0076]
例如,可以采用下述公式取负对数值:
[0077][0078]
其中,ik代表第k个第二时序数据片段的价值信息,vk代表第k个第二时序数据片段的特征值,v
min
代表k个第二时序数据片段中最小特征值,v
max
代表k个第二时序数据片段中最大特征值,其中,k为整数。
[0079]
此外,归一化处理可采用本领域常用算法,对数的底可选,通常为2。
[0080]
示例性的,以用相关系数计算相似度为例,归一化处理方式可以采用:v大于0,则值不变,v小于0,则值记为0。表2的示例中,所有特征值均大于0,因此可直接取负对数操作,信息价值为表2中i列所示。
[0081]
针对上述s108,如图6所示,为本发明实施例提供的一种得到待分析时序数据在业务分析目标下的信息价值密度的方法流程图,包括:
[0082]
s601:将第一时序数据片段的信息价值与第二时序数据片段的信息价值求和,得到待分析时序数据的信息价值总和。
[0083]
具体的,整个待分析的时序数据针对该业务分析目标的信息价值为所有时序数据片段信息价值的总和:其中,i(p)代表针对p业务分析目标的待分析时序数据的信息价值总和,im代表第m个时序数据片段(包括:第一时序数据片段、第二时序数据片段)的信息价值,k等于第一时序数据片段与第二时序数据片段的总和。
[0084]
s602:利用待分析时序数据的信息价值总和除以待分析时序数据的数据长度,得到待分析时序数据在业务分析目标下的信息价值密度。
[0085]
具体的,利用待分析时序数据的信息价值总和除以待分析时序数据的数据长度,得到待分析时序数据在业务分析目标下的信息价值密度,包括:其中,i(p)代表待分析时序数据的信息价值总和,n为待分析时序数据长度,f(p)代表待分析时序数据在业务分析目标下的信息价值密度。
[0086]
示例性的,以表2为例,整个待分析的时序数据针对该业务分析目标的信息价值为所有时序数据片段信息价值的总和:i(p)=i1+i2+i3+i4+i5=0.055888+0+0.075247+0+
0.075081=0.206216,则信息价值密度f(p)=0.206216/1606=0.0001284。
[0087]
此外,为快速定位当前业务中异常数据的位置,可根据各时序数据及时序数据片段的信息价值,快速定位和提取关键数据。
[0088]
本发明实施例中还提供了一种时序数据信息价值评估装置,如下面的实施例所述。由于该装置解决问题的原理与时序数据信息价值评估方法相似,因此该装置的实施可以参见时序数据信息价值评估方法的实施,重复之处不再赘述。
[0089]
如图7所示,为本发明实施例提供的一种时序数据信息价值评估装置的示意图,包括:
[0090]
第一处理模块701,用于根据预先设定的业务分析目标,确定多个价值基准模板;其中,价值基准模板是正常生产模式时产生的时序数据片段,业务分析目标包括:实际生产曲线中任意一个或多个数据指标相比于正常生成曲线中对应数据指标的偏离程度;
[0091]
第二处理模块702,用于根据预先设定的业务分析目标,确定时序数据切分点标志;
[0092]
第三处理模块703,用于根据切分点标志将待分析时序数据分为多个时序数据片段;
[0093]
赋值模块704,用于针对与业务分析目标无关的第一时序数据片段,赋予信息价值为0;
[0094]
相似度计算模块705,用于针对与业务分析目标相关的第二时序数据片段,确定每一第二时序数据片段与每一价值基准模板之间的相似度,得到每一第二时序数据片段对应的多个相似度值;
[0095]
第四处理模块706,用于将每一第二时序数据片段对应的多个相似度值中的最大值确定为每一第二时序数据片段的特征值;
[0096]
第五处理模块707,用于将每一第二时根据对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段在业务分析目标下的信息价值;
[0097]
第六处理模块708,用于将每一第二时根据对每一第二时序数据片段的根据待分析时序数据的数据长度、第一时序数据片段的信息价值、第二时序数据片段的信息价值,得到待分析时序数据在业务分析目标下的信息价值密度。
[0098]
在一种可能的实施方式中,相似度计算模块,具体用于对每一第二时序数据片段进行采样,得到每一第二时序数据的第一采样数据;对每一价值基准模板进行采样,得到每一价值基准模板的第二采样数据;其中,第一采样数据的数据长度与第二采样数据的数据长度相等;计算每一第二时序数据的第一采样数据与每一价值基准模板的第二采样数据之间的相似度。
[0099]
在一种可能的实施方式中,第五处理模块,具体用于对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段的归一化特征值;对每一第二时序数据片段的归一化特征值取负对数值,得到每一第二时序数据片段在业务分析目标下的信息价值。
[0100]
在一种可能的实施方式中,第六处理模块,具体用于将第一时序数据片段的信息价值与第二时序数据片段的信息价值求和,得到待分析时序数据的信息价值总和;利用待分析时序数据的信息价值总和除以待分析时序数据的数据长度,得到待分析时序数据在业
务分析目标下的信息价值密度。
[0101]
基于前述发明构思,如图8所示,本发明还提出了一种计算机设备800,包括存储器810、处理器820及存储在存储器810上并可在处理器820上运行的计算机程序830,所述处理器820执行所述计算机程序830时实现前述时序数据信息价值评估方法。
[0102]
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述时序数据信息价值评估方法。
[0103]
本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述时序数据信息价值评估方法。
[0104]
本发明实施例中,根据预先设定的业务分析目标,确定多个价值基准模板;其中,价值基准模板是正常生产模式时产生的时序数据片段,业务分析目标包括:实际生产曲线中任意一个或多个数据指标相比于正常生成曲线中对应数据指标的偏离程度;根据预先设定的业务分析目标,确定时序数据切分点标志;根据切分点标志将待分析时序数据分为多个时序数据片段;针对与业务分析目标无关的第一时序数据片段,赋予信息价值为0;针对与业务分析目标相关的第二时序数据片段,确定每一第二时序数据片段与每一价值基准模板之间的相似度,得到每一第二时序数据片段对应的多个相似度值;将每一第二时序数据片段对应的多个相似度值中的最大值确定为每一第二时序数据片段的特征值;将每一第二时根据对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段在业务分析目标下的信息价值;将每一第二时根据对每一第二时序数据片段的根据待分析时序数据的数据长度、第一时序数据片段的信息价值、第二时序数据片段的信息价值,得到待分析时序数据在业务分析目标下的信息价值密度。这样根据时序数据的信息价值密度,无论是数据可视化分析,还是异常点搜索,都可以辅助人员快速定位高信息价值时序数据,提升分析效率。
[0105]
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0106]
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0107]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0108]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或
其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0109]
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
技术特征:
1.一种时序数据信息价值评估方法,其特征在于,包括:根据预先设定的业务分析目标,确定多个价值基准模板;其中,价值基准模板是正常生产模式时产生的时序数据片段,业务分析目标包括:实际生产曲线中任意一个或多个数据指标相比于正常生成曲线中对应数据指标的偏离程度;根据预先设定的业务分析目标,确定时序数据切分点标志;根据切分点标志将待分析时序数据分为多个时序数据片段;针对与业务分析目标无关的第一时序数据片段,赋予信息价值为0;针对与业务分析目标相关的第二时序数据片段,确定每一第二时序数据片段与每一价值基准模板之间的相似度,得到每一第二时序数据片段对应的多个相似度值;将每一第二时序数据片段对应的多个相似度值中的最大值确定为每一第二时序数据片段的特征值;根据对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段在业务分析目标下的信息价值;根据待分析时序数据的数据长度、第一时序数据片段的信息价值、第二时序数据片段的信息价值,得到待分析时序数据在业务分析目标下的信息价值密度。2.如权利要求1所述的时序数据信息价值评估方法,其特征在于,针对与业务分析目标相关的第二时序数据片段,确定每一第二时序数据片段与每一价值基准模板之间的相似度,包括:对每一第二时序数据片段进行采样,得到每一第二时序数据的第一采样数据;对每一价值基准模板进行采样,得到每一价值基准模板的第二采样数据;其中,第一采样数据的数据长度与第二采样数据的数据长度相等;计算每一第二时序数据的第一采样数据与每一价值基准模板的第二采样数据之间的相似度。3.如权利要求1所述的时序数据信息价值评估方法,其特征在于,将每一第二时根据对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段在业务分析目标下的信息价值,包括:对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段的归一化特征值;对每一第二时序数据片段的归一化特征值取负对数值,得到每一第二时序数据片段在业务分析目标下的信息价值。4.如权利要求1所述的时序数据信息价值评估方法,其特征在于,将每一第二时根据对每一第二时序数据片段的根据待分析时序数据的数据长度、第一时序数据片段的信息价值、第二时序数据片段的信息价值,得到待分析时序数据在业务分析目标下的信息价值密度,包括:将第一时序数据片段的信息价值与第二时序数据片段的信息价值求和,得到待分析时序数据的信息价值总和;利用待分析时序数据的信息价值总和除以待分析时序数据的数据长度,得到待分析时序数据在业务分析目标下的信息价值密度。5.一种时序数据信息价值评估装置,其特征在于,包括:
第一处理模块,用于根据预先设定的业务分析目标,确定多个价值基准模板;其中,价值基准模板是正常生产模式时产生的时序数据片段,业务分析目标包括:实际生产曲线中任意一个或多个数据指标相比于正常生成曲线中对应数据指标的偏离程度;第二处理模块,用于根据预先设定的业务分析目标,确定时序数据切分点标志;第三处理模块,用于根据切分点标志将待分析时序数据分为多个时序数据片段;赋值模块,用于针对与业务分析目标无关的第一时序数据片段,赋予信息价值为0;相似度计算模块,用于针对与业务分析目标相关的第二时序数据片段,确定每一第二时序数据片段与每一价值基准模板之间的相似度,得到每一第二时序数据片段对应的多个相似度值;第四处理模块,用于将每一第二时序数据片段对应的多个相似度值中的最大值确定为每一第二时序数据片段的特征值;第五处理模块,用于将每一第二时根据对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段在业务分析目标下的信息价值;第六处理模块,用于将每一第二时根据对每一第二时序数据片段的根据待分析时序数据的数据长度、第一时序数据片段的信息价值、第二时序数据片段的信息价值,得到待分析时序数据在业务分析目标下的信息价值密度。6.如权利要求5所述的时序数据信息价值评估装置,其特征在于,相似度计算模块,具体用于对每一第二时序数据片段进行采样,得到每一第二时序数据的第一采样数据;对每一价值基准模板进行采样,得到每一价值基准模板的第二采样数据;其中,第一采样数据的数据长度与第二采样数据的数据长度相等;计算每一第二时序数据的第一采样数据与每一价值基准模板的第二采样数据之间的相似度。7.如权利要求5所述的时序数据信息价值评估装置,其特征在于,第五处理模块,具体用于对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段的归一化特征值;对每一第二时序数据片段的归一化特征值取负对数值,得到每一第二时序数据片段在业务分析目标下的信息价值。8.如权利要求5所述的时序数据信息价值评估装置,其特征在于,第六处理模块,具体用于将第一时序数据片段的信息价值与第二时序数据片段的信息价值求和,得到待分析时序数据的信息价值总和;利用待分析时序数据的信息价值总和除以待分析时序数据的数据长度,得到待分析时序数据在业务分析目标下的信息价值密度。9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4任一所述方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至4任一所述方法。11.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现权利要求1至4任一所述方法。
技术总结
本发明公开了一种时序数据信息价值评估方法及装置,涉及信息技术领域,其中该方法包括:根据切分点标志将待分析时序数据分为多个时序数据片段;针对与业务分析目标无关的第一时序数据片段赋予信息价值为0;针对与业务分析目标相关的第二时序数据片段,确定每一第二时序数据片段与每一价值基准模板之间的相似度;根据每一第二时序数据片段对应的多个相似度值,确定第二时序数据片段的特征值;根据每一第二时序数据片段的特征值,得到每一第二时序数据片段的信息价值;根据待分析时序数据的数据长度、第一时序数据片段的信息价值、第二时序数据片段的信息价值,得到待分析时序数据的信息价值密度。本发明可以辅助人员快速定位高信息价值时序数据。高信息价值时序数据。高信息价值时序数据。
技术研发人员:张东
受保护的技术使用者:中冶京诚工程技术有限公司
技术研发日:2023.05.17
技术公布日:2023/9/14
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/