一种基于自适应密度峰值聚类的工业数据划分方法及系统

未命名 08-05 阅读：164 评论：0

1.本发明属于机器学习领域，尤其涉及一种基于自适应密度峰值聚类的工业数据划分方法及系统。

背景技术：

2.本部分的陈述仅仅是提供了与本发明相关的背景技术信息，不必然构成在先技术。
3.在工业生产过程中，工业设备的每个环节都在源源不断的产生工业数据，这些数据往往被实时采集起来暂存在内存里，然后将概要数据信息保存在后台数据库中，对于这么大体量的数据“宝藏”，大多数企业只是对其表面进行运算统计，并没有挖掘出其内部隐藏的价值。综上所述，对工业数据进行处理进而发掘其潜在信息有着十分重要的现实意义。
4.数据挖掘中的有监督学习或半监督学习方法进行处理需要对数据进行预标注，而对大量的工业数据进行标注是一件费时费力的工作。聚类作为一种无监督学习方法，不需要对数据进行预标注，通过计算数据之间的相似度，将相似度高的数据归入一簇，从中发掘有价值的信息。现有的聚类方法大致可以分为五种：基于划分的聚类、基于网格的聚类、基于密度的聚类、基于层次的聚类、基于模型的聚类。其中基于密度的聚类方法由于其在处理具有任意形状和不同尺寸的数据上具有更好的优势，所以更适用于工业数据的分布特征。密度峰值聚类算法作为一种新颖的密度聚类算法，凭借着可以迅速发现聚类中心且分配过程无需迭代的优势近年来备受关注。
5.发明人发现，密度峰值聚类算法在处理工业数据时，有以下几个缺陷：首先，密度峰值聚类算法对数据进行聚类操作时，需要人工事先设定簇的个数，而工业数据随着时间的推移会不断产生新的数据，并且数据的特性有可能会随时间推移而改变，例如簇的个数发生增减，很难做到事先给出确定的簇的个数；其次密度峰值算法簇中心需要手动选取，有很大的人为主观性；密度峰值聚类算法计算数据的度量值时未考虑数据分布的局部特征，而一般相邻的工业数据之间存在着较强的关联性；密度峰值聚类算法的单一分配策略易产生“多米诺效应”，即一个局部域密度较大的样本发生分配错误，则会导致以该点为上级数据点的样本发生同样的分配错误，有时会严重影响聚类结果，若投入到工业生产环境中可能会产生不可估量的损失。

技术实现要素：

6.为了解决上述背景技术中存在的至少一项技术问题，本发明提供一种基于自适应密度峰值聚类的工业数据划分方法及系统，其在解决密度峰值聚类算法存在的问题的同时使其更适配于处理工业数据，该方法簇个数的设定和簇中心的选取全由算法自适应完成，无需人工干预，并引入共享邻居充分考虑样本的局部特征，最后通过一种二阶段分配法，避免了数据分配时产生“多米诺效应”。
7.为了实现上述目的，本发明采用如下技术方案：
8.本发明的第一个方面提供一种基于自适应密度峰值聚类的工业数据划分方法，包括如下步骤：
9.获取工业设备用电数据；
10.基于工业设备用电数据和自适应密度峰值聚类算法进行聚类得到数据划分结果；其中，所述自适应密度峰值聚类算法的构建过程为：
11.引入数据点的共享邻居计算数据点的局部域密度；
12.结合数据点的局部域密度，引入密度衰减现象，通过密度衰减现象将数据点自适应地汇聚成微簇；
13.采用两阶段分配策略代替一阶段分配策略，对数据进行划分，第一阶段，将微簇合并形成簇主干，第二阶段，用第一阶段已分配的簇主干指导第二步剩余数据点的分配。
14.作为一种或多种实施例，所述数据点的局部域密度的计算过程为：
15.计算任意两个数据之间的共享邻居得到共享邻居集合；
16.基于共享邻居集合，定义数据点之间的相似度；
17.基于数据点之间的相似度得到任意数据点的局部域密度。
18.作为一种或多种实施例，所述结合数据点的局部域密度，引入密度衰减现象，通过密度衰减现象将数据点自适应地汇聚成微簇，具体包括：
19.结合密度衰减现象的特点，基于数据点之间满足的局部域密度关系进行筛选，得到密度衰减点；
20.将任意一个数据点的所有密度衰减点合并作为该数据点的密度衰减集。
21.作为一种或多种实施例，所述基于数据点之间满足的局部域密度关系为：
22.如果点pi和点pj满足：存在一个路径p1＝pi,
………
,pn＝pj，如果任意一个pk(1《＝k《＝n)都满足ρk》ρ
(k+1)
，且p
(k+1)
是pk的k近邻，则称点pj是点pi密度衰减点，其中，pk为第k个数据点，ρk为第k个数据点对应的局部域密度，ρ
(k+1)
为第k+1个数据点对应的局部域密度。
23.作为一种或多种实施例，所述将微簇合并形成簇主干的过程包括：
24.计算任意两个微簇之间的交点集；
25.根据处于交点集的数据点的局部域密度和合并阈值条件对微簇进行合并得到簇主干。
26.作为一种或多种实施例，所述合并阈值条件为：
27.(1)cu中至少存在m
·
|cu|个点的密度小于数据点i的密度；
28.(2)cn中至少存在m
·
|cn|个点的密度小于数据点i的密度；
29.其中，cu和cn为任意两个微簇，m为合并阈值，取值范围为0～1。
30.作为一种或多种实施例，所述用第一阶段已分配的簇主干指导第二步剩余数据点的分配，包括：将剩余数据点分配给其上级数据点所在的簇，若上级数据点也处于未分配状态，则继续遍历该点的上级数据点，直到查找到已分配的上级数据点为止，然后将该点分配给已分配的上级数据点所在的簇。
31.本发明的第二个方面提供一种基于自适应密度峰值聚类的工业数据划分系统，包括：
32.数据获取模块，用于获取工业设备用电数据；
33.数据划分模块，用于基于工业设备用电数据和自适应密度峰值聚类算法进行聚类
得到数据划分结果；其中，所述自适应密度峰值聚类算法的构建过程为：
34.引入数据点的共享邻居调整数据点之间的距离度量值，计算数据点的局部域密度；
35.结合数据点的局部域密度，引入密度衰减现象，通过密度衰减现象将数据点自适应地汇聚成微簇；
36.采用两阶段分配策略代替一阶段分配策略，对数据进行划分，第一阶段，将微簇合并形成簇主干，第二阶段，用第一阶段已分配的簇主干指导第二步剩余数据点的分配。
37.本发明的第三个方面提供一种计算机可读存储介质。
38.一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如第一方面所述的一种基于自适应密度峰值聚类的工业数据划分方法中的步骤。
39.本发明的第四个方面提供一种计算机设备。
40.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如第一方面所述的一种基于自适应密度峰值聚类的工业数据划分方法中的步骤。
41.与现有技术相比，本发明的有益效果是：
42.1、本发明通过引入共享邻居调整数据点的度量值和密度衰减现象实现簇个数自适应确定和簇中心自适应选取，同时提出一种基于微簇合并的二阶段分配策略，降低“多米诺效应”出现的概率。
43.2、由于工业数据随着时间的推移会不断产生新的数据从而产生簇个数的增减变化，很难做到事先给出确定的簇的个数，而密度峰值算法需要预先设定簇个数的要求无法在工业数据上进行，因此通过密度衰减形成微簇，让数据自下而上汇聚，从而实现簇个数自适应确定和簇中心自适应选取，减少过程中的人为主观性。
44.3、本发明利用微簇合并的二阶段分配策略。第一步先合并微簇确定簇主干，再用第一步已分配的簇主干指导第二步剩余点的分配，降低一个密度较大的数据点分配错误导致以该点为上级数据点的所有点分配错误发生的概率，提升算法鲁棒性。
45.4、采用共享邻居解决密度峰值聚类算法在定义度量值时没有考虑数据的局部特征的问题，由于不同的工业数据规模大小不统一且数据规模会随时间变化，原始密度峰值聚类算法在计算局部域密度时对大小不同的数据集采用不同计算公式的方法在工业数据上无法进行，因此我们将局部域密度的计算方式统一，不再受数据集规模的影响。
46.本发明附加方面的优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。
附图说明
47.构成本发明的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。
48.图1是本发明实施例提供的一种基于自适应密度峰值聚类的工业数据划分方法整体流程图；
49.图2(a)-图2(b)是本发明实施例提供的基于自适应密度峰值聚类形成的微簇和最终聚类结果对比图。
具体实施方式
50.下面结合附图与实施例对本发明作进一步说明。
51.应该指出，以下详细说明都是例示性的，旨在对本发明提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
52.需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本发明的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
53.实施例一
54.如图1所示，本实施例提供了一种基于自适应密度峰值聚类的工业数据划分方法，包括如下步骤：
55.s101：获取工业设备用电数据，对数据的特征选取与预处理。
56.s101中，由于原始工业数据有很大概率存在如属性量纲不一致、重复冗余等不规范的问题，并且一些标识性数据变量与工业设备运行状态无关，如果不进行处理则会在聚类时会成为干扰项影响聚类结果，因此要对原始工业数据进行数据预处理使其规范化。
57.具体包括：
58.首先对原始工业数据进行特征提取，将公司编号、设备编号等标识性属性剔除，根据实际应用中不同的工业环境选取与之对应的和工业生产有关属性作为数据特征进行后续的数据挖掘。
59.首先将上一步处理好的数据中重复冗余的数据删除，再对特征提取后的数据进行标准化，消除量纲引起的特征数值量级对分析结果的影响。
60.例如，可以采用z-score方法进行标准化，如公式(1)所示：
[0061][0062]
其中，表示数据的均值，s表示数据的标准差。
[0063]
s102：基于共享邻居定义点的度量值。
[0064]
密度峰值聚类算法在一些复杂数据集上可能不会产生令人满意的结果，因为密度峰值聚类算法直接计算点之间的距离和密度。
[0065]
然而，一个点的大多数邻居通常仍然属于同一个簇，这一事实可用于改进密度峰值聚类算法的度量值。
[0066]
k最邻近(knn)的思想是：如果在特征空间中，距离一个样本点最近的k个样本点大多属于同一类别，则该样本点也属于这一类别。
[0067]
本实施例采用共享最近邻(snn)算法，其是基于k近邻算法的改进，snn的基本思想是，如果两个点有更多共同的邻居，则认为它们更相似。
[0068]
具体包括如下步骤：
[0069]
s201：计算每两个数据之间的共享邻居，对于数据集x中的任意点i和j，i和j的共享邻居集定义如下：
[0070]
snn(i,j)＝knn(i) ∩knn(j) ，
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0071]
s202：基于共享邻居集计算每两个点之间的相似度。如果两个点有更多共同的邻居则认为它们更相似，基于这个思想，定义了相似度，对于数据集x中的任意点i和j，其相似度定义如下：
[0072][0073]
其中，d
ij
是点i和j的欧氏距离，只有当点i和点j出现在彼此的k近邻集中时，才计算相似度。否则，点i和点j之间的相似度为0。不难发现，两个点的共享邻居数量越多，两个点的相似度越大。两个点的共享邻居距离两个点越近，两个点的相似度越大。通过同时检查共享邻居和两个点周围邻域的密度，snn相似度可以更好地适应各种工业环境。
[0074]
s203：计算数据点的局部域密度。对于数据集x中的任意数据点i，l(i)＝{x1，x2，
…
，xk}为与样本点i相似度最高的k个样本点的集合。把与点i相似度最高的k个点相似度之和定义为点i的局部域密度：
[0075]
ρi＝∑
j∈l(i)
sim(i,j)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0076]
s204：计算数据点的上级数据点距离。设点i是数据集x中的任意数据点，点j为满足局部域密度大于点i的数据点，计算i和j的距离乘以两点分别到各自k近邻距离之和，取其中最小值作为点i的距离，其对应的数据点即为点i的上级数据点，公式定义如下：
[0077][0078]
局部域密度最高的点的δ值是该点到其他点的δ的最大值：
[0079][0080]
本实施例中，更新后的距离因子不仅取决于两个点之间的距离，还考虑了两个点各自的邻域信息，更能反映出样本的真实空间分布特征。
[0081]
s103：基于密度衰减现象形成微簇。
[0082]
将自然中的衰减现象和聚类算法相结合，定义了密度衰减点和密度衰减集。
[0083]
如果一组东西有一定的数量，随着距离中心位置的距离的增加而逐渐减少，那么这些东西应该被视为一个整体，这种现象被称之为衰减现象。我们将自然中的衰减现象和聚类算法相结合，定义了密度衰减点和密度衰减集。
[0084]
计算密度密度衰减点和密度衰减集。如果点pi和点pj满足：存在一个路径p1＝pi,
………
,pn＝pj，如果任意一个pk(1《＝k《＝n)都满足ρk》ρ
(k+1)
，且p
(k+1)
是pk的k近邻，则称点pj是点pi密度衰减点，其中，pk为第k个数据点，ρk为第k个数据点对应的局部域密度，ρ
(k+1)
为第k+1个数据点对应的局部域密度。
[0085]
点pi的所有密度衰减点的集合被定义为点pi的密度衰减集。
[0086]
可以将已经形成的密度衰减集看成一个个自下而上聚集而成的微簇。如图2(a)-图2(b)所示，微簇的个数一般要远大于最终结果的簇个数。
[0087]
本发明通过密度衰减现象将数据点自适应地汇聚成微簇，避免了密度峰值聚类算法通过决策图人工选取聚类中心，减少了人为主观性。
[0088]
s104：基于微簇合并的二阶段分配法。
[0089]
由于密度峰值聚类算法的一步分配方式容易产生一步错步步错的链式反应，所以本实施例采用两阶段分配策略代替一阶段分配策略，第一阶段通过将微簇合并形成簇主干，并将簇主干上的样本点分配给对应的簇，第二阶段对未分配的剩余点采用和传统密度峰值聚类算法一样的分配方式，即将剩余点分配给对应的上级数据点，但由于第一步已经将一部分点分配完毕，这些点在第二步分配过程中会起到指导作用，从而有效避免“多米诺效应”。
[0090]
所述基于微簇合并的二阶段分配法具体包括如下步骤：
[0091]
s401：计算微簇的交集点。对于任意两个微簇cu和cn，其交点集iun的定义如下：
[0092][0093]
s402：计算微簇的连接点。对于任意两个微簇cu和cn，如果点i是交点集中的点且满足以下条件，则称点i为微簇cu和cn的连接点：
[0094]
(1)cu中至少存在m
·
|cu|个点的密度小于点i的密度。
[0095]
(2)cn中至少存在m
·
|cn|个点的密度小于点i的密度。
[0096]
其中，m为合并阈值，取值范围为0～1。m越大则微簇越难合并，越小越容易合并。
[0097]
s403：进行微簇合并，完成第一步分配策略。
[0098]
具体包括：将存在连接点的两个微簇进行合并,合并完成后，将未满足合并条件的交集点的标签清空，使其不属于任何一个簇，至此第一步分配结束。通过第一步分配，部分数据点已经得到了最后的聚类结果，这一部分数据点可以看作簇主干，来指导下一步的分配策略。
[0099]
s404：进行第二步分配策略。
[0100]
具体包括：将第一步分配后仍未分配的数据点称之为剩余点。第二步分配策略是将剩余点分配给其上级数据点所在的簇，若上级数据点也处于未分配状态，则继续遍历该点的上级数据点，直到查找到已分配的上级数据点为止，然后将该数据点分配给已分配的上级数据点所在的簇。由于已经形成簇主干，所以上级数据点不需要迭代多次就可以找到。
[0101]
实施例二
[0102]
本实施例提供一种基于自适应密度峰值聚类的工业数据划分系统，包括：
[0103]
数据获取模块，用于获取工业设备用电数据；
[0104]
数据划分模块，用于基于工业设备用电数据和自适应密度峰值聚类算法进行聚类得到数据划分结果；其中，所述自适应密度峰值聚类算法的构建过程为：
[0105]
引入数据点的共享邻居调整数据点之间的距离度量值，计算数据点的局部域密度；
[0106]
结合数据点的局部域密度，引入密度衰减现象，通过密度衰减现象将数据点自适应地汇聚成微簇；
[0107]
采用两阶段分配策略代替一阶段分配策略，对数据进行划分，第一阶段，将微簇合并形成簇主干，第二阶段，用第一阶段已分配的簇主干指导第二步剩余数据点的分配。
[0108]
实施例三
[0109]
本实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如实施例一所述的一种基于自适应密度峰值聚类的工业数据划分方法中
的步骤。
[0110]
实施例四
[0111]
本实施例提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如实施例一所述的一种基于自适应密度峰值聚类的工业数据划分方法中的步骤。
[0112]
本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
[0113]
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0114]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0115]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0116]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(read-only memory，rom)或随机存储记忆体(random accessmemory，ram)等。
[0117]
以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

技术特征：
1.一种基于自适应密度峰值聚类的工业数据划分方法，其特征在于，包括如下步骤：获取工业设备用电数据；基于工业设备用电数据和自适应密度峰值聚类算法进行聚类得到数据划分结果；其中，所述自适应密度峰值聚类算法的构建过程为：引入数据点的共享邻居计算数据点的局部域密度；结合数据点的局部域密度，引入密度衰减现象，通过密度衰减现象将数据点自适应地汇聚成微簇；采用两阶段分配策略代替一阶段分配策略，对数据进行划分，第一阶段，将微簇合并形成簇主干，第二阶段，用第一阶段已分配的簇主干指导第二步剩余数据点的分配。2.如权利要求1所述的一种基于自适应密度峰值聚类的工业数据划分方法，其特征在于，所述数据点的局部域密度的计算过程为：计算任意两个数据之间的共享邻居得到共享邻居集合；基于共享邻居集合，定义数据点之间的相似度；基于数据点之间的相似度得到任意数据点的局部域密度。3.如权利要求1所述的一种基于自适应密度峰值聚类的工业数据划分方法，其特征在于，所述结合数据点的局部域密度，引入密度衰减现象，通过密度衰减现象将数据点自适应地汇聚成微簇，具体包括：结合密度衰减现象的特点，基于数据点之间满足的局部域密度关系进行筛选，得到密度衰减点；将任意一个数据点的所有密度衰减点合并作为该数据点的密度衰减集。4.如权利要求3所述的一种基于自适应密度峰值聚类的工业数据划分方法，其特征在于，所述基于数据点之间满足的局部域密度关系为：如果点p
i
和点p
j
满足：存在一个路径p1＝p
i
,
………
,p
n
＝p
j
，如果任意一个p
k
(1<＝k<＝n)都满足ρ
k
>ρ
(k+1)
，且p
(k+1)
是p
k
的k近邻，则称点p
j
是点p
i
密度衰减点，其中，p
k
为第k个数据点，ρ
k
为第k个数据点对应的局部域密度，ρ
(k+1)
为第k+1个数据点对应的局部域密度。5.如权利要求1所述的一种基于自适应密度峰值聚类的工业数据划分方法，其特征在于，所述将微簇合并形成簇主干的过程包括：计算任意两个微簇之间的交点集；根据处于交点集的数据点的局部域密度和合并阈值条件对微簇进行合并得到簇主干。6.如权利要求5所述的一种基于自适应密度峰值聚类的工业数据划分方法，其特征在于，所述合并阈值条件为：(1)c
u
中至少存在m
·
|c
u
|个点的密度小于数据点i的密度；(2)c
n
中至少存在m
·
|c
n
|个点的密度小于数据点i的密度；其中，c
u
和c
n
为任意两个微簇，m为合并阈值，取值范围为0～1。7.如权利要求1所述的一种基于自适应密度峰值聚类的工业数据划分方法，其特征在于，所述用第一阶段已分配的簇主干指导第二步剩余数据点的分配，包括：将剩余数据点分配给其上级数据点所在的簇，若上级数据点也处于未分配状态，则继续遍历该点的上级数据点，直到查找到已分配的上级数据点为止，然后将该点分配给已分配的上级数据点所在的簇。
8.一种基于自适应密度峰值聚类的工业数据划分系统，其特征在于，包括：数据获取模块，用于获取工业设备用电数据；数据划分模块，用于基于工业设备用电数据和自适应密度峰值聚类算法进行聚类得到数据划分结果；其中，所述自适应密度峰值聚类算法的构建过程为：引入数据点的共享邻居调整数据点之间的距离度量值，计算数据点的局部域密度；结合数据点的局部域密度，引入密度衰减现象，通过密度衰减现象将数据点自适应地汇聚成微簇；采用两阶段分配策略代替一阶段分配策略，对数据进行划分，第一阶段，将微簇合并形成簇主干，第二阶段，用第一阶段已分配的簇主干指导第二步剩余数据点的分配。9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-7中任一项所述的一种基于自适应密度峰值聚类的工业数据划分方法中的步骤。10.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1-7中任一项所述的一种基于自适应密度峰值聚类的工业数据划分方法中的步骤。

技术总结
本发明属于机器学习领域，提供了一种基于自适应密度峰值聚类的工业数据划分方法及系统，其方案为：基于工业设备用电数据和自适应密度峰值聚类算法进行聚类得到数据划分结果；其中，所述自适应密度峰值聚类算法的构建过程为：引入数据点的共享邻居调整数据点之间的距离度量值，计算数据点的局部域密度；结合数据点的局部域密度，引入密度衰减现象，通过密度衰减现象将数据点自适应地汇聚成微簇；采用两阶段分配策略代替一阶段分配策略，对数据进行划分，第一阶段，将微簇合并形成簇主干，第二阶段，用第一阶段已分配的簇主干指导第二步剩余数据点的分配。数据点的分配。数据点的分配。

技术研发人员：杜韬王心耕周劲杨晓晖陈迪仵匀政
受保护的技术使用者：济南大学
技术研发日：2023.04.28
技术公布日：2023/8/4

版权声明

本文仅代表作者观点，不代表航家之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

上一篇：电子宫腔镜的制作方法 下一篇：一种航天器着陆机构缓冲实验装置与控制方法

一种基于自适应密度峰值聚类的工业数据划分方法及系统

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

一种基于自适应密度峰值聚类的工业数据划分方法及系统

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表