一种机房故障日志数据处理方法及装置与流程

未命名 08-07 阅读:179 评论:0


1.本技术涉及机房故障处理技术领域,尤其涉及一种机房故障日志数据处理方法及装置。


背景技术:

2.机房是专门用于存放计算机设备、服务器和相关设备的空间。它通常具备良好的环境控制和安全措施,以确保设备的正常运行和数据的安全性。由于电力问题、网络问题、温度和湿度问题或者设备故障等原因会引发机房故障,通常,对于机房故障可通过日志的形式记录机房中发生的故障事件和相应处理情况的记录,机房故障日志数据对于机房管理人员来说是一种比较重要的数据,可用于追踪和分析故障,并帮助改进机房的运行和维护。
3.目前,对于机房故障日志数据的处理一般采用k均值聚类算法对机房故障日志数据进行聚类,然后进行分析,但该现有机房故障日志数据的处理方法中一方面受到初始聚类中心的选择影响而造成局部聚类最优,影响最终的聚类结果准确性,另一方面因为机房故障日志数据块属于混合数据,采用该方法得到的聚类结果误差值比较大,也会影响最终聚类结果的准确性。


技术实现要素:

4.本技术实施例通过提供一种机房故障日志数据处理的方法及装置,以解决现有机房故障日志数据聚类中心点为局部最优以及聚类结果误差值比较大,影响最终聚类结果准确性的技术问题。
5.为解决上述技术问题,本技术采用如下技术方案:第一方面,本技术提供一种机房故障日志数据处理的方法,包括如下步骤:对每个机房故障日志数据块中数据进行分类,得到每个故障日志数据块的时间数据集和文本数据集;判定不同故障日志数据块间所述时间数据集的差异和所述文本数据集的差异,得到不同故障日志数据块间的数据差异度和文本差异度;根据不同故障日志数据块间的数据差异度和文本差异度,得到不同故障日志数据块的块间距离;将所述不同故障日志数据块的块间距离进行排序后确定截断距离;对所述截断距离进行密度检验估计,进而获取每个故障日志数据块对应类簇的分布密度;根据不同故障日志数据块间的差异度和不同故障日志数据块对应类簇的分布密度,确定每个故障日志数据块的高密度距离;对所有故障日志数据块的高密度距离和对应类簇的分布密度进行拟合,得到聚类质心拟合曲线,根据聚类质心拟合曲线,确定故障数据块聚类的中心点,按照所述故障数据块聚类的中心点对机房故障日志数据进行聚类。
6.在一些实施例中,对每个机房故障日志数据块中数据根据机房故障日志数据的属性类型进行分类。
7.在一些实施例中,不同故障日志数据块间所述时间数据集的差异和所述文本数据集的差异采用不同的判定方式。
8.在一些实施例中,不同故障日志数据块间时间数据集的差异采用下述公式确定:
9.其中,和表示两个不同的故障数据块对应的m维时间数据集,表示所述时间数据集和间的差异度,表示时间数据集中第1个到第m个的时间数据,表示时间数据集中第1个到第m个的时间数据。
10.不同故障日志数据块间文本数据集的差异采用下述公式确定:
11.其中,和表示两个不同的故障数据块对应的n维文本数据集,表示所述文本数据集和间的差异度,表示判定系数,表示文本数据集中第1个到第n个的文本数据,表示文本数据集中第1个到第n个的文本数据。
12.在一些实施例中,对不同故障日志数据块间的数据差异度和文本差异度加权后相加,得到不同故障日志数据块的块间距离。
13.在一些实施例中,根据所述截断距离,确定每个故障日志数据块对应类簇的范围。
14.在一些实施例中,所述每个机房故障日志数据块对应类簇的分布密度由下述公式确定:
15.其中,和表示两个不同的故障日志数据块,表示故障日志数据块对应类簇的分布密度,表示和的块间距离,表示所述截断距离,表示判定是否在对应类簇范围内的系数。
16.第二方面,在本技术提供一种机房故障日志数据处理装置,包括:故障日志数据块分类模块,用于对每个机房故障日志数据块中数据进行分类,得到每个故障日志数据块的时间数据集和文本数据集;故障日志数据块间距离判定模块,用于判定不同故障日志数据块间所述时间数据集的差异和所述文本数据集的差异,得到不同故障日志数据块间的数据差异度和文本差异度;根据不同故障日志数据块间的数据差异度和文本差异度,得到不同故障日志数据块的块间距离;故障日志数据块高密度判定模块,用于将所述不同故障日志数据块的块间距离进行排序后确定截断距离;对所述截断距离进行密度检验估计,进而获取每个故障日志数据块对应类簇的分布密度;根据不同故障日志数据块间的差异度和不同故障日志数据块对应类簇的分布密度,确定每个故障日志数据块的高密度距离;故障日志数据块聚类模块,用于对所有故障日志数据块的高密度距离和对应类簇的分布密度进行拟合,得到聚类质心拟合曲线,根据聚类质心拟合曲线,确定故障数据块聚类的中心点,按照所述故障数据块聚类的中心点对机房故障日志数据进行聚类。
17.第三方面,本技术提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有代码,所述处理器被配置为获取所述代码,并执行上述的机房故障日志处理方法。
18.第四方面,本技术提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的机房故障日志处理方法。
19.本技术公开的实施例提供的技术方案具有以下有益效果:本技术公开的机房故障日志数据处理的方法及装置中,首先对每个机房故障日志数据块中数据进行分类,降低数据复杂度,得到每个故障日志数据块的时间数据集和文本数据集,然后对不同故障日志数据块间所述时间数据集的差异和所述文本数据集的差异采用不同的方式进行判别,以提高不同故障日志数据块间所述数据差异度和所述文本差异度的准确度,进而根据不同故障日志数据块间的数据差异度和文本差异度,可得到不同故障日志数据块的块间距离,并进一步确定截断距离,对所述截断距离进行密度检验估计,从而获取每个故障日志数据块对应类簇的分布密度,根据不同故障日志数据块间的差异度和不同故障日志数据块对应类簇的分布密度,确定每个故障日志数据块的高密度距离,最后对所有故障日志数据块的高密度距离和对应类簇的分布密度进行拟合,得到聚类质心拟合曲线,进而确定故障数据块聚类中心点,根据所述故障数据块聚类中心点得到故障日志数据块类簇,最终可提高故障日志数据聚类的准确性。
附图说明
20.图1是根据本技术一些实施例所示的机房故障日志数据处理的方法的示例性流程图;图2是根据本技术一些实施例所示的机房故障日志数据处理的装置的示例性硬件和/或软件的示意图;图3是根据本技术一些实施例所示的应用机房故障日志数据处理方法的计算机设备的示例性结构示意图。
具体实施方式
21.本技术实施提供一种机房故障日志数据处理的方法及装置,其核心是对每个机房故障日志数据块中数据进行分类,得到每个故障日志数据块的时间数据集和文本数据集,然后对不同故障日志数据间所述时间数据集的差异和所述文本数据集的差异采用不同的方式判别,得到不同故障日志数据块间的数据差异度和文本差异度,根据不同故障日志数据块间的数据差异度和文本差异度,得到不同故障日志数据块的块间距离,进而确定截断距离,根据所述截断距离进行密度检验估计,进而获取每个故障日志数据块对应类簇的分布密度,根据不同故障日志数据块间的差异度和不同故障日志数据块对应类簇的分布密度,确定每个故障日志数据块的高密度距离,对所有故障日志数据块的高密度距离和对应类簇的分布密度进行拟合,得到聚类质心拟合曲线,根据所述聚类质心拟合曲线确定故障数据块聚类中心点,根据所述故障数据块聚类中心点对故障日志数据块进行聚类。
22.为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。参考图1,该图是根据本技术一些实施例所示的机房故障日志
数据处理方法的示例性流程图,该机房故障日志数据处理方法100主要包括如下步骤:在步骤101,对每个机房故障日志数据块中数据进行分类,得到每个故障日志数据块的时间数据集和文本数据集。
23.具体实现时,机房故障日志数据块为不同时间段内的机房故障日志数据组成的集合,属于混合数据,由于需要对混合数据中不同类型数据之间计算差异度,因此需对机房故障日志数据块中数据进行分类,在一些实施例中,按照数据的属性可以将机房故障日志数据块中数据分为时间数据和文本数据,根据上述分类得到每个故障日志数据块的时间数据集和文本数据集合。
24.设故障日志数据块,故障日志数据块中的数据有,故障日志数据块的时间数据集和文本数据集由下述过程得到:取出数据,对数据进行判定,如果属于文本属性数据放入文本数据集,否则,放入时间数据集。对故障日志数据块中所有数据重复该步骤,得到故障日志数据块的时间数据集和文本数据集。
25.在步骤102,判定不同故障日志数据块间所述时间数据集的差异和所述文本数据集的差异,得到不同故障日志数据块间的数据差异度和文本差异度;根据不同故障日志数据块间的数据差异度和文本差异度,得到不同故障日志数据块的块间距离。
26.具体实现时,由于所述时间数据集和所述文本数据集的类型不同,采用相同的方式判定不同故障日志数据块间所述时间数据集的差异和所述文本数据集的差异会导致其中一种的差异误差值大,因此需要采用不同的方法判定不同故障日志数据块之间所述时间数据集的差异和所述文本数据集的差异。
27.在一些实施例中,设定故障日志数据块的所述时间数据集,故障日志数据块的所述时间数据集,则所述故障日志数据块和所述故障日志数据块的所述时间数据集间的差异度可根据下述公式确定:
28.其中,和表示两个不同的故障数据块对应的m维时间数据集,表示所述时间数据集和间的差异度,表示时间数据集中第1个到第m个的时间数据,表示时间数据集中第1个到第m个的时间数据。
29.在一些实施例中,设定故障日志数据块的所述文本数据集,故障日志数据块的所述文本数据集,则所述故障日志数据块和所述故障日志数据块的所述文本数据集间的差异度可根据下述公式确定:
30.其中,和表示两个不同的故障数据块对应的n维文本数据集,表示所述文本数据集和间的差异度,表示文本数据集中第1个到第n个的文本数据,表示文本数据集中第1个到第n个的文本数据,表示判定系数,当与
相同时取值为0,当与不同时取值为1。
31.需要说明的,本技术中对不同故障日志数据块间的数据差异度和文本差异度加权后相加,可得到不同故障日志数据块的块间距离。
32.将所有故障日志数据块的时间数据集合并,得到时间数据全集,将所有故障日志数据块的文本数据集合并,得到文本数据全集,时间数据集和文本数据集合并,得到时间文本并集,计算时间文本并集中文本数据元素个数占时间文本并集元素个数的比例,得到加权值,加权值可以根据需求采用其他方法确定。
33.在一些实施例中,设故障日志数据块和故障日志数据块,则和的块间距离由下述公式确定:
34.其中,表示和之间的距离,表示加权值,表示和的数据集之间的差异度,表示和的文本集之间的差异度。
35.在步骤103,将所述不同故障日志数据块的块间距离进行排序后确定截断距离,对所述截断距离进行密度检验估计,进而获取每个故障日志数据块对应类簇的分布密度,根据不同故障日志数据块间的差异度和不同故障日志数据块对应类簇的分布密度,确定每个故障日志数据块的高密度距离。
36.在一些实施例中,将所述不同故障日志数据块的块间距离按照从小到大排序后得到顺序块间距离集,根据邻占比确定截断距离,所述邻占比为相邻故障日志数据块数量与全部故障日志数据块数量的比值,在本技术中,邻占比的取值范围为[1%,2%],取顺序块间距离集中第1%到2%元素的均值为截断距离,邻占比的取值范围可以根据需求设定范围。
[0037]
在一些实施例中,对截断距离采用密度检验估计,即所述故障日志数据块对应类簇的分布密度由下述公式确定:
[0038]
其中,和表示两个不同的故障日志数据块,表示故障日志数据块对应类簇的分布密度,表示和的块间距离,表示所述截断距离,表示判定是否在对应类簇范围内的系数,当小于0时在对应类簇范围内,当不小于0时不在对应类簇范围内。
[0039]
具体实现时,由于故障日志数据块聚类中心点处于高密度区域内,所以其对应类簇的分布密度应该大于其周围故障日志数据块对应类簇的分布密度,且不同故障日志数据块聚类中心点的距离足够远。
[0040]
在一些实施例中,设故障日志数据块对应类簇的分布密度为,找到故障日志数据块,与其他故障日志数据相比,所述与的块间距离最小且其对应类簇的分布密度大于,和的块间距离就是故障日志数据块的高密度距离。
[0041]
对所有故障日志块寻找高密度距离过程中,设故障日志数据块对应类簇的分布密度为,找不到故障日志数据块,与其他故障日志数据相比,所述与的块间距离最
小且其对应类簇的分布密度大于,则所述故障日志数据块的高密度为0。
[0042]
在步骤104,对所有故障日志数据块的高密度距离和对应类簇的分布密度进行拟合,得到聚类质心拟合曲线,根据聚类质心拟合曲线,确定故障数据块的聚类中心点,按照所述故障数据块的聚类中心点对机房故障日志数据进行聚类。
[0043]
在一些实施例中,设和为两个不同故障日志数据块,故障日志数据块和故障日志数据块对应类簇的分布密度分别为、,故障日志数据块与故障日志数据块的块间距离最小且大于,故障日志数据块的高密度距离为,采用下述公式对故障日志数据块的高密度距离和对应类簇的分布密度进行拟合:
[0044]
对所有故障日志数据块进行以上操作,得到故障日志数据聚类中心点拟合曲线。
[0045]
在一些实施例中,使用残差分析找到与该聚类质心拟合曲线距离最大的故障日志数据块,进而将所述远离聚类质心拟合曲线的故障日志数据块作为所述故障日志数据块的聚类中心点,最后对机房故障日志数据进行聚类。
[0046]
在一些实施例中,可通过计算除聚类中心点外的故障日志数据块与聚类中心点的距离,根据除聚类中心点外的故障日志数据块与聚类中心点的距离采用聚类算法(如k均值聚类、层次聚类等)将数据块划分成不同的簇,从而将故障日志数据块归纳入不同类簇中,实现对所述机房故障日志数据的聚类。
[0047]
另外,在一些实施例中,参考图2,该图是根据本技术一些实施例所示的机房故障日志数据处理装置的示例性硬件和/或软件的示意图,本实施例中机房故障日志数据处理装置200可包括:故障日志数据块分类模块201、故障日志数据块间距离判定模块202、故障日志数据块高密度判定模块203及故障日志数据块聚类中心点模块204,分别说明如下:故障日志数据块分类模块201,本技术中故障日志数据块分类模块201主要用于对每个机房故障日志数据块中数据进行分类,得到每个故障日志数据块的时间数据集和文本数据集;故障日志数据块间距离判定模块202,本技术中故障日志数据块间距离判定模块202主要用于判定不同故障日志数据块间所述时间数据集的差异和所述文本数据集的差异,得到不同故障日志数据块间的数据差异度和文本差异度;根据不同故障日志数据块间的数据差异度和文本差异度,得到不同故障日志数据块的块间距离;故障日志数据块高密度判定模块203,本技术中故障日志数据块高密度判定模块203主要用于将所述不同故障日志数据块的块间距离进行排序后确定截断距离;对所述截断距离进行密度检验估计,进而获取每个故障日志数据块对应类簇的分布密度;根据不同故障日志数据块间的差异度和不同故障日志数据块对应类簇的分布密度,确定每个故障日志数据块的高密度距离;故障日志数据块聚类中心点模块204,本技术中故障日志数据块聚类中心点模块204主要用于对所有故障日志数据块的高密度距离和对应类簇的分布密度进行拟合,得到聚类质心拟合曲线;根据聚类质心拟合曲线,确定故障数据块聚类的中心点;根据所述故障数据条类簇的中心点,对机房故障日志数据进行聚类。
[0048]
在一些实施例中,本技术还提供一种计算机设备,所述计算机设备包括存储器和
处理器,所述存储器存储有代码,所述处理器被配置为获取所述代码,并执行上述的机房故障日志数据处理方法。
[0049]
在一些实施例中,参考图3,该图是根据本技术施例提供的一种机房故障日志数据处理的方法的计算机设备的结构示意图。上述实施例中的机房故障日志数据处理方法可以通过图3所示的计算机设备来实现,该计算机设备300包括至少一个处理器301、通信总线302、存储器303以及至少一个通信接口304。
[0050]
处理器301可以是一个通用中央处理器(central processing unit,cpu)、特定应用集成电路(application-specific integrated circuit,asic)或一个或多个用于控制本技术中的机房故障日志数据处理方法的执行。
[0051]
通信总线302可包括一通路,在上述组件之间传送信息。
[0052]
存储器303可以是只读存储器(read-only memory,rom)或可存储静态信息和指令的其它类型的静态存储设备,随机存取存储器(random access memory,ram)或者可存储信息和指令的其它类型的动态存储设备,也可以是电可擦可编程只读存储器(electrically erasable programmable read-only memory,eeprom)、只读光盘(compact disc read-only memory,cd-rom)或其它光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘或者其它磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其它介质,但不限于此。存储器303可以是独立存在,通过通信总线302与处理器301相连接。存储器303也可以和处理器301集成在一起。
[0053]
其中,存储器303用于存储执行本技术方案的程序代码,并由处理器301来控制执行。处理器301用于执行存储器303中存储的程序代码。程序代码中可以包括一个或多个软件模块。上述实施例中机房故障日志数据处理方法可以通过处理器301以及存储器303中的程序代码中的一个或多个软件模块实现。
[0054]
通信接口304,使用任何收发器一类的装置,用于与其它设备或通信网络通信,如以太网,无线接入网(radio access network,ran),无线局域网(wireless local area networks,wlan)等。
[0055]
在具体实现中,作为一种实施例,计算机设备可以包括多个处理器,这些处理器中的每一个可以是一个单核(single-cpu)处理器,也可以是一个多核(multi-cpu)处理器。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令)的处理核。
[0056]
上述的计算机设备可以是一个通用计算机设备或者是一个专用计算机设备。在具体实现中,计算机设备可以是台式机、便携式电脑、网络服务器、掌上电脑 (personal digital assistant,pda)、移动手机、平板电脑、无线终端设备、通信设备或者嵌入式设备,本技术实施例不限定计算机设备的类型。
[0057]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0058]
例如,在一些实施例中,本技术还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的机房故障日志数据处理的方法。
[0059]
本技术是根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0060]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0061]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0062]
尽管已描述了本技术的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本技术范围的所有变更和修改。
[0063]
显然,本领域的技术人员可以对本技术进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内,则本技术也意图包含这些改动和变型在内。

技术特征:
1.一种机房故障日志数据处理方法,其特征在于,包括如下步骤:对每个机房故障日志数据块中数据进行分类,得到每个故障日志数据块的时间数据集和文本数据集;判定不同故障日志数据块间所述时间数据集的差异和所述文本数据集的差异,得到不同故障日志数据块间的数据差异度和文本差异度;根据不同故障日志数据块间的数据差异度和文本差异度,得到不同故障日志数据块的块间距离;将所述不同故障日志数据块的块间距离进行排序后确定截断距离;对所述截断距离进行密度检验估计,进而获取每个故障日志数据块对应类簇的分布密度;根据不同故障日志数据块间的差异度和不同故障日志数据块对应类簇的分布密度,确定每个故障日志数据块的高密度距离;对所有故障日志数据块的高密度距离和对应类簇的分布密度进行拟合,得到聚类质心拟合曲线,根据聚类质心拟合曲线,确定故障数据块聚类的中心点,按照所述故障数据块聚类的中心点对机房故障日志数据进行聚类。2.如权利要求1所述的方法,其特征在于,对机房故障日志数据块中数据根据机房故障日志数据的属性类型进行分类。3.如权利要求1所述的方法,其特征在于,不同故障日志数据块间所述时间数据集的差异和所述文本数据集的差异采用不同的判定方式。4.如权利要求3所述的方法,其特征在于,不同故障日志数据块间所述时间数据集的差异根据下述公式确定:其中,和表示两个不同的故障数据块对应的m维时间数据集,表示所述时间数据集和间的差异度,表示时间数据集中第1个到第m个的时间数据,表示时间数据集中第1个到第m个的时间数据;不同故障日志数据块间所述文本数据集的差异根据下述公式确定:其中,和表示两个不同的故障数据块对应的n维文本数据集,表示所述文本数据集和间的差异度,表示判定系数,表示文本数据集中第1个到第n个的文本数据,表示文本数据集中第1个到第n个的文本数据。5.如权利要求1所述的方法,其特征在于,对不同故障日志数据块间的数据差异度和文本差异度加权后相加,得到不同故障日志数据块的块间距离。6.如权利要求1所述的方法,其特征在于,根据所述截断距离,确定每个故障日志数据块对应类簇的范围。7.如权利要求6所述的方法,其特征在于,所述故障日志数据块对应类簇的分布密度根据下述公式确定:其中,和表示两个不同的故障日志数据块,表示故障日
志数据块对应类簇的分布密度,表示和的块间距离,表示所述截断距离,表示判定是否在对应类簇范围内的系数。8.一种机房故障日志数据处理装置,其特征在于,包括:故障日志数据块分类模块,用于对每个机房故障日志数据块中数据进行分类,得到每个故障日志数据块的时间数据集和文本数据集;故障日志数据块间距离判定模块,用于判定不同故障日志数据块间所述时间数据集的差异和所述文本数据集的差异,得到不同故障日志数据块间的数据差异度和文本差异度;根据不同故障日志数据块间的数据差异度和文本差异度,得到不同故障日志数据块的块间距离;故障日志数据块高密度判定模块,用于将所述不同故障日志数据块的块间距离进行排序后确定截断距离;对所述截断距离进行密度检验估计,进而获取每个故障日志数据块对应类簇的分布密度;根据不同故障日志数据块间的差异度和不同故障日志数据块对应类簇的分布密度,确定每个故障日志数据块的高密度距离;故障日志数据块聚类模块,用于对所有故障日志数据块的高密度距离和对应类簇的分布密度进行拟合,得到聚类质心拟合曲线,根据聚类质心拟合曲线,确定故障数据块聚类的中心点,按照所述故障数据块聚类的中心点对机房故障日志数据进行聚类。9.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有代码,所述处理器被配置为获取所述代码,并执行如权利要求1至7任一项所述的机房故障日志数据处理方法。10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的机房故障日志数据处理方法。

技术总结
本申请公开一种机房故障日志数据处理的方法及装置,对每个机房故障日志数据块中数据分类,得到每个故障日志数据块的时间数据集和文本数据集,根据不同故障日志数据块间时间数据集的差异和文本数据集的差异得到不同故障日志数据块的块间距离,由不同故障日志数据块的块间距离确定截断距离,由截断距离得到每个故障日志数据块对应类簇的分布密度,根据不同故障日志数据块间的差异度和不同故障日志数据块对应类簇的分布密度,确定每个故障日志数据块的高密度距离,对所有故障日志数据块的高密度距离和对应类簇的分布密度进行拟合得到聚类质心拟合曲线,确定故障数据块聚类的中心点,对机房故障日志数据块聚类,可提高故障日志数据聚类的准确性。志数据聚类的准确性。志数据聚类的准确性。


技术研发人员:陈振明 李凌志 汤潮炼 熊方明
受保护的技术使用者:广州豪特节能环保科技股份有限公司
技术研发日:2023.07.06
技术公布日:2023/8/6
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐