分析方法、分析程序和信息处理装置与流程
未命名
09-13
阅读:79
评论:0

背景技术:
::2.在使用石油、石化、化学、天然气等的各种工厂中,执行采用过程数据的运转控制。过程数据与各种物理现象的关系错综复杂,而且是4m(machine(设备)、method(工序和步骤)、man(操作员)、material(原材料))等环境分散状况下的复杂的多维数据。通过分析这种复杂的多维数据,确定成为异常的原因的要素等,生成工厂的构成要素的因果关系和工序间的因果关系等,并提示给操作员等。现有技术文献3.专利文献1:日本专利公开公报特开2013-41448号专利文献2:日本专利公开公报特开2013-218725号专利文献3:日本专利公开公报特开2018-128855号专利文献4:日本专利公开公报特开2020-9080号4.可是,仅靠因果关系的显示,操作员难以立即采取可操作的应对。例如,针对因果关系的显示,尽管老练的操作员能够立即确定应对操作,但是缺乏经验的操作员容易陷入信息中,反而发生混乱。技术实现要素:5.本发明的一个目的是提供可辅助操作员迅速决策的分析方法、分析程序和信息处理装置。6.按照一个方式的分析方法,计算机执行下述处理:取得在对具有与工厂的操作有关的多个变量的因果模型提供前提条件时的推断结果,根据所述推断结果从所述多个变量确定依赖于所述前提条件的相关变量,针对所述相关变量,显示通过所述推断结果得到的与所述相关变量的状态有关的信息以及在所述工厂中产生的工厂数据中符合所述相关变量的工厂数据的统计量。7.按照一个方式的分析程序,使计算机执行下述处理:取得在对具有与工厂的操作有关的多个变量的因果模型提供前提条件时的推断结果,根据所述推断结果从所述多个变量确定依赖于所述前提条件的相关变量,针对所述相关变量,显示通过所述推断结果得到的与所述相关变量的状态有关的信息以及在所述工厂中产生的工厂数据中符合所述相关变量的工厂数据的统计量。8.按照一个方式的信息处理装置,包括:取得在对具有与工厂的操作有关的多个变量的因果模型提供前提条件时的推断结果;确定部,根据所述推断结果从所述多个变量确定依赖于所述前提条件的相关变量;以及显示部,针对所述相关变量,显示通过所述推断结果得到的与所述相关变量的状态有关的信息以及在所述工厂中产生的工厂数据中符合所述相关变量的工厂数据的统计量。9.按照一个实施方式,可以辅助操作员迅速决策。附图说明10.图1是说明实施方式1的系统结构的图。图2是表示实施方式1的信息处理装置的功能结构的功能框图。图3是收集的过程数据的一例。图4是说明预处理完毕数据的图。图5是说明基于概率潜在语义分析的聚类结果的一例的图。图6是说明因果关系备选的决定例的图。图7是说明因果模型学习用的学习数据集的生成例1的图。图8是说明因果模型学习用的学习数据集的生成例2的图。图9是说明学习完毕的贝叶斯网络的一例的图。图10是说明将基于贝叶斯网络的推断结果形象化的一例的图。图11是说明基于贝叶斯网络的推断而求出的qmm相当信息的提示例的图。图12是说明实施方式1的处理流程的流程图。图13是表示实施方式2的信息处理装置10的功能结构的功能框图。图14是说明实施方式2的处理的图。图15是说明因果关系的应用例的图。图16是说明硬件结构例的图。具体实施方式11.以下,根据附图详细说明本技术公开的分析方法、分析程序和信息处理装置的实施例。另外,本发明不限于所述实施例。此外,同一要素标注相同的附图标记,适当省略重复说明,各实施方式在不矛盾的范围内可以适当组合。12.(整体结构)图1是说明实施方式1的系统结构的图。如图1所示,所述系统具有工厂1、历史数据库12和信息处理装置10。另外,不论有线和无线,工厂1和历史数据库12采用专用线等可通信地连接。同样,不论有线和无线,历史数据库12与信息处理装置10可借助互联网或专用线等网络n可通信地连接。13.工厂1具有多个设备或机器、控制系统11,是使用石油、石化、化学、天然气等的各种工厂的一例。控制系统11是控制设置在工厂1内的各个设备的动作的系统。工厂1内构筑有分散控制系统(distributedcontrolsystems:dcs),控制系统11从设置在控制对象的设备上的未图示的现场设备等的控制设备、及与控制对象的设备对应的未图示的操作设备等,取得测定值(processvariable:pv)、设定值(settingvariable:sv)、操作量(manipulatedvariable:mv)等过程数据。14.这里,现场设备是具备测定所设置的设备的动作状态(例如压力、温度、流量等)的测定功能以及根据输入的控制信号控制所设置的设备的动作的功能(例如执行器等)的操作器等现场设备。现场设备将设置的设备的动作状态作为过程数据向控制系统11逐次输出。另外,过程数据还包含输出的测定值的种类(例如压力、温度、流量等)的信息。此外,过程数据中附带有为了识别现场设备自身而赋予的标签名等信息。另外,作为过程数据输出的测定值,可以不仅是现场设备测定的测定值,还可以包含从测定值计算的计算值。从测定值到计算值的计算,可以在现场设备中进行,也可以由与现场设备连接的未图示的外部设备进行。15.历史数据库12是通过按时间顺序保存控制系统11取得的过程数据而保存长期的数据的历史记录的装置,例如包括rom(readonlymemory)、ram(randomaccessmemory)、闪存器等各种存储器和hdd(harddiskdrive)等存储装置。保存的过程数据的记录借助例如在工厂1内构筑的专用的通信网络n向信息处理装置10输出。另外,与信息处理装置10连接的控制系统11和历史数据库12的个数不限于图1所示的个数,可以分别由多个装置构成。此外,历史数据库12可以内置于控制系统11中,成为构筑分散控制系统等控制系统的结构要素。16.信息处理装置10使用历史数据库12中存储的各过程数据和构成工厂1的结构要素的父子关系,生成因果模型。而且,信息处理装置10是将工厂1的状态作为前提条件而输入到贝叶斯网络等因果模型中从而生成操作员可操作的信息并输出的计算机装置的一例。17.(操作员显示的参考技术)为了高精度分析与工厂中的品质等的pqcds(productivity(生产性)、quality(品质)、cost(成本)、delivery(交货期)、safety(安全性))相关的要因,采取如下步骤:在通过根据某些规则性和通用项并按照类似的每个运转状态将数据进行分解从而提高数据的质量的基础上,按照分解的每个运转状态并根据各种机器学习模型进行要因分析。18.通常,作为状态的分解技术,已知维度压缩和聚类。例如,已知如下技术:在进行工厂中的设备的异常检测和诊断时,利用维度压缩手法进行特征提取后,通过聚类根据运转模式将传感器数据分为几个类别。此外,已知如下技术:通过以各类别为对象分别进行模型化,实现异常检测灵敏度的提高和诊断精度的提高。这些技术通过将多维数据用低维模型来表现,能将复杂状态分解后用简单的模型来表现,所以存在现象容易理解或解释的优点。作为这里使用的维度压缩方法,可以列举主成分分析、独立成分分析、非负矩阵因子分解、潜在结构投影、正准相关分析,作为聚类手法,可以列举针对时间轨迹分割和混合分布的em算法和k-means等。19.此外,基于机器学习模型的要因分析,通常将目的(结果)与说明变量(要因)间的相关性利用相关系数和贡献度进行列表化,已知将说明变量间的概率分布通过无向图和有向图进行图表化的图形化模型。例如,有向图带有从“要因”到“结果”这种方向性,是人容易理解的表现形式,所以用户可直观把握直接和间接造成影响的要因,可对此前未注意到的要因重新引起注意。20.作为利用所述有向图来表现变量间的因果关系的图形化模型,已知贝叶斯网络。由于贝叶斯网络将变量间的定量关系以有条件概率来保持,所以通过对关注的节点给予证据状态(证据),可以推断当时的其他节点的状态的概率分布和至此的概率值。例如,贝叶斯网络用于针对工厂的设备警报和操作员的操作,流程的运转状态的变化中的因果关系的分析,以及设备、部位、劣化情况中的因果关系的分析等。21.(参考技术的改善点)关于上述的状态的分解技术,通常维度压缩是通过在将有用的信息尽量保留的状态下映射到新的成分(轴)来概括到低维空间,即作为特征量来提取的方法,新的成分自身不一定有物理性的意义,其解释大多很困难。例如,在异常检测中,在缺乏物理上的意义的特征空间内的异常要因的说明困难,在需要重视要因的说明的情况下,因理由不充分,会被当成是误检测。22.另一方面,通常的聚类是不将数据稀疏化,而是在维持原数据结构的状态下根据数据间的类似度进行分组的方法。例如,像作为硬聚类手法的一种的k-means法,根据某些“距离尺度”判断类似度的情况下,像过程数据一样若数据变得大规模和多维度,则有时会难以适当分组。这种困难性也表现为所谓“纬度的诅咒”等。23.此外,像过程数据一样与各种物理现象的关系错综复杂的情况下,大多情况下不适合像硬聚类一样分类为“0%”或“100%”。在此,作为避免处理过程数据时会出问题的“纬度的诅咒”而能以概率值表现所属程度的手法,不使用距离尺度而是根据“概率性出现频率(潜在意义条件下的共现率)”判断类似度的软聚类手法。作为通常的软聚类手法,有概率潜在语义分析(plsa)。24.此外,关于要因分析,将说明变量间的因果关系能够用有向图来表现的贝叶斯网络是对离散变量进行处理的算法。因此,应用于过程数据时,若对从传感器以规定的周期得到的离散性数值数据原状进行处理,则成为庞大的节点数和状态数。因此,除了产生计算爆炸,还成为繁杂的网络。其结果,通常像“unstable(不稳定)”和“increase(增加)”等一样,根据其数值数据所表示的意义进行类别数据化(抽象表现化)后,实施贝叶斯网络的学习,所以容易大体把握整体的定性倾向,另一方面,难以根据起因于反应过程的具体数值进行分析。25.此外,作为要因分析结果的提示方法,对设备、部位、劣化情况将通过贝叶斯网络的学习而得到的概率高的路径进行强调显示或按照概率高的顺序进行列表化等的方法,能够致力于使用户容易理解要因的因果关系。可是,在例如化学工艺中的品质稳定化等的目的中,不仅需要把握要因的因果关系,重要的是,像操作时操作员通常参照的相当于制造配方的品质管理表(qmm:qualitymanagementmatrix)一样,提示使操作员容易和现有基准进行比较探讨并可立即反映到操作中的操作员视角的结果和应该做什么的信息。26.在此,实施方式1的信息处理装置10活用概率潜在语义分析和贝叶斯网络,通过机器学习从包含工厂中的产品的生产4要素等的环境变化的复杂操作数据,提取影响品质的生产管理指标的要因。而后,信息处理装置10通过将机器学习结果转换为操作员容易考察和理解的形式并提示,辅助操作中的操作员的迅速决策。27.(用语的说明)另外,实施方式1中使用的生产4要素为设备(machine)、工序和步骤(method)、操作员(man)、原材料(material)等。概率潜在语义分析是软聚类手法的一种,以概率性的出现频率来判断类似性,能以概率表现集群的所属程度。此外,概率潜在语义分析可对行和列同时进行聚类。所述概率潜在语义分析也称为plsa(probabilisticlatentsemanticanalysis)。28.此外,贝叶斯网络是利用有向图将多个概率变量间的定性的依赖关系形象化,以条件概率表示各个变量间的定量性的关系的概率模型和因果模型的一例。生产管理指标是包含生产性(productivity)、品质(quality)、成本(cost)、交货期(delivery)、安全性(safety)的概念。品质管理表相当于制造配方,为了保证产品的品质等,记载有必须将哪个管理点控制在哪个基准范围内(具体数值范围)等的信息,是在操作中供操作员参考的一个重要信息。29.(功能结构)接下来,是表示具有图1所示的系统的各装置的功能结构的功能框图。另外,由于控制系统11和历史数据库12具有与工厂1的控制管理中通常使用的控制系统和历史数据库同样的结构,故省略详细说明。这里,说明具有与工厂1的控制管理中通常使用的监视装置和管理装置不同功能的信息处理装置10。30.图2是表示实施方式1的信息处理装置10的功能结构的功能框图。如图2所示,信息处理装置10具有通信部100、存储部101、控制部110。另外,信息处理装置10所具有的功能部不限于图示的,还可以具有由显示器等实现的显示部等其他功能部。31.通信部100是控制与其他装置之间的通信的处理部,例如由通信接口等实现。例如,通信部100控制与历史数据库12之间的通信,从历史数据库12接收过程数据,或向管理者使用的终端发送后述的由控制部110执行的结果。32.存储部101是存储各种数据和由控制部110执行的各种程序等的处理部,例如由存储器和硬盘等实现。所述存储部101存储控制部110执行各种处理时的在过程中得到的数据和通过执行各种处理得到的处理结果等,在信息处理装置100执行的处理中产生的各种数据。33.控制部110是负责信息处理装置100整体的处理部,例如由处理器等实现。所述控制部110具有过程数据收集部111、聚类部112、因果关系备选决定部113、因果模型构筑部114、分析部115、显示部116。34.过程数据收集部111是以时间顺序收集过程数据的处理部。具体过程数据收集部111在信息处理装置10开始分析处理时或以预定的时间间隔定期地向历史数据库12请求过程数据记录的输出,并取得根据所述请求而输出的过程数据。此外,过程数据收集部111将收集的过程数据存储到存储部101中,或输出到聚类部112。35.图3是收集的过程数据的一例。如图3所示,过程数据包含“时间,taga1,taga2,taga3,tagb1,···”。这里,“时间”是收集过程记录数据的时间。“taga1,taga2,taga3,tagb1”等是表示过程数据的信息,例如从工厂1得到的测定值、设定值、操作量等。图3的示例中,表示在时间“t1”上作为过程数据“taga1,taga2,taga3,tagb1”收集了“15,110,1.8,70”。36.聚类部112是把利用概率潜在语义分析将时间的要素和标签的要素通过所属概率进行聚类的结果向因果模型构筑部114输出的处理部。具体作为预处理,聚类部112实施期望的分析对象期间的切割,原始数据的缺失值处理和离群值处理。此外,聚类部112根据需要,可以实施微分值和积分值、移动平均值等派生变量的计算。37.此外,由于概率潜在语义分析通过离散变量(类别变量)进行处理,因此聚类部112针对数值数据亦即过程数据,执行将“1.2”等数值数据转换为“1.0-2.0”等类别值的离散化处理。作为离散化处理,可采用等频分割、等量分割、卡方分箱等。此外,当存在关注的例如相当于目的变量等的变量时,通过对所述变量施加权重,可以执行适于所述变量的特性的聚类。38.图4是说明预处理完毕数据的图。如图4所示,聚类部112通过对图3所示的过程数据执行离散化处理,生成图4所示的预处理完毕数据。例如,聚类部112将过程数据“时间=t1,taga1=15,taga2=110,taga3=1.8···”转换为“时间=t1,taga1=10-20,taga2=100-1150,taga3=1.5-2.5···”。39.随后,聚类部112使用预处理后的数据集通过概率潜在语义分析将过程数据的时间的要素和标签的要素同时聚类,求出各个所属概率(p)。这里,集群数可以根据操作员的领域知识来决定,也可以使用像aic(akaike'sinformationcriterion:赤池信息量准则)一样的用于评价统计模型的优良性的指标来决定集群数。40.另外,这里可以阶段性实施多次聚类。例如,聚类部112根据得到的时间要素的聚类结果(相当于按照每个操作状态分解的结果),将数据在时间方向上分解后,利用概率潜在语义分析对每个分解的数据再次实施聚类,由此能实现同一操作状态(集群)中的相关性高的标签的提取和操作状态的阶段性的细分。41.图5是说明利用概率潜在语义分析进行的聚类结果的一例的图。图5表示了集群数为3的示例。如图5所示,聚类部112通过对预处理完毕数据执行概率潜在语义分析,可以得到提取类似操作期间的行方向的聚类结果(参照图5的(a)),同样,可以得到提取相关标签的纵方向的聚类结果(参照图5的(b))。42.例如,图5的(a)所示的聚类结果,表示以时间确定的各过程数据属于各集群(cluster1,cluster2,cluster3)的概率。更具体地,表示时间t1的过程数据属于cluster1的概率为40%,属于cluster2的概率为30%,属于cluster3的概率为30%。这里,cluster1等表示工厂1的状态,例如相当于稳定运转(正常状态)和异常运转(异常状态)等。43.此外,图5的(b)所示的聚类结果,表示各过程数据的tag属于各集群(cluster1,cluster2,cluster3)的概率。更具体地,表示taga1属于cluster1的概率为30%、属于cluster2的概率为30%、属于cluster3的概率为40%。这里,cluster1等表示工厂1的状态,例如相当于稳定运转和异常运转等。此外,将图5的(b)所示的聚类结果用于后述处理时,优选各tag附加上所取得的时间的平均值和分散值等时间顺序的要素。44.因果关系备选决定部113是根据p&id(pipingandinstrumentationdiagram工艺管道和仪表流程图)、控制回路、监视画面的定义信息等工厂的构成信息,通过考虑现场设备与其他现场设备等的标签之间的相关性,定义为因果的父子关系备选,并向因果模型构筑部114输出的处理部。另外,p&id是将配置在工厂内的配管和设置现场设备的位置等工厂内的构成信息图形化的。45.图6是说明因果关系备选的决定例的图。因果关系备选决定部113考虑基于操作员的领域知识的相关性,像配管的上游和下游的位置关系等一样,将现场设备与其他现场设备等的标签之间的相关性等定义为因果的父子关系备选,并对因果模型构筑部104输出。46.例如图6所示,从设备a取得“taga1,taga2”等,从设备b取得“tagb1,tagb2”等,从设备c取得“tagc1,tagc2”等,从设备d取得“tagd1,tagd2”等。这种情况下,因果关系备选决定部113若根据预先定义的配管信息等,确定设备b和设备c位于设备a的下游、设备d位于设备b和设备c的下游,则决定设备a为父备选,设备b和设备c为子备选,设备d为孙备选。而且,因果关系备选决定部113如图6的(a)所示,生成表示该父子孙关系的数值数据。例如,“-”表示不定义为父子关系的备选,即不包含在学习中的因果探索范围。此外,“1”表示位于上游,“0”表示位于下游。另外,图6的例子中,例示了通过配管连接的因果关系备选,但是仅为例示,并不限于此。例如,可以根据设备的层级、设置位置、设置场所等各种信息确定因果关系备选。此外,成为因果关系备选的设备等,不一定具有多个要素(tag),可以将具有一个要素的设备等设为因果关系的判定对象。47.因果模型构筑部114是采用过程数据收集部111收集的过程数据的记录、聚类部112的分类结果、因果关系备选决定部113的父子关系备选的信息,通过贝叶斯网络构筑工厂1内的各种变量(tag)和环境因子(例如,外部气温等的变化)、集群、目的(例如,品质等)之间的因果模型的处理部。48.例如,因果模型构筑部114根据预处理完毕数据和基于向集群的所属概率进行的聚类结果,制作用于在基于贝叶斯网络的因果模型的学习中使用的学习用数据集。这里,可以将基于向各集群的所属概率进行的聚类结果,反映为数据出现频率而学习。这是因为,贝叶斯网络是将各个变量的关系以有条件概率表示的统计性的概率模型,故这种方法可行。另外,由于这里计算时间优先,所以作为属于概率最高的集群,有意识地将数据的所属决定为“0或1”的情况下(软聚类结果的硬聚类性活用),不一定采用这种方法。49.图7是说明因果模型学习用的学习数据集的生成例1的图。如图7所示,因果模型构筑部114根据时间将预处理完毕数据和聚类结果连结,将联合的数据按照所属概率进行复制。例如,因果模型构筑部114针对时间t1的数据,因属于cluster1的概率为“40%”,所以生成4个表示属于cluster1的“cluster1=1,cluster2=0,cluster3=0”的时间t1的数据。同样,因果模型构筑部114针对时间t1的数据,因属于cluster2的概率为“30%”,所以生成3个表示属于cluster2的“cluster1=0,cluster2=1,cluster3=0”的时间t1的数据。此外,因果模型构筑部114针对时间t1的数据,因属于cluster3的概率为“30%”,所以生成3个表示属于cluster3的“cluster1=0,cluster2=0,cluster3=1”的时间t1的数据。50.图8是说明因果模型学习用的学习数据集的生成例2的图。如图8所示,因果模型构筑部114根据时间将预处理完毕数据和聚类结果连结,将联合的数据按照所属概率对集群进行离散化。例如,因果模型构筑部114针对时间t1的数据,因属于cluster1的概率最高,所以生成表示属于cluster1的“cluster1=1,cluster2=0,cluster3=0”的时间t1的数据。同样,因果模型构筑部114针对时间t2的数据,因属于cluster2的概率最高,所以生成表示属于cluster2的“cluster1=0,cluster2=1,cluster3=0”的时间t2的数据。此外,因果模型构筑部114针对时间t3的数据,因属于cluster3的概率最高,所以生成表示属于cluster3的“cluster1=0,cluster2=0,cluster3=1”的时间t3的数据。51.如图7和图8所述,因果模型构筑部114可以对各数据根据概率来扩展学习用数据。这里,因果模型构筑部114针对各数据,附加用于确定成为目的的工厂1的“品质”的信息。作为一例,针对所述“品质”,稳定状态时设定为“1”,异常状态时设定为“0”。关于所述“品质”的信息,可以和过程数据一起取得,还可以由管理者等设定。52.接下来,因果模型构筑部114以上述的学习用的数据集和由因果关系备选决定部113生成的因果的父子关系备选的信息为基础,执行因果模型的一例亦即贝叶斯网络的结构学习。这里,因果的父子关系备选中,概率性依赖关系较大的节点间由有向图表现,各节点将有条件概率表(conditionalprobabilitytable:cpt)作为定量的信息而保持。另外,作为对操作员有益的信息,因果模型构筑部114将各节点中相当于可控制的标签的节点强调显示。53.图9是说明学习完毕的贝叶斯网络的一例的图。因果模型构筑部114将图7或图8所示的学习用的数据集和图6的(a)所示的因果关系作为学习数据,执行贝叶斯网络的结构学习(训练),生成图9所示的贝叶斯网络。生成的贝叶斯网络包含与目的对应的节点“品质”,与概率潜在语义分析结果对应的各节点“cluster1,cluster2,cluster3”,与说明变量亦即离散化的各传感器值(tag)对应的各节点。另外,与各tag对应的节点包含微分值和积分值等根据传感器值计算的变量。54.这里,与各说明变量对应的各节点亦即各tag中,包含有条件概率表。例如图9所示的“tagc2”,“tagc2”中包含表示发生“40-50”的状态的概率为“20%”,发生“50-60”的状态的概率为“70%”,发生“60-70”的状态的概率为“10%”的概率表。另外,有关贝叶斯网络的结构学习的算法,可以采用公知的手法。此外,图9中,将能由操作员进行值的设定变更的相当于可控制的标签的节点用粗框表示。55.返回图2,分析部115是根据由因果模型构筑部114构筑的因果模型(贝叶斯网络),利用基于对符合各种前提条件的想知道的场景的推断的事后概率等的分析结果,提取概率(影响)大的要素与其状态值、影响(概率)大的路径等的处理部。此外,分析部115是根据分析结果转换为相当于qmm的形式的处理部。56.具体分析部115在由因果模型构筑部114得到的学习完毕贝叶斯网络中,作为想知道的场景对期望的各节点给予证据状态(证据)而进行推断,由此可以求出各节点的事后概率分布。这里,分析部115通过提取事后概率值高的要素,可以求出在本场景中影响大的节点(相当于qmm的管理点)及其状态值(相当于qmm的管理基准)与其概率值。此外,分析部115通过将目的变量作为基点,追溯事后概率值大的父节点,可以求出在该场景中影响大的传播路径。此外,分析部115对有向图进行强调显示,由此可以在视觉上捕捉概率最大路径。而且,作为使操作员更容易理解的形式,分析部115还可以在p&id上模写与贝叶斯网络上的概率最大路径对应的路径和状态值。57.图10是说明将基于贝叶斯网络的推断结果形象化的一例的图。这里,作为前提条件由操作员指定“taga3较低时品质不稳定”。如图10所示,分析部115按照前提条件,将节点“taga3”所具有的有条件概率表中状态最低的“0.5-1.5”的概率值设定为“1”,其他设定为“0”。而且,分析部115将节点“品质”所具有的有条件概率表中“状态”相当于“不稳定”的概率值设定为“1”,将相当于“稳定”的概率值设定为“0”。这样设定证据后,分析部115执行贝叶斯网络并取得推断结果。58.其结果,分析部115通过更新满足前提条件的各个变量(节点)的概率值,确定各节点的条件依赖性。例如,节点“cluster1”的事后概率分布更新为“状态1(所属)、概率值(0.7)”,“状态2(非所属)、概率值(0.3)”,节点“cluster2”的事后概率分布更新为“状态1(所属)、概率值(0.8)”,“状态2(非所属)、概率值(0.2)”。此外,例如节点“tagd3”的事后概率分布更新为“状态(130-140)、概率值(0.2)”,“状态(140-150)、概率值(0.5)”,“状态(150-160)、概率值(0.3)”。59.而后,分析部115通过从目的变量亦即节点“品质”朝向上游方向(贝叶斯网络的上位层级方向)选择相关度高的变量(相关变量)的一例亦即概率值最高的节点,可以确定与前提条件“taga3低时品质不稳定”相关的节点。例如,分析部115确定节点品质、节点“cluster2”、节点“tagd3”、节点“tagb3”、节点“taga1”。60.随后,为了利用期望的前提条件下的推断结果使操作员容易与现有基准比较探讨,分析部115以立即可反映到操作的作为操作员视角的形式生成相当于qmm的信息。图11是说明利用贝叶斯网络的推断而求出的qmm相当信息的提示例的图。如图11所示,分析部115针对在图10中确定的前提条件的影响度较高的各节点,生成图11的(a)所示的相当于qmm的信息和图11的(b)所示的比较信息并显示。61.图11的(a)所示的相当于qmm的信息是包含“管理点、管理基准、概率值、遵守度”的信息。这里,“管理点”代表与图10中确定的前提条件相关性较高的各节点。“管理基准”表示上述推断的结果使概率值成为最高的状态,“概率值”是其概率值。“遵守度”是程度信息的一例,是管理基准的值在收集完毕的全过程数据中所含的比例。62.图11的(b)所示的比较信息,是包含“现有qmm的管理基准、数据整体的平均值、数据整体的频度最高值、数据整体的最大值、数据整体的最小值、数据整体的标准偏差”的信息。这里,“现有qmm的管理基准”是预先设定的基准值。“数据整体的平均值、数据整体的频度最高值、数据整体的最大值、数据整体的最小值、数据整体的标准偏差”是收集完毕的全过程数据中的相应数据的统计量。63.以上述示例说明,分析部115针对判定为前提条件的影响度较高的taga1,作为“管理基准,概率值,遵守度”,确定或算出“20-23℃,74%,88%”等并显示,作为“现有qmm的管理基准,数据整体的平均值,数据整体的频度最高值,数据整体的最大值,数据整体的最小值,数据整体的标准偏差”,确定或算出“〇-〇℃,〇℃,〇℃,〇℃,〇℃,〇℃”等并显示。另外,这里虽进行了简略标记,但将数值代入〇中。64.这样,分析部115可以定义“遵守度”,定量地表现在对象期间中实际以多大概率(频率)遵守管理基准。另外,分析部115针对提取的节点(管理点)及其状态值(管理基准),作为与分析对象数据整体的倾向的比较信息,分别一并输出数据整体的平均值、频度最高值、最大值、最小值、标准偏差等基本统计量。此外,分析部115在实际有在工厂1中参照的现有qmm的情况下,作为与以往的比较信息,一并提示其内容。65.返回图2,显示部116是显示输出各种信息的处理部。具体地,显示部116显示学习完毕贝叶斯网络。此外,显示部116将基于上述的场景(各种前提条件和假设)中的推断结果的,影响较大的节点及其状态值和概率值、概率最大路径、相当于qmm的信息,向工厂中的过程运转的管理者和操作员等用户视觉性提示。这样,判断用户对本结果是否可信,即根据过程变动的机制和已知的见解,判断用户是否接受结果和说明,是否具有妥当性。66.(处理流程)图12是说明实施方式1的处理流程的流程图。如图12所示,由包含管理者和操作员等的用户指示分析处理的开始后,过程数据收集部111从历史数据库12取得过程数据(s101)。67.接下来,聚类部112针对收集的过程数据,执行离散化、缺失值和离群值等的预处理(s102),针对预处理后的数据利用概率潜在语义分析将过程数据的时间的要素和标签的要素同时执行聚类(s103)。例如,过程数据有时存在未包含的tag。这种情况下,聚类部112在设定平均值和预先指定的值等的基础上执行聚类。68.而且,因果关系备选决定部113根据输出过程数据所含的“tag”的设备等的父子关系,决定因果关系备选(s104)。69.接下来,因果模型构筑部114根据在s102得到的预处理完毕数据、在s103得到的基于向各集群的所属概率的聚类结果,生成基于贝叶斯网络的因果模型的学习用数据集(s105)。随后,因果模型构筑部114以在s105得到的学习用的数据集和在s104得到的因果的父子关系备选的信息为基础,进行贝叶斯网络的结构学习(s106)。70.而且,分析部115在由s106得到的学习完毕贝叶斯网络中,作为想要知道的场景,对期望的各节点给予证据状态并执行推断(s107)。此外,分析部115使用期望的前提条件下的推断结果,生成图11所示的相当于qmm的信息(s108)。其结果,显示部116可以执行推断结果和相当于qmm的信息等的显示输出。71.这里,判断用户是否接受本结果(说明)(s109)。这里,信息处理装置10收到用户接受的输入的情况下(s109:是),结束一系列的分析。另一方面,信息处理装置10收到用户不接受的输入的情况下(s109:否),返回s103,适当变更分析对象和聚类条件,变更s104的父子关系备选的假设,并再次执行分析。72.(效果)如上所述,信息处理装置10活用概率潜在语义分析和贝叶斯网络,从包含工厂1中的产品的生产4要素等的环境变化的复杂操作数据,通过机器学习提取影响品质等生产管理指标的要因。此外,信息处理装置10通过将机器学习结果转换为使操作员容易考察和理解的形式并提示,可以辅助操作中的操作员迅速决策。73.此外,信息处理装置10在与各种物理现象和环境变化的影响错综复杂的多维过程数据中,通过回避所谓纬度的诅咒而分类为类似的操作状态和相关的标签,使情况简单化,并分析情况的复合要因,从而提高结果的解释性。74.此外,信息处理装置10通过将基于所属概率的软聚类结果应用于模型学习,即使在与各种物理现象的关系错综复杂的过程数据中,也可以实现要因分析的精度提高。此外,信息处理装置10通过将基于聚类结果、标签之间的物理相关性、已知的环境变化、操作员的领域见解和经验的信息导入到模型中,可形成根植于反应过程的分析,能够构筑可靠性和接受度较高的模型。75.此外,信息处理装置10根据符合各种前提条件和假设的想要知道的场景中的推断结果,将影响较大的节点和传播路径及可控制标签可视化,由此可以有效找出在控制中效果较高的要素。此外,信息处理装置10以操作员视角的相当于qmm的形式进行提示,操作员能与现有条件进行比较,从而能够迅速把握现状以及发掘新的课题,并且作为新的操作条件可以活用本结果。76.可是,在过程数据中的趋势分析和相关分析中,多数情况下是包罗性分析,如果再包括对结果的解释,则需要耗费非常大量的时间。此外,在深度学习等一般机器学习模型中,考虑到若说明变量(特征量)多,则解释性变差,还会成为学习时间的增加、过度拟合导致的通用性降低的要因。77.在此,实施方式2使用实施方式1的结果,说明实现随后的各种分析和机器学习模型的精度提高的信息处理装置10。图13是代表实施方式2的信息处理装置10的功能结构的功能框图。这里,说明与实施方式1不同的功能亦即趋势分析部117和预测部118。78.趋势分析部117是使用由分析部115得到的分析结果来执行趋势分析和相关分析的处理部。预测部118是使用由分析部115得到的分析结果生成机器学习模型并使用生成的机器学习模型预测工厂1的状态和各tag的值等的处理部。79.图14是说明实施方式2的处理的图。如图14所示,分析部115通过执行在实施方式1中说明的处理,针对向各种说明变量提供证据时的目的变量进行灵敏度分析。即,分析部115通过计算目的变量的事后概率值、事前概率与事后概率的差值等,可以提取对目的变量的影响力较大的变量(tag:标签)。这里,表示了作为重要标签提取了“tagd1,cluster2,taga1”的示例。80.而且,趋势分析部117参照分析结果,使用分析的元数据亦即过程数据根据重要标签重点实施趋势分析和相关分析。若用上述例说明,则趋势分析部117使用分别相当于重要标签“tagd1,cluster2,taga1”的过程数据,计算各重要度标签的时间顺序的位移、各重要标签的相关度等。81.其结果,由于可以预先提取针对目的的重要标签,根据这些重点推进分析,能够根据需要局部深度挖掘,因此可期待分析效率的提高。82.预测部118将基于分析结果的重要标签用作深度学习等一般机器学习模型的特征量,执行模型学习。若用上述例说明,则预测部118取得重要标签“tagd1,cluster2,taga1”各自的过程数据和当时的品质。即,预测部118生成“tagd1的过程数据,品质”等。而且,预测部118通过执行将该数据“tagd1的过程数据,品质”中的“tagd1的过程数据”设为说明变量、将“品质”设为目的变量的机器学习,生成品质预测模型。随后,预测部118若取得最新的过程数据,则将这最新的过程数据输入品质预测模型,取得工厂1的品质的预测结果,向操作员等显示输出。83.这样,预测部118可以尽量事前省略对目的变量不产生影响的特征量或者影响较小的特征量。其结果,能够预先提取对目的变量影响力较大的重要特征量(标签和集群等),通过将这些作为特征量构筑预测模型,可期待分析效率的提高。84.以上说明了本发明的实施方式,本发明在上述的实施方式以外还可以通过各种不同的方式实施。85.(因果关系)例如,图6所示的因果关系仅为一例,还可以追加其他要素,也可以增减层级。图15是说明因果关系的应用例的图。如图15所示,例如作为孙备选,还可以将有关设备e的温度的信息“tagm”追加到因果关系(父子关系)。作为另一例,还可以追加外部气温等作为图6所示的全部设备的父备选。这样,通过追加新的要素,可以增加成为贝叶斯网络的学习对象的维数,可以实现贝叶斯网络的精度提高。另外,不限于温度,例如可以追加基于外部气温、人的操作介入或设备保养的有无等可能产生影响的环境的变化、夜间品质变差的情况较多等操作员等的经验的因果关系备选。86.(数值等)上述实施方式采用的过程数据的种类、tag数、集群数、阈值、数据数量等仅为一例,可以任意变更。此外,作为目的的一例,以“品质”为例进行了说明,但是不限于此。例如,工厂1内的故障种类和工厂1的装置x的状态等,可设定更具体的目的,还可以设定操作员的错误等人为要因。87.此外,贝叶斯网络是因果模型的一例,还可以采用各种图形化系的因果模型和概率。另外,贝叶斯网络等的因果模型中的各节点(各tag)与工厂1的操作有关的多个变量对应。此外,根据推断结果确定为概率值最高的各变量与依赖于前提条件的相关变量对应。此外,贝叶斯网络的学习和推断能够以一定期间定期执行,还可以利用批处理等在一天的操作后执行。此外,深度学习也是机器学习的一例,可以采用神经网络、深度学习、支持向量机等各种算法。88.(系统)上述文字中和附图中所示的包括处理步骤、控制步骤、具体的名称、各种数据和参数的信息,除了特别记载的情况以外,都可以任意变更。此外,图6所示的各设备是结构设备的一例。此外,图11的显示形式仅为一例,能够任意变更为下拉形式等,比较信息的选择也可以任意变更。此外,信息处理装置10还可以从工厂1直接取得工厂数据。89.此外,图示的各装置的各结构要素为功能概念性要素,物理上的结构不一定如图所示。即,各装置的分散和综合的具体方式不限于图示。即,可以根据各种负荷和使用状况等,将其全部或一部分以任意的单位在功能或物理上分散或统合。90.而且,由各装置执行的各处理功能,其全部或任意的一部分通过cpu和由所述cpu分析执行的程序实现,或者,可作为基于布线逻辑的硬件实现。91.(硬件)接下来,说明信息处理装置10的硬件结构例。图16是说明硬件结构例的图。如图16所示,信息处理装置10具有通信装置10a、hdd(harddiskdrive)10b、存储器10c、处理器10d。此外,图16所示的各部分通过总线等相互连接。92.通信装置10a为网络接口卡等,与其他服务器进行通信。hdd10b存储实现图2所示的功能的程序和db。93.处理器10d通过从hdd10b等读出用于执行与图2所示的各处理部同样的处理的程序,在存储器10c中展开,使执行图2等中说明的各功能的进程工作。例如,该进程执行与信息处理装置10所具有的各处理部同样的功能。具体地,处理器10d从hdd10b等读出与过程数据收集部111、聚类部112、因果关系备选决定部113、因果模型构筑部114、分析部115、显示部116等具有同样的功能的程序。而且,处理器10d执行的进程执行与过程数据收集部111、聚类部112、因果关系备选决定部113、因果模型构筑部114、分析部115、显示部116等同样的处理。94.这样,信息处理装置10通过读出程序并执行,作为执行分析方法的信息处理装置而动作。此外,信息处理装置10还可以由介质读取装置从记录介质读出上述程序,通过执行读出的上述程序,实现与上述的实施例同样的功能。另外,其他实施例中的程序不限于由信息处理装置10执行。例如,其他计算机或服务器执行程序时,以及它们联动执行程序的情况下,也可以同样应用本发明。95.所述程序可以借助互联网等网络来分发。此外,所述程序可以记录在硬盘、软盘(fd)、cd-rom、mo(magneto-opticaldisk)、dvd(digitalversatiledisc)等计算机可读记录介质中,由计算机从记录介质读出并执行。附图标记说明96.10信息处理装置100通信部101存储部110控制部111过程数据收集部112聚类部113因果关系备选决定部114因果模型构筑部115分析部116显示部当前第1页12当前第1页12
技术特征:
1.一种分析方法,其特征在于,计算机执行下述处理:取得在对具有与工厂的操作有关的多个变量的因果模型提供前提条件时的推断结果,根据所述推断结果从所述多个变量确定依赖于所述前提条件的相关变量,针对所述相关变量,显示通过所述推断结果得到的与所述相关变量的状态有关的信息以及在所述工厂中产生的工厂数据中符合所述相关变量的工厂数据的统计量。2.根据权利要求1所述的分析方法,其特征在于,作为与所述相关变量的状态有关的信息,所述显示的处理显示通过所述推断结果得到的条件和概率值,以及对所述条件在所述工厂的操作中被遵守的程度进行定量表示的程度信息。3.根据权利要求1或2所述的分析方法,其特征在于,所述计算机执行下述处理:收集从所述工厂输出的包含所述多个变量的多个过程数据,执行将所述多个过程数据按照所述工厂的运转状态进行分类的聚类,使用采用所述过程数据和所述聚类的结果的学习数据,执行所述因果模型的结构学习。4.根据权利要求3所述的分析方法,其特征在于,在所述执行的处理中,根据构成所述工厂的结构设备的相关性,确定所述结构设备的父子关系,将所述过程数据、所述聚类的结果和所述父子关系用于所述学习数据,执行所述因果模型的结构学习。5.根据权利要求4所述的分析方法,其特征在于,在所述执行的处理中,使用所述学习数据和表示所述工厂的状态的目的变量,执行贝叶斯网络的结构学习,在所述取得的处理中,将指定成为目的的所述变量和所述工厂的状态的所述前提条件输入到学习完毕的贝叶斯网络进行推断,取得所述推断结果,在所述确定的处理中,在所述贝叶斯网络内的各节点所属的各集群中,将通过所述推断得到的概率值最高的节点确定为所述相关变量,在所述显示的处理中,针对所述相关变量,将通过所述推断结果得到的条件、概率值、所述程度信息以及所述统计量以可比较的方式显示。6.一种分析程序,其特征在于,使计算机执行下述处理:取得在对具有与工厂的操作有关的多个变量的因果模型提供前提条件时的推断结果,根据所述推断结果从所述多个变量确定依赖于所述前提条件的相关变量,针对所述相关变量,显示通过所述推断结果得到的与所述相关变量的状态有关的信息以及在所述工厂中产生的工厂数据中符合所述相关变量的工厂数据的统计量。7.一种信息处理装置,其特征在于包括:取得部,取得在对具有与工厂的操作有关的多个变量的因果模型提供前提条件时的推断结果;确定部,根据所述推断结果从所述多个变量确定依赖于所述前提条件的相关变量;以
及显示部,针对所述相关变量,显示通过所述推断结果得到的与所述相关变量的状态有关的信息以及在所述工厂中产生的工厂数据中符合所述相关变量的工厂数据的统计量。
技术总结
本发明提供分析方法、分析程序和信息处理装置,信息处理装置取得在对具有与工厂的操作有关的多个变量的因果模型提供前提条件时的推断结果。而且,信息处理装置根据推断结果从多个变量确定依赖于前提条件的相关变量。随后,信息处理装置针对相关变量,显示通过推断结果得到的与相关变量的状态有关的信息以及在工厂中产生的工厂数据中符合相关变量的工厂数据的统计量。厂数据的统计量。厂数据的统计量。
技术研发人员:虎井总一朗 千代田真一 大原健一
受保护的技术使用者:横河电机株式会社
技术研发日:2021.12.06
技术公布日:2023/9/12
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/