一种多目标约束下的生产业务流程优化方法
未命名
09-08
阅读:94
评论:0

1.本发明涉及业务流程管理技术领域,具体涉及流程模型间的差异检测和优化方法。
背景技术:
2.随着科技的进步和制造业的发展,制造企业面临着产品成本压缩、产品更迭速度加快、产品质量提高以及服务质量改进等方面的考验,这对生产业务流程的执行提出了费用更低、用时更短、资源利用率更优等更高要求。因此,优化生产业务流程,以帮助企业持续增加利润、提高核心竞争力,促进传统制造企业的智能升级,是制造企业亟待解决的重要问题。
3.传统的生产业务流程优化方法都是以手动或半自动化的方式对流程进行优化,即流程优化专家凭借自己的经验和专业知识找出流程中需要优化的部分并人为对其进行优化。然而随着市场需求的变化,流程已经变得越来越复杂,即节点种类不断增加,控制流结构变得日益复杂。采用手动或半自动化的方法对流程进行改进,不仅耗时耗力,花费高,而且容易出错。由此,迫切需要一种自动化的技术来对生产业务流程进行优化。
技术实现要素:
4.为了能够自动、高效、准确、快速地对生产业务流程进行优化,本发明提出一种多目标约束下的生产业务流程优化方法。首先,对生产业务流程的两个不同版本流程进行结构和行为两方面的差异检测,固定相同部分不变,改变差异部分的组合,构建两个不同版本流程间所有可能的候选优化流程,对每个候选优化流程引入强化学习的actor-critic算法计算最优资源分配,设计候选优化流程的执行时间和质量衡量标准,找出执行时间小于给定执行时间且执行费用最小的候选优化流程作为最终的优化流程,打破现有方法手动或半自动化进行流程优化,耗时长、费用高且容易出错的局限性,对现有的流程资源进行自动化最优分配,极大地节省了流程优化的时间和费用,提高了实际的可用性。
5.一种多目标约束下的生产业务流程优化方法,包括以下步骤:
6.(1)给定生产业务流程的两个不同版本v1和v2,检测v1和v2之间的n个差异。
7.(2)若生产业务流程的两个不同版本v1和v2之间共有n个差异,连接v1和v2的相同部分和所有位置上的差异部分组合,可以建立2
n-2个候选优化流程,其中减掉的2个流程是v1和v2;
8.(3)给定资源、时间和费用约束,构建每个候选优化流程的最优资源分配的计算模型,即考虑使用总数量分别为a、b和c的机器设备、劳动力、原材料三种资源,用于分配给候选优化流程中的n个任务节点,若第i个任务节点需要使用这三种资源的数量分别为xi、yi和zi,执行第i个任务的费用和时间分别为ci(xi,yi,zi)、ti(xi,yi,zi),应如何分配这些资源使得该候选优化流程的执行时间在小于给定时间t的约束下总费用最小,此问题的模型为:
[0009][0010]
(4)引入强化学习中的actor-critic算法,对步骤(3)中的计算模型进行求解,得到每个候选优化流程的最优资源分配,actor-critic算法包含三个主要元素,即执行者(actor)、批评者(critic)和环境。
[0011]
(5)建立候选优化流程的执行质量计算模型,在所有候选优化流程中选出执行质量最佳且优于给定生产业务流程执行质量的流程作为最优流程。
[0012]
进一步,步骤(1)由以下步骤组成:
[0013]
(1.1)结构差异检测,即找出只出现在一个流程中但不出现在另一个流程的结构片段或节点;
[0014]
(1.2)行为差异检测,即检测生产业务流程的两个不同版本v1和v2中映射的节点间执行关系的变化,执行关系类型变化包括顺序、选择、并行、循环四种。
[0015]
进一步,所述的步骤(4)由以下步骤组成:
[0016]
(4.1)给定候选优化流程的开始节点s,执行者以p(s,a,b,c)的概率随机选择资源a、b和c;
[0017]
(4.2)资源a、b和c的选定导致环境状态发生转移,并进入下一节点s',同时环境会得到该生产业务流程的执行时间t、费用m,以及关于执行时间t和费用m的开销c;
[0018]
(4.3)批评者会对执行者所选取的资源做出批评,即判别资源和时间约束条件是否满足,并使用时域差分误差修正价值函数v(s),最后得到误差δ(s)=c(t,m)+γ
·
v(s')-v(s),其中γ是一个将新状态s'的价值函数v(s')映射到当前状态的折中参数;
[0019]
(4.4)执行者更新资源选择策略,使产生更小开销的资源更容易被选中,即p(s,a,b,c)
←
p(s,a,b,c)+ξ
·
δ(s),其中ξ表示步长,δ(s)表示步骤4.3中计算得到的误差;actor-critic算法通过多次迭代,最终保证p(s,a,b,c)收敛到最优值,即节点s选择开销最小、满足约束条件且费用最小的资源。
[0020]
进一步,所述的步骤(5)由以下步骤组成:
[0021]
(5.1)设计执行时间和执行费用的评价函数,将生产业务流程的执行时间和费用分别映射到“非常好”、“比较好”、“一般”、“中等”、“比较差”五个级别;
[0022]
(5.2)引入三角模糊数tfn对:非常好、比较好、一般、中等、比较差,这五个级别进行建模,即每个级别l对应的tfn表示为其中l
l
、lm和lr分别对应l的最小值、中间值和最大值,例如,执行时间“非常好”的tfn为(10,15,20),表示若执行时间在10-20分钟内,则该流程在执行时间方面表现非常好;
[0023]
(5.3)给定候选优化流程的执行时间级别和费用级别设计基于执行时间和费用的生产业务流程执行质量的衡量标准;
[0024]
(5.4)比较所有候选优化流程的执行时间和费用,选出执行时间满足给定执行时间且执行费用最小的候选优化流程作为最终优化流程。
[0025]
本发明的技术构思是:对生产业务流程的两个不同版本进行结构和行为两方面的差异检测,固定相同部分不变,改变差异部分的组合,构建两个版本流程间所有可能的候选优化流程,引入强化学习中的actor-critic算法为每个候选优化流程进行最佳资源分配,设计候选优化流程的执行时间和费用衡量标准,从所有的候选优化流程中选出执行时间满足给定执行时间且执行费用最小的流程作为最佳优化流程。
[0026]
本发明的优点是:打破现有方法手动或半自动化进行流程优化,耗时长、费用高且容易出错的局限性,设计多目标约束下的生产业务流程优化方法,建立生产业务流程在时间、费用和资源约束下的优化模型;引入强化学习中的actor-critic算法求解得到最佳优化流程,以达到更高的执行质量,提高生产业务流程的优化效率;设计候选优化流程的执行质量计算模型,在候选优化流程中找出执行时间满足给定执行时间且执行费用最小的候选优化流程作为最终优化流程。
附图说明
[0027]
图1为本发明的总体流程图;
[0028]
图2为产品加工流程的两个不同版本实例图;
[0029]
图3为产品加工流程的候选优化流程实例图;
[0030]
图4为使用强化学习中的actor-critic算法进行最优资源分配示例图。
具体实施方式
[0031]
以下结合说明书附图,对本发明做进一步描述。
[0032]
如图1,一种多目标约束下的生产业务流程优化方法,该方法包括:
[0033]
(1)给定生产业务流程的两个不同版本v1和v2,检测v1和v2之间的n个差异,具体包括以下步骤:
[0034]
(1.1)结构差异检测,即找出只出现在一个流程中但不出现在另一个流程的结构片段或节点;
[0035]
(1.2)行为差异检测,即检测生产业务流程的两个不同版本v1和v2中映射的节点间执行关系的变化,执行关系类型变化包括顺序、选择、并行、循环四种。
[0036]
(2)若生产业务流程的两个不同版本v1和v2之间共有n个差异,连接v1和v2的相同部分和所有位置上的差异部分组合,可以建立2
n-2个候选优化流程,其中减掉的2个流程是v1和v2;
[0037]
(3)给定资源、时间和费用约束,构建每个候选优化流程的最优资源分配的计算模型,即考虑使用总数量分别为a、b和c的机器设备、劳动力、原材料三种资源,用于分配给候选优化流程中的n个任务节点,若第i个任务节点需要使用这三种资源的数量分别为xi、yi和zi,执行第i个任务的费用和时间分别为ci(xi,yi,zi)、ti(xi,yi,zi),应如何分配这些资源使得该候选优化流程的执行时间在小于给定时间t的约束下总费用最小,此问题的模型为:
[0038][0039]
(4)引入强化学习中的actor-critic算法,对步骤(3)中的计算模型进行求解,得到每个候选优化流程的最优资源分配,actor-critic算法包含三个主要元素,即执行者(actor)、批评者(critic)和环境,其按照下述几个步骤进行,直至收敛:
[0040]
(4.1)给定候选优化流程的开始节点s,执行者以p(s,a,b,c)的概率随机选择资源a、b和c;
[0041]
(4.2)资源a、b和c的选定导致环境状态发生转移,并进入下一节点s',同时环境会得到该生产业务流程的执行时间t、费用m,以及关于执行时间t和费用m的开销c;
[0042]
(4.3)批评者会对执行者所选取的资源做出批评,即判别资源和时间约束条件是否满足,并使用时域差分误差修正价值函数v(s),最后得到误差δ(s)=c(t,m)+γ
·
v(s')-v(s),其中γ是一个将新状态s'的价值函数v(s')映射到当前状态的折中参数;
[0043]
(4.4)执行者更新资源选择策略,使产生更小开销的资源更容易被选中,即p(s,a,b,c)
←
p(s,a,b,c)+ξ
·
δ(s),其中ξ表示步长,δ(s)表示步骤4.3中计算得到的误差;actor-critic算法通过多次迭代,最终保证p(s,a,b,c)收敛到最优值,即节点s选择开销最小、满足约束条件且费用最小的资源。
[0044]
(5)建立候选优化流程的执行质量计算模型,在所有候选优化流程中选出执行质量最佳且优于给定生产业务流程执行质量的流程作为最优流程,具体包括以下步骤:
[0045]
(5.1)设计执行时间和执行费用的评价函数,将生产业务流程的执行时间和费用分别映射到“非常好”、“比较好”、“一般”、“中等”、“比较差”五个级别;
[0046]
(5.2)引入三角模糊数tfn对:非常好、比较好、一般、中等、比较差,这五个级别进行建模,即每个级别l对应的tfn表示为其中l
l
、lm和lr分别对应l的最小值、中间值和最大值,例如,执行时间“非常好”的tfn为(10,15,20),表示若执行时间在10-20分钟内,则该流程在执行时间方面表现非常好;
[0047]
(5.3)给定候选优化流程的执行时间级别和费用级别设计基于执行时间和费用的生产业务流程执行质量的衡量标准;
[0048]
(5.4)比较所有候选优化流程的执行时间和费用,选出执行时间满足给定执行时间且执行费用最小的候选优化流程作为最终优化流程。
[0049]
图2为petri网建模的产品加工流程的两个不同版本,第一个版本流程g1={p,t,e},其中p为库所节点,图中用圆形表示,第一个版本流程g1的库所节点包括p1、p2、p3、p4、p5、p6、p7、p8、p9、p
10
、p
11
、p
12
,t为变迁节点,图中用矩形表示,第一个版本流程g1的变迁节点包括“准备材料”、“拼接”、“焊丝焊”、“石英管绕组”、“电线接头”、“紧固螺钉”、“密封”、“热熔胶胶装”、“组装”、“包装”,e表示边,第一个版本流程g1的边包括“p1→
准备材料”、“准备材料
→
p
2”、“准备材料
→
p
8”、“p2→
拼接”、“拼接
→
p
3”、“拼接
→
p
4”、“p3→
焊丝焊”、“p4→
石英管绕组”、“焊丝焊
→
p
5”、“石英管绕组
→
p
6”、“p5→
电线接头”、“p6→
电线接头”、“电线接头
→
p
7”、“p7→
组装”、“p8→
紧固螺钉”、“p8→
热熔胶胶装”、“紧固螺钉
→
p
9”、“p9→
密封”、“密封
→
p
10”、“热熔胶胶装
→
p
10”、“p
10
→
组装”、“组装
→
p
11”、“p
11
→
包装”、“包装
→
p
12”。g1表示一个产品的加工流程开始于准备材料,材料包括金属和塑料两种:在处理金属材料时,先对金属材料进行拼接,然后同时进行焊丝焊和石英管绕组的操作,最后进行电线接头;在处理塑料材料时,对于需要紧固的材料采用螺钉进行紧固,然后进行密封,对于不需要紧固的材料直接用热熔胶进行胶装。接着,对金属材料和塑料材料进行组装,组装成产品后进行包装。第二个版本g2={p,t,e},包括库所节点p1、p2、p3、p4、p5、p6、p7、p8、p9、p
10
、p
11
、p
12
,变迁节点“准备材料”、“拼接”、“焊丝焊”、“石英管绕组”、“电线接头”、“紧固螺钉”、“密封”、“热熔胶胶装”、“组装”、“包装”,边“p1→
准备材料”、“准备材料
→
p
2”、“准备材料
→
p
8”、“p2→
拼接”、“拼接
→
p
3”、“p3→
焊丝焊”、“p4→
石英管绕组”、“焊丝焊
→
p
5”、“石英管绕组
→
p
5”、“p5→
电线接头”、“电线接头
→
p
7”、“p7→
组装”、“p8→
密封”、“p8→
热熔胶胶装”、“密封
→
p
9”、“p9→
紧固螺钉”、“紧固螺钉
→
p
10”、“热熔胶胶装
→
p
10”、“p
10
→
组装”、“组装
→
p
11”、“p
11
→
包装”、“包装
→
p
12”。g2与g1间的差异共有2个:(1)在g1中“焊丝焊”与“石英管绕组”这两个任务节点是并行执行的,而在g2中这两个任务节点是选择执行的,只执行两者中的一个;(2)在g1中先执行“紧固螺钉”再执行“密封”,然而在g2中先执行“密封”再执行“紧固螺钉”。
[0050]
图3表示产品加工流程的候选优化流程实例图。图2中g1和g2间共有2个差异:固定g1和g2间的相同部分不变,改变差异部分的组合可以得到2
2-2=2个候选优化流程,如图3所示。
[0051]
图4表示使用强化学习中的actor-critic算法对图3中两个候选优化流程进行表1中人员、表2中材料和表3中设备的最优分配。
[0052]
表1产品加工流程的人员分配实例表
[0053][0054]
表2产品加工流程的材料分配实例表
[0055][0056]
表3产品加工流程的设备分配实例表
[0057][0058]
actor-critic算法包含三个主要元素,即执行者、批评者和环境,其按照下述方式进行,直至收敛:(1)给定生产业务流程的开始节点s,执行者以p(s,a,b,c)的概率随机选择人员a、材料b和设备c;(2)人员a、材料b和设备c的选定导致环境状态发生转移,并进入下一节点s',同时环境会得到该生产业务流程的执行时间t、费用m,以及关于执行时间t和费用m的开销c;(3)批评者会对执行者所选取的资源做出“批评”,即判别资源和时间约束条件是否满足,并使用时域差分误差修正价值函数v(s),即δ(s)=c(t,m)+γ
·
v(s')-v(s),这里的γ是一个将新状态s'的价值函数映射到当前状态的折中参数;(4)执行者更新资源选择策略,使产生更小开销的资源更容易被选中,即p(s,a,b,c)
←
p(s,a,b,c)+ξ
·
δ(s)。actor-critic算法通过多次迭代,最终保证p(s,a,b,c)收敛到最优值,即节点s选择开销最小、满足约束条件且费用最小的资源。在最优资源分配下,可以计算得到每个候选优化流程的执行时间和执行费用。
[0059]
表1表示产品加工流程中每个任务节点的人员分配,第一列表示人员,第一行列出了所有的任务节点。第i行(i》1)第j列(j》1)的单元格中有两个数字,分别代表第i位人员执行第j个任务所需要花费的时间和费用,单位分别为“分钟”和“元”。例如,第2行第2列的单元格(15,20)表示王伟准备材料需要15分钟,花费20元。
[0060]
表2表示产品加工流程中每个任务节点的材料分配,第一列表示材料,第一行列出了所有的任务节点。第i行(i》1)第j列(j》1)的单元格中有两个数字,分别代表第j个任务消耗第i个材料所需要花费的时间和费用,单位分别为“分钟”和“元”。例如,第2行第2列的单元格(5,10)表示“准备材料”这个任务用到材料塑料棒,需要花费时间5分钟,花费10元。
[0061]
表3表示产品加工流程中每个任务节点的设备分配,第一列表示设备,第一行列出了所有的任务节点。第i行(i》1)第j列(j》1)的单元格中有两个数字,分别代表第j个任务使用第i个设备所需要花费的时间和费用,单位分别为“分钟”和“元”。例如,第5行第8列的单元格(20,20)表示“紧固螺钉”这个任务使用扳手,需要花费时间20分钟,花费20元。
[0062]
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。
技术特征:
1.一种多目标约束下的生产业务流程优化方法,其特征在于,包括如下步骤:1)给定生产业务流程的两个不同版本v1和v2,检测v1和v2之间的n个差异;2)若生产业务流程的两个不同版本v1和v2之间共有n个差异,连接v1和v2的相同部分和所有位置上的差异部分组合,建立2
n-2个候选优化流程,其中减掉的2个流程是v1和v2;3)给定资源、时间和费用约束,构建每个候选优化流程的最优资源分配的计算模型,即考虑使用总数量分别为a、b和c的机器设备、劳动力、原材料三种资源,用于分配给候选优化流程中的n个任务节点,若第i个任务节点需要使用这三种资源的数量分别为x
i
、y
i
和z
i
,执行第i个任务的费用和时间分别为c
i
(x
i
,y
i
,z
i
)、t
i
(x
i
,y
i
,z
i
),应如何分配这些资源使得该候选优化流程的执行时间在小于给定时间t的约束下总费用最小,此问题的模型为:min(c1(x1,y1,z1)+c2(x2,y2,z2)+
…
+c
n
(x
n
,y
n
,z
n
))4)引入强化学习中的actor-critic算法,对步骤3)中的计算模型进行求解,得到每个候选优化流程的最优资源分配;5)建立候选优化流程的执行质量计算模型,在所有候选优化流程中选出执行质量最佳且优于给定生产业务流程执行质量的流程作为最优流程。2.如权利要求1所述的融合结构和行为特征的生产业务流程节点向量表征方法,其特征在于:步骤1)具体包括以下步骤:1.1)结构差异检测,即找出只出现在一个流程中但不出现在另一个流程的结构片段或节点;1.2)行为差异检测,即检测生产业务流程的两个不同版本v1和v2中映射的节点间执行关系的变化,执行关系类型变化包括顺序、选择、并行、循环四种。3.如权利要求1所述的融合结构和行为特征的生产业务流程节点向量表征方法,其特征在于:步骤4)中actor-critic算法包含三个主要元素,即执行者actor、批评者critic和环境,其按照下述几个步骤进行,直至收敛:4.1)给定候选优化流程的开始节点s,执行者以p(s,a,b,c)的概率随机选择资源a、b和c;4.2)资源a、b和c的选定导致环境状态发生转移,并进入下一节点s',同时环境会得到该生产业务流程的执行时间t、费用m,以及关于执行时间t和费用m的开销c;4.3)批评者会对执行者所选取的资源做出批评,即判别资源和时间约束条件是否满足,并使用时域差分误差修正价值函数v(s),最后得到误差δ(s)=c(t,m)+γ
·
v(s')-v(s),其中γ是一个将新状态s'的价值函数v(s')映射到当前状态的折中参数;4.4)执行者更新资源选择策略,使产生更小开销的资源更容易被选中,即p(s,a,b,c)
←
p(s,a,b,c)+ξ
·
δ(s),其中ξ表示步长,δ(s)表示步骤4.3中计算得到的误差;actor-critic算法通过多次迭代,最终保证p(s,a,b,c)收敛到最优值,即节点s选择开销最小、满
足约束条件且费用最小的资源。4.如权利要求1所述的融合结构和行为特征的生产业务流程节点向量表征方法,其特征在于:步骤5)具体包括以下步骤:5.1)设计执行时间和执行费用的评价函数,将生产业务流程的执行时间和费用分别映射到:非常好、比较好、一般、中等、比较差,五个级别;5.2)引入三角模糊数tfn对:非常好、比较好、一般、中等、比较差,这五个级别进行建模,即每个级别l对应的tfn表示为其中l
l
、l
m
和l
r
分别对应l的最小值、中间值和最大值;5.3)给定候选优化流程的执行时间级别和费用级别设计基于执行时间和费用的生产业务流程执行质量的衡量标准;5.4)比较所有候选优化流程的执行时间和费用,选出执行时间满足给定执行时间且执行费用最小的候选优化流程作为最终优化流程。
技术总结
本发明公开一种多目标约束下的生产业务流程优化方法,该方法包括以下几个步骤:首先对生产业务流程的两个不同版本进行结构和行为两方面的差异检测,固定相同部分不变,改变差异部分的组合,由此构建两个版本流程间所有可能的候选优化流程,然后引入强化学习中的Actor-critic算法为每个候选优化流程进行最佳资源分配,接着设计候选优化流程的执行时间和费用衡量标准,最后从所有的候选优化流程中选出执行时间满足给定执行时间且执行费用最小的流程作为最佳优化流程;本发明的优点是:引入强化学习中的Actor-critic算法求解得到最佳优化流程,以达到更高的执行质量,提高生产业务流程的优化效率。产业务流程的优化效率。产业务流程的优化效率。
技术研发人员:王佳星 卢成梁 范菁 曹斌
受保护的技术使用者:浙江工业大学
技术研发日:2023.05.26
技术公布日:2023/9/6
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
上一篇:多功能电动阀件启闭装置及方法与流程 下一篇:一种电池温度数据的管理方法和系统与流程