地铁突发事件延误时间预测方法、装置及电子设备

未命名 08-14 阅读:113 评论:0


1.本发明涉及公共交通领域,具体涉及一种地铁突发事件延误时间预测方法、装置及电子设备。


背景技术:

2.地铁系统作为城市公共交通的支柱,一旦发生故障,往往会导致对应线路失去大部分运营容量,进而导致地铁站滞留乘客激增,容易发生踩踏挤压事故,有着极大安全隐患。因此在出现地铁系统故障时,需要对故障延迟时间进行预测,并根据预测结果对实施应急决策,对乘客进行疏散分流,以免地铁站滞留乘客过多出现安全隐患。
3.目前现有的对地铁事故延误时间相关的研究方法大致可分为两类:一种是将地铁突发事件延误时间视作随机的不确定性问题,简化为服从某类分布的随机函数;另一种是将地铁突发事件延误时间试作可定的统计问题,从而直接使用历史数据的简单统计结果。然而现有技术对地铁事故延误时间的预测方法中,将延误时间预测简化为随机的不确定性问题或统计问题,均存在着预测结果不准确,且预测的延误时间结果范围较大的技术问题。


技术实现要素:

4.有鉴于此,有必要提供一种地铁突发事件延误时间预测方法、装置及电子设备,用于解决现有技术中,预测时间不准确且结果范围较大的技术问题。
5.为了解决上述问题,本发明提供了一种地铁突发事件延误时间预测方法,包括:
6.获取地铁突发事件历史数据,对所述历史数据预处理得到突发事件数据集,所述突发事件数据集包括延迟时间信息;
7.基于自然断点法对突发事件数据集中延迟时间信息进行分类得到分类标签输入集;
8.基于贝叶斯定理构建初始延误时间预测模型,并将所述分类标签输入集输入所述初始延误时间预测模型进行分类训练,得到训练完备的延误时间预测模型;
9.获取实时突发事件数据,判断所述实时突发事件数据的信息是否完整,若所述突发事件数据的信息完整,基于所述训练完备的延迟时间预测模型预测所述实时突发事件的延误时间。
10.进一步地,突发事件数据集还包括特征簇数据;所述对所述历史数据预处理得到突发事件数据集,包括:
11.提取所述地铁突发事件历史数据中突发事件的故障特征数据,所述故障特征数据包括突发事件的开始时间和结束时间;
12.根据所述开始时间和结束时间确定突发事件的延误时间;
13.基于斯皮尔曼相关系数筛选所述故障特征数据中影响延误时间的故障特征数据;
14.基于聚类算法确定所述故障特征数据的差异性评价值,根据所述差异性评价值将相近子类聚类合并,得到特征簇数据集;
15.将所述特征簇数据集中特征簇数据和对应的延误时间组成突发事件样本,得到突发事件数据集。
16.进一步地,基于斯皮尔曼相关系数筛选所述故障特征数据中影响延误时间的故障特征数据,包括:
17.设置相关性系数阈值,基于斯皮尔曼相关系数确定所述故障特征数据与延迟时间的相关性系数,剔除相关性系数低于相关性系数阈值的故障特征数据后得到所述影响延误时间的故障特征数据。
18.进一步地,基于聚类算法确定所述故障特征数据的差异性评价值,根据所述差异性评价值将相近子类聚类合并,得到特征簇数据集,包括:
19.以故障特征数据作为所述地铁突发事件历史数据的分类标签将地铁突发事件历史数据进行分类得到若干子类;
20.基于单因素方差分析对各子类对应延误时间进行差异性分析得到组间差异和组内差异,并根据所述组间差异和所述组内差异的比值得到差异性评价值;
21.根据两两组别之间的差异性评价值进行聚类合并,得到每种故障特征对应特征簇;
22.以所述特征簇替代所述故障特征,得到特征簇数据集。
23.进一步地,基于自然断点法对突发事件数据集中延迟时间进行分类得到分类标签输入集,包括:
24.设置方差拟合优度阈值;
25.设置分类方式并根据所述分类方式将延误时间划分为若干非空子集;
26.根据突发事件数据集中延误时间确定所述分类方式的方差拟合优度;
27.判断所述方差拟合优度是否满足方差拟合优度阈值条件,若不满足则重新设置分类方式直至所述方差拟合优度满足方差拟合优度阈值,并根据满足方差拟合优度阈值条件的分类方式对所述延迟时间进行分类得到分类标签输入集。
28.进一步地,根据突发事件数据集中延误时间确定所述分类方式的方差拟合优度,包括:
29.根据所述突发事件数据集中延误时间确定突发事件数据集的延误时间平均值和各子集的延误时间平均值;
30.根据所述突发事件数据集的延误时间平均值确定突发事件数据集的延误时间平均值的偏差平方和;
31.根据各子集的延误时间平均值确定各子集的延误时间平均值的偏差平方和,并确定各子集的延误时间平均值的偏差平方和最小值;
32.根据所述突发事件数据集的延误时间平均值的偏差平方和以及所述各子集的延误时间平均值的偏差平方和最小值确定分类方式的方差拟合优度。
33.进一步地,地铁突发事件延误时间预测方法还包括:
34.获取实时突发事件数据,判断突发事件数据的信息是否完整,若所述突发事件数据的信息不完整,根据突发事件数据集构建概率分布模型,基于所述概率分布模型预测所述实时突发事件的延误时间。
35.进一步地,根据突发事件数据集构建概率分布模型,基于所述概率分布模型预测
所述实时突发事件的延误时间,包括:
36.根据所述突发事件数据集确定每种特征簇数据对应延迟时间的概率密度分布函数;
37.根据所述概率密度分布函数并基于正态分布特征得到概率分布模型;
38.根据所述概率分布模型预测实时突发事件的延误时间范围。
39.本发明还提供了一种地铁突发事件延误时间预测装置,包括:
40.数据获取单元,用于获取地铁突发事件历史数据,对所述历史数据预处理得到突发事件数据集,所述突发事件数据集包括特征簇数据和延迟时间;
41.数据分类单元,用于基于自然断点法对突发事件数据集中延迟时间进行分类得到分类标签输入集;
42.模型构建单元,用于基于贝叶斯定理构建初始延误时间预测模型,并将所述分类标签输入集输入所述初始延误时间预测模型进行分类训练,得到训练完备的延误时间预测模型;
43.延误时间预测单元,用于获取实时突发事件数据,判断突发事件数据的信息是否完整,若所述突发事件数据的信息完整,基于所述训练完备的延迟时间预测模型预测所述实时突发事件的延误时间。
44.本发明还提供了一种电子设备,包括存储器和处理器,其中,
45.所述存储器,用于存储程序;
46.所述处理器,与所述存储器耦合,用于执行所述存储器中存储的所述程序,以实现上述任意一项所述的地铁突发事件延误时间预测方法中的步骤。
47.与现有技术相比,采用上述实施例的有益效果是:在本发明提供的地铁突发事件延误时间预测方法中,首先,获取地铁突发事件历史数据,对所述历史数据预处理得到突发事件数据集,所述突发事件数据集包括延迟时间信息;然后基于自然断点法对突发事件数据集中延迟时间信息进行分类得到分类标签输入集;基于贝叶斯定理构建初始延误时间预测模型,并将所述分类标签输入集输入所述初始延误时间预测模型进行分类训练,得到训练完备的延误时间预测模型;最后获取实时突发事件数据,判断所述实时突发事件数据的信息是否完整,若所述突发事件数据的信息完整,基于所述训练完备的延迟时间预测模型预测所述实时突发事件的延误时间。综上,本发明通过自然断点法对突发事件数据集中延迟时间信息进行分类,将延迟时间分类划分为若干范围,并通过构建贝叶斯模型对延迟时间进行预测,以实现得到准确度高,小范围区间的预测延迟时间的技术效果。
附图说明
48.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍,显然,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
49.图1为本发明提供的地铁突发事件延误时间预测方法的实施例流程示意图;
50.图2为本发明图1中步骤s101的实施例流程示意图;
51.图3为本发明提供的地铁突发事件延误时间预测装置的实施例结构示意图;
52.图4为本发明提供的电子设备的实施例结构示意图。
具体实施方式
53.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
54.应当理解,示意图的附图并未按实物比例绘制。本发明中使用的流程图示出了根据本发明的一些实施例实现的操作。应当理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本发明内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
55.附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器系统和/或微控制器系统中实现这些功能实体。
56.在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其他实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其他实施例相结合。
57.图1为本发明提供的地铁突发事件延误时间预测方法的一个实施例的流程示意图,如图1所示,地铁突发事件延误时间预测方法包括:
58.s101、获取地铁突发事件历史数据,对所述历史数据预处理得到突发事件数据集,所述突发事件数据集包括延迟时间信息;
59.s102、基于自然断点法对突发事件数据集中延迟时间信息进行分类得到分类标签输入集;
60.s103、基于贝叶斯定理构建初始延误时间预测模型,并将所述分类标签输入集输入所述初始延误时间预测模型进行分类训练,得到训练完备的延误时间预测模型;
61.s104、获取实时突发事件数据,判断所述实时突发事件数据的信息是否完整,若所述突发事件数据的信息完整,基于所述训练完备的延迟时间预测模型预测所述实时突发事件的延误时间。
62.具体地,在本发明提供的地铁突发事件延误时间预测方法中,首先,获取地铁突发事件历史数据,对所述历史数据预处理得到突发事件数据集,所述突发事件数据集包括延迟时间信息;然后基于自然断点法对突发事件数据集中延迟时间信息进行分类得到分类标签输入集;基于贝叶斯定理构建初始延误时间预测模型,并将所述分类标签输入集输入所述初始延误时间预测模型进行分类训练,得到训练完备的延误时间预测模型;最后获取实时突发事件数据,判断所述实时突发事件数据的信息是否完整,若所述突发事件数据的信息完整,基于所述训练完备的延迟时间预测模型预测所述实时突发事件的延误时间。综上,本发明通过自然断点法对突发事件数据集中延迟时间信息进行分类,将延迟时间分类划分为若干范围,并通过构建贝叶斯模型对延迟时间进行预测,以实现得到准确度高,小范围区间的预测延迟时间的技术效果。
63.在本发明的具体实施例中,如图2所述,步骤s101中对所述历史数据预处理得到突
发事件数据集,包括:
64.s201、提取所述地铁突发事件历史数据中突发事件的故障特征数据,所述故障特征数据包括突发事件的开始时间和结束时间;
65.s202、根据所述开始时间和结束时间确定突发事件的延误时间;
66.s203、基于斯皮尔曼相关系数筛选所述故障特征数据中影响延误时间的故障特征数据;
67.s204、基于聚类算法确定所述故障特征数据的差异性评价值,根据所述差异性评价值将相近子类聚类合并,得到特征簇数据集;
68.s205、将所述特征簇数据集中特征簇数据和对应的延误时间组成突发事件样本,得到突发事件数据集。
69.需要说明的是,在本发明的实施例中,获取地铁突发事件历史数据可以但不限于通过在社交平台模拟用户登录,构建检索界面筛选收集地铁延误事件的相关发帖,解析网页中的有效信息,并将有效信息以文本数据形式进行保存。
70.具体地,在预处理得到突发事件数据集的过程中,由于获取得到的地铁突发事件历史数据往往是一些非结构化的文本数据,首先需要对地铁突发事件历史数据中有效信息进行提取,在具体实施例中,可以通过正则表达式将地铁突发事件历史数据中故障特征数据进行提取,提取得到事故日期、开始时间、结束时间、故障车站、故障路线、故障类型等故障特征数据。并通过结束时间减去开始时间得到突发事件的延误时间。然后进行结构化处理将样本数据格式统一。
71.对于得到的故障特征数据,需要进行预处理,预处理过程首先基于斯皮尔曼相关系数对故障特征数据进行筛选,得到其中对延迟时间有影响的故障特征数据。同时由于故障特征数据中特征分类数过多,且可能存在着部分特征分类中样本数过少。例如故障类型可以分为自然因素、技术因素和人为因素三个大类,其中如技术因素又可以分为车辆故障、信号设备故障、线路设备故障、供电设备故障、站台门故障和其他设备故障等多个小类。因此需要进行采用聚类算法将相近子类聚类合并得到特征簇。并将得到的特征簇数据和对应的延误时间组成突发事件样本,得到突发事件数据集。
72.在本发明的具体实施例中,基于斯皮尔曼相关系数筛选所述故障特征数据中影响延误时间的故障特征数据,包括:
73.设置相关性系数阈值,基于斯皮尔曼相关系数确定所述故障特征数据与延迟时间的相关性系数,剔除相关性系数低于相关性系数阈值的故障特征数据后得到所述影响延误时间的故障特征数据。
74.具体地,对于提取得到故障特征数据,以其他故障特征数据作为自变量,以延迟时间作为因变量,对自变量和因变量之间通过斯皮尔曼相关性系数进行相关性分析,将相关性系数低于相关性系数阈值的故障特征数据剔除,筛选出对延迟时间具有显著影响的故障特征。相关性系数ρ的计算公式如下:
[0075][0076]
其中,xi是自变量的第i个元素,是自变量中所有元素的均值,yi是因变量中的第
i个元素,是因变量中所有元素的均值。
[0077]
在本发明的具体实施例中,基于聚类算法确定所述故障特征数据的差异性评价值,根据所述差异性评价值将相近子类聚类合并,得到特征簇数据集,包括:
[0078]
以故障特征数据作为所述地铁突发事件历史数据的分类标签将地铁突发事件历史数据进行分类得到若干子类;
[0079]
基于单因素方差分析对各子类对应延误时间进行差异性分析得到组间差异和组内差异,并根据所述组间差异和所述组内差异的比值得到差异性评价值;
[0080]
根据两两组别之间的差异性评价值进行聚类合并,得到每种故障特征对应特征簇;
[0081]
以所述特征簇替代所述故障特征,得到特征簇数据集。
[0082]
具体地,在聚类合并的过程中,对于筛选后得到的每种故障特征,以故障特征数据作为分类标签将地铁突发事件历史数据进行分类得到若干子类。计算各个子类对应的延迟时间的平均数,将各子类的平均数从大到小排列,首先将最大平均值的子类标记为第一特征簇。并根据该子类的延迟时间的平均值和其他各个子类对应的延迟时间计算得到其他各个子类的组内差异以及其他各个子类与该子类的组间差异,组间差异用于体现子类组别之间的差异,组内差异用于体现随机误差的大小,并以组间差异和组内差异的比值f作为差异性评价值来判断两个子类组别之间的差异性大小。差异性评价值计算公式如下:
[0083][0084]
其中,n为样本总数,即m
×
n,n-m为组内方差的自由度,m-1为组间方差的自由度,为第i组内均值,为样本总平均值,x
ij
为第i组的第j个样本。
[0085]
将得到的各子类与该子类的差异性评价值从小到大依次比较,凡是差异性评价值变化不显著的,均合并为第一特征簇,直至出现差异性评价值变化显著的子类。并将剩下子类重复上述过程得到第二特征簇,以此类推直至所有子类划分完毕,得到该故障特征的特征簇数据。并依次对每种故障特征进行聚类得到特征簇数据集。
[0086]
例如,对于故障时间段这一故障特征,按照故障时间段数据,从5:00-6:00、6:00-7:00、

、到23:00-24:00划分为多个子类,从12:00-13:00开始创建第一时间簇,通过计算差异性评价值可得到12:00-13:00、15:00-16:00、17:00-18:00、20:00-21:00和22:00-23:00这几个子类之间差异性评价值变化不显著,那么就可以将这几个子类划分为第一时间簇,并重复划分过程依次类推直至所有子类划分完毕,得到时间簇数据。
[0087]
本发明通过对各个故障特征的子类聚类合并为故障特征簇,有效地减少了子类划分数量,优化模型预测的计算效率并提升样本数较少的故障特征的预测结果精确度。
[0088]
在本发明的具体实施例中,基于自然断点法对突发事件数据集中延迟时间进行分类得到分类标签输入集,包括:
[0089]
设置方差拟合优度阈值;
[0090]
设置分类方式并根据所述分类方式将延误时间划分为若干非空子集;
[0091]
根据突发事件数据集中延误时间确定所述分类方式的方差拟合优度;
[0092]
判断所述方差拟合优度是否满足方差拟合优度阈值条件,若不满足则重新设置分
类方式直至所述方差拟合优度满足方差拟合优度阈值,并根据满足方差拟合优度阈值条件的分类方式对所述延迟时间进行分类得到分类标签输入集。
[0093]
在本发明的具体实施例中,根据突发事件数据集中延误时间确定所述分类方式的方差拟合优度,包括:
[0094]
根据所述突发事件数据集中延误时间确定突发事件数据集的延误时间平均值和各子集的延误时间平均值;
[0095]
根据所述突发事件数据集的延误时间平均值确定突发事件数据集的延误时间平均值的偏差平方和;
[0096]
根据各子集的延误时间平均值确定各子集的延误时间平均值的偏差平方和,并确定各子集的延误时间平均值的偏差平方和最小值;
[0097]
根据所述突发事件数据集的延误时间平均值的偏差平方和以及所述各子集的延误时间平均值的偏差平方和最小值确定分类方式的方差拟合优度。
[0098]
具体地,对于延迟时间数据x1,x2,

,xn,可分为k个非空子集,共有种分类方式。对于其中任意一种分类方式,按照分类方式将延迟时间划分为若干非空子集,首先计算延误时间的平均值和各子集的平均值
[0099]
然后计算平均值的偏差平方和(sum of squared deviations from the array mean,简称sdam):
[0100][0101]
迭代每个子集得到各子集的延误时间平均值的偏差平方和(sum of squared deviations from the class means,简称sdcm),并找出最小值:
[0102][0103][0104]
其中,lk为所有子集集合,k为所有子集数,是某一子集内所有的数据集合,t为固定的分类数。
[0105]
最后计算方差拟合优度(gvf):
[0106][0107]
其中,gvf的值在0-1之间,1表示拟合极好,0表示拟合极差。
[0108]
在具体实施例中,方差拟合优度阈值设置为0.95,对种分类方式,逐一对每种分类方式的方差拟合优度计算,直达其值达到0.95时终止,得到满足条件的分类方式,根据分类方式对延迟时间进行分类得到分类标签输入集。并通过分类标签输入集训练基于贝叶斯定理构建的初始延误时间预测模型,通过延误时间预测模型预测实时突发事件的延误时间。
[0109]
在本发明的具体实施例中,地铁突发事件延误时间预测方法还包括:
[0110]
获取实时突发事件数据,判断突发事件数据的信息是否完整,若所述突发事件数
据的信息不完整,根据突发事件数据集构建概率分布模型,基于所述概率分布模型预测所述实时突发事件的延误时间。
[0111]
具体地,由于实时突发事件数据可能存在信息不完整的情况,例如还未排查得到具体故障类型。此时无法通过延误时间预测模型对突发事件的延误时间进行预测,因此需要建立概率分布模型,并基于概率分布模型预测突发事件的延误时间。
[0112]
在本发明的具体实施例中,根据突发事件数据集构建概率分布模型,基于所述概率分布模型预测所述实时突发事件的延误时间,包括:
[0113]
根据所述突发事件数据集确定每种特征簇数据对应延迟时间的概率密度分布函数;
[0114]
根据所述概率密度分布函数并基于正态分布特征得到概率分布模型;
[0115]
根据所述概率分布模型预测实时突发事件的延误时间范围。
[0116]
具体地,对于突发事件数据集中每种特征簇对应延迟时间的样本集x,包含样本为x1,x2,

,x
n-1
,xn,则x的概率密度函数可表示为:
[0117][0118][0119][0120]
其中μ为lnx的均值,σ为lnx的标准差。
[0121]
则延迟时间样本集服从对数正态分布:
[0122]
lnx~n(μ,σ2)
[0123]
根据正态分布的性质,可以得到延迟时间范围有68.26%的概率为(e
μ-σ
,e
μ+σ
),有95.44%的概率为(e
μ-2σ
,e
μ+2σ
)。
[0124]
并根据实时突发事件数据已有的故障特征数据,判断故障特征数据属于哪个特征簇,基于概率模型得到预测延误时间范围。
[0125]
为了更好地实施本发明实施例中的地铁突发事件延误时间预测方法,在地铁突发事件延误时间预测方法的基础上,本发明还提供了一种地铁突发事件延误时间预测装置300,如图3所示,包括:
[0126]
数据获取单元301,用于获取地铁突发事件历史数据,对所述历史数据预处理得到突发事件数据集,所述突发事件数据集包括特征簇数据和延迟时间;
[0127]
数据分类单元302,用于基于自然断点法对突发事件数据集中延迟时间进行分类得到分类标签输入集;
[0128]
模型构建单元303,用于基于贝叶斯定理构建初始延误时间预测模型,并将所述分类标签输入集输入所述初始延误时间预测模型进行分类训练,得到训练完备的延误时间预测模型;
[0129]
延误时间预测单元304,用于获取实时突发事件数据,判断突发事件数据的信息是否完整,若所述突发事件数据的信息完整,基于所述训练完备的延迟时间预测模型预测所述实时突发事件的延误时间。
[0130]
上述实施例提供的地铁突发事件延误时间预测装置300可实现上述的地铁突发事件延误时间预测方法实施例中描述的技术方案,上述各模块或单元具体实现的原理可参见上述地铁突发事件延误时间预测方法实施例中的相应内容,此处不再赘述。
[0131]
基于地铁突发事件延误时间预测方法本发明还提供了一种电子设备400,如图4所示,图4为本发明提供的电子设备一实施例的结构示意图,电子设备400包括处理器401、存储器402及存储在存储器402并可在处理器401上运行的计算机程序,处理器401执行程序时,实现如上所述的地铁突发事件延误时间预测方法。
[0132]
作为优选的实施例,上述电子设备还包括显示器403,用于显示处理器401执行如上所述地铁突发事件延误时间预测方法过程。
[0133]
其中,处理器401可能是一种集成电路芯片,具有信号的处理能力。上述的处理器401可以是通用处理器,包括中央处理器(central processing unit,cpu)、网络处理器(network processor,np)等;还可以是数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器也可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0134]
其中,存储器402可以是,但不限于,随机存取存储器(random access memory,ram),只读存储器(read only memory,rom),安全数字(secure digital,sd卡),闪存卡(flash card)等。其中,存储器402用于存储程序,所述处理器401在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流程定义的方法可以应用于处理器401中,或者由处理器401实现。
[0135]
其中,显示器403可以是led显示屏,液晶显示器或触控式显示器等。显示器403用于显示在电子设备400的各种信息。
[0136]
可以理解的是,图4所示的结构仅为电子设备400的一种结构示意图,电子设备400还可以包括比图4所示更多或更少的组件。图4中所示的各组件可以采用硬件、软件或其组合实现。
[0137]
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。

技术特征:
1.一种地铁突发事件延误时间预测方法,其特征在于,包括:获取地铁突发事件历史数据,对所述历史数据预处理得到突发事件数据集,所述突发事件数据集包括延迟时间信息;基于自然断点法对突发事件数据集中延迟时间信息进行分类得到分类标签输入集;基于贝叶斯定理构建初始延误时间预测模型,并将所述分类标签输入集输入所述初始延误时间预测模型进行分类训练,得到训练完备的延误时间预测模型;获取实时突发事件数据,判断所述实时突发事件数据的信息是否完整,若所述突发事件数据的信息完整,基于所述训练完备的延迟时间预测模型预测所述实时突发事件的延误时间。2.根据权利要求1所述地铁突发事件延误时间预测方法,其特征在于,所述突发事件数据集还包括特征簇数据;所述对所述历史数据预处理得到突发事件数据集,包括:提取所述地铁突发事件历史数据中突发事件的故障特征数据,所述故障特征数据包括突发事件的开始时间和结束时间;根据所述开始时间和结束时间确定突发事件的延误时间;基于斯皮尔曼相关系数筛选所述故障特征数据中影响延误时间的故障特征数据;基于聚类算法确定所述故障特征数据的差异性评价值,根据所述差异性评价值将相近子类聚类合并,得到特征簇数据集;将所述特征簇数据集中特征簇数据和对应的延误时间组成突发事件样本,得到突发事件数据集。3.根据权利要求2所述地铁突发事件延误时间预测方法,其特征在于,所述基于斯皮尔曼相关系数筛选所述故障特征数据中影响延误时间的故障特征数据,包括:设置相关性系数阈值,基于斯皮尔曼相关系数确定所述故障特征数据与延迟时间的相关性系数,剔除相关性系数低于相关性系数阈值的故障特征数据后得到所述影响延误时间的故障特征数据。4.根据权利要求2所述地铁突发事件延误时间预测方法,其特征在于,所述基于聚类算法确定所述故障特征数据的差异性评价值,根据所述差异性评价值将相近子类聚类合并,得到特征簇数据集,包括:以故障特征数据作为所述地铁突发事件历史数据的分类标签将地铁突发事件历史数据进行分类得到若干子类;基于单因素方差分析对各子类对应延误时间进行差异性分析得到组间差异和组内差异,并根据所述组间差异和所述组内差异的比值得到差异性评价值;根据两两组别之间的差异性评价值进行聚类合并,得到每种故障特征对应特征簇;以所述特征簇替代所述故障特征,得到特征簇数据集。5.根据权利要求1所述地铁突发事件延误时间预测方法,其特征在于,所述基于自然断点法对突发事件数据集中延迟时间进行分类得到分类标签输入集,包括:设置方差拟合优度阈值;设置分类方式并根据所述分类方式将延误时间划分为若干非空子集;根据突发事件数据集中延误时间确定所述分类方式的方差拟合优度;判断所述方差拟合优度是否满足方差拟合优度阈值条件,若不满足则重新设置分类方
式直至所述方差拟合优度满足方差拟合优度阈值,并根据满足方差拟合优度阈值条件的分类方式对所述延迟时间进行分类得到分类标签输入集。6.根据权利要求5所述地铁突发事件延误时间预测方法,其特征在于,所述根据突发事件数据集中延误时间确定所述分类方式的方差拟合优度,包括:根据所述突发事件数据集中延误时间确定突发事件数据集的延误时间平均值和各子集的延误时间平均值;根据所述突发事件数据集的延误时间平均值确定突发事件数据集的延误时间平均值的偏差平方和;根据各子集的延误时间平均值确定各子集的延误时间平均值的偏差平方和,并确定各子集的延误时间平均值的偏差平方和最小值;根据所述突发事件数据集的延误时间平均值的偏差平方和以及所述各子集的延误时间平均值的偏差平方和最小值确定分类方式的方差拟合优度。7.根据权利要求1所述地铁突发事件延误时间预测方法,其特征在于,所述方法还包括:获取实时突发事件数据,判断突发事件数据的信息是否完整,若所述突发事件数据的信息不完整,根据突发事件数据集构建概率分布模型,基于所述概率分布模型预测所述实时突发事件的延误时间。8.根据权利要求7所述地铁突发事件延误时间预测方法,其特征在于,所述根据突发事件数据集构建概率分布模型,基于所述概率分布模型预测所述实时突发事件的延误时间,包括:根据所述突发事件数据集确定每种特征簇数据对应延迟时间的概率密度分布函数;根据所述概率密度分布函数并基于正态分布特征得到概率分布模型;根据所述概率分布模型预测实时突发事件的延误时间范围。9.一种地铁突发事件延误时间预测装置,其特征在于,包括:数据获取单元,用于获取地铁突发事件历史数据,对所述历史数据预处理得到突发事件数据集,所述突发事件数据集包括特征簇数据和延迟时间;数据分类单元,用于基于自然断点法对突发事件数据集中延迟时间进行分类得到分类标签输入集;模型构建单元,用于基于贝叶斯定理构建初始延误时间预测模型,并将所述分类标签输入集输入所述初始延误时间预测模型进行分类训练,得到训练完备的延误时间预测模型;延误时间预测单元,用于获取实时突发事件数据,判断突发事件数据的信息是否完整,若所述突发事件数据的信息完整,基于所述训练完备的延迟时间预测模型预测所述实时突发事件的延误时间。10.一种电子设备,其特征在于,包括存储器和处理器,其中,所述存储器,用于存储程序;所述处理器,与所述存储器耦合,用于执行所述存储器中存储的所述程序,以实现上述权利要求1至8中任意一项所述的地铁突发事件延误时间预测方法中的步骤。

技术总结
本发明提供了一种地铁突发事件延误时间预测方法、装置及电子设备,所述方法包括:获取地铁突发事件历史数据,对历史数据预处理得到突发事件数据集;基于自然断点法对突发事件数据集中延迟时间信息进行分类得到分类标签输入集;基于贝叶斯定理构建初始延误时间预测模型,并将分类标签输入集输入初始延误时间预测模型进行分类训练,得到训练完备的延误时间预测模型;获取实时突发事件数据,判断其信息是否完整,若信息完整,基于训练完备的延迟时间预测模型预测实时突发事件的延误时间。本发明通过自然断点法将延迟时间分类划分为若干范围,并通过构建贝叶斯模型对延迟时间进行预测,以实现得到准确度高,小范围区间的地铁突发事件预测延迟时间。发事件预测延迟时间。发事件预测延迟时间。


技术研发人员:张抒扬 熊浩伟 王成露 陈国俊
受保护的技术使用者:武汉理工大学
技术研发日:2023.05.05
技术公布日:2023/8/13
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐