班车到站时刻的预测方法、装置、设备、存储介质与流程

未命名 07-17 阅读:70 评论:0


1.本发明涉及班车到站预测技术领域,特别涉及一种班车到站时刻的预测方法、装置、设备、存储介质。


背景技术:

2.班车是常用的通勤工具,目前已经能够根据大数据对班车的到站时间进行预测。常用的方法是以班车的历史数据为依据,结合当前时刻对班车的到站时间进行预测。但是班车的行驶受到多种因素的影响,即使是同一时间段的历史数据之间也可能存在较大的误差,影响预测结果的准确性。


技术实现要素:

3.本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出一种班车到站时刻的预测方法、装置、设备、存储介质,能够提高班车到站时间的预测准确性。
4.第一方面,本发明实施例提供了一种班车到站时刻的预测方法,应用于服务器,所述服务器与目标班车通信连接,所述班车到站时刻的预测方法包括:
5.获取所述目标班车的预测信息,所述预测信息包括预测时刻和预测站点信息,所述预测时刻用于指示当前的时刻,所述预测站点信息用于指示所述目标班车当前的出发站点和目标站点;
6.根据所述预测信息从预设的历史数据中获取多个参考历史样本,所述参考历史样本包括历史行驶时间段、历史行驶时长和历史站点信息,其中,所述预测时刻位于所述历史行驶时间段中,所述预测站点信息与所述历史站点信息相匹配;
7.基于预设的深度学习聚类模型,对所述历史行驶时长进行聚类得到参考行驶时长区间,将所述历史行驶时长位于所述参考行驶时长区间的所述参考历史样本确定为目标历史样本;
8.根据所述目标历史样本的所述历史行驶时长确定预测行驶时长,根据所述预测行驶时长确定所述目标班车到达所述目标站点的预测到站时刻。
9.根据本发明的一些实施例,所述服务器与所述目标班车通过websocket通信协议通信连接,所述预测信息还包括天气信息、交通拥堵信息和驾驶员信息,所述获取所述目标班车的预测信息,包括:
10.获取所述目标班车发送的定位信息、行驶路线信息和所述驾驶员信息;
11.根据所述定位信息和所述行驶路线信息确定所述预测站点信息;
12.通过第三方接口获取所述天气信息和所述交通拥堵信息;
13.根据所述天气信息、所述交通拥堵信息、所述驾驶员信息、所述预测时刻和所述预测站点信息从所述历史数据中获取多个所述参考历史样本。
14.根据本发明的一些实施例,在所述通过第三方接口获取所述天气信息和所述交通拥堵信息之后,所述方法还包括:
15.从所述历史数据获取多个站间历史样本,所述站间历史样本包括站间行驶时长、站间行驶时间段和站间站点信息,其中,所述站间站点信息与所述预测站点信息相匹配,多个所述站点历史样本所对应的所述站点行驶时间段不同;
16.根据所述深度学习聚类模型对所述站间行驶时长进行聚类,得到至少两个站间行驶时长区间;
17.当所述至少两个所述站间行驶时长区间之间的数值差异大于预设的差异阈值,确定每个所述站间行驶时长区间所对应的高峰期识别结果,其中,数值较大的所述站间行驶时长区间的所述高峰期识别结果用于表征高峰期;
18.根据所述预测时刻所对应的所述站间历史样本所对应的所述高峰期识别结果,更新所述交通拥堵信息。
19.根据本发明的一些实施例,在所述根据所述预测行驶时长确定所述目标班车到达所述目标站点的预测到站时刻之后,所述方法还包括:
20.周期性获取所述目标班车的速度信息和所述定位信息;
21.当检测到所述定位信息与所述目标站点的位置相匹配,且所述速度信息所表征的速度小于预设速度阈值,获取所述目标班车的实际行驶时间段和实际行驶时长;
22.根据所述实际行驶时间段、所述实际行驶时长和所述预测站点信息生成新的历史数据。
23.根据本发明的一些实施例,所述服务器包括多台计算设备,多台所述计算设备之间部署有hadoop分布式框架,所述基于预设的深度学习聚类模型,对所述历史行驶时长进行聚类得到参考行驶时长区间,包括:
24.基于所述hadoop分布式框架,通过多台所述计算设备对多个所述参考历史样本进行分布式计算,得到多个中间时长区间;
25.获取针对所述历史行驶时间段预先设置的参考时长;
26.当所述中间时长区间的极值与所述参考时长之间的数值差小于预设的时长阈值,将所述中间时长区间确定分机时长区间;
27.根据多个所述分机时长区间确定所述参考行驶时长区间。
28.根据本发明的一些实施例,在所述根据所述预测行驶时长确定所述目标班车到达所述目标站点的预测到站时刻之后,所述方法还包括:
29.确定新的预测信息,所述新的预测信息包括新的预测时刻和新的预测站点信息,所述新的预测时刻为所述预测到站时刻,所述新的预测站点信息所指示的新的出发站点为当前的所述目标站点,所述新的预测站点信息所指示的新的目标站点为当前的所述目标站点的下一个站点;
30.根据所述新的预测信息从所述历史数据中获取多个新的参考历史样本,所述新的参考历史样本包括新的历史行驶时间段、新的历史行驶时长和新的历史站点信息,其中,所述新的预测时刻位于所述新的历史行驶时间段中,所述新的预测站点信息与所述新的历史站点信息相匹配;
31.基于所述深度学习聚类模型,对所述新的历史行驶时长进行聚类得到新的参考行驶时长区间,将所述新的历史行驶时长位于所述新的参考行驶时长区间的所述新的参考历史样本确定为新的目标历史样本;
32.根据所述新的目标历史样本的所述新的历史行驶时长确定新的预测行驶时长,根据所述新的预测行驶时长确定所述目标班车到达下一个站点的预测到站时刻。
33.根据本发明的一些实施例,在所述根据所述预测行驶时长确定所述目标班车到达所述目标站点的预测到站时刻之前,所述方法还包括:
34.当获取到路线变更信息,根据所述路线变更信息重新确定所述预测站点信息所指示的目标站点;
35.根据重新确定的预测站点信息重新获取多个参考历史样本;
36.基于重新获取的参考历史样本和所述深度学习聚类模型更新所述参考行驶时长区间。
37.第二方面,本发明实施例提供了一种班车到站时刻的预测装置,包括少一个控制处理器和用于与所述至少一个控制处理器通信连接的存储器;所述存储器存储有可被所述至少一个控制处理器执行的指令,所述指令被所述至少一个控制处理器执行,以使所述至少一个控制处理器能够执行如上述第一方面所述的班车到站时刻的预测方法。
38.第三方面,本发明实施例提供了一种电子设备,包括有如上述第二方面所述的班车到站时刻的预测装置。
39.第四方面,本发明实施例提供了一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于执行如上述第一方面所述的班车到站时刻的预测方法。
40.根据本发明实施例的班车到站时刻的预测方法,至少具有如下有益效果:获取所述目标班车的预测信息,所述预测信息包括预测时刻和预测站点信息,所述预测时刻用于指示当前的时刻,所述预测站点信息用于指示所述目标班车当前的出发站点和目标站点;根据所述预测信息从预设的历史数据中获取多个参考历史样本,所述参考历史样本包括历史行驶时间段、历史行驶时长和历史站点信息,其中,所述预测时刻位于所述历史行驶时间段中,所述预测站点信息与所述历史站点信息相匹配;基于预设的深度学习聚类模型,对所述历史行驶时长进行聚类得到参考行驶时长区间,将所述历史行驶时长位于所述参考行驶时长区间的所述参考历史样本确定为目标历史样本;根据所述目标历史样本的所述历史行驶时长确定预测行驶时长,根据所述预测行驶时长确定所述目标班车到达所述目标站点的预测到站时刻。根据本发明实施例的技术方案,能够在根据预测信息匹配出参考历史样本后,对通过聚类模型对历史行驶时长进行聚类,筛除误差较大的样本,提高预测的准确性。
附图说明
41.图1是本发明一个实施例提供的班车到站时刻的预测方法的流程图;
42.图2是本发明另一个实施例提供的聚类的示意图;
43.图3是本发明另一个实施例提供的根据多种因素确定参考历史样本的流程图;
44.图4是本发明另一个实施例提供的判断高峰期的流程图;
45.图5是本发明另一个实施例提供的通过聚类判断高峰期的示意图;
46.图6是本发明另一个实施例提供的生成新的历史数据的流程图;
47.图7是本发明另一个实施例提供的分布式计算的流程图;
48.图8是本发明另一个实施例提供的确定下一个站点的预测到站时刻的流程图;
49.图9是本发明另一个实施例提供的目标班车更新路线的流程图;
50.图10是本发明另一个实施例提供的班车到站时刻的预测装置的结构图。
具体实施方式
51.下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
52.在本发明的描述中,需要理解的是,涉及到方位描述,例如上、下、前、后、左、右等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
53.在本发明的描述中,若干的含义是一个或者多个,多个的含义是两个以上,大于、小于、超过等理解为不包括本数,以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
54.本发明的描述中,除非另有明确的限定,设置、安装、连接等词语应做广义理解,所属技术领域技术人员可以结合技术方案的具体内容合理确定上述词语在本发明中的具体含义。
55.本发明实施例提供了一种班车到站时刻的预测方法、装置、设备、存储介质,其中,班车到站时刻的预测方法包括:获取所述目标班车的预测信息,所述预测信息包括预测时刻和预测站点信息,所述预测时刻用于指示当前的时刻,所述预测站点信息用于指示所述目标班车当前的出发站点和目标站点;根据所述预测信息从预设的历史数据中获取多个参考历史样本,所述参考历史样本包括历史行驶时间段、历史行驶时长和历史站点信息,其中,所述预测时刻位于所述历史行驶时间段中,所述预测站点信息与所述历史站点信息相匹配;基于预设的深度学习聚类模型,对所述历史行驶时长进行聚类得到参考行驶时长区间,将所述历史行驶时长位于所述参考行驶时长区间的所述参考历史样本确定为目标历史样本;根据所述目标历史样本的所述历史行驶时长确定预测行驶时长,根据所述预测行驶时长确定所述目标班车到达所述目标站点的预测到站时刻。根据本发明实施例的技术方案,能够在根据预测信息匹配出参考历史样本后,对通过聚类模型对历史行驶时长进行聚类,筛除误差较大的样本,提高预测的准确性。
56.下面结合附图,对本发明实施例的控制方法作进一步阐述。
57.参照图1,图1为本发明实施例提供的一种班车到站时刻的预测方法的流程图,该方法应用于服务器,服务器与目标班车通信连接,班车到站时刻的预测方法包括:
58.步骤s110,获取目标班车的预测信息,预测信息包括预测时刻和预测站点信息,预测时刻用于指示当前的时刻,预测站点信息用于指示目标班车当前的出发站点和目标站点;
59.步骤s120,根据预测信息从预设的历史数据中获取多个参考历史样本,参考历史样本包括历史行驶时间段、历史行驶时长和历史站点信息,其中,预测时刻位于历史行驶时间段中,预测站点信息与历史站点信息相匹配;
60.步骤s130,基于预设的深度学习聚类模型,对历史行驶时长进行聚类得到参考行
驶时长区间,将历史行驶时长位于参考行驶时长区间的参考历史样本确定为目标历史样本;
61.步骤s140,根据目标历史样本的历史行驶时长确定预测行驶时长,根据预测行驶时长确定目标班车到达目标站点的预测到站时刻。
62.需要说明的是,预测时刻可以是服务器获取到预测指令的时刻,例如在服务器中部署微信小程序或者app等应用,当用户接入微信小程序或者app并且发起班车到站时刻查询时生成预测指令,服务器将获取到该预测指令的时刻确定为预测时刻。预测站点信息可以通过目标班车的定位信息确定,由于班车的路线和站点是已知且固定的,因此当获取到目标班车的定位信息,则可以根据定位信息与目标班车的路线进行匹配,从而确定目标班车当前所处位置距离最近的两个站点,再根据行驶方向确定出发站点和目标站点。
63.需要说明的是,历史数据可以包括每个班次的班车在两个站点之间的行驶信息,每当班车到达一个站点,收集该次行驶的出发站点、目标站点、行驶时长、出发时刻、到达时刻等信息形成历史数据,本领域技术人员熟知如何收集历史数据,在此不多做赘述。
64.需要说明的是,为了提高预测的准确性,可以根据预测时刻、预测站点信息匹配出参考历史样本,例如当前时刻为6:20,出发站点为a,目标站点为b,参考历史样本满足以下条件:出发时刻早于6:20,到达时刻晚于6:20,出发站点为a,目标站点为b。行驶时长会受到交通状况和路线的影响,因此,参考历史样本和目标班车当前行驶的时间段和路线相匹配,能够有效提高预测的准确性。
65.需要说明的是,深度学习聚类模型为本领域技术人员熟知的技术,本实施例对深度聚类算法不作过多赘述,能够在输入样本后基于设置好的特征进行聚类即可。
66.需要说明的是,在得到多个参考历史样本后,由于班车的行驶还可能受到偶发性因素的影响,例如某一个班次在行驶过程中遇到交通事故,又或者设备故障导致班车上报的时刻信息不准确等,行驶时长会明显异于正常行驶的样本,例如,参考图2所示,图2为针对多个参考历史样本进行聚类得到的聚类结果,可以看出在虚线圈范围内的历史行驶时长位于[15,25],左侧实心圆点由于行驶时间段与预测时刻偏离较大被排除,右侧两个实心圆点的历史行驶时长与聚类得到的参考行驶时长区间的偏差值较大,因此属于无效样本被排除,本实施例通过聚类对参考历史样本进行二次筛选,能够通过聚类得到历史行驶时长较为近似的参考行驶时长区间,确保历史行驶时长位于参考行驶时长区间内的样本具备更好的参考性,从而提高预测的准确性。
[0067]
需要说明的是,通过聚类确定目标历史样本之后,可以针对目标历史样本的历史行驶时长进行均值计算确定预测行驶时长,由于目标班车的出发时刻是可知的,可以根据出发时刻和预测行驶时长确定预测到站时刻。
[0068]
另外,在一实施例中,服务器与目标班车通过websocket通信协议通信连接,预测信息还包括天气信息、交通拥堵信息和驾驶员信息,参照图3,图1所示实施例的步骤s120还包括但不限于有以下步骤:
[0069]
步骤s310,获取目标班车发送的定位信息、行驶路线信息和驾驶员信息;
[0070]
步骤s320,根据定位信息和行驶路线信息确定预测站点信息;
[0071]
步骤s330,通过第三方接口获取天气信息和交通拥堵信息;
[0072]
步骤s340,根据天气信息、交通拥堵信息、驾驶员信息、预测时刻和预测站点信息
从历史数据中获取多个参考历史样本。
[0073]
需要说明的是,目标班车处于不断移动的状态,为了采集目标班车的数据,可以在目标班车设置采集装置,例如设置人脸识别装置对驾驶员进行识别,从而获取驾驶员信息,又如设置时刻采集装置,通过时刻采集装向服务器上报目标班车离开或者到达每个站点的时刻信息,又如,在目标班车设置定位装置,向服务器上报目标班车的定位信息。可以理解的是,为了提高通信效率,目标班车与服务器可以通过websocket通信协议建立长通信连接,提高数据收发的效率和准确性。当然也可以根据实际需求采用其他的通信协议,本实施例对此不多做限定。
[0074]
需要说明的是,由于目标班车的路线是可知的,因此在确定定位信息后,可以根据定位信息确定距离最近的两个站点,再根据行驶方向确定出发站点和目标站点。
[0075]
需要说明的是,为了增加预测信息的多样性,本实施例的服务器可以通过第三方接口获取天气信息和交通拥堵信息,例如通过第三方接口从天气应用中获取当前天气信息,例如当前是晴天、雨天等,同理,可以通过第三方接口从交通应用(例如导航、实时交通路况)获取交通拥堵信息,例如到达目标站点之前路况畅通、缓行、拥堵等,本领域技术人员熟知如何配置第三方接口以获取相应信息,并保存在云数据库作为基础数据使用,本实施例对此不多做赘述。
[0076]
需要说明的是,可以在预测时刻和预测站点信息的基础上,结合天气信息、交通拥堵信息和驾驶员信息进行参考历史样本的获取,确保得到的参考历史样本中,目标班车由同一个司机驾驶、天气状况和交通拥堵状况一致,提高参考历史样本的参考价值。在此基础上,还可以进一步细化各匹配因素,例如降雨量、气温、是否工作日等,本实施例对此不多作限定。
[0077]
需要说明的是,本实施例针对历史行驶时长进行聚类,在此基础上,还可以针对上述任意一个因素进行进一步的聚类,例如针对降雨量,降雨量的大小对车辆行驶速度有一定的影响,因此可以针对降雨量进行进一步聚类,确保目标历史样本在降雨量维度相似,具体方式参考上述实施例的描述即可,本实施例可以通过多层因素对参考历史样本进行至少一次聚类以实现样本的筛选,使得目标历史样本在环境因素、气候因素、驾驶因素等维度与当前的行驶状况接近,从而提高预测到达时间的准确性,当然,在获取到预测指令时,同时采集当前的相关因素的信息即可。
[0078]
另外,在一实施例中,参照图4,在执行完图3所示实施例的步骤s330之后,还包括但不限于有以下步骤:
[0079]
步骤s410,从历史数据获取多个站间历史样本,站间历史样本包括站间行驶时长、站间行驶时间段和站间站点信息,其中,站间站点信息与预测站点信息相匹配,多个站点历史样本所对应的站点行驶时间段不同;
[0080]
步骤s420,根据深度学习聚类模型对站间行驶时长进行聚类,得到至少两个站间行驶时长区间;
[0081]
步骤s430,当至少两个站间行驶时长区间之间的数值差异大于预设的差异阈值,确定每个站间行驶时长区间所对应的高峰期识别结果,其中,数值较大的站间行驶时长区间的高峰期识别结果用于表征高峰期;
[0082]
步骤s440,根据预测时刻所对应的站间历史样本所对应的高峰期识别结果,更新
交通拥堵信息。
[0083]
需要说明的是,交通拥堵状况很容易受到高峰期的影响,同一个路段在高峰期内大概率会较为拥堵,导致行驶时长较长,基于此,为了提高预测的准确性,本实施例可以从历史数据中获取两个站点之间多天的历史数据作为站间历史样本,站间历史样本的站点行驶时间段不同,例如从6点至7点,7点至8点,9点至10点等,通过不同时间段的站间历史样本进行聚类,能够根据站间行驶时长的聚类结果判断某个时间段是否为高峰期,当两个站间行驶时长区间的差值大于差异阈值,则可以确定两个时间段之间的交通状况有较大的差异,可以确定其交通拥堵情况有明显区别,例如图5所示,差异阈值以10分钟为例,通过多个站间历史样本进行聚类,得到两个虚线圈所表征的聚类结果,虚线圈外的样本为误差较大的无效样本,由此可见,左侧的聚类结果对应的站间行驶时长区间为[35,50],对应的时间段为6点至7点30分,右侧的聚类结果对应的站间行驶时长区间为[19,21],对应的时间段为9点至10点30分,差异阈值可以根据35-21=14,由于14大于10,可以确定6点至7点30分为高峰期,9点至10点30分为通畅时间段,以此作为两个站间行驶时长区间的高峰期识别结果。
[0084]
需要说明的是,在确定高峰期识别结果后,可以对交通拥堵信息进行更新,例如高峰期识别结果为高峰期,而由于当前时刻较早,第三方接口获取到的交通拥堵信息为通畅,但是过一段时间后会由于高峰期造成拥堵,若以通畅作为交通拥堵信息进行参考历史样本的匹配,最终得到的预测到达时刻准确性较低,此时可以将交通拥堵信息更新为拥堵,以确保参考历史样本所对应的交通拥堵信息同为拥堵,确保预测到达时刻的准确性较高。
[0085]
另外,在一实施例中,参照图6,在执行完图1所示实施例的步骤s140之后,还包括但不限于有以下步骤:
[0086]
步骤s610,周期性获取目标班车的速度信息和定位信息;
[0087]
步骤s620,当检测到定位信息与目标站点的位置相匹配,且速度信息所表征的速度小于预设速度阈值,获取目标班车的实际行驶时间段和实际行驶时长;
[0088]
步骤s630,根据实际行驶时间段、实际行驶时长和预测站点信息生成新的历史数据。
[0089]
需要说明的是,为了增加历史数据的样本数,可以在目标班车到达站点后收集0该次的行驶信息并作为新的历史数据保存,可以通过目标班车的速度和位置判断是否到站,例如当目标班车的速度为0,且定位信息与目标站点之间的位置相匹配,则可以确定目标班车停靠在目标站点,可以对实际行驶时间段和实际行驶时长等数据进行收集以形成新的历史数据。可以理解的是,定位信息与目标站点之间的位置相匹配可以是二者重叠,也可以考虑到定位误差设置距离阈值,例如定位信息与目标站点之间的距离小于10米,可以认为目标班车已经到达目标站点,同理,对于大部分班车预设速度阈值可以设置为零,即速度为零时认为目标班车停车,但是目标班车也可能在没有乘客上下车的情况下,以较慢速度不停车经过目标站点,因此可以将预设速度阈值设置为较小的数值,以此判断目标班车到站,预设速度阈值根据实际需求设置即可。
[0090]
另外,在一实施例中,服务器包括多台计算设备,多台计算设备之间部署有hadoop分布式框架,参照图7,图1所示实施例的步骤s130,还包括但不限于有以下步骤:
[0091]
步骤s710,基于hadoop分布式框架,通过多台计算设备对多个参考历史样本进行分布式计算,得到多个中间时长区间;
[0092]
步骤s720,获取针对历史行驶时间段预先设置的参考时长;
[0093]
步骤s730,当中间时长区间的极值与参考时长之间的数值差小于预设的时长阈值,将中间时长区间确定分机时长区间;
[0094]
步骤s740,根据多个分机时长区间确定参考行驶时长区间。
[0095]
需要说明的是,参考历史样本的数量通常较多,可以通过分布式计算提高聚类的计算速度,从而提高预测效率。分布式计算可以基于hadoop分布式框架实现,例如在云服务器中部署多台计算设备,并在计算设备中部署hadoop分布式框架实现分布式计算,hadoop分布式框架的部署为本领域技术人员熟知的技术,在此不多做赘述。
[0096]
需要说明的是,在通过分布式计算得到多个中间时长区间后,需要排除由于样本分布不均匀导致的计算误差,本实施例针对每个历史行驶时间段设置参考时长,若某个计算设备计算得到的中间时长区间的极值与参考时长之间的数值差小于时长阈值,则可以确定该中间时长区间有效,确定为分机时长区间用于计算参考行驶时长区间。参考时长可以人工设置,也可以根据每次计算出的参考行驶时长区间取中间值确定,本实施例对此不做限定。
[0097]
需要说明的是,由于计算设备较多,可以将每个计算设备得到的分机时长区间保存在缓存中,例如采用redis或memcached等中间件作为缓存空间,能够有效提高响应速度。
[0098]
另外,在一实施例中,参照图8,在执行完图1所示实施例的步骤s140之后,还包括但不限于有以下步骤:
[0099]
步骤s810,确定新的预测信息,新的预测信息包括新的预测时刻和新的预测站点信息,新的预测时刻为预测到站时刻,新的预测站点信息所指示的新的出发站点为当前的目标站点,新的预测站点信息所指示的新的目标站点为当前的目标站点的下一个站点;
[0100]
步骤s820,根据新的预测信息从历史数据中获取多个新的参考历史样本,新的参考历史样本包括新的历史行驶时间段、新的历史行驶时长和新的历史站点信息,其中,新的预测时刻位于新的历史行驶时间段中,新的预测站点信息与新的历史站点信息相匹配;
[0101]
步骤s830,基于深度学习聚类模型,对新的历史行驶时长进行聚类得到新的参考行驶时长区间,将新的历史行驶时长位于新的参考行驶时长区间的新的参考历史样本确定为新的目标历史样本;
[0102]
步骤s840,根据新的目标历史样本的新的历史行驶时长确定新的预测行驶时长,根据新的预测行驶时长确定目标班车到达下一个站点的预测到站时刻。
[0103]
需要说明的是,图1所示实施例的方法能够对目标站点的到站时刻进行预测,在此基础上,可以嵌套执行图1所示实施例的方法,对后续的多个站点的预测到站时刻进行预测,例如在完成站点a至b的预测之后,进一步预测站点b至c的预计到达时刻的预测。
[0104]
需要说明的是,由于班车的站点是连续的,因此可以将当前的目标站点确定为下一段的出发站点,根据目标班车的路线将当前的目标站点的下一站确定为新的目标站点,并且将本次的预计到站时刻确定为下一次预测的预测时刻,后续步骤s820至s840与图1所示实施例描述的原理类似,在此不重复赘述。
[0105]
另外,在一实施例中,参照图9,在执行图1所示实施例的步骤s140之前,还包括但不限有以下步骤:
[0106]
步骤s910,当获取到路线变更信息,根据路线变更信息重新确定预测站点信息所
指示的目标站点;
[0107]
步骤s920,根据重新确定的预测站点信息重新获取多个参考历史样本;
[0108]
步骤s930,基于重新获取的参考历史样本和深度学习聚类模型更新参考行驶时长区间。
[0109]
需要说明的是,虽然目标班车的路线通常是固定的,但是可能出现路线变更的情况,例如由于道路施工等因素调整到站点,当获取到路线变更信息,可以根据路线变更信息重新确定目标站点,例如根据定位信息从新的路线中确定最近的下一个站点,根据重新确定的目标站点重新进行参考历史样本的匹配,确保参考历史样本能够与当前的行驶路线相同或者相似,提高预测的准确性。
[0110]
如图10所示,图10是本发明一个实施例提供的班车到站时刻的预测装置的结构图。本发明还提供了一种班车到站时刻的预测装置,包括:
[0111]
处理器1001,可以采用通用的中央处理器(central processing unit,cpu)、微处理器、应用专用集成电路(application specific integrated circuit,asic)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本技术实施例所提供的技术方案;
[0112]
存储器1002,可以采用只读存储器(read only memory,rom)、静态存储设备、动态存储设备或者随机存取存储器(random access memory,ram)等形式实现。存储器1002可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1002中,并由处理器1001来调用执行本技术实施例的班车到站时刻的预测方法;
[0113]
输入/输出接口1003,用于实现信息输入及输出;
[0114]
通信接口1004,用于实现本设备与其他设备的通信交互,可以通过有线方式(例如usb、网线等)实现通信,也可以通过无线方式(例如移动网络、wifi、蓝牙等)实现通信;
[0115]
总线1005,在设备的各个组件(例如处理器1001、存储器1002、输入/输出接口1003和通信接口1004)之间传输信息;
[0116]
其中处理器1001、存储器1002、输入/输出接口1003和通信接口1004通过总线1005实现彼此之间在设备内部的通信连接。
[0117]
本技术实施例还提供了一种电子设备,包括如上所述的班车到站时刻的预测装置。
[0118]
本技术实施例还提供了一种存储介质,存储介质为计算机可读存储介质,该存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述班车到站时刻的预测方法。
[0119]
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,实现了以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
[0120]
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于ram、rom、eeprom、闪存或其他存储器技术、cd-rom、数字多功能盘(dvd)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包括计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
[0121]
以上是对本发明的较佳实施进行了具体说明,但本发明并不局限于上述实施方式,熟悉本领域的技术人员在不违背本发明精神的共享条件下还可作出种种等同的变形或替换,这些等同的变形或替换均包括在本发明权利要求所限定的范围内。

技术特征:
1.一种班车到站时刻的预测方法,其特征在于,应用于服务器,所述服务器与目标班车通信连接,所述班车到站时刻的预测方法包括:获取所述目标班车的预测信息,所述预测信息包括预测时刻和预测站点信息,所述预测时刻用于指示当前的时刻,所述预测站点信息用于指示所述目标班车当前的出发站点和目标站点;根据所述预测信息从预设的历史数据中获取多个参考历史样本,所述参考历史样本包括历史行驶时间段、历史行驶时长和历史站点信息,其中,所述预测时刻位于所述历史行驶时间段中,所述预测站点信息与所述历史站点信息相匹配;基于预设的深度学习聚类模型,对所述历史行驶时长进行聚类得到参考行驶时长区间,将所述历史行驶时长位于所述参考行驶时长区间的所述参考历史样本确定为目标历史样本;根据所述目标历史样本的所述历史行驶时长确定预测行驶时长,根据所述预测行驶时长确定所述目标班车到达所述目标站点的预测到站时刻。2.根据权利要求1所述的班车到站时刻的预测方法,其特征在于,所述服务器与所述目标班车通过websocket通信协议通信连接,所述预测信息还包括天气信息、交通拥堵信息和驾驶员信息,所述根据所述预测信息从预设的历史数据中获取多个参考历史样本,包括:获取所述目标班车发送的定位信息、行驶路线信息和所述驾驶员信息;根据所述定位信息和所述行驶路线信息确定所述预测站点信息;通过第三方接口获取所述天气信息和所述交通拥堵信息;根据所述天气信息、所述交通拥堵信息、所述驾驶员信息、所述预测时刻和所述预测站点信息从所述历史数据中获取多个所述参考历史样本。3.根据权利要求2所述的班车到站时刻的预测方法,其特征在于,在所述通过第三方接口获取所述天气信息和所述交通拥堵信息之后,所述方法还包括:从所述历史数据获取多个站间历史样本,所述站间历史样本包括站间行驶时长、站间行驶时间段和站间站点信息,其中,所述站间站点信息与所述预测站点信息相匹配,多个所述站点历史样本所对应的所述站点行驶时间段不同;根据所述深度学习聚类模型对所述站间行驶时长进行聚类,得到至少两个站间行驶时长区间;当所述至少两个所述站间行驶时长区间之间的数值差异大于预设的差异阈值,确定每个所述站间行驶时长区间所对应的高峰期识别结果,其中,数值较大的所述站间行驶时长区间的所述高峰期识别结果用于表征高峰期;根据所述预测时刻所对应的所述站间历史样本所对应的所述高峰期识别结果,更新所述交通拥堵信息。4.根据权利要求2所述的班车到站时刻的预测方法,其特征在于,在所述根据所述预测行驶时长确定所述目标班车到达所述目标站点的预测到站时刻之后,所述方法还包括:周期性获取所述目标班车的速度信息和所述定位信息;当检测到所述定位信息与所述目标站点的位置相匹配,且所述速度信息所表征的速度小于预设速度阈值,获取所述目标班车的实际行驶时间段和实际行驶时长;根据所述实际行驶时间段、所述实际行驶时长和所述预测站点信息生成新的历史数
据。5.根据权利要求1所述的班车到站时刻的预测方法,其特征在于,所述服务器包括多台计算设备,多台所述计算设备之间部署有hadoop分布式框架,所述基于预设的深度学习聚类模型,对所述历史行驶时长进行聚类得到参考行驶时长区间,包括:基于所述hadoop分布式框架,通过多台所述计算设备对多个所述参考历史样本进行分布式计算,得到多个中间时长区间;获取针对所述历史行驶时间段预先设置的参考时长;当所述中间时长区间的极值与所述参考时长之间的数值差小于预设的时长阈值,将所述中间时长区间确定分机时长区间;根据多个所述分机时长区间确定所述参考行驶时长区间。6.根据权利要求1至5任意一项所述的班车到站时刻的预测方法,其特征在于,在所述根据所述预测行驶时长确定所述目标班车到达所述目标站点的预测到站时刻之后,所述方法还包括:确定新的预测信息,所述新的预测信息包括新的预测时刻和新的预测站点信息,所述新的预测时刻为所述预测到站时刻,所述新的预测站点信息所指示的新的出发站点为当前的所述目标站点,所述新的预测站点信息所指示的新的目标站点为当前的所述目标站点的下一个站点;根据所述新的预测信息从所述历史数据中获取多个新的参考历史样本,所述新的参考历史样本包括新的历史行驶时间段、新的历史行驶时长和新的历史站点信息,其中,所述新的预测时刻位于所述新的历史行驶时间段中,所述新的预测站点信息与所述新的历史站点信息相匹配;基于所述深度学习聚类模型,对所述新的历史行驶时长进行聚类得到新的参考行驶时长区间,将所述新的历史行驶时长位于所述新的参考行驶时长区间的所述新的参考历史样本确定为新的目标历史样本;根据所述新的目标历史样本的所述新的历史行驶时长确定新的预测行驶时长,根据所述新的预测行驶时长确定所述目标班车到达下一个站点的预测到站时刻。7.根据权利要求1所述的班车到站时刻的预测方法,其特征在于,在所述根据所述预测行驶时长确定所述目标班车到达所述目标站点的预测到站时刻之前,所述方法还包括:当获取到路线变更信息,根据所述路线变更信息重新确定所述预测站点信息所指示的目标站点;根据重新确定的预测站点信息重新获取多个参考历史样本;基于重新获取的参考历史样本和所述深度学习聚类模型更新所述参考行驶时长区间。8.一种班车到站时刻的预测装置,其特征在于,包括至少一个控制处理器和用于与所述至少一个控制处理器通信连接的存储器;所述存储器存储有可被所述至少一个控制处理器执行的指令,所述指令被所述至少一个控制处理器执行,以使所述至少一个控制处理器能够执行如权利要求1至7任一项所述的班车到站时刻的预测方法。9.一种电子设备,其特征在于,包括权利要求8所述的班车到站时刻的预测装置。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1至7任一项所述的班车到
站时刻的预测方法。

技术总结
本发明提出了一种班车到站时刻的预测方法、装置、设备、存储介质,该方法包括:获取目标班车的预测信息,预测信息包括预测时刻和预测站点信息;根据预测信息从预设的历史数据中获取多个参考历史样本;基于预设的深度学习聚类模型,对历史行驶时长进行聚类得到参考行驶时长区间,将历史行驶时长位于参考行驶时长区间的参考历史样本确定为目标历史样本;根据目标历史样本的历史行驶时长确定预测行驶时长,根据预测行驶时长确定目标班车到达目标站点的预测到站时刻。根据本发明实施例的技术方案,能够在根据预测信息匹配出参考历史样本后,对通过聚类模型对历史行驶时长进行聚类,筛除误差较大的样本,提高预测的准确性。提高预测的准确性。提高预测的准确性。


技术研发人员:甘海彬 闫鑫 张汉就
受保护的技术使用者:东信和平科技股份有限公司
技术研发日:2022.12.26
技术公布日:2023/6/27
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐