一种基于车辆通行区段特征的轨迹重构的方法
未命名
10-09
阅读:89
评论:0

1.本发明属于高速公路交通技术领域,具体涉及一种路径拟合技术。
背景技术:
2.2020年之前,两个收费站之间的通行行程是收取固定金额的通行费。而“分段计费”则遵循了“多用路者多付费,少用路者少付费”的公平兼顾效率的原则,将高速公路全线依照匝道、互通枢纽、桥梁隧道等划分为若干段,各段内分别计算费额,最后将整段行程从入口收费站到出口收费站经过的每个分段的费额累加计算出最终通行费金额。
3.2020年1月1日全国高速公路取消省界收费站,实现“一张网”运营、“一次通行、一次扣费、一次告知”,随之高速公路车辆的收费模式由计重改成按车型收费,计费里程由收费站和沿途门架系统的交易记录还原的实际行驶路径来确定。收费模式发生改变,从原来的“入口取卡/etc”、“出口收费”变成现在的“入口取卡/etc”、“门架计费”、“出口收费”,从原来的出一次省界收一次费,到现在的“全国一张网”,跨省通行只要一次收费即可。自此,我国高速公路的车主有了“一脚油门踩到底”的快速、便捷的通行体验,避免了跨省车辆过省界收费站时的拥堵,提升了通行效率。
4.新运营模式以来,高速公路路网运行总体顺畅,联网收费稳定有序,但随着收费方式的转变,跨省车辆单次通行费数额大幅度增加,部分车主尤其是在既得利益的驱动下,利用各种非法手段达到逃交、少交通行费的目的,改变车型、屏蔽通行介质、跑长买短等典型逃费方式不断演变,给运营管理单位带来通行费损失,同时也严重影响了正常的收费运营秩序。
5.对此所应用的车辆路径拟合技术是一种基于车辆轨迹数据的路径分析技术,随着车辆轨迹数据的不断积累和应用需求的提高,如何从大量的车辆轨迹数据中提取出有价值的信息成为了一个重要的研究方向。
6.车辆路径拟合技术主要包括数据预处理、路径分析、路径模型建立等多个环节。其中,数据预处理是对车辆轨迹数据进行清洗和预处理,以保证数据的质量和可靠性;路径分析是对车辆轨迹数据进行分析和挖掘,得出车辆行驶路径和行驶特点;路径模型建立则是利用统计学和机器学习等方法,对车辆行驶路径进行建模和预测,为城市交通管理和规划提供更加精准和有效的数据支持。
技术实现要素:
7.因此,本发明提出了一种基于车辆通行区段特征的轨迹重构方法,首先,引入基于深度约束的迪杰斯特拉算法,对高速公路二义性路径进行提取并构建二义性路径库;其次,通过构建区段特征和驾驶行为信息实现车辆的行程估计,对正常区段进行建模;最后,基于二义性路径对路网实际距离进行匹配,对缺失数据进行轨迹重构,而非现有技术中直接使用最短路径代替实际路径,数据更准确科学;同时,通过单源数据实现对有误的行驶数据的轨迹重构,节省了计算资源,提高了计算效率。
8.本发明是通过以下技术方案得以实现:
9.一种基于车辆通行区段特征的轨迹重构的方法,其特征在于,包括步骤:
10.s1、获取高速公路门架的路网拓扑数据和车辆etc交易数据;
11.s2、基于所述路网拓扑数据中的所有门架节点,遍历选取任意两门架节点分别作为起点、终点,以得到各起点和终点之间的最短路径轨迹,并定义除了最短路径上的门架节点以外的其他能到达终点所需经过的门架节点为偏离点,再次遍历计算起点门架节点到各偏离点的最短路径轨迹、各偏离点到终点门架的最短路径轨迹并组合作为待选路径轨迹,基于最短路径轨迹和待选路径轨迹以得到二义性路径库;
12.s3、基于所述车辆etc交易数据生成车辆行程轨迹,将所述车辆行程轨迹与所述路网拓扑数据进行对比,并对该行程轨迹上不直接连通的门架节点之间所形成的异常区段,采用随机森林模型估算该异常区段轨迹的区段行程距离;
13.s4、基于行程轨迹、异常区段行程距离、二义性路径库,以得到车辆在通行区段下的实际通行重构轨迹。
14.优选地,所述etc交易数据包括车辆在行驶过程中的etc交易标识、经过的门架信息、经过的etc入口收费站信息、交易时间。
15.优选地,步骤s3中,所述车辆的行程轨迹生成步骤具体包括:
16.s3.1、获取车辆收费站交易流水数据,所述车辆出口收费站交易流水数据包括收费站交易标识、交易时间、站点入口收费站信息;
17.s3.2、基于车辆etc交易数据和站点收费站交易流水数据,将其中具有相同交易标识的交易数据进行聚合并按照交易时间排序,以构建基于门架信息形成的车辆行程轨迹。
18.优选地,高速公路门架的路网拓扑数据包括多个相邻两门架之间形成的连通性区段;步骤s3中的对比具体为:
19.将所述车辆行程轨迹与所述路网拓扑数据中的各连通性区段进行对比,以得到该行程轨迹上不直接连通的门架节点对之间所形成的异常区段。
20.优选地,步骤s3中随机森林模型的训练过程,包括:
21.a、获取训练样本集,所述训练样本集中的训练样本均包括对应车辆行车路径中的etc交易数据信息,训练样本还包括etc交易数据信息中各经过门架之间的距离信息;
22.b、对训练样本集进行数据预处理;
23.c、基于预处理后的训练样本集对随机森林模型进行训练,以构建出可估计任意区段行程距离的随机森林模型。
24.优选地,训练样本还包括对应车辆的型号信息、对应车辆行车路径中的车流量信息。
25.优选地,步骤s4中所述采用随机森林模型估算该区段轨迹的行程轨迹距离,具体为:
26.输入所述不直接连通的两门架信息以及车辆与该两门架相应的etc交易数据信息至训练后随机森林模型,并估计得到该两门架形成的区段轨迹的行程轨迹距离。
27.优选地,所述步骤b中,数据预处理包括对训练样本集中的异常etc交易数据信息进行去除。
28.优选地,所述步骤b中,数据预处理还包括对训练样本集中的etc交易数据进行归
一化处理。
29.优选地,所述步骤s4,具体包括:
30.s4.1、基于行程轨迹距离在二义性路径库中搜索得到与该行程轨迹距离匹配的所有路径;
31.s4.2、在匹配得到的所有路径中根据异常区段的形成距离筛选得到包括所述区段轨迹中两门架节点的路径,以作为车辆在该区段下的实际通行重构轨迹。
32.所述的一种基于车辆通行区段特征的轨迹重构的方法与现有的技术相比具有如下的优点和显著的效果:
33.一、本发明采用深度约束的迪杰斯特拉算法,而非用最短路径代替实际路径,对高速公路二义性路径进行提取并构建了更为全面、精确的二义性轨迹数据库,从而重构结果更准确;
34.二、采用了多种模型对区段信息进行挖掘以估计车辆通行距离,准确高效得出车辆的实际通行轨迹,解决了基于门架的通行区段数据失真,重复交易等问题。
附图说明
35.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
36.图1为本发明一种基于车辆通行区段特征的轨迹重构的方法流程图。
具体实施方式
37.下面通过具体实施例和附图对本发明作进一步的说明。本发明的实施例是为了更好地使本领域的技术人员更好地理解本发明,并不对本发明作任何的限制。
38.实施例一:
39.本实施例给出基于车辆通行区段特征的轨迹重构的方法的具体流程步骤,如下:
40.s1、获取高速公路门架的路网拓扑数据和车辆etc交易数据;
41.高速公路门架的路网拓扑数据包含若干门架对,另外,收费站可视为特殊的门架,如表1所示。
42.表1门架拓扑表主要字段
43.[0044][0045]
如表2所示,车辆etc交易数据包括车辆的etc交易标识、发生交易的门架信息、etc入口路网信息、etc入口收费站信息、交易时间等。
[0046]
表2etc交易流水表主要字段
[0047]
字段数据类型字段描述示例passidstring交易标识35000*****0305tradetimedatetime交易时间2020/9/320:48:39flagidstring门架编号350817ennetidstring入口路网编号3501enstationstring入口收费站编号4607entimedatetime入口时间2020/9/318:49:39vehclassstring车辆类型1errocodestring是否存在特情0
[0048]
s2、基于获取的高速公路门架的路网拓扑数据中的所有门架节点,遍历选取任意两门架分别作为起点、终点,以得到各起点和终点之间的最短路径轨迹,并定义除了最短路径上的门架节点以外的其他能到达终点所需经过的门架节点为偏离点,再次遍历计算起始门架节点到各偏离点的最短路径轨迹、各偏离点到终点门架的最短路径轨迹并组合作为待选路径轨迹,基于最短路径轨迹和待选路径轨迹以得到二义性路径库;
[0049]
相关定义:二义性路径指两节点之间可能存在两条或者两条以上的可选择通行路径的情况。其形式如公式所示:
[0050]
(ambiguouspath={od,nodepath_i});
[0051]
其中,od为起始门架和终点门架,即od=《node_ori,node_des》;
[0052]
nodepath_i指的是在当前od门架的约束下存在的可通行路径集合,i表示集合中的第i条门架路径。
[0053]
s2.1、以各高速公路收费站的进出站点作为起讫点(od),通过dijkstra算法对高速公路etc门架的拓扑路网生成od轨迹模型;
[0054]
s2.2、结合车辆的行驶轨迹进行分析验证,得到有效的od轨迹数据集,这些轨迹可以适应不同长度的轨迹数据。车辆经收费站驶入高速公路,通行后由收费站驶离高速公路,即产生了对应的od路径。
[0055]
s2.3、当路网成环状时,od路径可能不唯一,即产生二义性路径。根据高速公路etc门架拓扑关系控制出入和单向行驶的特殊性,本专利采用了节点偏离的思想引入基于深度约束的迪杰斯特拉算法进行二义性路径获取。
[0056]
s2.31、遍历所有门架,指定任意两个门架作为起始门架o和终点门架d。
[0057]
s2.32、指定起点门架o,终止门架d以及门架路径的最大长度。
[0058]
s2.33、采用基于深度约束的迪杰斯特拉获取长度内的所有二义性路径增加到中,步骤如下:
[0059]
s2.331:获取源点o,终点d以及终止长度cutoff参数。用最短路径法算出od间的最短路径,将其记为pk(k=1),将pk存入路径集a。
[0060]
s2.332:判断是否有待求候选路径存在(即路径集合a不为空)。如果有,进入步骤s2.333;如果没有,进入步骤s2.334。
[0061]
s2.333存在候选路径即,则继续查找下一候选路径pk+1,具体步骤如下:
[0062]
把最短路径pk上的每个门架节点(除去pk上的门架节点d)分别看作偏离点(设共有x个)。将每求pk+1个偏离点记为vi(i=1,2,
…
x)。
[0063]
遍历偏离点,每趟遍历过程如下:
[0064]
求出每个偏离点vi到终点d的最短路径。
[0065]
将起点o到点vi的路径、vi到终点d的最短路径组合,作为pk+1候选路径,加入候选路径集b。
[0066]
偏离点遍历结束后,判断候选路径集b是否为空。
[0067]
若为空:说明找到k条最短路径,进入步骤s2.334。
[0068]
若不为空:找出路径长度小于终止长度cutoff的路径记为所求的pk,将该路径从候选路径集b中移出,并放入路径集a中,进入步骤s2.332。
[0069]
s2.334:所有候选路径已找全,结束。
[0070]
s2.34、创建二义性路径表,指定引擎为log,orderby字段为od和门架路径长度,形成二义性路径库。
[0071]
s3、基于车辆etc交易数据生成车辆的行程轨迹,与高速公路门架的路网拓扑数据进行对比,并对该行程轨迹上不直接连通的门架节点之间所形成的区段轨迹,采用随机森林模型估算该区段轨迹的行程轨迹距离;
[0072]
s3.1、基于车辆etc交易数据和站点收费站交易流水数据,将其中具有相同交易标识与入口收费站信息的车辆信息组合为轨迹标识,并按照交易时间排序进行聚合,以构建基于门架信息形成的车辆行程轨迹,具体如下:
[0073]
s3.11、按照tnpathid进行分组抽取按时间顺序进行聚合,
[0074]
(1)根据表1,按tnpathid作为key进行分组操作,并提取轨迹信息。
[0075]
(2)使用tradetime字段进行操作使得信息具备时序性。
[0076]
(3)以每天为维度进行分区操作,以保证同天的数据能够保存在同一分区提升检索查询速度。
[0077]
(4)相同key的进行聚合操作,提取交易时间序列array(tradetime),交易门架序列array(flagid)等信息。
[0078]
(5)将处理结果存入车辆交易门架轨迹表。
[0079]
s3.12、建立车辆etc交易数据生成车辆的行程轨迹的交易区段表:
[0080]
(1)从车辆交易区段表中遍历车辆交易门架轨迹按顺序对其进行前后组合生成通行区段数据。
[0081]
(2)根据遍历交易门架的编号按顺序对其进行前后组合生成区段时间数据,该字段保存着当前区段起止交易门架的交易时间信息。
[0082]
(3)对每个交易门架所形成的区段时间进行计算获得区段总的通行时间timedelta。
[0083]
(4)根据重新组合成新的轨迹标识进行arrayjoin操作,将行数据转换成列数据。
[0084]
(2)数据预处理
[0085]
s3.3、训练随机森林模型具体如下:
[0086]
a、获取训练样本集,所述训练样本集中的训练样本均包括对应车辆行车路径中的etc交易数据信息,训练样本还包括etc交易数据信息中各经过门架之间的距离信息;
[0087]
b、对训练样本集进行数据预处理和特征工程;
[0088]
输入的数据为结构化数据,选取的特征变量包含数值变量和类别变量。对于类别变量如小时数,车辆类型,车辆标识等信息需要进行转换,否则无法用于机器学习模型训练,对数据的处理主要包括:对数据进行清洗、数据的归一化处理、类别特征处理。
[0089]
对数据进行探索性分析,以拟定更加合理的数据预处理方式,对数据按车型车类、各时间区间的平均行程速度、小时车流量进行划分。
[0090]
c、基于预处理后的训练样本集对随机森林模型进行训练,以构建出可估计任意区段行程距离的随机森林模型;
[0091]
原始样本集由车辆交易区段数据集构成,按照7:3的比例拆分成训练集和测试集并进行模型构建以及参数调优,构建出以区段特征估计行程距离的随机森林模型用于估算车辆在区段轨迹的行程轨迹距离。
[0092]
s4、基于行程轨迹、区段轨迹、行程轨迹距离、二义性路径库,以得到车辆在相应区段下的实际通行重构轨迹。
[0093]
s4.1、基于行程轨迹距离在二义性路径库中搜索得到与该行程轨迹距离匹配的所有路径;
[0094]
s4.2、并在匹配得到的所有路径中筛选得到包括所述区段轨迹中两门架节点的路径,以作为车辆在该区段下的实际通行重构轨迹。
[0095]
以上所述的实施例仅仅是对本发明的优选实施方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案作出的各种变形和改进,均应落入本发明的保护范围内。
技术特征:
1.一种基于车辆通行区段特征的轨迹重构的方法,其特征在于,包括步骤:s1、获取高速公路门架的路网拓扑数据和车辆etc交易数据;s2、基于所述路网拓扑数据中的所有门架节点,遍历选取任意两门架节点分别作为起点、终点,以得到各起点和终点之间的最短路径轨迹,并定义除了最短路径上的门架节点以外的其他能到达终点所需经过的门架节点为偏离点,再次遍历计算起点门架节点到各偏离点的最短路径轨迹、各偏离点到终点门架的最短路径轨迹并组合作为待选路径轨迹,基于最短路径轨迹和待选路径轨迹以得到二义性路径库;s3、基于所述车辆etc交易数据生成车辆行程轨迹,将所述车辆行程轨迹与所述路网拓扑数据进行对比,并对该行程轨迹上不直接连通的门架节点之间所形成的异常区段,采用随机森林模型估算该异常区段轨迹的区段行程距离;s4、基于行程轨迹、异常区段行程距离、二义性路径库,以得到车辆在通行区段下的实际通行重构轨迹。2.根据权利要求1所述的一种基于车辆通行区段特征的轨迹重构的方法,其特征在于,所述etc交易数据包括车辆在行驶过程中的etc交易标识、经过的门架信息、经过的etc入口收费站信息、交易时间。3.根据权利要求2所述的一种基于车辆通行区段特征的轨迹重构的方法,其特征在于,步骤s3中,所述车辆行程轨迹的生成步骤具体包括:s3.1、获取车辆收费站交易流水数据,所述车辆出口收费站交易流水数据包括收费站交易标识、交易时间、站点入口收费站信息;s3.2、基于车辆etc交易数据和车辆收费站交易流水数据,将其中具有相同交易标识的交易数据进行聚合并按照交易时间排序,以构建所述车辆行程轨迹。4.根据权利要求3所述的一种基于车辆通行区段特征的轨迹重构的方法,其特征在于,高速公路门架的路网拓扑数据包括多个相邻两门架之间形成的连通性区段;步骤s3中的对比具体为:将所述车辆行程轨迹与所述路网拓扑数据中的各连通性区段进行对比,以得到该行程轨迹上不直接连通的门架节点对之间所形成的异常区段。5.根据权利要求4所述的一种基于车辆通行区段特征的轨迹重构的方法,其特征在于,步骤s3中随机森林模型的训练过程,包括:a、获取训练样本集,所述训练样本集中的训练样本均包括车辆行程轨迹中的etc交易数据信息,训练样本还包括车辆行程轨迹中途径的各门架之间的距离信息;b、对训练样本集进行数据预处理;c、基于预处理后的训练样本集对随机森林模型进行训练,以构建出可估计任意区段行程距离的随机森林模型。6.根据权利要求5所述的一种基于车辆通行区段特征的轨迹重构的方法,其特征在于,训练样本还包括车辆的类型信息、对应车辆行车路径中的车流量信息。7.根据权利要求5所述的一种基于车辆通行区段特征的轨迹重构的方法,其特征在于,步骤s4中所述采用随机森林模型估算该区段轨迹的行程轨迹距离,具体为:输入所述不直接连通的两门架信息以及车辆与该两门架相应的etc交易数据信息至训练后随机森林模型,从而估计得到该两门架形成的异常区段的区段行程距离。
8.根据权利要求5所述的一种基于车辆通行区段特征的轨迹重构的方法,其特征在于,所述步骤b中,数据预处理包括对训练样本集中的异常etc交易数据信息进行去除。9.根据权利要求8所述的一种基于车辆通行区段特征的轨迹重构的方法,其特征在于,所述步骤b中,数据预处理还包括对训练样本集中的etc交易数据进行归一化处理。10.根据权利要求1所述的一种基于车辆通行区段特征的轨迹重构的方法,其特征在于,所述步骤s4,具体包括:s4.1、根据行程轨迹距离在二义性路径库中搜索得到与该行程轨迹距离匹配的所有路径;s4.2、在匹配得到的所有路径中根据异常区段的形成距离筛选得到包括所述区段轨迹中两门架节点的路径,以作为车辆在该区段下的实际通行重构轨迹。
技术总结
本发明公开了一种基于车辆通行区段特征的轨迹重构的方法,包括步骤:基于获取的高速公路门架的路网拓扑数据中的所有门架节点,构建二义性路径库;基于车辆ETC交易数据生成车辆的行程轨迹,与高速公路门架的路网拓扑数据进行对比,并对该行程轨迹上不直接连通的门架节点之间所形成的异常区段,采用随机森林模型估算该区段轨迹的区段行程距离;基于行程轨迹、异常区段轨迹、区段行程距离、二义性路径库,以得到车辆在相应区段下的实际通行重构轨迹。本发明通过采用深度约束的迪杰斯特拉算法,而非用最短路径代替实际路径,对高速公路二义性路径进行提取并构建了更为全面、精确的二义性轨迹数据库,解决基于门架的通行区段数据失真,重复交易等问题。重复交易等问题。重复交易等问题。
技术研发人员:祝德莲 邹复民 许宸源 陈继峰 钟欢 罗永煜 史柔月 胡泽荣
受保护的技术使用者:福建工程学院
技术研发日:2023.05.26
技术公布日:2023/10/7
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
上一篇:一种自清洁耐腐蚀铝板的制备方法与流程 下一篇:基于导体圆环的管件胀形加工方法