一种使用随机森林模型评估照明对交叉口安全影响的方法
未命名
07-18
阅读:114
评论:0

1.本发明涉及交叉路口安全领域,具体涉及使用随机森林模型评估照明度对交叉口安全的方法。
背景技术:
2.交叉路口安全一直是解决当地道路安全挑战的重要组成部分。交叉路口在大小、形状、入口车道数量和转弯车道数量方面可能会有很大差异。信号交叉路口通常是人流量最大的交叉路口类型,并且操作复杂,许多因素导致潜在的安全问题。交叉路口和在交叉路口转弯等操作可能会导致车辆与其他车辆、行人和骑自行车的人发生冲突。在城市地区,超过50%的车祸和在农村地区超过30%的车祸都归因于交叉路口。根据美国国家公路交通安全管理局(nhtsa)的报告,在过去几年中,与交叉路口相关的死亡人数平均占所有交通死亡人数的25%,约占所有交通伤害的50%。
3.交叉口的照明是影响夜间安全性的关键要素之一。国际照明委员会(cie)透露,超过半数的事故发生在夜间,表明与白天相比,夜间碰撞的比例更高,照明水平差会导致严重的安全问题和道路交通事故。在不同交通量条件下,平均道路亮度与安全性之间存在统计学上显著的关系,并且事故率随着能见度水平的增加而降低。因此,在交叉口的驾驶环境中保持适当的照度对于驾驶安全至关重要。综上,亟需一种可以评估照明度对交叉口安全的方法,对于驾驶员实时速度检测的交叉口智能照明系统的设计具有重要意义,管理机构也可根据评估方法制定可量化的措施来提高交叉口的安全水平。
技术实现要素:
4.本发明针对交叉路口存在问题,提供一种使用随机森林模型评估照明度对交叉口安全的方法。
5.本发明提出评估照明度对交叉口安全的方法,以交叉口入口车道行驶前后的速度差作为计算驾驶员速度变化的依据,并采用随机森林方法建立由车速变化的输出变量和照明等交通特性的输入变量组成的回归模型。该方法可以分析各特征变量对于驾驶员通过交叉路口车辆速度的影响,以及在不同场景下计算出满足驾驶员安全驾驶的照明度值。
6.本发明的技术方案是:
7.一种使用随机森林模型评估照明度对交叉口安全的方法,包括如下步骤:
8.1、设计实验步骤;
9.在典型工作日(例如周二、周三、周四)夜间进行现场试验。选取的交叉路口大小、环境条件应尽可能相同,且都处于信号控制之下。每个交叉口都应有中线、机动车和非机动车分隔线以及左转专用车道。所有交叉口的车速都限制在50km/h以内。利用激光测距仪测量了入口通道的宽度。
10.使用无人机获取特定视频用于初始交通数据采集,并在每个交叉口进行了相同时长的调查。利用gps对飞行器的飞行高度、电荷水平等参数进行识别。当前方法仅使用水平
双向道路上的车辆和其他交通数据。
11.此外,在拍摄视频时,还需同时记录了各个路口的照明度(illuminance)。将机器被放置在地面上,用来测量人行道周围的照度,并夜间每隔固定时间段测量一次照度。每个交叉口在一个时间段共记录12个点(记录点分别为4条人行道的起点、中间、终点)。最后将人行道周围的12个照度值取平均值,计算出相应时间段内记录的交叉口照度,照明度计算表达式如下:
[0012][0013]
2、处理数据;
[0014]
为考察光照对驾驶员通过交叉口时车速变化的影响,首先对于无人机采集数据进行筛选。其中,一个有效的事件或事件被定义为驾驶员在没有其他干扰的情况下通过路口的入口。视频处理中车辆选择的标准包括:
[0015]
1)所有选择的车辆都不受其他交互(如其他车辆或行人)的影响。
[0016]
2)自由通过交叉口的车辆(不包括信号为红灯停止的车辆)。
[0017]
3)在数据集中没有涉及转弯车辆。
[0018]
视频数据识别后,利用tracker软件对视频进行处理,获得交叉口入口前后绿灯时段车辆的轨迹数据和车速数据。使用该软件,一次只能自动跟踪一辆车辆。每一辆车都可以看作是一个粒子,并以每秒24帧的速度被捕捉。tracker可以通过像素坐标和像素速度的转换,计算出实际的坐标值和速度值。然后从软件中得到各车辆的参数t(即时间)、x(即横坐标)、y(即纵轴)、v(即速度)。
[0019]
3、分析变量及数据;
[0020]
本发明以速度变化为因变量,测量交叉口驾驶员的安全度。速度变化是测量同一辆车在速度方面的特征变化,速度变化是评估安全性的一种有用的方法,速度变化越大,事故发生率越高。驾驶员在交叉口入口车道前后的车速变化幅度较小,预示着安全驾驶。速度变化量的计算公式为:
[0021]
δv=v
s-vo,
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0022]
式中,vs为交叉口起始交叉口区域(本研究中为5米长)的车速平均值;vo表示初始速度,计算值为开始通过交叉口(即距离起始交叉口线60~40米)前的车速平均值。
[0023]
本发明中使用的自变量包括照度(illuminance)、初速度(v0)、左转弯车流量(leftv)、右转弯车流量(right tv)、直行车流量(straightv)、总车流量(totalv)、直行与右转弯车流量之比(ratiosr)、入口车道数(numlane)。交叉口的照度按式(1)计算。接着,利用线性插值计算特定时间点的照度值。线性插值是一种利用线性多项式进行曲线拟合的方法,在一组已知的离散数据点的范围内构造新的数据点。本实验每间隔固定时间段统计一次所有交通流量,包括左转、右转、直行和总车流量。同样,通过线性插值得到随机时间点的交通流量。
[0024]
4、建立模型及确定评价指标;
[0025]
本发明采用随机森林模型(random forest,rf)模拟交叉口灯光等交通要素对驾驶员速度变化的影响。随机从数据集中采样并训练模型中的每棵决策树,最后再将每棵决策树的结果进行整合。与线性模型相比,随机森林回归模型能够捕获特征与目标之间的非
线性交互作用,快速分析各数据特征与标签数据的相关性。能够很好地处理具有数值特征的表格数据,或少于数百个类别的类别特征。
[0026]
rf算法可以基于一组决策树进行回归建模,并结合bagging(引导聚合算法)和bootstrapping(自助法)技术进行操作。本发明的rf算法流程如下:
[0027]
41)bootstrapping:每个基分类器都是一个简单的决策树。每棵树都是通过从训练数据集中选择一组随机的观察数据来构建的。所有基本模型都是使用数据集的不同子样本独立构建的。所选的数据样本(大约三分之二的情况)称为引导样本,剩余的数据样本(大约三分之一的情况)称为外袋样本。
[0028]
42)training:rf模型生成了一个有多棵决策树的森林,其中每棵树包含所有特征的一个随机子集(即,illuminance,v0,leftv,righttv,straightv,totalv,ratiosr和numlane中的部分特征),按照上述建立决策树的方式获得最佳分割。
[0029]
43)testing/vote:对新样本/测试样本的预测可以通过对所有决策树的预测取平均,或者对决策树采取多数投票来实现。本发明中rf算法的最终回归结果是通过对所有建立在自举样本上决策树的输出求平均得到的。
[0030]
rf可以计算出oob样本的均方误差(mse)。较低的错误率可以消除对测试验证(如交叉验证)的需要。在rf回归模型中,为了验证模型的准确性,将平方残差均值(mean of squared residuals,mse)和解释百分比方差(percent variance explained)作为评价指标。
[0031]
均方误差的计算方法如下:
[0032][0033]
其中,表示将第i棵树的oob数据代入后的预测数据,yi是第i棵树的真实数据。解释百分比方差(percent variance explained,%vareplained)计算方法如下:
[0034][0035]
式中,是以n为除数进行计算;可以用%varexplained的值可以表示rf模型的精度,该值越大,表示模型精度越高。
[0036]
重要的是,当对该变量的(oob)数据进行排列,而其他所有变量保持不变时,rf可以通过计算预测误差的增量来计算特征变量重要性。与其他模型相比,随机森林分析的明显优势包括:不存在过拟合的可能性,多棵树生长时产生的泛化误差有限;通过减少在可变抽样中选择高度相关特征的可能性来缓解多重共线性问题。在rf算法中,保留了高度相关特征的贡献,从而不会对排名靠前的有影响力特征造成太大影响。与svm等其他分类器不同,rf中的随机过程可以在有许多噪声特征时保持高性能。
[0037]
5、训练模型及分析结果;
[0038]
从无人机视频中识别出有效的车辆跟踪片段。采用1个因变量(如速度变化)和8个自变量(如初速度、照明度等)进行分析。
[0039]
随机森林算法在r((64 3.3.3)软件中开发。该数据集被随机分成两部分,其中70%的数据集定义为训练数据,其余30%用作测试数据。该模型需要两个主要参数:决策树的数量(n
tree
)和每棵树中的变量数量(m
try
)。m
try
值越大,表示每棵树的强度和树间相关性
的越大。因此,在rf分析中,选择一个合适m
try
值至关重要。对于回归问题而言,建议的特性/输入变量为总数1/3的0.5/1/2倍。
[0040]
分析rf测试数据的拟合优度(解释的百分比方差),计算最终模型中各变量的重要性,表示其对预测响应的贡献。为了进一步定量地探讨照明度与交叉口安全之间的定量关系,在所有选定的数据集上显示二维核密度图,研究不同照明度、初始速度和直线车流量的速度变化情况。二维核密度图是散点图的平滑颜色密度表示,基于核密度估计的概率密度函数的非参数技术。密度估计的目标是获取有限的数据样本,并推断所有地方的潜在概率密度函数,包括没有数据点的地方。在核密度估计中,将每个数据点的贡献从单个点平滑到邻近区域。这些平滑的密度图显示了散点图的平均趋势。
[0041]
本发明的工作原理:本发明利用无人机获取各个交叉口特定视频用于初始交通数据采集,并以车速变化作为安全评价指标,计算通过路口入口车道前后的车速差值。建立随机森林模型(rf),对车速变化、照明度、初速度、左转弯车流量、右转弯车流量、直行车流量、总车流量、直行与右转弯车流量之比和入口车道数等变量进行回归分析。
[0042]
本发明的优点:本发明可以分析各特征变量对于驾驶员通过交叉路口车辆速度的影响,以及在不同场景下计算出满足驾驶员安全驾驶的照明度值,对于洞察基于驾驶员实时速度检测的交叉口智能照明系统的设计具有重要意义。管理机构可以根据该方法制定可量化的措施来提高交叉口的安全水平。
附图说明
[0043]
图1(a)-图1(d)是本发明四个交叉口几何形状图(白天拍摄垂直视图),其中,图1(a)是黄山-兴隆街交叉口,图1(b)是乐山-兴隆街交叉口,图1(c)是泰山-奥体街交叉口,图1(d)是黄山-梦都街交叉口;
[0044]
图2是本发明无人机拍摄界面截图;
[0045]
图3是本发明tracker软件视频处理过程;
[0046]
图4是本发明车辆速度变化计算示意图;
[0047]
图5是本发明rf算法回归建模流程图;
[0048]
图6是本发明不同照度条件下速度变化分布图;
[0049]
图7(a)-图7(b)是本发明不同初始速度场景下速度随照度变化分布图,其中图7(a)是低速场景下速度随照度变化分布图;图7(b)是高速场景下速度随照度变化分布图;
[0050]
图8(a)-图8(b)是本发明不同直行车流量场景下速度随照度变化分布图,图8(a)是低车流量场景下速度随照度变化分布图;图8(b)是高车流量场下速度随照度变化分布图。
具体实施方式
[0051]
下面结合附图,进一步说明本发明的技术方案。
[0052]
本发明的使用随机森林模型评估照明度对交叉口安全的方法:包括如下步骤:
[0053]
1、设计实验步骤;
[0054]
2017年11月10日至12月18日,在典型工作日(周二、周三、周四)夜间17:30至19:30进行现场试验。本次选取中国江苏省南京市建邺区的4个交叉口(黄山-兴隆街交叉口、乐
山-兴隆街交叉口、泰山-奥体街交叉口、黄山-梦都街交叉口)进行数据采集。图1显示了城市四个信号交叉口在白天的垂直视图。这四个路口的大小都差不多,都处于信号控制之下。每个交叉口都应有中线、机动车和非机动车分隔线以及左转专用车道。所有交叉口的车速都限制在50km/h以内。利用激光测距仪测量了入口通道的宽度。表1列出了这四个路口的车道数和入口宽度。
[0055]
表1路口入口的车道数和宽度
[0056][0057]
使用无人机(dji phantom 3advanced)获取特定视频用于初始交通数据采集,并在每个交叉口进行了两个小时的调查。图2为无人机操作界面截图。利用gps对飞行器的飞行高度、电荷水平等参数进行识别。当前方法仅使用水平双向道路上的车辆和其他交通数据。
[0058]
此外,在拍摄视频时,还需同时记录了四个路口的照明度(illuminance)。本次使用照度计(柯尼卡美能达,t-10a)以lux为单位测量照度。将机器被放置在地面上,用来测量人行道周围的照度,并夜间每隔固定时间段测量一次照度。每个交叉口在一个时间段(本次时常为15分钟)共记录12个点(记录点分别为4条人行道的起点、中间、终点)。最后将人行道周围的12个照度值取平均值,计算出相应时间段内记录的交叉口照度,照明度计算表达式如下:
[0059][0060]
2、处理数据;
[0061]
为考察光照对驾驶员通过交叉口时车速变化的影响,首先对于无人机采集数据进行筛选。其中,一个有效的事件或事件被定义为驾驶员在没有其他干扰的情况下通过路口的入口。视频处理中车辆选择的标准包括:
[0062]
1)所有选择的车辆都不受其他交互(如其他车辆或行人)的影响。
[0063]
2)自由通过交叉口的车辆(不包括信号为红灯停止的车辆)。
[0064]
3)在数据集中没有涉及转弯车辆。
[0065]
视频数据识别后,利用tracker软件对视频进行处理,获得交叉口入口前后绿灯时段车辆的轨迹数据和车速数据,如图3所示。使用该软件,一次只能自动跟踪一辆车辆。每一辆车都可以看作是一个粒子,并以每秒24帧的速度被捕捉。tracker可以通过像素坐标和像素速度的转换,计算出实际的坐标值和速度值。然后从软件中得到各车辆的参数t(即时间)、x(即横坐标)、y(即纵轴)、v(即速度)。
[0066]
3、分析变量及数据;
[0067]
本发明以速度变化为因变量,测量交叉口驾驶员的安全度。速度变化是测量同一辆车在速度方面的特征变化,速度变化是评估安全性的一种有用的方法,速度变化越大,事
故发生率越高。驾驶员在交叉口入口车道前后的车速变化幅度较小,预示着安全驾驶。图4显示了本研究中车辆速度变化的计算过程。速度变化量的计算公式为:
[0068]
δv=v
s-vo,
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0069]
式中,vs为交叉口起始区域(本研究中为5米长)的车速平均值;vo表示初始速度,计算值为开始通过交叉口(即距离起始交叉口线60~40米)前的车速平均值。
[0070]
本发明中使用的自变量包括照度(illuminance)、初速度(v0)、左转弯车流量(leftv)、右转弯车流量(right tv)、直行车流量(straightv)、总车流量(totalv)、直行与右转弯车流量之比(ratiosr)、入口车道数(numlane)。交叉口的照度按式(1)计算。夜间每15分钟记录一次照度,并利用线性插值计算特定时间点的照度值。线性插值是一种利用线性多项式进行曲线拟合的方法,在一组已知的离散数据点的范围内构造新的数据点。本实验每5分钟统计一次所有交通流量,包括左转、右转、直行和总车流量。同样,通过线性插值得到随机时间点的交通流量。
[0071]
4、建立模型及确定评价指标;
[0072]
本发明采用随机森林模型(random forest,rf)模拟交叉口灯光等交通要素对驾驶员速度变化的影响。随机从数据集中采样并训练模型中的每棵决策树,最后再将每棵决策树的结果进行整合。与线性模型相比,随机森林回归模型能够捕获特征与目标之间的非线性交互作用,快速分析各数据特征与标签数据的相关性。能够很好地处理具有数值特征的表格数据,或少于数百个类别的类别特征。
[0073]
rf算法可以基于一组决策树进行回归建模,并结合bagging(引导聚合算法)和bootstrapping(自助法)技术进行操作。如图5所示,本发明的rf算法流程如下:
[0074]
1)bootstrapping:每个基分类器都是一个简单的决策树。每棵树都是通过从训练数据集中选择一组随机的观察数据来构建的。所有基本模型都是使用数据集的不同子样本独立构建的。所选的数据样本(大约三分之二的情况)称为引导样本,剩余的数据样本(大约三分之一的情况)称为外袋样本。
[0075]
2)training:rf模型生成了一个有多棵决策树的森林,其中每棵树包含所有特征的一个随机子集(即,illuminance,v0,leftv,righttv,straightv,totalv,ratiosr和numlane中的部分特征),按照上述建立决策树的方式获得最佳分割。
[0076]
3)testing/vote:对新样本/测试样本的预测可以通过对所有决策树的预测取平均,或者对决策树采取多数投票来实现。本发明中rf算法的最终回归结果是通过对所有建立在自举样本上决策树的输出求平均得到的。
[0077]
rf可以计算出oob样本的均方误差(mse)。较低的错误率可以消除对测试验证(如交叉验证)的需要。在rf回归模型中,为了验证模型的准确性,将平方残差均值(mean of squared residuals,mse)和解释百分比方差(percent variance explained)作为评价指标。
[0078]
均方误差的计算方法如下:
[0079][0080]
其中,表示将第i棵树的oob数据代入后的预测数据,yi是第i棵树的真实数据。解释百分比方差(percent variance explained,%varexplained)计算方法如下:
[0081][0082]
式中,是以n为除数进行计算;可以用%varexplained的值可以表示rf模型的精度,该值越大,表示模型精度越高。
[0083]
重要的是,当对该变量的(oob)数据进行排列,而其他所有变量保持不变时,rf可以通过计算预测误差的增量来计算特征变量重要性。与其他模型相比,随机森林分析的明显优势包括:不存在过拟合的可能性,多棵树生长时产生的泛化误差有限;通过减少在可变抽样中选择高度相关特征的可能性来缓解多重共线性问题。在rf算法中,保留了高度相关特征的贡献,从而不会对排名靠前的有影响力特征造成太大影响。与svm等其他分类器不同,rf中的随机过程可以在有许多噪声特征时保持高性能。
[0084]
5、训练模型及分析结果;
[0085]
从无人机视频中共识别出213个有效的车辆跟踪片段。采用1个因变量(如速度变化)和8个自变量(如初速度、照明度等)进行分析。表2概括了本发明中所选数据集的所有变量的具体特征。
[0086]
表2变量特征表
[0087][0088]
随机森林算法在r((64 3.3.3)软件中开发。该数据集被随机分成两部分,其中70%的数据集定义为训练数据,其余30%用作测试数据。该模型需要两个主要参数:决策树的数量(n
tree
)和每棵树中的变量数量(m
try
)。m
try
值越大,表示每棵树的强度和树间相关性的越大。因此,在rf分析中,选择一个合适m
try
值至关重要。对于回归问题而言,建议的特性/输入变量为总数1/3的0.5/1/2倍(在本次研究中等于2/3/6),n
tree
的值是200/300/500。为了避免在小数据集上应用rf分析时出现过拟合问题,对这两个参数的推荐值进行了测试。最后在本发明中设置m
try
=3和n
tree
=500以满足oob误差最小和“解释百分比方差”最大值的要求。
[0089]
rf分析结果发现,测试数据的拟合优度(解释的百分比方差)为86.44%,该回归模型的精度较高。计算最终模型中各变量的重要性,表示其对预测响应的贡献,如表3所示。由表可知,初速度、照明度和直行车流量是最终模型中最重要的三个变量,rf重要性分别为23.47、20.43和13.29。表明在本研究中,开始通过交叉口前的初始速度对车速变化的影响最大,其次是照明度和直行车流量。
[0090]
表3各特征rf重要性等级
[0091][0092]
为了进一步定量地探讨照明度与交叉口安全之间的定量关系,在所有选定的数据集上显示二维核密度图,研究不同照明度、初始速度和直线车流量的速度变化情况。二维核密度图是散点图的平滑颜色密度表示,基于核密度估计的概率密度函数的非参数技术。密度估计的目标是获取有限的数据样本,并推断所有地方的潜在概率密度函数,包括没有数据点的地方。在核密度估计中,将每个数据点的贡献从单个点平滑到邻近区域。这些平滑的密度图显示了散点图的平均趋势。
[0093]
(1)照明度
[0094]
二维核密度图描述了不同照度值时速度变化的分布,如图6所示。显而易见的是,当照度在40~50勒克斯之间时,速度变化稳定地聚集在零附近。司机可以有安全的驾驶能见度,然后保持他们的速度通过交叉口在绿灯时间,当灯光范围在40~50勒克斯。我们还可以观察到,在速度变化分布随照度变化的两侧有两种完全不同的变化趋势。当照度在30lux以下,特别是在10lux以下时,速度变化在0~20km/h之间分布广泛。这说明在这种光照条件下,驾驶员可能没有很清楚地观察到交叉口,然后采取不同程度的减速通过交叉口。当照度在60勒克斯以上时,有16种速度变化在5km/h以上的情况。这意味着这种照明可以满足司机的能见度,司机可能会在交叉口积极加速。因此,本研究强烈建议交叉口照度设置在40~50lux之间,既考虑行车安全,又兼顾能耗。
[0095]
(2)初始速度
[0096]
研究了不同初始速度下速度变化与照度的关系。由表2可知,初始速度的均值为42.49km/h,中值为40km/h。因此,在本研究中将初始速度小于40km/h定义为低速场景,初始速度大于40km/h定义为高速场景。图7(a)和图7(b)分别是低速和高速情况下速度随照度变化分布的二维核密度图。从图中可以看出,低的初速度随着高照度(50lux以上)有增大的趋势,而高的初速度随着照度(40lux以下)有减小的趋势。这表明高速比低速更需要高照度(高于40勒克斯)。同时得出40~50lux的照度是在低、高初速度下到达交叉口的驾驶员的最佳选择。
[0097]
(3)直行车流量
[0098]
研究了不同直行车流量条件下速度随照度变化的分布,如图8所示。在本研究中将400/h以下的车流量定义为车流量较小场景,400/h以上的车流量定义为车流量较大场景。结果表明,与车流量较小场景相比,车流量较大场景下不同照度下的速度变化分布特征相对不明显。照明对交叉口速度变化的影响可能相对不显著。这可能是由于车流量较大场景下的跟车行为引起的。
技术特征:
1.一种使用随机森林模型评估照明度对交叉口安全的方法,包括如下步骤:1、设计实验步骤;在典型工作日夜间进行现场试验;选取的交叉路口大小、环境条件应尽可能相同,且都处于信号控制之下;每个交叉口都应有中线、机动车和非机动车分隔线以及左转专用车道;所有交叉口的车速都限制在50km/h以内;利用激光测距仪测量了入口通道的宽度;使用无人机获取特定视频用于初始交通数据采集,并在每个交叉口进行了相同时长的调查;利用gps对飞行器的飞行高度、电荷水平等参数进行识别;当前方法仅使用水平双向道路上的车辆和其他交通数据;此外,在拍摄视频时,还需同时记录了各个路口的照明度(illuminance);将机器被放置在地面上,用来测量人行道周围的照度,并夜间每隔固定时间段测量一次照度;每个交叉口在一个时间段共记录12个点(记录点分别为4条人行道的起点、中间、终点);最后将人行道周围的12个照度值取平均值,计算出相应时间段内记录的交叉口照度,照明度计算表达式如下:2、处理数据;为考察光照对驾驶员通过交叉口时车速变化的影响,首先对于无人机采集数据进行筛选;其中,一个有效的事件或事件被定义为驾驶员在没有其他干扰的情况下通过路口的入口;视频处理中车辆选择的标准包括:1)所有选择的车辆都不受其他交互的影响;2)自由通过交叉口的车辆,不包括信号为红灯停止的车辆;3)在数据集中没有涉及转弯车辆;视频数据识别后,利用tracker软件对视频进行处理,获得交叉口入口前后绿灯时段车辆的轨迹数据和车速数据;使用该软件,一次只能自动跟踪一辆车辆;每一辆车都可以看作是一个粒子,并以每秒24帧的速度被捕捉;tracker可以通过像素坐标和像素速度的转换,计算出实际的坐标值和速度值;然后从软件中得到各车辆的参数:时间t、横坐标x、纵轴y、速度v;3、分析变量及数据;以速度变化为因变量,测量交叉口驾驶员的安全度;速度变化是测量同一辆车在速度方面的特征变化,速度变化是评估安全性的一种有用的方法,速度变化越大,事故发生率越高;驾驶员在交叉口入口车道前后的车速变化幅度较小,预示着安全驾驶;速度变化量的计算公式为:δv=v
s-v
o
,
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)式中,v
s
为交叉口起始交叉口区域的车速平均值;v
o
表示初始速度,计算值为开始通过交叉口前的车速平均值;自变量包括照度(illuminance)、初速度(v0)、左转弯车流量(leftv)、右转弯车流量(right tv)、直行车流量(straightv)、总车流量(totalv)、直行与右转弯车流量之比(ratiosr)、入口车道数(numlane);交叉口的照度按式(1)计算;接着,利用线性插值计算特定时间点的照度值;线性插值是一种利用线性多项式进行曲线拟合的方法,在一组已知的
离散数据点的范围内构造新的数据点;每间隔固定时间段统计一次所有交通流量,包括左转、右转、直行和总车流量;同样,通过线性插值得到随机时间点的交通流量;4、建立模型及确定评价指标;采用随机森林模型(random forest,rf)模拟交叉口灯光等交通要素对驾驶员速度变化的影响;随机从数据集中采样并训练模型中的每棵决策树,最后再将每棵决策树的结果进行整合;与线性模型相比,随机森林回归模型能够捕获特征与目标之间的非线性交互作用,快速分析各数据特征与标签数据的相关性;能够很好地处理具有数值特征的表格数据,或少于数百个类别的类别特征;rf算法可以基于一组决策树进行回归建模,并结合bagging(引导聚合算法)和bootstrapping(自助法)技术进行操作;rf算法流程如下:41)bootstrapping:每个基分类器都是一个简单的决策树;每棵树都是通过从训练数据集中选择一组随机的观察数据来构建的;所有基本模型都是使用数据集的不同子样本独立构建的;所选的数据样本称为引导样本,剩余的数据样本称为外袋样本;42)training:rf模型生成了一个有多棵决策树的森林,其中每棵树包含所有特征的一个随机子集(即,illuminance,v0,leftv,righttv,straightv,totalv,ratiosr和numlane中的部分特征),按照上述建立决策树的方式获得最佳分割;43)testing/vote:对新样本/测试样本的预测可以通过对所有决策树的预测取平均,或者对决策树采取多数投票来实现;rf算法的最终回归结果是通过对所有建立在自举样本上决策树的输出求平均得到的;rf可以计算出oob样本的均方误差(mse);较低的错误率可以消除对测试验证的需要;在rf回归模型中,为了验证模型的准确性,将平方残差均值(mean of squared residuals,mse)和解释百分比方差(percent variance explained)作为评价指标;均方误差的计算方法如下:其中,表示将第i棵树的oob数据代入后的预测数据,y
i
是第i棵树的真实数据;解释百分比方差(percent variance explained,%varexplained)计算方法如下:式中,是以n为除数进行计算;可以用%varexplained的值可以表示rf模型的精度,该值越大,表示模型精度越高;重要的是,当对该变量的(oob)数据进行排列,而其他所有变量保持不变时,rf可以通过计算预测误差的增量来计算特征变量重要性;与其他模型相比,随机森林分析的明显优势包括:不存在过拟合的可能性,多棵树生长时产生的泛化误差有限;通过减少在可变抽样中选择高度相关特征的可能性来缓解多重共线性问题;在rf算法中,保留了高度相关特征的贡献,从而不会对排名靠前的有影响力特征造成太大影响;与svm等其他分类器不同,rf中的随机过程可以在有许多噪声特征时保持高性能;5、训练模型及分析结果;从无人机视频中识别出有效的车辆跟踪片段;采用1个因变量和8个自变量进行分析;
随机森林算法在r((64 3.3.3)软件中开发;该数据集被随机分成两部分,其中70%的数据集定义为训练数据,其余30%用作测试数据;该模型需要两个主要参数:决策树的数量(n
tree
)和每棵树中的变量数量(m
try
);m
try
值越大,表示每棵树的强度和树间相关性的越大;因此,在rf分析中,选择一个合适m
try
值至关重要;分析rf测试数据的拟合优度,计算最终模型中各变量的重要性,表示其对预测响应的贡献;为了进一步定量地探讨照明度与交叉口安全之间的定量关系,在所有选定的数据集上显示二维核密度图,研究不同照明度、初始速度和直线车流量的速度变化情况;二维核密度图是散点图的平滑颜色密度表示,基于核密度估计的概率密度函数的非参数技术;密度估计的目标是获取有限的数据样本,并推断所有地方的潜在概率密度函数,包括没有数据点的地方;在核密度估计中,将每个数据点的贡献从单个点平滑到邻近区域;这些平滑的密度图显示了散点图的平均趋势。2.如权利要求1所述的一种使用随机森林模型评估照明度对交叉口安全的方法,其特征在于:步骤1所述的典型工作日是周二或周三或周四。3.如权利要求1所述的一种使用随机森林模型评估照明度对交叉口安全的方法,其特征在于:步骤3所述的交叉口起始交叉口区域v
s
是5米长的车速平均值;v
o
表示初始速度,计算值为距离起始交叉口线60~40米前的车速平均值。4.如权利要求1所述的一种使用随机森林模型评估照明度对交叉口安全的方法,其特征在于:步骤41)所述的引导样本占数据样本的三分之二,外袋样本占数据样本的三分之一。5.如权利要求1所述的一种使用随机森林模型评估照明度对交叉口安全的方法,其特征在于:步骤5)所述的因变量是速度变,所述的自变量包括初速度、照明度。6.如权利要求1所述的一种使用随机森林模型评估照明度对交叉口安全的方法,其特征在于:步骤5)所述的变量数量(m
try
),对于回归问题而言,特性/输入变量为总数1/3的0.5/1/2倍。
技术总结
一种使用随机森林模型评估照明度对交叉口安全的方法,包括:1、设计实验步骤;2、处理数据;3、分析变量及数据;4、建立模型及确定评价指标;5、训练模型及分析结果。本发明以交叉口入口车道行驶前后的速度差作为计算驾驶员速度变化的依据,并采用随机森林方法建立由车速变化的输出变量和照明等交通特性的输入变量组成的回归模型。本发明可以分析各特征变量对于驾驶员通过交叉路口车辆速度的影响,以及在不同场景下计算出满足驾驶员安全驾驶的照明度值。度值。度值。
技术研发人员:汪圆 贾晨雨 杜文俊 殷玉明 方浩杰
受保护的技术使用者:浙江工业大学
技术研发日:2022.12.31
技术公布日:2023/5/23

版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/