CN113077625A - 一种道路交通事故形态预测方法 - Google Patents
一种道路交通事故形态预测方法 Download PDFInfo
- Publication number
- CN113077625A CN113077625A CN202110312213.8A CN202110312213A CN113077625A CN 113077625 A CN113077625 A CN 113077625A CN 202110312213 A CN202110312213 A CN 202110312213A CN 113077625 A CN113077625 A CN 113077625A
- Authority
- CN
- China
- Prior art keywords
- traffic accident
- formula
- association rule
- variables
- variable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 206010039203 Road traffic accident Diseases 0.000 title claims abstract description 98
- 238000000034 method Methods 0.000 title claims abstract description 33
- 230000003993 interaction Effects 0.000 claims abstract description 20
- 238000010187 selection method Methods 0.000 claims abstract description 9
- 238000012545 processing Methods 0.000 claims abstract description 7
- 230000008569 process Effects 0.000 claims abstract description 6
- 239000006185 dispersion Substances 0.000 claims abstract description 5
- 238000005065 mining Methods 0.000 claims abstract description 5
- 238000007476 Maximum Likelihood Methods 0.000 claims abstract description 4
- 230000014509 gene expression Effects 0.000 claims description 12
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 claims description 6
- 102000003712 Complement factor B Human genes 0.000 claims description 6
- 108090000056 Complement factor B Proteins 0.000 claims description 6
- 239000011541 reaction mixture Substances 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 5
- 238000013507 mapping Methods 0.000 claims description 3
- 230000006872 improvement Effects 0.000 abstract description 2
- 238000007418 data mining Methods 0.000 abstract 1
- 230000034994 death Effects 0.000 description 8
- 231100000517 death Toxicity 0.000 description 8
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W30/00—Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units
- B60W30/08—Active safety systems predicting or avoiding probable or impending collision or attempting to minimise its consequences
- B60W30/095—Predicting travel path or likelihood of collision
- B60W30/0956—Predicting travel path or likelihood of collision the prediction being responsive to traffic or environmental parameters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/16—Anti-collision systems
- G08G1/166—Anti-collision systems for active traffic, e.g. moving vehicles, pedestrians, bikes
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/16—Anti-collision systems
- G08G1/167—Driving aids for lane monitoring, lane changing, e.g. blind spot detection
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Theoretical Computer Science (AREA)
- Operations Research (AREA)
- Transportation (AREA)
- Quality & Reliability (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Automation & Control Theory (AREA)
- Game Theory and Decision Science (AREA)
- Mechanical Engineering (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Traffic Control Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种道路交通事故形态预测方法,其步骤如下:1、采集和处理道路交通事故数据;2、采用最小描述长度准则对交通事故数据中的连续自变量进行离散化;3、采用数据挖掘领域中基于关联规则的属性选择方法,挖掘自变量间的交互作用;4、建立混合Logit模型,并采用极大似然估计法进行参数估计;5、基于构建的混合Logit模型,进行交通事故形态概率的预测。本发明在连续自变量离散过程中充分利用预测变量的信息并挖掘变量间交互作用对事故形态的影响,以降低被离散变量的信息损失,克服忽略变量间交互作用导致错误推论的问题,从而提高交通事故形态预测模型的预测精度,为道路交通安全环境的改善提供技术支持。
Description
技术领域
本发明涉及一种道路交通事故形态预测方法,属于道路交通安全分析技术领域。
背景技术
《道路安全全球现状报告2018》数据显示,全球每年交通事故死亡人数攀升至135万人,其中,80%的死亡交通事故发生在中等收入国家。作为最大的中等收入国家,中国每年发生24万余起交通事故,造成6万余人死亡,交通安全形势严峻。对于不同形态的交通事故,其影响因素具有显著差异。构建交通事故形态与驾驶员、道路、环境等影响因素间的关系,从而进行交通事故形态的预测,是重要的交通安全改善措施之一。
在事故形态预测方法方面,Probit、多项Logit等固定参数离散选择模型得到了广泛的应用。然而,此类方法忽略了交通事故数据中普遍存在的未观测到的异质性,常导致有偏差的参数估计。相较于固定参数离散选择模型,混合Logit模型通过假定变量系数为随机参数反映交通事故数据的异质性。然而,该方法在事故形态预测方面存在以下问题:(1)对于交通事故数据中的连续自变量,多采用无监督离散化算法进行离散化,离散过程中无法考虑自变量与预测变量间的关系,造成被离散自变量信息损失严重;(2)交通事故的发生通常取决于多个自变量的共同作用,上述方法忽略了变量间交互作用对事故形态的影响,易导致错误的预测和推论。
发明内容
本发明为克服现有技术的不足之处,提出了一种道路交通事故形态预测方法,以期在连续自变量离散过程中充分利用预测变量的信息并挖掘变量间交互作用对事故形态的影响,以降低被离散变量的信息损失,克服忽略变量间交互作用导致错误推论的问题,从而提高交通事故形态预测模型的预测精度。
为达到上述目的,本发明采用如下技术方案:
本发明一种道路交通事故形态预测方法的特点是按如下步骤进行:
步骤1、采集和处理道路交通事故数据;
步骤1.1、从道路交通事故数据库中获取N起交通事故,构成交通事故数据D;定义交通事故数据集D中影响交通事故形态的自变量集合为X={x1,x2,…,xk,…,xK},其中,xk表示第k个自变量,k=1,2,...,K,令{x1,x2,…,xk}为分类自变量集合,{xk+1,xk+2,…,xk+l,…,xK}为连续自变量集合,l=1,2,...,K-k;
步骤1.2、依据事故发生时的具体情形,将交通事故形态分为车辆间事故y1、车辆与行人事故y2、单车事故y3,从而得到由三类事故构成的预测变量Y={y1,y2,y3};
步骤2、采用最小描述长度准则对连续自变量集合{xk+1,xk+2,…,xk+l,…,xK}进行离散化;
步骤2.1、初始化l=1;
步骤2.3、利用式(1)得到连续自变量xk+l与预测变量Y的信息熵E(D):
式(1)中,|Y|表示交通事故数据集D中预测变量Y的种类;pyi表示第i类事故yi在事故数据集D中所占的比例;i=1,2,3;
步骤2.4、根据信息增益最大化原则遍历寻找第l个连续自变量xk+l的最优离散点bl,以最优离散点bl为界将交通事故数据集D分为第一子集D1和第二子集D2,并利用式(2)计算离散所得的信息增益G(bl,D):
式(2)中,|D1|、|D2|、|D|分别表示第一子集D1、第二子集D2、交通事故数据集D中的交通事故案例数;E(D1)和E(D2)分别为第一子集D1和第二子集D2的信息熵;
步骤2.5、利用式(3)计算停止准则S:
式(3)中,|Y1|、|Y2|分别表示第一子集D1、第二子集D2中预测变量的种类;
步骤2.6、判断信息增益G(bl,D)是否大于停止准则S,若大于,则表示最优离散点bl有效,将最优离散点bl添加到离散点集合B中;分别将第一子集D1和第二子集D2替换交通事故数据集D,按照步骤2.4-步骤2.6的过程,在第一子集D1和第二子集D2中寻找下一最优离散切点;否则,执行步骤2.7;
步骤2.8、基于离散点集合B对各连续自变量进行离散化,使得所有自变量均转化为分类自变量,从而得到离散后的自变量集合XMDLP={x1,x2,…,xk,x k+1 ,x k+2 ,x k+l ,…,x K };其中,xk+l表示第k+l个分类自变量;
步骤3、采用基于关联规则的属性选择方法挖掘自变量间的交互作用;
步骤3.1、定义关联规则为A→B,其中,A为规则前件,B为规则后件,→为关系符号;将离散后的自变量集合XMDLP={x1,x2,…,xk,x k+1 ,x k+2 ,x k+l ,…,x K }中各因素分别设定为规则前件A,预测变量Y的各类别事故设定为规则后件B;
步骤3.2、分别定义关联规则A→B的支持度Support(A→B)、置信度Confidence(A→B)、提升度Lift(A→B),如式(4)、式(5)、式(6)所示:
式(4)、式(5)、式(6)中,N为交通事故的样本总数,P(A∩B)表示交通事故数据中因素A和因素B同时发生的频次;P(A)、P(B)分别表示因素A、因素B在交通事故数据中出现的频次;
步骤3.3、定义并初始化关联规则A→B的最小支持度minSup、最小置信度minConf和最小提升度minLift;
步骤3.4、挖掘关联规则A→B的支持度Support(A→B)、置信度Confidence(A→B)、提升度Lift(A→B);
步骤3.5、定义基于关联规则A→B的属性选择方法的三种受约束规则,分别是强关联规则SAR、分类关联规则CAR、原子型关联规则AAR;
步骤3.5.1、利用式(7)得到强关联规则SAR的表达式:
Support(A→B)>minSup∧Confidence(A→B)>minConf∧Lift(A→B)>minLift(7)
式(7)中,∧表示且;
步骤3.5.2、离散后的自变量集合XMDLP={x1,x2,…,xk,x k+1 ,x k+2 ,x k+l ,…,x K }中,令|xk|为第k个自变量xk的值域;1≤k≤K;
步骤3.5.4、利用式(8)得到分类关联规则CAR的表达式:
式(8)中,|B|为预测变量的种类;
步骤3.5.3、利用式(9)得到原子型关联规则AAR的表达式:
式(8)中,|A|为自变量种类的数量;
步骤3.6、令所有满足分类关联规则CAR的关联规则A→B构成CARset,满足原子型关联规则AAR的关联规则A→B构成原子型关联规则集合AARset;
步骤3.7、对原子型关联规则集合AARset中的关联规则A→B依照置信度进行降序排列;
步骤3.8、依次判定原子型关联规则AAR的规则后件是否出现在分类关联规则集合CARset的规则前件中,若存在,认定原子型关联规则集合AAR的规则后件为冗余变量,从分类关联规则集合CARset中将所有带有原子型关联规则AAR规则后件的关联规则A→B删除;
步骤3.9、按照步骤3.8进行处理,直至原子型关联规则集合AARset为空时为止;
步骤3.10、将分类关联规则集合CARset中剩余关联规则A→B映射到相应的自变量,从而获得包含变量间交互作用的自变量集合Set;
步骤4、基于混合Logit原理构建事故形态预测模型;
步骤4.1、利用式(10)建立混合Logit模型:
式(10)中,Pn(yi)表示第n起交通事故的事故形态为yi的概率,表示第n起交通事故的事故形态为yi时自变量的参数向量,表示自变量所估计参数的向量形式;表示随机参数β的概率密度函数,β和分别表示概率密度函均值和方差参数的向量形式;
步骤4.2、将包含变量间交互作用的自变量集合Set中各影响因素纳入混合Logit模型,并采用极大似然估计法对混合Logit模型的参数进行估计;
步骤5、基于构建的混合Logit模型,进行交通事故形态概率的预测;
步骤5.1、获取实时影响交通事故形态的自变量信息;
与现有技术相比,本发明的有益效果体现在:
1、本发明方法针对传统无监督离散化算法造成被离散自变量信息损失严重的问题,创新性地采用有监督离散算法中的最小描述长度准则进行连续变量离散化,降低了被离散自变量的信息损失,有利于寻求更优的离散点位置,从而提升了模型的预测精度;
2、本发明方法通过基于关联规则的属性选择方法挖掘自变量间的交互作用,并将自变量间的交互作用纳入混合Logit模型,有助于深入理解自变量间的交互作用对交通事故形态概率的影响,克服了忽略变量间交互作用导致错误推论的不利影响;
3、本发明方法提出一种包含变量间交互作用的混合Logit模型,为交通事故形态概率的预测提供了新的解决方法,为改善道路交通安全环境提供技术支持。
附图说明
图1为本发明方法的流程图;
图2为本发明最小描述长度准则的流程图;
图3为本发明基于关联规则的属性选择方法的流程图。
具体实施方式
本实施例中,如图1所示,一种道路交通事故形态预测方法,以广东省深圳市死亡交通事故数据为例,按如下步骤进行:
步骤1、采集和处理深圳市死亡道路交通事故数据;
步骤1.1、从道路交通安全研究信息共享平台采集深圳市2014至2016年的道路交通事故数据,筛选出死亡交通事故数据,删除交通事故数据库中记录不全(具有空白项)或记录不合理的事故数据,共获取1264(N=1264)起死亡交通事故数据作为交通事故数据集D,从机动车驾驶员、车辆、道路、环境和时间五个方面选取了16(K=16)潜在影响事故形态的自变量,构成影响交通事故形态的自变量集合X={x1,x2,…,xk,…,xK},其中驾驶员年龄、事故发生时间为连续自变量,所以分类变量集合为{x1,x2,…,x14},k=14,连续自变量集合为{x14+1,x14+2},各自变量的描述性统计见表1;
步骤1.2、依据事故发生时的具体情形,将交通事故形态分为车辆间事故y1、车辆与行人事故y2、单车事故y3,从而得到由三类事故构成的预测变量Y={y1,y2,y3};
表1自变量的描述性统计
注:18岁以下驾驶员均为无证的摩托车驾驶员,*表示该变量为基准变量。
步骤2、采用最小描述长度准则对连续自变量集合{xk+1,xk+2,…,xk+l,…,xK}进行离散化;
步骤2.1、图2为本发明所述最小描述长度准则的流程图,K=16,k=14,初始化l=1;
步骤2.3、利用式(1)得到连续自变量xk+l与预测变量Y的信息熵E(D):
式(1)中,|Y|表示交通事故数据集D中预测变量Y的种类;pyi表示第i类事故yi在事故数据集D中所占的比例;i=1,2,3;
步骤2.4、根据信息增益最大化原则遍历寻找第l个连续自变量xk+l的最优离散点bl,以最优离散点bl为界将交通事故数据集D分为第一子集D1和第二子集D2,并利用式(2)计算离散所得的信息增益G(bl,D):
式(2)中,|D1|、|D2|、|D|分别表示第一子集D1、第二子集D2、交通事故数据集D中的交通事故案例数;E(D1)和E(D2)分别为第一子集D1和第二子集D2的信息熵;
步骤2.5、利用式(3)计算停止准则S:
式(3)中,|Y1|、|Y2|分别表示第一子集D1、第二子集D2中预测变量的种类;
步骤2.6、判断信息增益G(bl,D)是否大于停止准则S,若大于,则表示最优离散点bl有效,将最优离散点bl添加到离散点集合B中;并分别将第一子集D1和第二子集D2替换交通事故数据集D,按照步骤2.4-步骤2.6的过程,在第一子集D1和第二子集D2中寻找下一最优离散切点;否则,执行步骤2.7;
步骤2.8、基于离散点集合B对分别连续自变量驾驶员年龄和事故发生时间进行离散化,使得自变量均转化为分类自变量,得到离散后的连续自变量集合XMDLP={x1,x2,…,xk,x k+1 ,x k+2 ,x k+l ,…,x K };其中,x k+l 表示第k+l个分类变量;离散化结果见表2;
表2连续自变量的离散化
注:*表示该变量为基准变量。
步骤3、采用基于关联规则的属性选择方法挖掘自变量间的交互作用;
步骤3.1、定义关联规则为A→B,其中,A为规则前件,B为规则后件,→为关系符号;如图2所示,将离散后的自变量集合XMDLP={x1,x2,…,xk,x k+1 ,x k+2 ,x k+l ,…,x K }中的各因素分别设定为规则前件A,预测变量Y的各类别事故设定为规则后件B;
步骤3.2、分别定义关联规则A→B的支持度Support(A→B)、置信度Confidence(A→B)、提升度Lift(A→B),如式(4)、式(5)、式(6)所示:
式(4)、式(5)、式(6)中,N为交通事故的样本总数,P(A∩B)表示交通事故数据中因素A和因素B同时发生的频次;P(A)、P(B)分别表示因素A、因素B在交通事故数据中出现的频次;
步骤3.3、如图3所示,定义并初始化关联规则A→B的最小支持度minSup=10%、最小置信度minConf=50%和最小提升度minLift=100%;
步骤3.4、挖掘关联规则A→B的支持度Support(A→B)、置信度Confidence(A→B)、提升度Lift(A→B);
步骤3.5、定义基于关联规则A→B的属性选择方法的三种受约束规则,分别是强关联规则SAR、分类关联规则CAR、原子型关联规则AAR;
步骤3.5.1、利用式(7)得到强关联规则SAR的表达式:
Support(A→B)>minSup∧Confidence(A→B)>minConf∧Lift(A→B)>minLift(7)
式(7)中,∧表示且;
步骤3.5.2、离散后的自变量集合XMDLP={x1,x2,…,xk,x k+1 ,x k+2 ,x k+l ,…,x K }中,令|xk|为第k个自变量xk的值域;1≤k≤K;
步骤3.5.4、利用式(8)得到分类关联规则CAR的表达式:
式(8)中,|B|为预测变量的种类;
步骤3.5.3、利用式(9)得到原子型关联规则AAR的表达式:
式(8)中,|A|为自变量种类的数量;
步骤3.6、令所有满足分类关联规则CAR的关联规则A→B构成CARset,满足原子型关联规则AAR的关联规则A→B构成原子型关联规则集合AARset;
步骤3.7、对原子型关联规则集合AARset中的关联规则A→B依照置信度进行降序排列;
步骤3.8、依次判定原子型关联规则AAR的规则后件是否出现在分类关联规则集合CARset的规则前件中,若存在,认定原子型关联规则集合AAR的规则后件为冗余变量,从分类关联规则集合CARset中将所有带有原子型关联规则AAR规则后件的关联规则A→B删除;
步骤3.9、按照步骤3.8进行处理,直至原子型关联规则集合AARset为空时为止;
步骤3.10、将分类关联规则集合CARset中剩余关联规则A→B映射到相应的自变量,从而获得包含变量间交互作用的自变量集合Set;
步骤4、基于混合Logit原理构建事故形态预测模型;
步骤4.1、利用式(10)建立混合Logit模型:
式(10)中,Pn(yi)表示第n起交通事故的事故形态为yi的概率,表示第n起交通事故的事故形态为yi时自变量的参数向量,表示自变量所估计参数的向量形式;表示随机参数β的概率密度函数,β和分别表示概率密度函均值和方差参数的向量形式;
步骤4.2、将包含变量间交互作用的自变量集合Set中各影响因素纳入混合Logit模型,应用软件SAS9.4,采用极大似然估计法对混合Logit模型的参数进行估计;
表3死亡交通事故形态的混合Logit模型参数估计结果
步骤5、基于构建的混合Logit模型,进行交通事故形态概率的预测;
步骤5.1、获取实时影响交通事故形态的自变量信息;;
步骤5.1.1、如表3所示,混合Logit模型参数估计结果表明,影响死亡交通事故形态的自变量包括:驾驶员年龄、车辆类型、道路隔离形式、路口路段类型、道路线形、事故发生时间、照明条件、天气与交通事故形态显著相关;从城市道路智能交通视频监控系统的视频数据中的获取驾驶员年龄、车辆类型数据;基于道路设计资料获取道路隔离形式、路口路段类型、道路线形数据;通过气象部门获取事故发生时间、照明条件和天气数据;
步骤5.4、根据步骤5.3得到当前自变量信息条件下各形态交通事故的预测概率,基于车联网无线通讯技术将信息传输给车载通讯设备,并通过智能语音播报装置对驾驶员应重点预防的交通事故形态做出预警提醒。例如,非平直道路上,14至21岁摩托车驾驶员发生单车事故的概率高达96.38%,发生车辆间事故、车辆与行人事故的概率分别为1.49%和2.14%。当14至21岁摩托车驾驶员即将行驶到非平直道路时,通过智能语音播报装置对摩托车驾驶员发出前方高概率单车事故的预警,提醒驾驶员谨慎降速行驶,从而实现对驾驶员的精准管控,保障行车安全。
Claims (1)
1.一种道路交通事故形态预测方法,其特征是按如下步骤进行:
步骤1、采集和处理道路交通事故数据;
步骤1.1、从道路交通事故数据库中获取N起交通事故,构成交通事故数据D;定义交通事故数据集D中影响交通事故形态的自变量集合为X={x1,x2,…,xk,…,xK},其中,xk表示第k个自变量,k=1,2,...,K,令{x1,x2,…,xk}为分类自变量集合,{xk+1,xk+2,…,xk+l,…,xK}为连续自变量集合,l=1,2,...,K-k;
步骤1.2、依据事故发生时的具体情形,将交通事故形态分为车辆间事故y1、车辆与行人事故y2、单车事故y3,从而得到由三类事故构成的预测变量Y={y1,y2,y3};
步骤2、采用最小描述长度准则对连续自变量集合{xk+1,xk+2,…,xk+l,…,xK}进行离散化;
步骤2.1、初始化l=1;
步骤2.3、利用式(1)得到连续自变量xk+l与预测变量Y的信息熵E(D):
式(1)中,|Y|表示交通事故数据集D中预测变量Y的种类;pyi表示第i类事故yi在事故数据集D中所占的比例;i=1,2,3;
步骤2.4、根据信息增益最大化原则遍历寻找第l个连续自变量xk+l的最优离散点bl,以最优离散点bl为界将交通事故数据集D分为第一子集D1和第二子集D2,并利用式(2)计算离散所得的信息增益G(bl,D):
式(2)中,|D1|、|D2|、|D|分别表示第一子集D1、第二子集D2、交通事故数据集D中的交通事故案例数;E(D1)和E(D2)分别为第一子集D1和第二子集D2的信息熵;
步骤2.5、利用式(3)计算停止准则S:
式(3)中,|Y1|、|Y2|分别表示第一子集D1、第二子集D2中预测变量的种类;
步骤2.6、判断信息增益G(bl,D)是否大于停止准则S,若大于,则表示最优离散点bl有效,将最优离散点bl添加到离散点集合B中;分别将第一子集D1和第二子集D2替换交通事故数据集D,按照步骤2.4-步骤2.6的过程,在第一子集D1和第二子集D2中寻找下一最优离散切点;否则,执行步骤2.7;
步骤2.8、基于离散点集合B对各连续自变量进行离散化,使得所有自变量均转化为分类自变量,从而得到离散后的自变量集合XMDLP={x1,x2,…,xk,xk+1,xk+2,xk+l,…,xK};其中,xk+l表示第k+l个分类自变量;
步骤3、采用基于关联规则的属性选择方法挖掘自变量间的交互作用;
步骤3.1、定义关联规则为A→B,其中,A为规则前件,B为规则后件,→为关系符号;将离散后的自变量集合XMDLP={x1,x2,…,xk,xk+1,xk+2,xk+l,…,xK}中各因素分别设定为规则前件A,预测变量Y的各类别事故设定为规则后件B;
步骤3.2、分别定义关联规则A→B的支持度Support(A→B)、置信度Confidence(A→B)、提升度Lift(A→B),如式(4)、式(5)、式(6)所示:
式(4)、式(5)、式(6)中,N为交通事故的样本总数,P(A∩B)表示交通事故数据中因素A和因素B同时发生的频次;P(A)、P(B)分别表示因素A、因素B在交通事故数据中出现的频次;
步骤3.3、定义并初始化关联规则A→B的最小支持度min Sup、最小置信度min Conf和最小提升度min Lift;
步骤3.4、挖掘关联规则A→B的支持度Support(A→B)、置信度Confidence(A→B)、提升度Lift(A→B);
步骤3.5、定义基于关联规则A→B的属性选择方法的三种受约束规则,分别是强关联规则SAR、分类关联规则CAR、原子型关联规则AAR;
步骤3.5.1、利用式(7)得到强关联规则SAR的表达式:
Support(A→B)>minSup∧Confidence(A→B)>minConf∧Lift(A→B)>minLift (7)
式(7)中,∧表示且;
步骤3.5.2、离散后的自变量集合XMDLP={x1,x2,…,xk,xk+1,xk+2,xk+l,…,xK}中,令|xk|为第k个自变量xk的值域;1≤k≤K;
步骤3.5.4、利用式(8)得到分类关联规则CAR的表达式:
式(8)中,|B|为预测变量的种类;
步骤3.5.3、利用式(9)得到原子型关联规则AAR的表达式:
式(8)中,|A|为自变量种类的数量;
步骤3.6、令所有满足分类关联规则CAR的关联规则A→B构成CARset,满足原子型关联规则AAR的关联规则A→B构成原子型关联规则集合AARset;
步骤3.7、对原子型关联规则集合AARset中的关联规则A→B依照置信度进行降序排列;
步骤3.8、依次判定原子型关联规则AAR的规则后件是否出现在分类关联规则集合CARset的规则前件中,若存在,认定原子型关联规则集合AAR的规则后件为冗余变量,从分类关联规则集合CARset中将所有带有原子型关联规则AAR规则后件的关联规则A→B删除;
步骤3.9、按照步骤3.8进行处理,直至原子型关联规则集合AARset为空时为止;
步骤3.10、将分类关联规则集合CARset中剩余关联规则A→B映射到相应的自变量,从而获得包含变量间交互作用的自变量集合Set;
步骤4、基于混合Logit原理构建事故形态预测模型;
步骤4.1、利用式(10)建立混合Logit模型:
式(10)中,Pn(yi)表示第n起交通事故的事故形态为yi的概率,表示第n起交通事故的事故形态为yi时自变量的参数向量,表示自变量所估计参数的向量形式;表示随机参数β的概率密度函数,β和分别表示概率密度函均值和方差参数的向量形式;
步骤4.2、将包含变量间交互作用的自变量集合Set中各影响因素纳入混合Logit模型,并采用极大似然估计法对混合Logit模型的参数进行估计;
步骤5、基于构建的混合Logit模型,进行交通事故形态概率的预测;
步骤5.1、获取实时影响交通事故形态的自变量信息;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110312213.8A CN113077625B (zh) | 2021-03-24 | 2021-03-24 | 一种道路交通事故形态预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110312213.8A CN113077625B (zh) | 2021-03-24 | 2021-03-24 | 一种道路交通事故形态预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113077625A true CN113077625A (zh) | 2021-07-06 |
CN113077625B CN113077625B (zh) | 2022-03-15 |
Family
ID=76613618
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110312213.8A Active CN113077625B (zh) | 2021-03-24 | 2021-03-24 | 一种道路交通事故形态预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113077625B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113762364A (zh) * | 2021-08-23 | 2021-12-07 | 东南大学 | 一种不平衡交通事故数据合成采样方法 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09190422A (ja) * | 1996-01-11 | 1997-07-22 | Toshiba Corp | 交通状況予測装置 |
CN104821080A (zh) * | 2015-03-02 | 2015-08-05 | 北京理工大学 | 基于宏观城市交通流的智能车辆行驶速度及时间预测方法 |
CN105931460A (zh) * | 2016-05-13 | 2016-09-07 | 东南大学 | 一种快速道路连续瓶颈路段的可变限速控制策略优化方法 |
CN106709595A (zh) * | 2016-11-24 | 2017-05-24 | 北京交通大学 | 基于非格式化信息的事故延误时间预测方法与系统 |
CN108717786A (zh) * | 2018-07-17 | 2018-10-30 | 南京航空航天大学 | 一种基于普适性元规则的交通事故致因挖掘方法 |
CN109636053A (zh) * | 2018-12-20 | 2019-04-16 | 黄凤南 | 一种车辆事故解决优化系统 |
WO2019103197A1 (ko) * | 2017-11-23 | 2019-05-31 | (주)에이텍티앤 | 인공지능 기반의 교통사고 예측시스템 및 그 방법 |
CN110555565A (zh) * | 2019-09-09 | 2019-12-10 | 南京东控智能交通研究院有限公司 | 基于决策树模型的高速路出口匝道事故严重程度预测方法 |
CN110782070A (zh) * | 2019-09-25 | 2020-02-11 | 北京市交通信息中心 | 一种城市轨道交通突发事件客流时空分布预测方法 |
CN110826244A (zh) * | 2019-11-15 | 2020-02-21 | 同济大学 | 模拟轨道交通影响城市生长的共轭梯度元胞自动机方法 |
CN111768625A (zh) * | 2020-07-01 | 2020-10-13 | 中国计量大学 | 一种基于图嵌入的交通道路事件预测方法 |
CN112149922A (zh) * | 2020-11-03 | 2020-12-29 | 南京信息职业技术学院 | 高速公路隧道下行线出入口区域事故严重程度预测方法 |
CN112224211A (zh) * | 2020-10-19 | 2021-01-15 | 中交第一公路勘察设计研究院有限公司 | 基于多自主体交通流的驾驶模拟仿真系统 |
-
2021
- 2021-03-24 CN CN202110312213.8A patent/CN113077625B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09190422A (ja) * | 1996-01-11 | 1997-07-22 | Toshiba Corp | 交通状況予測装置 |
CN104821080A (zh) * | 2015-03-02 | 2015-08-05 | 北京理工大学 | 基于宏观城市交通流的智能车辆行驶速度及时间预测方法 |
CN105931460A (zh) * | 2016-05-13 | 2016-09-07 | 东南大学 | 一种快速道路连续瓶颈路段的可变限速控制策略优化方法 |
CN106709595A (zh) * | 2016-11-24 | 2017-05-24 | 北京交通大学 | 基于非格式化信息的事故延误时间预测方法与系统 |
WO2019103197A1 (ko) * | 2017-11-23 | 2019-05-31 | (주)에이텍티앤 | 인공지능 기반의 교통사고 예측시스템 및 그 방법 |
CN108717786A (zh) * | 2018-07-17 | 2018-10-30 | 南京航空航天大学 | 一种基于普适性元规则的交通事故致因挖掘方法 |
CN109636053A (zh) * | 2018-12-20 | 2019-04-16 | 黄凤南 | 一种车辆事故解决优化系统 |
CN110555565A (zh) * | 2019-09-09 | 2019-12-10 | 南京东控智能交通研究院有限公司 | 基于决策树模型的高速路出口匝道事故严重程度预测方法 |
CN110782070A (zh) * | 2019-09-25 | 2020-02-11 | 北京市交通信息中心 | 一种城市轨道交通突发事件客流时空分布预测方法 |
CN110826244A (zh) * | 2019-11-15 | 2020-02-21 | 同济大学 | 模拟轨道交通影响城市生长的共轭梯度元胞自动机方法 |
CN111768625A (zh) * | 2020-07-01 | 2020-10-13 | 中国计量大学 | 一种基于图嵌入的交通道路事件预测方法 |
CN112224211A (zh) * | 2020-10-19 | 2021-01-15 | 中交第一公路勘察设计研究院有限公司 | 基于多自主体交通流的驾驶模拟仿真系统 |
CN112149922A (zh) * | 2020-11-03 | 2020-12-29 | 南京信息职业技术学院 | 高速公路隧道下行线出入口区域事故严重程度预测方法 |
Non-Patent Citations (3)
Title |
---|
XIANGHAI MENG 等: "Research on Accident Prediction Models for Freeways in Mountainous and Rolling Areas", 《2015 SEVENTH INTERNATIONAL CONFERENCE ON MEASURING TECHNOLOGY AND MECHATRONICS AUTOMATION》 * |
刘文玲 等: "基于关联规则的公交事故受伤情况预测研究", 《控制工程》 * |
王磊等: "高速公路交通事故影响因素分析及伤害估计", 《中国安全科学学报》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113762364A (zh) * | 2021-08-23 | 2021-12-07 | 东南大学 | 一种不平衡交通事故数据合成采样方法 |
CN113762364B (zh) * | 2021-08-23 | 2022-11-04 | 东南大学 | 一种不平衡交通事故数据合成采样方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113077625B (zh) | 2022-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110458244B (zh) | 一种应用于区域路网的交通事故严重度预测方法 | |
CN107958269A (zh) | 一种基于隐马尔可夫模型的行车危险度预测方法 | |
CN113837446B (zh) | 一种基于多源异构数据的机场陆侧区域交通态势预测方法 | |
Wang et al. | Energy consumption characteristics based driving conditions construction and prediction for hybrid electric buses energy management | |
CN115662113A (zh) | 一种信号交叉口人车博弈冲突风险评估与预警方法 | |
CN113077625B (zh) | 一种道路交通事故形态预测方法 | |
CN110288826B (zh) | 基于多源数据融合和milp的交通控制子区聚类划分方法 | |
Shang et al. | Analyzing the effects of road type and rainy weather on fuel consumption and emissions: A mesoscopic model based on big traffic data | |
CN117746626A (zh) | 基于车流量的智慧交通管理方法及系统 | |
CN112509328B (zh) | 一种交叉口右转机动车与电动自行车冲突行为分析方法 | |
CN112651666A (zh) | 一种基于驾驶模式转移特征的驾驶员风险评估方法 | |
CN110097757B (zh) | 一种基于深度优先搜索的交叉口群关键路径识别方法 | |
CN116935624B (zh) | 基于数字孪生的降雪天气智能网联交通事故风险评价方法 | |
CN113688561A (zh) | 一种基于神经网络的高速公路施工区最优预警距离确定方法 | |
CN118097953A (zh) | 一种基于多源风险的城市主次干路网交通事故风险评估方法 | |
CN117648539A (zh) | 一种农村公路交通事故严重程度评价方法 | |
CN112036709B (zh) | 基于随机森林的降雨天气高速公路二次事故致因分析方法 | |
CN116453352A (zh) | 一种基于k聚类算法和神经网络的货车交通流量预测方法 | |
CN116824868A (zh) | 车辆非法停驻点识别及拥堵预测方法、装置、设备及介质 | |
CN115587536A (zh) | 一种交通事故严重程度预测方法、设备及存储介质 | |
CN110827446A (zh) | 一种电动汽车行驶状态预测方法 | |
CN116882645B (zh) | 一种无人驾驶矿车生产调度方法 | |
CN111275241A (zh) | 基于机器学习决策树的公交车乘客下车站点推断方法 | |
Han et al. | A study on Autonomous Vehicles’ Driving Behavior Based on Open Road Test Data | |
CN113051695B (zh) | 一种基于物联网通信的小区道路规则寻优方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |