[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN113077625A - 一种道路交通事故形态预测方法 - Google Patents

一种道路交通事故形态预测方法 Download PDF

Info

Publication number
CN113077625A
CN113077625A CN202110312213.8A CN202110312213A CN113077625A CN 113077625 A CN113077625 A CN 113077625A CN 202110312213 A CN202110312213 A CN 202110312213A CN 113077625 A CN113077625 A CN 113077625A
Authority
CN
China
Prior art keywords
traffic accident
formula
association rule
variables
variable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110312213.8A
Other languages
English (en)
Other versions
CN113077625B (zh
Inventor
石琴
胡宗品
陈一锴
骆仁佳
于淑君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN202110312213.8A priority Critical patent/CN113077625B/zh
Publication of CN113077625A publication Critical patent/CN113077625A/zh
Application granted granted Critical
Publication of CN113077625B publication Critical patent/CN113077625B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W30/00Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units
    • B60W30/08Active safety systems predicting or avoiding probable or impending collision or attempting to minimise its consequences
    • B60W30/095Predicting travel path or likelihood of collision
    • B60W30/0956Predicting travel path or likelihood of collision the prediction being responsive to traffic or environmental parameters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/16Anti-collision systems
    • G08G1/166Anti-collision systems for active traffic, e.g. moving vehicles, pedestrians, bikes
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/16Anti-collision systems
    • G08G1/167Driving aids for lane monitoring, lane changing, e.g. blind spot detection

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Operations Research (AREA)
  • Transportation (AREA)
  • Quality & Reliability (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Automation & Control Theory (AREA)
  • Game Theory and Decision Science (AREA)
  • Mechanical Engineering (AREA)
  • Educational Administration (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Traffic Control Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种道路交通事故形态预测方法,其步骤如下:1、采集和处理道路交通事故数据;2、采用最小描述长度准则对交通事故数据中的连续自变量进行离散化;3、采用数据挖掘领域中基于关联规则的属性选择方法,挖掘自变量间的交互作用;4、建立混合Logit模型,并采用极大似然估计法进行参数估计;5、基于构建的混合Logit模型,进行交通事故形态概率的预测。本发明在连续自变量离散过程中充分利用预测变量的信息并挖掘变量间交互作用对事故形态的影响,以降低被离散变量的信息损失,克服忽略变量间交互作用导致错误推论的问题,从而提高交通事故形态预测模型的预测精度,为道路交通安全环境的改善提供技术支持。

Description

一种道路交通事故形态预测方法
技术领域
本发明涉及一种道路交通事故形态预测方法,属于道路交通安全分析技术领域。
背景技术
《道路安全全球现状报告2018》数据显示,全球每年交通事故死亡人数攀升至135万人,其中,80%的死亡交通事故发生在中等收入国家。作为最大的中等收入国家,中国每年发生24万余起交通事故,造成6万余人死亡,交通安全形势严峻。对于不同形态的交通事故,其影响因素具有显著差异。构建交通事故形态与驾驶员、道路、环境等影响因素间的关系,从而进行交通事故形态的预测,是重要的交通安全改善措施之一。
在事故形态预测方法方面,Probit、多项Logit等固定参数离散选择模型得到了广泛的应用。然而,此类方法忽略了交通事故数据中普遍存在的未观测到的异质性,常导致有偏差的参数估计。相较于固定参数离散选择模型,混合Logit模型通过假定变量系数为随机参数反映交通事故数据的异质性。然而,该方法在事故形态预测方面存在以下问题:(1)对于交通事故数据中的连续自变量,多采用无监督离散化算法进行离散化,离散过程中无法考虑自变量与预测变量间的关系,造成被离散自变量信息损失严重;(2)交通事故的发生通常取决于多个自变量的共同作用,上述方法忽略了变量间交互作用对事故形态的影响,易导致错误的预测和推论。
发明内容
本发明为克服现有技术的不足之处,提出了一种道路交通事故形态预测方法,以期在连续自变量离散过程中充分利用预测变量的信息并挖掘变量间交互作用对事故形态的影响,以降低被离散变量的信息损失,克服忽略变量间交互作用导致错误推论的问题,从而提高交通事故形态预测模型的预测精度。
为达到上述目的,本发明采用如下技术方案:
本发明一种道路交通事故形态预测方法的特点是按如下步骤进行:
步骤1、采集和处理道路交通事故数据;
步骤1.1、从道路交通事故数据库中获取N起交通事故,构成交通事故数据D;定义交通事故数据集D中影响交通事故形态的自变量集合为X={x1,x2,…,xk,…,xK},其中,xk表示第k个自变量,k=1,2,...,K,令{x1,x2,…,xk}为分类自变量集合,{xk+1,xk+2,…,xk+l,…,xK}为连续自变量集合,l=1,2,...,K-k;
步骤1.2、依据事故发生时的具体情形,将交通事故形态分为车辆间事故y1、车辆与行人事故y2、单车事故y3,从而得到由三类事故构成的预测变量Y={y1,y2,y3};
步骤2、采用最小描述长度准则对连续自变量集合{xk+1,xk+2,…,xk+l,…,xK}进行离散化;
步骤2.1、初始化l=1;
步骤2.2、由交通事故数据集D中各起交通事故的第l个连续自变量xk+l构成连续自变量值集合
Figure BDA0002990268090000021
并对连续自变量值集合
Figure BDA0002990268090000022
进行降序排列;
步骤2.3、利用式(1)得到连续自变量xk+l与预测变量Y的信息熵E(D):
Figure BDA0002990268090000023
式(1)中,|Y|表示交通事故数据集D中预测变量Y的种类;pyi表示第i类事故yi在事故数据集D中所占的比例;i=1,2,3;
步骤2.4、根据信息增益最大化原则遍历寻找第l个连续自变量xk+l的最优离散点bl,以最优离散点bl为界将交通事故数据集D分为第一子集D1和第二子集D2,并利用式(2)计算离散所得的信息增益G(bl,D):
Figure BDA0002990268090000024
式(2)中,|D1|、|D2|、|D|分别表示第一子集D1、第二子集D2、交通事故数据集D中的交通事故案例数;E(D1)和E(D2)分别为第一子集D1和第二子集D2的信息熵;
步骤2.5、利用式(3)计算停止准则S:
Figure BDA0002990268090000025
式(3)中,|Y1|、|Y2|分别表示第一子集D1、第二子集D2中预测变量的种类;
步骤2.6、判断信息增益G(bl,D)是否大于停止准则S,若大于,则表示最优离散点bl有效,将最优离散点bl添加到离散点集合B中;分别将第一子集D1和第二子集D2替换交通事故数据集D,按照步骤2.4-步骤2.6的过程,在第一子集D1和第二子集D2中寻找下一最优离散切点;否则,执行步骤2.7;
步骤2.7、将l+1赋值给l后,判断l是否大于K-k,若成立,则表示连续自变量集合
Figure BDA0002990268090000026
中所有连续自变量均已离散化,输出各连续自变量的离散点集合B后,执行步骤2.8;否则,返回步骤2.2执行;
步骤2.8、基于离散点集合B对各连续自变量进行离散化,使得所有自变量均转化为分类自变量,从而得到离散后的自变量集合XMDLP={x1,x2,…,xk,x k+1 ,x k+2 ,x k+l ,…,x K };其中,xk+l表示第k+l个分类自变量;
步骤3、采用基于关联规则的属性选择方法挖掘自变量间的交互作用;
步骤3.1、定义关联规则为A→B,其中,A为规则前件,B为规则后件,→为关系符号;将离散后的自变量集合XMDLP={x1,x2,…,xk,x k+1 ,x k+2 ,x k+l ,…,x K }中各因素分别设定为规则前件A,预测变量Y的各类别事故设定为规则后件B;
步骤3.2、分别定义关联规则A→B的支持度Support(A→B)、置信度Confidence(A→B)、提升度Lift(A→B),如式(4)、式(5)、式(6)所示:
Figure BDA0002990268090000031
Figure BDA0002990268090000032
Figure BDA0002990268090000033
式(4)、式(5)、式(6)中,N为交通事故的样本总数,P(A∩B)表示交通事故数据中因素A和因素B同时发生的频次;P(A)、P(B)分别表示因素A、因素B在交通事故数据中出现的频次;
步骤3.3、定义并初始化关联规则A→B的最小支持度minSup、最小置信度minConf和最小提升度minLift;
步骤3.4、挖掘关联规则A→B的支持度Support(A→B)、置信度Confidence(A→B)、提升度Lift(A→B);
步骤3.5、定义基于关联规则A→B的属性选择方法的三种受约束规则,分别是强关联规则SAR、分类关联规则CAR、原子型关联规则AAR;
步骤3.5.1、利用式(7)得到强关联规则SAR的表达式:
Support(A→B)>minSup∧Confidence(A→B)>minConf∧Lift(A→B)>minLift(7)
式(7)中,∧表示且;
步骤3.5.2、离散后的自变量集合XMDLP={x1,x2,…,xk,x k+1 ,x k+2 ,x k+l ,…,x K }中,令|xk|为第k个自变量xk的值域;1≤k≤K;
步骤3.5.3、定义影响因素值集FVIS为所有自变量可能取值的集合,即
Figure BDA0002990268090000041
定义目标值集TVIS为所有预测变量可能取值的集合,即TVIS=|Y|;
步骤3.5.4、利用式(8)得到分类关联规则CAR的表达式:
Figure BDA0002990268090000042
式(8)中,|B|为预测变量的种类;
步骤3.5.3、利用式(9)得到原子型关联规则AAR的表达式:
Figure BDA0002990268090000043
式(8)中,|A|为自变量种类的数量;
步骤3.6、令所有满足分类关联规则CAR的关联规则A→B构成CARset,满足原子型关联规则AAR的关联规则A→B构成原子型关联规则集合AARset;
步骤3.7、对原子型关联规则集合AARset中的关联规则A→B依照置信度进行降序排列;
步骤3.8、依次判定原子型关联规则AAR的规则后件是否出现在分类关联规则集合CARset的规则前件中,若存在,认定原子型关联规则集合AAR的规则后件为冗余变量,从分类关联规则集合CARset中将所有带有原子型关联规则AAR规则后件的关联规则A→B删除;
步骤3.9、按照步骤3.8进行处理,直至原子型关联规则集合AARset为空时为止;
步骤3.10、将分类关联规则集合CARset中剩余关联规则A→B映射到相应的自变量,从而获得包含变量间交互作用的自变量集合Set;
步骤4、基于混合Logit原理构建事故形态预测模型;
步骤4.1、利用式(10)建立混合Logit模型:
Figure BDA0002990268090000044
式(10)中,Pn(yi)表示第n起交通事故的事故形态为yi的概率,
Figure BDA0002990268090000045
表示第n起交通事故的事故形态为yi时自变量的参数向量,
Figure BDA0002990268090000046
表示自变量
Figure BDA0002990268090000047
所估计参数的向量形式;
Figure BDA0002990268090000048
表示随机参数β的概率密度函数,β和
Figure BDA0002990268090000049
分别表示概率密度函均值和方差参数的向量形式;
步骤4.2、将包含变量间交互作用的自变量集合Set中各影响因素纳入混合Logit模型,并采用极大似然估计法对混合Logit模型的参数进行估计;
步骤4.3、根据步骤4.2中获得的混合Logit模型参数估计值Par,在所设定的置信水平下,采用逐步回归法对混合Logit模型的参数进行筛选,筛选得到混合Logit模型的参数估计值
Figure BDA0002990268090000051
步骤5、基于构建的混合Logit模型,进行交通事故形态概率的预测;
步骤5.1、获取实时影响交通事故形态的自变量信息;
步骤5.2、将步骤5.1中获取的自变量信息输入式(11),计算得到相应自变量信息条件下事故形态为yi的效用函数
Figure BDA0002990268090000052
Figure BDA0002990268090000053
式(11)中,
Figure BDA0002990268090000054
表示混合Logit模型参数估计值
Figure BDA0002990268090000055
中事故形态为yi时的参数向量;
步骤5.3、利用式(12)得到实时影响交通事故形态的自变量信息条件下事故形态为yi的预测概率
Figure BDA0002990268090000056
Figure BDA0002990268090000057
式(12)中,
Figure BDA0002990268090000058
表示总效用函数。
与现有技术相比,本发明的有益效果体现在:
1、本发明方法针对传统无监督离散化算法造成被离散自变量信息损失严重的问题,创新性地采用有监督离散算法中的最小描述长度准则进行连续变量离散化,降低了被离散自变量的信息损失,有利于寻求更优的离散点位置,从而提升了模型的预测精度;
2、本发明方法通过基于关联规则的属性选择方法挖掘自变量间的交互作用,并将自变量间的交互作用纳入混合Logit模型,有助于深入理解自变量间的交互作用对交通事故形态概率的影响,克服了忽略变量间交互作用导致错误推论的不利影响;
3、本发明方法提出一种包含变量间交互作用的混合Logit模型,为交通事故形态概率的预测提供了新的解决方法,为改善道路交通安全环境提供技术支持。
附图说明
图1为本发明方法的流程图;
图2为本发明最小描述长度准则的流程图;
图3为本发明基于关联规则的属性选择方法的流程图。
具体实施方式
本实施例中,如图1所示,一种道路交通事故形态预测方法,以广东省深圳市死亡交通事故数据为例,按如下步骤进行:
步骤1、采集和处理深圳市死亡道路交通事故数据;
步骤1.1、从道路交通安全研究信息共享平台采集深圳市2014至2016年的道路交通事故数据,筛选出死亡交通事故数据,删除交通事故数据库中记录不全(具有空白项)或记录不合理的事故数据,共获取1264(N=1264)起死亡交通事故数据作为交通事故数据集D,从机动车驾驶员、车辆、道路、环境和时间五个方面选取了16(K=16)潜在影响事故形态的自变量,构成影响交通事故形态的自变量集合X={x1,x2,…,xk,…,xK},其中驾驶员年龄、事故发生时间为连续自变量,所以分类变量集合为{x1,x2,…,x14},k=14,连续自变量集合为{x14+1,x14+2},各自变量的描述性统计见表1;
步骤1.2、依据事故发生时的具体情形,将交通事故形态分为车辆间事故y1、车辆与行人事故y2、单车事故y3,从而得到由三类事故构成的预测变量Y={y1,y2,y3};
表1自变量的描述性统计
Figure BDA0002990268090000061
Figure BDA0002990268090000071
注:18岁以下驾驶员均为无证的摩托车驾驶员,*表示该变量为基准变量。
步骤2、采用最小描述长度准则对连续自变量集合{xk+1,xk+2,…,xk+l,…,xK}进行离散化;
步骤2.1、图2为本发明所述最小描述长度准则的流程图,K=16,k=14,初始化l=1;
步骤2.2、由交通事故数据集D中各起交通事故的第l个连续自变量xk+l构成连续自变量值集合
Figure BDA0002990268090000072
并根据连续自变量xk+l的值进行降序排列;
步骤2.3、利用式(1)得到连续自变量xk+l与预测变量Y的信息熵E(D):
Figure BDA0002990268090000073
式(1)中,|Y|表示交通事故数据集D中预测变量Y的种类;pyi表示第i类事故yi在事故数据集D中所占的比例;i=1,2,3;
步骤2.4、根据信息增益最大化原则遍历寻找第l个连续自变量xk+l的最优离散点bl,以最优离散点bl为界将交通事故数据集D分为第一子集D1和第二子集D2,并利用式(2)计算离散所得的信息增益G(bl,D):
Figure BDA0002990268090000081
式(2)中,|D1|、|D2|、|D|分别表示第一子集D1、第二子集D2、交通事故数据集D中的交通事故案例数;E(D1)和E(D2)分别为第一子集D1和第二子集D2的信息熵;
步骤2.5、利用式(3)计算停止准则S:
Figure BDA0002990268090000082
式(3)中,|Y1|、|Y2|分别表示第一子集D1、第二子集D2中预测变量的种类;
步骤2.6、判断信息增益G(bl,D)是否大于停止准则S,若大于,则表示最优离散点bl有效,将最优离散点bl添加到离散点集合B中;并分别将第一子集D1和第二子集D2替换交通事故数据集D,按照步骤2.4-步骤2.6的过程,在第一子集D1和第二子集D2中寻找下一最优离散切点;否则,执行步骤2.7;
步骤2.7、将l+1赋值给l后,判断l是否大于K-k,若成立,则表示连续自变量集合
Figure BDA0002990268090000083
中所有连续自变量均已离散化,输出各连续自变量的离散点集合B后,执行步骤2.8;否则,返回步骤2.2执行;
步骤2.8、基于离散点集合B对分别连续自变量驾驶员年龄和事故发生时间进行离散化,使得自变量均转化为分类自变量,得到离散后的连续自变量集合XMDLP={x1,x2,…,xk,x k+1 ,x k+2 ,x k+l ,…,x K };其中,x k+l 表示第k+l个分类变量;离散化结果见表2;
表2连续自变量的离散化
Figure BDA0002990268090000084
注:*表示该变量为基准变量。
步骤3、采用基于关联规则的属性选择方法挖掘自变量间的交互作用;
步骤3.1、定义关联规则为A→B,其中,A为规则前件,B为规则后件,→为关系符号;如图2所示,将离散后的自变量集合XMDLP={x1,x2,…,xk,x k+1 ,x k+2 ,x k+l ,…,x K }中的各因素分别设定为规则前件A,预测变量Y的各类别事故设定为规则后件B;
步骤3.2、分别定义关联规则A→B的支持度Support(A→B)、置信度Confidence(A→B)、提升度Lift(A→B),如式(4)、式(5)、式(6)所示:
Figure BDA0002990268090000091
Figure BDA0002990268090000092
Figure BDA0002990268090000093
式(4)、式(5)、式(6)中,N为交通事故的样本总数,P(A∩B)表示交通事故数据中因素A和因素B同时发生的频次;P(A)、P(B)分别表示因素A、因素B在交通事故数据中出现的频次;
步骤3.3、如图3所示,定义并初始化关联规则A→B的最小支持度minSup=10%、最小置信度minConf=50%和最小提升度minLift=100%;
步骤3.4、挖掘关联规则A→B的支持度Support(A→B)、置信度Confidence(A→B)、提升度Lift(A→B);
步骤3.5、定义基于关联规则A→B的属性选择方法的三种受约束规则,分别是强关联规则SAR、分类关联规则CAR、原子型关联规则AAR;
步骤3.5.1、利用式(7)得到强关联规则SAR的表达式:
Support(A→B)>minSup∧Confidence(A→B)>minConf∧Lift(A→B)>minLift(7)
式(7)中,∧表示且;
步骤3.5.2、离散后的自变量集合XMDLP={x1,x2,…,xk,x k+1 ,x k+2 ,x k+l ,…,x K }中,令|xk|为第k个自变量xk的值域;1≤k≤K;
步骤3.5.3、定义影响因素值集FVIS为所有自变量可能取值的集合,即
Figure BDA0002990268090000094
定义目标值集TVIS为所有预测变量可能取值的集合,即TVIS=|Y|;
步骤3.5.4、利用式(8)得到分类关联规则CAR的表达式:
Figure BDA0002990268090000095
式(8)中,|B|为预测变量的种类;
步骤3.5.3、利用式(9)得到原子型关联规则AAR的表达式:
Figure BDA0002990268090000101
式(8)中,|A|为自变量种类的数量;
步骤3.6、令所有满足分类关联规则CAR的关联规则A→B构成CARset,满足原子型关联规则AAR的关联规则A→B构成原子型关联规则集合AARset;
步骤3.7、对原子型关联规则集合AARset中的关联规则A→B依照置信度进行降序排列;
步骤3.8、依次判定原子型关联规则AAR的规则后件是否出现在分类关联规则集合CARset的规则前件中,若存在,认定原子型关联规则集合AAR的规则后件为冗余变量,从分类关联规则集合CARset中将所有带有原子型关联规则AAR规则后件的关联规则A→B删除;
步骤3.9、按照步骤3.8进行处理,直至原子型关联规则集合AARset为空时为止;
步骤3.10、将分类关联规则集合CARset中剩余关联规则A→B映射到相应的自变量,从而获得包含变量间交互作用的自变量集合Set;
步骤4、基于混合Logit原理构建事故形态预测模型;
步骤4.1、利用式(10)建立混合Logit模型:
Figure BDA0002990268090000102
式(10)中,Pn(yi)表示第n起交通事故的事故形态为yi的概率,
Figure BDA0002990268090000103
表示第n起交通事故的事故形态为yi时自变量的参数向量,
Figure BDA0002990268090000104
表示自变量
Figure BDA0002990268090000105
所估计参数的向量形式;
Figure BDA0002990268090000106
表示随机参数β的概率密度函数,β和
Figure BDA0002990268090000107
分别表示概率密度函均值和方差参数的向量形式;
步骤4.2、将包含变量间交互作用的自变量集合Set中各影响因素纳入混合Logit模型,应用软件SAS9.4,采用极大似然估计法对混合Logit模型的参数进行估计;
步骤4.3、根据步骤4.2中获得的混合Logit模型参数估计值Par,在90%置信水平下,采用逐步回归法对混合Logit模型的参数进行筛选,筛选得到混合Logit模型的参数估计值
Figure BDA0002990268090000108
见表3;
表3死亡交通事故形态的混合Logit模型参数估计结果
Figure BDA0002990268090000111
步骤5、基于构建的混合Logit模型,进行交通事故形态概率的预测;
步骤5.1、获取实时影响交通事故形态的自变量信息;;
步骤5.1.1、如表3所示,混合Logit模型参数估计结果表明,影响死亡交通事故形态的自变量包括:驾驶员年龄、车辆类型、道路隔离形式、路口路段类型、道路线形、事故发生时间、照明条件、天气与交通事故形态显著相关;从城市道路智能交通视频监控系统的视频数据中的获取驾驶员年龄、车辆类型数据;基于道路设计资料获取道路隔离形式、路口路段类型、道路线形数据;通过气象部门获取事故发生时间、照明条件和天气数据;
步骤5.2、将步骤5.1中获取的影响交通事故形态的自变量信息输入式(11),计算得到该交通信息条件下事故形态为yi的效用函数
Figure BDA0002990268090000121
Figure BDA0002990268090000122
式(11)中,
Figure BDA0002990268090000123
表示混合Logit模型参数估计值
Figure BDA0002990268090000124
中事故形态为yi时的参数向量;
步骤5.3、利用式(12)得到当前自变量信息条件下事故形态为yi的预测概率
Figure BDA0002990268090000125
Figure BDA0002990268090000126
式(12)中,
Figure BDA0002990268090000127
表示总效用函数;
步骤5.4、根据步骤5.3得到当前自变量信息条件下各形态交通事故的预测概率,基于车联网无线通讯技术将信息传输给车载通讯设备,并通过智能语音播报装置对驾驶员应重点预防的交通事故形态做出预警提醒。例如,非平直道路上,14至21岁摩托车驾驶员发生单车事故的概率高达96.38%,发生车辆间事故、车辆与行人事故的概率分别为1.49%和2.14%。当14至21岁摩托车驾驶员即将行驶到非平直道路时,通过智能语音播报装置对摩托车驾驶员发出前方高概率单车事故的预警,提醒驾驶员谨慎降速行驶,从而实现对驾驶员的精准管控,保障行车安全。

Claims (1)

1.一种道路交通事故形态预测方法,其特征是按如下步骤进行:
步骤1、采集和处理道路交通事故数据;
步骤1.1、从道路交通事故数据库中获取N起交通事故,构成交通事故数据D;定义交通事故数据集D中影响交通事故形态的自变量集合为X={x1,x2,…,xk,…,xK},其中,xk表示第k个自变量,k=1,2,...,K,令{x1,x2,…,xk}为分类自变量集合,{xk+1,xk+2,…,xk+l,…,xK}为连续自变量集合,l=1,2,...,K-k;
步骤1.2、依据事故发生时的具体情形,将交通事故形态分为车辆间事故y1、车辆与行人事故y2、单车事故y3,从而得到由三类事故构成的预测变量Y={y1,y2,y3};
步骤2、采用最小描述长度准则对连续自变量集合{xk+1,xk+2,…,xk+l,…,xK}进行离散化;
步骤2.1、初始化l=1;
步骤2.2、由交通事故数据集D中各起交通事故的第l个连续自变量xk+l构成连续自变量值集合
Figure FDA0002990268080000011
并对连续自变量值集合
Figure FDA0002990268080000012
进行降序排列;
步骤2.3、利用式(1)得到连续自变量xk+l与预测变量Y的信息熵E(D):
Figure FDA0002990268080000013
式(1)中,|Y|表示交通事故数据集D中预测变量Y的种类;pyi表示第i类事故yi在事故数据集D中所占的比例;i=1,2,3;
步骤2.4、根据信息增益最大化原则遍历寻找第l个连续自变量xk+l的最优离散点bl,以最优离散点bl为界将交通事故数据集D分为第一子集D1和第二子集D2,并利用式(2)计算离散所得的信息增益G(bl,D):
Figure FDA0002990268080000014
式(2)中,|D1|、|D2|、|D|分别表示第一子集D1、第二子集D2、交通事故数据集D中的交通事故案例数;E(D1)和E(D2)分别为第一子集D1和第二子集D2的信息熵;
步骤2.5、利用式(3)计算停止准则S:
Figure FDA0002990268080000015
式(3)中,|Y1|、|Y2|分别表示第一子集D1、第二子集D2中预测变量的种类;
步骤2.6、判断信息增益G(bl,D)是否大于停止准则S,若大于,则表示最优离散点bl有效,将最优离散点bl添加到离散点集合B中;分别将第一子集D1和第二子集D2替换交通事故数据集D,按照步骤2.4-步骤2.6的过程,在第一子集D1和第二子集D2中寻找下一最优离散切点;否则,执行步骤2.7;
步骤2.7、将l+1赋值给l后,判断l是否大于K-k,若成立,则表示连续自变量集合
Figure FDA0002990268080000021
中所有连续自变量均已离散化,输出各连续自变量的离散点集合B后,执行步骤2.8;否则,返回步骤2.2执行;
步骤2.8、基于离散点集合B对各连续自变量进行离散化,使得所有自变量均转化为分类自变量,从而得到离散后的自变量集合XMDLP={x1,x2,…,xk,xk+1,xk+2,xk+l,…,xK};其中,xk+l表示第k+l个分类自变量;
步骤3、采用基于关联规则的属性选择方法挖掘自变量间的交互作用;
步骤3.1、定义关联规则为A→B,其中,A为规则前件,B为规则后件,→为关系符号;将离散后的自变量集合XMDLP={x1,x2,…,xk,xk+1,xk+2,xk+l,…,xK}中各因素分别设定为规则前件A,预测变量Y的各类别事故设定为规则后件B;
步骤3.2、分别定义关联规则A→B的支持度Support(A→B)、置信度Confidence(A→B)、提升度Lift(A→B),如式(4)、式(5)、式(6)所示:
Figure FDA0002990268080000022
Figure FDA0002990268080000023
Figure FDA0002990268080000024
式(4)、式(5)、式(6)中,N为交通事故的样本总数,P(A∩B)表示交通事故数据中因素A和因素B同时发生的频次;P(A)、P(B)分别表示因素A、因素B在交通事故数据中出现的频次;
步骤3.3、定义并初始化关联规则A→B的最小支持度min Sup、最小置信度min Conf和最小提升度min Lift;
步骤3.4、挖掘关联规则A→B的支持度Support(A→B)、置信度Confidence(A→B)、提升度Lift(A→B);
步骤3.5、定义基于关联规则A→B的属性选择方法的三种受约束规则,分别是强关联规则SAR、分类关联规则CAR、原子型关联规则AAR;
步骤3.5.1、利用式(7)得到强关联规则SAR的表达式:
Support(A→B)>minSup∧Confidence(A→B)>minConf∧Lift(A→B)>minLift (7)
式(7)中,∧表示且;
步骤3.5.2、离散后的自变量集合XMDLP={x1,x2,…,xk,xk+1,xk+2,xk+l,…,xK}中,令|xk|为第k个自变量xk的值域;1≤k≤K;
步骤3.5.3、定义影响因素值集FVIS为所有自变量可能取值的集合,即
Figure FDA0002990268080000031
定义目标值集TVIS为所有预测变量可能取值的集合,即TVIS=|Y|;
步骤3.5.4、利用式(8)得到分类关联规则CAR的表达式:
Figure FDA0002990268080000032
式(8)中,|B|为预测变量的种类;
步骤3.5.3、利用式(9)得到原子型关联规则AAR的表达式:
Figure FDA0002990268080000033
式(8)中,|A|为自变量种类的数量;
步骤3.6、令所有满足分类关联规则CAR的关联规则A→B构成CARset,满足原子型关联规则AAR的关联规则A→B构成原子型关联规则集合AARset;
步骤3.7、对原子型关联规则集合AARset中的关联规则A→B依照置信度进行降序排列;
步骤3.8、依次判定原子型关联规则AAR的规则后件是否出现在分类关联规则集合CARset的规则前件中,若存在,认定原子型关联规则集合AAR的规则后件为冗余变量,从分类关联规则集合CARset中将所有带有原子型关联规则AAR规则后件的关联规则A→B删除;
步骤3.9、按照步骤3.8进行处理,直至原子型关联规则集合AARset为空时为止;
步骤3.10、将分类关联规则集合CARset中剩余关联规则A→B映射到相应的自变量,从而获得包含变量间交互作用的自变量集合Set;
步骤4、基于混合Logit原理构建事故形态预测模型;
步骤4.1、利用式(10)建立混合Logit模型:
Figure FDA0002990268080000034
式(10)中,Pn(yi)表示第n起交通事故的事故形态为yi的概率,
Figure FDA0002990268080000035
表示第n起交通事故的事故形态为yi时自变量的参数向量,
Figure FDA0002990268080000041
表示自变量
Figure FDA0002990268080000042
所估计参数的向量形式;
Figure FDA0002990268080000043
表示随机参数β的概率密度函数,β和
Figure FDA0002990268080000044
分别表示概率密度函均值和方差参数的向量形式;
步骤4.2、将包含变量间交互作用的自变量集合Set中各影响因素纳入混合Logit模型,并采用极大似然估计法对混合Logit模型的参数进行估计;
步骤4.3、根据步骤4.2中获得的混合Logit模型参数估计值Par,在所设定的置信水平下,采用逐步回归法对混合Logit模型的参数进行筛选,筛选得到混合Logit模型的参数估计值
Figure FDA0002990268080000045
步骤5、基于构建的混合Logit模型,进行交通事故形态概率的预测;
步骤5.1、获取实时影响交通事故形态的自变量信息;
步骤5.2、将步骤5.1中获取的自变量信息输入式(11),计算得到相应自变量信息条件下事故形态为yi的效用函数
Figure FDA0002990268080000046
Figure FDA0002990268080000047
式(11)中,
Figure FDA0002990268080000048
表示混合Logit模型参数估计值
Figure FDA0002990268080000049
中事故形态为yi时的参数向量;
步骤5.3、利用式(12)得到实时影响交通事故形态的自变量信息条件下事故形态为yi的预测概率
Figure FDA00029902680800000410
Figure FDA00029902680800000411
式(12)中,
Figure FDA00029902680800000412
表示总效用函数。
CN202110312213.8A 2021-03-24 2021-03-24 一种道路交通事故形态预测方法 Active CN113077625B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110312213.8A CN113077625B (zh) 2021-03-24 2021-03-24 一种道路交通事故形态预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110312213.8A CN113077625B (zh) 2021-03-24 2021-03-24 一种道路交通事故形态预测方法

Publications (2)

Publication Number Publication Date
CN113077625A true CN113077625A (zh) 2021-07-06
CN113077625B CN113077625B (zh) 2022-03-15

Family

ID=76613618

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110312213.8A Active CN113077625B (zh) 2021-03-24 2021-03-24 一种道路交通事故形态预测方法

Country Status (1)

Country Link
CN (1) CN113077625B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113762364A (zh) * 2021-08-23 2021-12-07 东南大学 一种不平衡交通事故数据合成采样方法

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09190422A (ja) * 1996-01-11 1997-07-22 Toshiba Corp 交通状況予測装置
CN104821080A (zh) * 2015-03-02 2015-08-05 北京理工大学 基于宏观城市交通流的智能车辆行驶速度及时间预测方法
CN105931460A (zh) * 2016-05-13 2016-09-07 东南大学 一种快速道路连续瓶颈路段的可变限速控制策略优化方法
CN106709595A (zh) * 2016-11-24 2017-05-24 北京交通大学 基于非格式化信息的事故延误时间预测方法与系统
CN108717786A (zh) * 2018-07-17 2018-10-30 南京航空航天大学 一种基于普适性元规则的交通事故致因挖掘方法
CN109636053A (zh) * 2018-12-20 2019-04-16 黄凤南 一种车辆事故解决优化系统
WO2019103197A1 (ko) * 2017-11-23 2019-05-31 (주)에이텍티앤 인공지능 기반의 교통사고 예측시스템 및 그 방법
CN110555565A (zh) * 2019-09-09 2019-12-10 南京东控智能交通研究院有限公司 基于决策树模型的高速路出口匝道事故严重程度预测方法
CN110782070A (zh) * 2019-09-25 2020-02-11 北京市交通信息中心 一种城市轨道交通突发事件客流时空分布预测方法
CN110826244A (zh) * 2019-11-15 2020-02-21 同济大学 模拟轨道交通影响城市生长的共轭梯度元胞自动机方法
CN111768625A (zh) * 2020-07-01 2020-10-13 中国计量大学 一种基于图嵌入的交通道路事件预测方法
CN112149922A (zh) * 2020-11-03 2020-12-29 南京信息职业技术学院 高速公路隧道下行线出入口区域事故严重程度预测方法
CN112224211A (zh) * 2020-10-19 2021-01-15 中交第一公路勘察设计研究院有限公司 基于多自主体交通流的驾驶模拟仿真系统

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09190422A (ja) * 1996-01-11 1997-07-22 Toshiba Corp 交通状況予測装置
CN104821080A (zh) * 2015-03-02 2015-08-05 北京理工大学 基于宏观城市交通流的智能车辆行驶速度及时间预测方法
CN105931460A (zh) * 2016-05-13 2016-09-07 东南大学 一种快速道路连续瓶颈路段的可变限速控制策略优化方法
CN106709595A (zh) * 2016-11-24 2017-05-24 北京交通大学 基于非格式化信息的事故延误时间预测方法与系统
WO2019103197A1 (ko) * 2017-11-23 2019-05-31 (주)에이텍티앤 인공지능 기반의 교통사고 예측시스템 및 그 방법
CN108717786A (zh) * 2018-07-17 2018-10-30 南京航空航天大学 一种基于普适性元规则的交通事故致因挖掘方法
CN109636053A (zh) * 2018-12-20 2019-04-16 黄凤南 一种车辆事故解决优化系统
CN110555565A (zh) * 2019-09-09 2019-12-10 南京东控智能交通研究院有限公司 基于决策树模型的高速路出口匝道事故严重程度预测方法
CN110782070A (zh) * 2019-09-25 2020-02-11 北京市交通信息中心 一种城市轨道交通突发事件客流时空分布预测方法
CN110826244A (zh) * 2019-11-15 2020-02-21 同济大学 模拟轨道交通影响城市生长的共轭梯度元胞自动机方法
CN111768625A (zh) * 2020-07-01 2020-10-13 中国计量大学 一种基于图嵌入的交通道路事件预测方法
CN112224211A (zh) * 2020-10-19 2021-01-15 中交第一公路勘察设计研究院有限公司 基于多自主体交通流的驾驶模拟仿真系统
CN112149922A (zh) * 2020-11-03 2020-12-29 南京信息职业技术学院 高速公路隧道下行线出入口区域事故严重程度预测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
XIANGHAI MENG 等: "Research on Accident Prediction Models for Freeways in Mountainous and Rolling Areas", 《2015 SEVENTH INTERNATIONAL CONFERENCE ON MEASURING TECHNOLOGY AND MECHATRONICS AUTOMATION》 *
刘文玲 等: "基于关联规则的公交事故受伤情况预测研究", 《控制工程》 *
王磊等: "高速公路交通事故影响因素分析及伤害估计", 《中国安全科学学报》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113762364A (zh) * 2021-08-23 2021-12-07 东南大学 一种不平衡交通事故数据合成采样方法
CN113762364B (zh) * 2021-08-23 2022-11-04 东南大学 一种不平衡交通事故数据合成采样方法

Also Published As

Publication number Publication date
CN113077625B (zh) 2022-03-15

Similar Documents

Publication Publication Date Title
CN110458244B (zh) 一种应用于区域路网的交通事故严重度预测方法
CN107958269A (zh) 一种基于隐马尔可夫模型的行车危险度预测方法
CN113837446B (zh) 一种基于多源异构数据的机场陆侧区域交通态势预测方法
Wang et al. Energy consumption characteristics based driving conditions construction and prediction for hybrid electric buses energy management
CN115662113A (zh) 一种信号交叉口人车博弈冲突风险评估与预警方法
CN113077625B (zh) 一种道路交通事故形态预测方法
CN110288826B (zh) 基于多源数据融合和milp的交通控制子区聚类划分方法
Shang et al. Analyzing the effects of road type and rainy weather on fuel consumption and emissions: A mesoscopic model based on big traffic data
CN117746626A (zh) 基于车流量的智慧交通管理方法及系统
CN112509328B (zh) 一种交叉口右转机动车与电动自行车冲突行为分析方法
CN112651666A (zh) 一种基于驾驶模式转移特征的驾驶员风险评估方法
CN110097757B (zh) 一种基于深度优先搜索的交叉口群关键路径识别方法
CN116935624B (zh) 基于数字孪生的降雪天气智能网联交通事故风险评价方法
CN113688561A (zh) 一种基于神经网络的高速公路施工区最优预警距离确定方法
CN118097953A (zh) 一种基于多源风险的城市主次干路网交通事故风险评估方法
CN117648539A (zh) 一种农村公路交通事故严重程度评价方法
CN112036709B (zh) 基于随机森林的降雨天气高速公路二次事故致因分析方法
CN116453352A (zh) 一种基于k聚类算法和神经网络的货车交通流量预测方法
CN116824868A (zh) 车辆非法停驻点识别及拥堵预测方法、装置、设备及介质
CN115587536A (zh) 一种交通事故严重程度预测方法、设备及存储介质
CN110827446A (zh) 一种电动汽车行驶状态预测方法
CN116882645B (zh) 一种无人驾驶矿车生产调度方法
CN111275241A (zh) 基于机器学习决策树的公交车乘客下车站点推断方法
Han et al. A study on Autonomous Vehicles’ Driving Behavior Based on Open Road Test Data
CN113051695B (zh) 一种基于物联网通信的小区道路规则寻优方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant