CN111768622A - 一种基于改进灰狼算法的短时交通量预测方法 - Google Patents
一种基于改进灰狼算法的短时交通量预测方法 Download PDFInfo
- Publication number
- CN111768622A CN111768622A CN202010581586.0A CN202010581586A CN111768622A CN 111768622 A CN111768622 A CN 111768622A CN 202010581586 A CN202010581586 A CN 202010581586A CN 111768622 A CN111768622 A CN 111768622A
- Authority
- CN
- China
- Prior art keywords
- data
- time
- intersection
- model
- algorithm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 241000282461 Canis lupus Species 0.000 title claims abstract description 66
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000012545 processing Methods 0.000 claims abstract description 23
- 238000005457 optimization Methods 0.000 claims abstract description 22
- 238000012549 training Methods 0.000 claims abstract description 20
- 238000013528 artificial neural network Methods 0.000 claims abstract description 14
- 238000007781 pre-processing Methods 0.000 claims abstract description 13
- 208000025174 PANDAS Diseases 0.000 claims abstract description 8
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 claims abstract description 8
- 235000016496 Panda oleosa Nutrition 0.000 claims abstract description 8
- 230000008569 process Effects 0.000 claims abstract description 7
- 239000006185 dispersion Substances 0.000 claims abstract description 5
- 230000006870 function Effects 0.000 claims description 27
- 239000013598 vector Substances 0.000 claims description 17
- 238000011161 development Methods 0.000 claims description 13
- 230000010354 integration Effects 0.000 claims description 8
- 240000004718 Panda Species 0.000 claims description 7
- 239000003795 chemical substances by application Substances 0.000 claims description 7
- 238000003780 insertion Methods 0.000 claims description 7
- 230000037431 insertion Effects 0.000 claims description 7
- 238000011156 evaluation Methods 0.000 claims description 6
- 238000013501 data transformation Methods 0.000 claims description 5
- 230000007423 decrease Effects 0.000 claims description 5
- 238000011160 research Methods 0.000 claims description 5
- 238000010801 machine learning Methods 0.000 claims description 4
- 230000000306 recurrent effect Effects 0.000 claims description 4
- 238000007405 data analysis Methods 0.000 claims description 3
- 230000002349 favourable effect Effects 0.000 claims description 3
- 230000009191 jumping Effects 0.000 claims description 3
- 238000012886 linear function Methods 0.000 claims description 3
- 238000012986 modification Methods 0.000 claims description 3
- 230000004048 modification Effects 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 238000000611 regression analysis Methods 0.000 claims description 3
- 238000003062 neural network model Methods 0.000 claims description 2
- 238000012216 screening Methods 0.000 abstract 2
- 240000000220 Panda oleosa Species 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 7
- 241000282421 Canidae Species 0.000 description 6
- 230000006399 behavior Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 238000010606 normalization Methods 0.000 description 5
- 230000003247 decreasing effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000012804 iterative process Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 2
- 238000003912 environmental pollution Methods 0.000 description 2
- 238000013178 mathematical model Methods 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- 230000011273 social behavior Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 241000197727 Euscorpius alpha Species 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000000474 nursing effect Effects 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/07—Controlling traffic signals
- G08G1/081—Plural intersections under common control
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Tourism & Hospitality (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Educational Administration (AREA)
- Primary Health Care (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开的一种基于改进灰狼算法的短时交通量预测方法,包括如下步骤:从城市交叉路口数据库将交叉路口数据导入至Oracle数据库,通过NumPy、Pandas对存入的路口数据进行数据预处理;将数据预处理完成的数据转化为监督学习模型需要的特征与标签;使用离差标准化对处理后的数据进行数据标准化处理;基于GRU神经网络构建路口的短时交通量预测模型,将标准化数据输入模型进行训练,实现对未来某时刻交叉路口车流量的预测;基于改进灰狼算法对短时交通量预测模型进行模型优化,提高精度与稳定性。本发明具有对路口数据进行筛选和选择的操作过程,通过对路口数据的筛选和选择,本发明方法可有效提高对路口车流量预测的准确率。
Description
技术领域
本发明属于短时交通量预测技术领域,特别涉及一种基于改进灰狼算法的短时交通量预测方法。
背景技术
近年来,随着大城市贸易圈的发展,交通问题逐步增多。最严重的问题之一是人满为患,这造成公共安全和浪费时间的隐患,而解决交通拥堵的途径之一就是发展智能交通运输系统。
智能交通运输系统(ITS)是目前世界交通运输领域的最前沿,已成为世界各国极力投注资本推进的关键点之一。美国、日本及欧盟等众多先进国家特别重视ITS,它被认为是提高交通的可靠性、安全性和减少环境污染的有效手段之一。构建智能交通系统(ITS)能够有效缓解道路拥堵,缩短出行时间,降低环境污染,提高交通安全性。作为ITS的重要研究内容之一,交通量预测能够作为交通决策的重要依据,可有效地应用于交通规划、交通诱导。
短时交通量预测是交通控制与诱导的基础,是智能交通系统的重要研究内容之一。随着交通量预测相关研究的不断推进,国内外研究人员已经提出了大量短时交通量预测方法,以解决实际问题。
发明内容
发明目的:针对交叉路口车流量受诸多环境影响,导致很难对路口车流量做出准确预测,本发明基于时间序列考虑提出一种基于改进灰狼算法的短时交通量预测方法。
技术方案:一种基于改进灰狼算法的短时交通量预测方法,所述方法包括如下步骤:
步骤1)从城市交叉路口数据库将路口数据导入至Oracle数据库,通过NumPy、Pandas对存入的路口数据进行数据预处理;
步骤2)将数据预处理完成的数据转化为监督学习模型需要的特征与标签;
步骤3)使用离差标准化对处理后的数据进行数据标准化处理;
步骤4)基于GRU神经网络构建路口的短时交通量预测模型,将标准化数据输入模型进行训练,实现对未来某时刻交叉路口车流量的预测;
步骤5)基于改进灰狼算法对上一步骤中的短时交通量预测模型进行模型优化,提高精度与稳定性。
进一步的,所述的步骤1)中,对路口数据进行数据预处理具体为:通过Pandas和NumPy对Oracle数据库下的路口数据进行读取并进行数据处理,数据处理包含三部分,分别是数据整合、数据插入、数据改造;
所述的数据整合:在路口数据中,每一条记录代表一辆车通过交叉路口的数据,而预测的是未来某时刻的交通量是交叉路口的车流量之和,为方便进行时间序列预测,选择10分钟作为一次时间间隔,取10分钟之内所有记录的车辆速度平均值作为该时间段的平均速度,取记录数作为车流量,其余字段丢弃,由于存在数据整合,所以整合后的数据不需要进行清洗,不存在异常值;
所述的数据插入:天气可能是交通流量预测的重要因素,许多研究探索了天气和气象因素对交通流量的影响,因此,本发明也将天气因素作为特征输入;同样的,工作日与周末也会导致交通量出现波动,因此,工作日也会作为特征之一进入训练;
所述的数据改造:因为时间并不能够直接作为特征传入神经网络模型,所以需要进行一定的改造,因为先前取时间间隔为10分钟,所以一天总共有144组数据,将数据的时间改为0到143的编号,表示一天的不同时间段。
进一步的,所述的步骤2)中,将数据预处理完成的数据转化为监督学习模型需要的特征与标签,具体操作为:
假设当前时间段为t,将t-1时间段的时间、天气、车速、车流量作为t时间段的特征,将t时间段的车流量作为标签,将数据处理出15份数据,分别代表不同的时间步长,本发明选择的时间步长为1-15,如此处理后的数据才能进行神经网络训练与预测;
监督学习是一个机器学习中的方法,可以由训练资料中学到或创建一个模式,并依此模式推测新的实例;训练资料是由输入物件(通常是向量)和预期输出所组成;函数的输出可以是一个连续的值(称为回归分析),或是预测一个分类标签(称作分类);
因为交通量预测是一种回归模型,所以要将先前处理好的数据变换成监督学习模型的特征与标签;同时交通量预测是一种时间序列模型,因此使用循环神经网络的变种GRU来进行训练与预测。
进一步的,所述的步骤3)中,对处理后的数据进行数据标准化的具体公式为:
数据标准化处理是数据预处理的一项基础工作,不同评价指标常常具备不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为消弭指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性;原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。
进一步的,所述的步骤5)中,使用改进灰狼算法(DGWO)对步骤4)的短时交通量预测模型进行模型优化;
在原始的GWO中,|A|>1时的迭代专门用于探索,|A|<1时的迭代专门用于开发,尽管拓宽搜索空间的可能会导致陷入局部最优的可能性降低,但是更多的探索会引入更多的随机性0,并且可能导致无法获得最优解;同时,过少的探索会使该算法可能无法达到全局最优;因此,群体智能算法在迭代过程中应保持探索阶段与开发阶段之间的平衡;
其中t表示当前迭代,tmax代表总迭代次数;
本发明使用非线性函数tanh重新定义了的函数,使的值随迭代次数的增加,非线性减小;在迭代初期,步长较大,比起标准GWO减小较快,搜索到的搜索空间理论上没有标准GWO多;随着迭代次数的增加,减小变慢,较小的步长可以防止算法漏掉目标函数的极值点,快速收敛到全局最优解,比标准GWO的收敛程度高且稳定;
改进灰狼算法(DGWO)使用20个搜索代理和20次迭代,通过不断调整GRU模型的超参数来优化整体拟合度。
有益效果:本发明以GRU模型为基础,提出一种基于改进灰狼算法(DGWO)的短时交通量预测模型(DGWO-GRU)。改进灰狼优化算法为协调灰狼算法的全局探索和局部开发能力,给出一种基于双曲正切函数描述的非线性变化收敛因子。通过实验表明,DGWO-GRU模型与LSTM、GRU模型对比,发现DGWO-GRU预测拟合度为97.5%,预测精度最高,稳定性最好,可以满足短时交通流预测的准确性和实时性的要求,能够为短时交通量预测提供一定的参考价值。
附图说明
图1是本发明交叉路口位置的示意图。
图2是本发明原始数据字段的示意图。
图3是GRU单元的示意图。
图4是各个时步的GRU模型对比的示意图。
图5是灰狼的社会支配等级(从上到下递减)的示意图。
图6是灰狼在2D空间中可能更新位置的示意图。
图7是灰狼在3D空间中可能更新位置的示意图。
图8是GWO位置更新的示意图。
图9是灰狼攻击猎物的示意图。
图10是灰狼远离猎物的示意图。
图11是灰狼优化算法的具体步骤示意图。
图12中本发明中的各个收敛因子示意图。
具体实施方式
下面将对本发明实施例中的技术方案进行清楚、完整地描述,以使本领域的技术人员能够更好的理解本发明的优点和特征,从而对本发明的保护范围做出更为清楚的界定。本发明所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
具体实施例1
本发明中的实施例的开发平台与工具如下:
语言:Python;
工具库:NumPy、Pandas、TensorFlow GPU、Scikit Learn。
本实施例的数据来源如下:
本发明采集的某市某街2018年7月20号至2018年9月21日总共63天的交叉路口车流数据。原始数据存储在Oracle中,共有1200万左右的数据。原始数据数据包括过车时间、路口号、检测断面号、车道号、车辆类型、车辆速度、占有时间、检测器类型(雷达、视频)、区域号、车道方向类型共10个字段。
所述的实施例中,包括如下步骤:
步骤1)从城市交叉路口数据库将路口数据导入至Oracle数据库,通过NumPy、Pandas对存入的路口数据进行数据预处理;
步骤2)将数据预处理完成的数据转化为监督学习模型需要的特征与标签;
步骤3)使用离差标准化对处理后的数据进行数据标准化处理;
步骤4)基于GRU神经网络构建路口的短时交通量预测模型,将标准化数据输入模型进行训练,实现对未来某时刻交叉路口车流量的预测;
步骤5)基于改进灰狼算法对上一步骤中的短时交通量预测模型进行模型优化,提高精度与稳定性。
具体操作如下:
所述的步骤1)中,对路口数据进行数据预处理具体为:通过Pandas和NumPy对Oracle数据库下的路口数据进行读取并进行数据处理,数据处理包含三部分,分别是数据整合、数据插入、数据改造;
1.数据整合
在原始数据中,每一条记录代表一辆车通过交叉路口的数据,而预测的是未来某一时刻的交通量是交叉路口的车流量之和。为方便进行时间序列预测,选择10分钟作为一次时间间隔,取10分钟之内所有记录的车辆速度平均值作为该时间段的平均速度,取记录数作为车流量,其余字段丢弃。由于存在数据整合,所以整合后的数据不需要进行清洗,不存在异常值。
处理后的数据如下表1所示:
表1数据整合结果
其中time表示时间刻度,speed表示车流平均速度,volume表示车流量。
2.数据插入
天气可能是交通流量预测的重要因素。许多研究探索了天气和气象因素对交通流量的影响。因此,本发明也将天气因素作为特征输入。同样的,工作日与周末也会导致交通量出现波动。因此,工作日也会作为特征之一进入训练。
处理后的数据如下表2:
表2数据插入结果
其中time表示时间刻度,weekday表示星期的编号,weather表示天气,speed表示车流平均速度,volume表示车流量。
3.数据改造
因为时间并不能够直接作为特征传入神经网络模型,所以需要进行一定的改造。因为先前取时间间隔为10分钟,所以一天总共有144组数据,将数据的时间改为0到143的编号,表示一天的不同时间段。
处理后的数据如下表3:
表3数据改造结果
其中time_index表示时间编号,weekday表示星期的编号,weather表示天气,speed表示车流平均速度,volume表示车流量。
所述的步骤2)中,将数据预处理完成的数据转化为监督学习模型需要的特征与标签,具体操作为:
监督式学习(Supervised learning),是一个机器学习中的方法,可以由训练资料中学到或创建一个模式(learning model),并依此模式推测新的实例。训练资料是由输入物件(通常是向量)和预期输出所组成。函数的输出可以是一个连续的值(称为回归分析),或是预测一个分类标签(称作分类)。
因为交通量预测是一种回归模型,所以要将先前处理好的数据变换成监督学习模型的特征与标签。同时交通量预测是一种时间序列模型,因此使用循环神经网络的变种GRU来进行训练与预测。
将数据处理出15份数据,分别代表不同的时间步长,本发明选择的时间步长为1-15。如此处理后的数据才能进行神经网络训练与预测。
处理后的数据如下表4所示:
表4时间步长为1的数据集
在表4中,t代表第t个时间间隔,1-5代表5个特征。由于篇幅的原因,省略号代表中间连续的特征列被省略。
所述的步骤3)中,对处理后的数据进行数据标准化的具体操作如下:
数据标准化处理是数据处理的一项基础工作,不同评价指标常常具备不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为消弭指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。
数据归一化的优点:
(1)提升模型的收敛速度;
(2)提升模型的精度;
(3)深度学习中数据归一化可以防止模型梯度爆炸。
(4)选择离差标准化,转换函数如下:
(5)处理后的数据如下表5所示:
表5时间步长为1的标准化数据集
步骤4)基于GRU神经网络构建路口的短时交通量预测模型,将标准化数据输入模型进行训练,实现对未来某时刻交叉路口车流量的预测;具体操作如下:
GRU的全名为Gated Recurrent Unit,是Chao等人于2014年提出的新模型,它是LSTM的一种变体。
在很多情况下,GRU和LSTM的实际表现相差不大。通过LSTM与GRU比较可以知道,它们都能够达到相似的结果,并且相比之下,GRU模型更容易进行训练,能够很大程度上提高训练效率,因此很多时候研究人员会优先使用GRU。
LSTM模型的神经元结构比较复杂,它实现了3个门计算,即遗忘门、输入门和输出门(见图3)。但是它的变种GRU模型却将遗忘门和输入门合并为1个,将记忆单元状态C与隐藏状态h混合。所以GRU的神经元结构比LSTM简单,如图3所示。
GRU仅有2个门,分别为更新门和重置门,即图3中的Zt与rt。更新门用于计算前1个时刻的状态信息ht-1传递到当前时刻状态中的程度Zt,更新门的结果Zt越大说明前1时刻的状态信息ht-1传递的信息越少,此时刻的预测状态信息传递的信息越多。重置门用于计算抛弃前1时刻的状态信息
其中:V与b代表神经网络的参数,h代表记忆细胞的状态信息,t代表时间刻度,r代表重置门的相关参数,z代表更新门的相关参数。σ代表sigmoid函数,tanh代表tanh函数(双曲正切)。
GRU模型的计算公式如下:
rt=σ(Wr·[ht-1,xt])
zt=σ(Wz·[ht-1,xt])
为了更全面地比较同一模型中因选择不同参数而导致的不同预测结果,本发明选择均方误差MSE(Mean Squared Error)作为损失函数,同时选择绝对平均误差MAE(MeanAbsolute Error)、均方根误差RMSE(Root Mean Squared Error)、决定系数(拟合优度)R2(R2_score)作为测量函数,以测量模型的预测效果。这几个指标反映了预测值和真实值之间的误差,定义为:
其中ytrue代表实际值,ypred代表预测值,N代表预测样本数。MAE、MSE与RMSE值越小,表示模型越接近真实,模型的精度越高;R2越高,代表模型的拟合度越好。
构建GRU模型训练并进行预测,表6和图4显示了车流量预测精度。
表6各个时步的GRU模型误差
所述的步骤5)中,使用改进灰狼算法(DGWO)对步骤4)的短时交通量预测模型进行模型优化;具体的操作如下:
灰狼优化算法(GreyWolfOptimizer,GWO)是受到灰狼捕食行为的启发而提出的一种群智能优化算法,它是澳大利亚格里菲斯大学学者Mirjalili等人于2014年提出的。它具有较强的收敛性、参数少、易实现等特征。自从过去几年以来,GWO变得非常流行。在很多研究中,GWO已成功用于解决一些实际应用问题,例如经济调度问题,功率分配问题,调度问题,特征选择等等。
GWO算法模仿了灰狼群的社交行为和社会结构。灰狼大多喜好群居生活,在群体中,通过将狼分为四种类型来维持社会结构,如图5所示。
Alpha狼是狼群中中最重要的狼,也被称为头狼。负责狼群中的所有关键和重大的决策。
Beta是Alpha的部下,可帮助Alpha进行决策。它会在没有Alpha的情况下充当主狼。
Delta必须听命Alpha和Beta。侦察狼、护卫狼、狩猎狼、老年狼和护理狼就属于这一类。
剩下的灰狼统称为Omega,它们通常必须听命于所有其它社会层次上的狼。
除了灰狼的社会等级制度外,群体狩猎是灰狼的另一种有趣的社会行为。它们狩猎的主要过程是追踪,包围和试探猎物,直到其停止移动,而后向猎物发起攻击。
GWO优化过程包括了灰狼的社会等级分层、跟踪、围困和试探和袭击猎物等步骤,其步骤具体情况如下所示。
(1)当设计GWO时,首先需构建灰狼社会等级层次模型。计算种群每一个个体的适应度,将狼群中适应度最好的三匹灰狼依次标识为Alpha、Beta和Delta,而剩下的灰狼标识为Omega。也就是说,灰狼群体中的社会等级从高往低排列依次为:Alpha、Beta和Delta以及Omega。GWO的优化过程主要由每代种群中的最佳三个解(即Alpha、Beta和Delta)来引导完成。
(2)当猎物的位置被灰狼捕获时,灰狼将很快包围猎物,当猎物停止运动时,猎物便会被捕杀。为了模拟周围的行为,在标准GWO中使用如下数学模型:
其中t表示当前迭代,是狼在迭代(t+1)处的位置,和是随机向量,表示猎物的位置向量,表示灰狼的位置向量。是负责探索和开发的步长向量,是决定灰狼狼向猎物附近区域移动的差分向量。与类似,也是步长向量,当陷入瓶颈时有助于探索解空间。
其中t表示当前迭代,tmax玳表总迭代次数。
图6中示出了灰狼在2D空间中可能的更新位置。从该图中可以看出,处于(X,Y)位置的灰狼可以依据猎物(X*,Y*)的位置更新自己的位置。经过调整和的值,可以围绕当前位置到达最佳代理四周的不同位置。例如,可以通过设置和来达到(X*-X,Y*)。图7描绘了灰狼在3D空间中可能的更新位置。随机向量和容许灰狼任意随机的更新其在猎物四周空间内的位置。
(3)灰狼有能力辨认猎物的位置(最优解)并围困它们。狩猎通常由Alpha引导,Beta和Delta也可能参与狩猎。然而,在抽象搜索空间中,模型不知道最优(猎物)的位置。为了在数学上模拟灰狼的狩猎行为,模型假定Alpha(最佳候选解决方案)Beta和Delta都能够到达猎物的位置并捕获猎物。因此,为了模拟猎物的位置,模型将保留迄今为止获得的前三个最佳解决方案,并命令其他搜索代理(即Omega)依据最佳搜索代理的位置更新其位置。
狩猎策略的数学模型如下:
图8显示搜索代理(Omega)如何根据2D搜索空间中的Alpha、Beta和Delta更新其位置。可以观察到,最终位置将在橙色圆内的任意位置,该圆是由搜索空间中的Alpha、Beta和Delta的位置定义的。换句话说,Alpha、Beta和Delta预估猎物的位置,其他狼在猎物四周随机更新其位置。
[-1,1]中时,搜索代理的下一个位置可以位于其当前位置和猎物位置之间的任意位置。图9显示|A|<1将迫使灰狼攻击猎物。
GWO主要根据Alpha、Beta和Delta的位置进行搜索。他们彼此分离,寻找猎物,并聚拢攻击猎物。为了在数学上模型化发散,模型利用随机值大于1或小于-1来迫使搜索代理从猎物上发散,这强调了探索并允许GWO算法进行全局搜索。图10还显示|A|>1迫使灰狼远离猎物,以期找到一个更合适的猎物。
GWO的另一个有利于探索的向量是 向量的随机值包含在[0|2]中。该向量为猎物提供随机权重,以便在公式中随机调整猎物与灰狼的距离。这有助于GWO在整个优化过程当中表现出更加随机的行为,有利于探索和防止局部最优。这里值得一提的是,与相比,不是线性下降的,它始终提供随机值,以便不仅在初始迭代过程中而且在最终迭代过程中都强调探索。在局部最优停滞的情况下,该向量非常有用,尤其是在最终迭代中。
(5)综上所述,GWO算法在搜索过程开始时中随机创建灰狼群(候选方案)。在迭代过程中,Alpha、Beta和Delta会估计猎物的可能位置。每一个候选解决方案都会更新其与猎物的距离。为了强调探索和开发,的值在迭代过程中逐渐从2减少到0。当|A|>1时,候选解倾向于探索,当|A|<1时趋向于开发。最后,通过满足给定的条件(迭代次数、EarlyStopping等)来终止GWO算法。
根据以上描述,灰狼优化算法的具体步骤如图11所示。
虽然标准GWO在理论上能够找到全局最优解,但是它相当的不稳定。这是因为在所有群体智能算法中,主要有两个阶段才能达到全局求解。在算法的初始阶段探索整个搜索空间。在最后迭代阶段利用收集的信息收敛到全局最优解。在原始的GWO中,探索和开发阶段之间的转换是由这样的自适应收敛因子完成的。
在原始的GWO中,|A|>1时的迭代专门用于探索,|A|<1时的迭代专门用于开发。尽管拓宽搜索空间的可能会导致陷入局部最优的可能性降低,但是更多的探索会引入更多的随机性,并且可能导致无法获得最优解。同时,过少的探索会使该算法可能无法达到全局最优。因此,群体智能算法在迭代过程中应保持探索阶段与开发阶段之间的平衡。
GWO算法中的值在迭代过程中逐渐从2减少到0。维持着GWO的探索和开发之间的平衡。在实际计算中,前期的需要较大的搜索空间来进行快速搜索;后期由于距离目标较近,过大容易漏掉搜索空间,过早地陷入局部最优解,需要精细的局部搜索。因为在最后迭代阶段仍然有较大幅度的变化,导致标准GWO收敛速度慢且收敛曲线不明显,仍然存在振荡,得到的最优解不够稳定。
其中t表示当前迭代,tmax代表总迭代次数。
图12中的f直线即原本的线性收敛因子,g曲线为双曲正切函数,h曲线即本发明提出的基于双曲正切函数的收敛因子。
本发明使用非线性函数重新定义了的函数,使的值随迭代次数的增加,非线性减小。在迭代初期,步长较大,比起标准GWO减小较快,搜索到的搜索空间理论上没有标准GWO多;随着迭代次数的增加,减小变慢,较小的步长可以防止算法漏掉目标函数的极值点,快速收敛到全局最优解,比标准GWO的收敛程度高且稳定。
由于计算资源有限,本文选择优化的超参数为批处理大小、学习回合、学习率、隐藏层单元数,选择GRU模型进行优化。
给定初始样本数选择20,迭代20次,极限边界如表7所示:
表7超参数的极限值
Hyperparameter | Min | Max |
Batch size | 40 | 100 |
Epochs | 30 | 60 |
Learning rate | 0.00001 | 0.001 |
Units | 1 | 100 |
将运行结果按R2降序排列,如表8所示:
表8灰狼优化GRU模型的部分超参数
比较表6标GRU模型的表现,表8中的对GRU模型的优化取得了一定的成效,R2在原来96.9%的基础上提升了约0.6%,这说明在给定的超参数范围内,灰狼优化对该数据集的优化是存在的,但是作用不明显。不过,同样可以看出,标准GRU模型的拟合度还是比较高的,这说明超参数优化已经无限接近全局最优。
综上可知,本发明提出一种基于双曲正切函数的GWO优化算法对GRU模型进行优化,通过实验表明,新模型与LSTM、GRU模型对比,预测精度最高,稳定性最好,能够为交通量预测提供一定的参考价值。实验先是通过对比LSTM和GRU模型在数据集中的表现,筛选出将要优化的模型以及时间步长,而后使用灰狼优化算法对神经网络的超参数进行优化,从而减少模型的误差,加大拟合度,完成模型的全局最优化。
以上所计算的结果为本发明在试验阶段的较佳实施案例,但不局限与本发明专利范围内,本发明针对本领域的技术人员而言,可以对前述个具体实施的方案进行修改,或对其中部分的技术内容进行相应的修改和替换。
Claims (5)
1.一种基于改进灰狼算法的短时交通量预测方法,其特征在于:所述方法包括如下步骤:
步骤1)从城市交叉路口数据库将路口数据导入至Oracle数据库,通过NumPy、Pandas对存入的路口数据进行数据预处理;
步骤2)将数据预处理完成的数据转化为监督学习模型需要的特征与标签;
步骤3)使用离差标准化对处理后的数据进行数据标准化处理;
步骤4)基于GRU神经网络构建路口的短时交通量预测模型,将标准化数据输入模型进行训练,实现对未来某时刻交叉路口车流量的预测;
步骤5)基于改进灰狼算法对上一步骤中的短时交通量预测模型进行模型优化,提高精度与稳定性。
2.根据权利要求1所述的基于改进灰狼算法的短时交通量预测方法,其特征在于:所述的步骤1)中,对路口数据进行数据预处理具体为:通过Pandas和NumPy对Oracle数据库下的路口数据进行读取并进行数据处理,数据处理包含三部分,分别是数据整合、数据插入、数据改造;
所述的数据整合:在路口数据中,每一条记录代表一辆车通过交叉路口的数据,而预测的是未来某时刻的交通量是交叉路口的车流量之和,为方便进行时间序列预测,选择10分钟作为一次时间间隔,取10分钟之内所有记录的车辆速度平均值作为该时间段的平均速度,取记录数作为车流量,其余字段丢弃,由于存在数据整合,所以整合后的数据不需要进行清洗,不存在异常值;
所述的数据插入:天气可能是交通流量预测的重要因素,许多研究探索了天气和气象因素对交通流量的影响,因此,本发明也将天气因素作为特征输入;同样的,工作日与周末也会导致交通量出现波动,因此,工作日也会作为特征之一进入训练;
所述的数据改造:因为时间并不能够直接作为特征传入神经网络模型,所以需要进行一定的改造,因为先前取时间间隔为10分钟,所以一天总共有144组数据,将数据的时间改为0到143的编号,表示一天的不同时间段。
3.根据权利要求1所述的基于改进灰狼算法的短时交通量预测方法,其特征在于:所述的步骤2)中,将数据预处理完成的数据转化为监督学习模型需要的特征与标签,具体操作为:
假设当前时间段为t,将t-1时间段的时间、天气、车速、车流量作为t时间段的特征,将t时间段的车流量作为标签,将数据处理出15份数据,分别代表不同的时间步长,本发明选择的时间步长为1-15,如此处理后的数据才能进行神经网络训练与预测;
监督学习是一个机器学习中的方法,可以由训练资料中学到或创建一个模式,并依此模式推测新的实例;训练资料是由输入物件(通常是向量)和预期输出所组成;函数的输出可以是一个连续的值(称为回归分析),或是预测一个分类标签(称作分类);
因为交通量预测是一种回归模型,所以要将先前处理好的数据变换成监督学习模型的特征与标签;同时交通量预测是一种时间序列模型,因此使用循环神经网络的变种GRU来进行训练与预测。
5.根据权利要求1所述的基于改进灰狼算法的短时交通量预测方法,其特征在于:所述的步骤5)中,使用改进灰狼算法(DGWO)对步骤4)的短时交通量预测模型进行模型优化;
在原始的GWO中,|A|>1时的迭代专门用于探索,|A|<1时的迭代专门用于开发,尽管拓宽搜索空间的可能会导致陷入局部最优的可能性降低,但是更多的探索会引入更多的随机性,并且可能导致无法获得最优解;同时,过少的探索会使该算法可能无法达到全局最优;因此,群体智能算法在迭代过程中应保持探索阶段与开发阶段之间的平衡;
其中t表示当前迭代,tmax代表总迭代次数;
本发明使用非线性函数tanh重新定义了的函数,使的值随迭代次数的增加,非线性减小;在迭代初期,步长较大,比起标准GWO减小较快,搜索到的搜索空间理论上没有标准GWO多;随着迭代次数的增加,减小变慢,较小的步长可以防止算法漏掉目标函数的极值点,快速收敛到全局最优解,比标准GWO的收敛程度高且稳定;
改进灰狼算法(DGWO)使用20个搜索代理和20次迭代,通过不断调整GRU模型的超参数来优化整体拟合度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010581586.0A CN111768622A (zh) | 2020-06-23 | 2020-06-23 | 一种基于改进灰狼算法的短时交通量预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010581586.0A CN111768622A (zh) | 2020-06-23 | 2020-06-23 | 一种基于改进灰狼算法的短时交通量预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111768622A true CN111768622A (zh) | 2020-10-13 |
Family
ID=72721805
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010581586.0A Pending CN111768622A (zh) | 2020-06-23 | 2020-06-23 | 一种基于改进灰狼算法的短时交通量预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111768622A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112766533A (zh) * | 2020-11-26 | 2021-05-07 | 浙江理工大学 | 一种基于多策略改进gwo_bp神经网络的共享单车需求预测方法 |
CN113205698A (zh) * | 2021-03-24 | 2021-08-03 | 上海吞山智能科技有限公司 | 一种基于igwo-lstm的短时交通流预测的导航提醒方法 |
CN113902011A (zh) * | 2021-10-08 | 2022-01-07 | 南威软件股份有限公司 | 基于循环神经网络的城市轨道交通短时客流预测方法 |
CN114676645A (zh) * | 2022-05-30 | 2022-06-28 | 湖南大学 | 一种非平稳时间序列预测方法及系统 |
CN117351367A (zh) * | 2023-12-06 | 2024-01-05 | 鄄城县公路事业发展中心 | 一种公路养护巡检方法、介质以及设备 |
CN117994986A (zh) * | 2024-04-07 | 2024-05-07 | 岳正检测认证技术有限公司 | 一种基于智能优化算法的交通车流量预测优化方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150221218A1 (en) * | 2014-02-03 | 2015-08-06 | Here Global B.V. | Predictive Incident Aggregation |
CN107085942A (zh) * | 2017-06-26 | 2017-08-22 | 广东工业大学 | 一种基于狼群算法的交通流预测方法、装置及系统 |
CN107193212A (zh) * | 2017-06-26 | 2017-09-22 | 南京航空航天大学 | 基于新型灰狼优化算法的航空发动机非线性预测控制方法 |
CN108694839A (zh) * | 2017-04-07 | 2018-10-23 | 孟卫平 | 交通信号泛绿波控制方法 |
CN110223510A (zh) * | 2019-04-24 | 2019-09-10 | 长安大学 | 一种基于神经网络lstm的多因素短期车流量预测方法 |
CN110322695A (zh) * | 2019-07-23 | 2019-10-11 | 内蒙古工业大学 | 一种基于深度学习的短时交通流预测方法 |
-
2020
- 2020-06-23 CN CN202010581586.0A patent/CN111768622A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150221218A1 (en) * | 2014-02-03 | 2015-08-06 | Here Global B.V. | Predictive Incident Aggregation |
CN108694839A (zh) * | 2017-04-07 | 2018-10-23 | 孟卫平 | 交通信号泛绿波控制方法 |
CN107085942A (zh) * | 2017-06-26 | 2017-08-22 | 广东工业大学 | 一种基于狼群算法的交通流预测方法、装置及系统 |
CN107193212A (zh) * | 2017-06-26 | 2017-09-22 | 南京航空航天大学 | 基于新型灰狼优化算法的航空发动机非线性预测控制方法 |
CN110223510A (zh) * | 2019-04-24 | 2019-09-10 | 长安大学 | 一种基于神经网络lstm的多因素短期车流量预测方法 |
CN110322695A (zh) * | 2019-07-23 | 2019-10-11 | 内蒙古工业大学 | 一种基于深度学习的短时交通流预测方法 |
Non-Patent Citations (2)
Title |
---|
杜甜添: "基于大数据挖掘技术的短时交通流预测方法研究", 《中国优秀硕士学位论文全文数据库工程科技Ⅱ辑》 * |
梁海峰: "基于狼群算法的短时高速交通流量预测仿真", 《计算机仿真》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112766533A (zh) * | 2020-11-26 | 2021-05-07 | 浙江理工大学 | 一种基于多策略改进gwo_bp神经网络的共享单车需求预测方法 |
CN113205698A (zh) * | 2021-03-24 | 2021-08-03 | 上海吞山智能科技有限公司 | 一种基于igwo-lstm的短时交通流预测的导航提醒方法 |
CN113902011A (zh) * | 2021-10-08 | 2022-01-07 | 南威软件股份有限公司 | 基于循环神经网络的城市轨道交通短时客流预测方法 |
CN114676645A (zh) * | 2022-05-30 | 2022-06-28 | 湖南大学 | 一种非平稳时间序列预测方法及系统 |
CN114676645B (zh) * | 2022-05-30 | 2022-08-12 | 湖南大学 | 一种非平稳时间序列预测方法及系统 |
CN117351367A (zh) * | 2023-12-06 | 2024-01-05 | 鄄城县公路事业发展中心 | 一种公路养护巡检方法、介质以及设备 |
CN117351367B (zh) * | 2023-12-06 | 2024-02-09 | 鄄城县公路事业发展中心 | 一种公路养护巡检方法、介质以及设备 |
CN117994986A (zh) * | 2024-04-07 | 2024-05-07 | 岳正检测认证技术有限公司 | 一种基于智能优化算法的交通车流量预测优化方法 |
CN117994986B (zh) * | 2024-04-07 | 2024-05-28 | 岳正检测认证技术有限公司 | 一种基于智能优化算法的交通车流量预测优化方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111768622A (zh) | 一种基于改进灰狼算法的短时交通量预测方法 | |
Khajavi et al. | Predicting the carbon dioxide emission caused by road transport using a Random Forest (RF) model combined by Meta-Heuristic Algorithms | |
CN110648014B (zh) | 一种基于时空分位数回归的区域风电预测方法及系统 | |
CN104091216A (zh) | 基于果蝇优化最小二乘支持向量机的交通信息预测方法 | |
CN110751318A (zh) | 一种基于ipso-lstm的超短期电力负荷预测方法 | |
CN110059852A (zh) | 一种基于改进随机森林算法的股票收益率预测方法 | |
Lin et al. | Tourism demand forecasting: Econometric model based on multivariate adaptive regression splines, artificial neural network and support vector regression | |
Liu et al. | Prediction intervals for granular data streams based on evolving type-2 fuzzy granular neural network dynamic ensemble | |
CN110443448A (zh) | 一种基于双向lstm的飞机机位分类预测方法和系统 | |
Yang et al. | LSTM-based deep learning model for civil aircraft position and attitude prediction approach | |
CN116187835A (zh) | 一种基于数据驱动的台区理论线损区间估算方法及系统 | |
CN115034426B (zh) | 一种基于相空间重构与多模型融合Stacking集成学习方式的滚动负荷预测方法 | |
Zhang et al. | Direction-decision learning based pedestrian flow behavior investigation | |
Ragab | Spider Monkey Optimization with Statistical Analysis for Robust Rainfall Prediction. | |
Gunawan et al. | Long Short-Term Memory Approach for Predicting Air Temperature In Indonesia | |
Xu et al. | Novel Early-Warning Model for Customer Churn of Credit Card Based on GSAIBAS-CatBoost. | |
Zoremsanga et al. | Particle Swarm Optimized Deep Learning Models for Rainfall Prediction: A Case Study in Aizawl, Mizoram | |
Cheng et al. | Network traffic prediction algorithm research based on PSO-BP neural network | |
CN112232557B (zh) | 基于长短期记忆网络的转辙机健康度短期预测方法 | |
Jiménez-López et al. | Artificial neural networks in the application of the growth of the urban sprawl | |
Hsieh et al. | Housing price prediction by using generative adversarial networks | |
Song et al. | A short-term electricity load forecasting method based on WOA-BiLSTM-attention | |
Zhao et al. | Particle swarm algorithm for classification rules generation | |
Wang et al. | Research on House Price Forecast Based on Hyper Parameter Optimization Gradient Boosting Regression Model | |
Liu et al. | Research on routing optimisation of logistics distribution vehicle based on cloud model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201013 |
|
RJ01 | Rejection of invention patent application after publication |