CN117037483A - 一种基于多头注意力机制的交通流预测方法 - Google Patents
一种基于多头注意力机制的交通流预测方法 Download PDFInfo
- Publication number
- CN117037483A CN117037483A CN202310995264.4A CN202310995264A CN117037483A CN 117037483 A CN117037483 A CN 117037483A CN 202310995264 A CN202310995264 A CN 202310995264A CN 117037483 A CN117037483 A CN 117037483A
- Authority
- CN
- China
- Prior art keywords
- road
- traffic flow
- representing
- node
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000007246 mechanism Effects 0.000 title claims abstract description 43
- 238000000034 method Methods 0.000 title claims abstract description 25
- 239000011159 matrix material Substances 0.000 claims abstract description 78
- 230000002457 bidirectional effect Effects 0.000 claims abstract description 20
- 230000004927 fusion Effects 0.000 claims abstract description 19
- 230000002441 reversible effect Effects 0.000 claims abstract description 11
- 238000007500 overflow downdraw method Methods 0.000 claims abstract description 10
- 230000004913 activation Effects 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 230000003044 adaptive effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
- G08G1/0129—Traffic data processing for creating historical data or processing based on historical data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/042—Knowledge-based neural networks; Logical representations of neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0137—Measuring and analyzing of parameters relative to traffic conditions for specific applications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/052—Detecting movement of traffic to be counted or controlled with provision for determining speed or overspeed
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Chemical & Material Sciences (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Analytical Chemistry (AREA)
- Primary Health Care (AREA)
- Educational Administration (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明涉及一种基于多头注意力机制的交通流预测方法,包括获取目标道路所在目标区域的路网地理图及其历史交通流数据;构建地理邻域子图和语义相似性子图;利用多头注意力机制分别计算地理邻域子图和语义相似性子图中道路节点与其相邻节点之间的权重,更新地理邻域子图和语义相似性子图的邻接矩阵;利用参数融合法将更新后的地理邻域子图和语义相似性子图的邻接矩阵进行融合得到融合矩阵,根据融合矩阵利用GCN提取目标道路节点的时空特征序列;将目标道路节点的时空特征序列和目标道路节点的交通流数据输入双向GRU模型,根据双向GRU模型的正向输出和反向输出通过全连接层得到目标道路节点的交通流预测结果。
Description
技术领域
本发明属于智能交通管理领域,特别是涉及一种基于多头注意力机制的交通流预测方法。
背景技术
随着车辆拥有量持续增加,发展智能交通系统(ITS)实现城市高效的交通规划和管控,已经成为众多国家解决交通问题的首选方案。交通速度预测作为智能交通系统的关键研究问题之一越来越受到重视,尤其是在路网结构复杂、交通流量大的城市道路上。准确及时的交通速度预测,可以帮助管理部门实现高效管控,缓解道路拥堵,提高出行效率。
近些年来,高效准确的交通流预测受到了学者的广泛关注。目前,研究主要从数理统计和深度学习两种方法进行展开。基于数理统计的方法,通过假定未来预测数据与历史交通流数据存在共同特性进行预测,其中自回归综合移动平均方法及其优化算法得到了广泛的应用。基于传统机器学习的方法,利用数据驱动模型来进行预测,其中最常用的方法包括支持向量机、隐马尔可夫模型等。基于深度学习模型的方法,通过使用大量历史交通数据训练网络模型进行预测,能够处理复杂的非线性时空依赖,其中递归神经网络、卷积神经网络和图卷积神经网络被大量用于交通预测。
随着交通数据的不断增长,基于深度学习模型能够处理海量数据和不同结构信息,逐渐成为交通预测模型的主流选择。虽然交通流预测已经取得了显著的成果,但是在交通流预测上仍然存在如下挑战:
1.如何充分挖掘交通流时空信息。交通流的上下游存在任意滞后性,且交通速度数据庞杂,传统的欧氏距离不能完全表示道路间的关系,如何利用语义表示有效表征交通流空间信息仍然具有挑战性。
2.如何捕获交通流的动态相关性。城市交通状况瞬息变化,道路流量的相互作用随着空间和时间等因素动态变化,如何在全局时空下捕获交通流的动态相关性显然是个问题。
3.如何分配不同影响因素对预测结果的权重。城市交通流的时空依赖存在多样性,同一时刻下的时空相关性,以及不同时刻下自身的和其他地区的时空依赖性,给充分挖掘城市路网中时空特征带来了困难。
发明内容
为了解决背景技术中存在的问题,本发明提供一种基于多头注意力机制的交通流预测方法,包括:
S1:通过企业提供的数据查询API或直接下载现有数据源得到目标道路所在目标区域的路网地理图及其历史交通流数据,并进行预处理;
S2:根据目标区域内道路节点之间的连接关系构建地理邻域子图,根据目标区域内道路节点之间交通流数据的相似性构造语义相似性子图;
S3:利用多头注意力机制分别计算地理邻域子图和语义相似性子图中道路节点与其相邻节点之间的权重,更新地理邻域子图和语义相似性子图的邻接矩阵;
S4:利用参数融合法将更新后的地理邻域子图和语义相似性子图的邻接矩阵进行融合得到融合矩阵,根据融合矩阵利用GCN提取目标道路节点的时空特征序列;
S5:将目标道路节点的时空特征序列和目标道路节点的交通流数据输入双向GRU模型,根据双向GRU模型的正向输出和反向输出通过全连接层得到目标道路节点的交通流预测结果。
优选地,所述根据目标区域内道路节点之间的连接关系构建地理邻域子图包括:
当两条道路共享一个交叉路口时,则两个道路节点具有连接关系,创建地理邻域子图:
Gadj=(V,Eadj,Aadj)
其中,V表示目标区域内的道路节点集,Eadj表示地理邻域子图的边集,Aadj表示地理邻域子图的邻接矩阵,Axy表示矩阵Aadj中的元素,即地理邻域子图中道路节点vx和vy的连接关系。
优选地,所述根据目标区域内道路节点之间交通流数据的相似性构造语义相似性子图包括:
S21:根据目标区域内道路节点之间交通流数据的相似性构造相似矩阵Asim:
其中,Dsim(Tx,Ty)表示道路节点vx和vy之间交通流数据的相似性,Tx和Ty分别表示道路节点vx和vy的交通流数据;θ表示设定的阈值;
S22:将相似矩阵Asim作为语义相似性子图的邻接矩阵,将axy=1的两个道路节点相连构建语义相似性子图。
优选地,所述目标区域内道路节点之间交通流数据的相似性包括:
S211:将目标区域内的历史交通流数据划分为N个时间段,则目标区域内任意两个道路节点vx和vy的历史交通流数据分别表示为:
Tx=[x1,x2,…,xi,…,xN]
Ty=[y1,y2,…,yj,…,yN]
其中,xi表示道路节点vx在第i个时间段的交通流数据;yj表示道路节点vy在第j个时间段的交通流数据;
S212:利用DTW算法计算目标区域内道路节点之间的交通流数据的相似性;
根据道路节点vx和vy的交通流数据在不同时间段之间的距离,构建道路节点vx和vy之间的距离矩阵MN×N:
dij=|xi-yj|
根据道路节点vx和vy之间的距离矩阵MN×N利用动态规划算法计算道路节点vx和vy之间交通流数据的相似性:
当i-1或j-1等于0时,令:
Dmat(xi,yj)=dij
当i-1和j-1大于0时,令:
则道路节点vx和vy之间交通流数据的相似性包括:
其中,Dsim(Tx,Ty)表示道路节点vx和vy之间交通流数据的相似性。
优选地,所述利用多头注意力机制分别计算地理邻域子图和语义相似性子图中道路节点与其相邻节点之间的权重包括:
S31:用表示道路节点vx的相邻节点集合,表示道路节点vx的第k个相邻节点;
S32:将道路节点vx和道路节点vx的所有相邻节点的特征表示组成中间特征序列其中,ck表示道路节点vx的第k个相邻节点Nk的特征表示;表示道路节点vx的特征表示;
S33:将中间特征序列输入多头注意力机制模块计算道路节点vx与其邻居节点之间的权重;
其中,H表示多头注意力机制头的数量,h表示多头注意力机制的第h个头,和表示多头注意力机制第h个头的查询、键和值向量的线性变换矩阵,dk表示缩放系数,表示道路节点vx与其第k个相邻节点Nk的权重;表示多头注意力机制的第h个头中道路节点vx与其第k个相邻节点Nk的权重,WO表示可训练的参数矩阵。
优选地,所述利用参数融合法将更新后的地理邻域子图和语义相似性子图的邻接矩阵进行融合得到融合矩阵包括:
其中,Afus表示融合矩阵,表示更新后的地理邻域子图的邻接矩阵,表示更新后的语义相似性子图的邻接矩阵,E1和表示可训练的参数矩阵,W1、W2和W3表示可训练的参数矩阵,T表示转置符号。
优选地,所述根据融合矩阵利用GCN提取目标道路节点的时空特征序列包括:
H0=ctarget
其中,ctarget表示目标道路节点的特征表示,Hl+1表示GCN网络第l个隐藏层提取的时空特征;σ表示sigmoid激活函数;I表示单位矩阵;D表示的度矩阵;Wl表示GCN网络第l个隐藏层的权重参数矩阵。
优选地,所述目标道路节点的交通流预测结果包括:
其中,FC表示全连接层;yt表示目标道路节点的交通流预测结果,表示双向GRU模型的反向输出结果,表示双向GRU模型的正向输出结果;Wb和Wf表示可训练的参数矩阵,bbf表示偏置。
本发明至少具有以下有益效果
本发明针对交通流速度预测问题,从语义交通流速度数据出发,通过语义化有效表征交通流信息,并利用多头注意力机制来捕获动态变化的时空关系,结合自适应融合方法对交通流复杂时空信息进行表示,然后引入注意力机制结合门控向量来分配不同影响因素的权重,最后结合双向门控图卷积网络对目标区域下的交通流速度进行预测。其中,语义化得到的语义相似子图,不仅结合了路网空间结构,还结合了路网节点时间序列的相似性,因而该子图表征了交通流数据的时空特征;在以往的时空信息提取上,忽略了道路相互作用随着空间和时间等因素的动态变化,而本发明利用多头自注意力机制计算不同时间下节点的影响,从而实现时空信息的动态提取。在信息融合时,针对海量的交通流数据,利用参数融合方法最大程度挖掘交通流的隐藏时空信息,再结合时间门控关注重要的时空特征能够更加准确地完成预测。该方法利用相似交通流挖掘隐藏信息,动态获取并选择性地关注重点时空特征,以实现交通路网中时空相信息的深入挖掘,并准确实时地对目标区域下一时间段的交通速度进行预测。
附图说明
图1为本发明的方法流程图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本发明的限制;为了更好地说明本发明的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若有术语“上”、“下”、“左”、“右”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本发明的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
本文提出了一种基于多头注意力机制的交通流预测方法,其包括获取数据、提取相关属性、建立模型,最后预测结果,即预测道路上车辆的平均速度。
本发明主要包括三个部分:
第一步:在线获取数据。获取数据的方式是直接查询企业提供数据库中的数据或下载已有数据源,获得目标区域的路网地理图及其交通流数据。并对数据进行预处理。
第二步:提取相关属性。分别从地理邻接、语义相似两方面来建立节点结构关系,提取不同结构下数据的时空特征。
第三步:建立模型。首先引入多头注意力机制对节点时空特征进行提取,然后结合基于参数融合方法合并时空特征。最后利用双向门控图神经网络挖掘交通流的复杂时空相关性,对区域下的交通流速度进行预测研究。
在一实施例中,如图1所示,一种基于多头注意力机制的交通流预测方法具体包括:
S1:通过企业提供的数据查询API或直接下载现有数据源得到目标道路所在目标区域的路网地理图及其历史交通流数据,并进行预处理;
具体地,对交通流量数据的预处理包括删除重复数据、清理无效信息等。通常获取的原始数据都是非结构化的,不能直接用于数据分析,通过简单的数据清洗可以使大部分非结构化数据结构化。
S2:根据目标区域内道路节点之间的连接关系构建地理邻域子图,根据目标区域内道路节点之间交通流数据的相似性构造语义相似性子图;
优选地,所述根据目标区域内道路节点之间的连接关系构建地理邻域子图包括:
当两条道路共享一个交叉路口时,则两个道路节点具有连接关系,创建地理邻域子图:
Gadj=(V,Eadj,Aadj)
其中,V表示目标区域内的道路节点集,Eadj表示地理邻域子图的边集,Aadj表示地理邻域子图的邻接矩阵,Axy表示矩阵Aadj中的元素,即地理邻域子图中道路节点vx和vy的连接关系。
优选地,所述根据目标区域内道路节点之间交通流数据的相似性构造语义相似性子图包括:
S21:根据目标区域内道路节点之间交通流数据的相似性构造相似矩阵Asim:
其中,Dsim(tx,ty)表示道路节点vx和vy之间交通流数据的相似性,tx和ty分别表示道路节点vx和vy的交通流数据;θ表示设定的阈值;
S22:将相似矩阵Asim作为语义相似性子图的邻接矩阵,将axy=1的两个道路节点相连构建语义相似性子图。
优选地,所述目标区域内道路节点之间交通流数据的相似性包括:
S211:将目标区域内的历史交通流数据划分为N个时间段,则目标区域内任意两个道路节点vx和vy的历史交通流数据分别表示为:
Tx=[x1,x2,…,xi,…,xN]
Ty=[y1,y2,…,yj,…,yN]
其中,xi表示道路节点vx在第i个时间段的交通流数据;yj表示道路节点vy在第j个时间段的交通流数据;
S212:利用DTW算法计算目标区域内道路节点之间的交通流数据的相似性;
根据道路节点vx和vy的交通流数据在不同时间段之间的距离,构建道路节点vx和vy之间的距离矩阵MN×N:
dij=|xi-yj|
根据道路节点vx和vy之间的距离矩阵MN×N利用动态规划算法计算道路节点vx和vy之间交通流数据的相似性:
当i-1或j-1等于0时,令:
Dmatch(xi,yj)=dij
当i-1和j-1大于0时,令:
则道路节点vx和vy之间交通流数据的相似性包括:
其中,Dsim(Tx,Ty)表示道路节点vx和vy之间交通流数据的相似性。
S3:利用多头注意力机制分别计算地理邻域子图和语义相似性子图中道路节点与其相邻节点之间的权重,更新地理邻域子图和语义相似性子图的邻接矩阵;
优选地,所述利用多头注意力机制分别计算地理邻域子图和语义相似性子图中道路节点与其相邻节点之间的权重包括:
众所周知,道路的相互作用随着空间和时间等因素动态变化,只利用固定的路网信息通常会出现表达能力不准确的情况,所以引入带有标记的多头图注意力机制动态生成边缘权重,来量化道路节点间的影响。
S31:用表示道路节点vx的相邻节点集合,表示道路节点vx的第k个相邻节点;
S32:将道路节点vx和道路节点vx的所有相邻节点的特征表示组成中间特征序列其中,ck表示道路节点vx的第k个相邻节点Nk的特征表示;表示道路节点vx的特征表示;
S33:将中间特征序列输入多头注意力机制模块计算道路节点vx与其邻居节点之间的权重;
其中,H表示多头注意力机制头的数量,h表示多头注意力机制的第h个头,和表示多头注意力机制第h个头的查询、键和值向量的线性变换矩阵,dk表示缩放系数,表示道路节点vx与其第k个相邻节点Nk的权重;表示多头注意力机制的第h个头中道路节点vx与其第k个相邻节点Nk的权重,WO表示可训练的参数矩阵。
S4:利用参数融合法将更新后的地理邻域子图和语义相似性子图的邻接矩阵进行融合得到融合矩阵,根据融合矩阵利用GCN提取目标道路节点的时空特征序列;
交通流的时空依赖复杂多样,预测地点的速度不仅和区域的空间结构有关,还与不同时刻下自身的交通流和上下游的交通流有关。为了能够更准确地预测交通速度,本文引入GCN和双向GRU对时空特征进行提取,并利用时间注意力机制让模型聚焦于和当前任务联系密切的信息首先,针对空间关系,本文引入图卷积网络聚合上下文信息,加强节点表达能力。利用GCN提取融合矩阵Afus中的节点特征,该特征不仅结合了路网空间结构,还结合了路网节点时间序列的相似性,即时空特征。
优选地,所述利用参数融合法将更新后的地理邻域子图和语义相似性子图的邻接矩阵进行融合得到融合矩阵包括:
其中,Afus表示融合矩阵,表示更新后的地理邻域子图的邻接矩阵,表示更新后的语义相似性子图的邻接矩阵,E1和表示可训练的参数矩阵,W1、W2和W3表示可训练的参数矩阵,T表示转置符号。
考虑到交通路网结构的复杂性,以及节点间相互影响的多变性。引入自适应矩阵来补充节点间隐藏的相关性。该矩阵通过两个可学习参数E1,E2□RN×D获得,,将E1与E2相乘得到自适应的空间依赖,利用非线性激活函数ReLU消除次要依赖,最后通过softmax函数获得自适应邻接矩阵Aadp。
优选地,所述根据融合矩阵利用GCN提取目标道路节点的时空特征序列包括:
H0=ctarget
其中,ctarget表示目标道路节点的特征表示,Hl+1表示GCN网络第l个隐藏层提取的时空特征;σ表示sigmoid激活函数;I表示单位矩阵;D表示的度矩阵;Wl表示GCN网络第l个隐藏层的权重参数矩阵。
S5:将目标道路节点的时空特征序列和目标道路节点的交通流数据输入双向GRU模型,根据双向GRU模型的正向输出和反向输出通过全连接层得到目标道路节点的交通流预测结果。
优选地,所述目标道路节点的交通流预测结果包括:
其中,FC表示全连接层;yt表示目标道路节点的交通流预测结果,表示双向GRU模型的反向输出结果,表示双向GRU模型的正向输出结果;Wb和Wf表示可训练的参数矩阵,bbf表示偏置。
在本实施例中将目标道路节点的时空特征序列和目标道路节点的交通流数据输入双向GRU模型得到双向GRU模型的正向输出和反向输出:
目标道路节点的时空特征序列Htarget={H1,H2,…,Hl,…,HL},L表示GCN神经网络隐藏层的数量;目标道路节点的交通数据表示为Ttarget={target1,target2,…,targeta,…,targetN};targeta表示目标道路节点在第a个时间段的交通流数据;
将目标道路节点的时空特征序列和目标道路节点的交通数据分别按正序和倒序输入双向GRU模型,在GRU模型中利用时间门控st决定在当前时刻输入数据的贡献:
xt=[Ttarget·Htarget]
mt=σ(Wm[ht-1,xt])
利用注意力分布求得关注当前输入交通数据和时空特征序列的权重:
利用γt更新候选状态的信息,得到GRU单元的输出:
其中,Wz、Wr和WP表示可训练的参数矩阵,r等于0或1表示正向或反向,表示正向的预测结果或反向的预测结果。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (8)
1.一种基于多头注意力机制的交通流预测方法,其特征在于,包括:
S1:通过企业提供的数据查询API或直接下载现有数据源得到目标道路所在目标区域的路网地理图及其历史交通流数据,并进行预处理;
S2:根据目标区域内道路节点之间的连接关系构建地理邻域子图,根据目标区域内道路节点之间交通流数据的相似性构造语义相似性子图;
S3:利用多头注意力机制分别计算地理邻域子图和语义相似性子图中道路节点与其相邻节点之间的权重,更新地理邻域子图和语义相似性子图的邻接矩阵;
S4:利用参数融合法将更新后的地理邻域子图和语义相似性子图的邻接矩阵进行融合得到融合矩阵,根据融合矩阵利用GCN提取目标道路节点的时空特征序列;
S5:将目标道路节点的时空特征序列和目标道路节点的交通流数据输入双向GRU模型,根据双向GRU模型的正向输出和反向输出通过全连接层得到目标道路节点的交通流预测结果。
2.根据权利要求1所述的一种基于多头注意力机制的交通流预测方法,其特征在于,所述根据目标区域内道路节点之间的连接关系构建地理邻域子图包括:
当两条道路共享一个交叉路口时,则两个道路节点具有连接关系,创建地理邻域子图:
Gadj=(V,Eadj,Aadj)
其中,V表示目标区域内的道路节点集,Eadj表示地理邻域子图的边集,Aadj表示地理邻域子图的邻接矩阵,Axy表示矩阵Aadj中的元素,即地理邻域子图中道路节点vx和vy的连接关系。
3.根据权利要求1所述的一种基于多头注意力机制的交通流预测方法,其特征在于,所述根据目标区域内道路节点之间交通流数据的相似性构造语义相似性子图包括:
S21:根据目标区域内道路节点之间交通流数据的相似性构造相似矩阵Asim:
其中,Dsim(Tx,Ty)表示道路节点vx和vy之间交通流数据的相似性,Tx和Ty分别表示道路节点vx和vy的交通流数据;θ表示设定的阈值;
S22:将相似矩阵Asim作为语义相似性子图的邻接矩阵,将axy=1的两个道路节点相连构建语义相似性子图。
4.根据权利要求3所述的一种基于多头注意力机制的交通流预测方法,其特征在于,所述目标区域内道路节点之间交通流数据的相似性包括:
S211:将目标区域内的历史交通流数据划分为N个时间段,则目标区域内任意两个道路节点vx和vy的历史交通流数据分别表示为:
Tx=[x1,x2,…,xi,…,xN]
Ty=[y1,y2,…,yj,…,yN]
其中,xi表示道路节点vx在第i个时间段的交通流数据;yj表示道路节点vy在第j个时间段的交通流数据;
S212:利用DTW算法计算目标区域内道路节点之间的交通流数据的相似性;
根据道路节点vx和vy的交通流数据在不同时间段之间的距离,构建道路节点vx和vy之间的距离矩阵MN×N:
dij=|xi-yj|
根据道路节点vx和vy之间的距离矩阵MN×N利用动态规划算法计算道路节点vx和vy之间交通流数据的相似性:
当i-1或j-1等于0时,令:
Dmatch(xi,yj)=dij
当i-1和j-1大于0时,令:
则道路节点vx和vy之间交通流数据的相似性包括:
其中,Dsim(Tx,Ty)表示道路节点vx和vy之间交通流数据的相似性。
5.根据权利要求1所述的一种基于多头注意力机制的交通流预测方法,其特征在于,所述利用多头注意力机制分别计算地理邻域子图和语义相似性子图中道路节点与其相邻节点之间的权重包括:
S31:用表示道路节点vx的相邻节点集合,表示道路节点vx的第k个相邻节点;
S32:将道路节点vx和道路节点vx的所有相邻节点的特征表示组成中间特征序列C={cvx,c1,c2,…,ck,…},其中,ck表示道路节点vx的第k个相邻节点Nk的特征表示;cvx表示道路节点vx的特征表示;
S33:将中间特征序列输入多头注意力机制模块计算道路节点vx与其邻居节点之间的权重;
其中,H表示多头注意力机制头的数量,h表示多头注意力机制的第h个头,和表示多头注意力机制第h个头的查询、键和值向量的线性变换矩阵,dk表示缩放系数,表示道路节点vx与其第k个相邻节点Nk的权重;表示多头注意力机制的第h个头中道路节点vx与其第k个相邻节点Nk的权重,WO表示可训练的参数矩阵。
6.根据权利要求1所述的一种基于多头注意力机制的交通流预测方法,其特征在于,所述利用参数融合法将更新后的地理邻域子图和语义相似性子图的邻接矩阵进行融合得到融合矩阵包括:
其中,Afus表示融合矩阵,表示更新后的地理邻域子图的邻接矩阵,表示更新后的语义相似性子图的邻接矩阵,E1和表示可训练的参数矩阵,W1、W2和W3表示可训练的参数矩阵,T表示转置符号。
7.根据权利要求6所述的一种基于多头注意力机制的交通流预测方法,其特征在于,所述根据融合矩阵利用GCN提取目标道路节点的时空特征序列包括:
H0=ctarget
其中,ctarget表示目标道路节点的特征表示,Hl+1表示GCN网络第l个隐藏层提取的时空特征;σ表示sigmoid激活函数;I表示单位矩阵;D表示的度矩阵;Wl表示GCN网络第l个隐藏层的权重参数矩阵。
8.根据权利要求1所述的一种基于多头注意力机制的交通流预测方法,其特征在于,所述目标道路节点的交通流预测结果包括:
其中,FC表示全连接层;yt表示目标道路节点的交通流预测结果,表示双向GRU模型的反向输出结果,表示双向GRU模型的正向输出结果;Wb和Wf表示可训练的参数矩阵,bbf表示偏置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310995264.4A CN117037483A (zh) | 2023-08-09 | 2023-08-09 | 一种基于多头注意力机制的交通流预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310995264.4A CN117037483A (zh) | 2023-08-09 | 2023-08-09 | 一种基于多头注意力机制的交通流预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117037483A true CN117037483A (zh) | 2023-11-10 |
Family
ID=88629441
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310995264.4A Pending CN117037483A (zh) | 2023-08-09 | 2023-08-09 | 一种基于多头注意力机制的交通流预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117037483A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118015049A (zh) * | 2024-04-09 | 2024-05-10 | 湖南大学 | 一种结合yolo和gcn的海上目标追踪方法及其模型 |
CN118571021A (zh) * | 2024-07-31 | 2024-08-30 | 杭州电子科技大学 | 基于多层注意力的图融合交通流量预测方法、介质及设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210064999A1 (en) * | 2019-08-29 | 2021-03-04 | Nec Laboratories America, Inc. | Multi-scale multi-granularity spatial-temporal traffic volume prediction |
CN112990594A (zh) * | 2021-03-30 | 2021-06-18 | 上海海事大学 | 一种基于多头自注意力机制的交通流量预测模型及方法 |
EP4016412A1 (en) * | 2020-12-18 | 2022-06-22 | Imec VZW | Traffic prediction |
CN115641718A (zh) * | 2022-10-24 | 2023-01-24 | 重庆邮电大学 | 一种基于卡口流量相似性和语义关联的短时交通流预测方法 |
-
2023
- 2023-08-09 CN CN202310995264.4A patent/CN117037483A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210064999A1 (en) * | 2019-08-29 | 2021-03-04 | Nec Laboratories America, Inc. | Multi-scale multi-granularity spatial-temporal traffic volume prediction |
EP4016412A1 (en) * | 2020-12-18 | 2022-06-22 | Imec VZW | Traffic prediction |
CN112990594A (zh) * | 2021-03-30 | 2021-06-18 | 上海海事大学 | 一种基于多头自注意力机制的交通流量预测模型及方法 |
CN115641718A (zh) * | 2022-10-24 | 2023-01-24 | 重庆邮电大学 | 一种基于卡口流量相似性和语义关联的短时交通流预测方法 |
Non-Patent Citations (1)
Title |
---|
夏英 等: "面向交通流量预测的多头注意力时空卷积图网络模型", 《计算机应用研究》, vol. 40, no. 3, 31 March 2023 (2023-03-31), pages 766 - 770 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118015049A (zh) * | 2024-04-09 | 2024-05-10 | 湖南大学 | 一种结合yolo和gcn的海上目标追踪方法及其模型 |
CN118571021A (zh) * | 2024-07-31 | 2024-08-30 | 杭州电子科技大学 | 基于多层注意力的图融合交通流量预测方法、介质及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110827543B (zh) | 一种基于深度学习和时空数据融合的短时交通流控制方法 | |
Yin et al. | Multi-stage attention spatial-temporal graph networks for traffic prediction | |
Luo et al. | ESTNet: embedded spatial-temporal network for modeling traffic flow dynamics | |
Long et al. | Unified spatial-temporal neighbor attention network for dynamic traffic prediction | |
CN112216108A (zh) | 一种基于属性增强的时空图卷积模型的交通预测方法 | |
CN106910199B (zh) | 面向城市空间信息采集的车联网众包方法 | |
CN117037483A (zh) | 一种基于多头注意力机制的交通流预测方法 | |
CN113538910A (zh) | 一种自适应的全链条城市区域网络信号控制优化方法 | |
CN112365708B (zh) | 基于多图卷积网络的景区交通量预测模型建立和预测方法 | |
CN115545758B (zh) | 城市服务设施自适应增量选址的方法和系统 | |
CN115376317A (zh) | 一种基于动态图卷积和时序卷积网络的交通流预测方法 | |
CN113283581B (zh) | 多融合图网络协同多通道注意力模型及其应用和应用方法 | |
CN115204478A (zh) | 一种结合城市兴趣点和时空因果关系的公共交通流量预测方法 | |
Zhang et al. | CGAIL: Conditional generative adversarial imitation learning—An application in taxi Drivers’ strategy learning | |
CN114970058B (zh) | 一种基于信赖域贝叶斯的大规模网络信号控制优化方法 | |
CN112863182A (zh) | 基于迁移学习的跨模态数据预测方法 | |
CN117116048A (zh) | 基于知识表示模型和图神经网络的知识驱动交通预测方法 | |
Liu et al. | A method for short-term traffic flow forecasting based on GCN-LSTM | |
Hou et al. | Urban region profiling with spatio-temporal graph neural networks | |
CN113159371B (zh) | 基于跨模态数据融合的未知目标特征建模与需求预测方法 | |
Hu et al. | SOUP: A fleet management system for passenger demand prediction and competitive taxi supply | |
Liu et al. | Co-prediction of multimodal transportation demands with self-learned spatial dependence | |
Li et al. | MGC-GAN: Multi-graph convolutional generative adversarial networks for accurate citywide traffic flow prediction | |
CN116167254A (zh) | 基于城市大数据的多维城市仿真推演方法和系统 | |
Miao et al. | Deep Multi-View Channel-Wise Spatio-Temporal Network for Traffic Flow Prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |