CN117037483A

CN117037483A - 一种基于多头注意力机制的交通流预测方法

Info

Publication number: CN117037483A
Application number: CN202310995264.4A
Authority: CN
Inventors: 贾朝龙; 黄冰宇; 王蓉; 李暾; 庞育才; 段思睿; 肖云鹏
Original assignee: Chongqing University of Post and Telecommunications
Current assignee: Chongqing University of Post and Telecommunications
Priority date: 2023-08-09
Filing date: 2023-08-09
Publication date: 2023-11-10

Abstract

本发明涉及一种基于多头注意力机制的交通流预测方法，包括获取目标道路所在目标区域的路网地理图及其历史交通流数据；构建地理邻域子图和语义相似性子图；利用多头注意力机制分别计算地理邻域子图和语义相似性子图中道路节点与其相邻节点之间的权重，更新地理邻域子图和语义相似性子图的邻接矩阵；利用参数融合法将更新后的地理邻域子图和语义相似性子图的邻接矩阵进行融合得到融合矩阵，根据融合矩阵利用GCN提取目标道路节点的时空特征序列；将目标道路节点的时空特征序列和目标道路节点的交通流数据输入双向GRU模型，根据双向GRU模型的正向输出和反向输出通过全连接层得到目标道路节点的交通流预测结果。

Description

一种基于多头注意力机制的交通流预测方法

技术领域

本发明属于智能交通管理领域，特别是涉及一种基于多头注意力机制的交通流预测方法。

背景技术

随着车辆拥有量持续增加，发展智能交通系统(ITS)实现城市高效的交通规划和管控，已经成为众多国家解决交通问题的首选方案。交通速度预测作为智能交通系统的关键研究问题之一越来越受到重视，尤其是在路网结构复杂、交通流量大的城市道路上。准确及时的交通速度预测，可以帮助管理部门实现高效管控，缓解道路拥堵，提高出行效率。

近些年来，高效准确的交通流预测受到了学者的广泛关注。目前，研究主要从数理统计和深度学习两种方法进行展开。基于数理统计的方法，通过假定未来预测数据与历史交通流数据存在共同特性进行预测，其中自回归综合移动平均方法及其优化算法得到了广泛的应用。基于传统机器学习的方法，利用数据驱动模型来进行预测，其中最常用的方法包括支持向量机、隐马尔可夫模型等。基于深度学习模型的方法，通过使用大量历史交通数据训练网络模型进行预测，能够处理复杂的非线性时空依赖，其中递归神经网络、卷积神经网络和图卷积神经网络被大量用于交通预测。

随着交通数据的不断增长，基于深度学习模型能够处理海量数据和不同结构信息，逐渐成为交通预测模型的主流选择。虽然交通流预测已经取得了显著的成果，但是在交通流预测上仍然存在如下挑战：

1.如何充分挖掘交通流时空信息。交通流的上下游存在任意滞后性，且交通速度数据庞杂，传统的欧氏距离不能完全表示道路间的关系，如何利用语义表示有效表征交通流空间信息仍然具有挑战性。

2.如何捕获交通流的动态相关性。城市交通状况瞬息变化，道路流量的相互作用随着空间和时间等因素动态变化，如何在全局时空下捕获交通流的动态相关性显然是个问题。

3.如何分配不同影响因素对预测结果的权重。城市交通流的时空依赖存在多样性，同一时刻下的时空相关性，以及不同时刻下自身的和其他地区的时空依赖性，给充分挖掘城市路网中时空特征带来了困难。

发明内容

为了解决背景技术中存在的问题，本发明提供一种基于多头注意力机制的交通流预测方法，包括：

S1：通过企业提供的数据查询API或直接下载现有数据源得到目标道路所在目标区域的路网地理图及其历史交通流数据，并进行预处理；

S2：根据目标区域内道路节点之间的连接关系构建地理邻域子图，根据目标区域内道路节点之间交通流数据的相似性构造语义相似性子图；

S3：利用多头注意力机制分别计算地理邻域子图和语义相似性子图中道路节点与其相邻节点之间的权重，更新地理邻域子图和语义相似性子图的邻接矩阵；

S4：利用参数融合法将更新后的地理邻域子图和语义相似性子图的邻接矩阵进行融合得到融合矩阵，根据融合矩阵利用GCN提取目标道路节点的时空特征序列；

S5：将目标道路节点的时空特征序列和目标道路节点的交通流数据输入双向GRU模型，根据双向GRU模型的正向输出和反向输出通过全连接层得到目标道路节点的交通流预测结果。

优选地，所述根据目标区域内道路节点之间的连接关系构建地理邻域子图包括：

当两条道路共享一个交叉路口时，则两个道路节点具有连接关系，创建地理邻域子图：

G_adj＝(V,E_adj,A_adj)

其中，V表示目标区域内的道路节点集，E_adj表示地理邻域子图的边集，A_adj表示地理邻域子图的邻接矩阵，A_xy表示矩阵A_adj中的元素，即地理邻域子图中道路节点v_x和v_y的连接关系。

优选地，所述根据目标区域内道路节点之间交通流数据的相似性构造语义相似性子图包括：

S21：根据目标区域内道路节点之间交通流数据的相似性构造相似矩阵A_sim：

其中，D_sim(T_x,T_y)表示道路节点v_x和v_y之间交通流数据的相似性，T_x和T_y分别表示道路节点v_x和v_y的交通流数据；θ表示设定的阈值；

S22：将相似矩阵A_sim作为语义相似性子图的邻接矩阵，将a_xy＝1的两个道路节点相连构建语义相似性子图。

优选地，所述目标区域内道路节点之间交通流数据的相似性包括：

S211：将目标区域内的历史交通流数据划分为N个时间段，则目标区域内任意两个道路节点v_x和v_y的历史交通流数据分别表示为：

T_x＝[x₁,x₂,…,x_i,…,x_N]

T_y＝[y₁,y₂,…,y_j,…,y_N]

其中，x_i表示道路节点v_x在第i个时间段的交通流数据；y_j表示道路节点v_y在第j个时间段的交通流数据；

S212：利用DTW算法计算目标区域内道路节点之间的交通流数据的相似性；

根据道路节点v_x和v_y的交通流数据在不同时间段之间的距离，构建道路节点v_x和v_y之间的距离矩阵M_N×N：

d_ij＝|x_i-y_j|

根据道路节点v_x和v_y之间的距离矩阵M_N×N利用动态规划算法计算道路节点v_x和v_y之间交通流数据的相似性：

当i-1或j-1等于0时，令：

D_mat(x_i,y_j)＝d_ij

当i-1和j-1大于0时，令：

则道路节点v_x和v_y之间交通流数据的相似性包括：

其中，D_sim(T_x,T_y)表示道路节点v_x和v_y之间交通流数据的相似性。

优选地，所述利用多头注意力机制分别计算地理邻域子图和语义相似性子图中道路节点与其相邻节点之间的权重包括：

S31：用表示道路节点v_x的相邻节点集合，表示道路节点v_x的第k个相邻节点；

S32：将道路节点v_x和道路节点v_x的所有相邻节点的特征表示组成中间特征序列其中，c_k表示道路节点v_x的第k个相邻节点N_k的特征表示；表示道路节点v_x的特征表示；

S33：将中间特征序列输入多头注意力机制模块计算道路节点v_x与其邻居节点之间的权重；

其中，H表示多头注意力机制头的数量，h表示多头注意力机制的第h个头，和表示多头注意力机制第h个头的查询、键和值向量的线性变换矩阵，d_k表示缩放系数，表示道路节点v_x与其第k个相邻节点N_k的权重；表示多头注意力机制的第h个头中道路节点v_x与其第k个相邻节点N_k的权重，W^O表示可训练的参数矩阵。

优选地，所述利用参数融合法将更新后的地理邻域子图和语义相似性子图的邻接矩阵进行融合得到融合矩阵包括：

其中，A_fus表示融合矩阵，表示更新后的地理邻域子图的邻接矩阵，表示更新后的语义相似性子图的邻接矩阵，E₁和表示可训练的参数矩阵，W₁、W₂和W₃表示可训练的参数矩阵，T表示转置符号。

优选地，所述根据融合矩阵利用GCN提取目标道路节点的时空特征序列包括：

H⁰＝c_target

其中，c_target表示目标道路节点的特征表示，H^l+1表示GCN网络第l个隐藏层提取的时空特征；σ表示sigmoid激活函数；I表示单位矩阵；D表示的度矩阵；W^l表示GCN网络第l个隐藏层的权重参数矩阵。

优选地，所述目标道路节点的交通流预测结果包括：

其中，FC表示全连接层；y_t表示目标道路节点的交通流预测结果，表示双向GRU模型的反向输出结果，表示双向GRU模型的正向输出结果；W_b和W_f表示可训练的参数矩阵，b_bf表示偏置。

本发明至少具有以下有益效果

本发明针对交通流速度预测问题，从语义交通流速度数据出发，通过语义化有效表征交通流信息，并利用多头注意力机制来捕获动态变化的时空关系，结合自适应融合方法对交通流复杂时空信息进行表示，然后引入注意力机制结合门控向量来分配不同影响因素的权重，最后结合双向门控图卷积网络对目标区域下的交通流速度进行预测。其中，语义化得到的语义相似子图，不仅结合了路网空间结构，还结合了路网节点时间序列的相似性，因而该子图表征了交通流数据的时空特征；在以往的时空信息提取上，忽略了道路相互作用随着空间和时间等因素的动态变化，而本发明利用多头自注意力机制计算不同时间下节点的影响，从而实现时空信息的动态提取。在信息融合时，针对海量的交通流数据，利用参数融合方法最大程度挖掘交通流的隐藏时空信息，再结合时间门控关注重要的时空特征能够更加准确地完成预测。该方法利用相似交通流挖掘隐藏信息，动态获取并选择性地关注重点时空特征，以实现交通路网中时空相信息的深入挖掘，并准确实时地对目标区域下一时间段的交通速度进行预测。

附图说明

图1为本发明的方法流程图。

具体实施方式

以下通过特定的具体实例说明本发明的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本发明的精神下进行各种修饰或改变。需要说明的是，以下实施例中所提供的图示仅以示意方式说明本发明的基本构想，在不冲突的情况下，以下实施例及实施例中的特征可以相互组合。

其中，附图仅用于示例性说明，表示的仅是示意图，而非实物图，不能理解为对本发明的限制；为了更好地说明本发明的实施例，附图某些部件会有省略、放大或缩小，并不代表实际产品的尺寸；对本领域技术人员来说，附图中某些公知结构及其说明可能省略是可以理解的。

本发明实施例的附图中相同或相似的标号对应相同或相似的部件；在本发明的描述中，需要理解的是，若有术语“上”、“下”、“左”、“右”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此附图中描述位置关系的用语仅用于示例性说明，不能理解为对本发明的限制，对于本领域的普通技术人员而言，可以根据具体情况理解上述术语的具体含义。

本文提出了一种基于多头注意力机制的交通流预测方法，其包括获取数据、提取相关属性、建立模型，最后预测结果，即预测道路上车辆的平均速度。

本发明主要包括三个部分：

第一步：在线获取数据。获取数据的方式是直接查询企业提供数据库中的数据或下载已有数据源，获得目标区域的路网地理图及其交通流数据。并对数据进行预处理。

第二步：提取相关属性。分别从地理邻接、语义相似两方面来建立节点结构关系，提取不同结构下数据的时空特征。

第三步：建立模型。首先引入多头注意力机制对节点时空特征进行提取，然后结合基于参数融合方法合并时空特征。最后利用双向门控图神经网络挖掘交通流的复杂时空相关性，对区域下的交通流速度进行预测研究。

在一实施例中，如图1所示，一种基于多头注意力机制的交通流预测方法具体包括：

具体地，对交通流量数据的预处理包括删除重复数据、清理无效信息等。通常获取的原始数据都是非结构化的，不能直接用于数据分析，通过简单的数据清洗可以使大部分非结构化数据结构化。

G_adj＝(V,E_adj,A_adj)

T_x＝[x₁,x₂,…,x_i,…,x_N]

T_y＝[y₁,y₂,…,y_j,…,y_N]

d_ij＝|x_i-y_j|

当i-1或j-1等于0时，令：

D_match(x_i,y_j)＝d_ij

当i-1和j-1大于0时，令：

则道路节点v_x和v_y之间交通流数据的相似性包括：

众所周知，道路的相互作用随着空间和时间等因素动态变化，只利用固定的路网信息通常会出现表达能力不准确的情况，所以引入带有标记的多头图注意力机制动态生成边缘权重，来量化道路节点间的影响。

交通流的时空依赖复杂多样，预测地点的速度不仅和区域的空间结构有关，还与不同时刻下自身的交通流和上下游的交通流有关。为了能够更准确地预测交通速度，本文引入GCN和双向GRU对时空特征进行提取，并利用时间注意力机制让模型聚焦于和当前任务联系密切的信息首先，针对空间关系，本文引入图卷积网络聚合上下文信息，加强节点表达能力。利用GCN提取融合矩阵A_fus中的节点特征，该特征不仅结合了路网空间结构，还结合了路网节点时间序列的相似性，即时空特征。

考虑到交通路网结构的复杂性，以及节点间相互影响的多变性。引入自适应矩阵来补充节点间隐藏的相关性。该矩阵通过两个可学习参数E₁,E₂□R^N×D获得，，将E₁与E₂相乘得到自适应的空间依赖，利用非线性激活函数ReLU消除次要依赖，最后通过softmax函数获得自适应邻接矩阵A_adp。

H⁰＝c_target

优选地，所述目标道路节点的交通流预测结果包括：

在本实施例中将目标道路节点的时空特征序列和目标道路节点的交通流数据输入双向GRU模型得到双向GRU模型的正向输出和反向输出：

目标道路节点的时空特征序列H_target＝{H¹,H²,…,H^l,…,H^L}，L表示GCN神经网络隐藏层的数量；目标道路节点的交通数据表示为T_target＝{target₁,target₂,…,target_a,…,target_N}；target_a表示目标道路节点在第a个时间段的交通流数据；

将目标道路节点的时空特征序列和目标道路节点的交通数据分别按正序和倒序输入双向GRU模型，在GRU模型中利用时间门控s_t决定在当前时刻输入数据的贡献：

x_t＝[T_target·H_target]

m_t＝σ(W_m[h_t-1,x_t])

利用注意力分布求得关注当前输入交通数据和时空特征序列的权重：

利用γ_t更新候选状态的信息，得到GRU单元的输出：

其中，W_z、W_r和W_P表示可训练的参数矩阵，r等于0或1表示正向或反向，表示正向的预测结果或反向的预测结果。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

最后说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本技术方案的宗旨和范围，其均应涵盖在本发明的权利要求范围当中。

Claims

1.一种基于多头注意力机制的交通流预测方法，其特征在于，包括：

2.根据权利要求1所述的一种基于多头注意力机制的交通流预测方法，其特征在于，所述根据目标区域内道路节点之间的连接关系构建地理邻域子图包括：

G_adj＝(V,E_adj,A_adj)

3.根据权利要求1所述的一种基于多头注意力机制的交通流预测方法，其特征在于，所述根据目标区域内道路节点之间交通流数据的相似性构造语义相似性子图包括：

4.根据权利要求3所述的一种基于多头注意力机制的交通流预测方法，其特征在于，所述目标区域内道路节点之间交通流数据的相似性包括：

T_x＝[x₁,x₂,…,x_i,…,x_N]

T_y＝[y₁,y₂,…,y_j,…,y_N]

d_ij＝|x_i-y_j|

当i-1或j-1等于0时，令：

D_match(x_i,y_j)＝d_ij

当i-1和j-1大于0时，令：

则道路节点v_x和v_y之间交通流数据的相似性包括：

5.根据权利要求1所述的一种基于多头注意力机制的交通流预测方法，其特征在于，所述利用多头注意力机制分别计算地理邻域子图和语义相似性子图中道路节点与其相邻节点之间的权重包括：

S32：将道路节点v_x和道路节点v_x的所有相邻节点的特征表示组成中间特征序列C＝{c_vx,c₁,c₂,…,c_k,…}，其中，c_k表示道路节点v_x的第k个相邻节点N_k的特征表示；c_vx表示道路节点v_x的特征表示；

6.根据权利要求1所述的一种基于多头注意力机制的交通流预测方法，其特征在于，所述利用参数融合法将更新后的地理邻域子图和语义相似性子图的邻接矩阵进行融合得到融合矩阵包括：

7.根据权利要求6所述的一种基于多头注意力机制的交通流预测方法，其特征在于，所述根据融合矩阵利用GCN提取目标道路节点的时空特征序列包括：

H⁰＝c_target

8.根据权利要求1所述的一种基于多头注意力机制的交通流预测方法，其特征在于，所述目标道路节点的交通流预测结果包括：