CN114782977B

CN114782977B - 一种基于拓扑信息和亲和度信息引导行人重识别方法

Info

Publication number: CN114782977B
Application number: CN202110469260.3A
Authority: CN
Inventors: 张苗辉; 王喜乐; 高诚诚; 李开放; 惠冠程
Original assignee: Henan University
Current assignee: Henan University
Priority date: 2021-04-28
Filing date: 2021-04-28
Publication date: 2024-07-05
Anticipated expiration: 2041-04-28
Also published as: CN114782977A

Abstract

本发明公开了一种基于拓扑信息和亲和度信息引导行人重识别方法，步骤1：利用ResNet‑50构建行人重识别模型的主干网络，用于提取行人特征；步骤2：自学习图卷积网络的构建，其用于空间拓扑信息的挖掘；步骤3：空间注意力子模块的构建，指导空间注意力的学习；步骤4：通道注意力子模块的构建，指导通道注意力的学习；步骤5：对基于拓扑信息和亲和度信息引导的全局注意力模块组合方式设计与实现；步骤6：对基于拓扑信息和亲和度信息引导的全局注意力模块进行嵌入方式设计。通道注意力融合了通道亲和度信息和通道语义信息来指导通道注意力的学习。以此来提升行人特征的表征能力，提升行人重识别模型的性能。

Description

一种基于拓扑信息和亲和度信息引导行人重识别方法

技术领域

本发明属于计算机视觉技术领域，具体涉及一种基于拓扑信息和亲和度信息引导行人重识别方法。

背景技术

行人重识别指的是给出一张感兴趣的行人图像，在其他的摄像机镜头拍摄的图像中检索并识别出属于这个行人的全部图片，行人重识别的本质是非重叠摄像头下的指定行人检索问题。行人重识别技术具有很多重要的应用场景，如视频监控，人的行为分析，多目标跟踪等。因此行人重识别日益受到研究者的重视，但是在实际环境中仍然是一项具有挑战性的任务。

传统的行人重识别方法大都是根据人类对图像的理解来设计特征，一般是通过事先定义好的特征描述方法提取图像特征，如颜色，纹理和梯度等。这些方法在小数据上取得了一定的成功，但是难以满足大规模搜索的需求。近年来，以卷积神经网络为代表的深度学习在计算机视觉领域取得了极大的成功,在多项任务上都击败传统的方法,甚至一定程度上超越了人类的水平。所以许多研究者通过设计不同的深层网络来学习行人的识别特征，从而提升行人重识别模型的性能。

近年来，由于注意力机制可以关注输入信号中信息最丰富的部分，并在各种任务中被证明是有效的，包括纹理合成，超分辨率，图像修补等，甚至是图像识别，图像分割，动作定位等高级任务中也是有效的。行人重识别的关键就是通过具有鉴别性特征的学习来匹配行人图像，而注意力机制可以强化鉴别性特征，抑制不相关特征。这一点与行人重识别相匹配，所以在行人重识别领域中，注意力机制受到了广泛的应用。

行人重识别的主要问题是由于局部的遮挡，背景噪声，相机风格变化，光照条件变化等因素，导致行人的外观产生较大的变化。面对这些问题，如何提取具有鉴别性的特征对行人重识别具有重大意义。

发明内容

针对现有技术不足，本发明的目的在于提供一种基于拓扑信息和亲和度信息引导行人重识别方法，提出了两种有益于聚类的全局信息，即空间拓扑信息和通道亲和度信息。在此基础上设计一个基于拓扑信息和亲和度信息引导的全局注意力模块，该全局注意力模块包含空间注意力子模块和通道注意力子模块。空间注意力子模块融合了空间拓扑信息和局部特征的语义信息来指导空间注意力的学习，通道注意力融合了通道亲和度信息和通道语义信息来指导通道注意力的学习。以此来提升行人特征的表征能力，提升行人重识别模型的性能。

本发明提供如下技术方案：

一种基于拓扑信息和亲和度信息引导行人重识别方法，包括以下步骤：

步骤1：利用ResNet-50构建行人重识别模型的主干网络，用于提取行人特征；

步骤2：自学习图卷积网络的构建，自学习图卷积网络只需要输入点集中所有点的特征X∈R^C×N即可，其中C和N分别表示每一个特征点的维度和点集中特征点的个数；

步骤3：空间注意力子模块的构建，其利用空间拓扑信息和局部特征的语义信息相融合来指导空间注意力的学习；

步骤4：通道注意力子模块的构建，其利用通道亲和度信息和通道语义信息相融合来指导通道注意力的学习；

步骤5：对基于拓扑信息和亲和度信息引导的全局注意力模块组合方式设计与实现；

步骤6：对基于拓扑信息和亲和度信息引导的全局注意力模块进行嵌入方式设计。

优选的，在步骤1中，ResNet-50需要在ImageNet上进行预训练，再去除掉了conv5_x中最后一个空间下采样操作，增加了N_i-dim全连接层进行分类，N_i表示数据集中行人身份的数量。

优选的，在步骤2中，利用两个独立的1×1卷积层来学习成对特征点之间的关系，并利用这些关联信息构建邻接矩阵A^ls，将N个特征点表示为v_i∈R^C，其中i＝1,…,N，那么A^ls中第i行，第j列的值可以表示为

其中f₁和f₂是两个嵌入函数，其通过一个1×1卷积层连接批量正则化层和激活函数ReLU所实现的，f₁和f₂可以表示为：

f₁(v_i)＝ReLU(BN(θ(v_i)))

f₂(v_j)＝ReLU(BN(φ(v_j)))

其中表示两个独立的1×1卷积层，这两个卷积层的输出设为输入的1/s，所以自学习图卷积可以表示为：

X_t＝A^lsXW。

优选的，在步骤3中，首先，经过主干网络进行特征提取，获得了宽为W，高为H，通道为C的中间特征图X∈R^H×W×C，将每一个空间位置上C维向量作为特征点，每一个特征点代表其对应空间位置的局部特征，将这些具有空间局部特征的特征点联合起来形成一个点集X^s＝{x₁,x₂,x₃…x_N}，其中N＝H×W；将这个点集X^s送入自学习图卷积网络中，进而获得具有拓扑信息的点集将点集中的特征点按照原来的空间位置构建特征图C^s其中表示自学习图卷积网络生成的特征点的维度，X_t表示具有拓扑信息的特征图，为了获得更加全面的信息，将局部特征的语义信息和空间拓扑信息进行融合，由于这两种信息不属于同一种特征域，需要将它们分别送入1×1的卷积层，并将其拼接获得空间融合特征F_s：

F_s＝[P_s(L_s(X)),T_s(X_t)]；

L_s和T_s分别表示局部特征和具有拓扑信息的特征图的嵌入函数，该函数是使用带有批正则化层和ReLU激活函数的1×1卷积层，L_s的输出维度设为原来的1/r，T_s的输出维度与原来相同，表示沿着通道方向做平均池化操作，将其维度减小到1，最终获得空间融合特征F_s∈R^H×W×(1+C)，并设计了一个浅层神经网络利用空间融合特征F_s来学习空间注意力A_s：

A_s＝Sigmoid(L₂(L₁(F_s)))；

L₁和L₂分别表示这个小型网络的第一层和第二层卷积层，L₁是由一个1×1的卷积层和批正则化层以及ReLU激活函数组成，L₁将通道维度缩减到原来的1/r，L₂是由的卷积层和批正则化层组合而成，L₂将通道维度缩减为1，通过融合局部特征的语义信息和空间拓扑信息来学习空间注意力权重，获得的特征图X_s可以表示为：

X_s＝A_s⊙X；

其中A_s∈R^H×W×1表示空间注意力图，X∈R^H×W×C表示输入特征，⊙表示对应空间位置的乘法运算。

优选的，在步骤4中，利用主干网络，提取行人图像的中间特征图X∈R^H×W×C，其宽为W，高为H，通道为C，将中间特征图X分割成C个通道，将每一个通道变换为一个大小为H×W的特征向量，将所有通道特征组成一个点集X^c＝{x₁,x₂,x₃…x_C}，那么特征点i和特征点j成对的亲和度关系表示为：

f_c(·)是一个计算成对特征点之间亲和度的函数，其中和ψ是两个独立的1×1卷积层，其后面连接批正则化层和ReLU激活函数，并将输出维度调整为原来的1/s，那么，经过相似关系加权过的特征向量x_ai可以表示为：

x_i表示点集X^c中的第i个点的特征向量，C表示X^c中包含的点的总数，之后，可以获得经过相似关系加权后的点集将这些特征点按照对应的通道顺序连接起来组合成特征图X_a∈R^(HW)×C×1；与空间注意力子模块相似，用同样的方法融合通道语义信息和通道亲和度信息来获取通道融合特征F_c：

F_c＝[P_c(L_c(X)),A_c(X_a)]； (9)

P_c表示沿着空间维度的全局平均池化操作，从而将维度缩减到1，L_c和A_c类似于公式4的L_s和T_s，获得通道融合特征F_c∈R^1×(1+HW)×C，类似于公式5，通过通道融合特征F_c学习通道注意力A_c，经过通道注意力子模块可以获得特征图X_c：

其中A_c∈R^1×1×C表示通道特征图，X∈R^H×W×C表示输入特征，表示对应通道上的乘法运算。

优选的，在步骤5中，由于全局注意力模块包含空间注意力子模块和通道注意力子模块，所以其具有三种组合方式，

方式一：将空间注意力子模块和通道注意力子模块并行连接，其输入为中间特征X，则方式一可以表示为：

X_s∥c＝X_s+X_c；

方式二：将空间注意力子模块和通道注意力子模块按照顺串行连接，空间注意力子模块的输入为中间特征X，通道注意力子模块的输入是空间注意力子模块的输出X_s，则方式二可表示为：

方式三：将通道注意力子模块和空间注意力子模块按照顺串行连接。通道注意力子模块的输入为中间特征X，空间注意力子模块的输入是通道注意力子模块的输出X_c，则方式三可表示为：

优选的，在步骤6中，基于拓扑信息和亲和度信息引导的全局注意力模块是一个易于嵌入到其他网络中的模块，只需要将全局注意力模块的输入调整为分别调整为四个残差块(conv2_x，conv3_x，conv4_x和conv5_x)输出的中间特征的尺寸相同，即可将该全局注意力模块分别嵌入到ResNet-50的四个残差块之后。

优选的，基于拓扑信息和亲和度信息引导的全局注意力模块采用方式三的组合方式略优于方式一和方式二，对行人重识别基线模型的性能提升更大。

优选的，在步骤1之前还进行数据集的预处理和训练参数的设定，所有行人图像的大小统一调整为256×128，对所有行人图像使用随机裁剪，随机水平翻转，随机擦除等数据增强策略，每小批随机选择32张行人图片，包含8个人，每人4张图片，选用Adam优化器进行训练，总共训练600个周期，并采用预热策略来训练出更好的模型，具体来说，设置初始学习率为8×10^-6，并在20个预热期内将初始学习率提高到8×10^-4之后，学习率每40个周期以0.5倍衰减，损失函数采用传统的分类损失和三元组损失。

优选的，在步骤6后：使用数据集Market-1501和DukeMTMC-reID数据集对模型进行性能评估。首先选用其中的训练集利用构建的网络模型进行训练，获取对应的行人重识别模型。对训练好的模型提取图库集和查询集中每一个行人图片的特征，通过计算查询集中的行人的特征与图库集中的行人特征的余弦距离，将最相近的几个样本记为查询到的结果集。最终利用查询结果的正确性来评估模型的好坏。在Market-1501数据集中，基线网络ResNet-50上添加本发明的全局注意力模块后，模型的mAP值达到87.8％，模型的Rank-1达到95.8％。在DukeMTMC-reID数据集中，基线网络ResNet-50上添加本发明的全局注意力模块后，模型的mAP值达到78.6％，模型的Rank-1达到88.3％。

与现有技术相比，本发明具有以下有益效果：

(1)本发明一种基于拓扑信息和亲和度信息引导行人重识别方法，采用对聚类有效的多种信息进行融合，来指导注意力的学习，可以大幅地提升网络对于前景行人的关注度，并抑制背景噪声对网络特征提取的干扰。从而提升行人特征的可区分性，提升行人特征对光照变化，局部遮挡，以及相机风格变化等问题的鲁棒性，与现有的行人重识别算法相比具有良好的性能。

(2)本发明一种基于拓扑信息和亲和度信息引导行人重识别方法，提出了两种有益于聚类的全局信息，即空间拓扑信息和通道亲和度信息。在此基础上设计一个基于拓扑信息和亲和度信息引导的全局注意力模块，该全局注意力模块包含空间注意力子模块和通道注意力子模块。空间注意力子模块融合了空间拓扑信息和局部特征的语义信息来指导空间注意力的学习，通道注意力融合了通道亲和度信息和通道语义信息来指导通道注意力的学习。以此来提升行人特征的表征能力，提升行人重识别模型的性能。

附图说明

为了更清楚地说明本发明实施方式的技术方案，下面将对实施方式中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本发明的总体网络框图。

图2为本发明的自学习图卷积网络框架图。

图3为本发明的空间注意力子模块框架图。

图4为本发明的亲和度计算框架图。

图5为本发明的通道注意力子模块框架图。

具体实施方式

为使本发明实施方式的目的、技术方案和优点更加清楚，下面将结合本发明实施方式中的附图，对本发明实施方式中的技术方案进行清楚、完整地描述。显然，所描述的实施方式是本发明一部分实施方式，而不是全部的实施方式。基于本发明中的实施方式，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式，都属于本发明保护的范围。

因此，以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施方式。基于本发明中的实施方式，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式，都属于本发明保护的范围。

实施例一：

步骤1：利用ResNet-50构建行人重识别模型的主干网络，用于提取行人特征。首先，ResNet-50需要在ImageNet上进行预训练，再去除掉了conv5_x中最后一个空间下采样操作，增加了N_i-dim全连接层进行分类，N_i表示数据集中行人身份的数量。

步骤2：自学习图卷积网络的构建。自学习图卷积网络只需要输入点集中所有点的特征X∈R^C×N即可，其中C和N分别表示每一个特征点的维度和点集中特征点的个数。本发明利用两个独立的1×1卷积层来学习成对特征点之间的关系，并利用这些关联信息构建邻接矩阵A^ls。将N个特征点表示为v_i∈R^C，其中i＝1,……,N。那么A^ls中第i行，第j列的值可以表示为

其中f₁和f₂是两个嵌入函数，其通过一个1×1卷积层连接批量正则化层和激活函数ReLU所实现的。f₁和f₂可以表示为：

其中表示两个独立的1×1卷积层，这两个卷积层的输出设为输入的1/s。所以自学习图卷积可以表示为：

X_t＝A^lsXW (3)

步骤3：空间注意力子模块的构建。经过主干网络进行特征提取，获得了宽为W，高为H，通道为C的中间特征图X∈R^H×W×C。首先，将每一个空间位置上C维向量作为特征点，每一个特征点代表其对应空间位置的局部特征。将这些具有空间局部特征的特征点联合起来形成一个点集X^s＝{x₁,x₂,x₃…x_N}，其中N＝H×W。将这个点集X^s送入自学习图卷积网络中，进而获得具有拓扑信息的点集将点集中的特征点按照原来的空间位置构建特征图C^s其中表示自学习图卷积网络生成的特征点的维度，X_t表示具有拓扑信息的特征图。为了获得更加全面的信息，将局部特征的语义信息和空间拓扑信息进行融合。由于考虑到这两种信息不属于同一种特征域，需要将它们分别送入1×1的卷积层，并将其拼接获得空间融合特征F_s：

F_s＝[P_s(L_s(X)),T_s(X_t)] (4)

L_s和T_s分别表示局部特征和具有拓扑信息的特征图的嵌入函数。该函数是使用带有批正则化层和ReLU激活函数的1×1卷积层。L_s的输出维度设为原来的1/r，T_s的输出维度与原来相同。表示沿着通道方向做平均池化操作，将其维度减小到1。最终获得空间融合特征F_s∈R^H×W×(1+C)，并设计了一个浅层神经网络利用空间融合特征F_s来学习空间注意力A_s。

A_s＝Sigmoid(L₂(L₁(F_s))) (5)

L₁和L₂分别表示这个小型网络的第一层和第二层卷积层。L₁是由一个1×1的卷积层和批正则化层以及ReLU激活函数组成，L₁将通道维度缩减到原来的1/r。L₂是由的卷积层和批正则化层组合而成，L₂将通道维度缩减为1。通过融合局部特征的语义信息和空间拓扑信息来学习空间注意力权重，获得的特征图X_s可以表示为：

X_s＝A_s⊙X (6)

步骤4：通道注意力子模块的构建，利用主干网络，提取行人图像的中间特征图X∈R^H×W×C，其宽为W，高为H，通道为C。将中间特征图X分割成C个通道，将每一个通道变换为一个大小为H×W的特征向量。将所有通道特征组成一个点集X^c＝{x₁,x₂,x₃…x_C}。那么特征点i和特征点j成对的亲和度关系表示为：

f_c(·)是一个计算成对特征点之间亲和度的函数。其中和ψ是两个独立的1×1卷积层，其后面连接批正则化层和ReLU激活函数，并将输出维度调整为原来的1/s。那么，经过相似关系加权过的特征向量x_ai可以表示为：

x_i表示点集X^c中的第i个点的特征向量，C表示X^c中包含的点的总数。之后，可以获得经过相似关系加权后的点集将这些特征点按照对应的通道顺序连接起来组合成特征图X_a∈R^(HW)×C×1。

与空间注意力子模块相似，用同样的方法融合通道语义信息和通道亲和度信息来获取通道融合特征F_c。

F_c＝[P_c(L_c(X)),A_c(X_a)] (9)

P_c表示沿着空间维度的全局平均池化操作，从而将维度缩减到1。L_c和A_c类似于公式4的L_s和T_s，获得通道融合特征F_c∈R^1×(1+HW)×C。类似于公式5，通过通道融合特征F_c学习通道注意力A_c。经过通道注意力子模块可以获得特征图X_c。

步骤5：基于拓扑信息和亲和度信息引导的全局注意力模块组合方式设计。由于本发明设计的全局注意力模块包含空间注意力子模块和通道注意力子模块，所以其具有三种组合方式。

X_s∥c＝X_s+X_c (11)

方式二：将空间注意力子模块和通道注意力子模块按照顺串行连接。空间注意力子模块的输入为中间特征X，通道注意力子模块的输入是空间注意力子模块的输出X_s，则方式二可表示为：

步骤6：基于拓扑信息和亲和度信息引导的全局注意力模块的嵌入方式设计。基于拓扑信息和亲和度信息引导的全局注意力模块是一个易于嵌入到其他网络中的模块，只需要将全局注意力模块的输入调整为分别调整为四个残差块(conv2_x，conv3_x，conv4_x和conv5_x)输出的中间特征的尺寸相同，即可将该全局注意力模块分别嵌入到ResNet-50的四个残差块之后。

实施例二

如图1所示，本发明提供一种基于拓扑信息和亲和度信息引导行人重识别方法，包括以下步骤：

步骤1：数据集的预处理和训练参数的设定。所有行人图像的大小统一调整为256×128。对所有行人图像使用随机裁剪，随机水平翻转，随机擦除等数据增强策略。每小批随机选择32张行人图片，包含8个人，每人4张图片。选用Adam优化器进行训练，总共训练600个周期，并采用预热策略来训练出更好的模型。具体来说，设置初始学习率为8×10^-6，并在20个预热期内将初始学习率提高到8×10^-4。之后，学习率每40个周期以0.5倍衰减。损失函数采用传统的分类损失和三元组损失。

步骤2：利用ResNet-50构建行人重识别模型的主干网络，用于提取行人特征。首先，ResNet-50需要在ImageNet上进行预训练，再去除掉了conv5_x中最后一个空间下采样操作，增加了N_i-dim全连接层进行分类，N_i表示数据集中行人身份的数量。

步骤3：自学习图卷积网络的构建。如图2所示，自学习图卷积网络只需要输入点集中所有点的特征X∈R^C×N即可，其中C和N分别表示每一个特征点的维度和点集中特征点的个数。本发明利用两个独立的1×1卷积层来学习成对特征点之间的关系，并利用这些关联信息构建邻接矩阵A^ls。将N个特征点表示为v_i∈R^C，其中i＝1,……,N。那么A^ls中第i行，第j列的值可以表示为

其中表示两个独立的1×1卷积层，这两个卷积层的输出设为输入的1/s，其中s设定为8。所以自学习图卷积可以表示为：

X_t＝A^lsXW (3)

步骤4：空间注意力子模块的构建。经过主干网络进行特征提取，获得了宽为W，高为H，通道为C的中间特征图X∈R^H×W×C。如图3所示，首先，将每一个空间位置上C维向量作为特征点，每一个特征点代表其对应空间位置的局部特征。将这些具有空间局部特征的特征点联合起来形成一个点集X^s＝{x₁,x₂,x₃…x_N}，其中N＝H×W。将这个点集X^s送入自学习图卷积网络中，进而获得具有拓扑信息的点集将点集中的特征点按照原来的空间位置构建特征图C^s其中表示自学习图卷积网络生成的特征点的维度，X_t表示具有拓扑信息的特征图。为了获得更加全面的信息，将局部特征的语义信息和空间拓扑信息进行融合。由于考虑到这两种信息不属于同一种特征域，需要将它们分别送入1×1的卷积层，并将其拼接获得空间融合特征F_s：

F_s＝[P_s(L_s(X)),T_s(X_t)] (4)

L_s和T_s分别表示局部特征和具有拓扑信息的特征图的嵌入函数。该函数是使用带有批正则化层和ReLU激活函数的1×1卷积层。L_s的输出维度设为原来的1/r，其中r设定为8。T_s的输出维度与原来相同。表示沿着通道方向做平均池化操作，将其维度减小到1。最终获得空间融合特征F_s∈R^H×W×(1+C)，并设计了一个浅层神经网络利用空间融合特征F_s来学习空间注意力A_s。

A_s＝Sigmoid(L₂(L₁(F_s))) (5)

X_s＝A_s⊙X (6)

步骤5：通道注意力子模块的构建，利用主干网络，提取行人图像的中间特征图X∈R^H×W×C，其宽为W，高为H，通道为C。如图4所示，将中间特征图X分割成C个通道，将每一个通道变换为一个大小为H×W的特征向量。将所有通道特征组成一个点集X^c＝{x₁,x₂,x₃…x_C}。那么特征点i和特征点j成对的亲和度关系表示为：

F_c＝[P_c(L_c(X)),A_c(X_a)] (9)

P_c表示沿着空间维度的全局平均池化操作，从而将维度缩减到1。L_c和A_c类似于公式4的L_s和T_s，如图5所示，获得通道融合特征F_c∈R^1×(1+HW)×C。类似于公式5，通过通道融合特征F_c学习通道注意力A_c。

经过通道注意力子模块可以获得特征图X_c。

步骤6：基于拓扑信息和亲和度信息引导的全局注意力模块组合方式设计。由于本发明设计的全局注意力模块包含空间注意力子模块和通道注意力子模块，所以其具有三种组合方式，如图1所示。

X_s∥c＝X_s+X_c (11)

优选地，基于拓扑信息和亲和度信息引导的全局注意力模块采用方式三的组合方式略优于方式一和方式二，对行人重识别基线模型的性能提升更大。

步骤7：基于拓扑信息和亲和度信息引导的全局注意力模块的嵌入方式设计。基于拓扑信息和亲和度信息引导的全局注意力模块是一个易于嵌入到其他网络中的模块，只需要将全局注意力模块的输入调整为分别调整为四个残差块(conv2_x，conv3_x，conv4_x和conv5_x)输出的中间特征的尺寸相同，即可将该全局注意力模块分别嵌入到ResNet-50的四个残差块之后。

步骤8：使用数据集Market-1501和DukeMTMC-reID数据集对模型进行性能评估。首先选用其中的训练集利用构建的网络模型进行训练，获取对应的行人重识别模型。对训练好的模型提取图库集和查询集中每一个行人图片的特征，通过计算查询集中的行人的特征与图库集中的行人特征的余弦距离，将最相近的几个样本记为查询到的结果集。最终利用查询结果的正确性来评估模型的好坏。在Market-1501数据集中，基线网络ResNet-50上添加本发明的全局注意力模块后，模型的mAP值达到87.8％，模型的Rank-1达到95.8％。在DukeMTMC-reID数据集中，基线网络ResNet-50上添加本发明的全局注意力模块后，模型的mAP值达到78.6％，模型的Rank-1达到88.3％。

本发明一种基于拓扑信息和亲和度信息引导行人重识别方法，采用对聚类有效的多种信息进行融合，来指导注意力的学习，可以大幅地提升网络对于前景行人的关注度，并抑制背景噪声对网络特征提取的干扰。从而提升行人特征的可区分性，提升行人特征对光照变化，局部遮挡，以及相机风格变化等问题的鲁棒性，与现有的行人重识别算法相比具有良好的性能。提出了两种有益于聚类的全局信息，即空间拓扑信息和通道亲和度信息。在此基础上设计一个基于拓扑信息和亲和度信息引导的全局注意力模块，该全局注意力模块包含空间注意力子模块和通道注意力子模块。空间注意力子模块融合了空间拓扑信息和局部特征的语义信息来指导空间注意力的学习，通道注意力融合了通道亲和度信息和通道语义信息来指导通道注意力的学习。以此来提升行人特征的表征能力，提升行人重识别模型的性能。

以上所述仅为本发明的优选实施方式而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化；凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于拓扑信息和亲和度信息引导行人重识别方法，其特征在于，包括以下步骤：

步骤2：自学习图卷积网络的构建，其用于空间拓扑信息的挖掘；自学习图卷积网络只需要输入点集中所有点的特征X∈R^C×N即可，其中C和N分别表示每一个特征点的维度和点集中特征点的个数；

步骤6：对基于拓扑信息和亲和度信息引导的全局注意力模块进行嵌入方式设计；

在步骤3中，首先，经过主干网络进行特征提取，获得了宽为W，高为H，通道为C的中间特征图X∈R^H×W×C，将每一个空间位置上C维向量作为特征点，每一个特征点代表其对应空间位置的局部特征，将这些具有空间局部特征的特征点联合起来形成一个点集X^s＝{x₁,x₂,x₃Lx_N}，其中N＝H×W；将这个点集X^s送入自学习图卷积网络中，进而获得具有拓扑信息的点集将点集中的特征点按照原来的空间位置构建特征图C^s其中表示自学习图卷积网络生成的特征点的维度，X_t表示具有拓扑信息的特征图，为了获得更加全面的信息，将局部特征的语义信息和空间拓扑信息进行融合，由于这两种信息不属于同一种特征域，需要将它们分别送入1×1的卷积层，并将其拼接获得空间融合特征F_s：

F_s＝[P_s(L_s(X)),T_s(X_t)]；

A_s＝Sigmoid(L₂(L₁(F_s)))；

X_s＝A_s e X；

其中A_s∈R^H×W×1表示空间注意力图，X∈R^H×W×C表示输入特征，e表示对应空间位置的乘法运算；

在步骤4中，利用主干网络，提取行人图像的中间特征图X∈R^H×W×C，其宽为W，高为H，通道为C；将中间特征图X分割成C个通道，将每一个通道变换为一个大小为H×W的特征向量，将所有通道特征组成一个点集X^c＝{x₁,x₂,x₃L x_C}，那么特征点i和特征点j成对的亲和度关系表示为：

f_c(g)是一个计算成对特征点之间亲和度的函数，其中和ψ是两个独立的1×1卷积层，其后面连接批正则化层和ReLU激活函数，并将输出维度调整为原来的1/s，那么，经过相似关系加权过的特征向量x_ai可以表示为：

x_i表示点集X^c中的第i个点的特征向量，C表示X^c中包含的点的总数，之后，可以获得经过相似关系加权后的点集将这些特征点按照对应的通道顺序连接起来组合成特征图X_a∈R^(HW)×C×1；

与空间注意力子模块相似，用同样的方法融合通道语义信息和通道亲和度信息来获取通道融合特征F_c：

F_c＝[P_c(L_c(X)),A_c(X_a)]； (1)

2.根据权利要求1所述一种基于拓扑信息和亲和度信息引导行人重识别方法，其特征在于，在步骤1中，ResNet-50需要在ImageNet上进行预训练，再去除掉了conv5_x中最后一个空间下采样操作，增加了N_i-dim全连接层进行分类，N_i表示数据集中行人身份的数量。

3.根据权利要求1所述一种基于拓扑信息和亲和度信息引导行人重识别方法，其特征在于，在步骤2中，利用两个独立的1×1卷积层来学习成对特征点之间的关系，并利用这些关联信息构建邻接矩阵A^ls，将N个特征点表示为v_i∈R^C，其中i＝1,……,N，那么A^ls中第i行，第j列的值可以表示为

f₁(v_i)＝ReLU(BN(θ(v_i)))

f₂(v_j)＝ReLU(BN(φ(v_j)))

X_t＝A^lsXW。

4.根据权利要求1-3任一项所述一种基于拓扑信息和亲和度信息引导行人重识别方法，其特征在于，在步骤5中，由于全局注意力模块包含空间注意力子模块和通道注意力子模块，所以其组合方式为：

将空间注意力子模块和通道注意力子模块并行连接，其输入为中间特征X，则方式可以表示为：

X_s∥c＝X_s+X_c。

5.根据权利要求1-3任一项所述一种基于拓扑信息和亲和度信息引导行人重识别方法，其特征在于，在步骤5中，由于全局注意力模块包含空间注意力子模块和通道注意力子模块，所以其组合方式为：

将空间注意力子模块和通道注意力子模块按照顺串行连接，空间注意力子模块的输入为中间特征X，通道注意力子模块的输入是空间注意力子模块的输出X_s，则方式可以表示为：

6.根据权利要求1-3任一项所述一种基于拓扑信息和亲和度信息引导行人重识别方法，其特征在于，在步骤5中，由于全局注意力模块包含空间注意力子模块和通道注意力子模块，所以其组合方式为：

将通道注意力子模块和空间注意力子模块按照顺串行连接，通道注意力子模块的输入为中间特征X，空间注意力子模块的输入是通道注意力子模块的输出X_c，则方式可表示为：

7.根据权利要求1所述一种基于拓扑信息和亲和度信息引导行人重识别方法，其特征在于，在步骤6中，基于拓扑信息和亲和度信息引导的全局注意力模块是一个易于嵌入到其他网络中的模块，只需要将全局注意力模块的输入调整为分别调整为四个残差块(conv2_x，conv3_x，conv4_x和conv5_x)输出的中间特征的尺寸相同，即可将该全局注意力模块分别嵌入到ResNet-50的四个残差块之后。