CN111311647B

CN111311647B - 一种基于全局-局部及卡尔曼滤波的目标跟踪方法及装置

Info

Publication number: CN111311647B
Application number: CN202010055391.2A
Authority: CN
Inventors: 张建明; 刘阳; 冯文俊
Original assignee: Changsha University of Science and Technology
Current assignee: Changsha University of Science and Technology
Priority date: 2020-01-17
Filing date: 2020-01-17
Publication date: 2023-07-14
Anticipated expiration: 2040-01-17
Also published as: CN111311647A

Abstract

本发明公开了一种基于全局‑局部及卡尔曼滤波的目标跟踪方法及装置，提高了目标跟踪的鲁棒性和准确率，解决了遮挡、快速运动、光照变化、尺度变化和相似物体与复杂背景等因素的干扰问题。方法包括：获取视频序列；根据视频序列构建得到基于卷积特征的全局滤波器，通过全局滤波器计算得到第一位置结果；根据视频序列构建得到基于手工特征的局部滤波器，通过局部滤波器计算得到第二位置结果；根据第一位置结果及第二位置结果判断是否满足目标跟踪可靠性；若满足，根据第一位置结果和第二位置结果得到最终跟踪位置结果；若不满足，根据视频序列构建得到卡尔曼滤波器，通过卡尔曼滤波器、第一位置结果及第二位置结果，计算得到最终跟踪位置结果。

Description

一种基于全局-局部及卡尔曼滤波的目标跟踪方法及装置

技术领域

本发明涉及视觉目标跟踪技术领域，特别是涉及一种基于全局-局部及卡尔曼滤波的目标跟踪方法及装置。

背景技术

视觉目标跟踪是计算机视觉研究中的基础和关键问题，也是很多应用必不可少的基础条件，例如自动驾驶、精确制导、视屏监控和人机交互。目标跟踪技术的基本思想是序列图像中根据目标在视频信息的时空上相关性，确定感兴趣的目标在每一帧的位置和姿态。但是由于部分或者完全遮挡、快速运动、光照变化、尺度变化和相似物体与复杂背景等因素的干扰，高精度和鲁棒性的视觉目标跟踪仍是一项艰巨的任务。

基于相关滤波的跟踪算法通过快速傅里叶变换将滤波器求解的过程转换到频域中，以实现计算的加速。Bolme等人在2010年提出了最小输出平方和误差(Minimum OutputSum ofSquare Error，MOSSE)算法，首次将相关滤波器引入视觉跟踪中。核化相关过滤器跟踪器(Kernel Correlation Filter，KCF)使用颜色特征(Color Names，CN)和方向梯度直方图(Histogram ofOriented Gridients，HOG)特征组成多通道特征，并使用核技巧将低维特征空间的计算映射到线性可分的高维特征空间。Henriques等提出核化最小二乘法(KernelRegularized Least Squares)，提高了在高纬特征空间中分类样本的速度。Bertinetto等利用HOG特征表示目标来训练滤波器，并加入颜色直方图的统计以得到最后的响应，两种特征的融合进一步提升了跟踪的精度。随着卷积神经网络的广泛应用，层次卷积特征跟踪器(HCF)和具有加权卷积响应的相关滤波器(CFWCR)选择使用从VGGNet提取出的深度特征训练滤波器，跟踪性能得到进一步改善。Danelljan等在中对训练样本建立插值模型，将不同分辨率的特征组合获得连续空间分辨率的特征图，并且在利用高斯混合模型将训练集中相似的样本归为一组，避免了对相近帧数的样本过拟合。Li引入多尺度估计模型，这两种方法成为目前常用的尺度估计方案。为了解决边界效应，Danelljan中引入空间正则化项，Alan使用空间可靠性图和通道可靠性图。Yang Li采用分块跟踪的方式，提出了一种概率模型来估计顺序蒙特卡洛框架下可靠补丁的分布。尽管深度卷积神经网络需要大规模的数据进行训练，但由于深度特征的强大的特征表征能力使其在基于相关滤波器的跟踪中广泛使用。方法之一是将深度特征直接应用到DCF框架中，例如Hedged deep tracking(HDT)和分层卷积跟踪特征(HCF)在多个卷积层上构建相关滤波器，学习连续卷积算子(CCOT)和有效卷积算子(ECO)将不同分辨率的深度特征图进行插值后集成。另外，全卷积孪生网络(SiamFC)使用端到端的学习方式，利用深度特征求目标与模板之间的相似性来进行跟踪。动态孪生网络(DSiam)可以在线学习目标的外观变化，使用连续的视频序列进行训练，提高跟踪的性能。孪生提案网络的高性能视觉跟踪(SiamRPN)将跟踪问题抽象为检测问题，使用了目标检测中常用的区域提案网络(RPN)，可以对目标作更精准的预测。快速的在线对象跟踪和分割：统一方法(SiamMask)在添加了二值掩膜(mask)分支，提出了一个对视频目标跟踪和视频目标分割的统一框架。

但是，基于相关滤波的跟踪器通过建立并实时更新一个高效的目标表示模型来进行跟踪，这样会增加大量的计算成本，造成跟踪系统难以满足实时性，其循环采样生成的虚拟样本容易造成边界效应，当目标发生剧烈变化或者被遮挡时容易造成跟踪的漂移和丢失。单模型的一个滤波器难以应对目标的遮挡或者旋转变化，造成跟踪系统的鲁棒性低；而基于孪生网络的目标跟踪以第一帧为模板进行跟踪，且在后续帧中不再更新模板，造成跟踪鲁棒性较差，并且基于孪生网络的跟踪系统具有较高的硬件要求，且网络的训练需要大量的数据，因此，基于孪生网络的跟踪的应用受到了一定程度的限制。

发明内容

本发明的目的是提供一种基于全局-局部及卡尔曼滤波的目标跟踪方法及装置，提高了目标跟踪的鲁棒性和准确率，解决了遮挡、快速运动、光照变化、尺度变化和相似物体与复杂背景等因素的干扰问题。

本发明第一方面提供一种基于全局-局部及卡尔曼滤波的目标跟踪方法，包括：

获取视频序列，视频序列为连续帧的视频图像；

根据视频序列构建得到基于卷积特征的全局滤波器，通过全局滤波器计算得到目标的第一位置结果；

根据视频序列构建得到基于手工特征的局部滤波器，通过局部滤波器计算得到目标的第二位置结果，局部滤波器至少为两个；

根据第一位置结果及第二位置结果判断是否满足目标跟踪可靠性；

若满足，则根据第一位置结果和第二位置结果得到目标的最终跟踪位置结果；

若不满足，则根据视频序列构建得到卡尔曼滤波器，通过卡尔曼滤波器、第一位置结果及第二位置结果，计算得到目标的最终跟踪位置结果。

进一步的，根据视频序列构建得到基于卷积特征的全局滤波器，通过全局滤波器计算得到目标的第一位置结果，包括：

获取视频序列的第一帧视频图像中的目标的目标信息；

根据目标的感兴趣区域计算得到图像块，建立每一个图像块的高斯标签函数；

对高斯标签函数进行离散傅里叶变换，得到频域高斯标签函数，根据频域高斯标签函数构建得到消除边界效应余弦窗；

对第t帧视频图像中的目标的候选区域进行划分，得到候选区域图像块，候选区域图像块的大小为第t-1帧中目标大小的两倍，t为大于或等于2的正整数；

对候选区域图像块进行去均值处理，得到去均值候选区域图像块；

在去均值候选区域图像块采集目标的不同大小的尺度样本，构建得到尺度金字塔模型；

利用预先训练的深度卷积神经网络模型对尺度金字塔模型进行卷积特征提取，得到目标的深度卷积特征图；

通过消除边界效应余弦窗对深度卷积特征图进行消除边界效应处理；

根据相关滤波算法，构建得到每一个卷积特征的相关滤波器；

根据相关滤波器计算得到每一个卷积特征的相关滤波响应图；

对相关滤波响应图进行加权融合，得到融合响应图；

根据融合响应图构建得到基于卷积特征的全局滤波器；

根据当前帧视频图像中的目标的目标信息及基于卷积特征的全局滤波器，计算得到目标的第一位置结果。

进一步的，根据视频序列构建得到基于手工特征的局部滤波器，通过局部滤波器计算得到目标的第二位置结果，包括：

获取视频序列的第一帧视频图像中的目标的目标信息，将目标划分为至少两个局部；

根据每一个局部的感兴趣区域计算得到图像块，建立每一个局部对应的每一个图像块的高斯标签函数；

对第t帧视频图像中的目标的每一个局部的候选区域进行划分，得到每一个局部的候选区域图像块，候选区域图像块的大小为第t-1帧中对应的局部大小的两倍，t为大于或等于2的正整数；

提取每一个局部的所有候选区域图像块的颜色特征和方向梯度直方图特征，根据颜色特征和方向梯度直方图特征得到每一个局部的手工特征图；

通过消除边界效应余弦窗对手工特征图进行消除边界效应处理；

根据手工特征图进行自我核相关处理，得到核相关矩阵；

根据预构建的核相关滤波器和核相关矩阵，构建得到每一个局部的基于手工特征的局部滤波器；

根据当前帧视频图像中的目标的至少两个局部及基于手工特征的局部滤波器，计算得到每一个局部的局部位置结果；

根据所有局部位置结果计算得到目标的第二位置结果。

进一步的，根据第一位置结果及第二位置结果判断是否满足目标跟踪可靠性，包括：

根据第一位置结果，计算得到可靠圆半径，并设置可靠圆阈值系数；

根据第一位置结果和第二位置结果，计算得到欧式距离；

判断欧式距离是否大于可靠圆阈值系数和可靠圆半径的乘积；

当欧式距离小于或等于可靠圆阈值系数和可靠圆半径的乘积时，确定满足目标跟踪可靠性；

当欧式距离大于可靠圆阈值系数和可靠圆半径的乘积时，确定不满足目标跟踪可靠性。

进一步的，根据第一位置结果和第二位置结果得到目标的最终跟踪位置结果，包括：

根据每一个局部位置结果，计算得到每一个局部的基于手工特征的局部滤波器的响应最大值；

当所有的响应最大值都大于可靠圆半径时，将第一位置结果作为最终跟踪位置结果；

当存在任意一个响应最大值小于或等于可靠圆半径时，对第一位置结果和第二位置结果进行预置权重计算，得到最终跟踪位置结果。

本发明第二方面提供一种基于全局-局部及卡尔曼滤波的目标跟踪装置，包括：

视频获取模块，用于获取视频序列，视频序列为连续帧的视频图像；

全局滤波模块，用于根据视频序列构建得到基于卷积特征的全局滤波器，通过全局滤波器计算得到目标的第一位置结果；

局部滤波模块，用于根据视频序列构建得到基于手工特征的局部滤波器，通过局部滤波器计算得到目标的第二位置结果，局部滤波器至少为两个；

可靠性判断模块，用于根据第一位置结果及第二位置结果判断是否满足目标跟踪可靠性；

处理模块，用于当第一位置结果及第二位置结果满足目标跟踪可靠性时，根据第一位置结果和第二位置结果得到目标的最终跟踪位置结果；

卡尔曼滤波模块，用于当第一位置结果及第二位置结果不满足目标跟踪可靠性时，根据视频序列构建得到卡尔曼滤波器，通过卡尔曼滤波器、第一位置结果及第二位置结果，计算得到目标的最终跟踪位置结果。

进一步的，

全局滤波模块，具体用于获取视频序列的第一帧视频图像中的目标的目标信息；

全局滤波模块，还用于根据目标的感兴趣区域计算得到图像块，建立每一个图像块的高斯标签函数；

全局滤波模块，还用于对高斯标签函数进行离散傅里叶变换，得到频域高斯标签函数，根据频域高斯标签函数构建得到消除边界效应余弦窗；

全局滤波模块，还用于对第t帧视频图像中的目标的候选区域进行划分，得到候选区域图像块，候选区域图像块的大小为第t-1帧中目标大小的两倍，t为大于或等于2的正整数；

全局滤波模块，还用于对候选区域图像块进行去均值处理，得到去均值候选区域图像块；

全局滤波模块，还用于在去均值候选区域图像块采集目标的不同大小的尺度样本，构建得到尺度金字塔模型；

全局滤波模块，还用于利用预先训练的深度卷积神经网络模型对尺度金字塔模型进行卷积特征提取，得到目标的深度卷积特征图；

全局滤波模块，还用于通过消除边界效应余弦窗对深度卷积特征图进行消除边界效应处理；

全局滤波模块，还用于根据相关滤波算法，构建得到每一个卷积特征的相关滤波器；

全局滤波模块，还用于根据相关滤波器计算得到每一个卷积特征的相关滤波响应图；

全局滤波模块，还用于对相关滤波响应图进行加权融合，得到融合响应图；

全局滤波模块，还用于根据融合响应图构建得到基于卷积特征的全局滤波器；

全局滤波模块，还用于根据当前帧视频图像中的目标的目标信息及基于卷积特征的全局滤波器，计算得到目标的第一位置结果。

进一步的，

局部滤波模块，具体用于获取视频序列的第一帧视频图像中的目标的目标信息，将目标划分为至少两个局部；

局部滤波模块，还用于根据每一个局部的感兴趣区域计算得到图像块，建立每一个局部对应的每一个图像块的高斯标签函数；

局部滤波模块，还用于对高斯标签函数进行离散傅里叶变换，得到频域高斯标签函数，根据频域高斯标签函数构建得到消除边界效应余弦窗；

局部滤波模块，还用于对第t帧视频图像中的目标的每一个局部的候选区域进行划分，得到每一个局部的候选区域图像块，候选区域图像块的大小为第t-1帧中对应的局部大小的两倍，t为大于或等于2的正整数；

局部滤波模块，还用于对候选区域图像块进行去均值处理，得到去均值候选区域图像块；

局部滤波模块，还用于提取每一个局部的所有候选区域图像块的颜色特征和方向梯度直方图特征，根据颜色特征和方向梯度直方图特征得到每一个局部的手工特征图；

局部滤波模块，还用于通过消除边界效应余弦窗对手工特征图进行消除边界效应处理；

局部滤波模块，还用于根据手工特征图进行自我核相关处理，得到核相关矩阵；

局部滤波模块，还用于根据预构建的核相关滤波器和核相关矩阵，构建得到每一个局部的基于手工特征的局部滤波器；

局部滤波模块，还用于根据当前帧视频图像中的目标的至少两个局部及基于手工特征的局部滤波器，计算得到每一个局部的局部位置结果；

局部滤波模块，还用于根据所有局部位置结果计算得到目标的第二位置结果。

进一步的，

可靠性判断模块，具体用于根据第一位置结果，计算得到可靠圆半径，并设置可靠圆阈值系数；

可靠性判断模块，还用于根据第一位置结果和第二位置结果，计算得到欧式距离；

可靠性判断模块，还用于判断欧式距离是否大于可靠圆阈值系数和可靠圆半径的乘积；

可靠性判断模块，还用于当欧式距离小于或等于可靠圆阈值系数和可靠圆半径的乘积时，确定满足目标跟踪可靠性；

可靠性判断模块，还用于当欧式距离大于可靠圆阈值系数和可靠圆半径的乘积时，确定不满足目标跟踪可靠性。

进一步的，

处理模块，具体用于根据每一个局部位置结果，计算得到每一个局部的基于手工特征的局部滤波器的响应最大值；

处理模块，还用于当所有的响应最大值都大于可靠圆半径时，将第一位置结果作为最终跟踪位置结果；

处理模块，还用于当存在任意一个响应最大值小于或等于可靠圆半径时，对第一位置结果和第二位置结果进行预置权重计算，得到最终跟踪位置结果。

由上可见，本发明中通过构建的基于卷积特征的全局滤波器和基于手工特征的局部滤波器计算得到第一位置结果和第二位置结果，并判断第一位置结果和第二位置结果的目标跟踪可靠性，如果满足，根据第一位置结果和第二位置结果得到目标的最终跟踪位置结果；如果不满足，根据视频序列构建得到卡尔曼滤波器，通过卡尔曼滤波器、第一位置结果及第二位置结果，计算得到目标的最终跟踪位置结果。由于全局滤波器和局部滤波器分别是基于卷积特征和基于手工特征的，在分别得到位置结果后，进行目标跟踪可靠性判断，在满足目标跟踪可靠性时，利用全局滤波器和局部滤波器的位置结果得到最终跟踪位置结果，提高了目标跟踪的准确性和鲁棒性；而且在不满足目标跟踪可靠性时，结合全局滤波器和局部滤波器的位置结果通过卡尔曼滤波器计算得到最终跟踪位置结果，解决了遮挡、快速运动、光照变化、尺度变化和相似物体与复杂背景等因素造成的干扰问题。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对现有技术和实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明提供的基于全局-局部及卡尔曼滤波的目标跟踪方法的一个实施例的流程示意图；

图2为本发明提供的全局滤波器的构建及目标跟踪的流程示意图；

图3为本发明提供的尺度金字塔模型示意图；

图4为本发明提供的局部滤波器的构建及目标跟踪的流程示意图；

图5为本发明提供的目标跟踪可靠性判断及最终跟踪位置结果计算的流程示意图；

图6为本发明提供的基于全局-局部及卡尔曼滤波的目标跟踪装置的一个实施例的结构示意图。

具体实施方式

本发明的核心是提供一种基于全局-局部及卡尔曼滤波的目标跟踪方法及装置，提高了目标跟踪的鲁棒性和准确率，解决了遮挡、快速运动、光照变化、尺度变化和相似物体与复杂背景等因素的干扰问题。

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，本发明实施例提供一种基于全局-局部及卡尔曼滤波的目标跟踪方法，包括：

101、获取视频序列，视频序列为连续帧的视频图像；

本实施例中，视频序列为连续前后多帧的视频图像的集合。

102、根据视频序列构建得到基于卷积特征的全局滤波器，通过全局滤波器计算得到目标的第一位置结果；

本实施例中，先利用获取的视频序列构建得到全局滤波器，全局滤波器实际应用中具体可以为基于卷积特征的判别相关滤波器(Discrimitive Correlation Filters，DCF)，通过全局滤波器就能得到当前帧的目标的第一位置结果。

103、根据视频序列构建得到基于手工特征的局部滤波器，通过局部滤波器计算得到目标的第二位置结果；

本实施例中，需要先对视频图像中的目标进行局部划分，一般是划分为至少两个局部，再构建得到局部滤波器，局部滤波器实际应用中具体可以为基于卷积特征的核相关滤波器(Kernel Correlation Filter，KCF)，通过局部滤波器就能得到当前帧的目标的第二位置结果。

104、根据第一位置结果及第二位置结果判断是否满足目标跟踪可靠性，若满足，执行步骤105；若不满足，执行步骤106；

本实施例中，根据第一位置结果和第二位置结果综合判断局部滤波器和全局滤波器的目标跟踪是否满足目标跟踪可靠性，如果满足，执行步骤105；如果满足执行步骤106。

105、根据第一位置结果和第二位置结果得到目标的最终跟踪位置结果；

本实施例中，在满足目标跟踪可靠性的时候，根据第一位置结果和第二位置结果得到目标的最终跟踪位置结果。

106、根据视频序列构建得到卡尔曼滤波器，通过卡尔曼滤波器、第一位置结果及第二位置结果，计算得到目标的最终跟踪位置结果。

本实施例中，在不满足目标跟踪可靠性的时候，还需要构建得到卡尔曼滤波器，根据第一位置结果和第二位置结果得到目标的最终跟踪位置结果。

本发明实施例中，通过构建的基于卷积特征的全局滤波器和基于手工特征的局部滤波器计算得到第一位置结果和第二位置结果，并判断第一位置结果和第二位置结果的目标跟踪可靠性，如果满足，根据第一位置结果和第二位置结果得到目标的最终跟踪位置结果；如果不满足，根据视频序列构建得到卡尔曼滤波器，通过卡尔曼滤波器、第一位置结果及第二位置结果，计算得到目标的最终跟踪位置结果。由于全局滤波器和局部滤波器分别是基于卷积特征和基于手工特征的，在分别得到位置结果后，进行目标跟踪可靠性判断，在满足目标跟踪可靠性时，利用全局滤波器和局部滤波器的位置结果得到最终跟踪位置结果，由于卷积特征的低层包含空间分辨率信息，高层包含丰富的语义信息，而手工特征对于遮挡和光照变化有较强的鲁邦性，提高了目标跟踪的准确性和鲁棒性；而且在不满足目标跟踪可靠性时，结合全局滤波器和局部滤波器的位置结果通过卡尔曼滤波器计算得到最终跟踪位置结果，解决了遮挡、快速运动、光照变化、尺度变化和相似物体与复杂背景等因素造成的干扰问题。

下面通过实施例对具体如何构建全局滤波器及如何进行目标跟踪进行说明，请参阅图2，进一步的，根据视频序列构建得到基于卷积特征的全局滤波器，通过全局滤波器计算得到目标的第一位置结果，包括：

201、获取视频序列的第一帧视频图像中的目标的目标信息；

读取视频序列，获取第一帧跟踪目标的目标信息，目标信息由四维向量表示，包括目标框左上角横、纵坐标(x_t,y_t)和目标框的宽W和高H。

202、根据目标的感兴趣区域计算得到图像块，建立每一个图像块的高斯标签函数；

计算感兴趣区域长和高中能包含的cell_size的个数M和N，计算高斯标签函数的参数σ，其中

W和H分别为前一帧目标尺寸的宽和高，μ表示输出尺度因子，cell_size表示分块的边长，假设值为4。对每一个cell块建立一个高斯标签函数

其中y(m,n)表示在(m,n)处的标签，由中心逐渐向外围衰减到0，符合高斯分布，m∈{0,1,...,M-1}，n∈{0,1,...,N-1}。

203、对高斯标签函数进行离散傅里叶变换，得到频域高斯标签函数，根据频域高斯标签函数构建得到消除边界效应余弦窗；

对高斯标签函数进行离散傅里叶变换求得高斯标签函数在频域中的表示y_f(m,n)，构造用于消除边界效应的余弦窗，其大小和y_f(m,n)相同。

204、对第t帧视频图像中的目标的候选区域进行划分，得到候选区域图像块；

针对第t帧，以第t帧目标为中心裁剪出目标的候选区域图像块，图像块的大小为t-1帧中目标大小的两倍区域，t为大于或等于2的正整数。

205、对候选区域图像块进行去均值处理，得到去均值候选区域图像块；

将候选区域图像块进行单精度处理，再利用深度网络进行重采样，将图像块归一化后计算出均值，然后将图像去均值。

206、在去均值候选区域图像块采集目标的不同大小的尺度样本，构建得到尺度金字塔模型；

在图像的候选区域采集目标的不同的尺度样本，将不同的样本缩放构建尺度金字塔，各个样本的宽和高的缩放公式为aⁿw×aⁿh，比例因子a取1.02，

样本数量S取值为11，这样可以生成11个不同尺度的样本，并使用双线性插值模型重新调整尺度样本，使它们大小都相同，尺度金字塔模型如图3所示。

207、利用预先训练的深度卷积神经网络模型对尺度金字塔模型进行卷积特征提取，得到目标的深度卷积特征图；

预先训练深度卷积神经网络模型，具体是：初始化深度卷积神经网络模型，本实施例中具体采用VGGNet-19模型来提取目标的深度卷积特征，卷积神经网络包括卷积层、池化层和全连接层三种结构；

利用预训练好的VGGNet-19从图像块中提取目标的深度卷积特征图

具体可以使用使用conv5-4，conv4-4和conv3-4三个卷积层的特征。

208、通过消除边界效应余弦窗对深度卷积特征图进行消除边界效应处理；

将深度卷积特征图f乘上之前构建的消除边界效应余弦窗，就能实现消除边界效应处理。

209、根据相关滤波算法，构建得到每一个卷积特征的相关滤波器；

根据相关滤波算法，构建每个卷积的d(d∈{1,2,....,D})的相关滤波器，公式为

其中，F是f的DFT变换，/>

为F的共轭，g是二维高斯核函数，是f进行循环移位采样的样本，λ_p为正则化参数，用于处理特征图f零频分量的影响。

210、根据相关滤波器计算得到每一个卷积特征的相关滤波响应图；

利用公式

计算每个卷积特征的相关滤波响应图E，其中

为感兴趣区域的卷积特征图，/>

为z的离散傅里叶变换后的共轭复数，FFT^-1表示离散傅里叶逆变换，E_i表示第i层特征图的相关滤波响应图。

211、对相关滤波响应图进行加权融合，得到融合响应图；

对三个特征图的响应图进行加权融合E＝α₁E₁+α₂E₂+α₃E₃，其中权重参数α₁、α₂和α₃取值分别为1、0.5和0.25，得到的融合相应图表示为E。

212、根据融合响应图构建得到基于卷积特征的全局滤波器；

根据融合响应图E的最大值来确定目标的中心位置坐标，从而构建得到了基于卷积特征的全局滤波器。

213、根据当前帧视频图像中的目标的目标信息及基于卷积特征的全局滤波器，计算得到目标的第一位置结果。

根据当前帧视频图像中的目标的目标信息及基于卷积特征的全局滤波器，计算得到目标的第一位置结果，全局滤波器计算得到的第一位置结果表示为pos^(g)，pos^(g)＝(x_g,y_g)＝arg_m,nmaxE(m,n)。

下面通过实施例对具体如何构建局部滤波器及如何进行目标跟踪进行说明，请参阅图4，根据视频序列构建得到基于手工特征的局部滤波器，通过局部滤波器计算得到目标的第二位置结果，包括：

401、获取视频序列的第一帧视频图像中的目标的目标信息，将目标划分为至少两个局部；

读取第一帧视频图像中的目标的目标信息，目标信息包括目标框左上角横、纵坐标(x_t,y_t)和目标框的宽W和高H，沿目标框较长的那条边将目标划分为大小为

的上下或左右两个局部。需要说明的是，本实施例中以划分了两个局部为例进行说明，在实际应用中，也可能划分为4个局部，具体数量不做限定。

402、根据每一个局部的感兴趣区域计算得到图像块，建立每一个局部对应的每一个图像块的高斯标签函数；

计算两个局部的感兴趣区域长和高中能包含的cell_size的个数M_i和N_i，针对每个局部，计算高斯标签函数的参数σ_i，其中

W和H分别为前一帧目标尺寸的宽和高，μ表示输出尺度因子，cell_size表示分块的边长，值为4；对每个局部的每一个cell块建立一个高斯标签函数/>

其中y_i(m,n)表示在(m,n)处的标签，由中心逐渐向外围衰减到0，符合高斯分布，m∈{0,1,...,M_i-1}，n∈{0,1,...,N_i-1}。

403、对高斯标签函数进行离散傅里叶变换，得到频域高斯标签函数，根据频域高斯标签函数构建得到消除边界效应余弦窗；

高斯标签函数进行离散傅里叶变换求得高斯标签函数在频域中的表示频域高斯标签函数y_if(m,n)，构造用于消除边界效应的余弦窗，大小和y_if(m,n)相同。

404、对第t帧视频图像中的目标的每一个局部的候选区域进行划分，得到每一个局部的候选区域图像块；

针对第t帧，以第t帧两个局部的中心裁剪出目标的候选区域图像块，图像块的大小为t-1帧中局部大小的两倍区域，t为大于或等于2的正整数。

405、对候选区域图像块进行去均值处理，得到去均值候选区域图像块；

将两个局部的候选区域图像块进行单精度处理，再利用深度网络进行重采样，将图像块归一化后计算出均值，然后将图像块去均值。

406、提取每一个局部的所有候选区域图像块的颜色特征和方向梯度直方图特征，根据颜色特征和方向梯度直方图特征得到每一个局部的手工特征图；

提取每一个局部的所有候选区域图像块的31维的HOG特征和11维的CN特征，组成每一个局部的42维的手工特征

407、通过消除边界效应余弦窗对手工特征图进行消除边界效应处理；

将两个局部提取出的手工特征图x_i乘上消除边界效应余弦窗进行消除边界效应处理。

408、根据手工特征图进行自我核相关处理，得到核相关矩阵；

取手工特征x_i进行自我核相关

处理，得到核相关矩阵的表达式为：

其中/>

F(·)和F^-1(·)分别表示傅里叶变换和傅里叶反变换，⊙表示矩阵元素的积，/>

为/>

的复共轭。

409、根据预构建的核相关滤波器和核相关矩阵，构建得到每一个局部的基于手工特征的局部滤波器；

预先构建核相关滤波器公式为

λ_l为局部滤波器正则化参数，将核相关矩阵/>

代入到公式得到每一个局部的基于手工特征的局部滤波器。

410、根据当前帧视频图像中的目标的至少两个局部及基于手工特征的局部滤波器，计算得到每一个局部的局部位置结果；

411、根据所有局部位置结果计算得到目标的第二位置结果。

计算两个局部滤波器的核相关的响应图，其公式为：

其中/>

为当前帧两个局部的感兴趣区域提取出的31维HOG和11维CN的组合特征图，通过找到两个局部响应图y_i的最大值来确定每个局部的中心位置(x_i,y_i)＝arg_m,nmaxy_i(m,n)，再取两个局部滤波器中心位置的中点为局部跟踪的最终位置

以上图2和图4所示的实施例中，分别说明了全局滤波器和局部滤波器是如何构建及如何进行目标跟踪的，下面通过实施例具体说明是如何进行目标跟踪可靠性的判定，请参阅图5，根据第一位置结果及第二位置结果判断是否满足目标跟踪可靠性，包括：

501、根据第一位置结果，计算得到可靠圆半径，并设置可靠圆阈值系数；

以全局滤波器的第一位置结果为中心设置可靠圆半径为

并设置可靠圆阈值系数θ。

502、根据第一位置结果和第二位置结果，计算得到欧式距离；

计算全局滤波器的第一位置结果和局部滤波器的第二位置结果的欧式距离

503、判断欧式距离是否大于可靠圆阈值系数和可靠圆半径的乘积，当小于或等于时，执行步骤504；当大于时，执行步骤505；

判断欧式距离是否大于可靠圆阈值系数和可靠圆半径的乘积，如果d≤θ·r，则表示满足目标跟踪可靠性，执行步骤504；如果d＞θ·r，则表示目标被完全遮挡或者全局-局部滤波器目标跟踪丢失等不可靠情况出现了，执行步骤505。

504、确定满足目标跟踪可靠性；

当欧式距离小于或等于可靠圆阈值系数和可靠圆半径的乘积时，确定满足目标跟踪可靠性。

505、确定不满足目标跟踪可靠性；

506、根据每一个局部位置结果，计算得到每一个局部的基于手工特征的局部滤波器的响应最大值；

当确定满足目标跟踪可靠性时，求当前两个局部滤波器的响应的最大值

507、当所有的响应最大值都大于可靠圆半径时，将第一位置结果作为最终跟踪位置结果；

当所有的响应最大值都大于可靠圆半径，即

时，将第一位置结果作为最终跟踪位置结果。

508、当存在任意一个响应最大值小于或等于可靠圆半径时，对第一位置结果和第二位置结果进行预置权重计算，得到最终跟踪位置结果。

当存在任意一个响应最大值小于或等于可靠圆半径，即

时，进行预置权重计算，得到最终跟踪位置结果为(1-β)pos^(g)+βpos^(l)，β是第一位置结果和第二位置结果的权重系数。

需要说明的是，还包括对于全局滤波器的更新，新全局滤波器H^d，

新模板滤波器即更新/>

和/>

更新的公式如下：/>

即

其中η为全局滤波器更新参数，η取值方法如下：

更新完成后，用于t+1帧目标位置的确定；

更新局部滤波器，根据两个局部滤波器的不同状态，选择更新方式如下：

其中γ为局部滤波器更新系数。

以上实施例中，并未对卡尔曼滤波器的构建进行详细说明，下面进行具体的说明：

在第一帧中初始化卡尔曼滤波器预测方程

和/>

中的各个参数，其中/>

表示k时刻预测的四维目标状态向量[x y dx dy]，x和y表示目标中心位置的坐标，dx和dy表示目标的运动速度，/>

初始化为[x y 0 0]，x,y分别为第一帧目标中心位置的坐标，dx和dy设为0，P_k|k-1是k时刻后验估计误差协方差矩阵，初始化为4*4的零矩阵。F_k为状态转移矩阵，初始化为/>

u_k是控制量，初始化为0。B_k是控制矩阵，初始化为0，Q_k预测模型带来的误差协方差矩阵，初始化为Q_k＝0.001*I，I为4*4的单位矩阵；

初始化卡尔曼滤波的卡尔曼系数更新方程各参数：卡尔曼系数

其中/>

初始化为/>

R_k初始化为/>

从第2帧到最后一帧，将步骤508中局部和全局滤波的最终目标跟踪位置结果pos＝[x_t y_t 0 0]作为t时刻目标状态

输入到卡尔曼滤波中，并执行以下卡尔曼滤波预测方程和更新方程：

预测方程

更新方程/>

如果出现d＞θ·r，则用卡尔曼滤波器给出的目标位置来替代全局和局部滤波器给出的最终跟踪位置结果

综合以上的说明，对于目标的最终跟踪位置结果的选择方式可以表达为以下公式：

Kfredetect表示的就是卡尔曼滤波器给出的最终跟踪位置结果。

在以上实施例中，具体说明了基于全局-局部及卡尔曼滤波的目标跟踪方法，下面通过实施例对应用该目标跟踪方法的基于全局-局部及卡尔曼滤波的目标跟踪装置进行详细说明。

请参阅图6，本发明实施例提供一种基于全局-局部及卡尔曼滤波的目标跟踪装置，包括：

视频获取模块601，用于获取视频序列，视频序列为连续帧的视频图像；

全局滤波模块602，用于根据视频序列构建得到基于卷积特征的全局滤波器，通过全局滤波器计算得到目标的第一位置结果；

局部滤波模块603，用于根据视频序列构建得到基于手工特征的局部滤波器，通过局部滤波器计算得到目标的第二位置结果，局部滤波器至少为两个；

可靠性判断模块604，用于根据第一位置结果及第二位置结果判断是否满足目标跟踪可靠性；

处理模块605，用于当第一位置结果及第二位置结果满足目标跟踪可靠性时，根据第一位置结果和第二位置结果得到目标的最终跟踪位置结果；

卡尔曼滤波模块606，用于当第一位置结果及第二位置结果不满足目标跟踪可靠性时，根据视频序列构建得到卡尔曼滤波器，通过卡尔曼滤波器、第一位置结果及第二位置结果，计算得到目标的最终跟踪位置结果。

本发明实施例中，视频获取模块601获取视频序列，全局滤波模块602和局部滤波模块603通过构建的基于卷积特征的全局滤波器和基于手工特征的局部滤波器计算得到第一位置结果和第二位置结果，并可靠性判断模块604判断第一位置结果和第二位置结果的目标跟踪可靠性，如果满足，处理模块605根据第一位置结果和第二位置结果得到目标的最终跟踪位置结果；如果不满足，卡尔曼滤波模块606根据视频序列构建得到卡尔曼滤波器，通过卡尔曼滤波器、第一位置结果及第二位置结果，计算得到目标的最终跟踪位置结果。由于全局滤波器和局部滤波器分别是基于卷积特征和基于手工特征的，在分别得到位置结果后，进行目标跟踪可靠性判断，在满足目标跟踪可靠性时，利用全局滤波器和局部滤波器的位置结果得到最终跟踪位置结果，由于卷积特征的低层包含空间分辨率信息，高层包含丰富的语义信息，而手工特征对于遮挡和光照变化有较强的鲁邦性，提高了目标跟踪的准确性和鲁棒性；而且在不满足目标跟踪可靠性时，结合全局滤波器和局部滤波器的位置结果通过卡尔曼滤波器计算得到最终跟踪位置结果，解决了遮挡、快速运动、光照变化、尺度变化和相似物体与复杂背景等因素造成的干扰问题。

可选的，结合图6所示的实施例，本发明的一些实施例中，

全局滤波模块602，具体用于获取视频序列的第一帧视频图像中的目标的目标信息；

全局滤波模块602，还用于根据目标的感兴趣区域计算得到图像块，建立每一个图像块的高斯标签函数；

全局滤波模块602，还用于对高斯标签函数进行离散傅里叶变换，得到频域高斯标签函数，根据频域高斯标签函数构建得到消除边界效应余弦窗；

全局滤波模块602，还用于对第t帧视频图像中的目标的候选区域进行划分，得到候选区域图像块，候选区域图像块的大小为第t-1帧中目标大小的两倍，t为大于或等于2的正整数；

全局滤波模块602，还用于对候选区域图像块进行去均值处理，得到去均值候选区域图像块；

全局滤波模块602，还用于在去均值候选区域图像块采集目标的不同大小的尺度样本，构建得到尺度金字塔模型；

全局滤波模块602，还用于利用预先训练的深度卷积神经网络模型对尺度金字塔模型进行卷积特征提取，得到目标的深度卷积特征图；

全局滤波模块602，还用于通过消除边界效应余弦窗对深度卷积特征图进行消除边界效应处理；

全局滤波模块602，还用于根据相关滤波算法，构建得到每一个卷积特征的相关滤波器；

全局滤波模块602，还用于根据相关滤波器计算得到每一个卷积特征的相关滤波响应图；

全局滤波模块602，还用于对相关滤波响应图进行加权融合，得到融合响应图；

全局滤波模块602，还用于根据融合响应图构建得到基于卷积特征的全局滤波器；

全局滤波模块602，还用于根据当前帧视频图像中的目标的目标信息及基于卷积特征的全局滤波器，计算得到目标的第一位置结果。

本发明实施例中，具体的实施过程参考图2所示的实施例中的步骤201-步骤213的内容，详细的描述了如何构建全局滤波器及如何进行目标跟踪。

可选的，结合图6所示的实施例，本发明的一些实施例中，

全局滤波模块603，具体用于获取视频序列的第一帧视频图像中的目标的目标信息，将目标划分为至少两个局部；

全局滤波模块603，还用于根据每一个局部的感兴趣区域计算得到图像块，建立每一个局部对应的每一个图像块的高斯标签函数；

全局滤波模块603，还用于对高斯标签函数进行离散傅里叶变换，得到频域高斯标签函数，根据频域高斯标签函数构建得到消除边界效应余弦窗；

全局滤波模块603，还用于对第t帧视频图像中的目标的每一个局部的候选区域进行划分，得到每一个局部的候选区域图像块，候选区域图像块的大小为第t-1帧中对应的局部大小的两倍，t为大于或等于2的正整数；

全局滤波模块603，还用于对候选区域图像块进行去均值处理，得到去均值候选区域图像块；

全局滤波模块603，还用于提取每一个局部的所有候选区域图像块的颜色特征和方向梯度直方图特征，根据颜色特征和方向梯度直方图特征得到每一个局部的手工特征图；

全局滤波模块603，还用于通过消除边界效应余弦窗对手工特征图进行消除边界效应处理；

全局滤波模块603，还用于根据手工特征图进行自我核相关处理，得到核相关矩阵；

全局滤波模块603，还用于根据预构建的核相关滤波器和核相关矩阵，构建得到每一个局部的基于手工特征的局部滤波器；

全局滤波模块603，还用于根据当前帧视频图像中的目标的至少两个局部及基于手工特征的局部滤波器，计算得到每一个局部的局部位置结果；

全局滤波模块603，还用于根据所有局部位置结果计算得到目标的第二位置结果。

本发明实施例中，具体的实施过程参考图4所示的实施例中的步骤401-步骤411的内容，详细的描述了如何构建局部滤波器及如何进行目标跟踪。

可选的，结合图6所示的实施例，本发明的一些实施例中，

可靠性判断模块604，具体用于根据第一位置结果，计算得到可靠圆半径，并设置可靠圆阈值系数；

可靠性判断模块604，还用于根据第一位置结果和第二位置结果，计算得到欧式距离；

可靠性判断模块604，还用于判断欧式距离是否大于可靠圆阈值系数和可靠圆半径的乘积；

可靠性判断模块604，还用于当欧式距离小于或等于可靠圆阈值系数和可靠圆半径的乘积时，确定满足目标跟踪可靠性；

可靠性判断模块604，还用于当欧式距离大于可靠圆阈值系数和可靠圆半径的乘积时，确定不满足目标跟踪可靠性。

本发明实施例中，具体的实施过程参考图5所示的实施例中的步骤501-步骤505的内容，详细的描述了如何进行目标跟踪可靠性的判定。

可选的，结合图6所示的实施例，本发明的一些实施例中，

处理模块605，具体用于根据每一个局部位置结果，计算得到每一个局部的基于手工特征的局部滤波器的响应最大值；

处理模块605，还用于当所有的响应最大值都大于可靠圆半径时，将第一位置结果作为最终跟踪位置结果；

处理模块605，还用于当存在任意一个响应最大值小于或等于可靠圆半径时，对第一位置结果和第二位置结果进行预置权重计算，得到最终跟踪位置结果。

本发明实施例中，详细的描述了在可靠性判断模块604确定第一位置结果及第二位置结果满足目标跟踪可靠性时，处理模块605根据每一个局部位置结果，计算得到每一个局部的基于手工特征的局部滤波器的响应最大值，当所有的响应最大值都大于可靠圆半径时，将第一位置结果作为最终跟踪位置结果；当存在任意一个响应最大值小于或等于可靠圆半径时，对第一位置结果和第二位置结果进行预置权重计算，得到最终跟踪位置结果。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其他实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种基于全局-局部及卡尔曼滤波的目标跟踪方法，其特征在于，包括：

获取视频序列，所述视频序列为连续帧的视频图像；

根据所述视频序列构建得到基于卷积特征的全局滤波器，通过所述全局滤波器计算得

到目标的第一位置结果；

根据所述视频序列构建得到基于手工特征的局部滤波器，通过所述局部滤波器计算得到所述目标的第二位置结果，所述局部滤波器至少为两个；

根据所述第一位置结果及所述第二位置结果判断是否满足目标跟踪可靠性；

若满足，则根据所述第一位置结果和所述第二位置结果得到所述目标的最终跟踪位置结果；

若不满足，则根据所述视频序列构建得到卡尔曼滤波器，通过所述卡尔曼滤波器、所述第一位置结果及所述第二位置结果，计算得到所述目标的最终跟踪位置结果；

所述根据所述视频序列构建得到基于卷积特征的全局滤波器，通过所述全局滤波器计算得到目标的第一位置结果，包括：

获取所述视频序列的第一帧视频图像中的目标的目标信息；

根据所述目标的感兴趣区域计算得到图像块，建立每一个图像块的高斯标签函数；

对所述高斯标签函数进行离散傅里叶变换，得到频域高斯标签函数，根据所述频域高斯标签函数构建得到消除边界效应余弦窗；

对第t帧视频图像中的所述目标的候选区域进行划分，得到候选区域图像块，所述候选区域图像块的大小为第t-1帧中所述目标大小的两倍，所述t为大于或等于2的正整数；

对所述候选区域图像块进行去均值处理，得到去均值候选区域图像块；

在所述去均值候选区域图像块采集所述目标的不同大小的尺度样本，构建得到尺度金字塔模型；

利用预先训练的深度卷积神经网络模型对所述尺度金字塔模型进行卷积特征提取，得到所述目标的深度卷积特征图；

通过所述消除边界效应余弦窗对所述深度卷积特征图进行消除边界效应处理；

根据所述相关滤波器计算得到每一个卷积特征的相关滤波响应图；

对所述相关滤波响应图进行加权融合，得到融合响应图；

根据所述融合响应图构建得到基于卷积特征的全局滤波器；

根据当前帧视频图像中的所述目标的目标信息及所述基于卷积特征的全局滤波器，计算得到所述目标的第一位置结果。

2.根据权利要求1所述的方法，其特征在于，所述根据所述视频序列构建得到基于手工特征的局部滤波器，通过所述局部滤波器计算得到所述目标的第二位置结果，包括：

获取所述视频序列的第一帧视频图像中的目标的目标信息，将所述目标划分为至少两个局部；

对第t帧视频图像中的所述目标的每一个局部的候选区域进行划分，得到每一个局部的候选区域图像块，所述候选区域图像块的大小为第t-1帧中对应的局部大小的两倍，所述t为大于或等于2的正整数；

提取每一个局部的所有候选区域图像块的颜色特征和方向梯度直方图特征，根据所述颜色特征和所述方向梯度直方图特征得到每一个局部的手工特征图；

通过所述消除边界效应余弦窗对所述手工特征图进行消除边界效应处理；

根据所述手工特征图进行自我核相关处理，得到核相关矩阵；

根据预构建的核相关滤波器和所述核相关矩阵，构建得到每一个局部的基于手工特征的局部滤波器；

根据当前帧视频图像中的所述目标的至少两个局部及所述基于手工特征的局部滤波器，计算得到每一个局部的局部位置结果；

根据所有局部位置结果计算得到所述目标的第二位置结果。

3.根据权利要求1-2中任一项所述的方法，其特征在于，所述根据所述第一位置结果及所述第二位置结果判断是否满足目标跟踪可靠性，包括：

根据所述第一位置结果，计算得到可靠圆半径，并设置可靠圆阈值系数；

根据所述第一位置结果和所述第二位置结果，计算得到欧式距离；

判断所述欧式距离是否大于所述可靠圆阈值系数和所述可靠圆半径的乘积；

当所述欧式距离小于或等于所述可靠圆阈值系数和所述可靠圆半径的乘积时，确定满足所述目标跟踪可靠性；

当所述欧式距离大于所述可靠圆阈值系数和所述可靠圆半径的乘积时，确定不满足所述目标跟踪可靠性。

4.根据权利要求3所述的方法，其特征在于，所述根据所述第一位置结果和所述第二位置结果得到所述目标的最终跟踪位置结果，包括：

当所有的响应最大值都大于所述可靠圆半径时，将所述第一位置结果作为最终跟踪位置结果；

当存在任意一个响应最大值小于或等于所述可靠圆半径时，对所述第一位置结果和所述第二位置结果进行预置权重计算，得到最终跟踪位置结果。

5.一种基于全局-局部及卡尔曼滤波的目标跟踪装置，其特征在于，包括：

视频获取模块，用于获取视频序列，所述视频序列为连续帧的视频图像；

全局滤波模块，用于根据所述视频序列构建得到基于卷积特征的全局滤波器，通过所述全局滤波器计算得到目标的第一位置结果；

局部滤波模块，用于根据所述视频序列构建得到基于手工特征的局部滤波器，通过所述局部滤波器计算得到所述目标的第二位置结果，所述局部滤波器至少为两个；

可靠性判断模块，用于根据所述第一位置结果及所述第二位置结果判断是否满足目标跟踪可靠性；

处理模块，用于当所述第一位置结果及所述第二位置结果满足目标跟踪可靠性时，根据所述第一位置结果和所述第二位置结果得到所述目标的最终跟踪位置结果；

卡尔曼滤波模块，用于当所述第一位置结果及所述第二位置结果不满足目标跟踪可靠性时，根据所述视频序列构建得到卡尔曼滤波器，通过所述卡尔曼滤波器、所述第一位置结果及所述第二位置结果，计算得到所述目标的最终跟踪位置结果；

所述全局滤波模块，具体用于获取所述视频序列的第一帧视频图像中的目标的目标信息；

所述全局滤波模块，还用于根据所述目标的感兴趣区域计算得到图像块，建立每一个图像块的高斯标签函数；

所述全局滤波模块，还用于对所述高斯标签函数进行离散傅里叶变换，得到频域高斯标签函数，根据所述频域高斯标签函数构建得到消除边界效应余弦窗；

所述全局滤波模块，还用于对第t帧视频图像中的所述目标的候选区域进行划分，得到候选区域图像块，所述候选区域图像块的大小为第t-1帧中所述目标大小的两倍，所述t为大于或等于2的正整数；

所述全局滤波模块，还用于对所述候选区域图像块进行去均值处理，得到去均值候选区域图像块；

所述全局滤波模块，还用于在所述去均值候选区域图像块采集所述目标的不同大小的尺度样本，构建得到尺度金字塔模型；

所述全局滤波模块，还用于利用预先训练的深度卷积神经网络模型对所述尺度金字塔模型进行卷积特征提取，得到所述目标的深度卷积特征图；

所述全局滤波模块，还用于通过所述消除边界效应余弦窗对所述深度卷积特征图进行消除边界效应处理；

所述全局滤波模块，还用于根据相关滤波算法，构建得到每一个卷积特征的相关滤波器；

所述全局滤波模块，还用于根据所述相关滤波器计算得到每一个卷积特征的相关滤波响应图；

所述全局滤波模块，还用于对所述相关滤波响应图进行加权融合，得到融合响应图；

所述全局滤波模块，还用于根据所述融合响应图构建得到基于卷积特征的全局滤波器；

所述全局滤波模块，还用于根据当前帧视频图像中的所述目标的目标信息及所述基于卷积特征的全局滤波器，计算得到所述目标的第一位置结果。

6.根据权利要求5所述的装置，其特征在于，

所述局部滤波模块，具体用于获取所述视频序列的第一帧视频图像中的目标的目标信息，将所述目标划分为至少两个局部；

所述局部滤波模块，还用于根据每一个局部的感兴趣区域计算得到图像块，建立每一个局部对应的每一个图像块的高斯标签函数；

所述局部滤波模块，还用于对所述高斯标签函数进行离散傅里叶变换，得到频域高斯标签函数，根据所述频域高斯标签函数构建得到消除边界效应余弦窗；

所述局部滤波模块，还用于对第t帧视频图像中的所述目标的每一个局部的候选区域进行划分，得到每一个局部的候选区域图像块，所述候选区域图像块的大小为第t-1帧中对应的局部大小的两倍，所述t为大于或等于2的正整数；

所述局部滤波模块，还用于对所述候选区域图像块进行去均值处理，得到去均值候选区域图像块；

所述局部滤波模块，还用于提取每一个局部的所有候选区域图像块的颜色特征和方向梯度直方图特征，根据所述颜色特征和所述方向梯度直方图特征得到每一个局部的手工特征图；

所述局部滤波模块，还用于通过所述消除边界效应余弦窗对所述手工特征图进行消除边界效应处理；

所述局部滤波模块，还用于根据所述手工特征图进行自我核相关处理，得到核相关矩阵；

所述局部滤波模块，还用于根据预构建的核相关滤波器和所述核相关矩阵，构建得到每一个局部的基于手工特征的局部滤波器；

所述局部滤波模块，还用于根据当前帧视频图像中的所述目标的至少两个局部及所述基于手工特征的局部滤波器，计算得到每一个局部的局部位置结果；

所述局部滤波模块，还用于根据所有局部位置结果计算得到所述目标的第二位置结果。

7.根据权利要求5-6中任一项所述的装置，其特征在于，

所述可靠性判断模块，具体用于根据所述第一位置结果，计算得到可靠圆半径，并设置可靠圆阈值系数；

所述可靠性判断模块，还用于根据所述第一位置结果和所述第二位置结果，计算得到欧式距离；

所述可靠性判断模块，还用于判断所述欧式距离是否大于所述可靠圆阈值系数和所述可靠圆半径的乘积；

所述可靠性判断模块，还用于当所述欧式距离小于或等于所述可靠圆阈值系数和所述可靠圆半径的乘积时，确定满足所述目标跟踪可靠性；

所述可靠性判断模块，还用于当所述欧式距离大于所述可靠圆阈值系数和所述可靠圆半径的乘积时，确定不满足所述目标跟踪可靠性。

8.根据权利要求7所述的装置，其特征在于，

所述处理模块，具体用于根据每一个局部位置结果，计算得到每一个局部的基于手工特征的局部滤波器的响应最大值；

所述处理模块，还用于当所有的响应最大值都大于所述可靠圆半径时，将所述第一位置结果作为最终跟踪位置结果；

所述处理模块，还用于当存在任意一个响应最大值小于或等于所述可靠圆半径时，对所述第一位置结果和所述第二位置结果进行预置权重计算，得到最终跟踪位置结果。