CN112149618B

CN112149618B - 适用于巡检车的行人异常行为检测方法与装置

Info

Publication number: CN112149618B
Application number: CN202011094116.8A
Authority: CN
Inventors: 贾立东
Original assignee: Ziqing Zhixing Technology Beijing Co ltd
Current assignee: Ziqing Zhixing Technology Beijing Co ltd
Priority date: 2020-10-14
Filing date: 2020-10-14
Publication date: 2022-09-09
Anticipated expiration: 2040-10-14
Also published as: CN112149618A

Abstract

本发明公开了一种适用于巡检车的行人异常行为检测方法与装置，该方法包括：预先设置异常行为检测网络，对RGB‑D相机和监控相机中采集到的视频数据中存在的异常行为进行在线检测；所述异常行为检测网络获取方法包括：步骤1，标定原始视频数据中存在的行为类别和属性，得到每一行为对应的类别标签和属性标签；步骤2，选取连续T帧图像序列作为训练样本数据；步骤3，建立无向图；步骤4，根据无向图，利用时空图卷积网络和卷积神经网络，获得异常行为检测网络。本发明能够在全天时情况下对于异常行为进行精准检测，为智能监控预警提供依据。

Description

适用于巡检车的行人异常行为检测方法与装置

技术领域

本发明涉及机器人和视频监控技术领域，特别是关于一种基于RGB-D相机的适用于巡检车的行人异常行为检测方法与装置。

背景技术

异常行为检测是指在监控视频场景下，基于各类计算机设备代替或补充监控人员对于视频监控场景下人类发的异常行为进行实时辨别，从而达到预警目的。其中异常行为一般是指场景中与其他人类行为有明显不同或者是在场景中人类发生概率较低的行为。实际上，对比正常行为，异常行为出现概率非常小，但异常行为几乎会产生严重后果。因而对于异常行为进行监控预警十分有必要。

机器人技术能够逐渐替代某些需要人类的单调和危险工作场景，从而极大降低人力成本。目前，监控预警一般采用视觉相机结合人工监控的方式进行，但是在夜间这两种监控方式都有不同程度的削弱和不便，其缺陷主要体现在：夜晚环境下人类和普通可见光相机感知能力下降。针对这一情况，目前并没有特别好的解决方案。

行为识别是一类重要的计算机视觉任务，其在视频理解、运动分析和智能监控领域都有广泛应用。Kinect是微软公司推出的民用型RGB-D相机，能够同时获取彩色图和深度图像，并且配备红外设备，能够在夜间环境下运行，是典型的3D目标识别设备。

发明内容

本发明的目的在于提供一种基于RGB-D相机的适用于巡检车的行人异常行为检测方法和装置来克服或至少减轻现有技术的上述缺陷中的至少一个。

为实现上述目的，本发明提供一种适用于巡检车的行人异常行为检测方法，预先设置异常行为检测网络，对RGB-D相机和监控相机中采集到的视频数据中存在的异常行为进行在线检测；所述异常行为检测网络获取方法包括：

步骤1，标定原始视频数据中存在的行为类别和属性，得到每一行为对应的类别标签A＝{a₁,a₂,...,a_n}和属性标签B＝{b_nor,b_ab}；其中，所述原始视频数据包括RGB-D相机数据，a_n表示第n种行为的类别标签，b_nor表示正常行为，b_ab表示异常行为；

步骤2，选取由步骤1标定好的连续T帧图像序列作为训练样本数据；

步骤3，获取训练样本数据的每一帧图像中的人体位置框，并建立无向图G＝(V,E)；

其中，关节节点位置集合V＝{v_ti|t＝1,...,T,i＝1,...,N}包括连续T帧图像序列中的所有关节节点的位置，v_ti表示第t帧图像中的第i个关节节点的位置，共有N个关节节点；

边集合E具有两个子集分别是空间边子集和时序边子集，其中：所述空间边子集E_S＝{v_tiv_tj|(i,j)∈H}，H表示单帧图像中的所有关节节点的位置；相邻两帧图像上同一关节节点连接而成的边组成的时序边子集E_F＝{v_tiv_(t+1)i}，v_tj表示第t帧图像中的第j个关节节点的位置，v_(t+1)i表示第t+1帧图像中的第j个关节节点的位置；

步骤4，根据无向图G＝(V,E)，利用时空图卷积网络和卷积神经网络，获得异常行为检测网络。

进一步地，步骤4包括：

步骤41，利用时空图卷积网络进行时空空间位置建模，其具体包括：

步骤411，对无向图G＝(V,E)进行时空图卷积操作，采用卷积核为K×K，输出与关节节点v_ti直接连接的局部特征图f_out(v_ti)：

式(1)中，B(v_ti)对应表示v_ti的邻居节点集合，w(v_ti,v_tj)是权重函数，Z_ti(v_tj)是正则函数项，p(v_ti,v_tj)表示采样函数，代表在关节点中具备关系两个点之间的最小距离，权重函数用于表示临近关节点所分配的不同权重；

步骤412，对于步骤411输出的局部特征图f_out(v_ti)，采用公式(2)进行关节节点空间构型划分，获得由关节节点构成人体局部肢体；

式(2)中，r_i代表第i个关节节点距离其所在人体重心的平均距离，r_j代表第j个关节节点距离其所在人体重心的平均距离，l_ti(v_tj)表示计算得到的关节节点空间构型，将每个关节节点自身及其周围邻居分为根节点子集、向心组子集和离心组子集，其中，根节点子集由根节点自身组成，向心组子集由邻居节点中比根节点距离身体重心节点更近的节点组成，离心组子集由邻居节点中比根节点距离身体重点节点更远的节点。

进一步地，步骤4还包括：

步骤42，利用时空图卷积网络进行与获取分类后行为，其具体包括：

步骤421，利用步骤411输出的与关节节点v_ti直接连接的局部特征图f_out(v_ti)和步骤412划分得到的空间构型，在每一帧图像上运行单层采用式(3)提供的时空图卷积操作，获得骨架动作特征分类；

式(3)中，f_out表示骨架动作特征分类，f_in表示步骤411输出的节点输出特征图和步骤412划分得到的空间构型，

由单帧图像的邻接矩阵A和单位矩阵I确定，

表示在整个无向图G＝(V,E)的邻接矩阵，

表示在整个无向图G＝(V,E)的单位矩阵，W是由前述多通道的权重向量w(v_ti,v_tj)叠加后的权重矩阵；

步骤422，经由多层如步骤411、步骤412和步骤421中时空图卷积操作后，最后经由Softmax函数，输出最终行为分类结果。

进一步地，步骤4还包括：

步骤43，对步骤3中建立的所述无向图G＝(V,E)中的前T/2帧图像中的关节节点位置集合所对应的分类输出行为序列f_out中每一行为分别进行编码为统一向量x_uni，将统一向量x_uni输入到LSTM网络中进行训练，输出行为预测结果

步骤44，将经由时空图卷积网络识别的原始行为结果STC_action与LSTM网络预测的行为结果LSTM_action进行按照式(4)进行融合：

式(4)中，若二者差值小于设定阈值则最后结果采用原始时空卷积图后结果，若二者相差结果大于设定阈值则取二者预测结果中间值。

进一步地，在云控平台、车载控制器和/或智能终端中预先设置所述异常行为检测网络。

本发明还提供一种适用于巡检车的行人异常行为检测装置，其包括异常行为检测网络，用于对RGB-D相机和监控相机中采集到的视频数据中存在的异常行为进行在线检测，所述异常行为检测网络的获取装置包括：

标定模块，其用于标定原始视频数据中存在的行为类别和属性，得到每一行为对应的类别标签A＝{a₁,a₂,...,a_n}和属性标签B＝{b_nor,b_ab}；其中，所述原始视频数据包括RGB-D相机数据，a_n表示第n种行为的类别标签，b_nor表示正常行为，b_ab表示异常行为；

训练样本数据选取模块，其用于选取由步骤1标定好的连续T帧图像序列作为训练样本数据；

无向图构建装置，其用于获取训练样本数据的每一帧图像中的人体位置框，并建立无向图G＝(V,E)；

异常行为检测网络离线训练模块，其用于根据无向图G＝(V,E)，利用时空图卷积网络和卷积神经网络，获得异常行为检测网络。

进一步地，所述异常行为检测网络离线训练模块包括：

时空空间位置建模单元，其用于利用时空图卷积网络进行时空空间位置建模，其具体包括：

首先，对无向图G＝(V,E)进行时空图卷积操作，采用卷积核为K×K，输出与关节节点v_ti直接连接的局部特征图f_out(v_ti)：

然后，对于局部特征图f_out(v_ti)，采用公式(2)进行关节节点空间构型划分，获得由关节节点构成人体局部肢体；

进一步地，所述异常行为检测网络离线训练模块还包括：

行为分类单元，其用于利用时空图卷积网络进行与获取分类后行为，其具体包括：

首先，利用所述时空空间位置建模单元输出的所述与关节节点v_ti直接连接的局部特征图和所述划分得到的空间构型，在每一帧图像上运行单层时空图卷积操作，获得骨架动作特征分类；

然后，经由多层如是说时空空间位置建模单元和行为分类单元的时空图卷积操作后，最后经由Softmax函数，输出最终行为分类结果；

行为预测单元，对所述无向图G＝(V,E)中的前T/2帧图像中的关节节点位置集合所对应的分类输出行为序列f_out中每一行为分别进行编码为统一向量x_uni，将统一向量x_uni输入到LSTM网络中进行训练，输出行为预测结果

融合单元，其用于将经由时空图卷积网络识别的原始行为结果STC_action与LSTM网络预测的行为结果LSTM_action进行按照式(4)进行融合：

进一步地，所述异常行为检测网络预先设置在云控平台、车载控制器和/或智能终端中。

进一步地，所述智能终端为巡航机器小车，其包括与所述异常行为检测网络信号连接的RGB-D相机。

本发明由于采取以上技术方案，其具有以下优点：本发明能够在全天时情况下对于异常行为进行精准检测，为智能监控预警提供依据。

附图说明

图1为是本发明的异常行为检测计算框架图。

图2是人体18点关节点示意图。

图3是空间构型划分示意图。

具体实施方式

下面结合附图和实施例对本发明进行详细的描述。

如图1所示，本发明实施例提供的适用于巡检车的行人异常行为检测方法包括：预先设置异常行为检测网络，对RGB-D相机和监控相机中采集到的视频数据中存在的异常行为进行在线检测；所述异常行为检测网络获取方法包括：

步骤1，标定原始视频数据中存在的行为类别和属性，得到每一行为对应的类别标签A＝{a₁,a₂,...,a_n}和属性标签B＝{b_nor,b_ab}，a_n表示第n种行为的类别标签，b_nor表示正常行为，b_ab表示异常行为。

其中，所述原始视频数据包括基于确定的监控区域的全天的RGB-D相机数据和监控相机数据。

在一个实施例中，步骤1采用的标定方法为算法自动标定和人为辅助标定相结合的方法，其具体包括：

步骤11，自动标定：采用AlphaPose算法对原始视频数据进行自动标定，自动标定的姿态置信度取值范围[0,1]。当姿态置信度值为0时，表示完全不相信自动标定结果或没有生成可用的姿态标定结果；当姿态置信度值为1时，表示确信所得出的姿态置信度值。

步骤12，手动二次标定：根据给定标定策略，对于不满足如下条件之一的自动标定结果进行二次手工标定。

第一条件，当自动标定算法所得姿态置信度小于预定阈值P_α(比如P_α＝0.5)，利用手工进行二次标定；

第二条件，对于夜间视频(晚上12点～早晨6点),对于夜间视频每隔5分钟1次利用进行随机抽样1分钟视频进行手工标定。

利用手工标定方法对于标定好行为进行属性分类，分类为正常行为b_nor和异常行为b_ab，构建行为和属性数据集。

步骤2，选取由步骤1标定好的连续T帧图像序列作为训练样本数据。

步骤3，获取训练样本数据的每一帧图像中的人体位置框，并建立无向图G＝(V,E)。其中，可以采用预训练好的目标检测模型YOLO v5获取人体位置框。

无向图G＝(V,E)中，关节节点位置集合V＝{v_ti|t＝1,...,T,i＝1,...,N}包括连续T帧图像序列中的所有关节节点的位置，v_ti表示第t帧图像中的第i个关节节点的位置，共有N个关节节点。

无向图G＝(V,E)中，边集合E具有两个子集，分别是空间边子集和时序边子集。

其中：所述空间边子集E_S＝{v_tiv_tj|(i,j)∈H}，H表示单帧图像中的所有关节节点的位置。相邻两帧图像上同一关节节点连接而成的边组成的时序边子集E_F＝{v_tiv_(t+1)i}。v_tj表示第t帧图像中的第j个关节节点的位置，v_(t+1)i表示第t+1帧图像中的第j个关节节点的位置。

如图2所示，图2提供的实施例示意了单帧图像的无向图G＝(V,E)，其中单个人体节点总数设置为18个。

步骤4，根据无向图G＝(V,E)，利用时空图卷积网络进行时空空间位置建模与获取分类后行为、以及利用卷积神经网络模块对于不同行为进行权重估计以判断是否属于异常行为，从而获得异常行为检测网络。

在一个实施例中，步骤4包括：

步骤411，对无向图G＝(V,E)进行时空图卷积操作，输出与关节节点v_ti直接连接的局部特征图。

具体地，输入特征图f_in为包含节点但节点之间无连接的无向图G＝(V,E)(如图2所示)，采用卷积核为K×K，则输出与关节节点v_ti直接连接的局部特征图f_out(v_ti)(如图3所示)：

式(1)中，B(v_ti)对应表示v_ti的邻居节点集合；Z_ti(v_tj)是正则函数项，此处任意机器学习L1或者L2正则项均可；p(v_ti,v_tj)表示采样函数，代表在关节点中具备关系两个点之间的最小距离，可采用任意通用采样函数，如随机粒子滤波等；w(v_ti,v_tj)是权重函数，用于表示临近关节点所分配的不同权重，其中的临近关节点指对于某个关节点周围与其直接相连或相关的关节节点。

步骤412，对于步骤411输出的与关节节点v_ti直接连接的局部特征图f_out(v_ti)进行关节节点空间构型划分，获得由关节节点构成人体局部肢体。

关节节点空间构型划分具有多种方式，如均匀标注、基于距离和基于空间构型。考虑本发明的适用途径，对于所建立的与关节节点v_ti直接连接的局部特征图f_out(v_ti)进行空间构型划分，如图3所示。将每个局部关节点自身及其周围邻居分为三个子集，分别为根节点子集、向心组子集和离心组子集，其中，根节点子集由根节点自身组成，向心组子集由邻居节点中比根节点距离身体重心节点更近的节点组成，离心组子集由邻居节点中比根节点距离身体重点节点更远的节点。采用的式(2)进行空间构型划分：

式(2)中，r_i代表第i个关节节点距离其所在人体重心(图3中的三角形所在位置)的平均距离，r_j代表第j个关节节点距离其所在人体重心的平均距离，l_ti(v_tj)表示计算得到的关节节点空间构型，如图2所示，经过计算后的图2中的关节节点11、关节节点12和关节节点13节点构成人体的胳膊。

步骤421，利用步骤411输出的与关节节点v_ti直接连接的局部特征图f_out(v_ti)和步骤412划分得到的空间构型，在每一帧图像上运行单层时空图卷积操作，获得骨架动作特征分类。

步骤421利用步骤411输出的与关节节点v_ti直接连接的局部特征图f_out(v_ti)和步骤412划分得到的空间构型在每一帧图像上运行单层时空图卷积操作表示为式(3)：

由单帧图像的邻接矩阵

和单位矩阵

确定，

表示在整个无向图G＝(V,E)的邻接矩阵，

表示在整个无向图G＝(V,E)的单位矩阵，W是由前述多通道的权重向量w(v_ti,v_tj)堆叠而成的权重矩阵。

步骤422，经由多层(比如5层)如步骤411、步骤412和步骤421中时空图卷积操作后，最后经由Softmax函数，输出最终行为分类结果STC_action＝{act₁,act₂,...,act_T}。

步骤43，根据无向图G＝(V,E)，对步骤3中建立的所述无向图G＝(V,E)中的前T/2帧图像中的关节节点位置集合所对应的分类输出行为序列f_out中每一行为分别进行编码为统一向量x_uni，将统一向量x_uni输入到LSTM((英文全称为Long Short-Term Memory，中文全称为长短时记忆网络)网络中进行训练，输出行为预测结果

通过步骤43，LSTM能够对获取的动作序列信息中的长期依赖进行建模，可用于解决前述行为识别中的行为跳变问题，提高异常行为检测网络的鲁棒性。

步骤44，将经由时空图卷积网络识别的原始行为结果STC_action与LSTM网络预测的行为结果

进行按照式(4)进行融合：

式(4)中，若二者差值小于设定阈值H_thre，则最后结果采用原始时空卷积图后结果，若二者相差结果大于设定阈值则取二者预测结果中间值。其中，阈值H_thre为所有在已标定好的行为库中的正常行为的正则化后平均行为值。

通过步骤44可以将原始行为识别结果与行为预测结果进行对比，进行优化增强，克服行为识别中容易出现的行为跳变问题。

步骤45，对于最终行为识别结果进行正常与异常行为分类。

根据设定规则对于识别的动作序列通过浅层卷积神经网络模块分类为正常行为和异常行为，若输出异常行为则发出警报。

在一个实施例中，本发明还包括：

步骤5，模型剪枝方法，其具体包括：

步骤51，评价所提出的异常行为检测网络中神经元参数重要性，将重要性最低的神经元移去除掉，之后微调异常行为检测网络。

步骤52，根据将预训练的YOLO v5网络采用组卷积剪枝方法进行模型剪枝后，推理部署到云控平台、车载控制器和/或智能终端(巡航小车)。

本发明实施例所提出的方法首先利用卷积网络检测人体区域，再将人体骨骼关键点建模为图卷积网络，利用识别的骨骼关键点进行人体行为识别，并对异常行为检测。配套的LSTM增强算法能够利用人类行为连续性，增强行为识别准确性。

在一个实施例中，适用于巡检车的行人异常行为检测方法包括：在云控平台、车载控制器和/或智能终端(巡航小车)中预先设置异常行为检测网络。

以配置有异常行为检测网络的巡航小车为例，说明异常行为检测网络在线检测异常行为的方法：

巡航小车根据规定路线巡检，其配备RGB-D增强相机，白天环境下可利用产生的RGB图像和深度图像进行行为检测，夜晚时可以利用红外相机和深度相机实现行为检测，从而可以实现全天时视频数据中的异常行为检测。在检测到异常行为时，可以采用声光报警方式进行预警。

本发明还提供一种适用于巡检车的行人异常行为检测装置，其包括异常行为检测网络，用于对RGB-D相机和监控相机中采集到的视频数据中存在的异常行为进行在线检测。所述异常行为检测网络的获取装置包括标定模块、训练样本数据选取模块、无向图构建装置和异常行为检测网络离线训练模块，其中：

标定模块用于标定原始视频数据中存在的行为类别和属性，得到每一行为对应的类别标签A＝{a₁,a₂,...,a_n}和属性标签B＝{b_nor,b_ab}；其中，所述原始视频数据包括RGB-D相机数据，a_n表示第n种行为的类别标签，b_nor表示正常行为，b_ab表示异常行为。

训练样本数据选取模块用于选取由步骤1标定好的连续T帧图像序列作为训练样本数据。

无向图构建装置用于获取训练样本数据的每一帧图像中的人体位置框，并建立无向图G＝(V,E)。

其中，关节节点位置集合V＝{v_ti|t＝1,...,T,i＝1,...,N}包括连续T帧图像序列中的所有关节节点的位置，v_ti表示第t帧图像中的第i个关节节点的位置，共有N个关节节点。

边集合E具有两个子集分别是空间边子集和时序边子集，其中：所述空间边子集E_S＝{v_tiv_tj|(i,j)∈H}，H表示单帧图像中的所有关节节点的位置；相邻两帧图像上同一关节节点连接而成的边组成的时序边子集E_F＝{v_tiv_(t+1)i}，v_tj表示第t帧图像中的第j个关节节点的位置，v_(t+1)i表示第t+1帧图像中的第j个关节节点的位置。

异常行为检测网络离线训练模块用于根据无向图G＝(V,E)，利用时空图卷积网络和卷积神经网络，获得异常行为检测网络。

在一个实施例中，所述异常行为检测网络离线训练模块包括时空空间位置建模单元、行为分类单元、行为预测单元和融合单元：

时空空间位置建模单元用于利用时空图卷积网络进行时空空间位置建模，其具体包括：

首先，对无向图G＝(V,E)进行时空图卷积操作，输出节点特征图。

然后，对于所述节点特征图进行关节节点空间构型划分，获得由关节节点构成人体局部部件。

其中，空间构型划分的方法包括：

将每个关节节点自身及其周围邻居分为根节点子集、向心组子集和离心组子集，其中，根节点子集由根节点自身组成，向心组子集由邻居节点中比根节点距离身体重心节点更近的节点组成，离心组子集由邻居节点中比根节点距离身体重点节点更远的节点；

行为分类单元。用于利用时空图卷积网络进行与获取分类后行为，其具体包括：

首先，利用所述时空空间位置建模单元输出的所述节点输出特征图和所述划分得到的空间构型，在每一帧图像上运行单层时空图卷积操作，获得骨架动作特征分类。

然后，经由多层如是说时空空间位置建模单元和行为分类单元的时空图卷积操作后，最后经由Softmax函数，输出最终行为分类结果。

行为预测单元用于4对所述无向图G＝(V,E)中的前T/2帧图像中的关节节点位置集合所对应的分类输出行为序列f_out中每一行为分别进行编码为统一向量x_uni，将统一向量x_uni输入到LSTM网络中进行训练，输出行为预测结果

在一个实施例中，所述异常行为检测网络预先设置在云控平台、车载控制器和/或智能终端中，用于对RGB-D相机和监控相机中采集到的视频数据中存在的异常行为进行在线检测。

在一个实施例中，所述智能终端为巡航机器小车，其包括RGB-D相机以及与RGB-D相机信号连接的异常行为检测网络。通过巡航机器小车中的RGB-D相机和异常行为检测网络，能够全天时对于巡检环境下的异常行为进行检测。

最后需要指出的是：以上实施例仅用以说明本发明的技术方案，而非对其限制。本领域的普通技术人员应当理解：可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种适用于巡检车的行人异常行为检测方法，其特征在于，预先设置异常行为检测网络，对RGB-D相机和监控相机中采集到的视频数据中存在的异常行为进行在线检测；所述异常行为检测网络获取方法包括：

步骤1，标定原始视频数据中存在的行为类别和属性，得到每一行为对应的类别标签A＝{a₁,a₂,...,a_n}和属性标签B＝{b_nor,b_ab}；其中，所述原始视频数据包括基于确定的监控区域的全天的RGB-D相机数据和监控相机数据，a_n表示第n种行为的类别标签，b_nor表示正常行为，b_ab表示异常行为；所述步骤1采用的标定方法为算法自动标定和人为辅助标定相结合的方法，其具体包括：

步骤11，自动标定：采用AlphaPose算法对原始视频数据进行自动标定，自动标定的姿态置信度取值范围[0,1]，当姿态置信度值为0时，表示完全不相信自动标定结果或没有生成可用的姿态标定结果；当姿态置信度值为1时，表示确信所得出的姿态置信度值；

步骤12，手动二次标定：根据给定标定策略，对于不满足如下条件之一的自动标定结果进行二次手工标定；

第一条件，当自动标定算法所得姿态置信度小于预定阈值P_α，利用手工进行二次标定；

第二条件，对于夜间视频每隔5分钟1次利用进行随机抽样1分钟视频进行手工标定；

利用手工标定方法对于标定好行为进行属性分类，分类为正常行为b_nor和异常行为b_ab，构建行为和属性数据集；

边集合E具有两个子集分别是空间边子集和时序边子集，其中：所述空间边子集E_S＝{v_tiv_tj|(i,j)∈H}，H表示单帧图像中的所有关节节点的位置；相邻两帧图像上同一关节节点连接而成的边组成的时序边子集E_F＝{v_tiv_(t+1)i}，v_tj表示第t帧图像中的第j个关节节点的位置，v_(t+1)i表示第t+1帧图像中的第i个关节节点的位置；

步骤4，根据无向图G＝(V,E)，利用时空图卷积网络和卷积神经网络，获得异常行为检测网络；

步骤4包括：

式(4)中，若二者差值小于设定阈值H_thre则最后结果采用原始时空卷积图后结果，若二者相差结果大于设定阈值H_thre则取二者预测结果中间值，阈值H_thre为所有在已标定好的行为库中的正常行为的正则化后平均行为值。

2.如权利要求1所述的适用于巡检车的行人异常行为检测方法，其特征在于，步骤4包括：

步骤412，对于步骤411输出的局部特征图f_out(v_ti)，采用公式(2)进行关节节点空间构型划分，获得由关节节点构成的人体局部肢体；

3.如权利要求2所述的适用于巡检车的行人异常行为检测方法，其特征在于，步骤4还包括：

步骤42，利用时空图卷积网络获取分类行为，其具体包括：

由单帧图像的邻接矩阵A和单位矩阵I确定，A表示在整个无向图G＝(V,E)的邻接矩阵，I表示在整个无向图G＝(V,E)的单位矩阵，W是由多通道的权重向量w(v_ti,v_tj)叠加后的权重矩阵；

4.如权利要求3所述的适用于巡检车的行人异常行为检测方法，其特征在于，将所述异常行为检测网络预先设置在云控平台、车载控制器和/或智能终端中。

5.一种适用于巡检车的行人异常行为检测装置，其特征在于，包括异常行为检测网络，用于对RGB-D相机和监控相机中采集到的视频数据中存在的异常行为进行在线检测，所述异常行为检测网络的获取装置包括：

标定模块，其用于标定原始视频数据中存在的行为类别和属性，得到每一行为对应的类别标签A＝{a₁,a₂,...,a_n}和属性标签B＝{b_nor,b_ab}；其中，所述原始视频数据包括基于确定的监控区域的全天的RGB-D相机数据和监控相机数据，a_n表示第n种行为的类别标签，b_nor表示正常行为，b_ab表示异常行为；标定模块采用的标定方法为算法自动标定和人为辅助标定相结合的方法，其具体包括：

训练样本数据选取模块，其用于选取由标定模块标定好的连续T帧图像序列作为训练样本数据；