CN105046197B - 基于聚类的多模板行人检测方法 - Google Patents
基于聚类的多模板行人检测方法 Download PDFInfo
- Publication number
- CN105046197B CN105046197B CN201510319875.2A CN201510319875A CN105046197B CN 105046197 B CN105046197 B CN 105046197B CN 201510319875 A CN201510319875 A CN 201510319875A CN 105046197 B CN105046197 B CN 105046197B
- Authority
- CN
- China
- Prior art keywords
- template
- pedestrian
- detection
- image
- detection results
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 119
- 238000012549 training Methods 0.000 claims abstract description 33
- 238000000034 method Methods 0.000 claims description 20
- 238000012706 support-vector machine Methods 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 5
- 230000000717 retained effect Effects 0.000 claims description 5
- 238000007500 overflow downdraw method Methods 0.000 claims description 2
- 238000005070 sampling Methods 0.000 claims 2
- 238000001914 filtration Methods 0.000 claims 1
- 238000003064 k means clustering Methods 0.000 claims 1
- 230000004927 fusion Effects 0.000 abstract description 4
- 238000003909 pattern recognition Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000036544 posture Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000037237 body shape Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000013100 final test Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
- G06V20/53—Recognition of crowd images, e.g. recognition of crowd congestion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于聚类的多模板行人检测方法,主要解决现有手工分类训练样本繁琐、检索结果不准确的问题。其实现步骤为:1.获取行人样本图像并归一化尺度;2.求取样本图像的梯度方向直方图特征;3.对行人样本聚类得到多个簇,根据这些簇的行人样本生成多组训练数据集,用这些训练数据集训练分类器生成模板;4.求取待检测图像的特征金字塔;5.用多个模板对特征金字塔进行多尺度滑窗搜索,得到各模板的初步检测结果;6.滤除各模板初步检测结果中重复的检测结果,得到多组单个模板的检测结果;7.融合多模板的重复检测结果,得到最终的检测结果。本发明提高了行人检测的准确率,可用于视频监控和无人驾驶设备中的行人检测。
Description
技术领域
本发明属于图像处理领域,更进一步涉及图像或视频中的行人检测方法,可用于无人驾驶和视频智能监控。
背景技术
在计算机视觉领域,行人检测具有重要的理论和实践意义,由于实际应用中人体姿态变化多样,衣着体型差异较大,且人的活动范围广,所处的环境非常复杂,这些将使得行人检测算法鲁棒性难以满足实际要求。
现有的检测方法可分为两大类:一类是基于前景分析的方法。Tianyi Zhou和Dacheng Tao在文章“GoDec:Randomized Low-rank&Sparse Matrix Decomposition inNoisy Case”(Proceedings of the 28th International Conference on MachineLearning)中提出一种前景分割方法,该方法将连续多帧图像组成一个三维矩阵,采用矩阵分解的方法从背景中提取出运动的前景目标。这类方法存在的不足是:该类方法的前提假设是背景是静止的,目标是运动的。然而实际中行人有可能处于静止状态,背景也可能处于运动状态,使得这类方法不适用。另一类采用机器学习的方法,通过求取行人的特征,离线训练得到行人模板,对图像进行多尺度滑窗搜索,将每个窗口与模板匹配得到检测结果。Navneet Dalal和Bill Triggs在文章“Histograms of Oriented Gradients for HumanDetection”(IEEE Conference on Computer Vision and Pattern Recognition,2005,pp.886-893)中提出一种梯度方向直方图特征,并将其应用于行人检测中,获得了较准确的检测结果。但是该方法训练得到的单个模板不足以适应行人的外观变化,检测准确率还有待进一步提升。
上海交通大学提出的专利申请“基于前景分析和模式识别的行人检测方法”(申请号:CN201110081075.3,公开号:CN102147869A)公开了一种前景分割和机器学习结合的行人检测方法。该方法采用高斯混合模型对视频图像的场景进行背景建模,利用阈值化操作和形态学后处理获得初步行人检测结果;在初步检测结果位置附近采样并与模板匹配,排除非行人前景目标,得到最终行人检测结果,这种方法虽说可提高行人检测速度,但由于要求行人与背景之间存在相对运动,故不能检测静止的行人,容易造成较高的漏检率。
发明内容
本发明的目的在于针对上述已有技术的不足,提出一种基于聚类的多模板行人检测方法,以实现在任意场景下的行人检测,提升行人检测的准确率。
本发明的技术方案是:通过聚类算法对行人样本进行聚类,将具有相似外观、姿态的行人聚成一类,再分别对每一类样本独立训练一个模板,得到多个行人模板;通过不同模板独立检测图片中的目标,并采用线性加权的方式融合不同模板的重复检测结果,其实现步骤包括如下:
(1)从行人图像数据库中提取5000张以上行人样本图像,将每一张图像归一化尺度为64x32的像素大小;
(2)求取行人样本的梯度方向直方图特征,得到样本的特征描述;
(3)设定聚类数目,对行人样本按照梯度方向直方图特征进行聚类,得到多个聚类簇;
(4)对于每一个簇,分别根据簇中的行人样本生成训练数据集,得到多组数据集,再分别对每一组训练数据集采用线性支持向量机训练分类器生成模板:
(4a)对于每个簇中的每个行人样本,以其在原图中的位置为中心,在中心的上下左右四个方向各扩大10%样本大小的背景像素,若扩大后的行人样本超出原图边界,则通过复制原图边界像素值的方法填充图像,将添加背景后的行人样本归一化至128x64大小,得到训练所用的正样本;
(4b)从不包含行人的图像中随机选取产生大小为128x64像素的负样本,负样本的个数大于10000个;
(4c)对于每个簇中的行人样本,分别求取其梯度方向直方图特征,得到多组训练数据;
(4d)分别对每一组训练数据集采用线性支持向量机训练分类器生成模板。本发明采用了LibSVM工具完成训练。LibSVM是一个快速有效的SVM模式识别与回归的软件包,该软件包可以在http://www.csie.ntu.edu.tw/~cjlin/libsvm免费获得。
(5)求取待检测图像的特征金字塔,特征金字塔的层数为3;
(6)用训练得到的多个模板分别独立检测图像中的行人,对特征金字塔进行多尺度滑窗搜索,得到多模板的初步检测结果:
(6a)分别用每个模板对特征金字塔进行滑窗搜索,将每个窗口与各模板匹配,即将各模板分别与特征金字塔的每一层做卷积运算,得到每个窗口与模板的匹配程度;
(6b)选取检测阈值,若某一窗口与模板的匹配程度大于阈值2.5,则认为该检测窗口为目标,记录其在原图中的位置及其与模板的匹配程度,得到各模板的初步的检测结果;
(7)获得多组单个模板的检测结果:
(7a)分别计算各模板初步检测结果之间的重复率ao:
其中,BBi表示模板匹配第i个窗口的检测结果在图中的位置,BBj表示模板匹配第j个窗口的检测结果在图中的位置,score表示该检测结果与模板的匹配程度;
(7b)判断ao是否大于阈值0.5:若大于,则采用NMS方法滤除score更低的检测结果,得到多组单个模板的检测结果;反之,则舍弃该模板的检测结果;
(8)获得最终的检测结果:
(8a)计算两个不同模板检测结果之间的重复率a'o:
其中,CCk表示第k个模板的检测结果在图中的位置,CCn表示第n个模板的检测结果在图中的位置;
(8b)判断a'o是否大于阈值0.5:若a'o大于阈值0.5,则用加权融合的方法融合这两个不同模板的检测结果;反之,则同时保留这两个模板的检测结果;返回步骤(9a)直到所有两个不同的模板的检测结果都被判断为融合或同时保留,整理所有模板检测出的行人在图中的位置,完成最终的行人检测。
本发明与现有技术相比具有以下优点:
第一,本发明由于引入了聚类算法自动分类训练样本,克服了现有技术中手工分类训练样本的繁琐过程,同时降低了人为因素的干扰。
第二,本发明由于引入了多个模板同时用于检测,提高了对行人外观变化及复杂背景的适应性,进而提高了检测准确率。
第三,本发明的检测由于对不同模板进行独立匹配,可以并行操作,因此加快了检测速度。
附图说明
图1为本发明的整体流程图;
图2为本发明中训练多模板的子流程图;
图3为本发明中聚类多组簇的子流程图;
图4为本发明中用多模板检测行人的子流程图;
图5为本发明与现有梯度方向直方图算法对INRIA数据库图片的检测结果图。
具体实施方案和
下面结合附图,对本发明实现的步骤和效果作进一步的详细描述。
参照图1,本发明的实现步骤如下:
步骤1,获取行人样本图像,归一化尺度为64x32大小。
(1a)从给定的图像数据库中提取5000个以上行人样本,每个样本为一矩形图像,如果提取到的行人样本不足5000个,则可将每个样本左右对换得到新的样本;
(1b)采用最近邻插值算法对行人样本的大小进行归一化,得到尺度大小为64x32的图像Inew(x,y),Inew(x,y)=I(round(x/αx),round(y/αy)),其中,αx和αy分别为图像x方向和y方向的尺度缩放因子,I表示图像,round表示向上取整。
步骤2,求取样本图像的梯度方向直方图特征,得到样本的特征描述。
(2a)采用一维的梯度算子[1,0,-1]和[1,0,-1]T分别计算图像x方向和y方向的梯度分量Gx(x,y)=I(x+1,y)-I(x-1,y)和Gy(x,y)=I(x,y+1)-I(x,y-1),I表示图像;
(2b)求取图像每个像素点的梯度大小和方向
(2c)将图像划分成8x8像素大小的细胞单元,求取每个细胞单元的梯度方向直方图,即将梯度方向均匀划分为9个区域,梯度方向的取值为[0°,180°],以梯度强度为权值对其所属的区域进行加权,得到细胞单元的梯度方向直方图,即一个9维的特征向量;
(2d)将相邻的四个细胞单元的直方图串联组成一个以块为单元的特征向量v,并采用L2-norm方法归一化,得到归一化后的特征向量vnew,其中||·||是范数,ε为一很小的数,防止除数为零,本实例取ε为0.01,得到块单元的梯度方向直方图;
(2e)将块单元以8个像素为移动步长,遍历图像,将每个块单元的直方图按其位置组成三维矩阵,得到图像的梯度方向直方图特征。
步骤3,指定聚类数目,对行人样本聚类得到多个簇。
参照图2,本步骤的具体实现如下:
(3a)设定聚类数目为3;
(3b)随机选取指定数目的聚类中心c;
(3c)计算每个行人样本到各聚类中心的欧式距离,将行人样本划分到离其最近的簇中;
(3d)更新聚类中心c,即计算簇中所有对象的均值;
(3e)返回步骤(3c)直到达到初始设定的循环次数3或者前后两次迭代各聚类中心变化小于阈值10-2。
步骤4,对于每一个簇,分别根据簇中的行人样本生成训练数据集,得到多组数据集,再分别对每一组训练数据集采用线性支持向量机训练分类器生成模板。
参照图3,本步骤的具体实现如下:
(4a)对于每个簇中的每个行人样本,以其在原图中的位置为中心,在中心的上下左右四个方向各扩大10%样本大小的背景像素,若扩大后的行人样本超出原图边界,则通过复制原图边界像素值的方法填充图像,将添加背景后的行人样本归一化至128x64大小,得到训练所用的正样本;
(4b)从不包含行人的图像中随机选取产生大小为128x64像素的负样本,负样本的个数大于10000个;
(4c)对于每个簇中的行人样本,分别求取其梯度方向直方图特征,得到多组训练数据。
(4d)对于每一组训练数据集分别采用线性支持向量机训练分类器生成模板,本步骤采用LibSVM工具完成训练,LibSVM是一个快速有效的SVM模式识别与回归的软件包,该软件包可以在http://www.csie.ntu.edu.tw/~cjlin/libsvm免费获得。
步骤5,求取待检测图像的特征金字塔。
循环对待检测图像进行下采样,并求取下采样图片的梯度方向直方图特征,直到min(Ih,height)*αn小于模板的高度或者min(Iw,width)*αn小于模板的宽度,即得到图像的特征金子塔,min(·)为取最小值,n为下采样次数,α为下采样的比例因子,其取值范围为[0.9,0.95],比例因子越大可以提高检测精度,检测所需消耗的时间也越多。
步骤6,将训练得到的多个模板分别独立检测图像中的行人,对特征金字塔进行多尺度滑窗搜索,得到各模板的初步检测结果。
(6a)分别用每个模板对特征金字塔进行滑窗搜索,将每个窗口与各模板匹配,即将各模板分别与特征金字塔的每一层做卷积运算,得到每个窗口与模板的匹配程度;
(6b)选取检测阈值,若某一窗口与模板的匹配程度大于阈值2.5,则认为该检测窗口为目标,记录其在原图中的位置及其与模板的匹配程度,得到各模板的初步的检测结果。阈值选取越大,漏检率越高,误检结果越少;反之,漏检率越低,误检结果越多。
步骤7,分别计算各模板检测结果之间的重复率ao,得到多组单个模板的检测结果。
(7a)分别计算各模板初步检测结果之间的重复率ao:
其中,BBi表示模板匹配第i个窗口的检测结果在图中的位置,BBj表示模板匹配第j个窗口的检测结果在图中的位置,Si表示该第i个窗口检测结果与模板的匹配程度,Sj表示该第j个窗口检测结果与模板的匹配程度;
(7b)判断ao是否大于阈值0.5:若同一模板的两个检测结果的重复率ao大于0.5,则去除匹配程度更低的检测结果;反之,则舍弃该模板的检测结果。
步骤8,计算多个模板检测结果之间的重复率a'o,得到最终的检测结果。
参照图4,本步骤的具体实现如下:
(8a)不同模板检测结果两两之间的重复率a'o定义为:
其中,CCk表示第k个模板的检测结果在图中的位置,CCn表示第n个模板的检测结果在图中的位置;
(8b)判断a'o是否大于阈值0.5:
若不同模板的两个检测结果的重复率a'o大于阈值0.5,则认为它们重复,对于多个模板之间的所有重复检测结果,记为集合O,并用下式进行线性加权融合,得到融合之后的检测结果[CC,s],其中CCi表示第i个模板的检测结果在图中的位置;
若不同模板的两个检测结果的重复率a'o小于阈值0.5,则同时保留这两个模板的检测结果;
(8c)返回步骤(8a)直到所有两个不同的模板的检测结果都被判断为融合或同时保留,分别统计同时保留的检测结果和融合之后的检测结果,在图中找出并标记它们的位置,完成最终的行人检测。
本发明的效果结合以下仿真实验进一步说明:
1.仿真条件
本发明是在中央处理器为Intel(R)Core i3-3502.93GHZ、内存2G、WINDOWS7操作系统的PC上,运用MATLAB软件进行的实验仿真。
2.仿真内容
取训练行人样本为INRIA和ETH数据库的所有训练样本,测试图像为INRIA数据库中的测试图像,采用梯度方向直方图算法和本发明方法对10张测试图像中的行人进行检测,结果如图5所示,其中图5(a)为梯度方向直方图算法的检测结果,图5(b)为本发明方法的检测结果。
行人检测的目的是将图像中的行人区域准确的检测出来,由图5结果可见,采用本发明进行行人检测的平均丢失率低于梯度方向直方图算法。因此,与梯度方向直方图相比,本发明通过引入聚类算法训练多个模板,能有效提高对行人外观变化的适应性,从而提高了检测的准确率。
以上描述仅是本发明的一个具体实例,显然对于本领域的专业人员来说,在了解了本发明内容和原理之后,都可能在不背离本发明原理、结构的情况下,进行形式和细节上的各种修正和改变,但是这些基于本发明思想的修正和改变仍在本发明的权利要求范围之内。
Claims (4)
1.一种基于聚类的多模板行人检测方法,包括如下步骤:
(1)从行人图像数据库中提取5000张以上行人样本图像,将每一张图像归一化尺度为64x32的像素大小;
(2)求取行人样本的梯度方向直方图特征,得到样本的特征描述;
(3)设定聚类数目,对行人样本按照欧氏距离进行聚类,得到多个聚类簇;
(4)对于每一个聚类簇,分别根据簇中的行人样本生成训练数据集,得到多组训练数据,分别对每一组训练数据集采用线性支持向量机训练分类器生成模板:
(4a)对于每个簇中的每个行人样本,以其在原图中的位置为中心,在中心的上下左右四个方向各扩大10%样本大小的背景像素,若扩大后的行人样本超出原图边界,则通过复制原图边界像素值的方法填充图像,将添加背景后的行人样本归一化至128x64大小,得到训练所用的正样本;
(4b)从不包含行人的图像中随机选取产生大小为128x64像素的负样本,负样本的个数大于10000个;
(4c)对于每个簇中的行人样本,分别求取其梯度方向直方图特征,得到多组训练数据;
(4d)对于每一组训练数据集,分别采用线性支持向量机训练分类器生成模板,本发明采用LibSVM工具完成训练;
(5)求取待检测图像的特征金字塔,特征金字塔的层数为3;
(6)用训练得到的多个模板分别独立检测图像中的行人,对特征金字塔进行多尺度滑窗搜索,得到多模板的初步检测结果:
(6a)分别用每个模板对特征金字塔进行滑窗搜索,将每个窗口与各模板匹配,即将各模板分别与特征金字塔的每一层做卷积运算,得到每个窗口与模板的匹配程度;
(6b)选取检测阈值,若某一窗口与模板的匹配程度大于阈值2.5,则认为该检测窗口为目标,记录其在原图中的位置及其与模板的匹配程度,得到各模板的初步的检测结果;
(7)获得多组单个模板的检测结果:
(7a)分别计算各模板初步检测结果之间的重复率ao:
<mrow>
<msub>
<mi>a</mi>
<mi>o</mi>
</msub>
<mo>=</mo>
<mfrac>
<mrow>
<mi>a</mi>
<mi>r</mi>
<mi>e</mi>
<mi>a</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>BB</mi>
<mi>i</mi>
</msub>
<mo>&cap;</mo>
<msub>
<mi>BB</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<mi>a</mi>
<mi>r</mi>
<mi>e</mi>
<mi>a</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>BB</mi>
<mrow>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>s</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<msub>
<mi>s</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
</msub>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
</mrow>
其中,BBi表示模板匹配第i个窗口的检测结果在图中的位置,BBj表示模板匹配第j个窗口的检测结果在图中的位置,Si表示该第i个窗口检测结果与模板的匹配程度,Sj表示该第j个窗口检测结果与模板的匹配程度;
(7b)判断ao是否大于阈值0.5:若大于,则采用NMS方法滤除s更低的检测结果,得到多组单个模板的检测结果;反之,则舍弃该模板的检测结果;
(8)获得最终的检测结果:
(8a)计算两个不同模板检测结果之间的重复率a'o:
<mrow>
<msubsup>
<mi>a</mi>
<mi>o</mi>
<mo>&prime;</mo>
</msubsup>
<mo>=</mo>
<mfrac>
<mrow>
<mi>a</mi>
<mi>r</mi>
<mi>e</mi>
<mi>a</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>CC</mi>
<mi>k</mi>
</msub>
<mo>&cap;</mo>
<msub>
<mi>CC</mi>
<mi>n</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<mi>a</mi>
<mi>r</mi>
<mi>e</mi>
<mi>a</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>CC</mi>
<mi>k</mi>
</msub>
<mo>&cup;</mo>
<msub>
<mi>CC</mi>
<mi>n</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
</mrow>
其中,CCk表示第k个模板的检测结果在图中的位置,CCn表示第n个模板的检测结果在图中的位置;
(8b)判断a'o是否大于阈值0.5:若a'o大于阈值0.5,则用加权融合的方法融合这两个不同模板的检测结果;反之,则同时保留这两个模板的检测结果;返回步骤(8a)直到所有两个不同的模板的检测结果都被判断为融合或同时保留,整理所有模板检测出的行人在图中的位置,完成最终的行人检测。
2.根据权利要求1所述的基于聚类的多模板行人检测方法,步骤(2)所述的求取行人样本的梯度方向直方图特征,得到样本的特征描述,按如下步骤进行:
(2a)采用一维的梯度算子[1,0,-1]和[1,0,-1]T分别计算图像x方向和y方向的梯度分量Gx(x,y)=I(x+1,y)-I(x-1,y)和Gy(x,y)=I(x,y+1)-I(x,y-1);
(2b)求取图像每个像素点的梯度大小和方向
(2c)将行人样本划分成8x8像素大小的细胞单元,求取每个细胞单元的梯度方向直方图,即将梯度方向均匀划分为9个区域,梯度方向的取值为[0°,180°],将梯度大小作为权值对该梯度大小所属的区域进行加权,得到细胞单元的梯度方向直方图,即一个9维的特征向量;
(2d)将相邻的四个细胞单元的直方图串联组成一个以块为单元的特征向量v,并采用L2-norm方法归一化,得到归一化后的特征向量vnew,其中||·||是范数,ε<0.01,防止除数为零,得到块单元的梯度方向直方图;
(2e)块单元以8个像素为移动步长,遍历图像,将每个块单元的直方图按其位置组成三维矩阵,得到图像的梯度方向直方图特征。
3.根据权利要求1所述的基于聚类的多模板行人检测方法,所述步骤(3)中对行人样本按照欧氏距离进行聚类,采用K-Means聚类算法进行,其步骤如下:
(3a)设定聚类数目为3;
(3b)随机选取指定数目的聚类中心c;
(3c)计算每个行人样本到各聚类中心的欧式距离,将行人样本划分到离其最近的簇中;
(3d)更新聚类中心c,即计算簇中所有对象的均值;
(3e)返回步骤(3c)直到达到初始设定的循环次数3或者前后两次迭代各聚类中心变化小于阈值10-2。
4.根据权利要求1所述的基于聚类的多模板行人检测方法,所述步骤(6)中求取待检测图像的特征金字塔,是循环对待检测图像进行下采样,并求取下采样图片的梯度方向直方图特征,直到min(Ih,height)*αn小于模板的高度或者min(Iw,width)*αn小于模板的宽度,即得到图像的特征金字塔,其中min(·)为取最小值,n为下采样次数,α为下采样的比例因子,其取值范围为[0.9,0.95]。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510319875.2A CN105046197B (zh) | 2015-06-11 | 2015-06-11 | 基于聚类的多模板行人检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510319875.2A CN105046197B (zh) | 2015-06-11 | 2015-06-11 | 基于聚类的多模板行人检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105046197A CN105046197A (zh) | 2015-11-11 |
CN105046197B true CN105046197B (zh) | 2018-04-17 |
Family
ID=54452726
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510319875.2A Active CN105046197B (zh) | 2015-06-11 | 2015-06-11 | 基于聚类的多模板行人检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105046197B (zh) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105975929A (zh) * | 2016-05-04 | 2016-09-28 | 北京大学深圳研究生院 | 一种基于聚合通道特征的快速行人检测方法 |
CN106650806B (zh) * | 2016-12-16 | 2019-07-26 | 北京大学深圳研究生院 | 一种用于行人检测的协同式深度网络模型方法 |
CN106778889A (zh) * | 2016-12-28 | 2017-05-31 | 天津普达软件技术有限公司 | 一种基于梯度强度和方向的模板匹配方法 |
CN106781236A (zh) * | 2016-12-29 | 2017-05-31 | 东南大学 | 一种基于人物检测和再识别方法的远程报警装置及远程监控方法 |
CN106886757B (zh) * | 2017-01-19 | 2019-06-11 | 华中科技大学 | 一种基于先验概率图的多类交通灯检测方法及系统 |
CN109670387A (zh) * | 2017-10-17 | 2019-04-23 | 天津所托瑞安汽车科技有限公司 | 一种基于全景视觉分析的车辆主动安全预警系统及方法 |
CN107679528A (zh) * | 2017-11-24 | 2018-02-09 | 广西师范大学 | 一种基于AdaBoost‑SVM集成学习算法的行人检测方法 |
CN108875753A (zh) * | 2018-04-03 | 2018-11-23 | 南昌奇眸科技有限公司 | 一种商标图像检索特征提取方法 |
CN108806355B (zh) * | 2018-04-26 | 2020-05-08 | 浙江工业大学 | 一种书画艺术互动教育系统 |
CN108764063B (zh) * | 2018-05-07 | 2020-05-19 | 华中科技大学 | 一种基于特征金字塔的遥感影像时敏目标识别系统及方法 |
CN111291602A (zh) * | 2018-12-07 | 2020-06-16 | 北京奇虎科技有限公司 | 视频检测方法、装置、电子设备及计算机可读存储介质 |
CN111274232A (zh) * | 2020-01-15 | 2020-06-12 | 江苏古卓科技有限公司 | 一种基于多元数据制造过程的数字孪生处理系统及方法 |
CN111242142B (zh) * | 2020-01-16 | 2023-10-27 | 网易(杭州)网络有限公司 | 模板子图的获取方法、装置、处理器及电子装置 |
CN112307976B (zh) * | 2020-10-30 | 2024-05-10 | 北京百度网讯科技有限公司 | 目标检测方法、装置、电子设备以及存储介质 |
CN112308141B (zh) * | 2020-10-30 | 2023-04-07 | 长城信息股份有限公司 | 一种扫描票据分类方法、系统及可读存储介质 |
CN112396112B (zh) * | 2020-11-20 | 2024-05-14 | 北京百度网讯科技有限公司 | 一种聚类方法、装置、电子设备及存储介质 |
CN112565614B (zh) * | 2021-02-22 | 2021-05-14 | 四川赛狄信息技术股份公司 | 一种信号处理模块及方法 |
CN114840700B (zh) * | 2022-05-30 | 2023-01-13 | 来也科技(北京)有限公司 | 结合rpa和ai实现ia的图像检索方法、装置及电子设备 |
CN114851206B (zh) * | 2022-06-06 | 2024-03-29 | 天津中科智能识别有限公司 | 基于视觉引导机械臂抓取炉具的方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102081741A (zh) * | 2011-01-15 | 2011-06-01 | 中国人民解放军军械工程学院 | 一种基于视觉注意原理的行人检测方法和系统 |
CN103093214A (zh) * | 2013-02-01 | 2013-05-08 | 浙江捷尚视觉科技有限公司 | 一种基于车载红外相机的行人检测方法 |
CN103106409A (zh) * | 2013-01-29 | 2013-05-15 | 北京交通大学 | 一种针对头肩检测的混合特征提取方法 |
CN103559502A (zh) * | 2013-10-25 | 2014-02-05 | 华南理工大学 | 一种基于自适应聚类分析的行人检测系统及方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9053372B2 (en) * | 2012-06-28 | 2015-06-09 | Honda Motor Co., Ltd. | Road marking detection and recognition |
-
2015
- 2015-06-11 CN CN201510319875.2A patent/CN105046197B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102081741A (zh) * | 2011-01-15 | 2011-06-01 | 中国人民解放军军械工程学院 | 一种基于视觉注意原理的行人检测方法和系统 |
CN103106409A (zh) * | 2013-01-29 | 2013-05-15 | 北京交通大学 | 一种针对头肩检测的混合特征提取方法 |
CN103093214A (zh) * | 2013-02-01 | 2013-05-08 | 浙江捷尚视觉科技有限公司 | 一种基于车载红外相机的行人检测方法 |
CN103559502A (zh) * | 2013-10-25 | 2014-02-05 | 华南理工大学 | 一种基于自适应聚类分析的行人检测系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105046197A (zh) | 2015-11-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105046197B (zh) | 基于聚类的多模板行人检测方法 | |
CN108520226B (zh) | 一种基于躯体分解和显著性检测的行人重识别方法 | |
Bregonzio et al. | Fusing appearance and distribution information of interest points for action recognition | |
CN110929593B (zh) | 一种基于细节辨别区别的实时显著性行人检测方法 | |
CN104077605B (zh) | 一种基于颜色拓扑结构的行人搜索识别方法 | |
CN104766343B (zh) | 一种基于稀疏表示的视觉目标跟踪方法 | |
CN105447503B (zh) | 基于稀疏表示lbp和hog融合的行人检测方法 | |
CN104615986B (zh) | 利用多检测器对场景变化的视频图像进行行人检测的方法 | |
CN102609686A (zh) | 一种行人检测方法 | |
CN103810503A (zh) | 一种基于深度学习的自然图像中显著区域的检测方法 | |
CN103310194A (zh) | 视频中基于头顶像素点梯度方向的行人头肩部检测方法 | |
CN110910421B (zh) | 基于分块表征和可变邻域聚类的弱小运动目标检测方法 | |
CN103679154A (zh) | 基于深度图像的三维手势动作的识别方法 | |
CN105912999A (zh) | 基于深度信息的人体行为识别方法 | |
CN105335725A (zh) | 一种基于特征融合的步态识别身份认证方法 | |
CN106295532B (zh) | 一种视频图像中的人体动作识别方法 | |
CN107909027A (zh) | 一种具有遮挡处理的快速人体目标检测方法 | |
CN105138983B (zh) | 基于加权部件模型和选择性搜索分割的行人检测方法 | |
CN104050684B (zh) | 一种基于在线训练的视频运动目标分类方法与系统 | |
CN105930790A (zh) | 基于核稀疏编码的人体行为识别方法 | |
CN105760858A (zh) | 一种基于类Haar中间层滤波特征的行人检测方法及装置 | |
CN102609720A (zh) | 一种基于位置校正模型的行人检测方法 | |
CN105426924B (zh) | 一种基于图像中层特征的场景分类方法 | |
CN108734200B (zh) | 基于bing特征的人体目标视觉检测方法和装置 | |
Kheirkhah et al. | A hybrid face detection approach in color images with complex background |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |