CN112001205B

CN112001205B - 一种二次人脸检测的网络模型样本采集的方法

Info

Publication number: CN112001205B
Application number: CN201910445457.6A
Authority: CN
Inventors: 于晓静; 田凤彬
Original assignee: Beijing Ingenic Semiconductor Co Ltd
Current assignee: Beijing Ingenic Semiconductor Co Ltd
Priority date: 2019-05-27
Filing date: 2019-05-27
Publication date: 2023-10-31
Anticipated expiration: 2039-05-27
Also published as: CN112001205A

Abstract

本发明提供一种二次人脸检测的网络模型样本采集的方法，所述的方法包括：S1，将每一张图片作为输入图片，通过集成电路芯片进行检测，所有所述的集成电路芯片检测出的结果作为二次检测的初级训练样本；S2，对初级训练样本分类，有人脸的图片为正样本，没有人脸的样本作为负样本；S3，再对正样本进行人工标注人脸的外接矩形框，这里标注人脸的外接矩形框与人脸识别要求的人脸外接矩形框规则完全一样。

Description

一种二次人脸检测的网络模型样本采集的方法

技术领域

本发明涉及人脸图像识别技术领域，特别涉及一种二次人脸检测的网络模型样本采集的方法。

背景技术

随着科技的不断发展，特别是计算机视觉技术的发展，人脸识别技术广泛应用于信息安全、电子认证等各个领域，图像特征提取方法具有良好的识别性能。人脸识别是指基于已知的人脸样本库，利用图像处理和/或模式识别技术从静态或者动态场景中，识别一个或多个人脸的技术。但是目前的人脸识别技术包括1、传统机器学习的人脸检测。2、基于深度学习的人脸检测。3、用于前端的人脸检测。其具有的缺点包括：前端人脸检测存在一定的误检，检测出的人脸框和是否为人脸的判定标准与满足人脸识别的要求不匹配，导致人脸识别识别率下降甚至无法正常使用。

发明内容

为了解决上述现有技术中存在的问题，本发明的目的在于：

1、实现去除前端人脸检测的误检。

2、达到人脸检测标准与人脸识别的要求相匹配，从而提高人脸识别的识别率。

3、实现人脸检测每个人脸用时5ms以内。

本发明提供一种二次人脸检测的网络模型样本采集的方法，所述的方法包括：

S1，将每一张图片作为输入图片，通过集成电路芯片进行检测，所有所述的集成电路芯片检测出的结果作为二次检测的初级训练样本；

S2，对初级训练样本分类，有人脸的图片为正样本，没有人脸的样本作为负样本；

S3，再对正样本进行人工标注人脸的外接矩形框，这里标注人脸的外接矩形框与人脸识别要求的人脸外接矩形框规则完全一样。

所述步骤S1中的集成电路芯片采用T01芯片。

所述步骤S1中的二次检测的初级训练样本的方法为：

S1.1，网络第一层设置为输入大尺寸图片，采用输出深度为4的特征图，卷积核大小为3×3大小，步长为2，卷积计算的图两端非对齐处理；

S1.2，网络第二层设置为输入比第一层小的尺寸图片，采用输出深度为8的特征图，卷积核大小为3×3大小，步长为2，卷积计算的图两端非对齐处理；

S1.3，网络第三层设置为输入比第二层小的尺寸图片，采用输出深度为16的特征图，卷积核大小为3×3大小，步长为2，卷积计算的图两端非对齐处理，得到输出特征图6×6×16；

S1.4，网络第四层设置为输入数据的特征图的大小为6×6×16，采用输出32张特征图，卷积核大小为1×1大小，步长为1，卷积计算的图两端对齐处理，得到输出特征图6×6×32；

S1.5，网络第五层设置为输入数据的特征图的大小为6×6×32，采用输出64张特征图，卷积核大小为3×3大小，步长为2，卷积计算的图两端对齐处理，得到输出特征图3×3×64；

S1.6，网络第六层设置为全连接到192的特征图上。

所述的网络第一层设置为输入数据的特征图的大小为55×55×3。

所述的网络第二层设置为输入数据的特征图的大小变为27×27×4。

所述的网络第三层输入数据的特征图的大小为13×13×8。

将所述的网络第六层的结果连接到是否为人脸的判断中和/或人脸box的相对坐标中。

所述的网络结构应用到人脸识别的预处理中，要求每张处理时间在5ms以内。

所述的网络结构优选每张处理时间在4ms以内。

本申请的优势在于：使用单独设计输出特征图个数的方案，可以有效的降低计算量，最大程度的提高卷积提取特征的效率。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，并不构成对本发明的限定。

图1是本发明方法的流程示意框图。

图2是本发明步骤S1的流程示意框图。

图3是本发明步骤S1的具体实施方式的流程框图。

具体实施方式

在人脸识别领域，目前一些相关的技术领域的术语包括：

1、深度学习：深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征，以发现数据的分布式特征表示。

2、人脸检测：使用人脸检测器检测视频或一张图片中是否存在人脸的过程，叫做人脸检测。

3、卷积核：卷积核是用来做图像处理时的矩阵，与原图像做运算的参数。卷积核通常是一个列矩阵数组成(例如3*3的矩阵)，该区域上每个方格都有一个权重值。矩阵形状一般是1×1,3×3,5×5,7×7,1×3,3×1,2×2,1×5,5×1，…

4、卷积：将卷积核的中心放置在要计算的像素上，一次计算核中每个元素和其覆盖的图像像素值的乘积并求和，得到的结构就是该位置的新像素值，这个过程称为卷积。

5、前端人脸检测：在芯片上使用的人脸检测称之为前端人脸检测，前端人脸检测的速度和正确率比云端服务器人脸检测的低。

6、特征图：输入数据通过卷积计算后得到的结果称之为特征图，数据通过全连接后生成的结果也称为特征图。特征图大小一般表示为长×宽×深度，或1×深度

7、步长：卷积核中心位置再坐标上移动的长度。

8：两端非对齐处理：图像或数据通过卷积核大小为3且步长为2处理时，会导致两侧数据不够，此时采用丢弃两侧或一侧数据，这种现象叫做两端非对其处理。

1、网络结构

1)本次处理的对象是前端北京君正T01(集成电路)芯片人脸检测出的结果，设计的网络是应用到人脸识别的预处理中，要求每张处理时间在5ms以内。该网络实现4ms每张的处理速度。

2)网络的实现，如图2所示。

第一层输入的图片尺寸相对较大，采用输出深度为4的特征图，卷积核大小为3×3大小，步长为2，卷积计算的图两端非对齐处理，计算量急剧减小。

第二层输入数据的特征图的大小变为27×27×4，尺寸也是相对较大，采用输出深度为8的特征图，卷积核大小为3×3大小，步长为2，卷积计算的图两端非对齐处理，计算量得到压缩。

第三层输入数据的特征图的大小为13×13×8，尺寸也相对适中，采用输出深度为16的特征图，卷积核大小为3×3大小，步长为2，卷积计算的图两端非对齐处理，得到输出特征图6×6×16。

由于前面几层使用的步长2比较密集，输出特征图相对较少，提取的特征效果不是很好，所以在第四层采用步长为1，卷积核为1的计算。

第四层输入数据的特征图的大小为6×6×16，此时的数据可以采用相对较多输出图的计算，采用输出32张特征图，卷积核大小为1×1大小，步长为1，卷积计算的图两端对齐处理，得到输出特征图6×6×32。

第五层输入数据的特征图的大小为6×6×32，采用输出64张特征图，卷积核大小为3×3大小，步长为2，卷积计算的图两端对齐处理，得到输出特征图3×3×64，由于输出特征图的长宽很小，导致计算量很小，所以可以使用相对较多的输出的特征图个数。

第六层是全连接到192的特征图上。最后将第六层的结果连接到是否为人脸的判断中和人脸box的相对坐标中。

具体的网络结构图如图3所示。

2、网络模型的训练

样本的采集，如图1所示。

使用T01设备，对人脸检测训练集进行采集样本。将每一张图片作为输入图片，通过T01进行检测，，所有T01检测出的结果作为二次检测的初级训练样本。对初级训练样本分类，有人脸的图片为正样本，没有人脸的样本作为负样本。再对正样本进行人工标注人脸的外接矩形框，这里标注人脸的外接矩形框与人脸识别要求的人脸外接矩形框规则完全一样。正样本张数大概有50万张，负样本张数大概有80万张。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明实施例可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种二次人脸检测的网络模型样本采集的方法，其特征在于，所述的方法包括：

S1，将每一张图片作为输入图片，通过集成电路芯片进行检测，所有所述的集成电路芯片检测出的结果作为二次检测的初级训练样本；所述步骤S1中的二次检测的初级训练样本的方法为：

S1.6，网络第六层设置为全连接到192的特征图上；

2.根据权利要求1所述的一种二次人脸检测的网络模型样本采集的方法，其特征在于，所述的网络第一层设置为输入数据的特征图的大小为55×55×3。

3.根据权利要求1所述的一种二次人脸检测的网络模型样本采集的方法，其特征在于，所述的网络第二层设置为输入数据的特征图的大小变为27×27×4。

4.根据权利要求1所述的一种二次人脸检测的网络模型样本采集的方法，其特征在于，所述的网络第三层输入数据的特征图的大小为13×13×8。

5.根据权利要求1所述的一种二次人脸检测的网络模型样本采集的方法，其特征在于，将所述的网络第六层的结果连接到是否为人脸的判断中和/或人脸box的相对坐标中。

6.根据权利要求1所述的一种二次人脸检测的网络模型样本采集的方法，其特征在于，网络结构应用到人脸识别的预处理中，要求每张处理时间在5ms以内。

7.根据权利要求6所述的一种二次人脸检测的网络模型样本采集的方法，其特征在于，所述的网络结构每张处理时间在4ms以内。