[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN112001205B - 一种二次人脸检测的网络模型样本采集的方法 - Google Patents

一种二次人脸检测的网络模型样本采集的方法 Download PDF

Info

Publication number
CN112001205B
CN112001205B CN201910445457.6A CN201910445457A CN112001205B CN 112001205 B CN112001205 B CN 112001205B CN 201910445457 A CN201910445457 A CN 201910445457A CN 112001205 B CN112001205 B CN 112001205B
Authority
CN
China
Prior art keywords
enabling
picture
network
size
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910445457.6A
Other languages
English (en)
Other versions
CN112001205A (zh
Inventor
于晓静
田凤彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Ingenic Semiconductor Co Ltd
Original Assignee
Beijing Ingenic Semiconductor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Ingenic Semiconductor Co Ltd filed Critical Beijing Ingenic Semiconductor Co Ltd
Priority to CN201910445457.6A priority Critical patent/CN112001205B/zh
Publication of CN112001205A publication Critical patent/CN112001205A/zh
Application granted granted Critical
Publication of CN112001205B publication Critical patent/CN112001205B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种二次人脸检测的网络模型样本采集的方法,所述的方法包括:S1,将每一张图片作为输入图片,通过集成电路芯片进行检测,所有所述的集成电路芯片检测出的结果作为二次检测的初级训练样本;S2,对初级训练样本分类,有人脸的图片为正样本,没有人脸的样本作为负样本;S3,再对正样本进行人工标注人脸的外接矩形框,这里标注人脸的外接矩形框与人脸识别要求的人脸外接矩形框规则完全一样。

Description

一种二次人脸检测的网络模型样本采集的方法
技术领域
本发明涉及人脸图像识别技术领域,特别涉及一种二次人脸检测的网络模型样本采集的方法。
背景技术
随着科技的不断发展,特别是计算机视觉技术的发展,人脸识别技术广泛应用于信息安全、电子认证等各个领域,图像特征提取方法具有良好的识别性能。人脸识别是指基于已知的人脸样本库,利用图像处理和/或模式识别技术从静态或者动态场景中,识别一个或多个人脸的技术。但是目前的人脸识别技术包括1、传统机器学习的人脸检测。2、基于深度学习的人脸检测。3、用于前端的人脸检测。其具有的缺点包括:前端人脸检测存在一定的误检,检测出的人脸框和是否为人脸的判定标准与满足人脸识别的要求不匹配,导致人脸识别识别率下降甚至无法正常使用。
发明内容
为了解决上述现有技术中存在的问题,本发明的目的在于:
1、实现去除前端人脸检测的误检。
2、达到人脸检测标准与人脸识别的要求相匹配,从而提高人脸识别的识别率。
3、实现人脸检测每个人脸用时5ms以内。
本发明提供一种二次人脸检测的网络模型样本采集的方法,所述的方法包括:
S1,将每一张图片作为输入图片,通过集成电路芯片进行检测,所有所述的集成电路芯片检测出的结果作为二次检测的初级训练样本;
S2,对初级训练样本分类,有人脸的图片为正样本,没有人脸的样本作为负样本;
S3,再对正样本进行人工标注人脸的外接矩形框,这里标注人脸的外接矩形框与人脸识别要求的人脸外接矩形框规则完全一样。
所述步骤S1中的集成电路芯片采用T01芯片。
所述步骤S1中的二次检测的初级训练样本的方法为:
S1.1,网络第一层设置为输入大尺寸图片,采用输出深度为4的特征图,卷积核大小为3×3大小,步长为2,卷积计算的图两端非对齐处理;
S1.2,网络第二层设置为输入比第一层小的尺寸图片,采用输出深度为8的特征图,卷积核大小为3×3大小,步长为2,卷积计算的图两端非对齐处理;
S1.3,网络第三层设置为输入比第二层小的尺寸图片,采用输出深度为16的特征图,卷积核大小为3×3大小,步长为2,卷积计算的图两端非对齐处理,得到输出特征图6×6×16;
S1.4,网络第四层设置为输入数据的特征图的大小为6×6×16,采用输出32张特征图,卷积核大小为1×1大小,步长为1,卷积计算的图两端对齐处理,得到输出特征图6×6×32;
S1.5,网络第五层设置为输入数据的特征图的大小为6×6×32,采用输出64张特征图,卷积核大小为3×3大小,步长为2,卷积计算的图两端对齐处理,得到输出特征图3×3×64;
S1.6,网络第六层设置为全连接到192的特征图上。
所述的网络第一层设置为输入数据的特征图的大小为55×55×3。
所述的网络第二层设置为输入数据的特征图的大小变为27×27×4。
所述的网络第三层输入数据的特征图的大小为13×13×8。
将所述的网络第六层的结果连接到是否为人脸的判断中和/或人脸box的相对坐标中。
所述的网络结构应用到人脸识别的预处理中,要求每张处理时间在5ms以内。
所述的网络结构优选每张处理时间在4ms以内。
本申请的优势在于:使用单独设计输出特征图个数的方案,可以有效的降低计算量,最大程度的提高卷积提取特征的效率。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,并不构成对本发明的限定。
图1是本发明方法的流程示意框图。
图2是本发明步骤S1的流程示意框图。
图3是本发明步骤S1的具体实施方式的流程框图。
具体实施方式
在人脸识别领域,目前一些相关的技术领域的术语包括:
1、深度学习:深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。
2、人脸检测:使用人脸检测器检测视频或一张图片中是否存在人脸的过程,叫做人脸检测。
3、卷积核:卷积核是用来做图像处理时的矩阵,与原图像做运算的参数。卷积核通常是一个列矩阵数组成(例如3*3的矩阵),该区域上每个方格都有一个权重值。矩阵形状一般是1×1,3×3,5×5,7×7,1×3,3×1,2×2,1×5,5×1,…
4、卷积:将卷积核的中心放置在要计算的像素上,一次计算核中每个元素和其覆盖的图像像素值的乘积并求和,得到的结构就是该位置的新像素值,这个过程称为卷积。
5、前端人脸检测:在芯片上使用的人脸检测称之为前端人脸检测,前端人脸检测的速度和正确率比云端服务器人脸检测的低。
6、特征图:输入数据通过卷积计算后得到的结果称之为特征图,数据通过全连接后生成的结果也称为特征图。特征图大小一般表示为长×宽×深度,或1×深度
7、步长:卷积核中心位置再坐标上移动的长度。
8:两端非对齐处理:图像或数据通过卷积核大小为3且步长为2处理时,会导致两侧数据不够,此时采用丢弃两侧或一侧数据,这种现象叫做两端非对其处理。
1、网络结构
1)本次处理的对象是前端北京君正T01(集成电路)芯片人脸检测出的结果,设计的网络是应用到人脸识别的预处理中,要求每张处理时间在5ms以内。该网络实现4ms每张的处理速度。
2)网络的实现,如图2所示。
第一层输入的图片尺寸相对较大,采用输出深度为4的特征图,卷积核大小为3×3大小,步长为2,卷积计算的图两端非对齐处理,计算量急剧减小。
第二层输入数据的特征图的大小变为27×27×4,尺寸也是相对较大,采用输出深度为8的特征图,卷积核大小为3×3大小,步长为2,卷积计算的图两端非对齐处理,计算量得到压缩。
第三层输入数据的特征图的大小为13×13×8,尺寸也相对适中,采用输出深度为16的特征图,卷积核大小为3×3大小,步长为2,卷积计算的图两端非对齐处理,得到输出特征图6×6×16。
由于前面几层使用的步长2比较密集,输出特征图相对较少,提取的特征效果不是很好,所以在第四层采用步长为1,卷积核为1的计算。
第四层输入数据的特征图的大小为6×6×16,此时的数据可以采用相对较多输出图的计算,采用输出32张特征图,卷积核大小为1×1大小,步长为1,卷积计算的图两端对齐处理,得到输出特征图6×6×32。
第五层输入数据的特征图的大小为6×6×32,采用输出64张特征图,卷积核大小为3×3大小,步长为2,卷积计算的图两端对齐处理,得到输出特征图3×3×64,由于输出特征图的长宽很小,导致计算量很小,所以可以使用相对较多的输出的特征图个数。
第六层是全连接到192的特征图上。最后将第六层的结果连接到是否为人脸的判断中和人脸box的相对坐标中。
具体的网络结构图如图3所示。
2、网络模型的训练
样本的采集,如图1所示。
使用T01设备,对人脸检测训练集进行采集样本。将每一张图片作为输入图片,通过T01进行检测,,所有T01检测出的结果作为二次检测的初级训练样本。对初级训练样本分类,有人脸的图片为正样本,没有人脸的样本作为负样本。再对正样本进行人工标注人脸的外接矩形框,这里标注人脸的外接矩形框与人脸识别要求的人脸外接矩形框规则完全一样。正样本张数大概有50万张,负样本张数大概有80万张。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明实施例可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种二次人脸检测的网络模型样本采集的方法,其特征在于,所述的方法包括:
S1,将每一张图片作为输入图片,通过集成电路芯片进行检测,所有所述的集成电路芯片检测出的结果作为二次检测的初级训练样本;所述步骤S1中的二次检测的初级训练样本的方法为:
S1.1,网络第一层设置为输入大尺寸图片,采用输出深度为4的特征图,卷积核大小为3×3大小,步长为2,卷积计算的图两端非对齐处理;
S1.2,网络第二层设置为输入比第一层小的尺寸图片,采用输出深度为8的特征图,卷积核大小为3×3大小,步长为2,卷积计算的图两端非对齐处理;
S1.3,网络第三层设置为输入比第二层小的尺寸图片,采用输出深度为16的特征图,卷积核大小为3×3大小,步长为2,卷积计算的图两端非对齐处理,得到输出特征图6×6×16;
S1.4,网络第四层设置为输入数据的特征图的大小为6×6×16,采用输出32张特征图,卷积核大小为1×1大小,步长为1,卷积计算的图两端对齐处理,得到输出特征图6×6×32;
S1.5,网络第五层设置为输入数据的特征图的大小为6×6×32,采用输出64张特征图,卷积核大小为3×3大小,步长为2,卷积计算的图两端对齐处理,得到输出特征图3×3×64;
S1.6,网络第六层设置为全连接到192的特征图上;
S2,对初级训练样本分类,有人脸的图片为正样本,没有人脸的样本作为负样本;
S3,再对正样本进行人工标注人脸的外接矩形框,这里标注人脸的外接矩形框与人脸识别要求的人脸外接矩形框规则完全一样。
2.根据权利要求1所述的一种二次人脸检测的网络模型样本采集的方法,其特征在于,所述的网络第一层设置为输入数据的特征图的大小为55×55×3。
3.根据权利要求1所述的一种二次人脸检测的网络模型样本采集的方法,其特征在于,所述的网络第二层设置为输入数据的特征图的大小变为27×27×4。
4.根据权利要求1所述的一种二次人脸检测的网络模型样本采集的方法,其特征在于,所述的网络第三层输入数据的特征图的大小为13×13×8。
5.根据权利要求1所述的一种二次人脸检测的网络模型样本采集的方法,其特征在于,将所述的网络第六层的结果连接到是否为人脸的判断中和/或人脸box的相对坐标中。
6.根据权利要求1所述的一种二次人脸检测的网络模型样本采集的方法,其特征在于,网络结构应用到人脸识别的预处理中,要求每张处理时间在5ms以内。
7.根据权利要求6所述的一种二次人脸检测的网络模型样本采集的方法,其特征在于,所述的网络结构每张处理时间在4ms以内。
CN201910445457.6A 2019-05-27 2019-05-27 一种二次人脸检测的网络模型样本采集的方法 Active CN112001205B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910445457.6A CN112001205B (zh) 2019-05-27 2019-05-27 一种二次人脸检测的网络模型样本采集的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910445457.6A CN112001205B (zh) 2019-05-27 2019-05-27 一种二次人脸检测的网络模型样本采集的方法

Publications (2)

Publication Number Publication Date
CN112001205A CN112001205A (zh) 2020-11-27
CN112001205B true CN112001205B (zh) 2023-10-31

Family

ID=73461578

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910445457.6A Active CN112001205B (zh) 2019-05-27 2019-05-27 一种二次人脸检测的网络模型样本采集的方法

Country Status (1)

Country Link
CN (1) CN112001205B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101667245A (zh) * 2009-09-25 2010-03-10 西安电子科技大学 基于支持向量新颖检测分类器级联的人脸检测方法
CN107871134A (zh) * 2016-09-23 2018-04-03 北京眼神科技有限公司 一种人脸检测方法及装置
CN108875624A (zh) * 2018-06-13 2018-11-23 华南理工大学 基于多尺度的级联稠密连接神经网络的人脸检测方法
WO2019091271A1 (zh) * 2017-11-13 2019-05-16 苏州科达科技股份有限公司 一种人脸检测方法以及人脸检测系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101667245A (zh) * 2009-09-25 2010-03-10 西安电子科技大学 基于支持向量新颖检测分类器级联的人脸检测方法
CN107871134A (zh) * 2016-09-23 2018-04-03 北京眼神科技有限公司 一种人脸检测方法及装置
WO2019091271A1 (zh) * 2017-11-13 2019-05-16 苏州科达科技股份有限公司 一种人脸检测方法以及人脸检测系统
CN108875624A (zh) * 2018-06-13 2018-11-23 华南理工大学 基于多尺度的级联稠密连接神经网络的人脸检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
多级联卷积神经网络人脸检测;余飞;甘俊英;张雨晨;曾军英;;五邑大学学报(自然科学版)(第03期);全文 *

Also Published As

Publication number Publication date
CN112001205A (zh) 2020-11-27

Similar Documents

Publication Publication Date Title
US11830230B2 (en) Living body detection method based on facial recognition, and electronic device and storage medium
CN107103613B (zh) 一种三维手势姿态估计方法
CN111754396B (zh) 脸部图像处理方法、装置、计算机设备和存储介质
CN106548169A (zh) 基于深度神经网络的模糊文字增强方法及装置
CN106778659B (zh) 一种车牌识别方法及装置
DE102013113490A1 (de) Verfahren und System zum Schätzen einer Lage einer Kamera
CN111126293A (zh) 一种火焰和烟雾异常情况检测方法及系统
CN110287862B (zh) 基于深度学习的防偷拍检测方法
CN110059539A (zh) 一种基于图像分割的自然场景文本位置检测方法
CN111104813A (zh) 二维码图像关键点检测方法、装置、电子设备及存储介质
CN104537381B (zh) 一种基于模糊不变特征的模糊图像识别方法
CN112991374A (zh) 基于Canny算法的边缘增强方法、装置、设备及存储介质
Zhu et al. Towards automatic wild animal detection in low quality camera-trap images using two-channeled perceiving residual pyramid networks
CN116740135A (zh) 红外弱小目标跟踪方法、装置、电子设备及存储介质
CN108229281B (zh) 神经网络的生成方法和人脸检测方法、装置及电子设备
CN112308087A (zh) 基于动态视觉传感器的一体化成像识别系统和方法
CN110321869A (zh) 基于多尺度融合网络的人员检测和提取方法
CN107609465A (zh) 一种用于人脸检测的多尺度检测方法
CN110472567A (zh) 一种适用于非配合场景下的人脸识别方法和系统
CN112001205B (zh) 一种二次人脸检测的网络模型样本采集的方法
CN110852172B (zh) 一种基于Cycle Gan图片拼贴并增强的扩充人群计数数据集的方法
CN112001204B (zh) 一种二次人脸检测的网络模型的训练方法
CN112001202B (zh) 一种二次人脸检测的网络结构设置方法
CN114782692B (zh) 房屋模型的修复方法、装置、电子设备和可读存储介质
CN117809115A (zh) Smt贴片错件检测方法、装置及视觉检测系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant