CN109800682A - 驾驶员属性识别方法及相关产品 - Google Patents
驾驶员属性识别方法及相关产品 Download PDFInfo
- Publication number
- CN109800682A CN109800682A CN201811646837.8A CN201811646837A CN109800682A CN 109800682 A CN109800682 A CN 109800682A CN 201811646837 A CN201811646837 A CN 201811646837A CN 109800682 A CN109800682 A CN 109800682A
- Authority
- CN
- China
- Prior art keywords
- driver
- image
- preset
- target
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 238000012545 processing Methods 0.000 claims abstract description 41
- 238000003062 neural network model Methods 0.000 claims abstract description 30
- 238000013527 convolutional neural network Methods 0.000 claims description 39
- 238000011156 evaluation Methods 0.000 claims description 27
- 238000004590 computer program Methods 0.000 claims description 21
- 238000013507 mapping Methods 0.000 claims description 19
- 238000012549 training Methods 0.000 claims description 19
- 238000003860 storage Methods 0.000 claims description 10
- 230000000694 effects Effects 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 7
- 238000011176 pooling Methods 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 15
- 238000004422 calculation algorithm Methods 0.000 description 14
- 238000009826 distribution Methods 0.000 description 13
- 238000013441 quality evaluation Methods 0.000 description 10
- 238000003709 image segmentation Methods 0.000 description 9
- 230000007613 environmental effect Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 230000002093 peripheral effect Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000012360 testing method Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000007781 pre-processing Methods 0.000 description 5
- 238000012544 monitoring process Methods 0.000 description 4
- 238000005286 illumination Methods 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 206010039203 Road traffic accident Diseases 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000011478 gradient descent method Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 239000003651 drinking water Substances 0.000 description 1
- 235000020188 drinking water Nutrition 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000036544 posture Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000000391 smoking effect Effects 0.000 description 1
- 206010041232 sneezing Diseases 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Landscapes
- Image Analysis (AREA)
Abstract
本申请实施例提供了一种驾驶员属性识别方法及相关产品,所述方法包括:获取输入图像,所述输入图像中包含驾驶员区域图像;提取所述输入图像中的驾驶员区域图像;确定所述驾驶员区域图像中的模糊区域和清晰区域;基于预设的最大后验框架模型对所述模糊区域进行去模糊化处理,得到处理后的所述驾驶员区域图像;采用预设深度神经网络模型对处理后的所述驾驶员区域图像进行属性识别,得到驾驶员对应的目标属性标识。通过本申请可以对模糊图像进行清晰化处理,从而,提升驾驶员属性的识别精度。
Description
技术领域
本申请涉及驾驶员属性识别技术领域,具体涉及一种驾驶员属性识别方法及相关产品。
背景技术
随着道路交通的高速发展,快速、舒适、便捷是人们的普遍感受,但是由此带来的交通事故也成为人们关注的严重社会问题。很多交通事故是由于驾驶员不良违规驾驶行为造成的。国内外对识别驾驶员不良违规行为已经取得了一些研究成果。但是,在实际应用中,一方面由于车辆是高速移动的,另一方面,也有可能驾驶员是晃动的,拍摄时,驾驶员有可能是模糊的,降低了对驾驶员属性的识别精度,如何精准对驾驶员的属性进行识别的问题亟待解决。
发明内容
本申请实施例提供了一种驾驶员属性识别方法及相关产品,能够精准识别驾驶员的属性。
本申请实施例第一方面提供了一种驾驶员属性识别方法,应用于电子设备,包括:
获取输入图像,所述输入图像中包含驾驶员区域图像;
提取所述输入图像中的驾驶员区域图像;
确定所述驾驶员区域图像中的模糊区域和清晰区域;
基于预设的最大后验框架模型对所述模糊区域进行去模糊化处理,得到处理后的所述驾驶员区域图像;
采用预设深度神经网络模型对处理后的所述驾驶员区域图像进行属性识别,得到驾驶员对应的目标属性标识。
本申请实施例第二方面提供了一种驾驶员属性识别装置,包括:
获取单元,用于获取输入图像,所述输入图像中包含驾驶员区域图像;
提取单元,用于提取所述输入图像中的驾驶员区域图像;
确定单元,用于确定所述驾驶员区域图像中的模糊区域和清晰区域;
处理单元,用于基于预设的最大后验框架模型对所述模糊区域进行去模糊化处理,得到处理后的所述驾驶员区域图像;
识别单元,用于采用预设深度神经网络模型对处理后的所述驾驶员区域图像进行属性识别,得到驾驶员对应的目标属性标识。
第三方面,本申请实施例提供一种电子设备,包括处理器、存储器以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行本申请实施例第一方面中的步骤的指令。
第四方面,本申请实施例提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。
第五方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
实施本申请实施例,具备如下有益效果:
可以看出,通过本申请实施例所描述的驾驶员属性识别方法及相关产品,获取输入图像,输入图像中包含驾驶员区域图像,提取输入图像中的驾驶员区域图像,确定驾驶员区域图像中的模糊区域和清晰区域,基于预设的最大后验框架模型对模糊区域进行去模糊化处理,得到处理后的驾驶员区域图像,采用预设深度神经网络模型对处理后的驾驶员区域图像进行属性识别,得到驾驶员对应的目标属性标识,如此,可以对模糊图像进行清晰化处理,从而,提升驾驶员属性的识别精度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1A是本申请实施例提供的一种驾驶员属性识别方法的实施例流程示意图;
图1B是本申请实施例提供的预设深度神经网络的结构示意图;
图2是本申请实施例提供的一种驾驶员属性识别方法的另一实施例流程示意图;
图3A是本申请实施例提供的一种驾驶员属性识别装置的实施例结构示意图;
图3B是本申请实施例提供的另一种驾驶员属性识别装置的实施例结构示意图;
图4是本申请实施例提供的一种电子设备的实施例结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置展示该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本申请实施例所描述电子设备可以包括智能手机(如Android手机、iOS手机、Windows Phone手机等)、平板电脑、掌上电脑、笔记本电脑、移动互联网设备(MID,MobileInternet Devices)或穿戴式设备等,上述仅是举例,而非穷举,包含但不限于上述装置,当然,上述电子设备还可以为服务器。
需要说明的是,相关技术中,驾驶员违章属性识别系统的传统流程包括:图像获取、特征提取、分类器判别三个步骤。图像获取后,主要对驾驶员图像进行光线补偿,图像去噪等预处理操作,但是没有针对性的对驾驶员图像进行去模糊处理,特别是过速和光照变化导致的图像模糊,影响驾驶员特征属性提取判断;特征提取方面,HOG算子、Haar-like算子等对图像特征的提取,由于各个算子应用功能的局限性,无法同时处理智能监控视频中的光照、外观和尺寸大幅变化的问题;关于分类器,支持向量机(support vector machine,SVM)、神经网络、贝叶斯分类器等理论在图像分类领域广泛应用。其中,SVM对多属性识别,且属性特征间有一定干扰的大样本的图片集,并不能取得很好的效果。监控视频中的驾驶员本身具有光照复杂性和姿态多变性,不同的时间段同一个摄像头获得的驾驶员图像可能会千差万别,在不同路段获得的驾驶员图像,也会存在一定的差异,采用传统的分类器方法难以达到较高的识别率。那么为了准确的识别出驾驶员违章属性,需加大样本集的学习度,以提高系统的识别率。
请参阅图1A,为本申请实施例提供的一种驾驶员属性识别方法的实施例流程示意图。本实施例中所描述的驾驶员属性识别方法,包括以下步骤:
101、获取输入图像,所述输入图像中包含驾驶员区域图像。
其中,电子设备可以获取输入图像,输入图像可以由摄像头拍摄的行人的全身照,输入图像可以由公共场所的摄像头拍摄所得。输入图像中包含驾驶员区域图像,即通过驾驶员区域图像可以识别出驾驶员的行为属性。
可选地,上述步骤101-步骤102之间还可以包括如下步骤:
对所述输入图像进行预处理,得到目标图像;
则,步骤102,提取所述输入图像中的驾驶员区域图像,则可以按照如下方式实施:
提取所述目标图像中的驾驶员区域图像。
其中,电子设备可以对输入图像进行预处理,例如,尺寸调整,背景去除,等等操作,得到目标图像。
可选地,上述步骤,对所述输入图像进行预处理,得到目标图像,可包括如下步骤:
A1、对所述输入图像进行缩放处理,使得缩放处理后的所述输入图像与图像库中的图像的尺寸大小一样;
A2、对缩放处理后的所述输入图像进行图像分割,得到所述目标图像。
其中,电子设备可以对输入图像进行缩放处理,使得缩放处理后的输入图像与图像库中的图像的尺寸大小一样,然后,对该缩放处理后的输入图像进行缩放处理,得到目标图像,如此,可以减少无效的数据,提升后续识别精度。
可选地,上述步骤,对所述输入图像进行预处理,得到目标图像,可包括如下步骤:
B1、对所述输入图像进行抠图处理,得到行人区域图像;
B2、对所述行人区域图像进行缩放处理,得到所述目标图像,缩放处理后的目标图像与图像库中的图像的尺寸大小一样。
其中,可以先对输入图像进行抠图处理,得到行人区域图像,抠图处理的具体算法可以为图像分割算法,例如,基于信息熵的图像分割算法、基于GraphCuts图割算法的图像分割算法、基于分水岭算法的图像分割算法等等,在此不作限定,其次,对该行人区域图像进行缩放处理,使得其与图像库中的图像的尺寸大小一致,得到目标图像。
其中,待处理图像可以由摄像头拍摄,上述待处理图像可以由用户指定或者由摄像头拍摄得到。
可选地,上述步骤101,获取输入图像,可以包括如下步骤:
11、获取目标环境参数;
12、按照预设的环境参数与拍摄参数之间的映射关系,确定所述目标环境参数对应的目标拍摄参数;
13、依据所述目标拍摄参数进行拍摄,得到所述输入图像。
其中,本申请实施例中,环境参数可以包括以下至少一种:温度、湿度、位置、磁场干扰强度、天气、环境光亮度、环境光源数量等等,在此不做限定。上述环境参数可以由环境传感器采集,环境传感器可以集成到电子设备中。环境传感器可以为以下至少一种:温度传感器、湿度传感器、定位装置、磁场检测传感器、处理器、环境光传感器、颜色传感器等等,在此不做限定,例如,温度传感器可以用于检测温度,湿度传感器可以用于检测湿度,全球定位系统GPS可以用于检测位置,磁场检测传感器可以用于检测磁场强度,处理器可以用于获取天气(例如,电子设备中安装天气APP,通过该天气APP获取天气),环境光传感器可以用于检测环境亮度,颜色传感器可以用于检测环境光源数量等等。
进一步地,拍摄参数可以为以下至少一种:曝光时长、拍摄模式(如海景模式、沙漠模式、夜景模式、全景模式等等)、感光度ISO、焦距、物距、光圈大小等等,在此不做限定。
另外,电子设备中还可以预先存储预设的环境参数与拍摄参数之间的映射关系,如下提供一种环境参数与拍摄参数之间的映射关系,具体如下:
环境参数 | 拍摄参数 |
环境参数1 | 拍摄参数1 |
环境参数2 | 拍摄参数2 |
... | ... |
环境参数n | 拍摄参数n |
具体实现中,电子设备可以获取目标环境参数,进而,按照预设的环境参数与拍摄参数之间的映射关系,确定目标环境参数对应的目标拍摄参数,并依据目标拍摄参数进行拍摄,得到输入图像,如此,可以得到与环境相宜的图像,提升了监控效率。
102、提取所述输入图像中的驾驶员区域图像。
其中,针对不同的地域,其车辆的驾驶室设置的位置不一样。地域可以为国家或者行政区域,电子设备可以对车辆进行车牌识别,得到目标车牌,电子设备中还可以预先存储行政区域与车牌之间的映射关系,确定目标车牌对应的目标地域,依据该目标区域确定驾驶室位置,从而,可以在输入图像中定位出驾驶员区域图像。
103、确定所述驾驶员区域图像中的模糊区域和清晰区域。
其中,驾驶员区域图像中可以包括清晰图像和模糊图像,模糊可以由驾驶员移动造成的。
可选地,上述步骤102,确定所述驾驶员区域图像中的模糊区域和清晰区域,可以按照如下方式实施:
将所述驾驶员区域图像输入到预设卷积神经网络模型中,得到所述模糊区域和所述清晰区域。
其中,预设卷积神经网络模型可以由用户自行设置或者系统默认,例如,卷积神经网络CNN。具体实现中,可以将驾驶员区域图像输入到预设卷积神经网络模型中,得到模糊区域和清晰区域。
进一步可选地,在上述步骤101之前,还可以包括如下步骤:
B1、获取A张样本图像,每一样本图像为清晰度大于预设清晰度的图像且每一样本图像中包括车辆以及该车辆的驾驶员,所述A为正整数;
B2、采用亚像素插值法生成B个随机模糊核,所述B个随机模糊核的尺寸大小依次从a×a到b×b,其中,a、b均为正整数,且b>a,B为正整数;
B3、基于所述A张样本图像、所述B个随机模糊核以及预设高斯噪声进行卷积运算,得到A×B张模糊图像;
B4、将所述A×B张模糊图像输入到卷积神经网络模型,得到所述预设卷积神经网络模型,其中,所述卷积神经网络模型包括N层,所述N层中包括M个卷积层,至少一个卷积层与卷积层之间加入了卷积块注意模块,所述卷积神经网络模型的全连接层使用全局平均池化层替代。
其中,上述预设清晰度可以预先设置或者系统默认,清晰度可以通过清晰度计算公式得到。具体实现中,可以挑选清晰的交通汽车驾驶员图片A张,使用亚像素插值法生成模糊核法B个随机模糊核,大小范围从a×a到b×b(b>a)。再将清晰图像与模糊核卷积并添加高斯噪声来合成模糊图像A×B张,其中σ=0.01。当然,在卷积神经网络模型在训练时图像时,可能会随机裁剪c×c个补丁,因此,为了使分类器对不同尺寸的图像更加鲁棒,预设卷积神经网络模型可采用多尺度训练策略,在[0.25,1]之间随机调整输入图像的大小。卷积神经网络模型假如有12层,可以在原有的12层神经网络(含输入层)的基础上,卷积层之间适当加入一些卷积块注意模块(Convolutional Block Attention Module CBAM),用以提高CNN网络的特征表达力,同时为了满足分类器处理不同大小尺寸的输入,使用全局平均池化层替代全连接层。
具体实现中,在执行上述步骤101之前,还可以随机抽取一定数量不参加训练的数据集用来测试,判断当前网络层数训练模型是否能够满足性能要求,如果不满足,将自动调整网络的层数,直至达到最佳的判别效果,例如,对上述输入图像进行图像质量评价,得到目标图像质量评价值,按照预设的图像质量评价值与层次之间的映射关系,确定目标图像质量评价值对应的目标层数,如此,可以得到与图像质量相宜的层数,有助于提升识别精度。
可选地,上述步骤,对上述输入图像进行图像质量评价,得到目标图像质量评价值,可按照如下方式实施:
采用至少一个图像质量评价指标对输入图像进行图像质量评价,得到图像质量评价值。
其中,图像质量评价指标可包括以下至少一种:平均灰度、均方差、熵、边缘保持度、信噪比等等,在此不做限定。可定义为得到的评价值越大,则图像质量越好。
104、基于预设的最大后验框架模型对所述模糊区域进行去模糊化处理,得到处理后的所述驾驶员区域图像。
其中,本申请实施例中,最大后验框架模型(maximum a posteriori,MAP)基于最大后验(MAP)框架模型对驾驶员区域图像进行去模糊化处理。
可选地,上述步骤104,基于预设的最大后验框架模型对所述模糊区域进行去模糊化处理,得到处理后的所述驾驶员区域图像,可包括如下步骤:
41、构造第一预设公式:
其中,表示卷积运算符,B表示模糊图像,I表示潜在清晰图像,K表示模糊内核,p(I)表示潜在图像先验p(I);
42、采用预设效果最佳的训练模型作为p(I)的先验潜像,以及L0梯度作为正则化项,对所述第一预设公式进行优化,得到第二预设公式,如下:
其中,γ,μ和λ是超参数,其均用于平衡每个项的权重;
43、采用半二次分裂方法分别通过在水平和垂直方向上引入关于图像I及其梯度的辅助变量μ和g=(gh,gv),以对所述第二预设公式进行优化,得到第三预设公式:
其中,α和β是罚分参数;
44、通过修复g和μ并优化来确定目标潜像I:
其中F(·)和F-1(·)分别表示傅里叶变换和逆傅里叶变换;是复共轭算子;和是水平和垂直的差分运算符;
45、基于所述目标潜像i对所述模糊区域进行去模糊化处理,得到处理后的所述驾驶员区域图像。
其中,MAP框架成功的关键在于潜在的图像先验p(I),它有利于在最小化(1)时模糊图像上的清晰图像。
其中,表示卷积运算符,B,I和K分别表示模糊图像,潜在清晰图像和模糊内核。
具体地,使用测试效果最佳的训练模型,作为(1)式中p(·)的先验潜像,用L0梯度作为正则化项,本申请的目标是解决以下优化问题:
其中γ,μ和λ是超参数,以平衡每个项的权重。
通过交替地求解潜像I和模糊核k来优化(2)。因此,将问题分为I子问题和k子问题:
其中,(3)中的f(·)和都是非凸的,这使得最小化(3)在计算上难以处理。为解决这个问题,采用半二次分裂方法分别通过在水平和垂直方向上引入关于图像及其梯度的辅助变量μ和g=(gh,gv),因此(3)可以改写为:
其中α和β是罚分参数。当α和β接近无穷大时,(5)的解与(3)的解相当,可以通过最小化I,g和μ替代来解决(5),因此,避免直接最小化非凸函数f(·)和
通过修复g和μ并优化来解决潜像I:
其中F(·)和F-1(·)分别表示傅里叶变换和逆傅里叶变换;是复共轭算子;和是水平和垂直的差分运算符。
鉴于潜在的图像I,通过以下方式解决g和μ:
使用反向传播方法计算f(·)的导数,并用梯度下降法更新u:
其中,η是步长,使用如下算法求解(11)的步骤1-7:
1、输入:潜向I
2、输出:μ的解决方法
3、初始化μ(0)←I
4、当s<s+1时
5、通过(11)解决μ(s+1)
6、s←s+1
7、结束
为了获得更准确的结果,使用图像梯度估计模糊核:
当然,也可以通过快速傅里叶变换(FFT)有效地解决,然后将k中的负元素设置为0并对k进行归一化,使得所有元素的总和等于1,再使用粗到细策略和图像金字塔来优化(2),在每个金字塔等级中,用最大迭代次数求解(3)和(12)。
105、采用预设深度神经网络模型对处理后的所述驾驶员区域图像进行属性识别,得到驾驶员对应的目标属性标识。
其中,本申请实施例中,驾驶员的属性可以为以下至少一种:玩手机、打电话、抱小孩、打架、挖鼻孔、掏耳朵、打喷嚏、扭头、低头、喝水、系安全带、摘眼镜、抽烟、吃东西等等,在此不做限定,每一属性均对应一个属性标识,属性标识用于表示属性。在具体实现中,还可以依据识别结果的目标准确率,调整预设深度神经网络模型的训练参数,该训练参数包括层数以及CBAM数量,具体地,依据预设的准确率与训练参数之间的映射关系,确定预设深度神经网络模型对应的训练参数,即得到调整后的层数以及CBAM数量,再用调整后的层数以及CBAM数量进行训练,或者,还可以提取驾驶员区域图像的特征,得到目标特征,依据目标特征的属性对调整预设深度神经网络模型的层数以及CBAM数量,再用调整后的层数以及CBAM数量进行训练,特征的属性可以为以下至少一种:特征点数量、特征点相对于人的位置、特征值大小、特征点方向等等,在此不做限定,可以预先存储特征的属性与训练参数之间的映射关系,进而,依据该映射关系确定预设深度神经网络模型的层数以及CBAM数量,并用调整后的层数以及CBAM数量进行训练。
上述预设深度神经网络模型可以由用户自行设置或者系统默认。如图1B所示,图1B提供了一种预设深度神经网络模型的结构示意图。
可选地,首先,在执行上述步骤105的过程中,可以固定卷积神经网络的第一层,将违章属性项分标签为,1,2...n(n>>1),再根据标签1,2...n对应的不同特征属性项的特点选择和改造合适的算法,避免同一算法对不同特征识别结果会有一定的差异性;然后,第一个属性算法的卷积首层先不固定,但从卷积第二层开始每层的名称加上-1,直至最后的输出层,便于算法间区分和标记。此后其他违章属性算法固定卷积第一层,其他卷积层随属性标签数对应逐层各自加上-2,-3,-4...,-n的区分标号;其次,单任务训练的单属性识别模型,特征点的属性决定了卷积层数和卷积块注意块(CBAM)数量,根据测试效果自动调整数据集比例,卷积层数和卷积块注意块(CBAM)数量,进行重新训练,直至达到违章属性核定测试的识别效果,目的是减少增加违章属性项,重复标记的工作量;以及从第二个违章属性开始,违章属性识别模型是基于前相关违章属性模型基础参数训练得到,目的是保留属性间的关联性,提高识别效率,再重复c的步骤,直至达到要求。
总之,上述预设深度神经网络模型可将各个违章属性的模型融合成一个总的识别模型,总识别网络的输出层是全局平均池化层,便于工程应用和减少模型占有量。最后根据对应的标签和状态量,识别网络输出驾驶员违章属性的状态。
可选地,所述预设深度神经网络模型包括多个驾驶员属性识别模型,每一驾驶员属性识别模型用于识别一种属性;
上述步骤105,采用预设深度神经网络模型对处理后的所述驾驶员区域图像进行属性识别,得到驾驶员对应的目标属性标识,可包括如下步骤:
51、采用所述多个驾驶员属性识别模型中每一驾驶员属性识别模型对处理后的所述驾驶员区域图像进行识别,多个识别结果,每一识别结果包括至少一种属性标识以及对应的概率值;
52、获取目标环境参数;
53、按照预设的环境参数与权值集之间的映射关系,确定所述目标环境参数对应的目标权值集,每一权值集为所述多个驾驶员属性识别模型中每一驾驶员属性识别模型对应的权值;
54、依据所述目标权值集、所述多个识别结果确定每一属性标识对应的评价值,得到多个评价值;
55、从所述多个评价值中选取最大评价值,将该最大评价值对应的属性标识作为目标属性标识。
其中,目标环境参数的具体描述可以参照上述步骤,在此不再赘述。具体实现中,本申请实施例中,预设深度神经网络模型可以包括多个驾驶员属性识别模型,每一驾驶员属性识别模型用于识别一种属性,电子设备中还可以预先存储预设的环境参数与权值集之间的映射关系,进而,可以采用多个驾驶员属性识别模型中每一驾驶员属性识别模型对处理后的驾驶员区域图像进行识别,多个识别结果,每一识别结果包括至少一种属性标识以及对应的概率值,获取目标环境参数,按照该预设的环境参数与权值集之间的映射关系,确定目标环境参数对应的目标权值集,每一权值集为多个驾驶员属性识别模型中每一驾驶员属性识别模型对应的权值,依据目标权值、多个识别结果确定每一属性标识对应的评价值,得到多个评价值,具体地,属性标识x的评价值为权值集中所有的权值与对应的概率值之间的加权值,最后,可以从多个评价值中选取最大评价值,将该最大评价值对应的属性标识作为目标属性标识,如此,可以针对不同环境对驾驶员属性进行精准识别。
进一步可选地,上述步骤105之后,还可以包括如下步骤:
C1、对处理后的所述驾驶员区域图像进行图像分割,得到目标人脸图像;
C2、对所述目标人脸图像进行特征点提取,得到目标特征点集;
C3、依据所述目标特征点集,确定所述目标人脸图像的目标特征点分布密度;
C4、按照预设的特征点分布密度与匹配阈值之间的映射关系,确定所述目标特征点分布密度对应的目标匹配阈值;
C5、依据所述目标匹配阈值以及所述目标人脸图像在预设数据库中进行搜索,得到与所述目标人脸图像匹配成功的目标对象。
其中,电子设备中可以预先存储预设的特征点分布密度与匹配阈值之间的映射关系,预设数据库也可以事先建立,该预设数据库中包括至少一个人脸图像,预设数据库可以为交警部门的驾驶员数据集或者公安机关的户籍数据库或者海关的出入境人员数据库,在此不做限定。具体实现中,电子设备可以对目标人脸图像进行特征点提取,得到目标特征点集,依据该目标特征点集,可以确定目标人脸图像的目标特征点分布密度,目标特征点分布密度=目标特征点集的数量/目标人脸图像的面积,进一步地,可以依据上述映射关系确定目标特征点分布密度对应的目标匹配阈值,依据该目标匹配阈值,可以将目标人脸图像在预设数据库中进行搜索,得到与目标人脸图像匹配成功的目标对象,即目标人脸图像与目标对象的人脸图像之间的匹配值大于目标匹配阈值时,则可以认为两者匹配成功,如此,可以动态调整匹配阈值,提高检索效率,如此,可以识别到哪个司机违规,现有技术中是哪个车违规,则扣分到车,本申请实施例,则可以扣分精准到人,提升了交通管理效率。
进一步地,上述步骤C5,依据所述目标匹配阈值以及所述目标人脸图像在预设数据库中进行搜索,得到与所述目标人脸图像匹配成功的目标对象,可包括如下步骤:
C51、对所述目标人脸图像进行轮廓提取,得到目标外围轮廓;
C52、将所述目标特征点集与人脸图像x的特征点集进行匹配,得到第一匹配值,所述人脸图像x为所述预设数据库中的任一人脸图像;
C53、将所述目标外围轮廓与所述人脸图像x的外围轮廓进行匹配,得到第二匹配值;
C54、获取特征点集对应的第一权值,以及外围轮廓对应的第二权值;
C55、依据所述第一匹配值、所述第二匹配值、所述第一权值和所述第二权值进行加权运算,得到目标匹配值;
C566、在所述目标匹配值大于所述目标匹配阈值时,确认所述人脸图像x为目标对象;
C57、在所述目标匹配值小于或等于所述目标匹配阈值时,确认所述人脸图像x不为所述目标对象。
其中,具体实现中,电子设备可以对目标人脸图像进行轮廓提取,得到目标外围轮廓,可以将目标特征点集与人脸图像x的特征点集进行匹配,得到第一匹配值,上述人脸图像x为预设数据库中的任意人脸图像,可以将目标外围轮廓与人脸图像x的外围轮廓进行匹配,得到第二匹配值,获取特征点集对应的第一权值,以及外围轮廓对应的第二权值,该第一权值、第二权值均可以预先设置,第一权值+第二权值=1,进而,目标匹配值=第一匹配值*第一权值+第二匹配值*第二权值,在目标匹配值大于目标匹配阈值时,确认人脸图像x为目标对象,反之,在目标匹配值小于或等于目标匹配阈值时,确认人脸图像x不为目标对象,如此,可以更精准地实现人脸识别。
可以看出,上述本申请实施例中的方法可以分为三个部分:CNN的驾驶员图像模糊和清晰分类、最大后验(MAP)框架中图像去模糊、深度神经网络驾驶员违章特征属性融合识别过程。(1)在CNN的驾驶员图像模糊和清晰分类部分,主要是根据数据集训练,确认驾驶员图像的模糊度,以及清晰和模糊的阈值,根据测试集的正确率调整CNN网络中卷积块注意模块(CBAM)和卷积神经网络的层数,在最大后验(MAP)框架中盲图像去模糊部分,主要将学习到的分类器作为MAP(最大后验)框架中潜在图像对应的正则化项,再基于半二次分裂法和梯度下降法的数值求解方法将监控视频的模糊驾驶员图像去盲区模糊,在深度神经网络驾驶员违章特征属性融合的识别过程中,得到去模糊化的驾驶员数据集,利用违章属性特征的关联性,及时调整各属性特征数据集比例,根据测试阈值及时调整CNN层数和卷积块注意模块数量,最终得到最佳的驾驶员违章属性识别效果。
可以看出,通过本申请实施例所描述的驾驶员属性识别方法,获取输入图像,输入图像中包含驾驶员区域图像,提取输入图像中的驾驶员区域图像,确定驾驶员区域图像中的模糊区域和清晰区域,基于预设的最大后验框架模型对模糊区域进行去模糊化处理,得到处理后的驾驶员区域图像,采用预设深度神经网络模型对处理后的驾驶员区域图像进行属性识别,得到驾驶员对应的目标属性标识,如此,可以对模糊图像进行清晰化处理,从而,提升驾驶员属性的识别精度。
与上述一致地,请参阅图2,为本申请实施例提供的一种驾驶员属性识别方法的实施例流程示意图。本实施例中所描述的驾驶员属性识别方法,包括以下步骤:
201、获取输入图像,所述输入图像中包含驾驶员区域图像。
202、提取所述输入图像中的驾驶员区域图像。
203、确定所述驾驶员区域图像中的模糊区域和清晰区域。
204、基于预设的最大后验框架模型对所述模糊区域进行去模糊化处理,得到处理后的所述驾驶员区域图像。
205、采用预设深度神经网络模型对处理后的所述驾驶员区域图像进行属性识别,得到驾驶员对应的目标属性标识。
206、对处理后的所述驾驶员区域图像进行图像分割,得到目标人脸图像。
207、对所述目标人脸图像进行特征点提取,得到目标特征点集。
208、依据所述目标特征点集,确定所述目标人脸图像的目标特征点分布密度。
209、按照预设的特征点分布密度与匹配阈值之间的映射关系,确定所述目标特征点分布密度对应的目标匹配阈值。
210、依据所述目标匹配阈值以及所述目标人脸图像在预设数据库中进行搜索,得到与所述目标人脸图像匹配成功的目标对象。
其中,上述步骤201-步骤210所描述的驾驶员属性识别方法可参考图1A所描述的驾驶员属性识别方法的对应步骤。
可以看出,通过本申请实施例所描述的驾驶员属性识别方法,获取输入图像,输入图像中包含驾驶员区域图像,提取输入图像中的驾驶员区域图像,确定驾驶员区域图像中的模糊区域和清晰区域,基于预设的最大后验框架模型对模糊区域进行去模糊化处理,得到处理后的驾驶员区域图像,采用预设深度神经网络模型对处理后的驾驶员区域图像进行属性识别,得到驾驶员对应的目标属性标识,对处理后的驾驶员区域图像进行图像分割,得到目标人脸图像,对目标人脸图像进行特征点提取,得到目标特征点集,依据目标特征点集,确定目标人脸图像的目标特征点分布密度,按照预设的特征点分布密度与匹配阈值之间的映射关系,确定目标特征点分布密度对应的目标匹配阈值,依据目标匹配阈值以及目标人脸图像在预设数据库中进行搜索,得到与目标人脸图像匹配成功的目标对象,如此,可以对模糊图像进行清晰化处理,从而,提升驾驶员属性的识别精度,还可以识别到哪个司机违规,现有技术中是哪个车违规,则扣分到车,则可以扣分精准到人,提升了交通管理效率。
与上述一致地,以下为实施上述驾驶员属性识别方法的装置,具体如下:
请参阅图3A,为本申请实施例提供的一种驾驶员属性识别装置的实施例结构示意图。本实施例中所描述的驾驶员属性识别装置,包括:获取单元301、提取单元302、确定单元303、处理单元304和识别单元305,具体如下:
获取单元301,用于获取输入图像,所述输入图像中包含驾驶员区域图像;
提取单元302,用于提取所述输入图像中的驾驶员区域图像;
确定单元303,用于确定所述驾驶员区域图像中的模糊区域和清晰区域;
处理单元304,用于基于预设的最大后验框架模型对所述模糊区域进行去模糊化处理,得到处理后的所述驾驶员区域图像;
识别单元305,用于采用预设深度神经网络模型对处理后的所述驾驶员区域图像进行属性识别,得到驾驶员对应的目标属性标识。
可以看出,通过本申请实施例所描述的驾驶员属性识别装置,获取输入图像,输入图像中包含驾驶员区域图像,提取输入图像中的驾驶员区域图像,确定驾驶员区域图像中的模糊区域和清晰区域,基于预设的最大后验框架模型对模糊区域进行去模糊化处理,得到处理后的驾驶员区域图像,采用预设深度神经网络模型对处理后的驾驶员区域图像进行属性识别,得到驾驶员对应的目标属性标识,如此,可以对模糊图像进行清晰化处理,从而,提升驾驶员属性的识别精度。
在一个可能的示例中,在所述确定所述驾驶员区域图像中的模糊区域和清晰区域方面,所述确定单元303具体用于:
将所述驾驶员区域图像输入到预设卷积神经网络模型中,得到所述模糊区域和所述清晰区域。
在一个可能的示例中,所述电子设备包括矢量寄存器,如图3B所示,图3B为图3A所示的驾驶员属性识别装置的又一变型结构,其与图3A相比较,还可以包括:模型构造单元306,具体如下:
所述模型构造单元306,具体用于:
获取A张样本图像,每一样本图像为清晰度大于预设清晰度的图像且每一样本图像中包括车辆以及该车辆的驾驶员,所述A为正整数;
采用亚像素插值法生成B个随机模糊核,所述B个随机模糊核的尺寸大小依次从a×a到b×b,其中,a、b均为正整数,且b>a,B为正整数;
基于所述A张样本图像、所述B个随机模糊核以及预设高斯噪声进行卷积运算,得到A×B张模糊图像;
将所述A×B张模糊图像输入到卷积神经网络模型,得到所述预设卷积神经网络模型,其中,所述卷积神经网络模型包括N层,所述N层中包括M个卷积层,至少一个卷积层与卷积层之间加入了卷积块注意模块,所述卷积神经网络模型的全连接层使用全局平均池化层替代。
在一个可能的示例中,在所述基于预设的最大后验框架模型对所述模糊区域进行去模糊化处理,得到处理后的所述驾驶员区域图像方面,处理单元304具体用于:
构造第一预设公式:
其中,表示卷积运算符,B表示模糊图像,I表示潜在清晰图像,K表示模糊内核,p(I)表示潜在图像先验p(I);
采用预设效果最佳的训练模型作为p(I)的先验潜像,以及L0梯度作为正则化项,对所述第一预设公式进行优化,得到第二预设公式,如下:
其中,γ,μ和λ是超参数,其均用于平衡每个项的权重;
采用半二次分裂方法分别通过在水平和垂直方向上引入关于图像I及其梯度的辅助变量μ和g=(gh,gv),以对所述第二预设公式进行优化,得到第三预设公式:
其中,α和β是罚分参数;
通过修复g和μ并优化来确定目标潜像I:
其中F(·)和F-1(·)分别表示傅里叶变换和逆傅里叶变换;是复共轭算子;和是水平和垂直的差分运算符;
基于所述目标潜像i对所述模糊区域进行去模糊化处理,得到处理后的所述驾驶员区域图像。
在一个可能的示例中,所述预设深度神经网络模型包括多个驾驶员属性识别模型,每一驾驶员属性识别模型用于识别一种属性;
在所述采用预设深度神经网络模型对处理后的所述驾驶员区域图像进行属性识别,得到驾驶员对应的目标属性标识方面,所述识别单元305具体用于:
采用所述多个驾驶员属性识别模型中每一驾驶员属性识别模型对处理后的所述驾驶员区域图像进行识别,多个识别结果,每一识别结果包括至少一种属性标识以及对应的概率值;
获取目标环境参数;
按照预设的环境参数与权值集之间的映射关系,确定所述目标环境参数对应的目标权值集,每一权值集为所述多个驾驶员属性识别模型中每一驾驶员属性识别模型对应的权值;
依据所述目标权值集、所述多个识别结果确定每一属性标识对应的评价值,得到多个评价值;
从所述多个评价值中选取最大评价值,将该最大评价值对应的属性标识作为目标属性标识。
可以理解的是,本实施例的驾驶员属性识别装置的各程序模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
与上述一致地,请参阅图4,为本申请实施例提供的一种电子设备的实施例结构示意图。本实施例中所描述的电子设备,包括:至少一个输入设备1000;至少一个输出设备2000;至少一个处理器3000,例如CPU;和存储器4000,上述输入设备1000、输出设备2000、处理器3000和存储器4000通过总线5000连接。
其中,上述输入设备1000具体可为触控面板、物理按键或者鼠标。
上述输出设备2000具体可为显示屏。
上述存储器4000可以是高速RAM存储器,也可为非易失存储器(non-volatilememory),例如磁盘存储器。上述存储器4000用于存储一组程序代码,上述输入设备1000、输出设备2000和处理器3000用于调用存储器4000中存储的程序代码,执行如下操作:
上述处理器3000,用于:
获取输入图像,所述输入图像中包含驾驶员区域图像;
提取所述输入图像中的驾驶员区域图像;
确定所述驾驶员区域图像中的模糊区域和清晰区域;
基于预设的最大后验框架模型对所述模糊区域进行去模糊化处理,得到处理后的所述驾驶员区域图像;
采用预设深度神经网络模型对处理后的所述驾驶员区域图像进行属性识别,得到驾驶员对应的目标属性标识。
可以看出,通过本申请实施例所描述的电子设备,获取输入图像,输入图像中包含驾驶员区域图像,提取输入图像中的驾驶员区域图像,确定驾驶员区域图像中的模糊区域和清晰区域,基于预设的最大后验框架模型对模糊区域进行去模糊化处理,得到处理后的驾驶员区域图像,采用预设深度神经网络模型对处理后的驾驶员区域图像进行属性识别,得到驾驶员对应的目标属性标识,如此,可以对模糊图像进行清晰化处理,从而,提升驾驶员属性的识别精度。
在一个可能的示例中,在所述确定所述驾驶员区域图像中的模糊区域和清晰区域方面,上述处理器3000具体用于:
将所述驾驶员区域图像输入到预设卷积神经网络模型中,得到所述模糊区域和所述清晰区域。
在一个可能的示例中,上述处理器3000还具体用于:
获取A张样本图像,每一样本图像为清晰度大于预设清晰度的图像且每一样本图像中包括车辆以及该车辆的驾驶员,所述A为正整数;
采用亚像素插值法生成B个随机模糊核,所述B个随机模糊核的尺寸大小依次从a×a到b×b,其中,a、b均为正整数,且b>a,B为正整数;
基于所述A张样本图像、所述B个随机模糊核以及预设高斯噪声进行卷积运算,得到A×B张模糊图像;
将所述A×B张模糊图像输入到卷积神经网络模型,得到所述预设卷积神经网络模型,其中,所述卷积神经网络模型包括N层,所述N层中包括M个卷积层,至少一个卷积层与卷积层之间加入了卷积块注意模块,所述卷积神经网络模型的全连接层使用全局平均池化层替代。
在一个可能的示例中,在所述基于预设的最大后验框架模型对所述模糊区域进行去模糊化处理,得到处理后的所述驾驶员区域图像方面,上述处理器3000具体用于:
构造第一预设公式:
其中,表示卷积运算符,B表示模糊图像,I表示潜在清晰图像,K表示模糊内核,p(I)表示潜在图像先验p(I);
采用预设效果最佳的训练模型作为p(I)的先验潜像,以及L0梯度作为正则化项,对所述第一预设公式进行优化,得到第二预设公式,如下:
其中,γ,μ和λ是超参数,其均用于平衡每个项的权重;
采用半二次分裂方法分别通过在水平和垂直方向上引入关于图像I及其梯度的辅助变量μ和g=(gh,gv),以对所述第二预设公式进行优化,得到第三预设公式:
其中,α和β是罚分参数;
通过修复g和μ并优化来确定目标潜像I:
其中F(·)和F-1(·)表示傅里叶变换和逆傅里叶变换;是复共轭算子;和是水平和垂直的差分运算符;
基于所述目标潜像i对所述模糊区域进行去模糊化处理,得到处理后的所述驾驶员区域图像。
在一个可能的示例中,所述预设深度神经网络模型包括多个驾驶员属性识别模型,每一驾驶员属性识别模型用于识别一种属性;
在所述采用预设深度神经网络模型对处理后的所述驾驶员区域图像进行属性识别,得到驾驶员对应的目标属性标识方面,上述处理器3000具体用于:
采用所述多个驾驶员属性识别模型中每一驾驶员属性识别模型对处理后的所述驾驶员区域图像进行识别,多个识别结果,每一识别结果包括至少一种属性标识以及对应的概率值;
获取目标环境参数;
按照预设的环境参数与权值集之间的映射关系,确定所述目标环境参数对应的目标权值集,每一权值集为所述多个驾驶员属性识别模型中每一驾驶员属性识别模型对应的权值;
依据所述目标权值集、所述多个识别结果确定每一属性标识对应的评价值,得到多个评价值;
从所述多个评价值中选取最大评价值,将该最大评价值对应的属性标识作为目标属性标识。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时包括上述方法实施例中记载的任何一种驾驶员属性识别方法的部分或全部步骤。
本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例所记载的任何一种驾驶员属性识别方法中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
尽管在此结合各实施例对本申请进行了描述,然而,在实施所要求保护的本申请过程中,本领域技术人员通过查看所述附图、公开内容、以及所附权利要求书,可理解并实现所述公开实施例的其他变化。在权利要求中,“包括”(comprising)一词不排除其他组成部分或步骤,“一”或“一个”不排除多个的情况。单个处理器或其他单元可以实现权利要求中列举的若干项功能。相互不同的从属权利要求中记载了某些措施,但这并不表示这些措施不能组合起来产生良好的效果。
本领域技术人员应明白,本申请的实施例可提供为方法、装置(设备)、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。计算机程序存储/分布在合适的介质中,与其它硬件一起提供或作为硬件的一部分,也可以采用其他分布形式,如通过Internet或其它有线或无线电信系统。
本申请是参照本申请实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管结合具体特征及其实施例对本申请进行了描述,显而易见的,在不脱离本申请的精神和范围的情况下,可对其进行各种修改和组合。相应地,本说明书和附图仅仅是所附权利要求所界定的本申请的示例性说明,且视为已覆盖本申请范围内的任意和所有修改、变化、组合或等同物。显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (10)
1.一种驾驶员属性识别方法,其特征在于,所述方法包括:
获取输入图像,所述输入图像中包含驾驶员区域图像;
提取所述输入图像中的驾驶员区域图像;
确定所述驾驶员区域图像中的模糊区域和清晰区域;
基于预设的最大后验框架模型对所述模糊区域进行去模糊化处理,得到处理后的所述驾驶员区域图像;
采用预设深度神经网络模型对处理后的所述驾驶员区域图像进行属性识别,得到驾驶员对应的目标属性标识。
2.根据权利要求1所述的方法,其特征在于,所述确定所述驾驶员区域图像中的模糊区域和清晰区域,包括:
将所述驾驶员区域图像输入到预设卷积神经网络模型中,得到所述模糊区域和所述清晰区域。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
获取A张样本图像,每一样本图像为清晰度大于预设清晰度的图像且每一样本图像中包括车辆以及该车辆的驾驶员,所述A为正整数;
采用亚像素插值法生成B个随机模糊核,所述B个随机模糊核的尺寸大小依次从a×a到b×b,其中,a、b均为正整数,且b>a,B为正整数;
基于所述A张样本图像、所述B个随机模糊核以及预设高斯噪声进行卷积运算,得到A×B张模糊图像;
将所述A×B张模糊图像输入到卷积神经网络模型,得到所述预设卷积神经网络模型,其中,所述卷积神经网络模型包括N层,所述N层中包括M个卷积层,至少一个卷积层与卷积层之间加入了卷积块注意模块,所述卷积神经网络模型的全连接层使用全局平均池化层替代。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述基于预设的最大后验框架模型对所述模糊区域进行去模糊化处理,得到处理后的所述驾驶员区域图像,包括:
构造第一预设公式:
其中,表示卷积运算符,B表示模糊图像,I表示潜在清晰图像,K表示模糊内核,p(I)表示潜在图像先验p(I);
采用预设效果最佳的训练模型作为p(I)的先验潜像,以及L0梯度作为正则化项,对所述第一预设公式进行优化,得到第二预设公式,如下:
其中,γ,μ和λ是超参数,其均用于平衡每个项的权重;
采用半二次分裂方法分别通过在水平和垂直方向上引入关于图像I及其梯度的辅助变量μ和g=(gh,gv),以对所述第二预设公式进行优化,得到第三预设公式:
其中,α和β是罚分参数;
通过修复g和μ并优化来确定目标潜像I:
其中F(·)和F-1(·)分别表示傅里叶变换和逆傅里叶变换;是复共轭算子;和是水平和垂直的差分运算符;
基于所述目标潜像i对所述模糊区域进行去模糊化处理,得到处理后的所述驾驶员区域图像。
5.根据权利要求3所述的方法,其特征在于,所述预设深度神经网络模型包括多个驾驶员属性识别模型,每一驾驶员属性识别模型用于识别一种属性;
所述采用预设深度神经网络模型对处理后的所述驾驶员区域图像进行属性识别,得到驾驶员对应的目标属性标识,包括:
采用所述多个驾驶员属性识别模型中每一驾驶员属性识别模型对处理后的所述驾驶员区域图像进行识别,多个识别结果,每一识别结果包括至少一种属性标识以及对应的概率值;
获取目标环境参数;
按照预设的环境参数与权值集之间的映射关系,确定所述目标环境参数对应的目标权值集,每一权值集为所述多个驾驶员属性识别模型中每一驾驶员属性识别模型对应的权值;
依据所述目标权值集、所述多个识别结果确定每一属性标识对应的评价值,得到多个评价值;
从所述多个评价值中选取最大评价值,将该最大评价值对应的属性标识作为目标属性标识。
6.一种驾驶员属性识别装置,其特征在于,包括:
获取单元,用于获取输入图像,所述输入图像中包含驾驶员区域图像;
提取单元,用于提取所述输入图像中的驾驶员区域图像;
确定单元,用于确定所述驾驶员区域图像中的模糊区域和清晰区域;
处理单元,用于基于预设的最大后验框架模型对所述模糊区域进行去模糊化处理,得到处理后的所述驾驶员区域图像;
识别单元,用于采用预设深度神经网络模型对处理后的所述驾驶员区域图像进行属性识别,得到驾驶员对应的目标属性标识。
7.根据权利要求6所述的装置,其特征在于,在所述确定所述驾驶员区域图像中的模糊区域和清晰区域方面,所述确定单元具体用于:
将所述驾驶员区域图像输入到预设卷积神经网络模型中,得到所述模糊区域和所述清晰区域。
8.根据权利要求6或7所述的装置,其特征在于,所述装置还包括:模型构造单元;
所述模型构造单元,具体用于:
获取A张样本图像,每一样本图像为清晰度大于预设清晰度的图像且每一样本图像中包括车辆以及该车辆的驾驶员,所述A为正整数;
采用亚像素插值法生成B个随机模糊核,所述B个随机模糊核的尺寸大小依次从a×a到b×b,其中,a、b均为正整数,且b>a,B为正整数;
基于所述A张样本图像、所述B个随机模糊核以及预设高斯噪声进行卷积运算,得到A×B张模糊图像;
将所述A×B张模糊图像输入到卷积神经网络模型,得到所述预设卷积神经网络模型,其中,所述卷积神经网络模型包括N层,所述N层中包括M个卷积层,至少一个卷积层与卷积层之间加入了卷积块注意模块,所述卷积神经网络模型的全连接层使用全局平均池化层替代。
9.一种电子设备,其特征在于,包括处理器、存储器,所述存储器用于存储一个或多个程序,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1-5任一项所述的方法中的步骤的指令。
10.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行以实现如权利要求1-5任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811646837.8A CN109800682B (zh) | 2018-12-29 | 2018-12-29 | 驾驶员属性识别方法及相关产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811646837.8A CN109800682B (zh) | 2018-12-29 | 2018-12-29 | 驾驶员属性识别方法及相关产品 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109800682A true CN109800682A (zh) | 2019-05-24 |
CN109800682B CN109800682B (zh) | 2022-12-09 |
Family
ID=66556878
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811646837.8A Active CN109800682B (zh) | 2018-12-29 | 2018-12-29 | 驾驶员属性识别方法及相关产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109800682B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110287834A (zh) * | 2019-06-13 | 2019-09-27 | Oppo广东移动通信有限公司 | 一种身份识别的方法及终端 |
CN110569789A (zh) * | 2019-09-06 | 2019-12-13 | 创新奇智(重庆)科技有限公司 | 商品组合型sku识别方法及其装置 |
CN110796109A (zh) * | 2019-11-05 | 2020-02-14 | 哈尔滨理工大学 | 一种基于模型融合的驾驶员分心行为识别方法 |
CN111340733A (zh) * | 2020-02-28 | 2020-06-26 | 深圳市商汤科技有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN111681335A (zh) * | 2020-03-18 | 2020-09-18 | 桂林电子科技大学 | 一种基于lstm技术的汽车轨迹预测系统及其预测方法 |
CN112102623A (zh) * | 2020-08-24 | 2020-12-18 | 深圳云天励飞技术股份有限公司 | 交通违章识别方法和装置、智能可穿戴设备 |
CN112801220A (zh) * | 2020-05-08 | 2021-05-14 | 视睿(杭州)信息科技有限公司 | 一种农产品品质分类方法、装置、计算机设备和存储介质 |
CN113053127A (zh) * | 2020-11-26 | 2021-06-29 | 泰州芯源半导体科技有限公司 | 智能化实时状态检测系统及方法 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080004904A1 (en) * | 2006-06-30 | 2008-01-03 | Tran Bao Q | Systems and methods for providing interoperability among healthcare devices |
US20090086229A1 (en) * | 2007-10-02 | 2009-04-02 | Seiko Epson Corporation | Image Processing Device and Pixel Attribute Identification Method |
CN102941864A (zh) * | 2012-11-09 | 2013-02-27 | 武汉翔翼科技有限公司 | 一种列车装载状态高清监控及超限检测方法 |
CN103984957A (zh) * | 2014-05-04 | 2014-08-13 | 中国科学院深圳先进技术研究院 | 胶囊内窥镜图像可疑病变区域自动预警系统 |
CN105799591A (zh) * | 2014-12-30 | 2016-07-27 | 厦门歌乐电子企业有限公司 | 路面图像的显示装置 |
US20170097948A1 (en) * | 2015-10-02 | 2017-04-06 | Adobe Systems Incorporated | Searching using specific attributes found in images |
CN106682602A (zh) * | 2016-12-16 | 2017-05-17 | 深圳市华尊科技股份有限公司 | 一种驾驶员行为识别方法及终端 |
CN107784292A (zh) * | 2017-11-08 | 2018-03-09 | 北方工业大学 | 基于阵列镜头的驾驶员疲劳状态识别方法 |
WO2018045602A1 (zh) * | 2016-09-07 | 2018-03-15 | 华中科技大学 | 一种基于深度学习的模糊核尺寸估计方法与系统 |
CN108491858A (zh) * | 2018-02-11 | 2018-09-04 | 南京邮电大学 | 基于卷积神经网络的疲劳驾驶检测方法及系统 |
CN108510451A (zh) * | 2018-02-09 | 2018-09-07 | 杭州雄迈集成电路技术有限公司 | 一种基于双层卷积神经网络的重建车牌的方法 |
CN108549892A (zh) * | 2018-06-12 | 2018-09-18 | 东南大学 | 一种基于卷积神经网络的车牌图像清晰化方法 |
CN109035149A (zh) * | 2018-03-13 | 2018-12-18 | 杭州电子科技大学 | 一种基于深度学习的车牌图像去运动模糊方法 |
CN109086778A (zh) * | 2018-07-27 | 2018-12-25 | 北京以萨技术股份有限公司 | 一种基于卷积神经网络的车牌去模糊识别方法 |
-
2018
- 2018-12-29 CN CN201811646837.8A patent/CN109800682B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080004904A1 (en) * | 2006-06-30 | 2008-01-03 | Tran Bao Q | Systems and methods for providing interoperability among healthcare devices |
US20090086229A1 (en) * | 2007-10-02 | 2009-04-02 | Seiko Epson Corporation | Image Processing Device and Pixel Attribute Identification Method |
CN102941864A (zh) * | 2012-11-09 | 2013-02-27 | 武汉翔翼科技有限公司 | 一种列车装载状态高清监控及超限检测方法 |
CN103984957A (zh) * | 2014-05-04 | 2014-08-13 | 中国科学院深圳先进技术研究院 | 胶囊内窥镜图像可疑病变区域自动预警系统 |
CN105799591A (zh) * | 2014-12-30 | 2016-07-27 | 厦门歌乐电子企业有限公司 | 路面图像的显示装置 |
US20170097948A1 (en) * | 2015-10-02 | 2017-04-06 | Adobe Systems Incorporated | Searching using specific attributes found in images |
WO2018045602A1 (zh) * | 2016-09-07 | 2018-03-15 | 华中科技大学 | 一种基于深度学习的模糊核尺寸估计方法与系统 |
CN106682602A (zh) * | 2016-12-16 | 2017-05-17 | 深圳市华尊科技股份有限公司 | 一种驾驶员行为识别方法及终端 |
CN107784292A (zh) * | 2017-11-08 | 2018-03-09 | 北方工业大学 | 基于阵列镜头的驾驶员疲劳状态识别方法 |
CN108510451A (zh) * | 2018-02-09 | 2018-09-07 | 杭州雄迈集成电路技术有限公司 | 一种基于双层卷积神经网络的重建车牌的方法 |
CN108491858A (zh) * | 2018-02-11 | 2018-09-04 | 南京邮电大学 | 基于卷积神经网络的疲劳驾驶检测方法及系统 |
CN109035149A (zh) * | 2018-03-13 | 2018-12-18 | 杭州电子科技大学 | 一种基于深度学习的车牌图像去运动模糊方法 |
CN108549892A (zh) * | 2018-06-12 | 2018-09-18 | 东南大学 | 一种基于卷积神经网络的车牌图像清晰化方法 |
CN109086778A (zh) * | 2018-07-27 | 2018-12-25 | 北京以萨技术股份有限公司 | 一种基于卷积神经网络的车牌去模糊识别方法 |
Non-Patent Citations (7)
Title |
---|
LERENHAN LI等: "Learning a Discriminative Prior for Blind Image Deblurring", 《2018 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》 * |
ZHE JIN等: "Generating Fixed-Length Representation From Minutiae Using Kernel Methods for Fingerprint Authentication", 《IEEE TRANSACTIONS ON SYSTEMS, MAN, AND CYBERNETICS: SYSTEMS》 * |
刘成云: "行车环境下多特征融合的交通标识检测与识别研究", 《中国博士学位论文全文数据库信息科技辑》 * |
刘辰: "基于改进SIFT的SAR图像配准及一种新的配准评价方法", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
石晓玲等: "基于卷积神经网络的交通监控模糊图像复原技术", 《智能城市》 * |
罗瑞红等: "车牌拍照识别技术研究动向", 《中山大学学报论丛》 * |
郝建坤: "空间变化PSF非盲去卷积图像复原法综述", 《中国光学》 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110287834A (zh) * | 2019-06-13 | 2019-09-27 | Oppo广东移动通信有限公司 | 一种身份识别的方法及终端 |
CN110569789A (zh) * | 2019-09-06 | 2019-12-13 | 创新奇智(重庆)科技有限公司 | 商品组合型sku识别方法及其装置 |
CN110569789B (zh) * | 2019-09-06 | 2023-05-05 | 创新奇智(重庆)科技有限公司 | 商品组合型sku识别方法及其装置 |
CN110796109A (zh) * | 2019-11-05 | 2020-02-14 | 哈尔滨理工大学 | 一种基于模型融合的驾驶员分心行为识别方法 |
CN111340733A (zh) * | 2020-02-28 | 2020-06-26 | 深圳市商汤科技有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN111340733B (zh) * | 2020-02-28 | 2022-07-26 | 深圳市商汤科技有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN111681335A (zh) * | 2020-03-18 | 2020-09-18 | 桂林电子科技大学 | 一种基于lstm技术的汽车轨迹预测系统及其预测方法 |
CN112801220A (zh) * | 2020-05-08 | 2021-05-14 | 视睿(杭州)信息科技有限公司 | 一种农产品品质分类方法、装置、计算机设备和存储介质 |
CN112801220B (zh) * | 2020-05-08 | 2022-07-08 | 视睿(杭州)信息科技有限公司 | 一种农产品品质分类方法、装置、计算机设备和存储介质 |
CN112102623A (zh) * | 2020-08-24 | 2020-12-18 | 深圳云天励飞技术股份有限公司 | 交通违章识别方法和装置、智能可穿戴设备 |
CN113053127A (zh) * | 2020-11-26 | 2021-06-29 | 泰州芯源半导体科技有限公司 | 智能化实时状态检测系统及方法 |
CN113053127B (zh) * | 2020-11-26 | 2021-11-26 | 江苏奥都智能科技有限公司 | 智能化实时状态检测系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109800682B (zh) | 2022-12-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109800682B (zh) | 驾驶员属性识别方法及相关产品 | |
CN111178183B (zh) | 人脸检测方法及相关装置 | |
CN111027493B (zh) | 一种基于深度学习多网络软融合的行人检测方法 | |
CN110858286B (zh) | 一种用于目标识别的图像处理方法及装置 | |
CN103366602B (zh) | 从数字摄像头图像确定停车场占用情况的方法 | |
CN108960189B (zh) | 图像再识别方法、装置及电子设备 | |
CN108805016B (zh) | 一种头肩区域检测方法及装置 | |
CN106446150B (zh) | 一种车辆精确检索的方法及装置 | |
US20150054824A1 (en) | Object detection method, object detection device, and image pickup device | |
CN106372666B (zh) | 一种目标识别方法及装置 | |
CN106651774B (zh) | 一种车牌超分辨率模型重建方法及装置 | |
CN111639653B (zh) | 一种误检图像确定方法、装置、设备和介质 | |
CN107392932A (zh) | 更新用于图像的背景减除的背景模型的方法和装置 | |
CN105205486A (zh) | 一种车标识别方法及装置 | |
CN109740416B (zh) | 目标跟踪方法及相关产品 | |
CN113033523B (zh) | 跌倒判断模型的构建方法及系统、跌倒判断方法及系统 | |
CN110414544B (zh) | 一种目标状态分类方法、装置及系统 | |
CN109784171A (zh) | 车辆定损图像筛选方法、装置、可读存储介质及服务器 | |
CN111951283A (zh) | 一种基于深度学习的医学图像识别方法及系统 | |
CN113870254A (zh) | 目标对象的检测方法、装置、电子设备及存储介质 | |
CN111382606A (zh) | 摔倒检测方法、摔倒检测装置和电子设备 | |
CN112861678A (zh) | 一种图像识别方法及装置 | |
CN107886060A (zh) | 基于视频的行人自动检测与跟踪方法 | |
CN116664873B (zh) | 图像信息处理方法、装置及存储介质 | |
CN114596515A (zh) | 目标对象检测方法、装置、电子设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |