CN108090511B - 图像分类方法、装置、电子设备及可读存储介质 - Google Patents
图像分类方法、装置、电子设备及可读存储介质 Download PDFInfo
- Publication number
- CN108090511B CN108090511B CN201711348128.7A CN201711348128A CN108090511B CN 108090511 B CN108090511 B CN 108090511B CN 201711348128 A CN201711348128 A CN 201711348128A CN 108090511 B CN108090511 B CN 108090511B
- Authority
- CN
- China
- Prior art keywords
- image
- gradient
- matrix
- brightness
- classified
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 239000011159 matrix material Substances 0.000 claims abstract description 150
- 238000007781 pre-processing Methods 0.000 claims description 18
- 238000010606 normalization Methods 0.000 claims description 17
- 239000013598 vector Substances 0.000 claims description 11
- 238000012015 optical character recognition Methods 0.000 claims description 10
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 230000007246 mechanism Effects 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 6
- 238000007619 statistical method Methods 0.000 abstract description 5
- 238000004364 calculation method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/73—Deblurring; Sharpening
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/40—Analysis of texture
- G06T7/41—Analysis of texture based on statistical description of texture
- G06T7/45—Analysis of texture based on statistical description of texture using co-occurrence matrix computation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/469—Contour-based spatial representations, e.g. vector-coding
- G06V10/473—Contour-based spatial representations, e.g. vector-coding using gradient analysis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Probability & Statistics with Applications (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Multimedia (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例提供一种图像分类方法、装置、电子设备及可读存储介质,通过在待分类图像中获取至少一个候选子图;确定每个候选子图的亮度矩阵和梯度矩阵;根据每个候选子图的亮度矩阵和梯度矩阵,确定同时满足预设亮度值及预设梯度值的像素点个数,形成每个候选子图对应的亮度‑梯度共生矩阵;根据每个候选子图对应的亮度‑梯度共生矩阵,确定出待分类图像的图像类别。该图像分类方法通过提取图像的亮度、梯度特征信息,并综合亮度‑梯度特征对图像内的各个像素点进行统计分析,从而准确获取了图像的纹理特征信息,提升了图像类型正确识别的准确率,且该方法仅对候选子图进行特征信息分析,待分析的数据量较少,有效提升图像类型识别的效率。
Description
技术领域
本发明实施例涉及图像处理领域,尤其涉及一种图像分类方法、装置、电子设备及可读存储介质。
背景技术
随着配置摄像头的手持终端设备的广泛普及,越来越多的业务办理基于终端设备所拍摄的数字图像,例如,住院医疗票据、身份证、银行卡等数字图像。
然而,业务办理过程中,上述各种数字图像通常需要工作人员人工审核查看资料是否齐全,处理效率较低,从而延长了客户办理业务的时长,客户体验差。
因此,亟需一种可以对数字图像进行准确且快速分类的方法,以提升图像自动分类的效率。
发明内容
本发明实施例提供一种图像分类方法、装置、电子设备及可读存储介质,以解决现有技术中对数字图像不能进行高效且准确分类的技术问题。
本发明实施例的一个方面提供一种图像分类方法,包括:
在待分类图像中获取至少一个候选子图;
确定每个候选子图的亮度矩阵和梯度矩阵;
根据每个候选子图的所述亮度矩阵和所述梯度矩阵,确定同时满足预设亮度值及预设梯度值的像素点个数,形成每个候选子图对应的亮度-梯度共生矩阵;
根据每个候选子图对应的亮度-梯度共生矩阵,确定出所述待分类图像的图像类别。
可选的,所述在待分类图像中获取至少一个候选子图之前,还包括:
对所述待分类图像进行图像预处理,得到图像预处理后的待分类图像;
其中,所述预处理包括以下处理中的至少一种:尺寸归一化调整、图像位置校正、图像画面清晰度调整。
可选的,所述在待分类图像中获取至少一个候选子图之前,还包括:
对所述图像预处理后的待分类图像进行灰度转换,得到灰度处理后的待分类图像;
对所述灰度处理后的待分类图像进行二值化处理,得到以二值化表示的待分类图像;
在所述以二值化表示的待分类图像中获取至少一个候选子图。
可选的,所述在待分类图像中获取至少一个候选子图包括:
在所述以二值化表示的待分类图像中确定出至少一个图形轮廓;
确定包围所述图形轮廓的最小轮廓外接矩形;
若所述最小轮廓外接矩形小于预设矩形尺寸,则以所述图像轮廓区域的中心位置对应所述预设矩形尺寸的中心,从所述待分类图像中截取满足所述预设矩形尺寸且包围所述图形轮廓的图像,形成所述候选子图;
若所述最小轮廓外接矩形大于等于所述预设矩形尺寸,则从所述待分类图像中截取所述最小轮廓外接矩形所包围的图像,形成所述候选子图。
可选的,所述确定每个候选子图的亮度矩阵和梯度矩阵包括:
确定每个候选子图中每个像素点的亮度值,形成每个候选子图的亮度矩阵;
根据每个候选子图的亮度矩阵,确定每个像素点在横向X方向上的梯度值,在纵向Y方向上的梯度值;
根据每个像素点在横向X方向上的梯度值,在纵向Y方向上的梯度值,形成每个候选子图的梯度矩阵。
可选的,所述根据每个候选子图的所述亮度矩阵和所述梯度矩阵,确定同时满足预设亮度值及预设梯度值的像素点个数,形成每个候选子图对应的亮度-梯度共生矩阵,包括:
根据最大预设亮度级V1,对每个候选子图的所述亮度矩阵进行归一化处理,得到归一化处理后的亮度矩阵F(x,y);
根据最大预设梯度级V2,对每个候选子图的所述梯度矩阵进行归一化处理,得到归一化处理后的梯度矩阵G(x,y);
其中,(x,y)表示候选子图中像素点的位置;所述预设亮度值小于等于所述最大预设亮度级V1,所述预设梯度值小于等于所述最大预设梯度级V2;所述V1,所述V2为正整数;
确定同时满足预设亮度值及预设梯度值的像素点个数,形成每个候选子图对应的亮度-梯度共生矩阵[V1、V2];或者形成每个候选子图对应的亮度-梯度共生矩阵[V2、V1]。
可选的,所述根据每个候选子图对应的亮度-梯度共生矩阵,确定出所述待分类图像的图像类别,包括:
将每个候选子图对应的亮度-梯度共生矩阵转换为每个候选子图的特征向量;
基于贝叶斯分类器,对每个候选子图的所述特征向量进行识别,并基于投票机制对识别结果进行判断,确定出所述待分类图像的图像类别。
可选的,所述方法还包括:
根据预设目标区域,在所述图像预处理后的待分类图像中提取与所述预设目标区域对应的目标子图;
将所述目标子图由RGB颜色空间转换到灰度图空间;
基于Laplacian增强算子,对转换到灰度图空间后的目标子图进行锐化处理;
基于光学字符识别OCR模型,对锐化处理后的目标子图进行识别;
根据识别结果确定所述待分类图像的图像类别;
若未能识别得到所述待分类图像的图像类别,则执行所述在待分类图像中获取至少一个候选子图;确定每个候选子图的亮度矩阵和梯度矩阵;根据每个候选子图的所述亮度矩阵和所述梯度矩阵,确定同时满足预设亮度值及预设梯度值的像素点个数,形成每个候选子图对应的亮度-梯度共生矩阵;根据每个候选子图对应的亮度-梯度共生矩阵,确定出所述待分类图像的图像类别的步骤。
本发明实施例的另一个方面提供一种图像分类装置,包括:
获取模块,用于在待分类图像中获取至少一个候选子图;
确定模块,用于确定每个候选子图的亮度矩阵和梯度矩阵;根据每个候选子图的所述亮度矩阵和所述梯度矩阵,确定同时满足预设亮度值及预设梯度值的像素点个数,形成每个候选子图对应的亮度-梯度共生矩阵;根据每个候选子图对应的亮度-梯度共生矩阵,确定出所述待分类图像的图像类别。
本发明实施例的还一个方面提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,
所述处理器运行所述计算机程序时执行上述任一项所述的图像分类方法。
本发明实施例的再一个方面提供一种电子设备可读存储介质,包括程序,当所述程序在电子设备上运行时,使得电子设备执行上述任一项所述的图像分类方法。
本发明实施例提供的图像分类方法、装置、电子设备及可读存储介质,通过在待分类图像中获取至少一个候选子图;确定每个候选子图的亮度矩阵和梯度矩阵;根据每个候选子图的亮度矩阵和梯度矩阵,确定同时满足预设亮度值及预设梯度值的像素点个数,形成每个候选子图对应的亮度-梯度共生矩阵;根据每个候选子图对应的亮度-梯度共生矩阵,确定出待分类图像的图像类别。该图像分类方法通过提取图像的亮度、梯度特征信息,并综合亮度-梯度特征对图像内的各个像素点进行统计分析,从而准确获取了图像的纹理特征信息,提升了图像类型正确识别的准确率,且该方法仅对候选子图进行特征信息分析,待分析的数据量较少,有效提升图像类型识别的效率。
附图说明
图1为本发明一示例性实施例提供的图像分类方法的流程示意图;
图2为本发明另一示例性实施例提供的图像分类方法的流程示意图;
图3为本发明图2所示实施例中投票机制的示意图;
图4为本发明另一示例性实施例提供的图像分类方法的流程示意图;
图5为本发明一示例性实施例提供的图像分类装置的结构示意图;
图6为本发明一示例性实施例提供的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
图1为本发明一示例性实施例提供的图像分类方法的流程示意图,如图1所示,本实施例中的图像分类方法的执行主体可以为任意具有数据处理能力的电子设备,例如,服务器、台式PC机、笔记本电脑、平板电脑PAD(portable android device,简称“PAD”)或手机等各种移动或非移动电子设备。本实施例的图像分类方法,具体可以包括:
步骤101,在待分类图像中获取至少一个候选子图。
在本步骤中,所谓候选子图为从待分类图像中分割出的部分图像,其中,候选子图的分割原则可以由本领域技术人员根据待分类图像的图像特征自行确定,本实施例对此不作具体限定。此外,本实施例对候选子图的数量也不作具体限定,通常来说,候选子图的数量越多,可以在一定程度上提升对待分类图像的类别识别准确率;但同时也会在一定程度上增加对候选子图进行数据处理的数据量,因此,本领域技术人员可以根据待分类图像的图像特征以及对待分类图像进行数据处理的硬件设备的处理能力综合确定获取候选子图的数量。
步骤102、确定每个候选子图的亮度矩阵和梯度矩阵。
在本步骤中,对获取到的每幅候选子图,确定其中每个像素点的亮度值,以及每个像素点的梯度值,形成每个候选子图的亮度矩阵F(x,y)与梯度矩阵G(x,y);其中,(x,y)表示候选子图中像素点在该候选子图中的位置,亮度矩阵、梯度矩阵中的元素个数与每个候选子图中包含的像素点个数相同,亮度矩阵中每个元素的元素值为该像素点的亮度值,梯度矩阵中每个元素的元素值为该像素点的梯度值。
步骤103、根据每个候选子图的亮度矩阵和梯度矩阵,确定同时满足预设亮度值及预设梯度值的像素点个数,形成每个候选子图对应的亮度-梯度共生矩阵。
在本步骤中,该预设亮度值与预设梯度值的取值及取值的个数可以由本领域技术人员根据每个候选子图的亮度矩阵和梯度矩阵中各个元素的取值确定,本实施例对此不作具体限定。根据公式(1)
W(n,m)=Num(F(x,y)=n,G(x,y)=m) (1)
确定出同时满足F(x,y)=n和G(x,y)=m的像素点个数;也就是说,当预设亮度值为n,预设梯度值为m时,统计该候选子图中同时满足上述两个条件的像素点的个数。假设候选子图中一共包含P个像素点,则同时满足F(x,y)=n和G(x,y)=m的像素点个数应该小于等于P,大于等于0;假设待统计的预设亮度值个数为N个,预设梯度值个数M个,则可以得到一个M×N的统计矩阵W(M,N)或者N×M的统计矩阵W(N,M)。该统计矩阵W就是亮度-梯度共生矩阵。
步骤104、根据每个候选子图对应的亮度-梯度共生矩阵,确定出待分类图像的图像类别。
在本步骤中,可以基于预设的识别模型,对提取出的该候选子图的亮度-梯度共生矩阵进行识别,根据识别结果确定出待分类图像的图像类别。其中本实施例不对该预设的识别模型进行具体限定,本领域技术人员可以选用现有技术中的各类图像分类模型,例如,基于决策树的分类、贝叶斯分类、支持向量机(Support Vector Machine,SVM)以及卷积神经网络等。
本实施例提供的图像分类方法,通过在待分类图像中获取至少一个候选子图;确定每个候选子图的亮度矩阵和梯度矩阵;根据每个候选子图的亮度矩阵和梯度矩阵,确定同时满足预设亮度值及预设梯度值的像素点个数,形成每个候选子图对应的亮度-梯度共生矩阵;根据每个候选子图对应的亮度-梯度共生矩阵,确定出待分类图像的图像类别。该图像分类方法通过提取图像的亮度、梯度特征信息,并综合亮度-梯度特征对图像内的各个像素点进行统计分析,从而准确获取了图像的纹理特征信息,提升了图像类型正确识别的准确率,且该方法仅对候选子图进行特征信息分析,待分析的数据量较少,有效提升图像类型识别的效率。
实施例二
图2为本发明另一示例性实施例提供的图像分类方法的流程示意图,如图2所示,在上一实施例的基础上,本实施例的图像分类方法,具体包括:
步骤201,对待分类图像进行图像预处理,得到图像预处理后的待分类图像。
其中,预处理包括以下处理中的至少一种:尺寸归一化调整、图像位置校正、图像画面清晰度调整。
在本步骤中,为了提升图像处理效率以及提升图像类别识别的准确率,可以对待分类图像进行标准化处理,处理的方式可以为对待分类图像进行尺寸的归一化,例如,确定各个待分类图像的分辨率,根据标准的分辨率对待分类图像的分辨率进行等比例转换,得到同一尺寸的图像。还可以包括:对图像位置进行校正,例如,图像的拍摄角度倾斜了45度角,则可以将该图像反向旋转45度角,以使其位置位于标准化位置。还可以包括:对图像进行锐化、亮度等调整,以使图像的画面更加清晰。
步骤202、对图像预处理后的待分类图像进行灰度转换,得到灰度处理后的待分类图像。
在本步骤中,灰度转换的目的也是为了改善图像的画质,其是将图像中以RGB表示的各个像素点转换为以灰度空间表示的像素点,从而使得图像的显示效果更加清晰。
步骤203、对灰度处理后的待分类图像进行二值化处理,得到以二值化表示的待分类图像。
在本步骤中,图像二值化(Image Binarization)就是将前一步骤中图像上的像素点的灰度值设置为0或255,从而将整个图像呈现出明显的黑白效果的过程。对该待分类图像进行二值化处理,可以使得图像中的数据量大为减少,从而凸显出图像的轮廓。
步骤204、在以二值化表示的待分类图像中获取至少一个候选子图。
具体的,该步骤的实现具体可以包括:
步骤2041、在以二值化表示的待分类图像中确定出至少一个图形轮廓。
通过步骤203对待分类图像进行二值化处理后,可以使得待分类图像中的各个图形轮廓突显,因此,可以直接根据封闭的轮廓选出一个或多个图形轮廓。当然,根据每幅待分类图像中图像内容的不同,选出的图形轮廓的个数会有所不同,为了后续分析的准确性,本领域技术人员可以预设一个图形轮廓的基准数量,若在以二值化处理后的待分类图像中未能确定出满足该基准数量的图形轮廓,则可以在该待分类图像中任意选取一个轮廓区域来补全该基准数量,例如,设定一个随机因子从图像中选取对应的子图进行补足。其中,优选的,各个选出的图形轮廓彼此不重叠,以减少重复计算的数据量。
步骤2042、确定包围图形轮廓的最小轮廓外接矩形。
在本步骤中,所谓最小轮廓外接矩形也就是可以完全包裹该图形轮廓,且沿着该图形轮廓的边缘勾勒出的轮廓外接矩形。由于不同类型的图像中轮廓的大小有很大的区别。因此,可以分以下两种情况讨论:
步骤2043a、若最小轮廓外接矩形小于预设矩形尺寸,则以图像轮廓区域的中心位置对应预设矩形尺寸的中心,从待分类图像中截取满足预设矩形尺寸且包围图形轮廓的图像,形成候选子图。
也就是说,如果获取的最小轮廓外接矩形小于预设的a×b图像大小,则根据轮廓的中心位置坐标为中心从原图中截取a×b大小的子图。
步骤2043b、若最小轮廓外接矩形大于等于预设矩形尺寸,则从待分类图像中截取最小轮廓外接矩形所包围的图像,形成候选子图。
也就是说,如果获取的最小轮廓外接矩形大于预设的a×b图像大小,则根据轮廓的实际大小进行截取。
步骤205、确定每个候选子图中每个像素点的亮度值,形成每个候选子图的亮度矩阵。
在本步骤中,可以通过将候选子图从RGB颜色空间转换到HIS
(Hue-Saturation-Intensity,简称“HIS”)颜色空间,所谓HIS颜色空间是当人观察一个彩色物体时,用色调、饱和度、亮度来描述物体的颜色。即用H、S、I三参数描述颜色特性,其中H定义颜色的波长,称为色调;S表示颜色的深浅程度,称为饱和度;I表示强度或亮度。从而通过参照转换公式(2)的计算得到各个候选子图中每个像素点的亮度通道I的值:
其中R,G,B,分别表示RGB颜色空间上不同颜色通道的值,I为亮度通道的值。
对候选子图中每个像素点计算其I值后,得到该候选子图的亮度矩阵。
步骤206、根据最大预设亮度级Vn,对每个候选子图的亮度矩阵进行归一化处理,得到归一化处理后的亮度矩阵F(x,y)。
在本步骤中,为了减少计算的复杂度,对得到的候选子图的亮度矩阵进行归一化处理。假设候选子图Q(x,y)中的最大亮度值为Vm,归一化后的最大亮度级为Vn,则该候选子图Q(x,y)的亮度矩阵归一化为:
其中,以公式(2)中计算出的每个像素点的I值代入Q(x,y),得到每个像素点归一化后的亮度值,进而形成每个候选子图的亮度矩阵F(x,y),其中INT为对归一化的亮度值进行取整数操作。
步骤207、根据每个候选子图的亮度矩阵,确定每个像素点在横向X方向上的梯度值,在纵向Y方向上的梯度值。
步骤208、根据每个像素点在横向X方向上的梯度值,在纵向Y方向上的梯度值,形成每个候选子图的梯度矩阵。
步骤209、根据最大预设梯度级Vg,对每个候选子图的所述梯度矩阵进行归一化处理,得到归一化处理后的梯度矩阵G(x,y)。
在步骤207~步骤209中,对归一化的亮度矩阵F(x,y),计算其梯度值。具体的计算公式如公式(4)~公式(6)所示:
gx=F(x+1,y-1)+2F(x+1,y)+F(x+1,y+1)-F(x-1,y-1)-2F(x-1,y)-F(x-1,y+1) (5)
gy=F(x-1,y+1)+2F(x,y+1)+F(x+1,y+1)-F(x-1,y+1)-2F(x,y-1)-F(x+1,y-1) (6)
其中,x,y表示候选子图中当前像素点的位置坐标,G(x,y)为像素点(x,y)处的梯度值。同理,为了降低计算的复杂度,需要对计算的梯度值进行归一化处理,假设归一化变化后的最大梯度级为Vg,然后根据最大预设梯度级Vg,对每个候选子图的所述梯度矩阵进行归一化处理,得到归一化处理后的梯度矩阵G(x,y)。
步骤210、确定同时满足预设亮度值及预设梯度值的像素点个数,形成每个候选子图对应的亮度-梯度共生矩阵[Vn、Vg];或者形成每个候选子图对应的亮度-梯度共生矩阵[Vg、Vn]。
在本步骤中,利用F(x,y),G(x,y)计算亮度-梯度共生矩阵,参照在上一实施例中提出的公式(1)
W(n,m)=Num(F(x,y)=n,G(x,y)=m) (1)
即,当F(x,y)=n的同时G(x,y)=m像素点个数。其中,预设亮度值n小于等于最大预设亮度级Vn,预设梯度值m小于等于最大预设梯度级Vg;Vn,Vg为正整数。通过公式(1)提取一个大小为[Vg、Vn]或者[Vn、Vg]的亮度-梯度共生矩阵。
步骤211、将每个候选子图对应的亮度-梯度共生矩阵转换为每个候选子图的特征向量。
在本步骤中,为了计算方便,可以将步骤210中获取到的亮度-梯度共生矩阵连接成为一个特征向量,从而得到表征每个候选子图图像特征的各自的特征向量。
步骤212、基于贝叶斯分类器,对每个候选子图的特征向量进行识别,并基于投票机制对识别结果进行判断,确定出待分类图像的图像类别。
在本步骤中,通过分别获取一定数量的不同类别的样本图像,按照上述步骤201~步骤211的方法提取每个样本图像对应的特征向量,并利用朴素贝叶斯分类器对各个样本图像进行训练,得到训练好的贝叶斯分类器,然后采用该训练好的贝叶斯分类器对上述各个候选子图进行分类,若对一张待分类图像中各个候选子图得到的分类结果不同,则可以利用"投票机制"进行最终的类别判定。如图3所示,图3为本发明图2所示实施例中投票机制的示意图,对各个分类结果(分类结果1、分类结果2、分类结果3)进行投票,票数多者为最终确定的待分类图像的图像类别。
实施例三
图4为本发明另一示例性实施例提供的图像分类方法的流程示意图,如图4所示,在上述实施例的基础上,为了可以进一步地提升图像分类的效率,可以对待分类图像进行分步识别。例如,对待分类图像先采用如下步骤401至步骤405进行识别,若未能识别出待分类图像的图像类别,则可以继续采用步骤407至步骤410的方法,也就是采用实施例一和/或实施例二中的方法进行进一步地精细识别。这样可以在保证识别准确率的基础上提升识别效率。下面具体阐述步骤401至步骤405的识别分类方法,步骤407至步骤410的实现原理与实施例一和实施例二类似,在该实施例中不再赘述。本实施例的图像分类方法,具体包括:
步骤401、对待分类图像进行图像预处理,得到图像预处理后的待分类图像。
该步骤的实现方式与步骤201的实现方式相同,在此不再赘述。
步骤402、根据预设目标区域,在图像预处理后的待分类图像中提取与预设目标区域对应的目标子图。
在本步骤中,所谓预设目标区域为可能包含有标识待分类图像的类别信息的区域;例如,对于待分类图像为票据类的图像,其图像构图的上方且中心的位置可能会出现标识其为发票信息的印章,如“全国统一发票监制章”的红章;通过将该区域设定为预设目标区域可以快速在待分类图像中提取到可以标识各个待分类图像身份的信息。再例如银行卡类图像,其图像构图的左上角、右下角等位置可能会出现银行名称的标识,则可以把这些区域设定为预设的目标区域。在经过步骤401预处理后的标准图像中,选取图像的显著区域进行分割提取出与预设目标区域对应的目标子图,该预设目标区域中通常包含有显著的标识信息,该标识信息可以显性的与其他类别的图像进行区分,从而通过提取与预设目标区域对应的目标子图,提升后续图像类别识别的效率及准确率。
步骤403、将目标子图由RGB颜色空间转换到灰度图空间。
在本步骤中,将提取出的目标子图从RGB颜色空间转换到灰度图空间,转换公式如公式(7)所示:
Gray=R*0.299+G*0.587+B*0.114 (7)
其中R,G,B,分别表示RGB颜色空间上红色通道、绿色通道、蓝色通道的值,Gray表示转换后的灰色图空间的取值。
步骤404、基于Laplacian增强算子,对转换到灰度图空间后的目标子图进行锐化处理。
在本步骤中,采用Laplacian增强算子对灰度图像进行锐化处理的计算公式可以为:
将公式(8)以矩阵空间进行表示,可以为:通过采用Laplacian增强算子对灰度图像进行锐化处理既可以产生拉普拉斯锐化处理的效果,同时又能保留目标子图中的背景信息,实现将原始图像(灰度处理后的目标子图)叠加到拉普拉斯变换的处理结果中去,可以使目标子图中的各灰度值得到保留、灰度突变处的对比度得到增强,最终结果是在保留图像背景的前提下,突现出图像中的细节。
步骤405、基于光学字符识别OCR模型,对锐化处理后的目标子图进行识别;若识别得到待分类图像的图像类别,则执行步骤406;若未能识别得到待分类图像的图像类别,则执行步骤407。
在执行本步骤之前,还可以包括对步骤404中得到的目标子图进行二值化处理,以进一步增强子图中的细节特征。优选的,二值化处理可以采取最大类间方差法对图像进行二值化操作并获得二值化后的目标子图。然后,将该二值化的目标子图输入事先训练好的光学字符识别(Optical CharacterRecognition,简称“OCR”)模型中进行识别,该OCR可以识别出图像中的文字信息,将该文字信息与预先的分类规则进行比对,例如,预先的分类规则为包含发票、国税、地税等文字的图像为发票类图像,则确定识别的结果与哪类分类规则对应,从而确定该待分类图像的图像类别,并将其保存到对应的影像库中,如果与待识别的类型都不一致,则转入步骤407继续进行二次分类。
步骤406、确定并输出待分类图像的图像类别。
步骤407、在图像预处理后的待分类图像中获取至少一个候选子图。
步骤408、确定每个候选子图的亮度矩阵和梯度矩阵。
步骤409、根据每个候选子图的亮度矩阵和梯度矩阵,确定同时满足预设亮度值及预设梯度值的像素点个数,形成每个候选子图对应的亮度-梯度共生矩阵。
步骤410、根据每个候选子图对应的亮度-梯度共生矩阵,确定出待分类图像的图像类别。
本实施例提供的图像分类方法,通过在待分类图像中提取目标子图,并对该目标子图进行灰度转换、锐化、二值化等处理,使得子图中的特征信息突显,并通过OCR光学字符识别对特征中包含的文字标识进行识别,以将识别出的文字标识与图像类别进行匹配,从而快速得到该待分类图像的类别信息,该方法仅对待分类图像中的显著区域即目标子图进行分析识别,可以大大提升识别的效率,随后对没有能够识别出的待分类图像再采用通过获取至少一个候选子图;确定每个候选子图的亮度矩阵和梯度矩阵;根据每个候选子图的亮度矩阵和梯度矩阵,确定同时满足预设亮度值及预设梯度值的像素点个数,形成每个候选子图对应的亮度-梯度共生矩阵;根据每个候选子图对应的亮度-梯度共生矩阵,确定出待分类图像的图像类别的方法,从而提取图像的亮度、梯度特征信息,并综合亮度-梯度特征对图像内的各个像素点进行统计分析,准确获取图像的纹理特征信息,提升了图像类型正确识别的准确率,该实施例对待识别图像采用两步识别方法,可以在保证识别准确性的前提下,提升识别效率,上述两步识别之间的先后顺序可以交换,例如,先执行步骤402至步骤405,再执行步骤407至步骤410;或者先执行步骤407至步骤410,再执行步骤402至步骤405都可以,本实施例对此不作具体限定。
实施例四
图5为本发明一示例性实施例提供的图像分类装置的结构示意图,如图5所示,本实施例提供一种图像分类装置,用于执行前述各个方法实施例所述的图像分类方法。该图像分类装置具体包括:
获取模块51,用于在待分类图像中获取至少一个候选子图。
确定模块52,用于确定每个候选子图的亮度矩阵和梯度矩阵;根据每个候选子图的亮度矩阵和梯度矩阵,确定同时满足预设亮度值及预设梯度值的像素点个数,形成每个候选子图对应的亮度-梯度共生矩阵;根据每个候选子图对应的亮度-梯度共生矩阵,确定出待分类图像的图像类别。
关于本实施例中的图像分类装置,其中各个模块执行操作的具体方式已经在前述方法实施例中进行了详细描述,其实现原理相类似,在此不再赘述。
本实施例提供的图像分类装置,通过在待分类图像中获取至少一个候选子图;确定每个候选子图的亮度矩阵和梯度矩阵;根据每个候选子图的亮度矩阵和梯度矩阵,确定同时满足预设亮度值及预设梯度值的像素点个数,形成每个候选子图对应的亮度-梯度共生矩阵;根据每个候选子图对应的亮度-梯度共生矩阵,确定出待分类图像的图像类别。该图像分类方法通过提取图像的亮度、梯度特征信息,并综合亮度-梯度特征对图像内的各个像素点进行统计分析,从而准确获取了图像的纹理特征信息,提升了图像类型正确识别的准确率,且该方法仅对候选子图进行特征信息分析,待分析的数据量较少,有效提升图像类型识别的效率。
实施例五
图6为本发明一示例性实施例提供的电子设备的结构示意图,如图6所示,该电子设备包括:存储器61、处理器62及存储在存储器61上并可在处理器62上运行的计算机程序,处理器62运行计算机程序时执行上述任一实施例所述的方法。
实施例六
本发明实施例提供一种电子设备可读存储介质,包括程序,当其在电子设备上运行时,使得电子设备执行上述任一实施例所述的方法。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (10)
1.一种图像分类方法,其特征在于,包括:
在待分类图像中获取至少一个候选子图;
确定每个候选子图的亮度矩阵和梯度矩阵;
根据每个候选子图的所述亮度矩阵和所述梯度矩阵,确定同时满足预设亮度值及预设梯度值的像素点个数,形成每个候选子图对应的亮度-梯度共生矩阵;
根据每个候选子图对应的亮度-梯度共生矩阵,确定出所述待分类图像的图像类别;
其中,所述根据每个候选子图对应的亮度-梯度共生矩阵,确定出所述待分类图像的图像类别,包括:
将每个候选子图对应的亮度-梯度共生矩阵转换为每个候选子图的特征向量;
基于贝叶斯分类器,对每个候选子图的所述特征向量进行识别,并基于投票机制对识别结果进行判断,确定出所述待分类图像的图像类别。
2.根据权利要求1所述的方法,其特征在于,所述在待分类图像中获取至少一个候选子图之前,还包括:
对所述待分类图像进行图像预处理,得到图像预处理后的待分类图像;
其中,所述预处理包括以下处理中的至少一种:尺寸归一化调整、图像位置校正、图像画面清晰度调整。
3.根据权利要求2所述的方法,其特征在于,所述在待分类图像中获取至少一个候选子图之前,还包括:
对所述图像预处理后的待分类图像进行灰度转换,得到灰度处理后的待分类图像;
对所述灰度处理后的待分类图像进行二值化处理,得到以二值化表示的待分类图像;
在所述以二值化表示的待分类图像中获取至少一个候选子图。
4.根据权利要求3所述的方法,其特征在于,所述在待分类图像中获取至少一个候选子图包括:
在所述以二值化表示的待分类图像中确定出至少一个图形轮廓;
确定包围所述图形轮廓的最小轮廓外接矩形;
若所述最小轮廓外接矩形小于预设矩形尺寸,则以所述图像轮廓区域的中心位置对应所述预设矩形尺寸的中心,从所述待分类图像中截取满足所述预设矩形尺寸且包围所述图形轮廓的图像,形成所述候选子图;
若所述最小轮廓外接矩形大于等于所述预设矩形尺寸,则从所述待分类图像中截取所述最小轮廓外接矩形所包围的图像,形成所述候选子图。
5.根据权利要求1所述的方法,其特征在于,所述确定每个候选子图的亮度矩阵和梯度矩阵包括:
确定每个候选子图中每个像素点的亮度值,形成每个候选子图的亮度矩阵;
根据每个候选子图的亮度矩阵,确定每个像素点在横向X方向上的梯度值,在纵向Y方向上的梯度值;
根据每个像素点在横向X方向上的梯度值,在纵向Y方向上的梯度值,形成每个候选子图的梯度矩阵。
6.根据权利要求5所述的方法,其特征在于,所述根据每个候选子图的所述亮度矩阵和所述梯度矩阵,确定同时满足预设亮度值及预设梯度值的像素点个数,形成每个候选子图对应的亮度-梯度共生矩阵,包括:
根据最大预设亮度级V1,对每个候选子图的所述亮度矩阵进行归一化处理,得到归一化处理后的亮度矩阵F(x,y);
根据最大预设梯度级V2,对每个候选子图的所述梯度矩阵进行归一化处理,得到归一化处理后的梯度矩阵G(x,y);
其中,(x,y)表示候选子图中像素点的位置;所述预设亮度值小于等于所述最大预设亮度级V1,所述预设梯度值小于等于所述最大预设梯度级V2;所述V1,所述V2为正整数;
确定同时满足预设亮度值及预设梯度值的像素点个数,形成每个候选子图对应的亮度-梯度共生矩阵[V1、V2];或者形成每个候选子图对应的亮度-梯度共生矩阵[V2、V1]。
7.根据权利要求2所述的方法,其特征在于,所述方法还包括:
根据预设目标区域,在所述图像预处理后的待分类图像中提取与所述预设目标区域对应的目标子图;
将所述目标子图由RGB颜色空间转换到灰度图空间;
基于Laplacian增强算子,对转换到灰度图空间后的目标子图进行锐化处理;
基于光学字符识别OCR模型,对锐化处理后的目标子图进行识别;
根据识别结果确定所述待分类图像的图像类别;
若未能识别得到所述待分类图像的图像类别,则执行所述在待分类图像中获取至少一个候选子图;确定每个候选子图的亮度矩阵和梯度矩阵;根据每个候选子图的所述亮度矩阵和所述梯度矩阵,确定同时满足预设亮度值及预设梯度值的像素点个数,形成每个候选子图对应的亮度-梯度共生矩阵;根据每个候选子图对应的亮度-梯度共生矩阵,确定出所述待分类图像的图像类别的步骤。
8.一种图像分类装置,其特征在于,包括:
获取模块,用于在待分类图像中获取至少一个候选子图;
确定模块,用于确定每个候选子图的亮度矩阵和梯度矩阵;根据每个候选子图的所述亮度矩阵和所述梯度矩阵,确定同时满足预设亮度值及预设梯度值的像素点个数,形成每个候选子图对应的亮度-梯度共生矩阵;根据每个候选子图对应的亮度-梯度共生矩阵,确定出所述待分类图像的图像类别;
其中,所述确定模块,具体用于将每个候选子图对应的亮度-梯度共生矩阵转换为每个候选子图的特征向量;基于贝叶斯分类器,对每个候选子图的所述特征向量进行识别,并基于投票机制对识别结果进行判断,确定出所述待分类图像的图像类别。
9.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,
所述处理器运行所述计算机程序时执行权利要求1~7任一项所述的图像分类方法。
10.一种电子设备可读存储介质,其特征在于,包括程序,当所述程序在电子设备上运行时,使得电子设备执行权利要求1~7任一项所述的图像分类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711348128.7A CN108090511B (zh) | 2017-12-15 | 2017-12-15 | 图像分类方法、装置、电子设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711348128.7A CN108090511B (zh) | 2017-12-15 | 2017-12-15 | 图像分类方法、装置、电子设备及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108090511A CN108090511A (zh) | 2018-05-29 |
CN108090511B true CN108090511B (zh) | 2020-09-01 |
Family
ID=62176669
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711348128.7A Active CN108090511B (zh) | 2017-12-15 | 2017-12-15 | 图像分类方法、装置、电子设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108090511B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110738603B (zh) * | 2018-07-18 | 2024-07-12 | 中国商用飞机有限责任公司 | 一种图像灰度处理方法、装置、计算机设备及存储介质 |
CN109447124B (zh) * | 2018-09-28 | 2019-11-19 | 北京达佳互联信息技术有限公司 | 图像分类方法、装置、电子设备及存储介质 |
CN109615536A (zh) * | 2018-12-13 | 2019-04-12 | 平安医疗健康管理股份有限公司 | 基于ocr技术的保险理赔方法、装置、设备及可读存储介质 |
CN109671079B (zh) * | 2018-12-25 | 2021-04-16 | 宁波智能装备研究院有限公司 | 一种基于灰度共生矩阵特征的瓦楞纸板智能检测方法 |
CN109685079B (zh) * | 2018-12-26 | 2021-03-02 | 网易(杭州)网络有限公司 | 一种特征图像类别信息的生成方法和装置 |
CN111489246A (zh) * | 2020-04-09 | 2020-08-04 | 贵州爱信诺航天信息有限公司 | 一种增值税发票电子化一体化入账的系统 |
CN111860657A (zh) * | 2020-07-23 | 2020-10-30 | 中国建设银行股份有限公司 | 一种图像分类方法、装置、电子设备及存储介质 |
CN114529771B (zh) * | 2022-02-23 | 2023-04-28 | 中国石油大学(华东) | 基于机器学习的页岩大视域图像分类方法 |
CN115438702A (zh) * | 2022-10-18 | 2022-12-06 | 国网山东省电力公司营销服务中心(计量中心) | 一种电力线载波信道噪声检测方法及系统 |
CN116152361B (zh) * | 2023-04-20 | 2023-07-07 | 高视科技(苏州)股份有限公司 | 用于估算色度的方法、电子设备及计算机可读存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101957313A (zh) * | 2010-09-21 | 2011-01-26 | 吉林大学 | 鲜玉米果穗质量的计算机视觉检测分级方法及装置 |
CN102663377A (zh) * | 2012-03-15 | 2012-09-12 | 华中科技大学 | 一种基于模板匹配的字符识别方法 |
CN104215584A (zh) * | 2014-08-29 | 2014-12-17 | 华南理工大学 | 一种基于高光谱图像技术区分大米产地的检测方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005505870A (ja) * | 2001-10-11 | 2005-02-24 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 画像の異なる領域を識別をするための方法及び装置 |
TWI406571B (zh) * | 2010-01-29 | 2013-08-21 | Corel Inc | Image Processing Method for Enhancing Image Edge Resolution |
JP5781743B2 (ja) * | 2010-06-28 | 2015-09-24 | ソニー株式会社 | 画像処理装置、画像処理方法及び画像処理プログラム |
CN105005989B (zh) * | 2015-06-30 | 2018-02-13 | 长安大学 | 一种弱对比度下的车辆目标分割方法 |
-
2017
- 2017-12-15 CN CN201711348128.7A patent/CN108090511B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101957313A (zh) * | 2010-09-21 | 2011-01-26 | 吉林大学 | 鲜玉米果穗质量的计算机视觉检测分级方法及装置 |
CN102663377A (zh) * | 2012-03-15 | 2012-09-12 | 华中科技大学 | 一种基于模板匹配的字符识别方法 |
CN104215584A (zh) * | 2014-08-29 | 2014-12-17 | 华南理工大学 | 一种基于高光谱图像技术区分大米产地的检测方法 |
Non-Patent Citations (2)
Title |
---|
一种利用纹理特征和朴素贝叶斯分类器检测近景影像植被的方法;詹总谦等;《武汉大学学报·信息科学版》;20130630;第38卷(第6期);第665-668 * |
基于灰度—梯度共生矩阵的图像型垃圾邮件识别方法;冯兵等;《通信学报》;20130930;第34卷(第Z2期);第1-4页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108090511A (zh) | 2018-05-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108090511B (zh) | 图像分类方法、装置、电子设备及可读存储介质 | |
US8638993B2 (en) | Segmenting human hairs and faces | |
CN110569878A (zh) | 一种基于卷积神经网络的照片背景相似度聚类方法及计算机 | |
CN110119741A (zh) | 一种有背景的卡证图像信息识别方法 | |
CN111222433B (zh) | 自动人脸稽核方法、系统、设备及可读存储介质 | |
CN109948625A (zh) | 文本图像清晰度评估方法及系统、计算机可读存储介质 | |
CN109740572A (zh) | 一种基于局部彩色纹理特征的人脸活体检测方法 | |
CN111680690A (zh) | 一种文字识别方法及装置 | |
CN112329779A (zh) | 一种基于mask提高证件识别准确率的方法和相关装置 | |
CN111860369A (zh) | 一种欺诈识别方法、装置以及存储介质 | |
CN108830175A (zh) | 虹膜图像局部增强方法、装置、设备及存储介质 | |
CN111259891B (zh) | 一种自然场景下身份证识别方法、装置、设备和介质 | |
CN114444565B (zh) | 一种图像篡改检测方法、终端设备及存储介质 | |
CN112507782A (zh) | 文本图像的识别方法及装置 | |
CN112396050B (zh) | 图像的处理方法、设备以及存储介质 | |
CN110991434B (zh) | 自助终端证件识别方法及装置 | |
CN110909568A (zh) | 用于面部识别的图像检测方法、装置、电子设备及介质 | |
CN108877030B (zh) | 图像处理方法、装置、终端和计算机可读存储介质 | |
CN109784379B (zh) | 纺织品图片特征库的更新方法和装置 | |
CN111709305A (zh) | 一种基于局部图像块的人脸年龄识别方法 | |
Nguyen et al. | Using contextual information to classify nuclei in histology images | |
CN110569716A (zh) | 一种货架图像翻拍检测方法 | |
CN112883959B (zh) | 身份证照完整性检测方法、装置、设备及存储介质 | |
CN108090728B (zh) | 一种基于智能终端的快递信息录入方法及录入系统 | |
CN111507119A (zh) | 标识码识别方法、装置、电子设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |