CN109740679A - 一种基于卷积神经网络和朴素贝叶斯的目标识别方法 - Google Patents
一种基于卷积神经网络和朴素贝叶斯的目标识别方法 Download PDFInfo
- Publication number
- CN109740679A CN109740679A CN201910013650.2A CN201910013650A CN109740679A CN 109740679 A CN109740679 A CN 109740679A CN 201910013650 A CN201910013650 A CN 201910013650A CN 109740679 A CN109740679 A CN 109740679A
- Authority
- CN
- China
- Prior art keywords
- convolutional neural
- neural network
- layer
- training
- neural networks
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013527 convolutional neural network Methods 0.000 title claims abstract description 40
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000012549 training Methods 0.000 claims abstract description 27
- 238000012360 testing method Methods 0.000 claims abstract description 9
- 238000013519 translation Methods 0.000 claims abstract description 4
- 238000011176 pooling Methods 0.000 claims description 12
- 230000004913 activation Effects 0.000 claims description 3
- 210000002569 neuron Anatomy 0.000 claims description 3
- 238000002474 experimental method Methods 0.000 abstract description 4
- 238000003909 pattern recognition Methods 0.000 abstract description 3
- 238000012545 processing Methods 0.000 abstract description 2
- 230000006641 stabilisation Effects 0.000 abstract 1
- 238000011105 stabilization Methods 0.000 abstract 1
- 238000007781 pre-processing Methods 0.000 description 7
- 238000004088 simulation Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 241000755937 Corinna Species 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Landscapes
- Image Analysis (AREA)
- Character Discrimination (AREA)
Abstract
本发明涉及基于卷积神经网络和朴素贝叶斯的目标识别方法,属于图片处理与模式识别领域,其特征在于采用如下步骤:(1)确定训练集样本A中图片像素点平移和归一化后的坐标(x′,y′),得到新的训练集A″;(2)训练卷积神经网络,更新连接权值ωi;(3)提取特征向量X;(4)将特征向量X作为朴素贝叶斯模型的输入,建立朴素贝叶斯模型进行训练;(5)将测试集样本作为输入,送到组合网路中进行分类,得到分类结果。本发明所建立的基于卷积神经网络和朴素贝叶斯的目标识别方法用朴素贝叶斯替换了传统卷积神经网络中的Softmax分类器实现了分类预测,充分利用了卷积神经网络全连接层输出的特征向量的特征信息。通过多组数据实验可知该方法计算精确、可靠,数据结果相对稳定,为图片目标识别提供了在保证了分类准确的基础上的稳定识别方法。
Description
技术领域
本发明涉及图片处理与模式识别领域,主要是一种对图片目标进行识别的方法。
背景技术
目前针对图片目标的识别问题,大多数技术无法完成较高的准确率,并且不稳定,鲁棒性较差。有些技术虽然可以达到较高的准确率,却需要经过一些复杂的预处理操作步骤。以手写数字识别为例,手写数字图片往往要进行扭曲变形来扩充训练集、模拟各种抖动操作来对图像进行预处理等操作,这样虽然可以达到较高的准确率,但是在一定程度上降低了实用性,而且不能满足稳定性要求。在经典的模式识别中,一般是事先提取特征,提取诸多特征后,要对这些特征进行相关性分析,找到最能代表字符的特征,去掉对分类无关的特征。然而,这些特征的提取过于依赖人的经验和主观意识,提取到的特征的不同分类性能影响很大,甚至提取的特征的顺序也会影响最后的分类性能。同时,图像预处理的好坏也会影响到提取的特征。
目前,图片目标中的数字识别技术往往与经济和商业相联系,投入使用的技术必须保证有较高的准确率,因为如果识别错误,即使是极小的错误,也可能会引发一系列的商业纠纷,甚至带来巨大的损失,造成无法挽回的结果。因此在研究和开发的过程中,为了避免一系列问题的出现,必须建立一种精确、可靠的手写数字识别模型,使得模型在对手写数字进行识别的时候,同时满足较高的准确率和较强的鲁棒性,达到经济和商业等领域中对手写数字识别的要求,从而节约时间、金钱,提高效率、节省成本。
发明内容
针对上述现有技术中存在的问题,本发明要解决的技术问题是提供一种精确、稳定的图片目标识别方法,其具体流程如图1所示。
技术方案实施步骤如下:
(1)确定训练集样本A中图片像素点平移和归一化后的坐标(x′,y′),得到新的训练集A″:
根据样本集中图片像素点的原坐标(x0,y0)、平移操作后像素点的最大值xmax、最小值xmin,dx、dy分别代表像素点在x轴和y轴上移动的大小,确定训练样本集像素点的坐标:
(2)训练卷积神经网络,更新连接权值wi:
构建卷积神经网络,设置卷积神经网络的卷积层个数m、池化层个数n、卷积层卷积核大小(s1,s2,...,sm)、池化层大小(t1,t2,...,tm)、卷积层步长r1、池化层步长r2、全连接层神经元个数N、激活函数f以及迭代次数l。采用反向传播算法及BP算法对卷积神经网络中的连接权值wi进行更新:
其中,为实际输出值,yi为理想输出值,η为每次更新的步长。
(3)提取特征向量X:
将卷积神经网络全连接层前边的卷积层和池化层交替连接的部分保留,去掉全连接层后面的Softmax层,将卷积神经网络的全连接层记为C。则卷积神经网络模型训练结束后,全连接层C的输出即为提取的特征向量X。
(4)将上一步骤得到的特征向量X作为朴素贝叶斯模型的输入,建立朴素贝叶斯模型进行训练,实现不同训练样本的分类。朴素贝叶斯法则如下:
其中Ci为类别,P(Ci|xi)表示在具有xi特征下被分为Ci的概率。
(5)将测试集样本作为输入,送到组合网路中进行分类,得到分类结果,完成基于卷积神经网络和朴素贝叶斯的图片目标识别。
本发明比现有技术具有的优点:
(1)本发明采用了将卷积神经网络与朴素贝叶斯组合的方式,用朴素贝叶斯替换了传统卷积神经网络中的Softmax分类器实现了分类预测,充分利用了卷积神经网络全连接层输出的特征向量的特征信息,提高了准确率。
(2)本发明不需要对图像进行复杂的预处理操作,在用卷积神经网络进行特征提取的时候,只需要对图像进行归一化操作,简化了繁琐的预处理流程。
(3)本发明对多组数据进行实验,实验结果与现有技术相比都取得了比较明显的优势,并且数据结果相对稳定。这说明本发明在保证了分类准确的基础上提高了模型的稳定性,能够更好的完成图片目标识别任务。
为了更好地理解本发明,下面结合附图作进一步的说明。
图1是建立基于卷积神经网络和朴素贝叶斯的目标识别模型的步骤流程图;
图2是建立基于卷积神经网络和朴素贝叶斯的目标识别模型的算法流程图;
图3是手写数字图片MNIST数据集中的样例;
图4是简易的神经网络结构图;
图5是卷积神经网络的结构图;
图6是本发明的组合网路结构示意图;
图7是多种模型实验结果对比;
图8是多组仿真实验结果对比;
具体实施方案
下面通过实施案例对本发明作进一步详细说明。
以手写数字识别为例,选用的数据集是MNIST公开数据集,MNIST数据集中的样例如图3所示,该数据集是由Google实验室的Corinna Cortes和纽约大学柯朗研究所的YannLeCun建立的一个手写数字数据库。将图2所示的手写数字图片作为原始的手写数字图片数据集,一部分标记为训练集,一部分标记为测试集,共有60000个训练样本集和10000个测试样本集。图片大小均为28X28。
本发明所提供的手写数字识别方法整体流程如图1所示,具体步骤如下:
(1)确定训练集样本A中图片像素点平移和归一化后的坐标(x′,y′),得到新的训练集A′:
根据样本集中图片像素点的原坐标(x0,y0)、平移操作后像素点的最大值xmax、最小值xmin,确定训练样本集像素点的坐标:
(2)训练卷积神经网络,更新连接权值wi:
构建卷积神经网络,设置卷积神经网络的卷积层个数m为2、池化层个数n为2、卷积层卷积核个数为32和64、池化层核个数为32和32、卷积层步长r1为1、池化层步长r2为2、全连接层神经元个数N为200、激活函数f(x)采用ReLu函数以及迭代次数l为30。采用反向传播算法及BP算法对卷积神经网络中的连接权值wi进行更新:
f(x)=max(0,x)
其中,为实际输出值,yi为理想输出值,η为每次更新的步长。
(3)提取特征向量X:
将卷积神经网络全连接层前边的卷积层和池化层交替连接的部分保留,去掉全连接层后面的Softmax层,将卷积神经网络的全连接层记为C。模型训练结束后,全连接层C的输出即为提取的特征向量X。
(4)将上一步骤得到的特征向量X作为朴素贝叶斯模型的输入,建立朴素贝叶斯模型进行训练,实现不同训练样本的分类。朴素贝叶斯法则如下:
其中Ci为类别0、1、2、3、4、5、6、7、8、9,P(Ci|xi)表示在具有xi特征下被分为这10种类别的概率。
(5)将测试集样本作为输入,送到组合网路中进行分类,得到分类结果,完成基于卷积神经网络和朴素贝叶斯的手写数字识别。
为了验证本发明对图片目标识别的准确性,对本发明进行了多组手写数字识别仿真实验,并将结果与一些识别手写数字的模型算法进行了对比,仿真结果如表1和表2所示。由仿真结果可以看出,本发明所建立的手写数字识别方法不用经过复杂的预处理就能达到较高的准确率,并且在保证不降低准确率的情况下,具有较好的稳定性。
表1多种模型实验结果对比
实验方法 | 识别准确率(%) |
基于卷积神经网络的手写数字识别 | 99.20 |
Maxout network | 99.55 |
基于卷积神经网络和支持向量机的手写数字识别 | 99.60 |
本发明 | 99.80 |
由仿真结果表1可知,在使用同样数据集的情况下,本发明通过简单的图片像素归一化预处理以后,识别准确率可以达到99.8%。与其他三种方法相比,具有更高的准确率。这表明本发明建立的目标识别方法是精确的,为建立精确的图片目标识别模型提供了有效的方法,更适用于实际中使用。
表2多组仿真实验对比
序号 | 识别准确率(%) |
1 | 99.70 |
2 | 99.77 |
3 | 99.75 |
4 | 99.82 |
5 | 99.85 |
由仿真结果表2可知,在用同一数据集进行多组实验后,识别准确率在99.7%-99.9%之间,波动范围仅为0.2%,这表明本发明建立的目标识别方法在保持较高准确率的基础上,具有较高的稳定性,可以满足多数场景下的手写数字识别。本发明所采用的方法是精确的、可靠的,为建立精确的图片目标识别模型提供了可靠的方法。
Claims (1)
1.一种基于卷积神经网络和朴素贝叶斯的目标识别方法,其具体识别步骤如下:
(1)确定训练集样本A中图片像素点平移和归一化后的坐标(x′,y′),得到新的训练集A″:
根据样本集中图片像素点的原坐标(x0,y0)、平移操作后像素点的最大值xmax、最小值xmin,dx、dy分别代表像素点在x轴和y轴上移动的大小,确定训练样本集像素点的坐标:
(2)训练卷积神经网络,更新连接权值ωi:
构建卷积神经网络,设置卷积神经网络的卷积层个数m、池化层个数n、卷积层卷积核大小(s1,s2,...,sm)、池化层大小(t1,t2,...,tm)、卷积层步长r1、池化层步长r2、全连接层神经元个数N、激活函数f以及迭代次数l,采用反向传播算法及BP算法对卷积神经网络中的连接权值ωi进行更新:
其中,为实际输出值,yi为理想输出值,η为每次更新的步长;
(3)提取特征向量X:
将卷积神经网络全连接层前边的卷积层和池化层交替连接的部分保留,去掉全连接层后面的Softmax层,将卷积神经网络的全连接层记为C,则卷积神经网络模型训练结束后,全连接层C的输出即为提取的特征向量X;
(4)将上一步骤得到的特征向量X作为朴素贝叶斯模型的输入,建立朴素贝叶斯模型进行训练,实现不同训练样本的分类,朴素贝叶斯法则如下:
其中Ci为类别,P(Ci|xi)表示在具有xi特征下被分为Ci的概率;
(5)将测试集样本作为输入,送到组合网路中进行分类,得到分类结果,完成基于卷积神经网络和朴素贝叶斯的图片目标识别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910013650.2A CN109740679B (zh) | 2019-01-13 | 2019-01-13 | 一种基于卷积神经网络和朴素贝叶斯的目标识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910013650.2A CN109740679B (zh) | 2019-01-13 | 2019-01-13 | 一种基于卷积神经网络和朴素贝叶斯的目标识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109740679A true CN109740679A (zh) | 2019-05-10 |
CN109740679B CN109740679B (zh) | 2020-10-30 |
Family
ID=66363723
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910013650.2A Expired - Fee Related CN109740679B (zh) | 2019-01-13 | 2019-01-13 | 一种基于卷积神经网络和朴素贝叶斯的目标识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109740679B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110210682A (zh) * | 2019-06-12 | 2019-09-06 | 云南电网有限责任公司大理供电局 | 基于负载数据图像化卷积神经网络的配变重过载预警方法 |
CN110515836A (zh) * | 2019-07-31 | 2019-11-29 | 杭州电子科技大学 | 一种面向软件缺陷预测的加权朴素贝叶斯方法 |
CN110533629A (zh) * | 2019-07-10 | 2019-12-03 | 湖南交工智能技术有限公司 | 一种桥梁裂缝的检测方法及检测装置 |
CN111343848A (zh) * | 2019-12-01 | 2020-06-26 | 深圳市智微智能软件开发有限公司 | Smt位置检测方法及系统 |
CN111524092A (zh) * | 2020-03-16 | 2020-08-11 | 中国农业科学院茶叶研究所 | 一种红茶萎凋程度指标的无损检测方法 |
CN112836571A (zh) * | 2020-12-18 | 2021-05-25 | 华中科技大学 | 遥感sar图像中的舰船目标检测识别方法、系统及终端 |
CN112949446A (zh) * | 2021-02-25 | 2021-06-11 | 山东英信计算机技术有限公司 | 一种物体识别方法、装置、设备及介质 |
CN113705594A (zh) * | 2020-05-21 | 2021-11-26 | 北京沃东天骏信息技术有限公司 | 一种识别图像的方法和装置 |
CN118277843A (zh) * | 2024-06-04 | 2024-07-02 | 之江实验室 | 一种多模态网络流量分类方法、装置和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105046268A (zh) * | 2015-06-18 | 2015-11-11 | 西安电子科技大学 | 基于Wishart深度网络的极化SAR图像分类方法 |
CN106407883A (zh) * | 2016-08-10 | 2017-02-15 | 北京工业大学 | 一种复杂表格及其内部手写数字识别方法 |
CN108960001A (zh) * | 2017-05-17 | 2018-12-07 | 富士通株式会社 | 训练用于人脸识别的图像处理装置的方法和装置 |
CN109670528A (zh) * | 2018-11-14 | 2019-04-23 | 中国矿业大学 | 面向行人重识别任务的基于成对样本随机遮挡策略的数据扩充方法 |
CN109741288A (zh) * | 2019-01-04 | 2019-05-10 | Oppo广东移动通信有限公司 | 图像处理方法、装置、存储介质及电子设备 |
-
2019
- 2019-01-13 CN CN201910013650.2A patent/CN109740679B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105046268A (zh) * | 2015-06-18 | 2015-11-11 | 西安电子科技大学 | 基于Wishart深度网络的极化SAR图像分类方法 |
CN106407883A (zh) * | 2016-08-10 | 2017-02-15 | 北京工业大学 | 一种复杂表格及其内部手写数字识别方法 |
CN108960001A (zh) * | 2017-05-17 | 2018-12-07 | 富士通株式会社 | 训练用于人脸识别的图像处理装置的方法和装置 |
CN109670528A (zh) * | 2018-11-14 | 2019-04-23 | 中国矿业大学 | 面向行人重识别任务的基于成对样本随机遮挡策略的数据扩充方法 |
CN109741288A (zh) * | 2019-01-04 | 2019-05-10 | Oppo广东移动通信有限公司 | 图像处理方法、装置、存储介质及电子设备 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110210682A (zh) * | 2019-06-12 | 2019-09-06 | 云南电网有限责任公司大理供电局 | 基于负载数据图像化卷积神经网络的配变重过载预警方法 |
CN110533629A (zh) * | 2019-07-10 | 2019-12-03 | 湖南交工智能技术有限公司 | 一种桥梁裂缝的检测方法及检测装置 |
CN110515836B (zh) * | 2019-07-31 | 2023-08-11 | 杭州电子科技大学 | 一种面向软件缺陷预测的加权朴素贝叶斯方法 |
CN110515836A (zh) * | 2019-07-31 | 2019-11-29 | 杭州电子科技大学 | 一种面向软件缺陷预测的加权朴素贝叶斯方法 |
CN111343848A (zh) * | 2019-12-01 | 2020-06-26 | 深圳市智微智能软件开发有限公司 | Smt位置检测方法及系统 |
CN111343848B (zh) * | 2019-12-01 | 2022-02-01 | 深圳市智微智能软件开发有限公司 | Smt位置检测方法及系统 |
CN111524092A (zh) * | 2020-03-16 | 2020-08-11 | 中国农业科学院茶叶研究所 | 一种红茶萎凋程度指标的无损检测方法 |
CN111524092B (zh) * | 2020-03-16 | 2024-03-12 | 中国农业科学院茶叶研究所 | 一种红茶萎凋程度指标的无损检测方法 |
CN113705594A (zh) * | 2020-05-21 | 2021-11-26 | 北京沃东天骏信息技术有限公司 | 一种识别图像的方法和装置 |
CN113705594B (zh) * | 2020-05-21 | 2024-05-21 | 北京沃东天骏信息技术有限公司 | 一种识别图像的方法和装置 |
CN112836571A (zh) * | 2020-12-18 | 2021-05-25 | 华中科技大学 | 遥感sar图像中的舰船目标检测识别方法、系统及终端 |
CN112949446A (zh) * | 2021-02-25 | 2021-06-11 | 山东英信计算机技术有限公司 | 一种物体识别方法、装置、设备及介质 |
CN118277843A (zh) * | 2024-06-04 | 2024-07-02 | 之江实验室 | 一种多模态网络流量分类方法、装置和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109740679B (zh) | 2020-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109740679B (zh) | 一种基于卷积神经网络和朴素贝叶斯的目标识别方法 | |
CN108960141B (zh) | 基于增强型深度卷积神经网络的行人再识别方法 | |
CN108681752B (zh) | 一种基于深度学习的图像场景标注方法 | |
CN107529650B (zh) | 闭环检测方法、装置及计算机设备 | |
CN105138973B (zh) | 人脸认证的方法和装置 | |
US20190228268A1 (en) | Method and system for cell image segmentation using multi-stage convolutional neural networks | |
CN110619059B (zh) | 一种基于迁移学习的建筑物标定方法 | |
CN113222011B (zh) | 一种基于原型校正的小样本遥感图像分类方法 | |
CN110717526A (zh) | 一种基于图卷积网络的无监督迁移学习方法 | |
CN112070768B (zh) | 基于Anchor-Free的实时实例分割方法 | |
CN111639564B (zh) | 一种基于多注意力异构网络的视频行人重识别方法 | |
CN109033978B (zh) | 一种基于纠错策略的cnn-svm混合模型手势识别方法 | |
CN112784929B (zh) | 一种基于双元组扩充的小样本图像分类方法及装置 | |
CN110210538A (zh) | 一种家居图像多目标识别方法及装置 | |
CN112967210B (zh) | 一种基于全卷积孪生网络的无人机图像去噪方法 | |
CN111259917B (zh) | 一种基于局部近邻成分分析的图像特征提取方法 | |
CN115035418A (zh) | 一种基于改进DeepLabV3+网络的遥感图像语义分割方法及系统 | |
CN114219824A (zh) | 基于深度网络的可见光-红外目标跟踪方法及系统 | |
CN113673482A (zh) | 基于动态标签分配的细胞抗核抗体荧光识别方法及系统 | |
CN112232395B (zh) | 一种基于联合训练生成对抗网络的半监督图像分类方法 | |
CN116071331A (zh) | 一种基于改进ssd算法的工件表面缺陷检测方法 | |
CN113033345B (zh) | 基于公共特征子空间的v2v视频人脸识别方法 | |
Sun et al. | Deep learning based pedestrian detection | |
WO2024060839A1 (zh) | 对象操作方法、装置、计算机设备以及计算机存储介质 | |
CN111582202A (zh) | 一种智能网课系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20201030 Termination date: 20220113 |