CN104067314A - 人形图像分割方法 - Google Patents
人形图像分割方法 Download PDFInfo
- Publication number
- CN104067314A CN104067314A CN201480000254.1A CN201480000254A CN104067314A CN 104067314 A CN104067314 A CN 104067314A CN 201480000254 A CN201480000254 A CN 201480000254A CN 104067314 A CN104067314 A CN 104067314A
- Authority
- CN
- China
- Prior art keywords
- humanoid
- image
- pixel
- human
- pixels
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000003709 image segmentation Methods 0.000 title abstract description 8
- 238000012549 training Methods 0.000 claims abstract description 22
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 14
- 238000013528 artificial neural network Methods 0.000 claims abstract description 11
- 239000000284 extract Substances 0.000 claims description 15
- 238000005192 partition Methods 0.000 claims description 11
- 238000012360 testing method Methods 0.000 claims description 9
- 210000004218 nerve net Anatomy 0.000 claims description 3
- 230000007935 neutral effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 3
- 230000005284 excitation Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/143—Segmentation; Edge detection involving probabilistic approaches, e.g. Markov random field [MRF] modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/192—Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
- G06V30/194—References adjustable by an adaptive method, e.g. learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/248—Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
- G06V30/2504—Coarse or fine approaches, e.g. resolution of ambiguities or multiscale approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/103—Static body considered as a whole, e.g. static pedestrian or occupant recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20016—Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20021—Dividing image into blocks, subimages or windows
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20076—Probabilistic image processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Probability & Statistics with Applications (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Computational Mathematics (AREA)
- Biodiversity & Conservation Biology (AREA)
- Human Computer Interaction (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种人形图像分割方法,方法包括:对训练人形图像的所有第一像素点,提取多尺度上下文信息;将所有第一像素点的所有尺度的图像块送入同一个卷积神经网络,形成多通道的卷积神经网络群,每一个通道对应一个尺度的图像块;采用反向传播算法来训练神经网络群,得到人形图像分割训练模型数据;对测试人形图像的所有第二像素点,提取多尺度上下文信息;每一个第二像素点的不同尺度的图像块送入与人形图像分割训练模型相对应的神经网络通道,如果第一概率大于第二概率,则第二像素点属于人形区域内,反之则第二像素点属于人形区域外。本发明人形图像分割方法,图像分割速度快,精确度高。
Description
技术领域
本发明涉及模式识别领域,尤其涉及一种基于多尺度上下文深度学习的人形图像分割方法。
背景技术
在图像目标分割方法中,现有的分割方法是建立每一个像素点与其临近像素点的关系,并采用图模型来建模该关系。当邻近像素点个数太少时(例如基于图模型的方法考虑邻近几个或十几个像素点),则无法形成有语义的分割;而当考虑的邻近像素点个数较多时,计算复杂度非常高,而且很可能模型难以收敛。
发明内容
本发明的目的是针对现有技术的缺陷,提供一种人形图像分割方法,采用人形区域内像素点的多尺度上下文信息来表达人形目标;通过多通道深度学习网络来描述人形局部区域的不同尺度上下文信息。
为实现上述目的,本发明提供了一种人形图像分割方法,所述方法包括:
步骤S1,对训练人形图像的所有第一像素点,提取多尺度上下文信息;
步骤S2,将所有所述第一像素点的所有尺度的图像块送入同一个卷积神经网络,形成多通道的卷积神经网络群,每一个通道对应一个尺度的图像块;
步骤S3,采用反向传播算法来训练所述神经网络群,得到人形图像分割训练模型数据;
步骤S4,对测试人形图像的所有第二像素点,提取多尺度上下文信息;
步骤S5,每一个所述第二像素点的不同尺度的图像块送入与人形图像分割训练模型相对应的神经网络通道,所有所述神经网通道在全连接层融合在一起,在全连接层的最后一层的第一节点输出第一值,第二节点输出第二值,所述第一值表示所述第二像素点属于人形区域内的第一概率,所述第二值表示所述第二像素点属于人形区域外的概率;如果所述第一概率大于所述第二概率,则所述第二像素点属于人形区域内,反之则所述第二像素点属于人形区域外。
进一步的,所述步骤S1具体包括:对训练人形图像的人形区域内和区域外的所有第一像素点,以所述第一像素点为中心提取不同尺度的图像块。
进一步的,所述步骤S2中所述多通道的卷积神经网络群在全连接层融合在一起;所述全连接层的最后一层为输出层,并包括第一节点和第二节点,所有人形区域内的像素点的输出对应所述第一节点,所有人形区域外的像素点的输出对应所述第二节点。
进一步的,所述步骤S4具体包括:对测试人形图像的所有第二像素点,以所述像第二素点为中心提取不同尺度的图像块。
本发明人形图像分割方法,图像分割速度快,精确度高。
附图说明
图1为本发明人形图像分割方法的流程图;
图2为本发明人形图像分割方法的示意图。
具体实施方式
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
深度学习理论是在语音识别、图像目标分类与检测等领域都取得了非常好的结果。并且基于该理论的技术很容易被扩展成不同类型的应用。
一种基于多尺度上下文深度学习的人形图像分割方法采用深度学习技术来描述每一个像素点与周围大范围像素点(可以超过一万个像素点)的关系,并且采用卷积神经网络来建模这些关系,取得了非常好的人形图像分割结果。
图1为本发明人形图像分割方法的流程图,如图所示,本发明具体包括如下步骤:
步骤101,对训练人形图像的所有第一像素点,提取多尺度上下文信息;
具体的,对训练人形图像的人形区域内和区域外的所有第一像素点,以所述第一像素点为中心提取不同尺度的图像块。
步骤102,将所有第一像素点的所有尺度的图像块送入同一个卷积神经网络,形成多通道的卷积神经网络群,每一个通道对应一个尺度的图像块;
因为第一像素点可能有多个,而每一个第一像素点提取的图像块的尺度也会不同,在将图像块送入卷积神经网络的时候,因为每一个通道对应一个尺度的图像块,所以每一个通道对应的图像块的尺度也不同,而进入该通道的图像块的尺度是相同的。
步骤102中所述多通道的卷积神经网络群在全连接层融合在一起;所述全连接层的最后一层为输出层,并包括第一节点和第二节点,所有人形区域内的像素点的输出对应所述第一节点,所有人形区域外的像素点的输出对应所述第二节点。
例如,每一个通道的深度神经网络的参数配置为:第一层有48个5×5的卷积子,步长为1,带有3×3步长为2的空间聚集层;第二层有128个5×5的卷积子,步长为1,带有3×3步长为2的空间聚集层;第三层有192个卷积子,步长为1;第四层有192个卷积子,步长为1;第五层有128个卷积子,步长为1,带有3×3步长为2的空间聚集层。全连接层的参数配置为:第六层有1024个节点;第七层有1024个节点;第八层中有两个节点第一节点和第二节点,分别对应人形区域内和人形区域外。
步骤103,采用反向传播(back-propagation,BP)算法来训练所述神经网络群,得到人形图像分割训练模型数据;
该BP算法主要用于多层模型的训练,其主体是激励传播以及权重更新两个环节的反复迭代,直至达到收敛条件时停止。在激励传播阶段,先将训练样本送入网络获得激励响应,然后将响应与训练样本对应的目标输出求差,从而获得输出层与监督层的误差。在权重更新阶段,先将已知误差与本层响应对前一层响应的函数的导数相乘,从而获得两层之间权重矩阵的梯度,然后沿这个梯度的反方向以某个比例调整权重矩阵。随后,将该梯度当作前一层的误差从而计算前一层的权重矩阵。以此类推完成对整个模型的更新。
参见图2所示,为本发明人形图像分割方法的示意图,步骤101、102和103为训练阶段,首先需要有一定量(比如5000张图像)的样本标注用于训练模型。在本实施例中,样本指的是对行人区域的每一个像素点标注为1,对其他区域标注为0。
具体的,对5000张图像的每一个像素点提取三个尺度(比如224*224,112*112,56*56)上下文信息,即以该像素点为中心提取三个尺度的图像块。送入网络之前,先将这些图像块缩放至56×56的大小。所有像素点的相同尺度图像块送入同一个卷积神经网络,形成三通道的卷积神经网络群。所有通道在全连接层融合在一起。在神经网络群的最后一层(输出层),行人区域的像素点对应一个节点即第一节点,行人背景区域的像素点对应另一个节点即第二节点。
步骤104,对测试人形图像的所有第二像素点,提取多尺度上下文信息;
具体的,对测试人形图像的所有第二像素点,以所述像第二素点为中心提取不同尺度的图像块
步骤105,每一个所述第二像素点的不同尺度的图像块送入与人形图像分割训练模型相对应的神经网络通道,所有所述神经网通道在全连接层融合在一起,在全连接层的最后一层的第一节点输出第一值,第二节点输出第二值,所述第一值表示所述第二像素点属于人形区域内的第一概率,所述第二值表示所述第二像素点属于人形区域外的概率;如果所述第一概率大于所述第二概率,则所述第二像素点属于人形区域内,反之则所述第二像素点属于人形区域外。
对测试图片的所有第二像素点判定完后,即完成人形图像分割。
步骤104和105为测试阶段,将任何一张带有行人的图片进行行人区域分割,具体的,输入一张测试图像,对其每一个像素点提取三个尺度(224*224,112*112,56*56)上下文信息,即以该像素点为中心提取三个尺度的图像块。送入网络之前,先将这些图像块缩放至56×56的大小。每一个像素点的不同尺度图像块送入与训练好的模型中相对应的神经网络通道,所有通道在全连接层融合在一起,在全连接层的最后一层两个节点上会分别输出一个值,表示该像素点属于行人和背景的概率。如果属于行人的概率大于属于背景的概率,则判定该像素点属于行人,反之则判定该像素点属于背景。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (4)
1.一种人形图像分割方法,其特征在于,所述方法包括:
步骤S1,对训练人形图像的所有第一像素点,提取多尺度上下文信息;
步骤S2,将所有所述第一像素点的所有尺度的图像块送入同一个卷积神经网络,形成多通道的卷积神经网络群,每一个通道对应一个尺度的图像块;
步骤S3,采用反向传播算法来训练所述神经网络群,得到人形图像分割训练模型数据;
步骤S4,对测试人形图像的所有第二像素点,提取多尺度上下文信息;
步骤S5,每一个所述第二像素点的不同尺度的图像块送入与人形图像分割训练模型相对应的神经网络通道,所有所述神经网通道在全连接层融合在一起,在全连接层的最后一层的第一节点输出第一值,第二节点输出第二值,所述第一值表示所述第二像素点属于人形区域内的第一概率,所述第二值表示所述第二像素点属于人形区域外的概率;如果所述第一概率大于所述第二概率,则所述第二像素点属于人形区域内,反之则所述第二像素点属于人形区域外。
2.根据权利要求1所述的方法,其特征在于,所述步骤S1具体包括:对训练人形图像的人形区域内和区域外的所有第一像素点,以所述第一像素点为中心提取不同尺度的图像块。
3.根据权利要求1所述的方法,其特征在于,所述步骤S2中所述多通道的卷积神经网络群在全连接层融合在一起;所述全连接层的最后一层为输出层,并包括第一节点和第二节点,所有人形区域内的像素点的输出对应所述第一节点,所有人形区域外的像素点的输出对应所述第二节点。
4.根据权利要求1所述的方法,其特征在于,所述步骤S4具体包括:对测试人形图像的所有第二像素点,以所述像第二素点为中心提取不同尺度的图像块。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2014/078282 WO2015176305A1 (zh) | 2014-05-23 | 2014-05-23 | 人形图像分割方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104067314A true CN104067314A (zh) | 2014-09-24 |
CN104067314B CN104067314B (zh) | 2017-03-08 |
Family
ID=51553777
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480000254.1A Active CN104067314B (zh) | 2014-05-23 | 2014-05-23 | 人形图像分割方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10096121B2 (zh) |
CN (1) | CN104067314B (zh) |
WO (1) | WO2015176305A1 (zh) |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015176305A1 (zh) * | 2014-05-23 | 2015-11-26 | 中国科学院自动化研究所 | 人形图像分割方法 |
CN105551036A (zh) * | 2015-12-10 | 2016-05-04 | 中国科学院深圳先进技术研究院 | 一种深度学习网络的训练方法和装置 |
WO2016090520A1 (en) * | 2014-12-10 | 2016-06-16 | Xiaogang Wang | A method and a system for image classification |
CN105760835A (zh) * | 2016-02-17 | 2016-07-13 | 天津中科智能识别产业技术研究院有限公司 | 一种基于深度学习的步态分割与步态识别一体化方法 |
CN105787482A (zh) * | 2016-02-26 | 2016-07-20 | 华北电力大学 | 一种基于深度卷积神经网络的特定目标轮廓图像分割方法 |
CN106372597A (zh) * | 2016-08-31 | 2017-02-01 | 李涛 | 基于自适应上下文信息的cnn交通检测方法 |
CN106548127A (zh) * | 2015-09-18 | 2017-03-29 | 松下电器(美国)知识产权公司 | 图像识别方法 |
CN106663186A (zh) * | 2014-07-28 | 2017-05-10 | 北京市商汤科技开发有限公司 | 用于脸部识别的方法和系统 |
CN106780512A (zh) * | 2016-11-30 | 2017-05-31 | 厦门美图之家科技有限公司 | 分割图像的方法、应用及计算设备 |
CN107016405A (zh) * | 2017-02-24 | 2017-08-04 | 中国科学院合肥物质科学研究院 | 一种基于分级预测卷积神经网络的害虫图像分类方法 |
CN107392933A (zh) * | 2017-07-12 | 2017-11-24 | 维沃移动通信有限公司 | 一种图像分割的方法及移动终端 |
WO2018036293A1 (zh) * | 2016-08-26 | 2018-03-01 | 杭州海康威视数字技术股份有限公司 | 图像分割方法、装置及全卷积网络系统 |
CN108198192A (zh) * | 2018-01-15 | 2018-06-22 | 任俊芬 | 一种基于深度学习的高精度快速人体分割方法 |
CN108198184A (zh) * | 2018-01-09 | 2018-06-22 | 北京理工大学 | 造影图像中血管分割的方法和系统 |
CN108694347A (zh) * | 2017-04-06 | 2018-10-23 | 北京旷视科技有限公司 | 图像处理方法和装置 |
CN108932943A (zh) * | 2018-07-12 | 2018-12-04 | 广州视源电子科技股份有限公司 | 命令词语音检测方法、装置、设备和存储介质 |
CN109165644A (zh) * | 2018-07-13 | 2019-01-08 | 北京市商汤科技开发有限公司 | 目标检测方法和装置、电子设备、存储介质、程序产品 |
CN109886964A (zh) * | 2019-03-29 | 2019-06-14 | 北京百度网讯科技有限公司 | 电路板缺陷检测方法、装置及设备 |
CN110895814A (zh) * | 2019-11-30 | 2020-03-20 | 南京工业大学 | 一种基于上下文编码网络的航空发动机孔探图像损伤智能分割方法 |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018120013A1 (en) * | 2016-12-30 | 2018-07-05 | Nokia Technologies Oy | Artificial neural network |
CN107657259A (zh) * | 2017-09-30 | 2018-02-02 | 平安科技(深圳)有限公司 | 图像篡改检测方法、电子装置及可读存储介质 |
CN107680088A (zh) * | 2017-09-30 | 2018-02-09 | 百度在线网络技术(北京)有限公司 | 用于分析医学影像的方法和装置 |
CN108875900B (zh) * | 2017-11-02 | 2022-05-24 | 北京旷视科技有限公司 | 视频图像处理方法和装置、神经网络训练方法、存储介质 |
CN107944399A (zh) * | 2017-11-28 | 2018-04-20 | 广州大学 | 一种基于卷积神经网络目标中心模型的行人重识别方法 |
CN110838122B (zh) * | 2018-08-16 | 2022-06-14 | 北京大学 | 点云的分割方法、装置及计算机存储介质 |
CN109447992B (zh) * | 2018-10-23 | 2022-04-01 | 中国银行股份有限公司 | 一种图像分割方法及装置 |
US11210559B1 (en) * | 2018-10-23 | 2021-12-28 | Hrl Laboratories, Llc | Artificial neural networks having attention-based selective plasticity and methods of training the same |
CN109375186B (zh) * | 2018-11-22 | 2022-05-31 | 中国人民解放军海军航空大学 | 基于深度残差多尺度一维卷积神经网络的雷达目标识别方法 |
CN110148148B (zh) * | 2019-03-01 | 2024-11-05 | 纵目科技(上海)股份有限公司 | 一种基于目标检测的下边缘检测模型的训练方法、模型和存储介质 |
CN111932486A (zh) * | 2019-05-13 | 2020-11-13 | 四川大学 | 一种基于3d卷积神经网络的脑胶质瘤分割方法 |
CN110188732B (zh) * | 2019-06-07 | 2022-04-05 | 吉林大学 | 一种基于卷积神经网络的静态手语识别方法 |
WO2021031066A1 (zh) * | 2019-08-19 | 2021-02-25 | 中国科学院深圳先进技术研究院 | 一种软骨图像分割方法、装置、可读存储介质及终端设备 |
CN110647889B (zh) * | 2019-08-26 | 2022-02-08 | 中国科学院深圳先进技术研究院 | 医学图像识别方法、医学图像识别装置、终端设备及介质 |
CN111401247B (zh) * | 2020-03-17 | 2023-07-28 | 杭州小影创新科技股份有限公司 | 一种基于级联卷积神经网络的人像分割方法 |
KR20220023639A (ko) * | 2020-08-21 | 2022-03-02 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
CN112434514B (zh) * | 2020-11-25 | 2022-06-21 | 重庆邮电大学 | 基于多粒度多通道的神经网络的语义匹配方法、装置及计算机设备 |
EP4099142A4 (en) | 2021-04-19 | 2023-07-05 | Samsung Electronics Co., Ltd. | ELECTRONIC DEVICE AND METHOD OF OPERATION |
CN117581234A (zh) | 2021-05-07 | 2024-02-20 | Hrl实验室有限责任公司 | 神经形态存储器电路和人工神经网络的神经发生的方法 |
CN114916928B (zh) * | 2022-05-12 | 2023-08-04 | 电子科技大学 | 一种人体姿态多通道卷积神经网络检测方法 |
CN115468541B (zh) * | 2022-11-01 | 2023-04-25 | 山东省地质矿产勘查开发局八〇一水文地质工程地质大队(山东省地矿工程勘察院) | 一种岩溶塌陷四维监测的信息系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090161912A1 (en) * | 2007-12-21 | 2009-06-25 | Raviv Yatom | method for object detection |
CN101673340A (zh) * | 2009-08-13 | 2010-03-17 | 重庆大学 | 综合多方向多尺度与bp神经网络的人耳识别方法 |
CN102855490A (zh) * | 2012-07-23 | 2013-01-02 | 黑龙江工程学院 | 高分辨率遥感影像面向对象神经网络分类方法 |
CN102945373A (zh) * | 2012-10-24 | 2013-02-27 | 中国科学院自动化研究所 | 基于上下文的局部空间信息建模方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5058179A (en) * | 1990-01-31 | 1991-10-15 | At&T Bell Laboratories | Hierarchical constrained automatic learning network for character recognition |
US7088846B2 (en) * | 2003-11-17 | 2006-08-08 | Vidient Systems, Inc. | Video surveillance system that detects predefined behaviors based on predetermined patterns of movement through zones |
CN102682297B (zh) * | 2012-05-07 | 2014-05-14 | 中北大学 | 模拟视觉细胞感受野特性的pcnn人脸图像分割方法 |
KR101724658B1 (ko) * | 2012-12-21 | 2017-04-10 | 한국전자통신연구원 | 사람 검출 장치 및 방법 |
WO2015157526A1 (en) * | 2014-04-09 | 2015-10-15 | Entrupy Inc. | Authenticating physical objects using machine learning from microscopic variations |
CN104067314B (zh) * | 2014-05-23 | 2017-03-08 | 银河水滴科技(北京)有限公司 | 人形图像分割方法 |
EP3146463B1 (en) * | 2014-05-23 | 2020-05-13 | Ventana Medical Systems, Inc. | Systems and methods for detection of biological structures and/or patterns in images |
US9928410B2 (en) * | 2014-11-24 | 2018-03-27 | Samsung Electronics Co., Ltd. | Method and apparatus for recognizing object, and method and apparatus for training recognizer |
US9892344B1 (en) * | 2015-11-30 | 2018-02-13 | A9.Com, Inc. | Activation layers for deep learning networks |
-
2014
- 2014-05-23 CN CN201480000254.1A patent/CN104067314B/zh active Active
- 2014-05-23 US US15/312,829 patent/US10096121B2/en active Active
- 2014-05-23 WO PCT/CN2014/078282 patent/WO2015176305A1/zh active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090161912A1 (en) * | 2007-12-21 | 2009-06-25 | Raviv Yatom | method for object detection |
CN101673340A (zh) * | 2009-08-13 | 2010-03-17 | 重庆大学 | 综合多方向多尺度与bp神经网络的人耳识别方法 |
CN102855490A (zh) * | 2012-07-23 | 2013-01-02 | 黑龙江工程学院 | 高分辨率遥感影像面向对象神经网络分类方法 |
CN102945373A (zh) * | 2012-10-24 | 2013-02-27 | 中国科学院自动化研究所 | 基于上下文的局部空间信息建模方法 |
Non-Patent Citations (2)
Title |
---|
LIANG WANG ET AL.: "Silhouette Analysis-Based Gait Recognition for Human Identification", 《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》 * |
张忠波 等: "基于局部特征分析与最优化匹配的人脸识别算法", 《吉林大学学报(理学版)》 * |
Cited By (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015176305A1 (zh) * | 2014-05-23 | 2015-11-26 | 中国科学院自动化研究所 | 人形图像分割方法 |
US10096121B2 (en) | 2014-05-23 | 2018-10-09 | Watrix Technology | Human-shape image segmentation method |
CN106663186B (zh) * | 2014-07-28 | 2018-08-21 | 北京市商汤科技开发有限公司 | 用于脸部识别的方法和系统 |
CN106663186A (zh) * | 2014-07-28 | 2017-05-10 | 北京市商汤科技开发有限公司 | 用于脸部识别的方法和系统 |
WO2016090520A1 (en) * | 2014-12-10 | 2016-06-16 | Xiaogang Wang | A method and a system for image classification |
CN106548127B (zh) * | 2015-09-18 | 2022-11-04 | 松下电器(美国)知识产权公司 | 图像识别方法 |
CN106548127A (zh) * | 2015-09-18 | 2017-03-29 | 松下电器(美国)知识产权公司 | 图像识别方法 |
CN105551036A (zh) * | 2015-12-10 | 2016-05-04 | 中国科学院深圳先进技术研究院 | 一种深度学习网络的训练方法和装置 |
CN105760835B (zh) * | 2016-02-17 | 2018-03-06 | 银河水滴科技(北京)有限公司 | 一种基于深度学习的步态分割与步态识别一体化方法 |
CN105760835A (zh) * | 2016-02-17 | 2016-07-13 | 天津中科智能识别产业技术研究院有限公司 | 一种基于深度学习的步态分割与步态识别一体化方法 |
CN105787482A (zh) * | 2016-02-26 | 2016-07-20 | 华北电力大学 | 一种基于深度卷积神经网络的特定目标轮廓图像分割方法 |
US11151723B2 (en) | 2016-08-26 | 2021-10-19 | Hangzhou Hikvision Digital Technology Co., Ltd. | Image segmentation method, apparatus, and fully convolutional network system |
WO2018036293A1 (zh) * | 2016-08-26 | 2018-03-01 | 杭州海康威视数字技术股份有限公司 | 图像分割方法、装置及全卷积网络系统 |
CN107784654A (zh) * | 2016-08-26 | 2018-03-09 | 杭州海康威视数字技术股份有限公司 | 图像分割方法、装置及全卷积网络系统 |
CN107784654B (zh) * | 2016-08-26 | 2020-09-25 | 杭州海康威视数字技术股份有限公司 | 图像分割方法、装置及全卷积网络系统 |
CN106372597A (zh) * | 2016-08-31 | 2017-02-01 | 李涛 | 基于自适应上下文信息的cnn交通检测方法 |
CN106372597B (zh) * | 2016-08-31 | 2019-09-13 | 郑州禅图智能科技有限公司 | 基于自适应上下文信息的cnn交通检测方法 |
CN106780512A (zh) * | 2016-11-30 | 2017-05-31 | 厦门美图之家科技有限公司 | 分割图像的方法、应用及计算设备 |
CN106780512B (zh) * | 2016-11-30 | 2020-01-17 | 厦门美图之家科技有限公司 | 分割图像的方法、应用及计算设备 |
CN107016405A (zh) * | 2017-02-24 | 2017-08-04 | 中国科学院合肥物质科学研究院 | 一种基于分级预测卷积神经网络的害虫图像分类方法 |
CN107016405B (zh) * | 2017-02-24 | 2019-08-30 | 中国科学院合肥物质科学研究院 | 一种基于分级预测卷积神经网络的害虫图像分类方法 |
CN108694347B (zh) * | 2017-04-06 | 2022-07-12 | 北京旷视科技有限公司 | 图像处理方法和装置 |
CN108694347A (zh) * | 2017-04-06 | 2018-10-23 | 北京旷视科技有限公司 | 图像处理方法和装置 |
CN107392933B (zh) * | 2017-07-12 | 2020-02-21 | 维沃移动通信有限公司 | 一种图像分割的方法及移动终端 |
CN107392933A (zh) * | 2017-07-12 | 2017-11-24 | 维沃移动通信有限公司 | 一种图像分割的方法及移动终端 |
CN108198184B (zh) * | 2018-01-09 | 2020-05-05 | 北京理工大学 | 造影图像中血管分割的方法和系统 |
CN108198184A (zh) * | 2018-01-09 | 2018-06-22 | 北京理工大学 | 造影图像中血管分割的方法和系统 |
CN108198192A (zh) * | 2018-01-15 | 2018-06-22 | 任俊芬 | 一种基于深度学习的高精度快速人体分割方法 |
CN108932943A (zh) * | 2018-07-12 | 2018-12-04 | 广州视源电子科技股份有限公司 | 命令词语音检测方法、装置、设备和存储介质 |
CN109165644A (zh) * | 2018-07-13 | 2019-01-08 | 北京市商汤科技开发有限公司 | 目标检测方法和装置、电子设备、存储介质、程序产品 |
CN109886964A (zh) * | 2019-03-29 | 2019-06-14 | 北京百度网讯科技有限公司 | 电路板缺陷检测方法、装置及设备 |
CN110895814A (zh) * | 2019-11-30 | 2020-03-20 | 南京工业大学 | 一种基于上下文编码网络的航空发动机孔探图像损伤智能分割方法 |
Also Published As
Publication number | Publication date |
---|---|
US10096121B2 (en) | 2018-10-09 |
WO2015176305A1 (zh) | 2015-11-26 |
CN104067314B (zh) | 2017-03-08 |
US20170200274A1 (en) | 2017-07-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104067314A (zh) | 人形图像分割方法 | |
CN105760835B (zh) | 一种基于深度学习的步态分割与步态识别一体化方法 | |
CN108776772A (zh) | 一种跨时间建筑物变化检测建模方法以及检测装置、方法及存储介质 | |
CN106096561A (zh) | 基于图像块深度学习特征的红外行人检测方法 | |
CN107862261A (zh) | 基于多尺度卷积神经网络的图像人群计数方法 | |
CN107392019A (zh) | 一种恶意代码家族的训练和检测方法及装置 | |
CN105787482A (zh) | 一种基于深度卷积神经网络的特定目标轮廓图像分割方法 | |
CN112639997B (zh) | 一种利用神经网络进行分割的疾病诊断系统和方法 | |
CN104317894B (zh) | 样本标注的确定方法和装置 | |
CN106951568A (zh) | 基于数据挖掘的学生贫困状态预测方法 | |
CN106909886A (zh) | 一种基于深度学习的高精度交通标志检测方法及系统 | |
CN109886946A (zh) | 基于深度学习的早期老年性黄斑病变弱监督分类方法 | |
CN110322509B (zh) | 基于层级类激活图的目标定位方法、系统及计算机设备 | |
CN107392252A (zh) | 计算机深度学习图像特征并量化感知度的方法 | |
CN109753853A (zh) | 一种同时完成行人检测与行人重识别的方法 | |
CN109325385A (zh) | 目标检测和区域分割方法、装置和计算机可读存储介质 | |
CN114428937A (zh) | 一种基于时空图神经网络的时间序列数据预测方法 | |
CN107392311A (zh) | 序列切分的方法和装置 | |
CN104268657A (zh) | 基于遥感的流域水生态风险预警和判别方法 | |
Comber et al. | Comparing expert and non-expert conceptualisations of the land: an analysis of crowdsourced land cover data | |
Lin et al. | Optimal CNN-based semantic segmentation model of cutting slope images | |
CN112215188B (zh) | 交警姿态识别方法、装置、设备及存储介质 | |
CN104834990A (zh) | 旅客信息化编码的方法及装置 | |
CN115937758A (zh) | 一种基于多尺度动态图卷积的弱监督人群计数方法 | |
Agdas et al. | Determining land use/land cover (LULC) changes using remote sensing method in Lüleburgaz and LULC change's impacts on SDGs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C41 | Transfer of patent application or patent right or utility model | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20160908 Address after: 100090 Beijing city Haidian District Zhongguancun south a No. 2 B District three floor Horse International Hotel Applicant after: Galaxy drop Technology (Beijing) Co., Ltd. Address before: Haidian District, Beijing, China Zhongguancun East Road, No. 95 Applicant before: Institute of Automation, Chinese Academy of Sciences |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |