CN105938559A - 使用卷积神经网络的数字图像处理 - Google Patents
使用卷积神经网络的数字图像处理 Download PDFInfo
- Publication number
- CN105938559A CN105938559A CN201610122298.2A CN201610122298A CN105938559A CN 105938559 A CN105938559 A CN 105938559A CN 201610122298 A CN201610122298 A CN 201610122298A CN 105938559 A CN105938559 A CN 105938559A
- Authority
- CN
- China
- Prior art keywords
- cnn
- candidate
- image
- size
- framework
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013527 convolutional neural network Methods 0.000 title claims abstract description 123
- 238000012545 processing Methods 0.000 title claims description 51
- 238000013507 mapping Methods 0.000 claims description 33
- 238000012549 training Methods 0.000 claims description 33
- 238000000034 method Methods 0.000 claims description 32
- 238000005070 sampling Methods 0.000 claims description 21
- 238000012795 verification Methods 0.000 claims description 14
- 238000004422 calculation algorithm Methods 0.000 claims description 13
- 230000006378 damage Effects 0.000 claims description 12
- 238000012804 iterative process Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 8
- 238000003475 lamination Methods 0.000 claims description 7
- 238000012360 testing method Methods 0.000 claims description 5
- 238000003860 storage Methods 0.000 claims description 4
- 239000012141 concentrate Substances 0.000 claims description 2
- 241000208340 Araliaceae Species 0.000 claims 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims 1
- 235000003140 Panax quinquefolius Nutrition 0.000 claims 1
- 230000002708 enhancing effect Effects 0.000 claims 1
- 235000008434 ginseng Nutrition 0.000 claims 1
- 238000003672 processing method Methods 0.000 claims 1
- 238000010200 validation analysis Methods 0.000 abstract 1
- 230000001771 impaired effect Effects 0.000 description 14
- 238000002372 labelling Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 9
- 238000013500 data storage Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 238000005457 optimization Methods 0.000 description 6
- 238000001514 detection method Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000012706 support-vector machine Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000003909 pattern recognition Methods 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 239000002689 soil Substances 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 241000406668 Loxodonta cyclotis Species 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000005282 brightening Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000002087 whitening effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/285—Selection of pattern recognition techniques, e.g. of classifiers in a multi-classifier system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24143—Distances to neighbourhood prototypes, e.g. restricted Coulomb energy networks [RCEN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/254—Fusion techniques of classification results, e.g. of results related to same input data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/776—Validation; Performance evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/809—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of classification results, e.g. where the classifiers operate on the same input data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Multimedia (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Biodiversity & Conservation Biology (AREA)
- Image Analysis (AREA)
Abstract
根据示例,可以通过卷积神经网络(CNN)集合对数字图像进行处理,以对数字图像中的对象进行分类。对于每个CNN,可以选择候选架构和候选参数以构建多个CNN。一旦确定每个对于所选择的候选参数具有不同的值的预定数量的CNN满足验证阈值,就可以从预定数量的CNN生成CNN集合。然后,可以聚集来自CNN集合的预测以准确地对数字图像中的对象进行分类。
Description
背景技术
数字图像处理通常涉及处理数字图像(例如,来自数字静止图像或数字视频)以确知、检测和/或分类图像中的具体特征或对象。可以在图像处理期间应用模式识别以检测图像中的具体对象。具有模式识别的数字图像处理已经在广泛多种应用(诸如面部识别、来自航空照片的土地特征的检测、车辆牌照确定等)中使用。不同类型的常规机器学习功能可以用于模式识别,然而,许多常规机器学习功能不适合于或可能难以适合于数字图像处理中的模式识别。
附图说明
通过示例的方式图示本公开的特征,并且不局限于以下附图,其中,类似的标号指示类似的元件,其中:
图1示出了根据本公开的示例的图像处理系统的系统图;
图2示出了根据本公开的示例的指示对资产(property)损坏的程度的分类类别;
图3示出了根据本公开的示例的图像处理服务器的数据存储(data store);
图4示出了根据本公开的示例的用于使用卷积神经网络(CNN)对数字图像中的对象进行分类的计算设备的框图;
图5示出了根据本公开的示例的使用CNN对数字图像中的对象进行分类的方法的流程图;和
图6示出了根据本公开的示例的优化CNN的流程图。
具体实施方式
出于简化和说明目的,主要通过参照其示例对本公开进行描述。在以下描述中,阐述了许多具体细节,以便提供对本公开的透彻理解。然而,显而易见的是,在不局限于这些具体细节的情况下,也可以实践本公开。在其它实例中,没有对一些方法和结构进行详细描述,以免不必要地模糊本公开。如本文中所使用的,术语“一”和“一个”旨在表示至少一个具体元素,术语“包括(includes)”意味着包括(includes)但不限于,术语“包括(including)”意味着包括(including)但不限于,并且术语“基于”意味着至少部分基于。
根据示例,图像处理系统构建并且训练深度学习模型(诸如卷积神经网络(CNN))集合(ensemble),以精确地且自动地执行图像处理来检测数字图像中的对象的具体属性,并且根据所检测的属性对对象进行分类。然而,CNN包括许多功能部件,其使得它很难确定准确执行以检测并分类对于手头问题是相关的图像的具体特征所必需的网络架构。更进一步地,CNN的每个部件通常具有与它相关联的大量参数。在没有应用任何鲁棒的图像处理系统的情况下,成功且准确的图像分类所必需的那些参数的特定值不是先验已知的。因此,图像处理系统提供了一种用于构建并且微调证明输出图像的准确分类的CNN的方法。通过迭代过程,可以选择用于CNN的候选架构和候选参数来构建、训练、并优化CNN。例如,迭代过程可以包括:从多个候选架构选择候选架构并且验证用于所选择的候选架构的候选参数集。候选架构可以包括分类器类型以及若干个卷积层和子采样(subsampling)层。候选参数可以包括学习率、批量大小、训练历元(training epoch)的最大数量、输入图像大小、CNN每一层处的特征映射图(feature map)数量、卷积滤波器大小、子采样池大小、隐含层数量、每个隐含层中的单元数量、所选择的分类器算法、以及输出种类的数量。另外,还可以选择预处理协议,以增强用于所选择的候选架构和所选择的候选参数的图像中的具体内容。
迭代过程可以包括:使用训练集构建中间CNN并且评价(evaluate)中间CNN在验证集上的性能。比如,该评价确定中间CNN是否满足验证阈诸(诸如小于20%错误率)。重复该迭代过程直到预定数量(例如,25个)的中间CNN满足验证阈值为止。根据示例,每个中间CNN对于所选择的候选参数具有不同的值。然后,从预定数量的中间CNN生成最准确的中间CNN集合。例如,该集合可能是前5个最准确的中间CNN。下一步骤可以包括:选择集合算法以聚集和/或组合该集合中的每个中间CNN的预测以形成集合预测。然后,该集合中的每个中间CNN的预测可以用来对图像或图像中的对象进行分类。
所公开的示例的技术优势和优点包括:提供了表现出优良的分类准确度以评估(assess)资产损坏的先进深度学习架构和确定先进深度学习架构的迭代图像处理系统。通过迭代过程由图像处理系统生成的CNN比其它规则的前馈神经网络更容易训练,并且具有较少的估计参数,从而使其成为用来评估资产损坏的更有效的架构。
根据示例,由图像处理系统生成的CNN可以用来对在数字图像中捕获的资产的损坏程度间分类。损坏可以是指损害资产外观的任何类型的损伤或伤害。图像或数字图像可以包括静止图像和运动图像(例如,视频)。资产可能是包括但不限于房子、家具、服装、车辆设备、土地、计算设备、玩具等的任何有形对象。在其中投保客户的有形资产意外受损的示例中,投保客户可以通过用智能手机和/或相机拍摄数码照片来记录对受损资产的损坏。然后,受损资产的数字图像可以被馈给到图像处理系统。图像处理系统可以自动基于从所接收的数字图像的图像处理确定的损坏量来对受损资产进行分类。在本示例中,图像处理系统提供了一种自动检测对如在数字图像中捕获的资产的损坏程度的机器视觉方法和装置。
根据示例,图像处理系统生成集合模型(例如,包括多个优化CNN),以在准确度提高的情况下对图像或者该图像中的对象进行分类。在示例中,使用集合模型的图像处理系统对验证集中的图像的准确度接近90%。
如上文所讨论的,根据示例,图像处理系统可以用于对在图像中捕获的资产损坏的程度进行分类。然而,图像处理系统可以基本上用于任何应用以将数字图像中的特征分类为预先定义的类别。
参照图1,示出了根据本公开的示例的图像处理系统100的系统图。应当理解,在不脱离该系统100的范围的情况下,该系统100可以包括附加的部件,并且本文中所描述的部件的一个或多个部件可以被移除和/或修改。该系统100可以包括至少一个图像捕获设备110、通信网络120、图像处理服务器130、以及数据存储140。
图像捕获设备110可以经由通信网络120与图像处理服务器130通信。图像捕获设备110可以是任何计算设备,其包括相机(诸如但不限于智能电话、计算平板电脑、膝上型计算机、台式计算机、或任何可穿戴计算设备)。根据示例,图像捕获设备110可以捕获有形资产150的图像并且将有形资产150的图像发送到图像处理服务器130以自动对有形资产150的损坏程度进行分类。
通信网络120可以包括局域网(LAN)和广域网(WAN)(诸如因特网)。通信网络120可以包括可以由软件、应用程序和/或逻辑控制的信号承载介质。通信网络120可以包括支持数据通信服务的网络元件的组合。例如,通信网络120可以通过使用物理连接(诸如铜电缆、同轴电缆和光纤电缆)或通过无线技术(诸如无线电、微波、或卫星)将图像捕获设备110连接到图像处理服务器130。
例如,图像处理服务器130可以在图像预处理器105处从训练集接收数字图像。图像预处理器可以裁剪并增强来自训练集的图像中的具体内容以输入到中间CNN构建器(builder)115。中间CNN构建器115可以选择各种架构和参数来训练中间CNN125。然后,可以在由验证电路135生成的验证集上对中间CNN125进行评估。验证电路135可以确定是否标记满足指定验证阈值的中间CNN125。如果中间CNN125不满足验证阈值,则中间CNN不被标记,并且继续通过中间CNN构建器115在来自训练集的数字图像上进行训练。然而,如果中间CNN125确实满足验证阈值,则中间CNN125现在是标记的中间CNN145。因此,标记的中间CNN145有资格被选择作为由集合生成器155生成的优化CNN集合的一部分。例如,集合生成器155可以创建优化CNN集合165。从集合165聚集的预测可以用来准确分类来自输入数字图像的对象175。下文在图4、图5和图6中对图像处理服务器130的处理功能进一步详细说明。
根据示例,图像处理服务器130可以接收有形资产150的图像并且使用CNN对有形资产150的损坏程度自动分类,以识别并分类有形资产150的图像中的损坏。根据示例,如图2所图示的,图像处理服务器130可以将有形资产150的损坏程度分类为各种预先确定的分类类别200(诸如但不限于未受损的、受损的、严重受损的或总计的)。
如图4中下文进一步所详述的,图像处理服务器130可以被耦合到数据存储140。如图3所图示的,数据存储140可以通过图像处理服务器130存储对有形资产150的损坏程度分类所依赖的数据。例如,数据存储140可以存储训练集和包括资产310、受损资产320和总计损坏的资产330的数字图像的验证集。图像处理服务器130依赖这些数字图像以构建准确评估并分类对有形资产150的损坏程度的模型。
参照图4,示出了根据本公开的示例的用于使用卷积神经网络(CNN)进行图像处理的计算设备400的框图。根据示例,计算设备400是图像处理服务器130。应当理解,在不脱离计算设备400的范围的情况下,计算设备400可以包括附加的部件,并且本文中所描述的部件的一个或多个部件可以被移除和/或修改。
计算设备400被描绘为包括处理器402、数据存储140、输入/输出(I/O)接口406和图像处理平台410。作为示例,计算设备400的部件在单个计算机或服务器上示出,并且在其它示例中,部件可以存在于多个计算机或服务器上。计算设备400可以将数据存储在数据存储140中和/或可以管理比如通过I/O接口406存储在单独的计算设备中的数据的存储。数据存储140可以包括物理存储器(诸如硬盘驱动器、光盘驱动器、闪存驱动器、驱动器阵列或它们的任意组合),并且可以包括易失性和/或非易失性数据存储。
图像处理平台410被描绘为包括训练电路412、模型构建器414、验证电路416和分类器418。可以包括微处理器、微控制器、专用集成电路(ASIC)、图形处理单元(GPU)等等的处理器402要在计算设备400中执行各种处理功能。处理功能可以包括图像处理平台410的训练电路412、模型构建器414、验证电路416和分类器418的功能。
例如,训练电路412可以从受损资产或对象的图像创建训练集。该训练集可以通过模型构建器414用来构建CNN模型。例如,模型构建器414可以根据用于CNN模型的所选择的候选架构和候选参数在训练集上构建CNN模型。例如,验证电路416可以评价由模型构建器414构建的CNN模型在验证集上的性能,并且确定CNN模型是否满足验证阈值。例如,分类器418可以分类验证集中的每幅图像中的对象的损坏程度。该分类器还可以聚集来自优化CNN模型集合的预测以更准确地评估数字图像中的受损对象。
在示例中,图像处理平台410包括存储在非暂态计算机可读介质413上并且由处理器执行的机器可读指令。非暂态计算机可读介质的示例包括动态随机存取存储器(DRAM)、电可擦除可编程只读存储器(EEPROM)、磁阻随机存取存储器(MRAM)、忆阻器、闪存、硬盘驱动器等。计算机可读介质413可以被包括在数据存储140中或可以是单独的存储设备。在另一示例中,图像处理平台410包括硬件设备(诸如电路或布置在板上的多个电路)。在该示例中,训练电路412、模型构建器414、验证电路416和分类器418包括电路部件或单独电路(诸如嵌入式系统、ASIC或现场可编程门阵列(FPGA))。
处理器402可以通过总线405被耦合到数据存储140和I/O接口406,其中,总线405可以是在计算设备400的各种部件之间传送数据的通信系统。在示例中,总线405可以是外围部件互连(PCI)、工业标准架构(ISA)、PCI-Express、NuBus、专用总线等等。
I/O接口406包括硬件和/或软件接口。I/O接口406可以是通过网络设备连接到网络的网络接口,通过该网络接口,图像处理平台410可以接收并且传送信息(比如关于对资产的损坏程度的信息)。例如,输入/输出接口406可以是无线局域网(WLAN)或网络接口控制器(NIC)。WLAN可以通过无线电信号将计算设备400链接到网络设备。类似地,NIC可以通过物理连接(诸如电缆)将计算设备400链接到网络设备。计算设备400还可以通过无线广域网(WWAN)链接到网络设备,其使用移动数据信号与移动电话塔通信。处理器402可以将通过输入/输出接口406接收的信息存储在数据存储140中,并且可以使用在实施图像处理平台410的训练电路412、模型生成器414、验证电路416和分类器418中的信息。
下文在图5和图6中所公开的方法描述了使用CNN进行数字图像处理例如以分类对在图像中所捕获的资产的损坏程度的方法的示例。对于本领域技术人员,应该显而易见的是,在不背离方法的范围的情况下,这些方法表示广义的图示,并且其它序列可以被添加或者现有的序列可以被移除、修改或重新布置。
图5示出了根据本公开的示例的使用CNN进行数字图像处理的方法500的流程图。CNN可以用于推进图像中的对象的分类性能。因此,图5中所图示的方法500提供了一种用于训练并构建CNN以输出图像中的对象的准确分类的方法。例如,图像处理服务器130的处理器402可以实施图像处理平台410以准确评估图像中的资产损坏。
在框505中,训练电路412比如可以从受损资产或对象的图像创建训练集。根据示例,训练集数据可以包括新(未受损的)对象、受损对象和总计对象的图像。可以通过模型构建器414处理这个训练集,以发现预测性关系并且调整模型(诸如CNN)。
在已经创建训练集之后,方法500可以迭代地选择候选架构和候选参数以优化CNN的例如准确分类对图像中的对象的损坏程度的能力。该迭代过程可以包括方法500的框510-545。
在框510中,模型构建器414比如可以从多个候选架构中选择候选架构。根据示例,多个候选架构可以包括分类器类型、以及若干个卷积层和子采样层的不同组合。分类器类型可以包括多层感知器(MLP)、支持向量机(SVM)等等。
在框515中,模型构建器414比如可以选择用于所选择的候选架构的候选参数。根据示例,候选参数可以包括学习率、批量大小、训练历元的最大数量、卷积滤波器大小、CNN每一层的特征映射图数量、子采样池大小、输入图像大小、隐含层数量、每个隐含层中的单元数量、所选择的分类器算法、以及输出种类数量。
学习参数的示例包括学习率、批量大小和训练历元的最大数量。学习率参数是其中CNN从训练集学习最佳滤波系数的速率。理想情况下,学习率不是太高(其中,CNN超量学习并且不太普及)或太低。根据示例,用于学习率参数的范围包括但不限于0.05至0.10。批量大小参数是当在最小化中计算梯度下降的估计时,一起被处理的图像的数量(与一次使用一幅图像相对)。在训练期间,将若干幅图像聚束在批量中通过使用图像(高度×宽度)的三维(3D)矩阵表示(批量大小×高度×宽度)而非两维(2D)矩阵表示来加快计算。根据示例,批量大小参数的范围包括但不限于每个批量2-128幅图像。训练历元的最大数量参数是整个训练集在更新最小化参数中重新使用的最大次数。训练图像的数量除以批量大小是在一个历元中的迭代总数。根据示例,训练历元的最大数量参数的范围介于100和200之间。
卷积和子采样参数的示例包括卷积滤波器大小、CNN每一层的特征映射图数量、以及子采样池大小。卷积滤波器大小参数是卷积层中的滤波器大小。根据示例,用于卷积滤波器大小参数的范围介于2×2个像素和114×114像素之间。特征映射图数量参数是从每个卷积层中若干个滤波器或内核输出的特征映射图数量。根据示例,用于特征映射图数量参数的范围介于用于第一卷积层的60个特征映射图和512个特征映射图之间。子采样池大小参数是图像中的像素的正方形贴片(patch)的大小,该像素在经由最大池化(pooling)的操作之后,被降采样(down-sampled)成并且替代为一个像素,该最大池化设置所得像素的值作为像素的初始正方形贴片中的像素的最大值。根据示例,用于子采样池大小参数的值的范围包括但不限于介于2×2和4×4的范围。根据示例,就最终卷积层的输出而言,选择卷积层的网络的参数以将输入图像大小减少至1×1像素值。
分类器参数的示例包括图像输入大小、隐含层数量、每一层中的单元数量、所选择的分类器算法和输出种类数量。图像输入大小是其中来自最终卷积层的数据将被分类的空间维数,并且因此,等于特征映射图数量和最终卷积层的图像大小的乘积。根据示例,输入图像大小是乘以1×1的最终卷积层上的特征映射图的数量。根据示例,隐含层是全连接MLP层并且隐含层的数量包括2。隐含层的数量应该至多限于三个隐含层。每个隐含层中的单元数量是使用在卷积和子采样层中学习的信息以检测损坏程度的隐含层中的单元数量。根据示例,每个隐含层中的单元数量参数的范围包括但不限于介于6个单元和1024个单元之间。所选择的分类器算法可以包括但不限于多层感知器(MLP)、支持向量机(SVM)等等。输出种类数量是输入图像被分成的类型的数量。根据示例,输出种类数量可以包括但不限于3。
然后,如框520所示,模型构建器414比如可以选择预处理协议,以针对所选择的候选架构和所选择的候选参数增强受损对象的图像中的信息内容。预处理协议可以包括但不限于局部对比度归一化或零相成分分析(ZCA)缩放、以及用于增白(whitening)的独立成分分析(ICA)。
在框525中,模型构建器414比如可以训练并使用训练集构建中间CNN。如框530所示,在训练并构建中间CNN之后,验证电路416比如可以评价中间CNN在验证集上的性能。根据示例,验证集包括与来自训练集的图像集分开并且不同的新的(未受损的)对象、受损对象和总计对象的图像集。在这方面,验证集用来评估中间CNN相对于分类验证集的图像的每幅图像的损坏程度的准确度。
在框535中,验证电路416比如可以确定中间CNN是否满足验证阈值。验证阈值可以是验证错误率。根据该示例,如果其验证错误率相对于分类预测小于20%,则中间CNN可能符合或满足验证阈值。如果中间CNN不满足验证阈值,则迭代过程在框510处重新开始。
另一方面,如果中间CNN满足验证阈值,则验证电路416可以标记中间CNN以指示它已经满足了如框540中所示的验证阈值。在框545中,验证电路416可以确定当满足验证阈值时,预定数量的中间CNN是否已经被标记。预定数量的标记的中间CNN例如可以是25个标记的中间CNN。根据示例,使用用于所选择的候选参数的不同值构建标记的中间CNN的每个中间CNN。如果标记的中间CNN的数量还未达到预先确定数量(例如,25),则迭代过程再次在框510处开始。
可替代地,如框550所示,如果标记的中间CNN的数量已经达到预先确定数量(例如,25),则验证电路416可以从预先确定数量的中间CNN创建中间CNN集合。例如,5个最准确的中间CNN可以被选择作为集合。
在框555中,分类器418比如可以对验证集中的每幅图像中的对象的损坏程度进行分类。根据示例,分类包括:聚集来自标记的中间CNN集合的预测以在对验证集中的每幅图像中的对象的损坏程度分类中实现更高的准确度。现在描述用于聚集来自各个CNN的预测以形成集合预测的技术的示例。在示例中,所有的中间CNN同时被训练以确定用于CNN集合的系数或权重并且所训练的集合用于做出预测。在另一示例中,代数规则可以用来组合中间CNN的输出。用于组合中间CNN的输出的代数规则的示例可以包括最大、总和、平均和加权平均。在另一示例中,中间CNN组合使用验证集合测试以确定哪些组合具有最高的预测准确度。当测试组合时,多数投票(vote)可以应用于每个组合,以确定用于该类别的预测。执行研究,并且确定采取来自10-24个标记的中间CNN集合的多数投票的准确度约为90%,其通常比准确度通常约为80-85%导致的单个CNN的性能更高。
图6示出了根据本公开的示例的优化卷积神经网络(CNN)600的流程图。CNN 600是根据上文所描述的方法500构建的优化CNN。用于该CNN600的架构包括4个卷积和子采样层、2个隐含层和逻辑回归分类器(诸如MLP)。在这方面,比如,该CNN600可以对在图像中捕获的资产的损坏程度进行分类,准确度约为88%。
如上文所讨论的,投保客户可以将权利要求中的资产的图像提交给保险公司。保险公司可以使用所提交的图像利用该CNN600自动地对资产的损坏程度进行分类。例如,所提交的图像可以被输入到CNN600中。
所提交的受损资产的图像可以被预先处理610以增强图像中的信息内容以供CNN600处理。在该示例中,所提交的图像是480×640个像素。例如,预处理610可以将所提交的受损资产的图像裁剪成96×96个像素并且从所提交的受损资产的图像中提取3个RGB通道层以作为输入图像呈现给CNN600。
在第一卷积层(C1)620中,CNN600可以用每个大小为5×5的60个不同的第一层滤波器卷积输入图像,以产生大小为92×92的60个特征映射图。卷积层的每个滤波器应用降低输入图像的分辨率。如果输入图像的分辨率是N×N,则卷积滤波器的大小为M×M,那么由此产生的图像的分辨率为N-M+1×N-M+1。然后,CNN600可以对特征映射图执行非线性子采样形式的最大池化。将输入图像最大池化划分成非重叠正方形贴片集,从而更换单个像素值等于初始正方形贴片中的所有像素的最大值的每个贴片。在示例中,CNN可以对C1 620上的60个特征映射图的2×2区域进行最大池化。然后,进一步对C1 620中大小为46×46的所得的60个特征映射图进行卷积并且在第二卷积层(C2)630中进行最大池化。
在C2 630中,用每个大小为3×3的第二层卷积滤波器卷积来自C1 620的大小为46×46的所得的60个特征映射图,以产生大小为44×44的128个特征映射图。然后,可以对128个特征映射图的4×4区域执行最大池化。然后,进一步对C2 630中大小为11×11的所得的128个特征映射图进行卷积并且在第三卷积层(C3)640中进行最大池化。
在C3 640中,用每个大小为4×4的第三层卷积滤波器卷积来自C2 630的大小为11×11的所得的128个特征映射图,以产生大小为8×8的128个特征映射图。然后,可以对128个特征映射图的2×2区域执行最大池化。然后,进一步对C3 640中大小为4×4的所得的128个特征映射图进行卷积并且在第四卷积层(C4)650中进行最大池化。
在C4 650中,用每个大小为3×3的第四层滤波器卷积来自C3640的大小为4×4的所得的128个特征映射图,以产生大小为2×2的256个特征映射图。然后,可以对256个特征映射图的2×2区域进行最大池化。然后,进一步对C4 650中大小为1×1的所得的256个特征映射图被输入到第一隐含层(H1)660以开始分类过程。
为了执行分类,CNN600应用卷积层后面的全连接神经网络层。在H1 660的第一分类层,例如,512个单元的每个单元采用从C 4650产生的所有的256个特征映射图的每个像素的值,将每个值乘以预先确定的权重,并且使总和去线性化。事实上,512个单元的每个单元的输出例如表示关于受损资产e的原始提交的图像的判断。第二隐含层(H2)670被添加以从H2 670的第二分类层中的100个单元的每个单元的输出中导出关于受损资产的所提交的图像的更抽象的结论。因此,CNN 600的逻辑回归分类器680然后可以根据第三分类层中的3个单元的输出准确地分类对作为新的、受损的或总计的所提交的图像中的资产的损坏程度。
本文所述和所图示的是本公开的示例和一些变化。本文中所使用的术语、描述和附图仅通过图示的方式阐述,并且不意味着作为限制。许多变化都可能落入旨在通过所附权利要求-及其等价物-定义的本发明的精神和范围之内,其中,除非另外指明,所有的术语都被意指其最广的合理意义。
Claims (20)
1.一种图像处理方法,包括:
从受损对象的图像创建训练集;
选择用于卷积神经网络(CNN)的候选架构和候选参数以通过迭代过程对所述图像中的所述对象的损坏程度进行分类,其中,所述迭代过程包括:
从多个候选架构中选择所述候选架构;
选择用于所选择的候选架构的所述候选参数;
针对所选择的候选架构和所选择的候选参数选择预处理协议以增强所述受损对象的所述图像中的所述信息内容;
使用所述训练集构建中间CNN;
评价所述中间CNN在验证集上的性能;
确定所述中间CNN是否满足验证阈值;以及
重复所述迭代过程直到预先确定数量的中间CNN满足所述验证阈值,其中,每个中间CNN对于所选择的候选参数具有不同的值;
从所述预先确定数量的中间CNN创建中间CNN集合;以及
对所述验证集中的每幅图像中的所述对象的损坏程度进行分类,其中,所述分类包括聚集来自所述中间CNN集合的预测。
2.根据权利要求1所述的方法,其中,所述候选架构包括分类器类型以及若干个卷积层和子采样层。
3.根据权利要求1所述的方法,其中,所述候选参数包括学习参数,其中,所述学习参数包括以下各项中的至少一项:学习率、批量大小、以及训练历元的最大数量。
4.根据权利要求3所述的方法,其中,所述学习率介于0.05和0.1之间,所述批量大小介于2幅图像和128幅图像之间,并且所述训练历元的最大数量介于100和200之间。
5.根据权利要求1所述的方法,其中,所述候选参数包括卷积和子采样参数,其中,所述卷积和子采样参数包括卷积滤波器大小、特征映射图数量、以及子采样池大小。
6.根据权利要求5所述的方法,其中,所述卷积滤波器大小介于2×2个像素和114×114个像素之间,第一卷积层中的所述特征映射图数量介于60和512之间,并且所述子采样池大小介于2×2个像素和4×4像素之间。
7.根据权利要求1所述的方法,其中,所述候选参数包括分类器参数,其中,所述分类器参数包括图像输入大小、隐含层的数量、每个隐含层中的单元数量、分类器算法、以及输出种类数量。
8.根据权利要求7所述的方法,其中,所述图像输入大小是等于特征映射图数量和最终卷积层的图像大小的乘积的数量,所述隐含层数量是2,所述每个隐含层中的单元数量介于6个单元和1024个单元之间,分类器算法是多层感知器(MLP)算法,并且所述输出种类数量是3。
9.根据权利要求1所述的方法,其中,确定所述中间CNN是否满足所述验证阈值包括:确定所述中间CNN在所述验证集上的错误率是否小于20%。
10.根据权利要求1所述的方法,其中,中间CNN的所述预先确定数量是25。
11.一种图像处理服务器,包括:
处理器;
存储机器可读指令的存储器,所述机器可读指令使所述处理器:
通过训练电路从受损对象的图像创建训练集;
选择用于卷积神经网络(CNN)的候选架构和候选参数以通过迭代过程对所述图像中的所述对象的损坏程度进行分类,其中,所述迭代过程包括:
通过模型构建器从多个候选架构中选择所述候选架构;
通过所述模型构建器选择用于所选择的候选架构的所述候选参数;
通过所述模型构建器使用所述训练集构建中间CNN;
通过所述验证电路评价所述中间CNN在验证集上的性能,以及
重复所述迭代过程,直到确定预先确定数量的中间CNN满足验证阈值,其中,每个中间CNN对于所选择的候选参数具有不同的值;
通过所述验证电路从预先确定数量的中间CNN创建中间CNN集合,以及
通过分类器对所述验证集中的每个图像中的所述对象的损坏程度进行分类,其中,分类是聚集来自所述中间CNN集合的预测。
12.根据权利要求11所述的图像处理服务器,其中,所述机器可读指令使所述处理器:
选择候选架构,所述候选架构包括分类器类型以及若干卷积层和子采样层。
13.根据权利要求11所述的图像处理服务器,其中,所述机器可读指令使所述处理器选择:
候选参数,所述候选参数包括学习率、批量大小、训练历元的最大数量、卷积滤波器大小、特征映射图数量、子采样池大小、图像输入大小、隐含层数量、每个隐含层中的单元数量、分类器算法、以及输出种类数量。
14.根据权利要求13所述的图像处理服务器,其中,所述机器可读指令使所述处理器:
选择介于0.05和0.1之间的所述学习率、介于2幅图像和128幅图像之间的所述批量大小、介于100和200之间的训练历元的所述最大数量、介于2×2个像素和114×114个像素之间的所述卷积滤波器大小、介于60和512之间的第一卷积层中的所述特征映射图数量、介于2×2像素和4×4像素之间的所述子采样池大小、为2的所述隐含层数量、介于6个单元和1024个单元之间的每个隐含层中的所述单元数量、作为多层感知器(MLP)算法的分类器算法、以及为3的所述输出种类数量。
15.根据权利要求11所述的图像处理服务器,其中,为了确定所述中间CNN是否满足所述验证阈值,所述机器可读指令使所述处理器确定所述中间CNN在验证集上的误差率是否小于20%。
16.根据权利要求11所述的图像处理服务器,其中,中间CNN的所述预先确定数量是25。
17.一种处理数字图像的非暂态计算机可读介质,其包括机器可读指令,所述机器可读指令可由处理器执行以:
选择用于多个卷积神经网络(CNN)的候选架构和候选参数以对所述图像中的所述对象的损坏程度进行分类;
确定预先确定数量的CNN满足验证阈值,其中,每个CNN对于所选择的候选参数具有不同的值;
从所述预先确定数量的CNN中选择CNN集合;
聚集来自所述CNN集合的预测;以及
对所述图像中的所述对象的损坏程度进行分类。
18.根据权利要求17所述的非暂态计算机可读介质,其中,为了选择候选架构,所述机器可读指令能够由所述处理器执行以:
选择候选架构,所述候选架构包括若干个卷积层和子采样层以及分类器类型。
19.根据权利要求17所述的非暂态计算机可读介质,其中,为了选择候选参数,所述机器可读指令能够由所述处理器执行以:
选择候选参数,所述候选参数包括学习率、批量大小、训练历元的最大数量、卷积滤波器大小、特征映射图数量、子采样池大小、图像输入大小、隐含层数量、每个隐含层中的单元数量、分类器算法、以及输出种类数量。
20.根据权利要求19所述的非暂态计算机可读介质,其中,为了选择候选参数,所述机器可读指令能够由所述处理器执行以:
选择介于0.05和0.1之间的所述学习率、介于2幅图像和128幅图像之间的所述批量大小、介于100和200之间的训练历元的所述最大数量、介于2×2个像素和114×114个像素之间的所述卷积滤波器大小、介于60和512之间的第一卷积层中的所述特征映射图数量、介于2×2像素和4×4像素之间的所述子采样池大小、为2的所述隐含层数量、介于6个单元和1024个单元之间的每个隐含层中的所述单元数量、作为多层感知器(MLP)算法的分类器算法、以及为3的所述输出种类数量。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/638,873 | 2015-03-04 | ||
US14/638,873 US9524450B2 (en) | 2015-03-04 | 2015-03-04 | Digital image processing using convolutional neural networks |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105938559A true CN105938559A (zh) | 2016-09-14 |
CN105938559B CN105938559B (zh) | 2019-09-06 |
Family
ID=55588031
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610122298.2A Active CN105938559B (zh) | 2015-03-04 | 2016-03-03 | 使用卷积神经网络的数字图像处理 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9524450B2 (zh) |
EP (1) | EP3065085B1 (zh) |
CN (1) | CN105938559B (zh) |
AU (1) | AU2016201292B2 (zh) |
CA (1) | CA2921672C (zh) |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107451189A (zh) * | 2017-06-20 | 2017-12-08 | 中山大学 | 一种基于哈希编码的无监督图像检索方法 |
CN107480599A (zh) * | 2017-07-19 | 2017-12-15 | 董伟 | 一种基于深度学习算法的共享单车还车管理方法 |
CN108596090A (zh) * | 2018-04-24 | 2018-09-28 | 北京达佳互联信息技术有限公司 | 人脸图像关键点检测方法、装置、计算机设备及存储介质 |
CN109447247A (zh) * | 2018-10-23 | 2019-03-08 | 北京旷视科技有限公司 | 获得卷积神经网络的方法及装置 |
CN109472292A (zh) * | 2018-10-11 | 2019-03-15 | 平安科技(深圳)有限公司 | 一种图像的情感分类方法、存储介质和服务器 |
CN109559302A (zh) * | 2018-11-23 | 2019-04-02 | 北京市新技术应用研究所 | 基于卷积神经网络的管道视频缺陷检测方法 |
CN109635941A (zh) * | 2018-11-06 | 2019-04-16 | 华中科技大学 | 一种基于1t1r存储器件的最大池化处理器 |
CN110121749A (zh) * | 2016-11-23 | 2019-08-13 | 通用电气公司 | 用于图像采集的深度学习医疗系统和方法 |
CN110168477A (zh) * | 2016-11-15 | 2019-08-23 | 奇跃公司 | 用于长方体检测的深度学习系统 |
WO2020000171A1 (en) * | 2018-06-26 | 2020-01-02 | Nokia Technologies Oy | Method and apparatus for computer vision |
CN110663023A (zh) * | 2017-06-02 | 2020-01-07 | 史迪奇菲克斯公司 | 使用人工智能来设计产品 |
CN110660117A (zh) * | 2018-06-28 | 2020-01-07 | 奥多比公司 | 确定图像控键位置 |
CN110909589A (zh) * | 2018-09-18 | 2020-03-24 | 迪尔公司 | 谷粒质量控制系统和方法 |
CN110956190A (zh) * | 2018-09-27 | 2020-04-03 | 深圳云天励飞技术有限公司 | 图像识别方法及装置、计算机装置和计算机可读存储介质 |
CN111051955A (zh) * | 2017-08-15 | 2020-04-21 | 西门子医疗有限公司 | 通过使用卷积神经网络来标识利用数字全息显微镜所获取的细胞图像的品质 |
CN111242070A (zh) * | 2020-01-19 | 2020-06-05 | 上海眼控科技股份有限公司 | 目标物体检测方法、计算机设备和存储介质 |
CN111406267A (zh) * | 2017-11-30 | 2020-07-10 | 谷歌有限责任公司 | 使用性能预测神经网络的神经架构搜索 |
CN111461319A (zh) * | 2019-01-22 | 2020-07-28 | 斯特拉德视觉公司 | 可适应用户要求的基于cnn的对象检测方法及装置 |
CN111507128A (zh) * | 2019-01-30 | 2020-08-07 | 北京沃东天骏信息技术有限公司 | 人脸识别方法、装置、电子设备及可读介质 |
CN111527387A (zh) * | 2017-12-15 | 2020-08-11 | 采埃孚股份公司 | 用于识别构件的损伤的方法和系统 |
CN111553375A (zh) * | 2019-02-08 | 2020-08-18 | Sap欧洲公司 | 使用变换以验证计算机视觉质量 |
CN111602148A (zh) * | 2018-02-02 | 2020-08-28 | 谷歌有限责任公司 | 正则化神经网络架构搜索 |
CN112689843A (zh) * | 2018-07-12 | 2021-04-20 | 菲力尔商业系统公司 | 闭环自动数据集创建系统和方法 |
Families Citing this family (147)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6706788B2 (ja) * | 2015-03-06 | 2020-06-10 | パナソニックIpマネジメント株式会社 | 画像認識方法、画像認識装置およびプログラム |
CN106156807B (zh) * | 2015-04-02 | 2020-06-02 | 华中科技大学 | 卷积神经网络模型的训练方法及装置 |
US10095950B2 (en) * | 2015-06-03 | 2018-10-09 | Hyperverge Inc. | Systems and methods for image processing |
CN105138963A (zh) * | 2015-07-31 | 2015-12-09 | 小米科技有限责任公司 | 图片场景判定方法、装置以及服务器 |
US10282623B1 (en) * | 2015-09-25 | 2019-05-07 | Apple Inc. | Depth perception sensor data processing |
US10296982B1 (en) * | 2015-10-15 | 2019-05-21 | State Farm Mutual Automobile Insurance Company | Using images and voice recordings to facilitate underwriting life insurance |
US11237528B2 (en) * | 2016-02-16 | 2022-02-01 | Ademco Inc. | System and method for handing off the configuration of a building device from a contractor to a customer using a hang tag or the like |
US9965269B2 (en) * | 2016-04-06 | 2018-05-08 | Orcam Technologies Ltd. | Systems and methods for determining and distributing an update to an inference model for wearable apparatuses |
US10740891B1 (en) | 2016-05-20 | 2020-08-11 | Ccc Information Services Inc. | Technology for analyzing images depicting vehicles according to base image models |
US9886771B1 (en) * | 2016-05-20 | 2018-02-06 | Ccc Information Services Inc. | Heat map of vehicle damage |
US10657647B1 (en) | 2016-05-20 | 2020-05-19 | Ccc Information Services | Image processing system to detect changes to target objects using base object models |
US11288789B1 (en) * | 2016-05-20 | 2022-03-29 | Ccc Intelligent Solutions Inc. | Systems and methods for repairing a damaged vehicle using image processing |
US10706321B1 (en) | 2016-05-20 | 2020-07-07 | Ccc Information Services Inc. | Image processing system to align a target object in a target object image with an object model |
US10636148B1 (en) * | 2016-05-20 | 2020-04-28 | Ccc Information Services Inc. | Image processing system to detect contours of an object in a target object image |
US10319094B1 (en) * | 2016-05-20 | 2019-06-11 | Ccc Information Services Inc. | Technology for capturing, transmitting, and analyzing images of objects |
WO2018005542A1 (en) | 2016-06-27 | 2018-01-04 | Omniearth, Inc. | Systems and methods for utilizing property features from images |
US10303977B2 (en) * | 2016-06-28 | 2019-05-28 | Conduent Business Services, Llc | System and method for expanding and training convolutional neural networks for large size input images |
DE112016007110T5 (de) * | 2016-09-06 | 2019-04-18 | Mitsubishi Electric Corporation | Lernvorrichtung, signalverarbeitungsvorrichtung und lernverfahren |
GB2554361B8 (en) * | 2016-09-21 | 2022-07-06 | Emergent Network Intelligence Ltd | Automatic image based object damage assessment |
US10650285B1 (en) | 2016-09-23 | 2020-05-12 | Aon Benfield Inc. | Platform, systems, and methods for identifying property characteristics and property feature conditions through aerial imagery analysis |
WO2018058044A1 (en) * | 2016-09-23 | 2018-03-29 | Aon Benfield Inc. | Platform, systems, and methods for identifying property characteristics and property feature maintenance through aerial imagery analysis |
US11017269B2 (en) * | 2016-09-30 | 2021-05-25 | General Electric Company | System and method for optimization of deep learning architecture |
CN107953329B (zh) * | 2016-10-17 | 2021-06-15 | 中国科学院深圳先进技术研究院 | 物体识别和姿态估计方法、装置及机械臂抓取系统 |
KR102567525B1 (ko) * | 2016-11-17 | 2023-08-16 | 삼성전자주식회사 | 이동 로봇 시스템, 이동 로봇 및 이동 로봇 시스템의 제어 방법 |
US10242443B2 (en) * | 2016-11-23 | 2019-03-26 | General Electric Company | Deep learning medical systems and methods for medical procedures |
KR101834791B1 (ko) * | 2016-12-05 | 2018-03-07 | 대한민국 | 합성곱신경망을 이용한 주자본과 목판본의 분류 정보 제공 방법 |
US10699184B2 (en) * | 2016-12-29 | 2020-06-30 | Facebook, Inc. | Updating predictions for a deep-learning model |
CN110121723B (zh) * | 2016-12-30 | 2024-01-12 | 诺基亚技术有限公司 | 人工神经网络 |
US20200005151A1 (en) * | 2016-12-30 | 2020-01-02 | Nokia Technologies Oy | Artificial neural network |
CN106845383B (zh) * | 2017-01-16 | 2023-06-06 | 腾讯科技(上海)有限公司 | 人头检测方法和装置 |
KR20180092778A (ko) | 2017-02-10 | 2018-08-20 | 한국전자통신연구원 | 실감정보 제공 장치, 영상분석 서버 및 실감정보 제공 방법 |
US10726558B2 (en) * | 2017-02-27 | 2020-07-28 | Dolphin AI, Inc. | Machine learning-based image recognition of weather damage |
GB2560177A (en) | 2017-03-01 | 2018-09-05 | Thirdeye Labs Ltd | Training a computational neural network |
GB2560387B (en) | 2017-03-10 | 2022-03-09 | Standard Cognition Corp | Action identification using neural networks |
US10395141B2 (en) * | 2017-03-20 | 2019-08-27 | Sap Se | Weight initialization for machine learning models |
US10769532B2 (en) * | 2017-04-05 | 2020-09-08 | Accenture Global Solutions Limited | Network rating prediction engine |
US10489887B2 (en) * | 2017-04-10 | 2019-11-26 | Samsung Electronics Co., Ltd. | System and method for deep learning image super resolution |
KR102332525B1 (ko) | 2017-06-01 | 2021-11-29 | 삼성전자주식회사 | 전자 장치 및 그 동작방법 |
US11521045B2 (en) | 2017-06-14 | 2022-12-06 | Knowm, Inc. | Anti-Hebbian and Hebbian (AHAH) computing |
KR102419136B1 (ko) | 2017-06-15 | 2022-07-08 | 삼성전자주식회사 | 다채널 특징맵을 이용하는 영상 처리 장치 및 방법 |
CN107239803A (zh) * | 2017-07-21 | 2017-10-10 | 国家海洋局第海洋研究所 | 利用深度学习神经网络的海底底质自动分类方法 |
CN107368857A (zh) * | 2017-07-24 | 2017-11-21 | 深圳市图芯智能科技有限公司 | 图像对象检测方法、系统及模型处理方法、设备、终端 |
CN107316066B (zh) * | 2017-07-28 | 2021-01-01 | 北京工商大学 | 基于多通路卷积神经网络的图像分类方法及系统 |
US10474925B2 (en) | 2017-07-31 | 2019-11-12 | Industrial Technology Research Institute | Deep neural network with side branches for recognizing and classifying media data and method for using the same |
CN107610091A (zh) * | 2017-07-31 | 2018-01-19 | 阿里巴巴集团控股有限公司 | 车险图像处理方法、装置、服务器及系统 |
US11232687B2 (en) | 2017-08-07 | 2022-01-25 | Standard Cognition, Corp | Deep learning-based shopper statuses in a cashier-less store |
US11200692B2 (en) | 2017-08-07 | 2021-12-14 | Standard Cognition, Corp | Systems and methods to check-in shoppers in a cashier-less store |
US11250376B2 (en) | 2017-08-07 | 2022-02-15 | Standard Cognition, Corp | Product correlation analysis using deep learning |
US10650545B2 (en) | 2017-08-07 | 2020-05-12 | Standard Cognition, Corp. | Systems and methods to check-in shoppers in a cashier-less store |
US10474988B2 (en) * | 2017-08-07 | 2019-11-12 | Standard Cognition, Corp. | Predicting inventory events using foreground/background processing |
US10853965B2 (en) | 2017-08-07 | 2020-12-01 | Standard Cognition, Corp | Directional impression analysis using deep learning |
US10474991B2 (en) | 2017-08-07 | 2019-11-12 | Standard Cognition, Corp. | Deep learning-based store realograms |
CN109426782B (zh) | 2017-08-29 | 2023-09-19 | 北京三星通信技术研究有限公司 | 对象检测方法和用于对象检测的神经网络系统 |
WO2019046599A1 (en) * | 2017-08-31 | 2019-03-07 | Omniearth, Inc. | SYSTEMS AND METHODS FOR AUTOMATIC ESTIMATING OF OBJECT CHARACTERISTICS FROM DIGITAL IMAGES |
KR101934443B1 (ko) * | 2017-09-20 | 2019-01-02 | 대한민국 | 합성곱신경망과 이미지 추출을 이용한 주자본과 목판본의 분류 정보 제공 방법 |
US11094043B2 (en) * | 2017-09-25 | 2021-08-17 | The Regents Of The University Of California | Generation of high dynamic range visual media |
US20210287297A1 (en) | 2017-09-27 | 2021-09-16 | State Farm Mutual Automobile Insurance Company | Automobile Monitoring Systems and Methods for Loss Reserving and Financial Reporting |
US10043113B1 (en) * | 2017-10-04 | 2018-08-07 | StradVision, Inc. | Method and device for generating feature maps by using feature upsampling networks |
US11126914B2 (en) * | 2017-10-11 | 2021-09-21 | General Electric Company | Image generation using machine learning |
US20200279389A1 (en) * | 2017-11-17 | 2020-09-03 | C 3 Limited | Object measurement system |
CN108009579A (zh) * | 2017-11-29 | 2018-05-08 | 合肥寰景信息技术有限公司 | 基于深度学习的特种车辆检测与识别系统 |
WO2019134753A1 (en) * | 2018-01-08 | 2019-07-11 | Siemens Healthcare Gmbh | Biologically-inspired network generation |
US10922871B2 (en) * | 2018-01-19 | 2021-02-16 | Bamtech, Llc | Casting a ray projection from a perspective view |
US11119915B2 (en) | 2018-02-08 | 2021-09-14 | Samsung Electronics Co., Ltd. | Dynamic memory mapping for neural networks |
TWI657346B (zh) * | 2018-02-14 | 2019-04-21 | 倍加科技股份有限公司 | 資料減量及建立資料識別模型的方法、電腦系統及電腦可讀取的記錄媒體 |
US11270168B1 (en) | 2018-03-02 | 2022-03-08 | Autodata Solutions, Inc. | Method and system for vehicle image classification |
US10984503B1 (en) * | 2018-03-02 | 2021-04-20 | Autodata Solutions, Inc. | Method and system for vehicle image repositioning using machine learning |
US10140553B1 (en) | 2018-03-08 | 2018-11-27 | Capital One Services, Llc | Machine learning artificial intelligence system for identifying vehicles |
US20190286984A1 (en) * | 2018-03-13 | 2019-09-19 | Google Llc | Neural architecture search by proxy |
CN110276362A (zh) * | 2018-03-13 | 2019-09-24 | 富士通株式会社 | 训练图像模型的方法和装置以及分类预测方法和装置 |
CN108875752B (zh) * | 2018-03-21 | 2022-06-07 | 北京迈格威科技有限公司 | 图像处理方法和装置、计算机可读存储介质 |
US11265549B2 (en) * | 2018-04-01 | 2022-03-01 | Lg Electronics Inc. | Method for image coding using convolution neural network and apparatus thereof |
US10949676B2 (en) | 2018-04-09 | 2021-03-16 | Accenture Global Solutions Limited | Aerial monitoring system and method for identifying and locating object features |
US11948073B2 (en) | 2018-04-20 | 2024-04-02 | Advanced Micro Devices, Inc. | Machine learning inference engine scalability |
US11367222B2 (en) | 2018-04-20 | 2022-06-21 | Hewlett-Packard Development Company, L.P. | Three-dimensional shape classification and retrieval using convolutional neural networks and majority vote |
US11875251B2 (en) | 2018-05-03 | 2024-01-16 | Samsung Electronics Co., Ltd. | Neural network method and apparatus |
US11048921B2 (en) | 2018-05-09 | 2021-06-29 | Nviso Sa | Image processing system for extracting a behavioral profile from images of an individual specific to an event |
WO2019222135A1 (en) | 2018-05-16 | 2019-11-21 | Benevis Informatics, Llc | Systems and methods for review of computer-aided detection of pathology in images |
CN108681999B (zh) * | 2018-05-22 | 2022-05-31 | 浙江理工大学 | 基于深度卷积神经网络模型的sar图像目标形状生成方法 |
EP3732631A1 (en) * | 2018-05-29 | 2020-11-04 | Google LLC | Neural architecture search for dense image prediction tasks |
US11106911B1 (en) | 2018-06-13 | 2021-08-31 | Pointivo, Inc. | Image acquisition planning systems and methods used to generate information for structures of interest |
US11238506B1 (en) | 2018-06-15 | 2022-02-01 | State Farm Mutual Automobile Insurance Company | Methods and systems for automatic processing of images of a damaged vehicle and estimating a repair cost |
US10832065B1 (en) | 2018-06-15 | 2020-11-10 | State Farm Mutual Automobile Insurance Company | Methods and systems for automatically predicting the repair costs of a damaged vehicle from images |
US20230230166A1 (en) * | 2018-06-15 | 2023-07-20 | State Farm Mutual Automobile Insurance Company | Methods and systems for automatic classification of a level of vehicle damage |
US11120574B1 (en) | 2018-06-15 | 2021-09-14 | State Farm Mutual Automobile Insurance Company | Methods and systems for obtaining image data of a vehicle for automatic damage assessment |
JP6578607B1 (ja) * | 2018-07-18 | 2019-09-25 | ゼアーウィンスリーサービス株式会社 | タイヤパンク修理判定システム、タイヤパンクの保証申請の可否を判断する装置及び、タイヤパンクの保証申請の可否を判断する装置の作動方法 |
US20200034279A1 (en) * | 2018-07-24 | 2020-01-30 | Sap Se | Deep machine learning in software test automation |
CN110795976B (zh) | 2018-08-03 | 2023-05-05 | 华为云计算技术有限公司 | 一种训练物体检测模型的方法、装置以及设备 |
CN109344695B (zh) * | 2018-08-14 | 2022-03-22 | 中山大学 | 一种基于特征选择卷积神经网络的目标重识别方法和装置 |
US10831702B2 (en) | 2018-09-20 | 2020-11-10 | Ceva D.S.P. Ltd. | Efficient utilization of systolic arrays in computational processing |
CN109285112A (zh) | 2018-09-25 | 2019-01-29 | 京东方科技集团股份有限公司 | 基于神经网络的图像处理方法、图像处理装置 |
US11769041B2 (en) | 2018-10-31 | 2023-09-26 | Advanced Micro Devices, Inc. | Low latency long short-term memory inference with sequence interleaving |
GB2578771A (en) * | 2018-11-08 | 2020-05-27 | Robinson Healthcare Ltd | Vaginal speculum |
TWI717655B (zh) * | 2018-11-09 | 2021-02-01 | 財團法人資訊工業策進會 | 適應多物件尺寸之特徵決定裝置及方法 |
KR102200496B1 (ko) * | 2018-12-06 | 2021-01-08 | 주식회사 엘지씨엔에스 | 딥러닝을 이용한 이미지 인식 방법 및 서버 |
KR102641423B1 (ko) * | 2018-12-11 | 2024-02-28 | 삼성전자주식회사 | 영상 처리 장치 및 그 동작방법 |
US10332245B1 (en) * | 2018-12-11 | 2019-06-25 | Capital One Services, Llc | Systems and methods for quality assurance of image recognition model |
US10963757B2 (en) | 2018-12-14 | 2021-03-30 | Industrial Technology Research Institute | Neural network model fusion method and electronic device using the same |
CN111353575A (zh) | 2018-12-20 | 2020-06-30 | 超威半导体公司 | 用于卷积神经网络的图块化格式 |
CN111382757B (zh) * | 2018-12-28 | 2023-09-08 | 深圳市优必选科技有限公司 | 深度学习分类算法中动态调节训练样本的方法及终端设备 |
CN109829484B (zh) * | 2019-01-08 | 2021-10-15 | 深圳禾思众成科技有限公司 | 一种服饰分类方法、设备及计算机可读存储介质 |
US11379967B2 (en) * | 2019-01-18 | 2022-07-05 | Kla Corporation | Methods and systems for inspection of semiconductor structures with automatically generated defect features |
US10509987B1 (en) * | 2019-01-22 | 2019-12-17 | StradVision, Inc. | Learning method and learning device for object detector based on reconfigurable network for optimizing customers' requirements such as key performance index using target object estimating network and target object merging network, and testing method and testing device using the same |
US10410120B1 (en) * | 2019-01-25 | 2019-09-10 | StradVision, Inc. | Learning method and testing method of object detector to be used for surveillance based on R-CNN capable of converting modes according to aspect ratios or scales of objects, and learning device and testing device using the same |
EP3690704B1 (en) | 2019-01-29 | 2021-02-24 | Accenture Global Solutions Limited | Distributed and self-validating dense object detection in digital images |
KR102354674B1 (ko) | 2019-01-29 | 2022-01-24 | 연세대학교 산학협력단 | 요속과 잔뇨를 동시에 측정함으로써 배뇨 장애를 진단하기 위한 방법 및 장치 |
JP7261022B2 (ja) * | 2019-01-30 | 2023-04-19 | キヤノン株式会社 | 情報処理システム、端末装置及びその制御方法、プログラム、記憶媒体 |
US10915809B2 (en) | 2019-02-04 | 2021-02-09 | Bank Of America Corporation | Neural network image recognition with watermark protection |
US11107205B2 (en) | 2019-02-18 | 2021-08-31 | Samsung Electronics Co., Ltd. | Techniques for convolutional neural network-based multi-exposure fusion of multiple image frames and for deblurring multiple image frames |
CN111723918A (zh) * | 2019-03-18 | 2020-09-29 | 超威半导体公司 | 用于卷积内核的自动生成和调谐工具 |
CN110334724B (zh) * | 2019-04-16 | 2022-06-17 | 武汉理工大学 | 基于lstm的遥感对象自然语言描述及多尺度矫正方法 |
US11232575B2 (en) | 2019-04-18 | 2022-01-25 | Standard Cognition, Corp | Systems and methods for deep learning-based subject persistence |
US11062436B2 (en) | 2019-05-10 | 2021-07-13 | Samsung Electronics Co., Ltd. | Techniques for combining image frames captured using different exposure settings into blended images |
KR20200130602A (ko) | 2019-05-10 | 2020-11-19 | 한국전자통신연구원 | 영상 인식 장치, 영상 인식 장치의 동작 방법, 그리고 영상 인식 장치를 포함하는 컴퓨팅 장치 |
EP3977348A4 (en) * | 2019-05-31 | 2022-07-27 | Guangdong Oppo Mobile Telecommunications Corp., Ltd. | NEURAL NETWORK SYSTEMS WITH UNDERSTANDING OF VIDEOS AND METHODS OF USING THEM |
US11860852B1 (en) | 2019-06-03 | 2024-01-02 | State Farm Mutual Automobile Insurance Company | Systems and methods for analyzing veracity of statements |
GB2598244B (en) | 2019-06-07 | 2023-11-29 | Pictometry Int Corp | Systems and methods for automated detection of changes in extent of structures using imagery |
US11095829B2 (en) | 2019-06-11 | 2021-08-17 | Samsung Electronics Co., Ltd. | Apparatus and method for high dynamic range (HDR) image creation of dynamic scenes using graph cut-based labeling |
US12079991B2 (en) | 2019-06-12 | 2024-09-03 | Carnegie Mellon University | Deep-learning models for image processing |
US11386144B2 (en) | 2019-09-09 | 2022-07-12 | Adobe Inc. | Identifying digital attributes from multiple attribute groups within target digital images utilizing a deep cognitive attribution neural network |
CA3149080A1 (en) | 2019-09-20 | 2021-03-25 | Shadrian Strong | Roof condition assessment using machine learning |
WO2021062152A1 (en) | 2019-09-25 | 2021-04-01 | Pictometry International Corp. | Systems and methods for creating automated faux-manual markings on digital images imitating manual inspection results |
AU2020365115A1 (en) | 2019-10-18 | 2022-03-10 | Pictometry International Corp. | Geospatial object geometry extraction from imagery |
CN110866608B (zh) * | 2019-10-31 | 2022-06-07 | 同济大学 | 一种自适应学习率计算方法 |
US11763932B2 (en) | 2019-11-14 | 2023-09-19 | International Business Machines Corporation | Classifying images using deep neural network with integrated acquisition information |
US11334771B2 (en) | 2019-12-12 | 2022-05-17 | Vade Usa, Incorporated | Methods, devices and systems for combining object detection models |
US11676365B2 (en) | 2019-12-16 | 2023-06-13 | Accenture Global Solutions Limited | Explainable artificial intelligence (AI) based image analytic, automatic damage detection and estimation system |
US11687778B2 (en) | 2020-01-06 | 2023-06-27 | The Research Foundation For The State University Of New York | Fakecatcher: detection of synthetic portrait videos using biological signals |
RU2724797C1 (ru) * | 2020-01-22 | 2020-06-25 | Общество с ограниченной ответственностью "Ай Ти Ви групп" | Кассовая система и способ для идентификации блюд на подносе |
US11616760B1 (en) * | 2020-02-20 | 2023-03-28 | Meta Platforms, Inc. | Model thresholds for digital content management and selection |
KR20210132420A (ko) * | 2020-04-27 | 2021-11-04 | 엘지전자 주식회사 | 공기조화기 시스템 및 그 동작 방법 |
US11514530B2 (en) | 2020-05-14 | 2022-11-29 | Ccc Information Services Inc. | Image processing system using convolutional neural networks |
US11587180B2 (en) * | 2020-05-14 | 2023-02-21 | Ccc Information Services Inc. | Image processing system |
US11303853B2 (en) | 2020-06-26 | 2022-04-12 | Standard Cognition, Corp. | Systems and methods for automated design of camera placement and cameras arrangements for autonomous checkout |
US11361468B2 (en) | 2020-06-26 | 2022-06-14 | Standard Cognition, Corp. | Systems and methods for automated recalibration of sensors for autonomous checkout |
CN111751253B (zh) * | 2020-07-06 | 2022-10-14 | 重庆理工大学 | 一种混凝土骨料检测模型的形成方法及质量检测方法 |
US11430094B2 (en) | 2020-07-20 | 2022-08-30 | Samsung Electronics Co., Ltd. | Guided multi-exposure image fusion |
US11537813B1 (en) * | 2020-09-30 | 2022-12-27 | Amazon Technologies, Inc. | System for synthesizing data |
US20240062530A1 (en) * | 2020-12-17 | 2024-02-22 | Trustees Of Tufts College | Deep perceptual image enhancement |
US11838522B2 (en) * | 2020-12-29 | 2023-12-05 | Tencent America LLC | Method and apparatus for video coding |
CN112953565B (zh) * | 2021-01-19 | 2022-06-14 | 华南理工大学 | 一种基于卷积神经网络的归零卷积码译码方法和系统 |
KR20220169373A (ko) * | 2021-06-17 | 2022-12-27 | 센스타임 인터내셔널 피티이. 리미티드. | 타겟 검출 방법들, 장치들, 전자 디바이스들 및 컴퓨터 판독가능한 저장 매체 |
US11417069B1 (en) * | 2021-10-05 | 2022-08-16 | Awe Company Limited | Object and camera localization system and localization method for mapping of the real world |
KR20240110594A (ko) * | 2021-11-01 | 2024-07-15 | 엘지전자 주식회사 | 피쳐 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체 |
US11948119B2 (en) * | 2021-11-30 | 2024-04-02 | Zebra Technologies Corporation | Systems and methods for lost asset management using photo-matching |
WO2023102223A1 (en) * | 2021-12-03 | 2023-06-08 | Innopeak Technology, Inc. | Cross-coupled multi-task learning for depth mapping and semantic segmentation |
US11776206B1 (en) | 2022-12-23 | 2023-10-03 | Awe Company Limited | Extended reality system and extended reality method with two-way digital interactive digital twins |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050185835A1 (en) * | 2004-01-29 | 2005-08-25 | Canon Kabushiki Kaisha | Learning method and device for pattern recognition |
US20090182693A1 (en) * | 2008-01-14 | 2009-07-16 | Halliburton Energy Services, Inc. | Determining stimulation design parameters using artificial neural networks optimized with a genetic algorithm |
CN104217214A (zh) * | 2014-08-21 | 2014-12-17 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 基于可配置卷积神经网络的rgb-d人物行为识别方法 |
US20150139485A1 (en) * | 2013-11-15 | 2015-05-21 | Facebook, Inc. | Pose-aligned networks for deep attribute modeling |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1378855B1 (en) | 2002-07-05 | 2007-10-17 | Honda Research Institute Europe GmbH | Exploiting ensemble diversity for automatic feature extraction |
US7912246B1 (en) * | 2002-10-28 | 2011-03-22 | Videomining Corporation | Method and system for determining the age category of people based on facial images |
AU2003289116A1 (en) * | 2002-12-16 | 2004-07-09 | Canon Kabushiki Kaisha | Pattern identification method, device thereof, and program thereof |
EP3358501B1 (en) * | 2003-07-18 | 2020-01-01 | Canon Kabushiki Kaisha | Image processing device, imaging device, image processing method |
US7809587B2 (en) | 2004-05-07 | 2010-10-05 | International Business Machines Corporation | Rapid business support of insured property using image analysis |
JP4878283B2 (ja) * | 2006-12-22 | 2012-02-15 | キヤノン株式会社 | 特徴検出方法及び装置、プログラム、記憶媒体 |
US8503539B2 (en) * | 2010-02-26 | 2013-08-06 | Bao Tran | High definition personal computer (PC) cam |
CA2883091C (en) * | 2011-08-25 | 2020-02-25 | Cornell University | Retinal encoder for machine vision |
US20140270347A1 (en) * | 2013-03-13 | 2014-09-18 | Sharp Laboratories Of America, Inc. | Hierarchical image classification system |
US9202144B2 (en) * | 2013-10-30 | 2015-12-01 | Nec Laboratories America, Inc. | Regionlets with shift invariant neural patterns for object detection |
JP6582416B2 (ja) * | 2014-05-15 | 2019-10-02 | 株式会社リコー | 画像処理装置、画像処理方法及びプログラム |
US20150347860A1 (en) * | 2014-05-30 | 2015-12-03 | Apple Inc. | Systems And Methods For Character Sequence Recognition With No Explicit Segmentation |
US9251431B2 (en) * | 2014-05-30 | 2016-02-02 | Apple Inc. | Object-of-interest detection and recognition with split, full-resolution image processing pipeline |
US20160034814A1 (en) * | 2014-08-01 | 2016-02-04 | University Of Southern California | Noise-boosted back propagation and deep learning neural networks |
US9568611B2 (en) * | 2014-08-20 | 2017-02-14 | Nec Corporation | Detecting objects obstructing a driver's view of a road |
-
2015
- 2015-03-04 US US14/638,873 patent/US9524450B2/en active Active
-
2016
- 2016-02-23 EP EP16156845.6A patent/EP3065085B1/en active Active
- 2016-02-24 CA CA2921672A patent/CA2921672C/en active Active
- 2016-02-29 AU AU2016201292A patent/AU2016201292B2/en active Active
- 2016-03-03 CN CN201610122298.2A patent/CN105938559B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050185835A1 (en) * | 2004-01-29 | 2005-08-25 | Canon Kabushiki Kaisha | Learning method and device for pattern recognition |
US20090182693A1 (en) * | 2008-01-14 | 2009-07-16 | Halliburton Energy Services, Inc. | Determining stimulation design parameters using artificial neural networks optimized with a genetic algorithm |
US20150139485A1 (en) * | 2013-11-15 | 2015-05-21 | Facebook, Inc. | Pose-aligned networks for deep attribute modeling |
CN104217214A (zh) * | 2014-08-21 | 2014-12-17 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 基于可配置卷积神经网络的rgb-d人物行为识别方法 |
Non-Patent Citations (2)
Title |
---|
DAVID W.OPITZ: "Generating Accurate and Diverse Members of a Neural-Network Ensemble", 《PROCEEDINGS OF THE 8TH INTERNATIONAL CONFERENCE ON NEURAL INFORMATION PROCESSING SYSTEM》 * |
ROBI POLIKAR等: "Learn++: An Incremental Learning Algorithm for Supervised Neural Networks", 《IEEE TRANSACTIONS ON SYSTEMS MAN AND CYBERNETICS PART C (APPLICATIONS AND REVIEWS)》 * |
Cited By (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3542250A4 (en) * | 2016-11-15 | 2020-08-26 | Magic Leap, Inc. | DEPTH LEARNING SYSTEM FOR DETECTION OF RUBBERS |
US10937188B2 (en) | 2016-11-15 | 2021-03-02 | Magic Leap, Inc. | Deep learning system for cuboid detection |
US11328443B2 (en) | 2016-11-15 | 2022-05-10 | Magic Leap, Inc. | Deep learning system for cuboid detection |
US11797860B2 (en) | 2016-11-15 | 2023-10-24 | Magic Leap, Inc. | Deep learning system for cuboid detection |
CN110168477B (zh) * | 2016-11-15 | 2022-07-08 | 奇跃公司 | 用于长方体检测的深度学习系统 |
CN115097937A (zh) * | 2016-11-15 | 2022-09-23 | 奇跃公司 | 用于长方体检测的深度学习系统 |
CN110168477A (zh) * | 2016-11-15 | 2019-08-23 | 奇跃公司 | 用于长方体检测的深度学习系统 |
CN110121749B (zh) * | 2016-11-23 | 2024-02-13 | 通用电气公司 | 用于图像采集的深度学习医疗系统和方法 |
CN110121749A (zh) * | 2016-11-23 | 2019-08-13 | 通用电气公司 | 用于图像采集的深度学习医疗系统和方法 |
CN110663023A (zh) * | 2017-06-02 | 2020-01-07 | 史迪奇菲克斯公司 | 使用人工智能来设计产品 |
US11669776B2 (en) | 2017-06-02 | 2023-06-06 | Stitch Fix, Inc. | Using artificial intelligence to design a product |
CN110663023B (zh) * | 2017-06-02 | 2023-07-14 | 史迪奇菲克斯公司 | 用于优化计算机机器学习的方法和系统 |
CN107451189A (zh) * | 2017-06-20 | 2017-12-08 | 中山大学 | 一种基于哈希编码的无监督图像检索方法 |
CN107480599A (zh) * | 2017-07-19 | 2017-12-15 | 董伟 | 一种基于深度学习算法的共享单车还车管理方法 |
US11580640B2 (en) | 2017-08-15 | 2023-02-14 | Siemens Healthcare Gmbh | Identifying the quality of the cell images acquired with digital holographic microscopy using convolutional neural networks |
CN111051955A (zh) * | 2017-08-15 | 2020-04-21 | 西门子医疗有限公司 | 通过使用卷积神经网络来标识利用数字全息显微镜所获取的细胞图像的品质 |
CN111051955B (zh) * | 2017-08-15 | 2022-04-15 | 西门子医疗有限公司 | 通过使用卷积神经网络来标识利用数字全息显微镜所获取的细胞图像的品质 |
US11227386B2 (en) | 2017-08-15 | 2022-01-18 | Siemens Healthcare Gmbh | Identifying the quality of the cell images acquired with digital holographic microscopy using convolutional neural networks |
CN111406267B (zh) * | 2017-11-30 | 2024-06-04 | 谷歌有限责任公司 | 使用性能预测神经网络的神经架构搜索 |
CN111406267A (zh) * | 2017-11-30 | 2020-07-10 | 谷歌有限责任公司 | 使用性能预测神经网络的神经架构搜索 |
CN111527387A (zh) * | 2017-12-15 | 2020-08-11 | 采埃孚股份公司 | 用于识别构件的损伤的方法和系统 |
CN111602148A (zh) * | 2018-02-02 | 2020-08-28 | 谷歌有限责任公司 | 正则化神经网络架构搜索 |
CN111602148B (zh) * | 2018-02-02 | 2024-04-02 | 谷歌有限责任公司 | 正则化神经网络架构搜索 |
US11669744B2 (en) | 2018-02-02 | 2023-06-06 | Google Llc | Regularized neural network architecture search |
CN108596090A (zh) * | 2018-04-24 | 2018-09-28 | 北京达佳互联信息技术有限公司 | 人脸图像关键点检测方法、装置、计算机设备及存储介质 |
US11386287B2 (en) | 2018-06-26 | 2022-07-12 | Nokia Technologies Oy | Method and apparatus for computer vision |
CN112313662A (zh) * | 2018-06-26 | 2021-02-02 | 诺基亚技术有限公司 | 用于计算机视觉的方法和装置 |
WO2020000171A1 (en) * | 2018-06-26 | 2020-01-02 | Nokia Technologies Oy | Method and apparatus for computer vision |
CN110660117B (zh) * | 2018-06-28 | 2024-05-24 | 奥多比公司 | 确定图像控键位置 |
CN110660117A (zh) * | 2018-06-28 | 2020-01-07 | 奥多比公司 | 确定图像控键位置 |
CN112689843B (zh) * | 2018-07-12 | 2023-11-17 | 泰立戴恩菲力尔商业系统公司 | 闭环自动数据集创建系统和方法 |
CN112689843A (zh) * | 2018-07-12 | 2021-04-20 | 菲力尔商业系统公司 | 闭环自动数据集创建系统和方法 |
CN110909589A (zh) * | 2018-09-18 | 2020-03-24 | 迪尔公司 | 谷粒质量控制系统和方法 |
CN110956190A (zh) * | 2018-09-27 | 2020-04-03 | 深圳云天励飞技术有限公司 | 图像识别方法及装置、计算机装置和计算机可读存储介质 |
CN109472292B (zh) * | 2018-10-11 | 2024-08-20 | 平安科技(深圳)有限公司 | 一种图像的情感分类方法、存储介质和服务器 |
CN109472292A (zh) * | 2018-10-11 | 2019-03-15 | 平安科技(深圳)有限公司 | 一种图像的情感分类方法、存储介质和服务器 |
CN109447247A (zh) * | 2018-10-23 | 2019-03-08 | 北京旷视科技有限公司 | 获得卷积神经网络的方法及装置 |
CN109447247B (zh) * | 2018-10-23 | 2021-11-16 | 北京旷视科技有限公司 | 获得用于图像处理任务的卷积神经网络的方法及装置 |
CN109635941B (zh) * | 2018-11-06 | 2022-02-15 | 华中科技大学 | 一种基于1t1r存储器件的最大池化处理器 |
CN109635941A (zh) * | 2018-11-06 | 2019-04-16 | 华中科技大学 | 一种基于1t1r存储器件的最大池化处理器 |
CN109559302A (zh) * | 2018-11-23 | 2019-04-02 | 北京市新技术应用研究所 | 基于卷积神经网络的管道视频缺陷检测方法 |
CN111461319B (zh) * | 2019-01-22 | 2023-04-18 | 斯特拉德视觉公司 | 可适应用户要求的基于cnn的对象检测方法及装置 |
CN111461319A (zh) * | 2019-01-22 | 2020-07-28 | 斯特拉德视觉公司 | 可适应用户要求的基于cnn的对象检测方法及装置 |
CN111507128A (zh) * | 2019-01-30 | 2020-08-07 | 北京沃东天骏信息技术有限公司 | 人脸识别方法、装置、电子设备及可读介质 |
CN111553375A (zh) * | 2019-02-08 | 2020-08-18 | Sap欧洲公司 | 使用变换以验证计算机视觉质量 |
CN111553375B (zh) * | 2019-02-08 | 2024-04-05 | Sap欧洲公司 | 使用变换以验证计算机视觉质量 |
CN111242070A (zh) * | 2020-01-19 | 2020-06-05 | 上海眼控科技股份有限公司 | 目标物体检测方法、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CA2921672A1 (en) | 2016-09-04 |
CA2921672C (en) | 2019-03-05 |
EP3065085A1 (en) | 2016-09-07 |
AU2016201292A1 (en) | 2016-09-22 |
AU2016201292B2 (en) | 2017-05-04 |
CN105938559B (zh) | 2019-09-06 |
EP3065085B1 (en) | 2020-04-01 |
US20160259994A1 (en) | 2016-09-08 |
US9524450B2 (en) | 2016-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105938559A (zh) | 使用卷积神经网络的数字图像处理 | |
US12062249B2 (en) | System and method for generating image landmarks | |
CN110020592B (zh) | 物体检测模型训练方法、装置、计算机设备及存储介质 | |
US9542621B2 (en) | Spatial pyramid pooling networks for image processing | |
CN110163813B (zh) | 一种图像去雨方法、装置、可读存储介质及终端设备 | |
EP3477550A1 (en) | Vehicle license plate classification method and system based on deep learning, electronic apparatus, and storage medium | |
CN109960742B (zh) | 局部信息的搜索方法及装置 | |
CN105122270A (zh) | 使用深度传感器计数人的方法和系统 | |
CN104866868A (zh) | 基于深度神经网络的金属币识别方法和装置 | |
CN111738403B (zh) | 一种神经网络的优化方法及相关设备 | |
CN107784288A (zh) | 一种基于深度神经网络的迭代定位式人脸检测方法 | |
JP2024513596A (ja) | 画像処理方法および装置、ならびにコンピュータ可読ストレージ媒体 | |
CN111915618B (zh) | 基于峰值响应增强的实例分割算法、计算设备 | |
CN116363037B (zh) | 一种多模态图像融合方法、装置及设备 | |
CN114897136A (zh) | 多尺度注意力机制方法及模块和图像处理方法及装置 | |
CN114255377A (zh) | 一种智能货柜的差异商品检测分类方法 | |
Shit et al. | An encoder‐decoder based CNN architecture using end to end dehaze and detection network for proper image visualization and detection | |
CN114743187A (zh) | 银行安全控件自动登录方法、系统、设备及存储介质 | |
CN114120454A (zh) | 活体检测模型的训练方法、装置、电子设备及存储介质 | |
CN116071625B (zh) | 深度学习模型的训练方法、目标检测方法及装置 | |
CN118115932A (zh) | 图像回归器训练方法与相关方法、装置、设备及介质 | |
CN117197653A (zh) | 基于深度学习的滑坡灾害识别方法及系统 | |
CN116758419A (zh) | 针对遥感图像的多尺度目标检测方法、装置和设备 | |
CN115797990A (zh) | 图像分类、图像处理方法、装置和存储介质 | |
CN112133100A (zh) | 一种基于r-cnn的车辆检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |