[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN111079833B - 图像识别方法、装置以及计算机可读存储介质 - Google Patents

图像识别方法、装置以及计算机可读存储介质 Download PDF

Info

Publication number
CN111079833B
CN111079833B CN201911293876.9A CN201911293876A CN111079833B CN 111079833 B CN111079833 B CN 111079833B CN 201911293876 A CN201911293876 A CN 201911293876A CN 111079833 B CN111079833 B CN 111079833B
Authority
CN
China
Prior art keywords
image
recognition model
training
convolution kernel
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911293876.9A
Other languages
English (en)
Other versions
CN111079833A (zh
Inventor
李悦翔
陈嘉伟
郑冶枫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Healthcare Shenzhen Co Ltd
Original Assignee
Tencent Healthcare Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Healthcare Shenzhen Co Ltd filed Critical Tencent Healthcare Shenzhen Co Ltd
Priority to CN201911293876.9A priority Critical patent/CN111079833B/zh
Publication of CN111079833A publication Critical patent/CN111079833A/zh
Application granted granted Critical
Publication of CN111079833B publication Critical patent/CN111079833B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例公开了一种图像识别方法、装置以及计算机可读存储介质,其中,该图像识别方法包括:采集多个标注了区域类型特征的图像样本,通过所述图像样本对预设初始识别模型进行训练,得到训练后识别模型,计算训练后识别模型与已训练的图像识别模型之间的相似度,所述图像识别模型由多个标注了区域类型特征的自然图像样本训练得到的,基于相似度对图像识别模型对应的权重参数进行更新,得到更新后图像识别模型,从多个图像样本中选择用于模型训练的图像样本,并通过选择到的图像样本对更新后图像识别模型进行训练,得到目标识别模型,通过目标识别模型对待识别图像进行识别,该方案提高图像识别的准确率。

Description

图像识别方法、装置以及计算机可读存储介质
技术领域
本发明涉及计算机技术领域,具体涉及一种图像识别方法、装置以及计算机可读存储介质。
背景技术
随着人工智能(AI,Artificial Intelligence)技术研究和进步,AI技术在多个领域展开研究和应用,比如,会在移动前端设备如智能相机、无人机以及机器人等计算资源有限的设备上部署卷积神经网络,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。
以图像识别为例,目前,通常利用图像样本训练一个卷积神经网络,再根据该卷积神经网络对图像进行识别,在训练卷积神经网络时,所使用的图像样本通常需要经过像素级标注,比如对人脸图像的局部区域如眼睛、鼻子或嘴唇进行标注,然而,对于一些特殊的图像而言如医学图像或遥感图像,由于其标注的难度大,导致这些图像样本的数量较少,且导致其训练出来的模型的精度并不高,从而导致识别的准确率也不高。
发明内容
本发明实施例提供一种图像识别方法、装置以及计算机可读存储介质,可以提高对图像识别的准确率。
本发明实施例提供了一种图像识别方法,包括:
采集多个标注了区域类型特征的图像样本;
通过所述图像样本对预设初始识别模型进行训练,得到训练后识别模型;
计算训练后识别模型与已训练的图像识别模型之间的相似度,所述图像识别模型由多个标注了区域类型特征的自然图像样本训练得到的;
基于相似度对图像识别模型对应的权重参数进行更新,得到更新后图像识别模型;
从多个图像样本中选择用于模型训练的图像样本,并通过选择到的图像样本对更新后图像识别模型进行训练,得到目标识别模型;
通过目标识别模型对待识别图像进行识别。
相应的,本发明实施例还提供了一种图像识别装置,包括:
采集模块,用于采集多个标注了区域类型特征的图像样本;
第一训练模块,用于通过所述图像样本对预设初始识别模型进行训练,得到训练后识别模型;
计算模块,用于计算训练后识别模型与已训练的图像识别模型之间的相似度,所述图像识别模型由多个标注了区域类型特征的自然图像样本训练得到的;
更新模块,用于基于相似度对图像识别模型对应的权重参数进行更新,得到更新后图像识别模型;
第二训练模块,用于从多个图像样本中选择用于模型训练的图像样本,并通过选择到的图像样本对更新后图像识别模型进行训练,得到目标识别模型;
识别模块,用于通过目标识别模型对待识别图像进行识别。
可选的,在本发明的一些实施例中,所述计算模块包括:
提取单元,用于提取图像识别模型中对应的多个卷积核,得到多个第一卷积核,以及提取训练后识别模型对应的多个卷积核,得到多个第二卷积核;
计算单元,用于分别计算每个第一卷积核与各第二卷积核之间的相似度,得到计算结果。
可选的,在本发明的一些实施例中,所述计算单元具体用于:
提取每个第一卷积核对应的权重信息,得到多个第一权重信息,以及;
提取每个第二卷积核对应的权重信息,得到多个第二权重信息;
分别计算每个第一权重信息与各第二权重信息之间的相似度,得到计算结果。
可选的,在本发明的一些实施例中,所述更新模块包括:
确定单元,用于基于计算结果从多个第一卷积核中确定满足预设条件的第一卷积核,得到目标卷积核;
更新单元,用于通过所述目标卷积核对图像识别模型对应的权重参数进行更新,得到更新后图像识别模型。
可选的,在本发明的一些实施例中,所述更新单元具体用于:
对图像识别模型中除目标卷积核的其余卷积核的权重参数进行初始化处理,得到处理后权重参数;
通过所述目标卷积核对应的权重参数以及处理后权重参数,生成更新后图像识别模型。
可选的,在本发明的一些实施例中,所述第一训练模块具体用于:
从多个图像样本中选择与预置策略对应数量的图像样本,得到目标图像样本;
通过所述目标图像样本对更新后图像识别模型进行训练,得到目标识别模型。
可选的,在本发明的一些实施例中,所述第二训练模块具体用于:
从采集到的多个图像样本中确定当前需要进行训练的图像样本,得到当前处理对象;
将所述当前处理对象导入预设初始识别模型中进行训练,得到当前处理对象对应的区域预测值;
将当前处理对象对应的区域预测值与当前处理对象的标注的区域类型特征进行收敛,以对所述预设初始识别模型的参数进行调整;
返回执行从采集到的多个图像样本中确定当前需要进行训练的图像样本的步骤,直至所述多个图像样本均训练完毕。
可选的,在本发明的一些实施例中,所述采集模块具体用于:
采集多个图像样本;
采用邻域局部典型区域标注法对采集到的多个图像样本进行标注,得到多个标注了区域类型特征的图像样本。
本发明实施例在采集多个标注了区域类型特征的图像样本后,通过所述图像样本对预设初始识别模型进行训练,得到训练后识别模型,然后,计算训练后识别模型与已训练的图像识别模型之间的相似度,所述图像识别模型由多个标注了区域类型特征的自然图像样本训练得到的,接着,基于相似度对图像识别模型对应的权重参数进行更新,得到更新后图像识别模型,再然后,从多个图像样本中选择用于模型训练的图像样本,并通过选择到的图像样本对更新后图像识别模型进行训练,得到目标识别模型,最后,通过目标识别模型对待识别图像进行识别。该方案可以提高对图像识别的准确率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a是本发明实施例提供的图像识别方法的场景示意图;
图1b是本发明实施例提供的图像识别方法的流程示意图;
图2a是本发明实施例提供的图像识别方法的另一流程示意图;
图2b是本发明实施例提供的两个10层的模型之间的相似度的示意图;
图2c是本发明实施例提供的结构为14层的模型与结构为32层的模型之间的表达相似度的示意图;
图3是本发明实施例提供的图像识别装置的结构示意图;
图4是本发明实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种图像识别装置,以下简称识别装置,该识别装置具体可以集成在终端或服务器中,终端可以包括平板电脑、笔记本电脑或个人计算机(PC,PersonalComputer)等,服务器可以包括一个独立运行的服务器或者分布式服务器,也可以包括由多个服务器组成的服务器集群。
例如,请参阅图1a,该用户行为预测装置集成在服务器上,服务器在采集多个标注了区域类型特征的图像样本后,通过图像样本对预设初始识别模型进行训练,得到训练后识别模型,然后,计算训练后识别模型与已训练的图像识别模型之间的相似度,其中,图像识别模型由多个标注了区域类型特征的自然图像样本训练得到的,接着,基于相似度对图像识别模型对应的权重参数进行更新,得到更新后图像识别模型,再然后,从多个图像样本中选择用于模型训练的图像样本,并通过选择到的图像样本对更新后图像识别模型进行训练,得到目标识别模型,最后,通过目标识别模型对待识别图像进行识别。
由于该方案是计算训练后识别模型与已训练的图像识别模型之间的相似度,通过该相似度对图像识别模型对应的权重参数进行更新,更新后图像识别模型对图像具有一定的识别能力,之后,从多个图像样本中选择用于模型训练的图像样本,并通过选择到的图像样本对更新后图像识别模型进行训练,得到目标识别模型,降低了用于模型训练的图像样本的数量,进而提高了模型的训练速度,因此,相对于现有方案而言,本方案可以提高模型的精度和识别准确率,改善识别效果。
以下分别进行详细说明。需说明的是,以下实施例的描述顺序不作为对实施例优先顺序的限定。
一种图像识别方法,包括:采集多个标注了区域类型特征的图像样本,通过图像样本对预设初始识别模型进行训练,得到训练后识别模型,计算训练后识别模型与已训练的图像识别模型之间的相似度,基于相似度对图像识别模型对应的权重参数进行更新,得到更新后图像识别模型,从多个图像样本中选择用于模型训练的图像样本,并通过选择到的图像样本对更新后图像识别模型进行训练,得到目标识别模型,通过目标识别模型对待识别图像进行识别。
请参阅图1b,图1b为本发明实施例提供的图像识别方法的流程示意图。该图像识别方法的具体流程可以如下:
101、采集多个标注了区域类型特征的图像样本。
例如,具体可以采集多个图像样本,然后,采用邻域局部典型区域标注法对采集到的多个图像样本进行标注,得到多个标注了区域类型特征的图像样本,即,可选的,在一些实施例中,步骤“采集多个标注了区域类型特征的图像样本”,具体可以包括:
(11)采集多个图像样本;
(12)采用邻域局部典型区域标注法对采集到的多个图像样本进行标注,得到多个标注了区域类型特征的图像样本.
其中,采集的途径可以有多种,比如,可以从互联网、指定数据库和/或医疗记录中进行获取,具体可以根据实际应用的需求而定;同理,标注方式也可以根据实际应用的需求进行选择,比如,可以在专业医生的指点下,由标注审核人员进行人工标注,或者,也可以通过训练标注模型来实现自动标注,等等,在此不作赘述。
102、通过图像样本对预设初始识别模型进行训练,得到训练后识别模型。
例如,具体的,可以将图像样本导入预设初始识别模型中,得到该图像样本对应的区域预测值,然后,通过区域类型特征和区域预测值进行收敛,以对预设初始识别模型的参数进行调整,即,步骤“通过图像样本对预设初始识别模型进行训练,得到训练后识别模型”,具体可以包括:
(21)从采集到的多个图像样本中确定当前需要进行训练的图像样本,得到当前处理对象;
(22)将当前处理对象导入预设初始识别模型中进行训练,得到当前处理对象对应的区域预测值;
(23)将当前处理对象对应的区域预测值与当前处理对象的标注的区域类型特征进行收敛,以对预设初始识别模型的参数进行调整;
(24)返回执行从采集到的多个图像样本中确定当前需要进行训练的图像样本的步骤,直至多个图像样本均训练完毕。
其中,该初始识别模型可以根据实际应用的需求进行设定,比如,,该初始识别模型可以包括包括四个卷积层和一个全连接层。
卷积层:主要用于对图像样本进行特征提取,其中,卷积核大小可以根据实际应用而定,比如,从第一层卷积层至第四层卷积层的卷积核大小依次可以为(7,7),(5,5),(3,3),(3,3);可选的,为了降低计算的复杂度,提高计算效率,在本实施例中,这四层卷积层的卷积核大小可以都设置为(3,3),激活函数均采用“relu(线性整流函数,Rectified LinearUnit)”,而padding(padding,指属性定义元素边框与元素内容之间的空间)方式均设置为“same”,“same”填充方式可以简单理解为以0填充边缘,左边(上边)补0的个数和右边(下边)补0的个数一样或少一个。可选的,卷积层与卷积层之间可以通过直连的方式连接,从而加快网络收敛速度,为了进一步减少计算量,还可以在第二至第四层卷积层中的所有层或任意1~2层进行下采样(pooling)操作,该下采样操作与卷积的操作基本相同,只不过下采样的卷积核为只取对应位置的最大值(max pooling)或平均值(average pooling)等,为了描述方便,在本发明实施例中,将均以在第二层卷积层和第三次卷积层中进行下采样操作,且该下采样操作具体为max pooling为例进行说明。
需说明的是,为了描述方便,在本发明实施例中,将激活函数所在层和下采样层(也称为池化层)均归入卷积层中,应当理解的是,也可以认为该结构包括卷积层、激活函数所在层、下采样层(即池化层)和全连接层,当然,还可以包括用于输入数据的输入层和用于输出数据的输出层,在此不再赘述。
全连接层:可以将学到的特征映射到样本标记空间,其在整个卷积神经网络中主要起到“分类器”的作用,全连接层的每一个结点都与上一层(如卷积层中的下采样层)输出的所有结点相连,其中,全连接层的一个结点即称为全连接层中的一个神经元,全连接层中神经元的数量可以根据实际应用的需求而定,可选的,在全连接层中,也可以通过加入激活函数来加入非线性因素,比如,可以加入激活函数sigmoid(S型函数)。
103、计算训练后识别模型与已训练的图像识别模型之间的相似度。
其中,图像识别模型由多个标注了区域类型特征的自然图像样本训练得到的,在本发明实施例中,可以通过衡量网络表达相似度的度量函数如中心内核对齐指数(Centered kernel alignment,CKA),表征训练后识别模型与已训练的图像识别模型之间的相似度,CKA可以用于揭示基于不同随机初始化训练的卷积神经网络的不同卷积核之间的关系,比如,基于预设独立性准则如希尔伯特-施密特独立性算子(Hilbert-SchmidtIndependence Criterion,HSIC)通过CKA对训练后识别模型中的卷积核A和已训练的图像识别模型中的卷积核B进行网络表达相似度估计,其表达式如下:
Figure BDA0002319964620000081
即,可选的,在一些实施例中,步骤“计算训练后识别模型与已训练的图像识别模型之间的相似度”,具体可以包括:
(31)提取图像识别模型中对应的多个卷积核,得到多个第一卷积核,以及提取训练后识别模型对应的多个卷积核,得到多个第二卷积核;
(32)分别计算每个第一卷积核与各第二卷积核之间的相似度,得到计算结果。
在卷积神经网络中,权重参数是一个非常重要的概念,卷积层一般会用到多个不同的卷积核,每个卷积核都有对应的权重参数,该权重参数利用图像的局部相关性,提取和强化图像的特征,可以理解的是,第一卷积核与第二卷积核之间的相似度可以通过第一卷积核对应的权重参数与第二卷积核对应的权重参数之间的相似度来体现,即,可选的,在一些实施例中,步骤“分别计算每个第一卷积核与各第二卷积核之间的相似度,得到计算结果”,具体可以包括:
(41)提取每个第一卷积核对应的权重信息,得到多个第一权重信息,以及提取每个第二卷积核对应的权重信息,得到多个第二权重信息;
(42)分别计算每个第一权重信息与各第二权重信息之间的相似度,得到计算结果。
104、基于相似度对图像识别模型对应的权重参数进行更新,得到更新后图像识别模型。
其中,可以根据该步骤103得到的计算结果调整图像识别模型的权重参数,即步骤“基于相似度对图像识别模型对应的权重参数进行更新,得到更新后图像识别模型”,具体可以包括:基于计算结果对图像识别模型对应的权重参数进行更新,得到更新后图像识别模型。
具体的,可以根据计算结果从多个第一卷积核中确定满足预设条件的第一卷积核,得到目标卷积核,然后,通过目标卷积核对图像识别模型对应的权重参数进行更新,得到更新后图像识别模型,即,在一些实施例中,步骤“基于计算结果对图像识别模型对应的权重参数进行更新,得到更新后图像识别模型”,具体可以包括:
(51)基于计算结果从多个第一卷积核中确定满足预设条件的第一卷积核,得到目标卷积核;
(52)通过目标卷积核对图像识别模型对应的权重参数进行更新,得到更新后图像识别模型。
比如,图像识别模型包括5个第一卷积核,训练后识别模型也包括第二卷积核b1、第二卷积核b2、第二卷积核b3、第二卷积核b4以及第二卷积核b5,其中,图像识别模型中的一个第一卷积核a与各第二卷积核的相似度分别为:60%、10%、20%、13%以及16%,预设条件为相似度大于50%,那么可以确定该第一卷积核a为目标卷积核。
其中,通过目标卷积核对图像识别模型对应的权重参数进行更新的方式有很多种,其中,第一种方式可以为:在图像识别模型中保留目标卷积核的权重参数,并且,将目标卷积核相邻的其余卷积核调整至该目标卷积核对应的权重参数,比如,图像识别模型中有6个卷积核,分别为第一卷积核a1、第一卷积核a2、第一卷积核a3、第一卷积核a4、第一卷积核a5以及第一卷积核a6,其中,第一卷积核a2和第一卷积核a6均为目标卷积核,那么,可以分别将第一卷积核a1对应的权重参数以及第一卷积核a3对应的权重参数调整至第一卷积核a2对应的权重参数,将第一卷积核a5对应的权重参数调整至第一卷积核a6对应的权重参数,需要说明的是,对于不相邻的第一卷积核(在本实施例中为第一卷积核a4),可以将第一卷积核a4对应的权重参数进行随机初始化。
可选的,第二种方式可以为:根据目标卷积核对图像识别模型进行剪枝操作,即,对图像识别模型中除目标卷积核的其余卷积核的权重参数进行初始化处理,也即,步骤“通过目标卷积核对图像识别模型对应的权重参数进行更新,得到更新后图像识别模型”,具体可以包括:
(61)对图像识别模型中除目标卷积核的其余卷积核的权重参数进行初始化处理,得到处理后权重参数;
(62)通过目标卷积核对应的权重参数以及处理后权重参数,生成更新后图像识别模型。
以图像识别模型包括第一卷积核a1、第一卷积核a2、第一卷积核a3、第一卷积核a4、第一卷积核a5以及第一卷积核a6为例,其中,第一卷积核a2和第一卷积核a6均为目标卷积核,那么,可以保留第一卷积核a2对应的权重参数以及第一卷积核a6对应的权重参数,分别第一卷积核a1、第一卷积核a3、第一卷积核a4以及第一卷积核a5进行权重参数调整,即,对图像识别模型中除目标卷积核的其余卷积核的权重参数进行初始化处理,得到处理后权重参数,然后,根据目标卷积核对应的权重参数以及处理后权重参数,生成更新后图像识别模型。
需要说明的是,对图像识别模型中除目标卷积核的其余卷积核的权重参数进行初始化处理的方式可以为随机初始化,一般是将需要进行初始化的权重参数调整至服从高斯分布或均匀分布的值。
在本发明实施例中,保留目标卷积核对应的权重参数,使得图像识别模型对图像具有一定的识别能力,并且,对除目标卷积核的其余卷积核的权重参数进行初始化处理,可以过滤掉一些在自然图像上有效,但对图像处理造成干扰的冗余特征,能够更好的提升图像识别模型对图像进行识别的能力。
105、从多个图像样本中选择用于模型训练的图像样本,并通过选择到的图像样本对更新后图像识别模型进行训练,得到目标识别模型。
其中,对更新后图像识别模型进行训练可以采用全部的图像样本,由于图像识别模型对图像具有一定的识别能力,因此,可以采用少量的样本图像对更新后图像识别模型进行训练,所采用的样本图像的数量可以通过预置策略确定,即,步骤“从多个图像样本中选择用于模型训练的图像样本,并通过选择到的图像样本对更新后图像识别模型进行训练,得到目标识别模型”,具体可以包括:
(71)从多个图像样本中选择与预置策略对应数量的图像样本,得到目标图像样本;
(72)通过目标图像样本对更新后图像识别模型进行训练,得到目标识别模型。
其中,预置策略可以根据实际情况进行设置,比如,可以设置为从多个图像样本中选取50%数量的图像样本,也可以设置为从多个图像样本中选取10%数量的图像样本。
106、通过目标初始识别模型对待识别图像进行识别。
本发明实施例在采集多个标注了区域类型特征的图像样本后,通过图像样本对预设初始识别模型进行训练,得到训练后识别模型,然后,计算训练后识别模型与已训练的图像识别模型之间的相似度,接着,基于相似度对图像识别模型对应的权重参数进行更新,得到更新后图像识别模型,再然后,从多个图像样本中选择用于模型训练的图像样本,并通过选择到的图像样本对更新后图像识别模型进行训练,得到目标识别模型,最后,通过目标识别模型对待识别图像进行识别。由于该方案是计算训练后识别模型与已训练的图像识别模型之间的相似度,通过该相似度对图像识别模型对应的权重参数进行更新,更新后图像识别模型对图像具有一定的识别能力,之后,从多个图像样本中选择用于模型训练的图像样本,并通过选择到的图像样本对更新后图像识别模型进行训练,得到目标识别模型,降低了用于模型训练的图像样本的数量,进而提高了模型的训练速度,因此,相对于现有方案而言,本方案可以提高模型的精度和识别准确率,改善识别效果。
根据实施例所述的方法,以下将举例进一步详细说明。
在本实施例中将以该图像识别装置具体集成在服务器中为例进行说明。
请参阅图2a,一种图像识别方法,具体流程可以如下:
201、服务器采集多个标注了区域类型特征的图像样本。
例如,具体的,服务器可以采集多个图像样本,然后,采用邻域局部典型区域标注法对采集到的多个图像样本进行标注,得到多个标注了区域类型特征的图像样本。
其中,采集的途径可以有多种,比如,服务器可以从互联网、指定数据库和/或医疗记录中进行获取,具体可以根据实际应用的需求而定。
202、服务器通过图像样本对预设初始识别模型进行训练,得到训练后识别模型。
例如,具体的,服务器可以将图像样本导入预设初始识别模型中,得到该图像样本对应的区域预测值,然后,通过区域类型特征和区域预测值进行收敛,以对预设初始识别模型的参数进行调整。
203、服务器计算训练后识别模型与已训练的图像识别模型之间的相似度。
其中,图像识别模型由多个标注了区域类型特征的自然图像样本训练得到的,在本发明实施例中,可以通过衡量网络表达相似度的度量函数如中心内核对齐指数(Centered kernel alignment,CKA),表征训练后识别模型与已训练的图像识别模型之间的相似度,CKA可以用于揭示基于不同随机初始化训练的卷积神经网络的不同卷积核之间的关系,请参阅图2b与图2c,图2b为两个10层的模型之间的相似度的示意图,图2c为结构为14层的模型与结构为32层的模型之间的表达相似度的示意图。其中,图中的横纵坐标分别代表与其对应的模型结构的成熟,图中用阴影线的密集度表征两个模型对应的卷积核之间的相似度,图中密集部分代表两个卷积核的表达相似度较高可选的,在一些实施例中,两个模型对应的卷积核之间的相似度大于50%则可以认为这两个卷积核对应的权重参数相似。
204、服务器基于相似度对图像识别模型对应的权重参数进行更新,得到更新后图像识别模型。
其中,服务器可以基于计算结果对图像识别模型对应的权重参数进行更新,得到更新后图像识别模型,具体的,服务器可以根据计算结果从多个第一卷积核中确定满足预设条件的第一卷积核,得到目标卷积核,然后,服务器可以通过目标卷积核对图像识别模型对应的权重参数进行更新,得到更新后图像识别模型。
可选的,服务器可以根据目标卷积核对图像识别模型进行剪枝操作,即,对图像识别模型中除目标卷积核的其余卷积核的权重参数进行初始化处理。以图像识别模型包括第一卷积核a1、第一卷积核a2、第一卷积核a3、第一卷积核a4、第一卷积核a5以及第一卷积核a6为例,其中,第一卷积核a2和第一卷积核a6均为目标卷积核,那么,服务器可以保留第一卷积核a2对应的权重参数以及第一卷积核a6对应的权重参数,服务器分别对第一卷积核a1、第一卷积核a3、第一卷积核a4以及第一卷积核a5进行权重参数调整,即,服务器对图像识别模型中除目标卷积核的其余卷积核的权重参数进行初始化处理,得到处理后权重参数,然后,服务器根据目标卷积核对应的权重参数以及处理后权重参数,生成更新后图像识别模型。
205、服务器从多个图像样本中选择用于模型训练的图像样本,并通过选择到的图像样本对更新后图像识别模型进行训练,得到目标识别模型。
其中,服务器可以对更新后图像识别模型进行训练可以采用全部的图像样本,由于图像识别模型对图像具有一定的识别能力,因此,可以采用少量的样本图像对更新后图像识别模型进行训练,所采用的样本图像的数量可以通过预置策略确定,可选的,预置策略可以根据实际情况进行设置,比如,可以设置为从多个图像样本中选取50%数量的图像样本,也可以设置为从多个图像样本中选取10%数量的图像样本。
206、服务器通过目标初始识别模型对待识别图像进行识别。
本发明实施例的服务器在采集多个标注了区域类型特征的图像样本后,服务器通过图像样本对预设初始识别模型进行训练,得到训练后识别模型,然后,服务器计算训练后识别模型与已训练的图像识别模型之间的相似度,接着,服务器基于相似度对图像识别模型对应的权重参数进行更新,得到更新后图像识别模型,再然后,服务器从多个图像样本中选择用于模型训练的图像样本,并通过选择到的图像样本对更新后图像识别模型进行训练,得到目标识别模型,最后,服务器通过目标识别模型对待识别图像进行识别。由于该方案中的服务器是计算训练后识别模型与已训练的图像识别模型之间的相似度,通过该相似度对图像识别模型对应的权重参数进行更新,更新后图像识别模型对图像具有一定的识别能力,之后,从多个图像样本中选择用于模型训练的图像样本,并通过选择到的图像样本对更新后图像识别模型进行训练,得到目标识别模型,降低了用于模型训练的图像样本的数量,进而提高了模型的训练速度,因此,相对于现有方案而言,本方案可以提高模型的精度和识别准确率,改善识别效果。
为了便于对本发明实施例提供的图像识别方法的理解,以下举例进一步说明,比如,在对医学图像识别的场景中,可以采集多个标注了区域类型特征的医学图像样本,该区域类型特征可以为病变区域类型特征,然后,通过医学图像样本对预设初始识别模型进行训练,得到训练后识别模型,接着,计算训练后识别模型与已训练的图像识别模型之间的相似度,并基于相似度对图像识别模型对应的权重参数进行更新,得到更新后图像识别模型,再然后,从多个医学图像样本中选择用于模型训练的图像样本,并通过选择到的图像样本对更新后图像识别模型进行训练,得到目标识别模型,最后,通过目标识别模型对待识别图像进行识别,又比如,在对遥感图像识别的场景中,可以采集多个标注了区域类型特征的图像样本,该区域类型特征可以为道路区域类型特征,模型的训练方法与前面实施例一样,在此不再赘述。由于该方案通过计算训练后识别模型与已训练的图像识别模型之间的相似度,再根据该相似度对图像识别模型对应的权重参数进行更新,使得更新后图像识别模型对医学图像或遥感图像具有一定的识别能力,因此,降低了用于模型训练的图像样本的数量,进而提高了模型的训练速度,并且,还可以解决现有的医学图像样本或遥感图像样本数量少导致训练出来的识别模型的精度差的问题,也就是说,本方案可以提高模型的精度和识别准确率,改善识别效果。
为便于更好的实施本发明实施例的图像识别方法,本发明实施例还提供一种基于上述图像识别装置(简称识别装置)。其中名词的含义与上述图像识别方法中相同,具体实现细节可以参考方法实施例中的说明。
请参阅图3,图3为本发明实施例提供的用户行为预测装置的结构示意图,其中该识别装置可以包括采集模块301、第一训练模块302、计算模块303、更新模块304、第二训练模块305以及识别模块306,具体可以如下:
采集模块301,用于采集多个标注了区域类型特征的图像样本。
例如,采集模块301具体可以采集多个图像样本,然后,采用邻域局部典型区域标注法对采集到的多个图像样本进行标注,得到多个标注了区域类型特征的图像样本。
可选的,在一些实施例中,采集模块301具体可以用于:采集多个图像样本,采用邻域局部典型区域标注法对采集到的多个图像样本进行标注,得到多个标注了区域类型特征的图像样本。
第一训练模块302,用于通过图像样本对预设初始识别模型进行训练,得到训练后识别模型。
例如,具体的,第一训练模块302可以将图像样本导入预设初始识别模型中,得到该图像样本对应的区域预测值,然后,第一训练模块302通过区域类型特征和区域预测值进行收敛,以对预设初始识别模型的参数进行调整。
可选的,在一些实施例中,第一训练模块302具体可以用于:从多个图像样本中选择与预置策略对应数量的图像样本,得到目标图像样本,通过目标图像样本对更新后图像识别模型进行训练,得到目标识别模型。.
计算模块303,用于计算训练后识别模型与已训练的图像识别模型之间的相似度。
其中,图像识别模型由多个标注了区域类型特征的自然图像样本训练得到的,
可选的,在一些实施例中,计算模块303包括:
提取单元,用于提取图像识别模型中对应的多个卷积核,得到多个第一卷积核,以及提取训练后识别模型对应的多个卷积核,得到多个第二卷积核;
计算单元,用于分别计算每个第一卷积核与各第二卷积核之间的相似度,得到计算结果。
可选的,在一些实施例中,计算单元具体可以用于:提取每个第一卷积核对应的权重信息,得到多个第一权重信息,以及提取每个第二卷积核对应的权重信息,得到多个第二权重信息,分别计算每个第一权重信息与各第二权重信息之间的相似度,得到计算结果。
更新模块304,用于基于相似度对图像识别模型对应的权重参数进行更新,得到更新后图像识别模型。
具体的,更新模块304可以基于计算结果对图像识别模型对应的权重参数进行更新,得到更新后图像识别模型。
可选的,在一些实施例中,更新模块304具体可以包括:
确定单元,用于基于计算结果从多个第一卷积核中确定满足预设条件的第一卷积核,得到目标卷积核;
更新单元,用于通过目标卷积核对图像识别模型对应的权重参数进行更新,得到更新后图像识别模型。
可选的,在一些实施例中,更新单元具体用于:对图像识别模型中除目标卷积核的其余卷积核的权重参数进行初始化处理,得到处理后权重参数,通过目标卷积核对应的权重参数以及处理后权重参数,生成更新后图像识别模型。
第二训练模块305,用于从多个图像样本中选择用于模型训练的图像样本,并通过选择到的图像样本对更新后图像识别模型进行训练,得到目标识别模型。
其中,对更新后图像识别模型进行训练可以采用全部的图像样本,由于图像识别模型对图像具有一定的识别能力,因此,可以采用少量的样本图像对更新后图像识别模型进行训练,所采用的样本图像的数量可以通过预置策略确定。
可选的,在一些实施例中,第二训练模块305具体可以用于:从采集到的多个图像样本中确定当前需要进行训练的图像样本,得到当前处理对象,将当前处理对象导入预设初始识别模型中进行训练,得到当前处理对象对应的区域预测值,将当前处理对象对应的区域预测值与当前处理对象的标注的区域类型特征进行收敛,以对预设初始识别模型的参数进行调整,返回执行从采集到的多个图像样本中确定当前需要进行训练的图像样本的步骤,直至多个图像样本均训练完毕。
识别模块306,用于通过目标识别模型对待识别图像进行识别。
本发明实施例的采集模块301采集多个标注了区域类型特征的图像样本后,第一训练模块302通过图像样本对预设初始识别模型进行训练,得到训练后识别模型,然后,计算模块303计算训练后识别模型与已训练的图像识别模型之间的相似度,接着,更新模块304基于相似度对图像识别模型对应的权重参数进行更新,得到更新后图像识别模型,再然后,第二训练模块305从多个图像样本中选择用于模型训练的图像样本,并通过选择到的图像样本对更新后图像识别模型进行训练,得到目标识别模型,最后,识别模块306通过目标识别模型对待识别图像进行识别。由于该方案是计算训练后识别模型与已训练的图像识别模型之间的相似度,通过该相似度对图像识别模型对应的权重参数进行更新,更新后图像识别模型对图像具有一定的识别能力,之后,从多个图像样本中选择用于模型训练的图像样本,并通过选择到的图像样本对更新后图像识别模型进行训练,得到目标识别模型,降低了用于模型训练的图像样本的数量,进而提高了模型的训练速度,因此,相对于现有方案而言,本方案可以提高模型的精度和识别准确率,改善识别效果。
此外,本发明实施例还提供一种电子设备,如图4所示,其示出了本发明实施例所涉及的电子设备的结构示意图,具体来讲:
该电子设备可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解,图4中示出的电子设备结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器401是该电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。可选的,处理器401可包括一个或多个处理核心;优选的,处理器401可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器401中。
存储器402可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器402还可以包括存储器控制器,以提供处理器401对存储器402的访问。
电子设备还包括给各个部件供电的电源403,优选的,电源403可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该电子设备还可包括输入单元404,该输入单元404可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
尽管未示出,电子设备还可以包括显示单元等,在此不再赘述。具体在本实施例中,电子设备中的处理器401会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现各种功能,如下:
采集多个标注了区域类型特征的图像样本,通过图像样本对预设初始识别模型进行训练,得到训练后识别模型,计算训练后识别模型与已训练的图像识别模型之间的相似度,基于相似度对图像识别模型对应的权重参数进行更新,得到更新后图像识别模型,从多个图像样本中选择用于模型训练的图像样本,并通过选择到的图像样本对更新后图像识别模型进行训练,得到目标识别模型,通过目标识别模型对待识别图像进行识别。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
本发明实施例在采集多个标注了区域类型特征的图像样本后,通过图像样本对预设初始识别模型进行训练,得到训练后识别模型,然后,计算训练后识别模型与已训练的图像识别模型之间的相似度,接着,基于相似度对图像识别模型对应的权重参数进行更新,得到更新后图像识别模型,再然后,从多个图像样本中选择用于模型训练的图像样本,并通过选择到的图像样本对更新后图像识别模型进行训练,得到目标识别模型,最后,通过目标识别模型对待识别图像进行识别。由于该方案是计算训练后识别模型与已训练的图像识别模型之间的相似度,通过该相似度对图像识别模型对应的权重参数进行更新,更新后图像识别模型对图像具有一定的识别能力,之后,从多个图像样本中选择用于模型训练的图像样本,并通过选择到的图像样本对更新后图像识别模型进行训练,得到目标识别模型,降低了用于模型训练的图像样本的数量,进而提高了模型的训练速度,因此,相对于现有方案而言,本方案可以提高模型的精度和识别准确率,改善识别效果。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本发明实施例提供一种存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本发明实施例所提供的任一种图像识别方法中的步骤。例如,该指令可以执行如下步骤:
采集多个标注了区域类型特征的图像样本,通过图像样本对预设初始识别模型进行训练,得到训练后识别模型,计算训练后识别模型与已训练的图像识别模型之间的相似度,基于相似度对图像识别模型对应的权重参数进行更新,得到更新后图像识别模型,从多个图像样本中选择用于模型训练的图像样本,并通过选择到的图像样本对更新后图像识别模型进行训练,得到目标识别模型,通过目标识别模型对待识别图像进行识别。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的指令,可以执行本发明实施例所提供的任一种图像识别方法中的步骤,因此,可以实现本发明实施例所提供的任一种图像识别方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本发明实施例所提供的一种图像识别方法、装置、服务器、电子设备以及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (13)

1.一种图像识别方法,其特征在于,包括:
采集多个标注了区域类型特征的图像样本;
通过所述图像样本对预设初始识别模型进行训练,得到训练后识别模型;
提取已训练的图像识别模型中对应的多个卷积核,得到多个第一卷积核,其中,所述图像识别模型由多个标注了区域类型特征的自然图像样本训练得到的;
提取训练后识别模型对应的多个卷积核,得到多个第二卷积核;
分别计算每个第一卷积核与各第二卷积核之间的相似度,得到计算结果;
基于计算结果对图像识别模型对应的权重参数进行更新,得到更新后图像识别模型;
从多个图像样本中选择用于模型训练的图像样本,并通过选择到的图像样本对更新后图像识别模型进行训练,得到目标识别模型;
通过目标识别模型对待识别图像进行识别。
2.根据权利要求1所述的方法,其特征在于,所述分别计算每个第一卷积核与各第二卷积核之间的相似度,得到计算结果,包括:
提取每个第一卷积核对应的权重信息,得到多个第一权重信息,以及;
提取每个第二卷积核对应的权重信息,得到多个第二权重信息;
分别计算每个第一权重信息与各第二权重信息之间的相似度,得到计算结果。
3.根据权利要求1所述的方法,其特征在于,所述基于计算结果对图像识别模型对应的权重参数进行更新,得到更新后图像识别模型,包括:
基于计算结果从多个第一卷积核中确定满足预设条件的第一卷积核,得到目标卷积核;
通过所述目标卷积核对图像识别模型对应的权重参数进行更新,得到更新后图像识别模型。
4.根据权利要求3所述的方法,其特征在于,所述通过所述目标卷积核对图像识别模型对应的权重参数进行更新,得到更新后图像识别模型,包括:
对图像识别模型中除目标卷积核的其余卷积核的权重参数进行初始化处理,得到处理后权重参数;
通过所述目标卷积核对应的权重参数以及处理后权重参数,生成更新后图像识别模型。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述从多个图像样本中选择用于模型训练的图像样本,并通过选择到的图像样本对更新后图像识别模型进行训练,得到目标识别模型,包括:
从多个图像样本中选择与预置策略对应数量的图像样本,得到目标图像样本;
通过所述目标图像样本对更新后图像识别模型进行训练,得到目标识别模型。
6.根据权利要求1至4任一项所述的方法,其特征在于,所述通过所述图像样本对预设初始识别模型进行训练,得到训练后识别模型,包括:
从采集到的多个图像样本中确定当前需要进行训练的图像样本,得到当前处理对象;
将所述当前处理对象导入预设初始识别模型中进行训练,得到当前处理对象对应的区域预测值;
将当前处理对象对应的区域预测值与当前处理对象的标注的区域类型特征进行收敛,以对所述预设初始识别模型的参数进行调整;
返回执行从采集到的多个图像样本中确定当前需要进行训练的图像样本的步骤,直至所述多个图像样本均训练完毕。
7.根据权利要求1至4任一项所述的方法,其特征在于,所述采集多个标注了区域类型特征的图像样本,包括:
采集多个图像样本;
采用邻域局部典型区域标注法对采集到的多个图像样本进行标注,得到多个标注了区域类型特征的图像样本。
8.一种图像识别装置,其特征在于,包括:
采集模块,用于采集多个标注了区域类型特征的图像样本;
第一训练模块,用于通过所述图像样本对预设初始识别模型进行训练,得到训练后识别模型;
第一提取模块,用于提取已训练的图像识别模型中对应的多个卷积核,得到多个第一卷积核,其中,所述图像识别模型由多个标注了区域类型特征的自然图像样本训练得到的;
第二提取模块,用于提取训练后识别模型对应的多个卷积核,得到多个第二卷积核;
计算模型,用于分别计算每个第一卷积核与各第二卷积核之间的相似度,得到计算结果;
更新模块,用于基于计算结果对图像识别模型对应的权重参数进行更新,得到更新后图像识别模型;
第二训练模块,用于从多个图像样本中选择用于模型训练的图像样本,并通过选择到的图像样本对更新后图像识别模型进行训练,得到目标识别模型;
识别模块,用于通过目标识别模型对待识别图像进行识别。
9.根据权利要求8所述的装置,其特征在于,所述计算模型具体用于:
提取每个第一卷积核对应的权重信息,得到多个第一权重信息,以及;
提取每个第二卷积核对应的权重信息,得到多个第二权重信息;
分别计算每个第一权重信息与各第二权重信息之间的相似度,得到计算结果。
10.根据权利要求8所述的装置,其特征在于,所述更新模块包括:
确定单元,用于基于计算结果从多个第一卷积核中确定满足预设条件的第一卷积核,得到目标卷积核;
更新单元,用于通过所述目标卷积核对图像识别模型对应的权重参数进行更新,得到更新后图像识别模型。
11.根据权利要求10所述的装置,其特征在于,所述更新单元具体用于:
对图像识别模型中除目标卷积核的其余卷积核的权重参数进行初始化处理,得到处理后权重参数;
通过所述目标卷积核对应的权重参数以及处理后权重参数,生成更新后图像识别模型。
12.根据权利要求8至11任一项所述的装置,其特征在于,所述第一训练模块具体用于:
从多个图像样本中选择与预置策略对应数量的图像样本,得到目标图像样本;
通过所述目标图像样本对更新后图像识别模型进行训练,得到目标识别模型。
13.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1-7任一项所述图像识别方法的步骤。
CN201911293876.9A 2019-12-16 2019-12-16 图像识别方法、装置以及计算机可读存储介质 Active CN111079833B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911293876.9A CN111079833B (zh) 2019-12-16 2019-12-16 图像识别方法、装置以及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911293876.9A CN111079833B (zh) 2019-12-16 2019-12-16 图像识别方法、装置以及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN111079833A CN111079833A (zh) 2020-04-28
CN111079833B true CN111079833B (zh) 2022-05-06

Family

ID=70315168

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911293876.9A Active CN111079833B (zh) 2019-12-16 2019-12-16 图像识别方法、装置以及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111079833B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113515980B (zh) * 2020-05-20 2022-07-05 阿里巴巴集团控股有限公司 模型训练方法、装置、设备和存储介质
CN111476222B (zh) * 2020-06-11 2020-10-09 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机设备和计算机可读存储介质
CN111862109B (zh) * 2020-06-28 2024-02-23 国网山东省电力公司德州供电公司 多目标采集、图像识别及自动标注识别结果的系统和装置
CN112101551A (zh) * 2020-09-25 2020-12-18 北京百度网讯科技有限公司 用于训练模型的方法、装置、设备以及存储介质
JP7158515B2 (ja) * 2021-02-18 2022-10-21 本田技研工業株式会社 学習装置、学習方法及びプログラム
CN113435343B (zh) * 2021-06-29 2022-11-29 重庆紫光华山智安科技有限公司 图像识别方法、装置、计算机设备及存储介质
CN114972883B (zh) * 2022-06-17 2024-05-10 平安科技(深圳)有限公司 基于人工智能的目标检测样本生成方法及相关设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107527068A (zh) * 2017-08-07 2017-12-29 南京信息工程大学 基于cnn和域自适应学习的车型识别方法
CN108229679A (zh) * 2017-11-23 2018-06-29 北京市商汤科技开发有限公司 卷积神经网络去冗余方法及装置、电子设备和存储介质
CN109934300A (zh) * 2019-03-21 2019-06-25 腾讯科技(深圳)有限公司 模型压缩方法、装置、计算机设备及存储介质
CN111275120A (zh) * 2020-01-22 2020-06-12 支付宝(杭州)信息技术有限公司 图像识别模型的训练方法及装置、图像识别方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11176439B2 (en) * 2017-12-01 2021-11-16 International Business Machines Corporation Convolutional neural network with sparse and complementary kernels

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107527068A (zh) * 2017-08-07 2017-12-29 南京信息工程大学 基于cnn和域自适应学习的车型识别方法
CN108229679A (zh) * 2017-11-23 2018-06-29 北京市商汤科技开发有限公司 卷积神经网络去冗余方法及装置、电子设备和存储介质
CN109934300A (zh) * 2019-03-21 2019-06-25 腾讯科技(深圳)有限公司 模型压缩方法、装置、计算机设备及存储介质
CN111275120A (zh) * 2020-01-22 2020-06-12 支付宝(杭州)信息技术有限公司 图像识别模型的训练方法及装置、图像识别方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Self-supervised Feature Learning for 3D Medical Images by Playing a Rubik"s Cube";Xinrui Zhuang et al.;《arXiv》;20191005;第1-9页 *
"神经网络模型压缩方法综述";曹文龙 等;《计算机应用研究》;20190331;第36卷(第3期);第649-656页 *

Also Published As

Publication number Publication date
CN111079833A (zh) 2020-04-28

Similar Documents

Publication Publication Date Title
CN111079833B (zh) 图像识别方法、装置以及计算机可读存储介质
CN110555481B (zh) 一种人像风格识别方法、装置和计算机可读存储介质
CN112131978B (zh) 一种视频分类方法、装置、电子设备和存储介质
US10892050B2 (en) Deep image classification of medical images
Kwaśniewska et al. Deep features class activation map for thermal face detection and tracking
CN110309856A (zh) 图像分类方法、神经网络的训练方法及装置
CN111479130B (zh) 一种视频定位方法、装置、电子设备和存储介质
CN111709497B (zh) 一种信息处理方法、装置及计算机可读存储介质
KR20180057096A (ko) 표정 인식과 트레이닝을 수행하는 방법 및 장치
CN111401376A (zh) 目标检测方法、装置、电子设备以及存储介质
CN110069129B (zh) 确定系统和确定方法
CN110765882B (zh) 一种视频标签确定方法、装置、服务器及存储介质
CN111242019B (zh) 视频内容的检测方法、装置、电子设备以及存储介质
US20230326173A1 (en) Image processing method and apparatus, and computer-readable storage medium
CN111708823B (zh) 异常社交账号识别方法、装置、计算机设备和存储介质
WO2021031817A1 (zh) 情绪识别方法、装置、计算机装置及存储介质
CN112241664B (zh) 人脸识别方法、装置、服务器及存储介质
CN112418302A (zh) 一种任务预测方法及装置
CN111080746A (zh) 图像处理方法、装置、电子设备和存储介质
CN111104911A (zh) 一种基于大数据训练的行人重识别方法及装置
CN114677730A (zh) 活体检测方法、装置、电子设备及存储介质
CN111046655B (zh) 一种数据处理方法、装置及计算机可读存储介质
CN110674716A (zh) 图像识别方法、装置和存储介质
CN114611692A (zh) 模型训练方法、电子设备以及存储介质
CN113449548A (zh) 更新物体识别模型的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40021631

Country of ref document: HK

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210924

Address after: 518052 Room 201, building A, 1 front Bay Road, Shenzhen Qianhai cooperation zone, Shenzhen, Guangdong

Applicant after: Tencent Medical Health (Shenzhen) Co.,Ltd.

Address before: 518057 Tencent Building, No. 1 High-tech Zone, Nanshan District, Shenzhen City, Guangdong Province, 35 floors

Applicant before: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd.

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant