CN103345656A - 一种基于多任务深度神经网络的数据识别方法及装置 - Google Patents
一种基于多任务深度神经网络的数据识别方法及装置 Download PDFInfo
- Publication number
- CN103345656A CN103345656A CN2013103162215A CN201310316221A CN103345656A CN 103345656 A CN103345656 A CN 103345656A CN 2013103162215 A CN2013103162215 A CN 2013103162215A CN 201310316221 A CN201310316221 A CN 201310316221A CN 103345656 A CN103345656 A CN 103345656A
- Authority
- CN
- China
- Prior art keywords
- layer
- neural network
- multitask
- degree
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 62
- 238000000034 method Methods 0.000 title claims abstract description 29
- 239000013598 vector Substances 0.000 claims description 15
- 238000005457 optimization Methods 0.000 claims description 5
- 238000002372 labelling Methods 0.000 abstract 2
- 230000006870 function Effects 0.000 description 8
- 238000003062 neural network model Methods 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于多任务深度神经网络的数据识别方法及其装置。该方法包括:步骤1、建立多任务深度神经网络;步骤2、将所述多任务深度神经网络相邻两层看作限制的波尔兹曼机,采用无监督地自底向上的逐层训练方法来预训练该多任务深度神经网络,获得相邻层之间的初始连接权重;步骤3、利用反向传播算法有监督地最小化关于所述网络权重的目标函数,以获得优化后的网络权重;步骤4、将待识别数据输入具有优化后网络权重的所述多任务深度神经网络,得到输出层节点值,并根据输出层节点值得出所述待识别数据所属的类别。本方法利用神经网络来挖掘不同标签之间的关联性,在标签数量较多的大规模图像标注中仍然可以保证较高的图像标注准确率。
Description
技术领域
本发明涉及模式识别与机器学习领域,特别涉及一种基于多任务深度神经网络的数据识别方法及其装置。
背景技术
多标签学习问题广泛存在于现实生活的各个方面。例如,在文本分类中,一个文本可能包含多个主题:健康,医疗和基因。在自然场景分类中,每个场景可能包含多个类别:天空,沙滩和海洋。多标签学习要求我们对每个文本或者图像分配相应的多个标签。
传统的二类和多类分类问题是多标签学习的特例,即单标签学习问题。然而相对于把单个标签分配给一个事例,同时分配多个标签将不可避免的增加了解决问题的难度。传统的解决方法是通过分别学习单标签来解决多标签学习问题。然而这种独立学习各个标签的方法没有考虑不同标签之间的关联性,从而降低了模型的表达能力。
发明内容
本发明的目的是提供一种基于多任务深度神经网络的数据识别方法及装置。为了对标签之间的关联性进行建模,本发明把单标签学习看成一个任务,通过推广传统的神经网络从多任务学习的角度来解决多标签学习。
根据本发明的一方面,本发明提出了一种基于多任务深度神经网络的数据识别方法,包括步骤:
步骤1、建立多任务深度神经网络,其中所述多任务深度神经网络为多层网络结构,输入层对应数据向量,输出层每两个节点对应一个类别标签,以用于表示是否属于该类别标签;该多任务深度神经网络具有网络权重,用于根据当前层节点值获得下一层节点值;
步骤2、将所述多任务深度神经网络相邻两层看作限制的波尔兹曼机,采用无监督地自底向上的逐层训练方法来预训练该多任务深度神经网络,获得相邻层之间的初始连接权重;
步骤3、利用反向传播算法有监督地最小化关于所述网络权重的目标函数,以获得优化后的网络权重;
步骤4、将待识别数据输入具有优化后网络权重的所述多任务深度神经网络,得到输出层节点值,并根据输出层节点值得出所述待识别数据所属的类别。
根据本发明的另一方面,本发明还提出了一种基于多任务深度神经网络的数据识别装置,其包括:
网络建立模块,其用于建立多任务深度神经网络,其中所述多任务深度神经网络为多层网络结构,输入层对应输入数据向量,输出层每两个节点对应一个类别标签,以用于表示是否属于该类别标签;该多任务深度神经网络具有网络权重,用于根据当前层节点值获得下一层节点值;
网络权重初始模块,其用于将所述多任务深度神经网络相邻两层看作限制的波尔兹曼机,采用无监督地自底向上的逐层训练方法来预训练该多任务深度神经网络,获得相邻层之间的初始连接权重;
网络权重优化模块,其用于利用反向传播算法有监督地最小化关于所述网络权重的目标函数,以获得优化后的网络权重;
数据识别模块,其用于将待识别数据输入具有优化后网络权重的所述多任务深度神经网络,得到输出层节点值,并根据输出层节点值得出所述待识别数据所属的类别。
由于本发明通过推广神经网络适以多任务学习方式来解决标签学习,从而可以对不同标签之间的关系进行建模。同时在初始化网络权重阶段,还可以利用大量无类别标签的图像作为训练数据。
附图说明
图1是本发明中基于多任务深度神经网络的数据识别方法基本流程图。
图2是利用本发明的方案解决图像多类标注问题的具体模型图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明作进一步的详细说明。
本发明提出一种基于多任务深度神经网络的数据识别方法,能够广泛地应用于多类别标注问题。
图1示出了本发明提出的基于多任务深度神经网络的数据识别方法的步骤流程图。如图1所示,该方法包括:
步骤1、建立多任务深度神经网络,设置网络的层数和节点数;其中所述多任务深度神经网络为多层网络结构,输入层可以为对应图像的像素点,这里要求所有输入图像保持相同的大小;此处输入层不仅限于图像,还包括文本和语音等可以表示为列向量的数据;输出层每两个节点对应一个类别标签,以用于表示是否属于该类别标签;该多任务深度神经网络具有网络权重,用于根据当前层节点值获得下一层节点值。深度神经网络的输入层和输出层的结点数是固定的,但是其各隐含层的结点数需要手工调节以使得该模型效果最优。
图2示出了本发明中所使用的多任务深度神经网络图。如图2所示,这是一个四层的多任务深度神经网络,每层中的圆形点表示网络结点。最底层图像代表输入层,当输入层输入的是一个d0维的图像列向量其每一维度用一个结点表示,其取值范围为0到1的实数,对应归一化后的输入图像。对于中间分别包含d1、d2和d3个结点的三个隐含层和最后包含c个结点的输出层,则分别得到d1、d2、d3和c维的四个列向量,相应的值分别由该层前一层的向量值计算得到:
步骤2、在多层神经网络的输出层上,分别对每个类别标签l定义一对输出结点,包括一个正结点cl和一个负结点分别对应“属于类别l”和“不属于类别l”。因此,网络输出层的结点数量为标签总数量的2倍。当给定一幅图像v,输出关于类别标签l的正负结点值分别为:和而网络的输出列向量O即包含所有类别标签对应的正负结点值:
步骤3、分别把相邻的两层结构看作一个限制的波尔兹曼机(restrictedBoltzmann machine,RBM),采用无监督地自底向上的逐层训练方法来预训练该神经网络,从而对网络权重进行初始化。以图2最下面两层网络为例进行说明,把输入层图像v和第一隐含层h当作一个限制的波尔兹曼机,其能量函数F(v,h)定义为:
F(v,h)=-vTW1h-b1v-b2h
其中W1表示输入层结点与隐含层结点之间的连接权重,b1和b2分别表示输入层和隐含层各结点的常数偏置项。在能量函数的基础上可以得到输入层图像v的概率分布P(v):
利用梯度下降算法来最小化-logP(v),从而以迭代的方式对W进行调整:
对上式中的的具体简化求解方式,可以参考Hinton等人2006年发表在Neural Computation上的文章“A fast learning algorithm fordeep belief nets”,∈表示一个常数学习率。迭代地使用来调整深度神经网络最底两层之间的连接权重W1,进而把调整后的结果当做对W1的初始化。自底向上,分别把网络中其余相邻的两层看作RBM并初始化其相应的权重,直至完成对网络中其他权重的初始化。
步骤4、定义该深度神经网络的目标函数,并利用反向传播算法(BackPropagation,在Rumelhart等人1986年发表在Nature上的文章″Learningrepresentations by back-propagating errors″中有具体介绍)有监督地最小化该目标函数,从而进一步优化深度神经网络的网络权重。网络的目标函数E定义为输入数据的真实标签与多任务深度神经网络预测的标签之间的交叉熵:
其中ql是一个0或者1的二值数,表示输入数据v的是否真实的含有类别标签l,当其取值为0时表示没有,1表示有。pl表示多层神经网络模型预测的数据v含有类别标签l的概率,其值是由网络输出层中与类别标签l相关的正负结点的值和计算的:
步骤5、对网络权重分别无监督初始化和有监督优化后,得到最终的多任务深度神经网络模型。向模型输入待识别图像v,模型会输出对应每个类别标签l的正负结点的值和通过比较两个结点值的相对大小即可判定图像v是否属于类别标签l,即如果那么数据v属于l类别;反之则不属于。
为了详细说明本发明的具体实施方式,以某图像数据集为例说明。该数据集包含30000张日常生活中的图像,总共属于31个类别,包括船、天空、飞机、太阳和马等。每张图像根据其图像内容分别属于多个类别。实现的模型可以自动对这些图像进行多类别标注。具体步骤如下:
步骤S1,将数据集中的15000个图像作为训练集,剩下的15000个图像作为测试集。
步骤S2,使用一个四层的基于多任务深度神经网络多标签学习模型,其输入层、三个隐含层和输出层分别包含634、3000、3000、4000和62个结点。
步骤S3,将图像训练集随机划分为150个子集,每个子集包含100个图像。对于每张图像,将其按照像素的顺序拉伸为一个列向量作为深度神经网络的输入。
步骤S4,在每个子集上,分别把两层结构634-3000、3000-3000和3000-4000当作限制的玻尔兹曼机来初始化权重,其这些不同的子集训练的是同一组网络权重。
步骤S5,通过最小化深度神经网络目标函数,利用传统的神经网络反向传播算法来优化网络的权重。由于反向传播算法是以迭代优化的方式进行的,这里设置最大迭代次数为300可以保证收敛。
步骤S6,把测试图像输入训练好的模型,输出图像各个类别标签相应的正负结点数值,比较每两个结点值的相对大小来确定测试图像是否属于相应的类别。最终确定对测试图像分配哪些类别标签。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于多任务深度神经网络的数据识别方法,包括步骤:
步骤1、建立多任务深度神经网络,其中所述多任务深度神经网络为多层网络结构,输入层对应数据向量,输出层每两个节点对应一个类别标签,以用于表示是否属于该类别标签;该多任务深度神经网络具有网络权重,用于根据当前层节点值获得下一层节点值;
步骤2、将所述多任务深度神经网络相邻两层看作限制的波尔兹曼机,采用无监督地自底向上的逐层训练方法来预训练该多任务深度神经网络,获得相邻层之间的初始连接权重;
步骤3、利用反向传播算法有监督地最小化关于所述网络权重的目标函数,以获得优化后的网络权重;
步骤4、将待识别数据输入具有优化后网络权重的所述多任务深度神经网络,得到输出层节点值,并根据输出层节点值得出所述待识别数据所属的类别。
2.如权利要求1所述的数据识别方法,其特征在于,步骤1中除输入层的其它层节点值如下获得:
其中,hi表示第i层的节点值向量,Wi表示第i层与其前一层的连接权重,hi-1表示第i-1层的节点值向量,i为大于等于1的整数,h0表示输入层数据向量;g(x)=1/(1+e-x)。
3.如权利要求1所述的数据识别方法,其特征在于,步骤2中将相邻两层看作一个限制的波尔兹曼机,求解初始连接权重,具体如下表示:
其中,Wi表示第i层与其前一层的连接权重,hi表示第i层的节点值向量,∈为常数,P(hi)表示第i层数据的概率分布,i为大于等于1的整数。
4.如权利要求3所述的数据识别方法,其特征在于,各层数据的概率分布如下计算:
其中,h0表示输入层数据向量;F(hi-1,hi)表示第i-1层与第i层之间的能量函数,如下表示:
F(hi-1,hi)=-hi-1 TWihi-bi-1hi-1-cihi
其中,bi-1和ci分别表示第i-1层和第i层各节点的偏置项。
5.如权利要求1所述的数据识别方法,其特征在于,步骤3中关于所述网络权重的目标函数定义为输入数据的真实标签类别与所述多任务深度神经网络预测的标签类别之间的交叉熵。
6.如权利要求5所述的数据识别方法,其特征在于,所述交叉熵如下表示:
其中,ql是一个0或者1的二值数,表示输入的数据是否含有真实类别标签l,pl表示所述多任务深度神经网络所预测的数据含有类别标签l的概率。
8.如权利要求1所述的数据识别方法,其特征在于,步骤4中,通过比较对应一个类别标签的两个节点值相对大小,判别待识别数据是否属于该类别标签。
9.如权利要求1所述的数据识别方法,其特征在于,步骤3中采用自顶向下有监督的方式优化所述网络权重。
10.一种基于多任务深度神经网络的数据识别装置,其包括:
网络建立模块,其用于建立多任务深度神经网络,其中所述多任务深度神经网络为多层网络结构,输入层对应输入数据向量,输出层每两个节点对应一个类别标签,以用于表示是否属于该类别标签;该多任务深度神经网络具有网络权重,用于根据当前层节点值获得下一层节点值;
网络权重初始模块,其用于将所述多任务深度神经网络相邻两层看作限制的波尔兹曼机,采用无监督地自底向上的逐层训练方法来预训练该多任务深度神经网络,获得相邻层之间的初始连接权重;
网络权重优化模块,其用于利用反向传播算法有监督地最小化关于所述网络权重的目标函数,以获得优化后的网络权重;
数据识别模块,其用于将待识别数据输入具有优化后网络权重的所述多任务深度神经网络,得到输出层节点值,并根据输出层节点值得出所述待识别数据所属的类别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310316221.5A CN103345656B (zh) | 2013-07-17 | 2013-07-17 | 一种基于多任务深度神经网络的数据识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310316221.5A CN103345656B (zh) | 2013-07-17 | 2013-07-17 | 一种基于多任务深度神经网络的数据识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103345656A true CN103345656A (zh) | 2013-10-09 |
CN103345656B CN103345656B (zh) | 2016-01-20 |
Family
ID=49280451
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310316221.5A Active CN103345656B (zh) | 2013-07-17 | 2013-07-17 | 一种基于多任务深度神经网络的数据识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103345656B (zh) |
Cited By (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103530689A (zh) * | 2013-10-31 | 2014-01-22 | 中国科学院自动化研究所 | 一种基于深度学习的聚类方法 |
CN104077577A (zh) * | 2014-07-03 | 2014-10-01 | 浙江大学 | 一种基于卷积神经网络的商标检测方法 |
CN104239194A (zh) * | 2014-09-12 | 2014-12-24 | 上海交通大学 | 基于bp神经网络的任务完成时间预测方法 |
WO2015180397A1 (zh) * | 2014-05-31 | 2015-12-03 | 华为技术有限公司 | 一种基于深度神经网络的数据类别识别方法及装置 |
WO2015192734A1 (en) * | 2014-06-18 | 2015-12-23 | Tencent Technology (Shenzhen) Company Limited | Information processing method and apparatus |
CN105184367A (zh) * | 2014-06-09 | 2015-12-23 | 讯飞智元信息科技有限公司 | 深度神经网络的模型参数训练方法及系统 |
CN105184303A (zh) * | 2015-04-23 | 2015-12-23 | 南京邮电大学 | 一种基于多模态深度学习的图像标注方法 |
CN105512725A (zh) * | 2015-12-14 | 2016-04-20 | 杭州朗和科技有限公司 | 一种神经网络的训练方法和设备 |
CN105654136A (zh) * | 2015-12-31 | 2016-06-08 | 中国科学院电子学研究所 | 一种基于深度学习的大规模遥感影像目标自动识别方法 |
CN105654942A (zh) * | 2016-01-04 | 2016-06-08 | 北京时代瑞朗科技有限公司 | 一种基于统计参数的疑问句、感叹句的语音合成方法 |
CN105809201A (zh) * | 2016-03-11 | 2016-07-27 | 中国科学院自动化研究所 | 一种生物启发式自主提取图像语义概念的识别方法及装置 |
CN105809200A (zh) * | 2016-03-11 | 2016-07-27 | 中国科学院自动化研究所 | 一种生物启发式自主抽取图像语义信息的方法及装置 |
CN105808732A (zh) * | 2016-03-10 | 2016-07-27 | 北京大学 | 一种基于深度度量学习的一体化目标属性识别与精确检索方法 |
CN106096729A (zh) * | 2016-06-06 | 2016-11-09 | 天津科技大学 | 一种面向大规模环境中复杂任务的深度策略学习方法 |
CN106096727A (zh) * | 2016-06-02 | 2016-11-09 | 腾讯科技(深圳)有限公司 | 一种基于机器学习的网络模型构造方法及装置 |
CN106096638A (zh) * | 2016-06-03 | 2016-11-09 | 腾讯科技(深圳)有限公司 | 一种数据处理方法及装置 |
CN106296699A (zh) * | 2016-08-16 | 2017-01-04 | 电子科技大学 | 基于深度神经网络和多模态mri图像的脑肿瘤分割方法 |
CN106951753A (zh) * | 2016-01-06 | 2017-07-14 | 北京三星通信技术研究有限公司 | 一种心电信号的认证方法和认证装置 |
WO2017157112A1 (en) * | 2016-03-16 | 2017-09-21 | Hong Kong Applied Science and Technology Research Institute Company Limited | Method and system for bit-depth reduction in artificial neural networks |
CN107690657A (zh) * | 2015-08-07 | 2018-02-13 | 谷歌有限责任公司 | 根据影像发现商户 |
CN107977456A (zh) * | 2017-12-15 | 2018-05-01 | 清华大学 | 一种基于多任务深度网络的多源大数据分析方法 |
CN108133178A (zh) * | 2017-12-08 | 2018-06-08 | 重庆广睿达科技有限公司 | 一种基于图像识别的智能环境监控系统与方法 |
CN108280458A (zh) * | 2017-01-05 | 2018-07-13 | 腾讯科技(深圳)有限公司 | 群体关系类型识别方法及装置 |
US10089576B2 (en) | 2015-07-28 | 2018-10-02 | Microsoft Technology Licensing, Llc | Representation learning using multi-task deep neural networks |
CN109581137A (zh) * | 2017-10-19 | 2019-04-05 | 广西大学 | 一种小电流接地系统单相接地故障选线方法 |
CN109840537A (zh) * | 2017-11-29 | 2019-06-04 | 南京大学 | 一种基于交叉对比神经网络的图像多任务分类方法 |
CN110168578A (zh) * | 2017-01-30 | 2019-08-23 | 谷歌有限责任公司 | 具有任务特定路径的多任务神经网络 |
CN110503181A (zh) * | 2018-05-18 | 2019-11-26 | 百度在线网络技术(北京)有限公司 | 用于生成多层神经网络的方法和装置 |
CN110717785A (zh) * | 2019-09-29 | 2020-01-21 | 支付宝(杭州)信息技术有限公司 | 基于标签分布学习的决策方法、系统及装置 |
US10643122B1 (en) | 2019-05-06 | 2020-05-05 | Capital One Services, Llc | Systems using hash keys to preserve privacy across multiple tasks |
CN111613204A (zh) * | 2020-04-29 | 2020-09-01 | 云知声智能科技股份有限公司 | 一种快速响应的神经语音合成系统及其方法 |
CN112784918A (zh) * | 2021-02-01 | 2021-05-11 | 中国科学院自动化研究所 | 基于无监督图表示学习的节点识别方法、系统、装置 |
CN113614747A (zh) * | 2019-04-09 | 2021-11-05 | 罗伯特·博世有限公司 | 用于运行深度神经网络的方法、设备和计算机程序 |
CN113962302A (zh) * | 2021-10-20 | 2022-01-21 | 全球能源互联网研究院有限公司 | 一种基于标签分布学习的敏感数据智能识别方法 |
CN116051682A (zh) * | 2022-11-30 | 2023-05-02 | 四川省中车铁投轨道交通有限公司 | 一种智轨电车底盘故障检测方法及系统 |
US12061966B2 (en) | 2015-03-20 | 2024-08-13 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Relevance score assignment for artificial neural networks |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100217589A1 (en) * | 2009-02-20 | 2010-08-26 | Nuance Communications, Inc. | Method for Automated Training of a Plurality of Artificial Neural Networks |
CN102737278A (zh) * | 2011-03-31 | 2012-10-17 | 微软公司 | 联合非线性随机投影、受限波尔兹曼机、以及基于批量的可并行优化来使用的深凸网络 |
CN102902966A (zh) * | 2012-10-12 | 2013-01-30 | 大连理工大学 | 一种基于深度信赖网络的超分辨率人脸识别方法 |
CN103117060A (zh) * | 2013-01-18 | 2013-05-22 | 中国科学院声学研究所 | 用于语音识别的声学模型的建模方法、建模系统 |
US20130138436A1 (en) * | 2011-11-26 | 2013-05-30 | Microsoft Corporation | Discriminative pretraining of deep neural networks |
-
2013
- 2013-07-17 CN CN201310316221.5A patent/CN103345656B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100217589A1 (en) * | 2009-02-20 | 2010-08-26 | Nuance Communications, Inc. | Method for Automated Training of a Plurality of Artificial Neural Networks |
CN102737278A (zh) * | 2011-03-31 | 2012-10-17 | 微软公司 | 联合非线性随机投影、受限波尔兹曼机、以及基于批量的可并行优化来使用的深凸网络 |
US20130138436A1 (en) * | 2011-11-26 | 2013-05-30 | Microsoft Corporation | Discriminative pretraining of deep neural networks |
CN102902966A (zh) * | 2012-10-12 | 2013-01-30 | 大连理工大学 | 一种基于深度信赖网络的超分辨率人脸识别方法 |
CN103117060A (zh) * | 2013-01-18 | 2013-05-22 | 中国科学院声学研究所 | 用于语音识别的声学模型的建模方法、建模系统 |
Cited By (60)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103530689A (zh) * | 2013-10-31 | 2014-01-22 | 中国科学院自动化研究所 | 一种基于深度学习的聚类方法 |
US10296827B2 (en) | 2014-05-31 | 2019-05-21 | Huawei Technologies Co., Ltd. | Data category identification method and apparatus based on deep neural network |
CN105224984A (zh) * | 2014-05-31 | 2016-01-06 | 华为技术有限公司 | 一种基于深度神经网络的数据类别识别方法及装置 |
WO2015180397A1 (zh) * | 2014-05-31 | 2015-12-03 | 华为技术有限公司 | 一种基于深度神经网络的数据类别识别方法及装置 |
CN105224984B (zh) * | 2014-05-31 | 2018-03-13 | 华为技术有限公司 | 一种基于深度神经网络的数据类别识别方法及装置 |
CN105184367B (zh) * | 2014-06-09 | 2018-08-14 | 讯飞智元信息科技有限公司 | 深度神经网络的模型参数训练方法及系统 |
CN105184367A (zh) * | 2014-06-09 | 2015-12-23 | 讯飞智元信息科技有限公司 | 深度神经网络的模型参数训练方法及系统 |
US10235624B2 (en) | 2014-06-18 | 2019-03-19 | Tencent Technology (Shenzhen) Company Limited | Information processing method and apparatus |
WO2015192734A1 (en) * | 2014-06-18 | 2015-12-23 | Tencent Technology (Shenzhen) Company Limited | Information processing method and apparatus |
CN104077577A (zh) * | 2014-07-03 | 2014-10-01 | 浙江大学 | 一种基于卷积神经网络的商标检测方法 |
CN104239194A (zh) * | 2014-09-12 | 2014-12-24 | 上海交通大学 | 基于bp神经网络的任务完成时间预测方法 |
US12061966B2 (en) | 2015-03-20 | 2024-08-13 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Relevance score assignment for artificial neural networks |
CN105184303A (zh) * | 2015-04-23 | 2015-12-23 | 南京邮电大学 | 一种基于多模态深度学习的图像标注方法 |
CN105184303B (zh) * | 2015-04-23 | 2019-08-09 | 南京邮电大学 | 一种基于多模态深度学习的图像标注方法 |
US10089576B2 (en) | 2015-07-28 | 2018-10-02 | Microsoft Technology Licensing, Llc | Representation learning using multi-task deep neural networks |
CN107690657B (zh) * | 2015-08-07 | 2019-10-22 | 谷歌有限责任公司 | 根据影像发现商户 |
CN107690657A (zh) * | 2015-08-07 | 2018-02-13 | 谷歌有限责任公司 | 根据影像发现商户 |
CN105512725A (zh) * | 2015-12-14 | 2016-04-20 | 杭州朗和科技有限公司 | 一种神经网络的训练方法和设备 |
CN105654136B (zh) * | 2015-12-31 | 2019-01-11 | 中国科学院电子学研究所 | 一种基于深度学习的大规模遥感影像目标自动识别方法 |
CN105654136A (zh) * | 2015-12-31 | 2016-06-08 | 中国科学院电子学研究所 | 一种基于深度学习的大规模遥感影像目标自动识别方法 |
CN105654942A (zh) * | 2016-01-04 | 2016-06-08 | 北京时代瑞朗科技有限公司 | 一种基于统计参数的疑问句、感叹句的语音合成方法 |
CN106951753A (zh) * | 2016-01-06 | 2017-07-14 | 北京三星通信技术研究有限公司 | 一种心电信号的认证方法和认证装置 |
CN105808732B (zh) * | 2016-03-10 | 2019-05-17 | 北京大学 | 一种基于深度度量学习的一体化目标属性识别与精确检索方法 |
CN105808732A (zh) * | 2016-03-10 | 2016-07-27 | 北京大学 | 一种基于深度度量学习的一体化目标属性识别与精确检索方法 |
CN105809200B (zh) * | 2016-03-11 | 2020-05-15 | 中国科学院自动化研究所 | 一种生物启发式自主抽取图像语义信息的方法及装置 |
CN105809200A (zh) * | 2016-03-11 | 2016-07-27 | 中国科学院自动化研究所 | 一种生物启发式自主抽取图像语义信息的方法及装置 |
CN105809201A (zh) * | 2016-03-11 | 2016-07-27 | 中国科学院自动化研究所 | 一种生物启发式自主提取图像语义概念的识别方法及装置 |
CN105809201B (zh) * | 2016-03-11 | 2019-07-05 | 中国科学院自动化研究所 | 一种生物启发式自主提取图像语义概念的识别方法及装置 |
US11106973B2 (en) | 2016-03-16 | 2021-08-31 | Hong Kong Applied Science and Technology Research Institute Company Limited | Method and system for bit-depth reduction in artificial neural networks |
WO2017157112A1 (en) * | 2016-03-16 | 2017-09-21 | Hong Kong Applied Science and Technology Research Institute Company Limited | Method and system for bit-depth reduction in artificial neural networks |
CN106096727A (zh) * | 2016-06-02 | 2016-11-09 | 腾讯科技(深圳)有限公司 | 一种基于机器学习的网络模型构造方法及装置 |
CN106096727B (zh) * | 2016-06-02 | 2018-12-07 | 腾讯科技(深圳)有限公司 | 一种基于机器学习的网络模型构造方法及装置 |
US11741361B2 (en) | 2016-06-02 | 2023-08-29 | Tencent Technology (Shenzhen) Company Limited | Machine learning-based network model building method and apparatus |
CN106096638A (zh) * | 2016-06-03 | 2016-11-09 | 腾讯科技(深圳)有限公司 | 一种数据处理方法及装置 |
CN106096638B (zh) * | 2016-06-03 | 2018-08-07 | 腾讯科技(深圳)有限公司 | 一种数据处理方法及装置 |
CN106096729B (zh) * | 2016-06-06 | 2018-11-20 | 天津科技大学 | 一种面向大规模环境中复杂任务的深度策略学习方法 |
CN106096729A (zh) * | 2016-06-06 | 2016-11-09 | 天津科技大学 | 一种面向大规模环境中复杂任务的深度策略学习方法 |
CN106296699A (zh) * | 2016-08-16 | 2017-01-04 | 电子科技大学 | 基于深度神经网络和多模态mri图像的脑肿瘤分割方法 |
CN108280458A (zh) * | 2017-01-05 | 2018-07-13 | 腾讯科技(深圳)有限公司 | 群体关系类型识别方法及装置 |
CN110168578A (zh) * | 2017-01-30 | 2019-08-23 | 谷歌有限责任公司 | 具有任务特定路径的多任务神经网络 |
CN110168578B (zh) * | 2017-01-30 | 2024-02-06 | 渊慧科技有限公司 | 具有任务特定路径的多任务神经网络 |
CN109581137B (zh) * | 2017-10-19 | 2021-06-25 | 广西大学 | 一种小电流接地系统单相接地故障选线方法 |
CN109581137A (zh) * | 2017-10-19 | 2019-04-05 | 广西大学 | 一种小电流接地系统单相接地故障选线方法 |
CN109840537A (zh) * | 2017-11-29 | 2019-06-04 | 南京大学 | 一种基于交叉对比神经网络的图像多任务分类方法 |
CN108133178A (zh) * | 2017-12-08 | 2018-06-08 | 重庆广睿达科技有限公司 | 一种基于图像识别的智能环境监控系统与方法 |
CN107977456B (zh) * | 2017-12-15 | 2018-10-30 | 清华大学 | 一种基于多任务深度网络的多源大数据分析方法 |
CN107977456A (zh) * | 2017-12-15 | 2018-05-01 | 清华大学 | 一种基于多任务深度网络的多源大数据分析方法 |
CN110503181B (zh) * | 2018-05-18 | 2022-03-01 | 百度在线网络技术(北京)有限公司 | 用于生成多层神经网络的方法和装置 |
CN110503181A (zh) * | 2018-05-18 | 2019-11-26 | 百度在线网络技术(北京)有限公司 | 用于生成多层神经网络的方法和装置 |
CN113614747A (zh) * | 2019-04-09 | 2021-11-05 | 罗伯特·博世有限公司 | 用于运行深度神经网络的方法、设备和计算机程序 |
US11093821B2 (en) | 2019-05-06 | 2021-08-17 | Capital One Services, Llc | Systems using hash keys to preserve privacy across multiple tasks |
US11586877B2 (en) | 2019-05-06 | 2023-02-21 | Capital One Services, Llc | Systems using hash keys to preserve privacy across multiple tasks |
US10643122B1 (en) | 2019-05-06 | 2020-05-05 | Capital One Services, Llc | Systems using hash keys to preserve privacy across multiple tasks |
US11836601B2 (en) | 2019-05-06 | 2023-12-05 | Capital One Services, Llc | Systems using hash keys to preserve privacy across multiple tasks |
CN110717785A (zh) * | 2019-09-29 | 2020-01-21 | 支付宝(杭州)信息技术有限公司 | 基于标签分布学习的决策方法、系统及装置 |
CN111613204A (zh) * | 2020-04-29 | 2020-09-01 | 云知声智能科技股份有限公司 | 一种快速响应的神经语音合成系统及其方法 |
CN112784918A (zh) * | 2021-02-01 | 2021-05-11 | 中国科学院自动化研究所 | 基于无监督图表示学习的节点识别方法、系统、装置 |
CN112784918B (zh) * | 2021-02-01 | 2023-06-30 | 中国科学院自动化研究所 | 基于无监督图表示学习的节点识别方法、系统、装置 |
CN113962302A (zh) * | 2021-10-20 | 2022-01-21 | 全球能源互联网研究院有限公司 | 一种基于标签分布学习的敏感数据智能识别方法 |
CN116051682A (zh) * | 2022-11-30 | 2023-05-02 | 四川省中车铁投轨道交通有限公司 | 一种智轨电车底盘故障检测方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN103345656B (zh) | 2016-01-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103345656B (zh) | 一种基于多任务深度神经网络的数据识别方法及装置 | |
Mao et al. | Recycling waste classification using optimized convolutional neural network | |
CN108399421B (zh) | 一种基于词嵌入的深度零样本分类方法 | |
CN107437096B (zh) | 基于参数高效的深度残差网络模型的图像分类方法 | |
Olugboja et al. | Parallel convolutional neural networks for object detection | |
Dong et al. | Automatic age estimation based on deep learning algorithm | |
CN103838836B (zh) | 基于判别式多模态深度置信网多模态数据融合方法和系统 | |
CN108021947B (zh) | 一种基于视觉的分层极限学习机目标识别方法 | |
CN109214441A (zh) | 一种细粒度车型识别系统及方法 | |
CN109993100B (zh) | 基于深层特征聚类的人脸表情识别的实现方法 | |
CN105184368B (zh) | 一种分布式极限学习机优化集成框架方法系统及方法 | |
CN110473592B (zh) | 一种多视角人类协同致死基因预测方法 | |
CN106022363B (zh) | 一种适用于自然场景下的中文文字识别方法 | |
Salih | A new training method based on black hole algorithm for convolutional neural network | |
CN106845499A (zh) | 一种基于自然语言语义的图像目标检测方法 | |
CN107145903A (zh) | 一种基于卷积神经网络图片特征提取的船舶类型识别方法 | |
CN105095833A (zh) | 用于人脸识别的网络构建方法、识别方法及系统 | |
CN105205448A (zh) | 基于深度学习的文字识别模型训练方法和识别方法 | |
CN109165275B (zh) | 基于深度学习的智能变电站操作票信息智能搜索匹配方法 | |
CN105787557A (zh) | 一种计算机智能识别的深层神经网络结构设计方法 | |
CN103778407A (zh) | 一种迁移学习框架下基于条件随机场的手势识别算法 | |
CN110321862B (zh) | 一种基于紧致三元损失的行人再识别方法 | |
CN108898213A (zh) | 一种面向深度神经网络的自适应激活函数参数调节方法 | |
Kasfi et al. | Convolutional neural network for time series cattle behaviour classification | |
CN107528824B (zh) | 一种基于二维度稀疏化的深度信念网络入侵检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |