CN104504015A - 一种基于动态增量式字典更新的学习算法 - Google Patents
一种基于动态增量式字典更新的学习算法 Download PDFInfo
- Publication number
- CN104504015A CN104504015A CN201410758958.7A CN201410758958A CN104504015A CN 104504015 A CN104504015 A CN 104504015A CN 201410758958 A CN201410758958 A CN 201410758958A CN 104504015 A CN104504015 A CN 104504015A
- Authority
- CN
- China
- Prior art keywords
- dictionary
- matrix
- atom
- initial
- increment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2136—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on sparsity criteria, e.g. with an overcomplete basis
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于动态增量式字典更新的学习算法,包括选取预训练样本集,初始化初始字典,并确定要增加的原子个数m;基于OMP算法,用初始字典对输入样本进行稀疏表征,得到最初稀疏系数矩阵;计算表征后的剩余误差,在剩余误差大于预定阈值时,向初始字典增加m个原子,基于信息熵,对m个原子初始化;将进行初始化后的m个原子添加至初始字典中,得到新字典矩阵,利用新字典矩阵对输入样本进行稀疏分解;基于稀疏分解后的输入样本,利用K-SVD算法对增量原子进行更新,确定误差最小的增量原子,并对增量原子去相关,当所有样本训练结束,输出最终的字典。本发明的有益效果为:能够对体量庞大的遥感数据集进行更有效更稀疏的表征。
Description
技术领域
本发明涉及面向海量遥感数据的稀疏表达技术,具体来说,涉及一种基于动态增量式字典更新的学习算法。
背景技术
近年来,信号的稀疏表达吸引了很多科研人员的关注,稀疏表达的应用范围也非常广泛,包括数据压缩,特征提取等等;稀疏表达是指训练一个过完备字典,该字典是由多个原子组成,信号则表示成这些原子的线性组合;它主要包含两个步骤:稀疏表达与字典学习,而字典学习过程的不同也是区别不同算法的重要因素;字典主要有两大类:解析字典与非解析字典,解析字典由于原子固定,对于复杂的数据集,不能很好的保证分解后的稀疏性;非解析字典则能够根据数据特征自适应的训练出相应的字典,更能有效的稀疏的表示原始数据。
然而经典的字典学习算法,例如K-SVD算法等,需要一次性的输入所有的训练样本集,当训练数据体量扩大后,样本将不再能一次性输入训练,显然,传统的稀疏表达算法在大数据稀疏表示问题上显得力不从心。
针对相关技术中的问题,目前尚未提出有效的解决方案。
发明内容
本发明的目的是提供一种基于动态增量式字典更新的学习算法,以克服目前现有技术存在的上述不足。
本发明的目的是通过以下技术方案来实现:
一种基于动态增量式字典更新的学习算法,包括以下步骤:
选取预训练样本集,初始化初始字典,确定所述初始字典将要增加的原子个数m;
基于OMP算法,用初始字典对输入样本进行稀疏表征,得到最初稀疏系数矩阵;
根据所述最初稀疏系数矩阵,计算表征后的剩余误差,并且,在所述剩余误差大于预定阈值的情况下,向所述初始字典增加m个原子,并基于信息熵,对所述m个原子初始化;
将进行初始化后的所述m个原子添加至所述初始字典中,得到新字典矩阵,并且,基于OMP算法,利用所述新字典矩阵对所述输入样本进行稀疏分解;
基于稀疏分解后的输入样本,利用K-SVD算法对增量原子进行更新,确定误差最小的增量原子,并对确定的所述误差最小的增量原子去相关;
当所有样本训练结束,输出最终的字典。
进一步的,还包括:
在所述剩余误差小于预定阈值的情况下,不更新所述初始字典,继续输入下一样本;
进一步的,对确定的所述误差最小的增量原子去相关包括:
计算伽马矩阵G=D T D,其中D是所述新字典矩阵;
将伽马矩阵映射至结构化约束集:首先将伽马矩阵的对角线元素置为1,再对伽马矩阵进行阈值量化;
因式分解伽马矩阵并映射至光谱约束集;
对矩阵进行翻转;
重复上述过程直至达到事先设定的迭代次数,输出最终的字典。
本发明的有益效果为:基于稀疏系数的信息熵来初始化增量原子,此后运用K-SVD算法对增量原子进行更新,再迭代映射翻转对增量原子矩阵去相关,使得我们能够对体量庞大的遥感数据集进行更有效更稀疏的表征;大大减少了数据的存储空间,简化了后续的数据分析和处理难度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例所述的一种基于动态增量式字典更新的学习算法的流程图;
图2是本发明实施例所述的一种基于动态增量式字典更新的学习算法的增量原子初始化示意图;
图3是本发明实施例所述的一种基于动态增量式字典更新的学习算法的增量原子更新示意图;
图4是本发明实施例所述的一种基于动态增量式字典更新的学习算法的增量原子去相关示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
如图1-4所示,根据本发明实施例所述的一种基于动态增量式字典更新的学习算法,包括以下步骤:
1)借鉴了人类大脑认知的过程,当一项新的内容不能被大脑记忆中存储的信息片段重组时,这项新的内容将被加入到人类的记忆中;本发明利用了该原理,分批输入训练样本,当已有的字典不能有效表达新的样本时,则增加若干字典用于表示新的内容;
2)加入了相互关联约束,当目标函数值小于该约束值,此次样本训练过程结束,继续输入下一个样本训练;目标函数值大于该约束值时,则加入新的字典原子进行字典更新过程;
3)基于信息论信息熵的增量原子初始化方法,计算每个系数向量的信息熵,按信息熵从大到小选取前m个系数向量,将字典矩阵与这m个系数向量相乘即得到增量字典原子的初始值;
4) 增量原子更新过程加入去相关过程,重复以下过程,其中知道事先约定的循环次数:首先计算伽马矩阵(G=D T D,D是训练的字典),其次将矩阵映射至结构化约束集,再对矩阵进行因式分解并映射至光谱约束集,最后再进行矩阵翻转。
其中,在训练字典的过程中,我们从人类大脑认知的过程中得到启示,采用了动态更新的方法,将训练样本分批输入,每输入一批样本,当之前的字典不能很好的表示现输入的样本时,则动态增加m个字典原子,运用K-SVD算法对这m个增量原子进行更新,并创造性的加入了原子间去相关的过程,使得能够对海量遥感数据进行更有效更稀疏的表示,本方法可以得到一个能够对海量遥感数据进行稀疏表示的字典。
一种基于动态增量式字典更新的学习算法,包括以下步骤:
选取预训练样本集,初始化初始字典,确定所述初始字典将要增加的原子个数m;
基于OMP算法,用初始字典对输入样本进行稀疏表征,得到最初稀疏系数矩阵;
根据所述最初稀疏系数矩阵,计算表征后的剩余误差,并且,在所述剩余误差大于预定阈值的情况下,向所述初始字典增加m个原子,并基于信息熵,对所述m个原子初始化;
将进行初始化后的所述m个原子添加至所述初始字典中,得到新字典矩阵,并且,基于OMP算法,利用所述新字典矩阵对所述输入样本进行稀疏分解;
基于稀疏分解后的输入样本,利用K-SVD算法对增量原子进行更新,确定误差最小的增量原子,并对确定的所述误差最小的增量原子去相关;其中,对增量原子去相关具体包括以下步骤:
计算伽马矩阵G=D T D,其中D是所述新字典矩阵;将伽马矩阵映射至结构化约束集:首先将伽马矩阵的对角线元素置为1,再对伽马矩阵进行阈值量化;因式分解伽马矩阵并映射至光谱约束集;对矩阵进行翻转;重复上述过程直至达到事先设定的迭代次数,输出最终的字典;
在所述剩余误差小于预定阈值的情况下,不更新所述初始字典,继续输入下一样本;
当所有样本训练结束,输出最终的字典。
如图1所示,本发明实施例所述的一种基于动态增量式字典更新的遥感大数据字典学习算法,包括以下步骤:
步骤1:选取训练样本集,初始化字典D 0并设置参数(增量原子个数m,模式:PSNR(Peak Signal to Noise Ratio峰值信噪比)/稀疏度,阈值);
步骤2:基于OMP算法,用初始字典对输入样本进行稀疏表征,得到最初稀疏系数矩阵;
步骤3:每输入一个样本,首先计算剩余误差,如果剩余误差小于设定阈值则不更新字典,输入下一个样本继续训练;如果误差大于设定阈值,则增加m个原子,并基于信息熵对这些原子进行初始化,将这些新原子并入旧字典中得到新字典矩阵;运用OMP算法用刚更新的字典对输入样本进行稀疏分解,再用K-SVD(K-Singular Value Decomposition,K次奇异值分解)算法对增量原子进行更新,最后对增量原子进行更新。当所有的样本均训练完毕,输出最终的字典。
具体应用时,
1)基于信息熵的原子初始化:
本发明采用的基于信息熵的原子初始化方法如图2所示,首先依次取系数矩阵的系数向量,计算各系数向量的信息熵,其中 代表系数向量,H( )代表信息熵,代表系数向量的j个分量,公式如下:
,其中,
再将信息熵最高的前m项对应的系数向量提出,与字典相乘即得到增量字典的初始值。
2)基于K-SVD算法的增量字典更新,如图3所示:
对输入的样本Y分块,分成若干个小训练样本y i ,对每个样本交替进行如下两个步骤:
步骤2-1:稀疏分解,结合目前得到的字典,运用OMP算法解如下目标函数,得到系数,其中D是字典,T 0是事先设定的阈值;
;
步骤2-2:字典原子更新,对于每个原子d k ,计算剩余误差E k ,并对其进行奇异值分解,Y是原始样本矩阵,是系数矩阵的第j行,取最大特征值对应的特征向量作为原子的更新值
。
3)增量原子去相关,如图4所示,本发明运用改进的IPR算法进行迭代映射旋转对新加入的原子去相关,增量原子去相关由以下步骤完成:
步骤3-1:计算伽马矩阵;
步骤3-2:将伽马矩阵映射至结构化约束集:首先将伽马矩阵的对角线元素置为1,再对伽马矩阵进行阈值量化;
步骤3-3:因式分解伽马矩阵并映射至光谱约束集;
步骤3-4:对矩阵进行翻转;
步骤3-5:重复上述过程直至达到事先设定的迭代次数,输出最终的字典。
本发明提出基于动态增量式字典更新的遥感大数据字典学习算法,借鉴人脑认知的过程,将训练样本分批输入,每输入一个样本,用此样本之前的所有样本训练出的字典进行稀疏表征,并计算表征后的剩余误差,若剩余误差小于设定的阈值则不更新字典并输入下一个样本继续训练,否则增加m个新原子,基于稀疏系数的信息熵来初始化增量原子,此后运用K-SVD算法对增量原子进行更新,再迭代映射翻转对增量原子矩阵去相关,使得我们能够对体量庞大的遥感数据集进行更有效更稀疏的表征,大大减少了数据的存储空间,简化了后续的数据分析和处理难度。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (3)
1.一种基于动态增量式字典更新的学习算法,其特征在于,包括以下步骤:
选取预训练样本集,初始化初始字典,确定所述初始字典将要增加的原子个数m;
基于OMP算法,用初始字典对输入样本进行稀疏表征,得到最初稀疏系数矩阵;
根据所述最初稀疏系数矩阵,计算表征后的剩余误差,并且,在所述剩余误差大于预定阈值的情况下,向所述初始字典增加m个原子,并基于信息熵,对所述m个原子初始化;
将进行初始化后的所述m个原子添加至所述初始字典中,得到新字典矩阵,并且,基于OMP算法,利用所述新字典矩阵对所述输入样本进行稀疏分解;
基于稀疏分解后的输入样本,利用K-SVD算法对增量原子进行更新,确定误差最小的增量原子,并对确定的所述误差最小的增量原子去相关;
当所有样本训练结束,输出最终的字典。
2.根据权利要求1所述的基于动态增量式字典更新的学习算法,其特征在于,还包括:
在所述剩余误差小于预定阈值的情况下,不更新所述初始字典,继续输入下一样本。
3.根据权利要求1所述的基于动态增量式字典更新的学习算法,其特征在于,对确定的所述误差最小的增量原子去相关包括:
计算伽马矩阵G=D T D,其中D是所述新字典矩阵;
将伽马矩阵映射至结构化约束集:首先将伽马矩阵的对角线元素置为1,再对伽马矩阵进行阈值量化;
因式分解伽马矩阵并映射至光谱约束集;
对矩阵进行翻转;
重复上述过程直至达到事先设定的迭代次数,输出最终的字典。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410758958.7A CN104504015A (zh) | 2014-12-11 | 2014-12-11 | 一种基于动态增量式字典更新的学习算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410758958.7A CN104504015A (zh) | 2014-12-11 | 2014-12-11 | 一种基于动态增量式字典更新的学习算法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104504015A true CN104504015A (zh) | 2015-04-08 |
Family
ID=52945413
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410758958.7A Pending CN104504015A (zh) | 2014-12-11 | 2014-12-11 | 一种基于动态增量式字典更新的学习算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104504015A (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105630870A (zh) * | 2015-12-16 | 2016-06-01 | 广州神马移动信息科技有限公司 | 搜索请求处理方法及系统 |
CN107492062A (zh) * | 2016-06-13 | 2017-12-19 | 滴滴(中国)科技有限公司 | 乘客出行矩阵的压缩方法和系统 |
CN107664773A (zh) * | 2017-09-26 | 2018-02-06 | 武汉大学 | 一种基于时间移位和熵约束的地震信号编码方法 |
CN108694409A (zh) * | 2017-04-12 | 2018-10-23 | 中国科学院微电子研究所 | 一种心电数据的重构方法及装置 |
CN108924148A (zh) * | 2018-07-18 | 2018-11-30 | 中南大学 | 一种多源信号协同压缩感知数据恢复方法 |
CN109033079A (zh) * | 2018-07-06 | 2018-12-18 | 龙马智芯(珠海横琴)科技有限公司 | 语言模型的训练方法、训练装置及检验方法 |
CN109274614A (zh) * | 2018-10-26 | 2019-01-25 | 上海无线电设备研究所 | 一种适用于时变稀疏信道的鲁棒信道估计算法 |
CN110687605A (zh) * | 2019-09-30 | 2020-01-14 | 成都理工大学 | 基于改进的k-svd算法在地震信号处理的算法分析应用 |
CN114283088A (zh) * | 2021-12-24 | 2022-04-05 | 中北大学 | 低剂量ct图像降噪方法及装置 |
CN116070638A (zh) * | 2023-01-03 | 2023-05-05 | 广东工业大学 | 一种中文语句特征构造的训练更新方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101957993A (zh) * | 2010-10-11 | 2011-01-26 | 上海交通大学 | 自适应红外小目标检测方法 |
CN102081795A (zh) * | 2011-01-14 | 2011-06-01 | 天津大学 | 基于稀疏表示的自动去块效应方法 |
US20140037199A1 (en) * | 2005-04-04 | 2014-02-06 | Michal Aharon | System and method for designing of dictionaries for sparse representation |
-
2014
- 2014-12-11 CN CN201410758958.7A patent/CN104504015A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140037199A1 (en) * | 2005-04-04 | 2014-02-06 | Michal Aharon | System and method for designing of dictionaries for sparse representation |
CN101957993A (zh) * | 2010-10-11 | 2011-01-26 | 上海交通大学 | 自适应红外小目标检测方法 |
CN102081795A (zh) * | 2011-01-14 | 2011-06-01 | 天津大学 | 基于稀疏表示的自动去块效应方法 |
Non-Patent Citations (2)
Title |
---|
LIZHE WANG, KE LU, PENG LIU, RAJIV RANJAN,LAJIAO CHEN: "IK-SVD:Dictionary Learning for Spatial Big Data via Incremental Atom Update", 《IEEE COMPUTING IN SCIENCE & ENGINEERING》 * |
RUBINSTEIN R等: "Efficient Implementation of the K-SVD Algorithm using Batch Orthogonal Matching Pursuit", 《CS TECHNION》 * |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105630870A (zh) * | 2015-12-16 | 2016-06-01 | 广州神马移动信息科技有限公司 | 搜索请求处理方法及系统 |
CN107492062A (zh) * | 2016-06-13 | 2017-12-19 | 滴滴(中国)科技有限公司 | 乘客出行矩阵的压缩方法和系统 |
CN107492062B (zh) * | 2016-06-13 | 2021-05-04 | 北京嘀嘀无限科技发展有限公司 | 乘客出行矩阵的压缩方法和系统 |
CN108694409A (zh) * | 2017-04-12 | 2018-10-23 | 中国科学院微电子研究所 | 一种心电数据的重构方法及装置 |
CN107664773A (zh) * | 2017-09-26 | 2018-02-06 | 武汉大学 | 一种基于时间移位和熵约束的地震信号编码方法 |
CN109033079A (zh) * | 2018-07-06 | 2018-12-18 | 龙马智芯(珠海横琴)科技有限公司 | 语言模型的训练方法、训练装置及检验方法 |
CN109033079B (zh) * | 2018-07-06 | 2020-08-04 | 龙马智芯(珠海横琴)科技有限公司 | 语言模型的训练方法、训练装置及检验方法 |
CN108924148A (zh) * | 2018-07-18 | 2018-11-30 | 中南大学 | 一种多源信号协同压缩感知数据恢复方法 |
CN109274614A (zh) * | 2018-10-26 | 2019-01-25 | 上海无线电设备研究所 | 一种适用于时变稀疏信道的鲁棒信道估计算法 |
CN110687605A (zh) * | 2019-09-30 | 2020-01-14 | 成都理工大学 | 基于改进的k-svd算法在地震信号处理的算法分析应用 |
CN114283088A (zh) * | 2021-12-24 | 2022-04-05 | 中北大学 | 低剂量ct图像降噪方法及装置 |
CN114283088B (zh) * | 2021-12-24 | 2024-09-06 | 中北大学 | 低剂量ct图像降噪方法及装置 |
CN116070638A (zh) * | 2023-01-03 | 2023-05-05 | 广东工业大学 | 一种中文语句特征构造的训练更新方法及系统 |
CN116070638B (zh) * | 2023-01-03 | 2023-09-08 | 广东工业大学 | 一种中文语句特征构造的训练更新方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104504015A (zh) | 一种基于动态增量式字典更新的学习算法 | |
CN111639710B (zh) | 图像识别模型训练方法、装置、设备以及存储介质 | |
CN107977704B (zh) | 权重数据存储方法和基于该方法的神经网络处理器 | |
Donahue et al. | Long-term recurrent convolutional networks for visual recognition and description | |
CN106126507B (zh) | 一种基于字符编码的深度神经翻译方法及系统 | |
CN108171198B (zh) | 基于非对称多层lstm的连续手语视频自动翻译方法 | |
WO2018095049A1 (zh) | 生成推荐结果的方法和装置 | |
CN107729311B (zh) | 一种融合文本语气的中文文本特征提取方法 | |
WO2021238333A1 (zh) | 一种文本处理网络、神经网络训练的方法以及相关设备 | |
CN109101235A (zh) | 一种软件程序的智能解析方法 | |
CN112257858A (zh) | 一种模型压缩方法及装置 | |
CN104538028A (zh) | 一种基于深度长短期记忆循环神经网络的连续语音识别方法 | |
CN106547735A (zh) | 基于深度学习的上下文感知的动态词或字向量的构建及使用方法 | |
CN106909537B (zh) | 一种基于主题模型和向量空间的一词多义分析方法 | |
CN113312505B (zh) | 一种基于离散在线哈希学习的跨模态检索方法及系统 | |
CN106897265B (zh) | 词向量训练方法及装置 | |
CN106934458A (zh) | 基于深度学习的多层自动编码方法及系统 | |
JP2019530119A (ja) | エンドツーエンドモデリング方法及びシステム | |
CN109284761A (zh) | 一种图像特征提取方法、装置、设备及可读存储介质 | |
CN111368536A (zh) | 自然语言处理方法及其设备和存储介质 | |
WO2021238568A1 (zh) | 一种更新参数的方法、装置及存储介质 | |
CN106897744A (zh) | 一种自适应设置深度置信网络参数的方法及系统 | |
CN109858612A (zh) | 一种自适应形变空洞卷积方法 | |
CN110796233A (zh) | 基于迁移学习的深度残差卷积神经网络的自适应压缩方法 | |
CN105354532A (zh) | 一种基于手部运动帧数据的手势识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20150408 |
|
RJ01 | Rejection of invention patent application after publication |