[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN101470730B - 基于频谱特征分析的图像重复检测方法 - Google Patents

基于频谱特征分析的图像重复检测方法 Download PDF

Info

Publication number
CN101470730B
CN101470730B CN2007103042078A CN200710304207A CN101470730B CN 101470730 B CN101470730 B CN 101470730B CN 2007103042078 A CN2007103042078 A CN 2007103042078A CN 200710304207 A CN200710304207 A CN 200710304207A CN 101470730 B CN101470730 B CN 101470730B
Authority
CN
China
Prior art keywords
image
spectrum
gradient
sampling
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2007103042078A
Other languages
English (en)
Other versions
CN101470730A (zh
Inventor
胡卫明
李玺
吴偶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Renmin Zhongke Beijing Intelligent Technology Co ltd
Original Assignee
Institute of Automation of Chinese Academy of Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Automation of Chinese Academy of Science filed Critical Institute of Automation of Chinese Academy of Science
Priority to CN2007103042078A priority Critical patent/CN101470730B/zh
Publication of CN101470730A publication Critical patent/CN101470730A/zh
Application granted granted Critical
Publication of CN101470730B publication Critical patent/CN101470730B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明是一种基于频谱特征分析的图像重复检测方法,包括:通过下采样模块对图像进行下采样,通过频谱分析模块对图像进行频谱分析;用于提取图像像素的颜色信息;通过频谱分析模块对图像进行梯度信息分析;用于获取下采样后的图像梯度分布特征,该特征具有旋转、平移以及尺度不变的性质;通过索引生成模块融合图像颜色和梯度信息,作为图像索引。采用这种方法可以极大地减少数据库的存储冗余度,提高了现有检索系统的检索性能和效率。

Description

基于频谱特征分析的图像重复检测方法
技术领域
本发明涉及计算机应用技术领域的多媒体检索技术,是一种基于频谱特征分析的图像重复检测方法。
背景技术
随着多媒体技术和计算机网络的飞速发展,全世界包括数字图像、音频、视频在内的多媒体数据正在以惊人的速度进行增长。特别是图像数据,由于其直观、内容表达丰富、可以进行个性化编辑等因素,非常受到用户的青睐。但是,每天新生成的海量级的图像数据,由于其巨大的冗余性,无情地吞噬了我们有限的存储空间,并且淹没了很多有用的信息,从而给用户的图像数据搜索带来了很大的麻烦。如何才能使用户有效地利用信息并对所需多媒体资源的快捷定位、方便获取以及有效管理已经是一个亟待解决的问题,特别是那些为用户服务的互联网搜索公司以及个性化数据供应商更是希望能够低成本地维护和更新图像数据库。然而,目前诸如google、yahoo以及百度等成熟的商业图像搜索引擎几乎都是用文本来索引图像的,这样就会导致在数据库出现大量的文本索引不同而内容几乎一样的图像,从而占用了大量的宝贵的存储空间;更严重的是,用户检索服务的质量会严重下降,因为检索出来的图像存在很大的重复性,直接会影响用户的使用心情,造成用户的不满。因此,图像数据库中的重复检测问题显得尤为重要,然而重复检测问题的核心是图像表达。只要数据库中的图像索引做得好,就能有效地进行图像重复检测。
图像表达的本质是寻找一个合适的特征映射函数,该函数能够将图像映射到一个不仅类内相似度高而且类间相似度也低的高维空间。在图像表达研究领域,大致存在两种类型的特征映射函数,它们分别是基于底层视觉特征和高层语义特征,我们称它们为底层特征映射函数和高层语义特征映射函数。底层特征映射函数主要是获得图像的一些底层信息,这些信息主要包括颜色、纹理、梯度等。该函数的主要优点是操作方便,灵活度高,计算复杂度低等,其主要缺点是缺乏图像的高层语义信息。相比之下,高层语义特征映射函数主要是获得图像里的存在的目标或者整个图像场景的语义信息,其主要优点是能够有效进行图像理解,从而较准确地表达图像,但是,其主要的缺点是计算复杂度高,需要设定参数较多,灵活度低,不能够被大规模地使用。综合以上两种映射函数的优缺点以及图像数据库重复检测问题本身的特性,我们决定采用底层特征映射函数去捕获图像信息,其主要原因如下:(1)图像数据库的规模比较大,对计算复杂度的要求非常严格;如果采用高层语义特征映射函数的话,数据库维护和更新的代价非常巨大。(2)图像重复检测这个问题本身对图像内容表达的要求不高。通常,两幅重复的图像是可以通过一些变换进行相互转换的,这些变换主要包括平移、旋转以及尺度,且其变换幅度非常小。底层特征映射函数完全可以处理以上这些变换所造成的影响。(3)底层特征映射函数灵活度高,易于计算机处理;而高层语义特征映射函数正好相反,它受到诸多因素的限制,需要事先设置很多的经验参数,不利于计算机处理。于是在这种背景下,我们提出了一种融合图像颜色和梯度信息的特征。在该特征中,图像颜色信息是通过图像的频谱来体现的,而图像梯度信息主要是通过图像梯度方向直方图的频谱来体现的。在以下几个部分,我们将详细介绍该特征。
发明内容
本发明提出了一种基于频谱特征分析的图像重复检测方法,这种方法采用了集成了图像颜色和梯度信息的图像索引,,应用于图像重复检测领域。
本发明提出的基于频谱分析的图像重复检测方法,包括:
采用下采样模块对图像进行下采样,用于缩短图像频谱分析的计算时间;
采用频谱分析模块对图像进行频谱分析,用于提取下采样后的图像的低频谱信息,得到图像像素的颜色信息;
采用频谱分析模块对图像进行梯度信息分析;用于获取下采样后的图像梯度分布特征;
采用索引生成模块融合图像颜色和梯度信息,作为图像索引;
以图像索引为依据,检测图像是否重复。
进一步,所述下采样后的图像的低频谱信息包括旋转、平移以及尺度不变。
进一步,所述下采样后的图像梯度分布特征具有旋转、平移以及尺度不变的性质。
进一步,所述频谱分析步骤包括:
对图像进行傅立叶变换,获取其幅度谱;
对幅度谱进行对数极坐标映射形成一幅新的图像;
对这幅新的图像进行傅立叶变换,获得幅度谱;
仅保留低频谱信息,用来刻画图像颜色分布的特征。
进一步,所述梯度信息分析步骤包括:
提取图像每一个像素的梯度,统计所有像素的梯度方向;
将方向空间量化为n个等级;
将每一个像素的梯度方向映射到相应的等级,构建成了一个梯度方向直方图;
对直方图进行傅立叶变换,取其幅度谱;
将幅度谱作为刻画图像梯度信息的特征。
本发明提出的基于频谱特征分析的图像重复检测方法,使用的图像底层特征较好地表达了图像中的结构和细节信息;其作为图像索引,可以有效地检测出图像数据库中文本索引不同而内容几乎一样的图像,从而极大地节约了宝贵的存储空间,从而提高了用户检索服务的质量。
附图说明
图1为本发明系统结构框图;
图2为本发明检测重复山河图像的应用实例;
图3为本发明检测重复飞机图像实例;
图4为本发明检测重复溪流图像实例。
具体实施方式
下面将结合附图对本发明加以详细说明,应指出的是,所描述的实施例仅旨在便于对本发明的理解,而对其不起任何限定作用。
本发明总体结构由以下三个模块组成:一、下采样模块,该模块的功能是对图像进行下采样。二、频谱分析模块,该模块的功能足进行图像频谱分析和图像梯度信息分析。三、图像索引生成模块,该模块的任务是将频谱分析模块得到的两种特征统一起来,从而形成一个对图像旋转、平移以及尺度变化非常鲁棒的图像索引。我们利用这个索引来进行图像重复检测。图1显示了本发明的整体结构。
下面详细给出该发明技术方案中所涉及的各个细节问题的说明。
1)通过下采样模块对图像进行下采样。
首先将图像进行下采样,这样做的目的是降低计算复杂度,同时也能获取图像大尺度的结构信息。通常,下采样率是0.5,也就是图像的尺寸变成原来的一半。此外,如果要处理的图像是彩色图像,那么我们首先将彩色图像转换为灰度图像。
2)通过频谱分析模块对图像进行频谱分析。
对下采样后的图像进行傅立叶变换,获取其幅度谱;然后对幅度谱进行对数极坐标映射形成一幅新的图像;接着对这幅新的图像进行傅立叶变换,获得幅度谱;最后仅保留一些低频率的谱信息。经过以上处理后所获得的谱信息是不变于图像尺度、旋转以及平移变换的,这些属性可以通过我们以下的理论分析得到证实。
给定一幅原始图像fa(x,y),我们对它进行旋转、尺度以及平移变换后得到一幅新的图像fb(x,y),其中旋转角度是α,尺度因子是σ,x方向的平移量为x0,以及y方向的平移量为y0,以上变换过程可以用以下的公式说明:
fb(x,y)=fa[σ(x cosα+y sinα)-x0,σ(-x sinα+y cosα)-y0 ]。我们分别对fa(x,y)和fb(x,y)进行傅立叶变换,得到对应的频谱Fa(u,v)和Fb(u,v)。根据傅立叶变换理论,Fa(u,v)和Fb(u,v)存在以下的关系:
F b ( u , v ) = e - j φ b ( u , v ) { F a [ σ - 1 ( u cos α + vinα ) 0 , σ - 1 ( - u sin α + v cos α ) ] }
其中,φb(u,v)是fb(x,y)的相位谱,该相位谱与旋转角度、尺度因子以及平移量有关;但如果我们只考虑幅度频谱|Fb(u,v)|,就会发现|Fb(u,v)|是平移不变的,即:
|Fb(u,v)|=σ-2|Fa-1(u cosα+v sinα)0,σ-1(-u sinα+v cosα)]|。
以上公式表明,|Fa(u,v)|和|Fb(u,v)|之间是通过旋转角度α和尺度因子σ之间联系的。然后我们在极坐标系(r,θ)里重新表达|Fa(u,v)|和|Fb(u,v)|,即u=r cosθ和v=r sinθ。从而可以衍生出以下的关系:
fap(θ,r)=|Fa(r cosθ,r sinθ)|;fbp(θ,r)=|Fb(r cosθ,r sinθ)|
经过一些简化运算,我们可以得出:
fbp(θ,r)=σ-2fap(θ-α,r/σ)。
这样图像旋转转换就被转换为沿着角度轴θ的平移和半径轴r的尺度变换。接着,我们进一步将fbp(r,θ)的半径轴r映射到对数坐标系里,这样我就有了以下的关系式:
fbpl(θ,λ)=fbp(θ,r)=σ-2fapl(θ-α,λ-η),
其中,λ=log(r),η=log(σ)。这样以来,图像的旋转和平移就被简化为沿着λ轴和η轴的平移;然后我们对fbpl(θ,λ)进行傅立叶变换;根据傅立叶变换理论,我们有以下的关系:
Fbpl(ξ,ζ)=σ-2e-j2π(ξη+ζλ)Fapl(ξ,ζ)。
我们对|Fbpl(ξ,ζ)|进行归一化,然后取其作为最后的频谱特征,这样|Fbpl(ξ,ζ)|是旋转、尺度和平移不变的。
3)通过频谱分析模块对图像进行梯度信息分析。
提取下采样后的图像每一个像素的梯度,然后统计所有像素的梯度方向;接着,我们将方向空间等间隔量化为36个等级;然后我们将每一个像素的梯度方向映射到相应的等级,这样构建成了一个梯度方向直方图;然后对直方图进行傅立叶变换,取其幅度谱。由于梯度方向直方图本身具有尺度和平移不变的属性,再加上傅立叶变换后去幅度谱,这样以来得到的特征有具有旋转不变的特性。
4)通过索引生成模块融合图像颜色和梯度信息,实现特征集成。
第二步得到的谱特征和第三步得到的梯度方向直方图谱特征,它们都具有旋转、尺度以及平移不变的属性。我们将这两种特征组合起来作为一幅图像的索引,分别使用欧式距离来度量两幅图像之间的距离,另外再定义一个阈值来判别两幅图像是否重复;如果两种距离的和小于这个阈值,我们就认为比较的两幅图像是重复的;反之亦然。
图2、图3以及图4给出了我们图像重复检测系统的三个应用实例。在图2中,我们选中数据库中的一幅含有山河的图像,对其提取我们提出的基于频谱分析的图像底层特征,然后利用该特征进行图像匹配,从而挑选出数据库中与检索图像重复的4张图片。在图3中,我们选中数据库中的一幅含有飞机的图像,对其提取我们提出的基于频谱分析的图像底层特征,然后利用该特征进行图像匹配,从而挑选出数据库中与检索图像重复的3张图片。在图4中,我们选中数据库中的一幅含有溪流的图像,对其提取我们提出的基于频谱分析的图像底层特征,然后利用该特征进行图像匹配,从而挑选出数据库中与检索图像重复的3张图片。
以上所述,仅为本发明中的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉该技术的人在本发明所揭露的技术范围内,可理解想到的变换或替换,都应涵盖在本发明的包含范围之内,因此,本发明的保护范围应该以权利要求书的保护范围为准。

Claims (1)

1.一种基于频谱分析的图像重复检测方法,其特征在于,包括:
通过下采样模块对图像进行下采样,用于缩短图像频谱分析的计算时间;
通过频谱分析模块对下采样后的图像进行频谱分析,所述频谱分析步骤包括:
对图像进行傅立叶变换,获取其幅度谱;
对幅度谱进行对数极坐标映射形成一幅新的图像;
对这幅新的图像进行傅立叶变换,获得幅度谱;
仅保留低频谱信息,用来刻画图像颜色分布的特征;
通过频谱分析模块对下采样后的图像进行梯度信息分析,所述梯度信息分析步骤包括:
提取图像每一个像素的梯度,统计所有像素的梯度方向;
将方向空间量化为36个等级;
将每一个像素的梯度方向映射到相应的等级,构建成了一个梯度方向直方图;
对直方图进行傅立叶变换,取其幅度谱;
将幅度谱作为刻画图像梯度信息的特征;
通过索引生成模块融合图像颜色和梯度信息,作为图像索引;
以图像索引为依据,检测图像是否重复。
CN2007103042078A 2007-12-26 2007-12-26 基于频谱特征分析的图像重复检测方法 Active CN101470730B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2007103042078A CN101470730B (zh) 2007-12-26 2007-12-26 基于频谱特征分析的图像重复检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007103042078A CN101470730B (zh) 2007-12-26 2007-12-26 基于频谱特征分析的图像重复检测方法

Publications (2)

Publication Number Publication Date
CN101470730A CN101470730A (zh) 2009-07-01
CN101470730B true CN101470730B (zh) 2010-12-22

Family

ID=40828206

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007103042078A Active CN101470730B (zh) 2007-12-26 2007-12-26 基于频谱特征分析的图像重复检测方法

Country Status (1)

Country Link
CN (1) CN101470730B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5518007B2 (ja) * 2011-07-11 2014-06-11 クラリオン株式会社 車両用外界認識装置及びそれを用いた車両制御システム
CN103729368B (zh) * 2012-10-13 2016-12-21 复旦大学 一种基于局部频谱图像描述子的鲁棒音频识别方法
CN103593677A (zh) * 2013-12-02 2014-02-19 中国科学院自动化研究所 一种近似重复图像检测方法
CN103955496B (zh) * 2014-04-18 2018-06-12 大连恒锐科技股份有限公司 一种快速的现场轮胎痕迹花纹检索算法
CN105005565B (zh) * 2014-04-18 2019-03-05 大连恒锐科技股份有限公司 现场鞋底痕迹花纹图像检索方法
CN105023027B (zh) * 2014-04-18 2019-03-05 大连恒锐科技股份有限公司 基于多次反馈机制的现场鞋底痕迹花纹图像检索方法
CN107423715B (zh) * 2017-07-31 2020-05-19 大连海事大学 一种基于多特征联合决策的脚印自动识别方法
CN112015929B (zh) 2019-05-30 2024-07-05 阿里云计算有限公司 栅格数据访问方法、装置、电子设备及计算机存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1193648A1 (en) * 2000-06-30 2002-04-03 Texas Instruments Incorporated Image object ranking
CN1595434A (zh) * 2004-06-21 2005-03-16 南开大学 基于色彩内容及分布的彩色图像匹配分析方法
EP1221662A3 (en) * 2001-01-09 2006-04-12 Samsung Electronics Co., Ltd. Image retrieval method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1193648A1 (en) * 2000-06-30 2002-04-03 Texas Instruments Incorporated Image object ranking
EP1221662A3 (en) * 2001-01-09 2006-04-12 Samsung Electronics Co., Ltd. Image retrieval method
CN1595434A (zh) * 2004-06-21 2005-03-16 南开大学 基于色彩内容及分布的彩色图像匹配分析方法

Also Published As

Publication number Publication date
CN101470730A (zh) 2009-07-01

Similar Documents

Publication Publication Date Title
CN101470730B (zh) 基于频谱特征分析的图像重复检测方法
Thyagharajan et al. A review on near-duplicate detection of images using computer vision techniques
JP6397144B2 (ja) 画像からの事業発見
Gauen et al. Comparison of visual datasets for machine learning
Averkiou et al. Shapesynth: Parameterizing model collections for coupled shape exploration and synthesis
Yu et al. Artificial intelligence for Dunhuang cultural heritage protection: the project and the dataset
Xu et al. Satellite image spoofing: Creating remote sensing dataset with generative adversarial networks (short paper)
Yu et al. Stratified pooling based deep convolutional neural networks for human action recognition
CN104486585B (zh) 一种基于gis的城市海量监控视频管理方法及系统
CN109344298A (zh) 一种将非结构化数据转化为结构化数据的方法及装置
Zhang et al. Large‐scale video retrieval via deep local convolutional features
Li et al. I‐GANs for Infrared Image Generation
Kim et al. TVDP: Translational visual data platform for smart cities
Wang et al. Target detection algorithm based on super-resolution color remote sensing image reconstruction
CN107633259B (zh) 一种基于稀疏字典表示的跨模态学习方法
CN111968073B (zh) 一种基于纹理信息统计的无参考图像质量评价方法
Shi et al. A lightweight image splicing tampering localization method based on MobileNetV2 and SRM
Jing et al. Flood event image recognition via social media image and text analysis
Xiao et al. CTNet: hybrid architecture based on CNN and transformer for image inpainting detection
CN103092935A (zh) 一种基于sift量化的近似拷贝图像检测方法
Deng et al. Building Image Feature Extraction Using Data Mining Technology
Sun et al. Design of a Media Resource Management System for Colleges Based on Cloud Service
Zhang et al. Large Kernel Separable Mixed ConvNet for Remote Sensing Scene Classification
Mumar Image retrieval using SURF features
CN103530656B (zh) 基于隐结构学习的图像摘要生成方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20191203

Address after: 250101 2F, Hanyu Jingu new media building, high tech Zone, Jinan City, Shandong Province

Patentee after: Renmin Zhongke (Shandong) Intelligent Technology Co.,Ltd.

Address before: 100080 Zhongguancun East Road, Beijing, No. 95, No.

Patentee before: Institute of Automation, Chinese Academy of Sciences

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20200310

Address after: Room 201, 2 / F, Hanyu Jingu new media building, no.7000, Jingshi Road, Jinan City, Shandong Province, 250000

Patentee after: Renmin Zhongke (Jinan) Intelligent Technology Co.,Ltd.

Address before: 250101 2F, Hanyu Jingu new media building, high tech Zone, Jinan City, Shandong Province

Patentee before: Renmin Zhongke (Shandong) Intelligent Technology Co.,Ltd.

CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 100176 1401, 14th floor, building 8, No. 8 courtyard, No. 1 KEGU street, Beijing Economic and Technological Development Zone, Daxing District, Beijing (Yizhuang group, high-end industrial area, Beijing Pilot Free Trade Zone)

Patentee after: Renmin Zhongke (Beijing) Intelligent Technology Co.,Ltd.

Address before: Room 201, 2 / F, Hangu Jinggu new media building, 7000 Jingshi Road, Jinan City, Shandong Province

Patentee before: Renmin Zhongke (Jinan) Intelligent Technology Co.,Ltd.