CN110019871A - 图像检索方法及装置 - Google Patents
图像检索方法及装置 Download PDFInfo
- Publication number
- CN110019871A CN110019871A CN201711474391.0A CN201711474391A CN110019871A CN 110019871 A CN110019871 A CN 110019871A CN 201711474391 A CN201711474391 A CN 201711474391A CN 110019871 A CN110019871 A CN 110019871A
- Authority
- CN
- China
- Prior art keywords
- image
- object region
- feature
- described image
- query
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/51—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开涉及图像检索方法及装置。该方法包括:对于图像库中的任意一个图像,检测所述图像中的物体所在区域;提取所述图像中的物体所在区域的特征,并将所述图像中的物体所在区域的特征作为所述图像的特征;根据所述图像库中的各个图像的特征,建立所述图像库对应的索引文件;在接收到图像检索请求的情况下,检测所述图像检索请求对应的查询图像中的物体所在区域;提取所述查询图像中的物体所在区域的特征;根据所述查询图像中的物体所在区域的特征检索所述索引文件,得到检索结果。本公开能够提高图像检索的准确性和速度。
Description
技术领域
本公开涉及计算机技术领域,尤其涉及一种图像检索方法及装置。
背景技术
近年来,随着多媒体技术和计算机网络的飞速发展,全世界的数字图像的数量正以惊人的速度在增长。为了使这些庞杂的图像中所包含的信息被有效地访问和利用,必然需要一种能够快速且准确地查找访问图像的技术,即图像的检索技术。随着大规模数字图像库的出现,传统的依赖于人工标注进行的基于文本的图像检索技术已经无法满足用户日益增长的需求,CBIR(Content Based Image Retrieval,基于内容的图像检索)技术便应运而生。CBIR的一般做法是先提取出图像的特征建立特征数据库,这样就把图像库中的一个实例转换成了特征空间中的一个点。而图像特征一般都是高维的矢量数据,所以对图像基于内容的相似检索就转换为对高维特征矢量的最邻近检索。如何提高图像检索的准确性和速度,是迫切需要解决的问题。
发明内容
有鉴于此,本公开提出了一种图像检索方法及装置。
根据本公开的一方面,提供了一种图像检索方法,包括:
对于图像库中的任意一个图像,检测所述图像中的物体所在区域;
提取所述图像中的物体所在区域的特征,并将所述图像中的物体所在区域的特征作为所述图像的特征;
根据所述图像库中的各个图像的特征,建立所述图像库对应的索引文件;
在接收到图像检索请求的情况下,检测所述图像检索请求对应的查询图像中的物体所在区域;
提取所述查询图像中的物体所在区域的特征;
根据所述查询图像中的物体所在区域的特征检索所述索引文件,得到检索结果。
在一种可能的实现方式中,提取所述图像中的物体所在区域的特征,包括:
提取所述图像中的物体所在区域的特征点描述子;
对所述图像中的物体所在区域的特征点描述子进行聚类,得到所述图像中的物体所在区域对应的聚类结果;
根据所述聚类结果生成所述图像中的物体所在区域的特征。
在一种可能的实现方式中,对于图像库中的任意一个图像,检测所述图像中的物体所在区域,包括:
对于图像库中的任意一个图像,检测所述图像中的所有物体的物体所在区域。
在一种可能的实现方式中,在接收到图像检索请求的情况下,检测所述图像检索请求对应的查询图像中的物体所在区域,包括:
在接收到图像检索请求的情况下,检测所述图像检索请求对应的查询图像中的所有物体的物体所在区域。
在一种可能的实现方式中,在接收到图像检索请求的情况下,检测所述图像检索请求对应的查询图像中的物体所在区域,包括:
在接收到图像检索请求的情况下,确定用户在所述图像检索请求对应的查询图像中选择的查询区域;
检测所述查询区域中的物体所在区域。
根据本公开的另一方面,提供了一种图像检索装置,包括:
第一检测模块,用于对于图像库中的任意一个图像,检测所述图像中的物体所在区域;
第一提取模块,用于提取所述图像中的物体所在区域的特征,并将所述图像中的物体所在区域的特征作为所述图像的特征;
建立模块,用于根据所述图像库中的各个图像的特征,建立所述图像库对应的索引文件;
第二检测模块,用于在接收到图像检索请求的情况下,检测所述图像检索请求对应的查询图像中的物体所在区域;
第二提取模块,用于提取所述查询图像中的物体所在区域的特征;
检索模块,用于根据所述查询图像中的物体所在区域的特征检索所述索引文件,得到检索结果。
在一种可能的实现方式中,所述第一提取模块包括:
提取子模块,用于提取所述图像中的物体所在区域的特征点描述子;
聚类子模块,用于对所述图像中的物体所在区域的特征点描述子进行聚类,得到所述图像中的物体所在区域对应的聚类结果;
生成子模块,用于根据所述聚类结果生成所述图像中的物体所在区域的特征。
在一种可能的实现方式中,所述第一检测模块用于:
对于图像库中的任意一个图像,检测所述图像中的所有物体的物体所在区域。
在一种可能的实现方式中,所述第二检测模块用于:
在接收到图像检索请求的情况下,检测所述图像检索请求对应的查询图像中的所有物体的物体所在区域。
在一种可能的实现方式中,所述第二检测模块包括:
确定子模块,用于在接收到图像检索请求的情况下,确定用户在所述图像检索请求对应的查询图像中选择的查询区域;
检测子模块,用于检测所述查询区域中的物体所在区域。
根据本公开的另一方面,提供了一种图像检索装置,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为执行上述方法。
根据本公开的另一方面,提供了一种非易失性计算机可读存储介质,其上存储有计算机程序指令,其中,所述计算机程序指令被处理器执行时实现上述方法。
本公开的各方面的图像检索方法及装置通过对于图像库中的任意一个图像,检测该图像中的物体所在区域,提取该图像中的物体所在区域的特征,并将该图像中的物体所在区域的特征作为该图像的特征,根据图像库中的各个图像的特征,建立图像库对应的索引文件,在接收到图像检索请求的情况下,检测图像检索请求对应的查询图像中的物体所在区域,提取查询图像中的物体所在区域的特征,并根据查询图像中的物体所在区域的特征检索索引文件,得到检索结果,由此能够提高图像检索的准确性和速度。
根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本公开的示例性实施例、特征和方面,并且用于解释本公开的原理。
图1示出根据本公开一实施例的图像检索方法的流程图。
图2示出根据本公开一实施例的图像检索方法步骤S12中提取该图像中的物体所在区域的特征的一示例性的流程图。
图3示出根据本公开一实施例的图像检索方法步骤S14的一示例性的流程图。
图4示出根据本公开一实施例的图像检索的框图。
图5示出根据本公开一实施例的图像检索的一示例性的框图。
图6是根据一示例性实施例示出的一种用于图像检索的装置1900的框图。
具体实施方式
以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
另外,为了更好的说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。
图1示出根据本公开一实施例的图像检索方法的流程图。该方法可以应用于服务器中。该方法可以用于检索图像,也可以在检索到图像之后,获取图像所属的视频。例如,输入某个明星的照片,可以查找与该明星有关的视频。又如,照片版权所有者可以检测其照片被其他地方引用的情况。如图1所示,该方法包括步骤S11至步骤S16。
在步骤S11中,对于图像库中的任意一个图像,检测该图像中的物体所在区域。
在本实施例中,图像库可以包括可被检索的所有图像,也可以包括从可被检索的视频中抽取的图像等,在此不作限定。
在一种可能的实现方式中,可以采用YOLO(You Only Look Once,你只看一眼)v2算法检测图像库中的各个图像的物体所在区域。本实施例可以不对检测的物体进行分类,从而能够避免分类误差。
在另一种可能的实现方式中,可以采用不同尺度的滑动窗口遍历图像中的所有位置,判断滑动窗口中是否是物体,从而确定图像中的物体所在区域。
在另一种可能的实现方式中,可以通过RCNN(Region-based ConvolutionalNeural Networks,基于区域的卷积神经网路)在图像中找出可能是物体的框,判断框中是否是物体,从而确定图像中的物体所在区域。
本实施例通过对图像库中的各个图像进行物体检测,能够加强理解图像库中的各个图像的图像内容,从而能够进一步提高图像检索的准确性。
在一种可能的实现方式中,对于图像库中的任意一个图像,检测该图像中的物体所在区域,可以包括:对于图像库中的任意一个图像,检测该图像中的所有物体的物体所在区域。
在步骤S12中,提取该图像中的物体所在区域的特征,并将该图像中的物体所在区域的特征作为该图像的特征。
在本实施例中,对于该图像中的各个物体所在区域,可以分别提取特征。
在一种可能的实现方式中,提取该图像中的物体所在区域的特征,可以包括:提取该图像中的物体所在区域的局部特征。其中,局部特征可以为VLAD(Vector of LocallyAggregated Descriptors,局部特征聚合描述符)特征、VLAT(Vector of LocallyAggregated Tensors,局部特征聚合张量)、LLC(Locality-constrained Linear Coding,局部约束线性编码)特征、SIFT(Scale-Invariant Feature Transform,尺度不变特征变换)特征、SURF(Speeded Up Robust Features,加速稳健特征)或者KAZE特征等。
在另一种可能的实现方式中,提取该图像中的物体所在区域的特征,可以包括:提取该图像中的物体所在区域的深度特征。其中,深度特征可以指通过深度学习网络提取的特征。其中,深度学习网络可以为ResNet、VGG网络或者AlexNet等,在此不作限定。
在另一种可能的实现方式中,提取该图像中的物体所在区域的特征,可以包括:提取该图像中的物体所在区域的局部特征和深度特征。
本实施例中通过将图像中的物体所在区域的特征作为图像的特征,能够减少图像中的背景干扰,从而可以针对图像中的某个特定目标进行检索。
在步骤S13中,根据图像库中的各个图像的特征,建立图像库对应的索引文件。
在一种可能的实现方式中,在物体检测算法更新之后,可以重新对图像库中的各个图像进行物体检测,进而能够增量更新索引文件,且不破坏已经生成的索引。
本实施例基于检测的物体所在区域建立索引文件,从而在图像检索时,即使图像库中没有完全一样的图像,或者图像中的显著区域发生改变,或者用户采用一部分的截图进行图像检索,仍然能够获得较好的检索结果。
在一种可能的实现方式中,可以采用Faiss库,建立图像库对应的索引文件。
在步骤S14中,在接收到图像检索请求的情况下,检测图像检索请求对应的查询图像中的物体所在区域。
在一种可能的实现方式中,可以采用YOLOv2算法检测查询图像中的物体所在区域。
本实施例通过对查询图像进行物体检测,能够加强理解查询图像的图像内容,从而能够进一步提高图像检索的准确性。
在一种可能的实现方式中,在接收到图像检索请求的情况下,检测图像检索请求对应的查询图像中的物体所在区域,可以包括:在接收到图像检索请求的情况下,检测图像检索请求对应的查询图像中的所有物体的物体所在区域。
在步骤S15中,提取查询图像中的物体所在区域的特征。
在本实施例中,对于查询图像中的各个物体所在区域,可以分别提取特征。
在一种可能的实现方式中,提取查询图像中的物体所在区域的特征,可以包括:提取查询图像中的物体所在区域的局部特征。
在另一种可能的实现方式中,提取查询图像中的物体所在区域的特征,可以包括:提取查询图像中的物体所在区域的深度特征。
在另一种可能的实现方式中,提取查询图像中的物体所在区域的特征,可以包括:提取查询图像中的物体所在区域的局部特征和深度特征。
在步骤S16中,根据查询图像中的物体所在区域的特征检索索引文件,得到检索结果。
在一种可能的实现方式中,可以计算查询图像的物体所在区域的特征与索引文件中的各个图像的特征的距离,并可以根据与查询图像的物体所在区域的特征的距离最小的N个特征对应的图像确定检索结果,其中,N为正整数。
作为该实现方式的一个示例,可以按照与查询图像的物体所在区域的特征的距离由小到大的顺序,对该N个图像进行排序,得到检索结果。
本实施例通过对于图像库中的任意一个图像,检测该图像中的物体所在区域,提取该图像中的物体所在区域的特征,并将该图像中的物体所在区域的特征作为该图像的特征,根据图像库中的各个图像的特征,建立图像库对应的索引文件,在接收到图像检索请求的情况下,检测图像检索请求对应的查询图像中的物体所在区域,提取查询图像中的物体所在区域的特征,并根据查询图像中的物体所在区域的特征检索索引文件,得到检索结果,由此能够提高图像检索的准确性和速度。
图2示出根据本公开一实施例的图像检索方法步骤S12中提取该图像中的物体所在区域的特征的一示例性的流程图。如图2所示,提取该图像中的物体所在区域的特征可以包括步骤S121至步骤S123。
在步骤S121中,提取该图像中的物体所在区域的特征点描述子。
在一种可能的实现方式中,可以分别提取该图像中的各个物体所在区域的SIFT特征点描述子。
在步骤S122中,对该图像中的物体所在区域的特征点描述子进行聚类,得到该图像中的物体所在区域对应的聚类结果。
在一种可能的实现方式,对于该图像中的任意一个物体所在区域,可以对该物体所在区域的SIFT特征点描述子进行聚类,得到该物体所在区域对应的聚类结果。
在步骤S123中,根据聚类结果生成该图像中的物体所在区域的特征。
在一种可能的实现方式,可以根据该物体所在区域的SIFT特征点描述子的聚类结果生成该物体所在区域的VLAD特征,并可以将生成的VLAD特征作为该物体所在区域的特征。
图3示出根据本公开一实施例的图像检索方法步骤S14的一示例性的流程图。如图3所示,步骤S14可以包括步骤S141和步骤S142。
在步骤S141中,在接收到图像检索请求的情况下,确定用户在图像检索请求对应的查询图像中选择的查询区域。
在本实施例中,在图像检索时,用户可以在查询图像中选择一个或多个区域作为查询区域。
在步骤S142中,检测查询区域中的物体所在区域。
在本实施例中,可以仅检测查询图像中查询区域中的物体所在区域,而不检测查询图像中查询区域以外的区域中的物体所在区域,从而能够使检索结果符合用户的检索需求,避免查询图像中的背景区域对图像检索产生干扰。
图4示出根据本公开一实施例的图像检索的框图。如图4所示,该装置包括:第一检测模块41,用于对于图像库中的任意一个图像,检测该图像中的物体所在区域;第一提取模块42,用于提取该图像中的物体所在区域的特征,并将该图像中的物体所在区域的特征作为该图像的特征;建立模块43,用于根据图像库中的各个图像的特征,建立图像库对应的索引文件;第二检测模块44,用于在接收到图像检索请求的情况下,检测图像检索请求对应的查询图像中的物体所在区域;第二提取模块45,用于提取查询图像中的物体所在区域的特征;检索模块46,用于根据查询图像中的物体所在区域的特征检索索引文件,得到检索结果。
图5示出根据本公开一实施例的图像检索的一示例性的框图。如图5所示:
在一种可能的实现方式中,第一提取模块42包括:提取子模块421,用于提取该图像中的物体所在区域的特征点描述子;聚类子模块422,用于对该图像中的物体所在区域的特征点描述子进行聚类,得到该图像中的物体所在区域对应的聚类结果;生成子模块423,用于根据聚类结果生成该图像中的物体所在区域的特征。
在一种可能的实现方式中,第一检测模块41用于:对于图像库中的任意一个图像,检测该图像中的所有物体的物体所在区域。
在一种可能的实现方式中,第二检测模块44用于:在接收到图像检索请求的情况下,检测图像检索请求对应的查询图像中的所有物体的物体所在区域。
在一种可能的实现方式中,第二检测模块44包括:确定子模块441,用于在接收到图像检索请求的情况下,确定用户在图像检索请求对应的查询图像中选择的查询区域;检测子模块442,用于检测查询区域中的物体所在区域。
本实施例通过对于图像库中的任意一个图像,检测该图像中的物体所在区域,提取该图像中的物体所在区域的特征,并将该图像中的物体所在区域的特征作为该图像的特征,根据图像库中的各个图像的特征,建立图像库对应的索引文件,在接收到图像检索请求的情况下,检测图像检索请求对应的查询图像中的物体所在区域,提取查询图像中的物体所在区域的特征,并根据查询图像中的物体所在区域的特征检索索引文件,得到检索结果,由此能够提高图像检索的准确性和速度。
图6是根据一示例性实施例示出的一种用于图像检索的装置1900的框图。例如,装置1900可以被提供为一服务器。参照图6,装置1900包括处理组件1922,其进一步包括一个或多个处理器,以及由存储器1932所代表的存储器资源,用于存储可由处理组件1922的执行的指令,例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1922被配置为执行指令,以执行上述方法。
装置1900还可以包括一个电源组件1926被配置为执行装置1900的电源管理,一个有线或无线网络接口1950被配置为将装置1900连接到网络,和一个输入输出(I/O)接口1958。装置1900可以操作基于存储在存储器1932的操作系统,例如Windows ServerTM,MacOS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算机程序指令的存储器1932,上述计算机程序指令可由装置1900的处理组件1922执行以完成上述方法。
本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
Claims (12)
1.一种图像检索方法,其特征在于,包括:
对于图像库中的任意一个图像,检测所述图像中的物体所在区域;
提取所述图像中的物体所在区域的特征,并将所述图像中的物体所在区域的特征作为所述图像的特征;
根据所述图像库中的各个图像的特征,建立所述图像库对应的索引文件;
在接收到图像检索请求的情况下,检测所述图像检索请求对应的查询图像中的物体所在区域;
提取所述查询图像中的物体所在区域的特征;
根据所述查询图像中的物体所在区域的特征检索所述索引文件,得到检索结果。
2.根据权利要求1所述的方法,其特征在于,提取所述图像中的物体所在区域的特征,包括:
提取所述图像中的物体所在区域的特征点描述子;
对所述图像中的物体所在区域的特征点描述子进行聚类,得到所述图像中的物体所在区域对应的聚类结果;
根据所述聚类结果生成所述图像中的物体所在区域的特征。
3.根据权利要求1所述的方法,其特征在于,对于图像库中的任意一个图像,检测所述图像中的物体所在区域,包括:
对于图像库中的任意一个图像,检测所述图像中的所有物体的物体所在区域。
4.根据权利要求1所述的方法,其特征在于,在接收到图像检索请求的情况下,检测所述图像检索请求对应的查询图像中的物体所在区域,包括:
在接收到图像检索请求的情况下,检测所述图像检索请求对应的查询图像中的所有物体的物体所在区域。
5.根据权利要求1所述的方法,其特征在于,在接收到图像检索请求的情况下,检测所述图像检索请求对应的查询图像中的物体所在区域,包括:
在接收到图像检索请求的情况下,确定用户在所述图像检索请求对应的查询图像中选择的查询区域;
检测所述查询区域中的物体所在区域。
6.一种图像检索装置,其特征在于,包括:
第一检测模块,用于对于图像库中的任意一个图像,检测所述图像中的物体所在区域;
第一提取模块,用于提取所述图像中的物体所在区域的特征,并将所述图像中的物体所在区域的特征作为所述图像的特征;
建立模块,用于根据所述图像库中的各个图像的特征,建立所述图像库对应的索引文件;
第二检测模块,用于在接收到图像检索请求的情况下,检测所述图像检索请求对应的查询图像中的物体所在区域;
第二提取模块,用于提取所述查询图像中的物体所在区域的特征;
检索模块,用于根据所述查询图像中的物体所在区域的特征检索所述索引文件,得到检索结果。
7.根据权利要求6所述的装置,其特征在于,所述第一提取模块包括:
提取子模块,用于提取所述图像中的物体所在区域的特征点描述子;
聚类子模块,用于对所述图像中的物体所在区域的特征点描述子进行聚类,得到所述图像中的物体所在区域对应的聚类结果;
生成子模块,用于根据所述聚类结果生成所述图像中的物体所在区域的特征。
8.根据权利要求6所述的装置,其特征在于,所述第一检测模块用于:
对于图像库中的任意一个图像,检测所述图像中的所有物体的物体所在区域。
9.根据权利要求6所述的装置,其特征在于,所述第二检测模块用于:
在接收到图像检索请求的情况下,检测所述图像检索请求对应的查询图像中的所有物体的物体所在区域。
10.根据权利要求6所述的装置,其特征在于,所述第二检测模块包括:
确定子模块,用于在接收到图像检索请求的情况下,确定用户在所述图像检索请求对应的查询图像中选择的查询区域;
检测子模块,用于检测所述查询区域中的物体所在区域。
11.一种图像检索装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行权利要求1至5中任意一项所述的方法。
12.一种非易失性计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至5中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711474391.0A CN110019871A (zh) | 2017-12-29 | 2017-12-29 | 图像检索方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711474391.0A CN110019871A (zh) | 2017-12-29 | 2017-12-29 | 图像检索方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110019871A true CN110019871A (zh) | 2019-07-16 |
Family
ID=67187172
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711474391.0A Pending CN110019871A (zh) | 2017-12-29 | 2017-12-29 | 图像检索方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110019871A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102687140A (zh) * | 2009-12-30 | 2012-09-19 | 诺基亚公司 | 用于有助于基于内容的图像检索的方法和装置 |
CN106326288A (zh) * | 2015-06-30 | 2017-01-11 | 阿里巴巴集团控股有限公司 | 图像搜索方法及装置 |
CN106649487A (zh) * | 2016-10-09 | 2017-05-10 | 苏州大学 | 基于兴趣目标的图像检索方法 |
CN107256262A (zh) * | 2017-06-13 | 2017-10-17 | 西安电子科技大学 | 一种基于物体检测的图像检索方法 |
CN107423294A (zh) * | 2016-02-25 | 2017-12-01 | 北京联合大学 | 一种社群图像检索方法及系统 |
-
2017
- 2017-12-29 CN CN201711474391.0A patent/CN110019871A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102687140A (zh) * | 2009-12-30 | 2012-09-19 | 诺基亚公司 | 用于有助于基于内容的图像检索的方法和装置 |
CN106326288A (zh) * | 2015-06-30 | 2017-01-11 | 阿里巴巴集团控股有限公司 | 图像搜索方法及装置 |
CN107423294A (zh) * | 2016-02-25 | 2017-12-01 | 北京联合大学 | 一种社群图像检索方法及系统 |
CN106649487A (zh) * | 2016-10-09 | 2017-05-10 | 苏州大学 | 基于兴趣目标的图像检索方法 |
CN107256262A (zh) * | 2017-06-13 | 2017-10-17 | 西安电子科技大学 | 一种基于物体检测的图像检索方法 |
Non-Patent Citations (2)
Title |
---|
袁津生,李群,蔡岳: "《搜索引擎原理与实践》", 30 November 2008 * |
黄孝平: "《当代机器深度学习方法与应用研究》", 30 November 2017 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11163818B2 (en) | Media fingerprinting and identification system | |
Zhang et al. | Panorama: a data system for unbounded vocabulary querying over video | |
CN111651636A (zh) | 视频相似片段搜索方法及装置 | |
Kumar et al. | Indian classical dance classification with adaboost multiclass classifier on multifeature fusion | |
Iakovidou et al. | Localizing global descriptors for content-based image retrieval | |
KR20200002332A (ko) | 딥 러닝을 이용하여 이미지를 검색하는 단말 장치 및 방법 | |
CN113343920A (zh) | 人脸识别照片的分类方法、装置、电子设备和存储介质 | |
CN113139540A (zh) | 背板检测方法及设备 | |
Sitaula et al. | Unsupervised deep features for privacy image classification | |
CN110019910A (zh) | 图像检索方法及装置 | |
Cuffaro et al. | Segmentation free object discovery in video | |
WO2024222406A1 (zh) | 基于视频内容的处理方法、装置、设备和存储介质 | |
Varghese et al. | A novel video genre classification algorithm by keyframe relevance | |
CN110019874A (zh) | 索引文件的生成方法、装置及系统 | |
Sharma et al. | Performance Analysis of Object Detection Algorithms on YouTube Video Object Dataset. | |
CN110019096A (zh) | 索引文件的生成方法及装置 | |
Gao et al. | Data-driven lightweight interest point selection for large-scale visual search | |
CN110019871A (zh) | 图像检索方法及装置 | |
CN110019985A (zh) | 索引文件的建立、查询方法及装置 | |
Rao et al. | Common object discovery as local search for maximum weight cliques in a global object similarity graph | |
Hase et al. | Data augmentation for intra-class imbalance with generative adversarial network | |
Ciubotariu et al. | Enhancing the performance of image classification through features automatically learned from depth-maps | |
Calarasanu et al. | From text detection to text segmentation: a unified evaluation scheme | |
Galopoulos et al. | Towards a privacy respecting image-based user profiling component | |
Zhou et al. | Content based image retrieval using local directional pattern and color histogram |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20200515 Address after: 310052 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province Applicant after: Alibaba (China) Co.,Ltd. Address before: 200241 room 1162, building 555, Dongchuan Road, Shanghai, Minhang District Applicant before: SHANGHAI QUAN TOODOU CULTURAL COMMUNICATION Co.,Ltd. |
|
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190716 |