[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN109034150B - 图像处理方法及装置 - Google Patents

图像处理方法及装置 Download PDF

Info

Publication number
CN109034150B
CN109034150B CN201810620868.XA CN201810620868A CN109034150B CN 109034150 B CN109034150 B CN 109034150B CN 201810620868 A CN201810620868 A CN 201810620868A CN 109034150 B CN109034150 B CN 109034150B
Authority
CN
China
Prior art keywords
editing operation
image
editing
position information
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810620868.XA
Other languages
English (en)
Other versions
CN109034150A (zh
Inventor
杨松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaomi Mobile Software Co Ltd
Original Assignee
Beijing Xiaomi Mobile Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaomi Mobile Software Co Ltd filed Critical Beijing Xiaomi Mobile Software Co Ltd
Priority to CN201810620868.XA priority Critical patent/CN109034150B/zh
Publication of CN109034150A publication Critical patent/CN109034150A/zh
Application granted granted Critical
Publication of CN109034150B publication Critical patent/CN109034150B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/40Filling a planar surface by adding surface attributes, e.g. colour or texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本公开是关于一种图像处理方法及装置,包括获取图像集合,所述图像集合包括多个图像;在检测到针对所述图像集合中任意一个图像的编辑操作时,获取所述编辑操作的对象和类型;获取所述图像集合的各图像中与所述编辑操作的对象相同的对象;对与所述编辑操作的对象相同的对象进行所述类型的编辑,通过在检测到针对某一对象的编辑操作时,对图像集合的各图像中相同的对象进行相同类型的编辑,根据本公开实施例的图像处理方法及装置能够实现对多个图像中对象的批量编辑,减少用户交互次数,提高编辑效率。

Description

图像处理方法及装置
技术领域
本公开涉及图像处理技术领域,尤其涉及一种图像处理方法及装置。
背景技术
出于保护隐私的目的,用户在分享图像时可能会对照片进行一些处理,例如对一些区域(车牌、行人或者人脸等)加入马赛克。相关技术中,用户对同一个场景拍摄很多照片后,需要用户一张一张照片进行处理,比较费时。
发明内容
为克服相关技术中存在的问题,本公开提供一种图像处理方法及装置。
根据本公开实施例的第一方面,提供一种图像处理方法,包括获取图像集合,所述图像集合包括多个图像;在检测到针对所述图像集合中任意一个图像的编辑操作时,获取所述编辑操作的对象和类型;获取所述图像集合的各图像中与所述编辑操作的对象相同的对象;对与所述编辑操作的对象相同的对象进行所述类型的编辑。
在一种可能的实现方式中,所述获取所述图像集合的各图像中与所述编辑操作的对象相同的对象包括:针对所述图像集合中的每个图像,对该图像进行目标检测,确定该图像中各对象的位置信息和类别;针对各图像中确定的每个对象,根据该对象的位置信息,提取该对象的特征向量;针对各图像中与所述编辑操作的对象属于同一类别的对象,确定各对象的特征向量与所述编辑操作的对象的特征向量之间的相似度;将各图像中与所述编辑操作的对象属于同一类别的对象中,所述相似度大于特征阈值的对象确定为与所述编辑操作的对象相同的对象。
在一种可能的实现方式中,所述获取所述编辑操作的对象包括:获取所述编辑操作的位置信息;针对所述编辑操作对应的图像中的每个对象:根据所述编辑操作的位置信息和该对象的位置信息,确定所述编辑操作与该对象的重合度;若所述编辑操作与该对象的重合度大于重合阈值,则确定该对象为所述编辑操作的对象。
在一种可能的实现方式中,所述对所述编辑操作的对象相同的对象进行所述类型的编辑包括:针对每个与所述编辑操作的对象相同的对象,根据该对象的位置信息确定该对象所在的区域;对与所述编辑操作的对象相同的各个对象所在的区域,分别进行所述类型的编辑。
在一种可能的实现方式中,所述方法还包括:在所述编辑操作的对象所在图像中,对所述编辑操作的对象的位置信息对应的区域进行所述类型的编辑。
根据本公开实施例的第二方面,提供一种图像处理装置,所述装置包括:集合获取模块,用于获取图像集合,所述图像集合包括多个图像;第一对象获取模块,用于在检测到针对所述图像集合中任意一个图像的编辑操作时,获取所述编辑操作的对象和类型;第二对象获取模块,用于获取所述图像集合的各图像中与所述编辑操作的对象相同的对象;第一对象编辑模块,用于对与所述编辑操作的对象相同的对象进行所述类型的编辑。
在一种可能的实现方式中,所述第二对象获取模块包括:目标检测子模块,用于针对所述图像集合中的每个图像,对该图像进行目标检测,确定该图像中各对象的位置信息和类别;特征提取子模块,用于针对各图像中确定的每个对象,根据该对象的位置信息,提取该对象的特征向量;相似度确定子模块,用于针对各图像中与所述编辑操作的对象属于同一类别的对象,确定各对象的特征向量与所述编辑操作的对象的特征向量之间的相似度;第一对象确定子模块,用于将各图像中与所述编辑操作的对象属于同一类别的对象中,所述相似度大于特征阈值的对象确定为与所述编辑操作的对象相同的对象。
在一种可能的实现方式中,所述第一对象获取模块包括:位置获取子模块,用于获取所述编辑操作的位置信息;重合度确定子模块,用于针对所述编辑操作对应的图像中的每个对象,根据所述编辑操作的位置信息和该对象的位置信息,确定所述编辑操作与该对象的重合度;第二对象确定子模块,用于针对所述编辑操作对应的图像中的每个对象,当所述编辑操作与该对象的重合度大于重合阈值时,确定该对象为所述编辑操作的对象。
在一种可能的实现方式中,所述第一对象编辑模块包括:区域确定子模块,用于针对每个与所述编辑操作的对象相同的对象,根据该对象的位置信息确定该对象所在的区域;区域编辑子模块,用于对与所述编辑操作的对象相同的各个对象所在的区域,分别进行所述类型的编辑。
在一种可能的实现方式中,第二对象编辑模块,用于在所述编辑操作的对象所在图像中,对所述编辑操作的对象的位置信息对应的区域进行所述类型的编辑。
根据本公开实施例的第三方面,提供一种图像处理装置,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为执行上述方法。
根据本公开实施例的第四方面,提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由处理器执行时,使得处理器能够执行上述方法。
本公开的实施例提供的技术方案可以包括以下有益效果:在本公开中,在检测到针对图像集合中任意一个图像的编辑操作时,可以根据编辑操作的对象和类型,对图像集合的各图像中相同的对象进行相同类型的编辑,通过某个图像上的编辑操作可以实现对多个图像中对象的批量编辑,减少了用户交互次数,提高了编辑效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的一种图像处理方法的流程图。
图2是根据本公开一实施例示出的一种图像处理方法的流程图。
图3是根据本公开一实施例示出的一种图像处理方法的流程图。
图4是根据本公开一实施例示出的一种图像处理方法的流程图。
图5是根据本公开一实施例示出的一种图像处理方法的流程图。
图6是根据本公开一实施例示出的一种图像处理装置的框图。
图7是根据本公开一实施例示出的一种图像处理装置的框图。
图8是根据一示例性实施例示出的一种用于图像处理的装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种图像处理方法的流程图。该方法可以用于终端中,例如手机、平板和计算机等。参照图1,该图像处理方法可以包括以下步骤:
在步骤S11中,获取图像集合,所述图像集合包括多个图像。
图像集合包括多个图像。在本公开实施例中,图像集合可以是用户选择需要进行批量传播(例如,在社交网站上分享、展示等)的图像时形成的图像集合,也可能是终端按照图像来源、拍摄时间和拍摄地点等自动分类形成的图像集合。本公开对图像集合包括的图像不做限制。
在步骤S12中,在检测到针对所述图像集合中任意一个图像的编辑操作时,获取所述编辑操作的对象和类型。
针对图像的编辑操作可以为单击、双击或者滑动等操作,对此本公开不做限制。编辑操作的类型可以为马赛克、涂鸦和填充等,对此本公开不做限制。编辑操作的对象可以为车牌、行人、人脸等。在一个示例中,用户在图像A中的车牌B上涂抹马赛克时,终端可以获取到编辑操作的对象为车牌B,编辑操作的类型为马赛克。
在步骤S13中,获取所述图像集合的各图像中与所述编辑操作的对象相同的对象。
图像集合的各图像可能包括相同的对象、对应于同一场景等,例如都有某些人、某个物品等。一个图像中可能包括多个相同的对象,例如包括多个同款式的杯子、包括多个相同的长椅等。
在步骤S14中,对与所述编辑操作的对象相同的对象进行所述类型的编辑。
终端检测到对某个图像中某个对象的编辑操作后,可以对图像集合的各图像(包括该图像)中与该对象相同的对象都进行编辑操作对应的编辑。
在本公开中,在检测到针对图像集合中任意一个图像的编辑操作时,可以根据编辑操作的对象和类型,对图像集合的各图像中相同的对象进行相同类型的编辑,通过某个图像上的编辑操作可以实现对多个图像中对象的自动编辑,减少了用户交互次数,提高了编辑效率。
图2是根据本公开一实施例示出的一种图像处理方法的流程图。参照图2,步骤S13获取所述图像集合的各图像中与所述编辑操作的对象相同的对象可以包括步骤S131至步骤S134。
在步骤S131中,针对所述图像集合中的每个图像,对该图像进行目标检测,确定该图像中各对象的位置信息和类别。
图像分类可以确定出一幅图像中包含的对象的类别。目标检测在图像分类的基础上,还可以进行对象定位,定位常用表征就是对象的外接框。
终端中可预先设置对象可能属于的目标类别。对图像进行目标检测后,终端可得到图像中各个对象的位置,以及每个对象为每个目标类别的概率。针对图像中的每个对象,终端可以将最大概率对应的目标类别确定为该对象的类别。
经过目标检测,可以得到图像中各对象的外接框r的位置信息,r=(x,y,w,h),其中,x和y为外接框r的一个顶点,w和h分别为外接框r的宽度和长度。在本公开实施例中,可以采用对象的外接框r的位置信息表示对象的位置信息。
在一种可能的实现方式中,终端可以通过Faster RCNN(Faster Regions withCNN features,快速区域卷积神经网络)、SSD(Single Shot multibox Detector,单次多框检测器)等方法对图像进行目标检测。本公开实施例中还可以通过其他方法对图像进行目标检测,对此本公开不做限制。
在步骤S132中,针对各图像中确定的每个对象,根据该对象的位置信息,提取该对象的特征向量。
终端可以根据对象的位置信息,从对象所在图像中提取该对象对应的局部图像。终端可以通过CNN(Convolutional Neural Network,卷积神经网络)对局部图像进行特征提取,得到对象的特征向量。
针对图像集合中的每个图像,终端可以对该图像进行CNN(Convolutional NeuralNetwork,卷积神经网络)卷积运算,得到该图像的特征图Fc。针对该图像中确定的每个对象,将该对象的外接框r映射到特征图Fc中,得到外接框r在Fc中对应的特征区域rc=(xc,yc,wc,hc)=(sc*x,sc*y,sc*w,sc*h),其中,sc为该图像尺寸到特征图尺寸的缩放系数。终端可以对每各对象的外接框r所对应的特征区域rc进行池化操作,将其映射为固定长度的特征向量fc
在步骤S133中,针对各图像中与所述编辑操作的对象属于同一类别的对象,确定各对象的特征向量与所述编辑操作的对象的特征向量之间的相似度。
属于同一类别的对象可能是相同的对象,也可能是不同的对象。例如,多个人脸,可能是同一个人的人脸,也可能是不同人的人脸。终端可以根据同一类别的两个对象的特征向量之间的相似度,确定这两个对象是不是相同的对象。
在一种可能的实现方式中,终端可以将两个特征向量的夹角余弦值作为他们之间的相似度。余弦值的范围在-1到1之间,值越接近于1表示两个特征向量的夹角越小,两个特征向量的方向就越接近,相似度也就越高。
在步骤S134中,将各图像中与所述编辑操作的对象属于同一类别的对象中,所述相似度大于特征阈值的对象确定为与所述编辑操作的对象相同的对象。
当两个特征向量的相似度大于特征阈值时,表示这两个特征向量对应的对象是相同的对象。因此,当一个对象的特征向量与所述编辑操作的对象的特征向量之间的相似度大于特征阈值时,终端可以确定该对象为与所述编辑操作的对象相同的对象。其中,特征阈值可以根据需要进行设置,例如将余弦值作为相似度时,特征阈值可以设置为0.8、0.7等,对此本公开不做限制。
在本公开实施例中,终端可以根据特征向量之间的相似度,确定出与编辑操作的对象相同的对象,进而实现对象的批量编辑。
图3是根据本公开一实施例示出的一种图像处理方法的流程图。参照图3,步骤S12在检测到针对所述图像集合中任意一个图像的编辑操作时,获取所述编辑操作的对象和类型可以包括步骤S121至步骤S123。
在步骤S121中,在检测到针对所述图像集合中任意一个图像的编辑操作时,获取所述编辑操作的位置信息和类型。
在步骤S122中,针对所述编辑操作对应的图像中的每个对象,根据所述编辑操作的位置信息和该对象的位置信息,确定所述编辑操作与该对象的重合度。
在步骤S123中,针对所述编辑操作对应的图像中的每个对象,若所述编辑操作与该对象的重合度大于重合阈值,则确定该对象为所述编辑操作的对象。
编辑操作的位置信息可以表示编辑操作对应于图像中的位置,终端可以根据编辑操作的位置信息,确定编辑区域,例如根据滑动操作的轨迹确定编辑区域等。在一种可能的实现方式中,编辑区域可以为矩形区域。参照步骤S131,终端可以根据对象的位置信息确定对象的外接框r,该外接框对应于一个矩形区域,该外接框对应的区域就是该对象所在区域。
终端可以根据编辑区域和对象所在区域的IoU(Intersection over Union,交除并)值,确定编辑区域和对象所在区域的重合度,也就是编辑操作和对象的重合度。两个区域的IoU值就是这两个区域的重叠面积占这两个区域并集的面积的比例。
当编辑操作和某个对象的重合度大于重合阈值时,表明编辑操作和该对象高度重合,可以认为该编辑操作是针对该对象的操作。其中,重合阈值可以根据需要进行设置,例如重合阈值可以设置为0.6、0.7等,对此本公开不做限制。
这样,通过根据编辑操作的位置信息和各对象的位置信息可以确定编辑操作的对象,从而能够确定与该对象相同的对象,进行批量编辑。
图4是根据本公开一实施例示出的一种图像处理方法的流程图。参照图4,步骤S14对与所述编辑操作的对象相同的对象进行所述类型的编辑可以包括步骤S141和步骤S142。
在步骤S141中,针对每个与所述编辑操作的对象相同的对象,根据该对象的位置信息确定该对象所在的区域。
在步骤S142中,对与所述编辑操作的对象相同的各个对象所在的区域,分别进行所述类型的编辑。
终端在对对象进行所述编辑操作对应的编辑时,需要确定编辑的区域。在本公开实施例中,终端可以根据对象的位置信息,确定对象所在的区域,因此终端可以通过对对象的位置信息对应的区域进行所述类型的编辑,实现对对象的编辑。
图5是根据本公开一实施例示出的一种图像处理方法的流程图。参照图5,该图像处理方法还可以包括步骤S15。
在步骤S15中,在所述编辑操作的对象所在图像中,对所述编辑操作的对象的位置信息对应的区域进行所述类型的编辑。
终端确定编辑操作的对象后,可以实现对该对象所在区域的自动编辑。这样,用户可以在该对象的较少操作的情况下,实现对该对象的编辑,减少了单个对象编辑时的用户交互次数,提高编辑效率。例如,用户对一个人脸进行马赛克操作时,可以在人脸上滑动几次(滑动操作未覆盖人脸的全部),终端就可以对该人脸所在的全部区域进行马赛克。
图6是根据本公开一实施例示出的一种图像处理装置的框图。该装置可以用于终端。参照图6,该图像处理装置60包括集合获取模块61、第一对象获取模块62、第二对象获取模块63和第一对象编辑模块64。
该集合获取模块61被配置为获取图像集合,所述图像集合包括多个图像;
该第一对象获取模块62被配置为在检测到针对所述图像集合中任意一个图像的编辑操作时,获取所述编辑操作的对象和类型;
该第二对象获取模块63被配置为获取所述图像集合的各图像中与所述编辑操作的对象相同的对象;
该第一对象编辑模块64被配置为对与所述编辑操作的对象相同的对象进行所述类型的编辑。
图7是根据本公开一实施例示出的一种图像处理装置的框图。参照图7,在一种可能的实现方式中,所述第二对象获取模块63包括目标检测子模块631、特征提取子模块632、相似度确定子模块633和第一对象确定子模块634。
该目标检测子模块631被配置为针对所述图像集合中的每个图像,对该图像进行目标检测,确定该图像中各对象的位置信息和类别;
该特征提取子模块632被配置为针对各图像中确定的每个对象,根据该对象的位置信息,提取该对象的特征向量;
该相似度确定子模块633被配置为针对各图像中与所述编辑操作的对象属于同一类别的对象,确定各对象的特征向量与所述编辑操作的对象的特征向量之间的相似度;
该对象第一确定子模块634被配置为将各图像中与所述编辑操作的对象属于同一类别的对象中,所述相似度大于特征阈值的对象确定为与所述编辑操作的对象相同的对象。
在一种可能的实现方式中,所述第一对象获取模块62包括位置获取子模块621、重合度确定子模块622和第二对象确定子模块623。
该位置获取子模块621被配置为获取所述编辑操作的位置信息;
该重合度确定子模块622被配置为针对所述编辑操作对应的图像中的每个对象,根据所述编辑操作的位置信息和该对象的位置信息,确定所述编辑操作与该对象的重合度;
该第二对象确定子模块623被配置为针对所述编辑操作对应的图像中的每个对象,当所述编辑操作与该对象的重合度大于重合阈值时,确定该对象为所述编辑操作的对象。
在一种可能的实现方式中,所述第一对象编辑模块64包括区域确定子模块641和区域编辑子模块642。
该区域确定子模块641被配置为针对每个与所述编辑操作的对象相同的对象,根据该对象的位置信息确定该对象所在的区域。
该区域编辑子模块642被配置为对与所述编辑操作的对象相同的各个对象所在的区域,分别进行所述类型的编辑。
在一种可能的实现方式中,所述装置60还包括第二对象编辑模块65。
该第二对象编辑模块65被配置为在所述编辑操作的对象所在图像中,对所述编辑操作的对象的位置信息对应的区域进行所述类型的编辑。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
在本公开中,在检测到针对图像集合中任意一个图像的编辑操作时,可以根据编辑操作的对象和类型,对图像集合的各图像中相同的对象进行相同类型的编辑,通过某个图像上的编辑操作可以实现对多个图像中对象的批量编辑,减少了用户交互次数,提高了编辑效率。
图8是根据一示例性实施例示出的一种用于图像处理的装置800的框图。例如,装置800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图8,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在装置800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图像,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当装置800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到装置800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (8)

1.一种图像处理方法,其特征在于,所述方法包括:
获取图像集合,所述图像集合包括多个图像;
在检测到针对所述图像集合中任意一个图像的编辑操作时,获取所述编辑操作的对象和类型;
针对所述图像集合中的每个图像,对该图像进行目标检测,确定该图像中各对象的位置信息和类别;
针对各图像中确定的每个对象,根据该对象的位置信息,提取该对象的特征向量;
针对各图像中与所述编辑操作的对象属于同一类别的对象,确定各对象的特征向量与所述编辑操作的对象的特征向量之间的相似度;
将各图像中与所述编辑操作的对象属于同一类别的对象中,所述相似度大于特征阈值的对象确定为与所述编辑操作的对象相同的对象;
对与所述编辑操作的对象相同的对象进行所述类型的编辑;
在所述编辑操作的对象所在图像中,对所述编辑操作的对象的位置信息对应的区域进行所述类型的编辑。
2.根据权利要求1所述的方法,其特征在于,所述获取所述编辑操作的对象包括:
获取所述编辑操作的位置信息;
针对所述编辑操作对应的图像中的每个对象:
根据所述编辑操作的位置信息和该对象的位置信息,确定所述编辑操作与该对象的重合度;
若所述编辑操作与该对象的重合度大于重合阈值,则确定该对象为所述编辑操作的对象。
3.根据权利要求1所述的方法,其特征在于,所述对与所述编辑操作的对象相同的对象进行所述类型的编辑包括:
针对每个与所述编辑操作的对象相同的对象,根据该对象的位置信息确定该对象所在的区域;
对与所述编辑操作的对象相同的各个对象所在的区域,分别进行所述类型的编辑。
4.一种图像处理装置,其特征在于,所述装置包括:
集合获取模块,用于获取图像集合,所述图像集合包括多个图像;
第一对象获取模块,用于在检测到针对所述图像集合中任意一个图像的编辑操作时,获取所述编辑操作的对象和类型;
第二对象获取模块,用于获取所述图像集合的各图像中与所述编辑操作的对象相同的对象,所述第二对象获取模块包括目标检测子模块、特征提取子模块、相似度确定子模块以及第一对象确定子模块;
所述目标检测子模块,用于针对所述图像集合中的每个图像,对该图像进行目标检测,确定该图像中各对象的位置信息和类别;
所述特征提取子模块,用于针对各图像中确定的每个对象,根据该对象的位置信息,提取该对象的特征向量;
所述相似度确定子模块,用于针对各图像中与所述编辑操作的对象属于同一类别的对象,确定各对象的特征向量与所述编辑操作的对象的特征向量之间的相似度;
所述第一对象确定子模块,用于将各图像中与所述编辑操作的对象属于同一类别的对象中,所述相似度大于特征阈值的对象确定为与所述编辑操作的对象相同的对象;
第一对象编辑模块,用于对与所述编辑操作的对象相同的对象进行所述类型的编辑;
第二对象编辑模块,用于在所述编辑操作的对象所在图像中,对所述编辑操作的对象的位置信息对应的区域进行所述类型的编辑。
5.根据权利要求4所述的装置,其特征在于,所述第一对象获取模块包括:
位置获取子模块,用于获取所述编辑操作的位置信息;
重合度确定子模块,用于针对所述编辑操作对应的图像中的每个对象,根据所述编辑操作的位置信息和该对象的位置信息,确定所述编辑操作与该对象的重合度;
第二对象确定子模块,用于针对所述编辑操作对应的图像中的每个对象,当所述编辑操作与该对象的重合度大于重合阈值时,确定该对象为所述编辑操作的对象。
6.根据权利要求4所述的装置,其特征在于,所述第一对象编辑模块包括:
区域确定子模块,用于针对每个与所述编辑操作的对象相同的对象,根据该对象的位置信息确定该对象所在的区域;
区域编辑子模块,用于对与所述编辑操作的对象相同的各个对象所在的区域,分别进行所述类型的编辑。
7.一种图像处理装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行如权利要求1至3任一项所述的方法。
8.一种非临时性计算机可读存储介质,其特征在于,当所述存储介质中的指令由处理器执行时,使得处理器能够执行如权利要求1-3任一项所述的方法。
CN201810620868.XA 2018-06-15 2018-06-15 图像处理方法及装置 Active CN109034150B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810620868.XA CN109034150B (zh) 2018-06-15 2018-06-15 图像处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810620868.XA CN109034150B (zh) 2018-06-15 2018-06-15 图像处理方法及装置

Publications (2)

Publication Number Publication Date
CN109034150A CN109034150A (zh) 2018-12-18
CN109034150B true CN109034150B (zh) 2021-09-21

Family

ID=64609851

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810620868.XA Active CN109034150B (zh) 2018-06-15 2018-06-15 图像处理方法及装置

Country Status (1)

Country Link
CN (1) CN109034150B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110288679A (zh) * 2019-06-30 2019-09-27 于峰 图像的处理方法、装置及系统
CN110489533A (zh) * 2019-07-09 2019-11-22 深圳追一科技有限公司 人机对话方法及相关设备
CN111325656B (zh) * 2020-03-02 2023-08-15 Oppo广东移动通信有限公司 图像处理方法、图像处理装置及终端设备
CN115908642A (zh) * 2021-09-30 2023-04-04 北京字跳网络技术有限公司 一种图像编辑方法及装置
CN114661214A (zh) * 2022-02-18 2022-06-24 北京达佳互联信息技术有限公司 图像显示方法、装置及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886549A (zh) * 2012-12-21 2014-06-25 北京齐尔布莱特科技有限公司 自动对图片中的车牌进行马赛克处理的方法及装置
CN104378542A (zh) * 2013-08-14 2015-02-25 腾讯科技(深圳)有限公司 一种媒体内容的处理方法及装置、终端设备
CN104794131A (zh) * 2014-01-21 2015-07-22 腾讯科技(深圳)有限公司 一种文件的批量编辑方法及装置
CN105677325A (zh) * 2015-12-29 2016-06-15 努比亚技术有限公司 一种移动终端及图片处理方法
CN106485166A (zh) * 2016-10-20 2017-03-08 广州三星通信技术研究有限公司 用于电子终端的截屏方法和设备
CN107330859A (zh) * 2017-06-30 2017-11-07 广东欧珀移动通信有限公司 一种图像处理方法、装置、存储介质及终端
CN108132749A (zh) * 2017-12-21 2018-06-08 维沃移动通信有限公司 一种图像编辑方法及移动终端
CN108154099A (zh) * 2017-12-20 2018-06-12 北京奇艺世纪科技有限公司 一种人物识别方法、装置及电子设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5634111B2 (ja) * 2010-04-28 2014-12-03 キヤノン株式会社 映像編集装置、映像編集方法及びプログラム
US9693108B2 (en) * 2012-06-12 2017-06-27 Electronics And Telecommunications Research Institute Method and system for displaying user selectable picture

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886549A (zh) * 2012-12-21 2014-06-25 北京齐尔布莱特科技有限公司 自动对图片中的车牌进行马赛克处理的方法及装置
CN104378542A (zh) * 2013-08-14 2015-02-25 腾讯科技(深圳)有限公司 一种媒体内容的处理方法及装置、终端设备
CN104794131A (zh) * 2014-01-21 2015-07-22 腾讯科技(深圳)有限公司 一种文件的批量编辑方法及装置
CN105677325A (zh) * 2015-12-29 2016-06-15 努比亚技术有限公司 一种移动终端及图片处理方法
CN106485166A (zh) * 2016-10-20 2017-03-08 广州三星通信技术研究有限公司 用于电子终端的截屏方法和设备
CN107330859A (zh) * 2017-06-30 2017-11-07 广东欧珀移动通信有限公司 一种图像处理方法、装置、存储介质及终端
CN108154099A (zh) * 2017-12-20 2018-06-12 北京奇艺世纪科技有限公司 一种人物识别方法、装置及电子设备
CN108132749A (zh) * 2017-12-21 2018-06-08 维沃移动通信有限公司 一种图像编辑方法及移动终端

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Object detection from images using convolutional neural networks;Olavi Stenroos;《Aalto University School of Science,Master"s Programme in Computer》;20170628;第1-75页 *
图像编辑的动作脚本及批处理应用;黄春华等;《上海应用技术学院学报(自然科学版)》;20120930;第12卷(第3期);第220-223、239页 *

Also Published As

Publication number Publication date
CN109034150A (zh) 2018-12-18

Similar Documents

Publication Publication Date Title
CN106651955B (zh) 图片中目标物的定位方法及装置
CN109034150B (zh) 图像处理方法及装置
CN106557768B (zh) 对图片中的文字进行识别的方法及装置
TWI702544B (zh) 圖像處理方法、電子設備和電腦可讀儲存介質
US10452890B2 (en) Fingerprint template input method, device and medium
RU2577188C1 (ru) Способ, аппарат и устройство для сегментации изображения
WO2021031609A1 (zh) 活体检测方法及装置、电子设备和存储介质
CN108010060B (zh) 目标检测方法及装置
CN107944447B (zh) 图像分类方法及装置
US20170154206A1 (en) Image processing method and apparatus
US20170032219A1 (en) Methods and devices for picture processing
CN107563994B (zh) 图像的显著性检测方法及装置
WO2017031901A1 (zh) 人脸识别方法、装置及终端
RU2664003C2 (ru) Способ и устройство для определения ассоциированного пользователя
CN107944367B (zh) 人脸关键点检测方法及装置
CN106557759B (zh) 一种标志牌信息获取方法及装置
CN105631803B (zh) 滤镜处理的方法和装置
CN106485567B (zh) 物品推荐方法及装置
CN107025441B (zh) 肤色检测方法及装置
CN111652107B (zh) 对象计数方法及装置、电子设备和存储介质
US20220222831A1 (en) Method for processing images and electronic device therefor
CN108009563B (zh) 图像处理方法、装置及终端
CN112927122A (zh) 水印去除方法、装置及存储介质
CN111523346A (zh) 图像识别方法及装置、电子设备和存储介质
CN112200040A (zh) 遮挡图像检测方法、装置及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant