CN104504712A

CN104504712A - 图片处理方法和装置

Info

Publication number: CN104504712A
Application number: CN201410842993.7A
Authority: CN
Inventors: 李旭斌; 陈世佳; 文石磊; 秦首科; 张泽明; 韩友; 江焱; 陈志扬
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Baidu Online Network Technology Beijing Co Ltd; Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2014-12-30
Filing date: 2014-12-30
Publication date: 2015-04-08
Anticipated expiration: 2034-12-30
Also published as: CN104504712B

Abstract

本发明提出一种图片处理方法和装置，该图片处理方法包括获取待处理的图片；识别所述图片是否是拼接图；如果所述图片是拼接图，根据预设的拼接图分割算法，对所述图片进行分割，得到组成所述图片的子图片。该图片处理方法能够识别出拼接图，并按照拼接图的处理方式处理拼接图，从而实现根据图片类别的不同选择对应的处理方式，提高处理效果。

Description

图片处理方法和装置

技术领域

本发明涉及图像处理技术领域，尤其涉及一种图片处理方法和装置。

背景技术

随着互联网技术的不断普及，互联网多媒体的呈现形式也由最初的文字，发展到今天的图片和视频等等。在数量庞大的互联网图片中，拼接图广泛存在，比如：用户上传的旅游图片，广告媒体图片，新闻素材等。

现有技术中，在图片处理时大多数情况下都是按照普通图片的处理方式，并不区分图片是否是拼接图，但是，由于拼接图与普通图片是不同的，这种处理方式得到的处理效果较差。

发明内容

本发明旨在至少在一定程度上解决相关技术中的技术问题之一。

为此，本发明的一个目的在于提出一种图片处理方法，该方法可以识别出拼接图，并按照拼接图的处理方式处理拼接图，从而实现根据图片类别的不同选择对应的处理方式，提高处理效果。

本发明的另一个目的在于提出一种图片处理装置。

为达到上述目的，本发明第一方面实施例提出的图片处理方法，包括：获取待处理的图片；识别所述图片是否是拼接图；如果所述图片是拼接图，根据预设的拼接图分割算法，对所述图片进行分割，得到组成所述图片的子图片。

本发明第一方面实施例提出的图片处理方法，通过识别待处理的图片是否是拼接图，并在是拼接图时，根据拼接图分割算法，对图片进行分割，可以识别出拼接图，并按照拼接图的处理方式处理拼接图，从而实现根据图片类别的不同选择对应的处理方式，提高处理效果。

为达到上述目的，本发明第二方面实施例提出的图片处理装置，包括：获取模块，用于获取待处理的图片；识别模块，用于识别所述图片是否是拼接图；分割模块，用于如果所述图片是拼接图，根据预设的拼接图分割算法，对所述图片进行分割，得到组成所述图片的子图片。

本发明第二方面实施例提出的图片处理装置，通过识别待处理的图片是否是拼接图，并在是拼接图时，根据拼接图分割算法，对图片进行分割，可以识别出拼接图，并按照拼接图的处理方式处理拼接图，从而实现根据图片类别的不同选择对应的处理方式，提高处理效果。

本发明附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1是本发明一实施例提出的图片处理方法的流程示意图；

图2是本发明另一实施例提出的图片处理方法的流程示意图；

图3是本发明实施例中对待处理的图片进行多边形识别的流程示意图；

图4是本发明实施例中对图片组中每一张图片进行多边形识别的流程示意图；

图5是本发明实施例中一种拼接图的分割结果的示意图；

图6是本发明另一实施例提出的图片处理装置的结构示意图；

图7是本发明另一实施例提出的图片处理装置的结构示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。相反，本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。

图1是本发明一实施例提出的图片处理方法的流程示意图，该方法包括：

S11：获取待处理的图片。

待处理的图片是要进行分割处理的图片，该图片可以是从互联网上获取的。

该待处理的图片可以是普通图片，或者，也可以是拼接图。

S12：识别所述图片是否是拼接图。

其中，拼接图可以包括：左右相似拼接图，或者，多边形拼接图。

左右相似拼接图是指拼接图存在左子图和右子图，并且两个子图内容相似。一般来讲，这类拼接图的左子图和右子图存在密切联系，比如对比照片，或者，右子图是左子图的细化等。

可以理解的是，本发明实施例中，相似可以根据预设算法确定，例如，分别提取左子图的特征信息与右子图的特征信息，再根据预设算法计算这两个特征信息之间的相似度数值，根据计算得到的相似度数值确定两个子图是否相似。而具体的提取的特征信息以及具体的计算相似度数值的算法可以在通常采用的算法中根据需要选取。

多边形拼接图是指子图的外形是多边形。

其中，左右相似拼接图和多边形拼接图可以采用不同的识别方法进行识别，以及子图分割，具体可以参见后续实施例。

S13：如果所述图片是拼接图，根据预设的拼接图分割算法，对所述图片进行分割，得到组成所述图片的子图片。

另一实施例中，参见图2，图片处理方法可以包括：

S21：获取待处理的图片。

S22：识别所述图片是否是左右相似拼接图，若是，执行S23，否则，执行S24。

其中，可以提取所述图片的内容信息，当所述内容信息满足预设的左右对称要求时，确定所述图片是左右相似拼接图。

提取图片的内容信息可以包括：提取图片中的人脸信息，文字信息，姿态信息，前景和背景信息，主体信息等，具体的提取方法可以采用人脸识别或者文字识别等技术。

在判断内容信息是否满足左右对称要求时，可以将提取的内容信息区分为左子图的内容信息和右子图的内容信息，根据预设算法计算这两个内容信息的相似度数值，将相似度数值大于预设阈值时，确定内容信息满足左右对称要求。

或者，由于左右相似拼接图通常中间存在分割线，因此，在提取到内容信息后，可以先判断图片中间位置的内容信息是否是线条，在是线条时才进行后续处理，从而过滤到一部分图片，降低工作量，由于中间位置的内容信息是线条时也不一定是左右相似拼接图，例如，提取出的中间位置的线条可能是旗杆，因此，后续处理还包括继续判断线条左右两侧的内容是否满足预设要求。判断线条左右两侧的内容是否满足预设要求时可以采用如下两种方式：

第一种方式，将左右两侧的内容分别拆分为多个小块(patch)，分别比较左右两侧对应位置上的patch，比较时，可以获取两个patch的直方图，计算这两个直方图的距离，例如巴氏距离，得到左右对应位置上两个patch的直方图距离，对其他左右对应位置上的patch进行处理，得到所有的patch之间的直方图距离，在得到所有的直方图距离后，可以计算所有的直方图距离对应的方差，当该方差小于预设值时，则左右两侧的内容满足预设要求，该图片是左右对称拼接图。

第二种方式，在左右两侧分别提取尺度不变特征变换匹配(Scale Invariant Feature Transform，SIFT)关键点，计算左右匹配上的SIFT对，如果SIFT对的左右关键点相对位置一致，则左右两侧的内容满足预设要求，该图片是左右对称拼接图。

可以理解的是，本发明实施例中，匹配或者一致的含义不限于完全相同，是指在一定误差范围内的相同。

S23：按照左右相似拼接图的分割算法进行拼接图的分割。

如果所述图片是左右相似拼接图，将所述图片分割为左右对称的两个子图片，并将分割后的得到的所述两个子图片确定为组成所述图片的子图片。

例如，左右两侧是两个相似人脸时，则将每个人脸对应的部分确定为一个子图片。

S24：识别所述图片是否是多边形拼接图，若是，执行S25，否则，执行S26。

参见图3，多边形拼接图的识别流程可以包括：

S31：对所述图片进行缩放处理，得到一组图片组。

缩放处理具体可以是金字塔缩放处理。

得到的图片组中包括：原始图片，比原始图片尺寸小的图片，以及，比原始图片尺寸大的图片。

在得到图片组后，可以对所述图片组中的每张图片进行多边形识别，得到每张图片对应的识别结果，所述识别结果包括所述每张图片中包括的多边形。

当前处理的一张图片可以称为当前处理的图片。

所述对所述图片组中的每张图片进行多边形识别，得到每张图片对应的识别结果，包括：

S32：对当前处理的图片进行多边形识别，得到识别结果，所述当前处理的图片是所述图片组中的一张图片。

参见图4，所述对当前处理的图片进行多边形识别，得到识别结果，包括：

S41：对当前处理的图片进行去噪。

去噪例如通过上采样或者下采样等方式，去除图片中的噪声。

S42：对去噪后的图片进行二值化。

图片的二值化，就是将图片上的像素点的灰度值设置为0或255，也就是将整个图片呈现出明显的只有黑和白的视觉效果。

S43：在二值化后，对所述当前处理的图片进行视觉分析，确定边缘信息。

视觉分析可以采用预设的视觉分析算法得到视觉特征信息，视觉特征信息例如为：图像边缘信息，图像轮廓信息，直线检测结果，多边形检测结果，SIFT关键点信息，色彩空间直方图信息等。

在得到视觉特征信息后，可以根据视觉特征信息确定边缘信息，例如在视觉分析时可以得到的图像边缘信息，实现对边缘的定位。

S44：根据所述边缘信息生成轮廓信息。

可以根据通常采用的由边缘信息生成轮廓信息的算法，由边缘信息生成轮廓信息。在这些算法中存在多个可调参数，在具体实施时，可以根据实际需要调整这些参数，实现在保留轮廓时，保留尽量多的轮廓，这样有利于召回更多潜在的多边形。

S45：根据所述轮廓信息识别出所述当前处理的图片中包括的多边形。

可以根据轮廓信息对应的角的个数以及最大角的度数确定出多边形。

可选的，在S45之后还可以包括：

S46：加深二值化程度。之后重新执行S42及其后续步骤。

其中，加深二值化程度的次数可以预先设定。

加深二值化程度例如降低0的个数，增加255的个数等。

通过不同程度的二值化，有利于多边形边缘的识别。

S47：保存所述多边形，确定为所述识别结果。

对应当前处理的图片识别出多边形后，可以将该识别出的多边形确定为该当前处理的图片对应的识别结果，之后可以保存该识别结果。

S33：判断所述识别结果中是否包括不满足预设的停止条件的多边形，若是，执行S34，否则，执行S35。

预设的停止条件可以是识别出的多边形的面积在当前处理的图片中的占比率大于预设值，例如，可以将较大的多边形确定为满足停止条件的多边形，而将较小的多边形确定为不满足停止条件的多边形。

S34：擦除所述不满足所述停止条件的多边形，之后，可以重复执行S32及其后续步骤。

擦除多边形例如将多边形的边界用白色替代等。

S35：将满足所述停止条件的识别结果确定为所述每张图片对应的识别结果。

通过S32-S35可以得到图片组中每张图片对应的识别结果，之后，可以执行：

S36：根据所述每张图片对应的识别结果，获取所述图片组对应的识别结果。

例如，将每张图片对应的识别结果组成的集合确定为图片组对应的识别结果。

S37：对所述图片组对应的识别结果进行过滤，并在过滤后的识别结果中包括第一多边形时，确定所述图片是多边形拼接图，所述第一多边形是指占比率大于预设阈值的多边形，所述占比率是指多边形的面积与所述图片的面积之间的比值。

其中，第一多边形可以是一个或者至少两个。

在S32-S35的多边形识别阶段，可以检测出了大量的多边形。但是，有些多边形存在误检，比如一张图上面部分是蓝天，下面部分是大海，中间有条海平线，很容易被误分为拼接图。为了提高识别准确度，可以通过过滤消除识别出的错误的多边形。

过滤可以包括：修正分割边界，和/或，消除多余多边形。

其中，可以根据图片的内容信息和视觉特征信息修正分割边界，例如，当检测到的多边形的边界落到人脸内容或者文字区域中时，可以认为该多边形是误检的，可以用人脸边界或者文字区域边界来修正。

当检测到的大的多边形中包含小的多边形时，该小的多边形可以认为是误检的，可以使用非极大值抑制法(Non-Maximum Suppression，NMS)消除小的误检多边形。

S25：按照多边形拼接图的分割算法进行拼接图的分割。

如果所述图片是多边形拼接图，将所述过滤后的识别结果中包括的多边形对应的部分，确定为所述图片的子图片。

例如，参见图5，假设经过多边形识别和过滤，得到两个多边形51，且每个多边形的占比率大于预设阈值，则每个多边形对应的部分为一个子图片，将图片划分为如图5所示的两个子图片。

S26：按照普通图片进行处理。

例如，进行通常采用的一般图片的处理方式。

本实施例中，通过识别待处理的图片是否是拼接图，并在是拼接图时，根据拼接图分割算法，对图片进行分割，可以识别出拼接图，并按照拼接图的处理方式处理拼接图，从而实现根据图片类别的不同选择对应的处理方式，提高处理效果。进而，通过拼接图的识别和子图提取，可以更准确提取图片信息，帮助图片分类效果，提高裁剪图片时的准确率等，对于图片处理相关产品线起到有力作用。

图6是本发明另一实施例提出的图片处理装置的结构示意图，该装置60包括获取模块61，识别模块62和分割模块63。

获取模块61用于获取待处理的图片；

该待处理的图片可以是普通图片，或者，也可以是拼接图。

识别模块62于识别所述图片是否是拼接图；

分割模块63用于如果所述图片是拼接图，根据预设的拼接图分割算法，对所述图片进行分割，得到组成所述图片的子图片。

多边形拼接图是指子图的外形是多边形。

其中，左右相似拼接图和多边形拼接图可以采用不同的识别方法进行识别，以及子图分割。

可选的，当所述拼接图是左右相似拼接图时，所述识别模块72具体用于：

提取所述图片的内容信息；

当所述内容信息满足预设的左右对称要求时，确定所述图片是左右相似拼接图。

相应的，所述分割模块63具体用于：

可选的，参见图7，当所述拼接图是多边形拼接图时，所述识别模块62包括：

第一单元621，用于对所述图片进行缩放处理，得到一组图片组；

缩放处理具体可以是金字塔缩放处理。

当前处理的一张图片可以称为当前处理的图片。

第二单元622，用于对所述图片组中的每张图片进行多边形识别，得到每张图片对应的识别结果，所述识别结果包括所述每张图片中包括的多边形；

可选的，所述第二单元622具体用于：

对当前处理的图片进行多边形识别，得到识别结果，所述当前处理的图片是所述图片组中的一张图片；

如果所述识别结果中包括不满足预设的停止条件的多边形，则擦除所述不满足所述停止条件的多边形，并重新进行多边形识别，直至得到的识别结果都满足所述停止条件；

将满足所述停止条件的识别结果确定为所述每张图片对应的识别结果。

可选的，所述第二单元622进一步具体用于：

对所述当前处理的图片进行去噪和二值化；

根据所述去噪和二值化结果，对所述当前处理的图片进行视觉分析，确定边缘信息；

根据所述边缘信息生成轮廓信息；

根据所述轮廓信息识别出所述当前处理的图片中包括的多边形；

保存所述多边形，确定为所述识别结果。

第三单元623，用于根据所述每张图片对应的识别结果，获取所述图片组对应的识别结果；

第四单元624，用于对所述图片组对应的识别结果进行过滤，并在过滤后的识别结果中包括第一多边形时，确定所述图片是多边形拼接图，所述第一多边形是指占比率大于预设阈值的多边形，所述占比率是指多边形的面积与所述图片的面积之间的比值。

其中，第一多边形可以是一个或者至少两个。

具体的，对所述图片组中的每张图片进行多边形识别，得到每张图片对应的识别结果可以具体参见上述方法实施例中的描述，在此不再赘述。

相应的，所述分割模块63具体用于：

如果所述图片是多边形拼接图，将所述过滤后的识别结果中包括的第一多边形对应的部分，确定为所述图片的子图片。

需要说明的是，在本发明的描述中，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。此外，在本发明的描述中，除非另有说明，“多个”的含义是两个或两个以上。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本发明各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种图片处理方法，其特征在于，包括：

获取待处理的图片；

识别所述图片是否是拼接图；

如果所述图片是拼接图，根据预设的拼接图分割算法，对所述图片进行分割，得到组成所述图片的子图片。

2.根据权利要求1所述的方法，其特征在于，当所述拼接图是左右相似拼接图时，所述识别所述图片是否是拼接图，包括：

提取所述图片的内容信息；

3.根据权利要求2所述的方法，其特征在于，所述如果所述图片是拼接图，根据预设的拼接图分割算法，对所述图片进行分割，得到组成所述图片的子图片，包括：

4.根据权利要求1所述的方法，其特征在于，当所述拼接图是多边形拼接图时，所述识别所述图片是否是拼接图，包括：

对所述图片进行缩放处理，得到一组图片组；

对所述图片组中的每张图片进行多边形识别，得到每张图片对应的识别结果，所述识别结果包括所述每张图片中包括的多边形；

根据所述每张图片对应的识别结果，获取所述图片组对应的识别结果；

对所述图片组对应的识别结果进行过滤，并在过滤后的识别结果中包括第一多边形时，确定所述图片是多边形拼接图，所述第一多边形是指占比率大于预设阈值的多边形，所述占比率是指多边形的面积与所述图片的面积之间的比值。

5.根据权利要求4所述的方法，其特征在于，所述如果所述图片是拼接图，根据预设的拼接图分割算法，对所述图片进行分割，得到组成所述图片的子图片，包括：

6.根据权利要求4所述的方法，其特征在于，所述对所述图片组中的每张图片进行多边形识别，得到每张图片对应的识别结果，包括：

7.根据权利要求6所述的方法，其特征在于，所述对当前处理的图片进行多边形识别，得到识别结果，包括：

对所述当前处理的图片进行去噪和二值化；

根据所述边缘信息生成轮廓信息；

保存所述多边形，确定为所述识别结果。

8.一种图片处理装置，其特征在于，包括：

获取模块，用于获取待处理的图片；

识别模块，用于识别所述图片是否是拼接图；

分割模块，用于如果所述图片是拼接图，根据预设的拼接图分割算法，对所述图片进行分割，得到组成所述图片的子图片。

9.根据权利要求8所述的装置，其特征在于，当所述拼接图是左右相似拼接图时，所述识别模块具体用于：

提取所述图片的内容信息；

10.根据权利要求9所述的装置，其特征在于，所述分割模块具体用于：

11.根据权利要求8所述的装置，其特征在于，当所述拼接图是多边形拼接图时，所述识别模块包括：

第一单元，用于对所述图片进行缩放处理，得到一组图片组；

第二单元，用于对所述图片组中的每张图片进行多边形识别，得到每张图片对应的识别结果，所述识别结果包括所述每张图片中包括的多边形；

第三单元，用于根据所述每张图片对应的识别结果，获取所述图片组对应的识别结果；

第四单元，用于对所述图片组对应的识别结果进行过滤，并在过滤后的识别结果中包括第一多边形时，确定所述图片是多边形拼接图，所述第一多边形是指占比率大于预设阈值的多边形，所述占比率是指多边形的面积与所述图片的面积之间的比值。

12.根据权利要求11所述的装置，其特征在于，所述分割模块具体用于：

13.根据权利要求11所述的装置，其特征在于，所述第二单元具体用于：

14.根据权利要求13所述的装置，其特征在于，所述第二单元进一步具体用于：

对所述当前处理的图片进行去噪和二值化；

根据所述边缘信息生成轮廓信息；

保存所述多边形，确定为所述识别结果。