CN112381222A - 一种样本生成方法、装置、计算机设备和存储介质 - Google Patents
一种样本生成方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN112381222A CN112381222A CN202011259861.3A CN202011259861A CN112381222A CN 112381222 A CN112381222 A CN 112381222A CN 202011259861 A CN202011259861 A CN 202011259861A CN 112381222 A CN112381222 A CN 112381222A
- Authority
- CN
- China
- Prior art keywords
- image
- generating
- sample
- foreground
- annotation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000012545 processing Methods 0.000 claims description 48
- 230000009466 transformation Effects 0.000 claims description 30
- 238000004590 computer program Methods 0.000 claims description 11
- 230000009467 reduction Effects 0.000 claims description 11
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 5
- 238000005286 illumination Methods 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000012549 training Methods 0.000 abstract description 9
- 230000008569 process Effects 0.000 description 11
- 238000002372 labelling Methods 0.000 description 10
- 238000013528 artificial neural network Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/04—Context-preserving transformations, e.g. by using an importance map
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/60—Rotation of whole images or parts thereof
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Image Processing (AREA)
Abstract
本公开提供了一种样本生成的方法、装置、计算机设备和存储介质,其中,该方法包括:获取包括目标对象的第一图像、以及原始背景图像;其中,所述第一图像中除所述目标对象所在第一区域外的第二区域的颜色,满足预设的颜色条件;基于所述第一图像生成包括所述目标对象的前景图像、以及与所述第一图像对应的第一标注图像;基于所述原始背景图像和所述前景图像,生成第二图像;基于所述第一标注图像、以及所述第二图像,生成样本。本公开实施例降低了生成标注图像的成本,提高了训练样本的精度。
Description
技术领域
本公开涉及机器学习技术领域,具体而言,涉及一种样本生成方法、装置、计算机设备和存储介质。
背景技术
在对神经网络进行有监督学习或者半监督学习的时候,需要具有标注信息的样本图像。且样本图像的标注信息越精确,神经网络的性能也越好。
样本图像的标注信息可以由人工标注或者使用标注工具标注,人工标注的人力成本和时间成本较大,且标注精度会受到标注人员的主观差异性影响,不够精准;使用标注工具标注图像的时间成本也很高,且标注的信息也不够准确精细,这造成了采用人工标注或者还是用标注工具标注生成的样本对神经网络训练时,神经网络的精度受到影响。
发明内容
本公开实施例至少提供一种样本生成方法、装置、计算机设备和存储介质。
第一方面,本公开实施例提供了一种样本生成方法,包括:获取包括目标对象的第一图像、以及原始背景图像;其中,所述第一图像中除所述目标对象所在第一区域外的第二区域的颜色,满足预设的颜色条件;基于所述第一图像生成包括所述目标对象的前景图像、以及与所述第一图像对应的第一标注图像;基于所述原始背景图像和所述前景图像,生成第二图像;基于所述第一标注图像、以及所述第二图像,生成样本。
在一种可能的实施方式中,所述颜色条件,包括:位于所述第二区域的像素点的像素值属于预设的像素值区间。
在一种可能的实施方式中,基于所述第一图像生成包括所述目标对象的前景图像,包括:基于所述颜色条件,从所述第一图像中确定属于所述目标对象的第一像素点;基于所述第一像素点在所述第一图像中的位置、以及所述第一像素点的像素值,生成所述前景图像。
在一种可能的实施方式中,基于所述第一图像生成与所述第一图像对应的第一标注图像,包括:基于所述颜色条件,从所述第一图像中确定属于所述第二区域的第二像素点;基于所述第二像素点在所述第一图像中的位置,生成所述第一标注图像。
在一种可能的实施方式中,所述基于所述第一像素点在所述第一图像中的位置,生成所述第一标注图像,包括:基于所述第二像素点在所述第一图像中的位置,确定所述第一区域和所述第二区域的边界像素点;基于所述边界像素点在所述第一图像中的位置,将所述第一区域和所述第二区域的边界进行柔化处理;基于柔化处理的结果,生成所述第一标注图像。
在一种可能的实施方式中,基于所述原始背景图像和所述前景图像,生成第二图像,包括:基于所述原始背景图像,生成与所述前景图像适配的背景图像;基于所述背景图像以及所述前景图像,生成所述第二图像。
在一种可能的实施方式中,基于所述原始背景图像,生成与所述前景图像适配的背景图像,包括:将所述原始背景图像进行下述至少一种处理,得到与所述前景图像适配的背景图像:放大处理、缩小处理、裁剪处理、以及旋转处理。
在一种可能的实施方式中,基于所述背景图像以及所述前景图像,生成所述第二图像,包括:对所述背景图像和/或所述前景图像,进行下述至少一种参数调整处理,并基于所述参数调整处理的结果,生成所述第二图像;所述参数调整处理包括:亮度参数调整、对比度调整、颜色变换、光照参数调整、以及尺寸调整。
在一种可能的实施方式中,所述基于所述第一标注图像、以及所述第二图像,生成样本,包括:基于属于所述第一区域的像素点在所述第一图像中的位置,以及所述前景图像在所述第二图像中的位置,确定位置变换关系信息;基于所述位置变换关系信息,对所述第一标注图像进行调整,得到与所述第二图像对应的中间标注图像;基于所述中间标注图像、以及所述第二图像,生成所述样本。
在一种可能的实施方式中,所述基于所述中间标注图像、以及所述第二图像,生成所述样本,包括:对所述中间标注图像、和所述第二图像进行相同的形状变换操作,得到第二标注图像、以及变换图像;基于所述第二标注图像、以及所述变换图像,得到所述样本。
在一种可能的实施方式中,所述形状变换操作包括下述至少一种:旋转操作、缩小操作、放大操作、以及仿射变换。
第二方面,本公开实施例还提供一种样本生成装置,包括:获取模块,用于获取包括目标对象的第一图像、以及原始背景图像;其中,所述第一图像中除所述目标对象所在第一区域外的第二区域的颜色,满足预设的颜色条件;第一生成模块,用于基于所述第一图像生成包括所述目标对象的前景图像、以及与所述第一图像对应的第一标注图像;第二生成模块,用于基于所述原始背景图像和所述前景图像,生成第二图像;第三生成模块,用于基于所述第一标注图像、以及所述第二图像,生成样本。
在一种可能的实施方式中,所述颜色条件,包括:位于所述第二区域的像素点的像素值属于预设的像素值区间。
在一种可能的实施方式中,所述第一生成模块,在基于所述第一图像生成包括所述目标对象的前景图像时,具体用于基于所述颜色条件,从所述第一图像中确定属于所述目标对象的第一像素点;基于所述第一像素点在所述第一图像中的位置、以及所述第一像素点的像素值,生成所述前景图像。
在一种可能的实施方式中,所述第一生成模块,在基于所述第一图像生成与所述第一图像对应的第一标注图像时,具体用于基于所述颜色条件,从所述第一图像中确定属于所述第二区域的第二像素点;基于所述第二像素点在所述第一图像中的位置,生成所述第一标注图像。
在一种可能的实施方式中,所述第一生成模块,在基于所述第一像素点在所述第一图像中的位置,生成所述第一标注图像时,具体用于基于所述第二像素点在所述第一图像中的位置,确定所述第一区域和所述第二区域的边界像素点;基于所述边界像素点在所述第一图像中的位置,将所述第一区域和所述第二区域的边界进行柔化处理;基于柔化处理的结果,生成所述第一标注图像。
在一种可能的实施方式中,所述第二生成模块,在基于所述原始背景图像和所述前景图像,生成第二图像时,具体用于基于所述原始背景图像,生成与所述前景图像适配的背景图像;基于所述背景图像以及所述前景图像,生成所述第二图像。
在一种可能的实施方式中,所述第二生成模块,在基于所述原始背景图像,生成与所述前景图像适配的背景图像时,具体用于将所述原始背景图像进行下述至少一种处理,得到与所述前景图像适配的背景图像:放大处理、缩小处理、裁剪处理、以及旋转处理。
在一种可能的实施方式中,所述第二生成模块,在基于所述背景图像以及所述前景图像,生成所述第二图像时,具体用于对所述背景图像和/或所述前景图像,进行下述至少一种参数调整处理,并基于所述参数调整处理的结果,生成所述第二图像;所述参数调整处理包括:亮度参数调整、对比度调整、颜色变换、光照参数调整、以及尺寸调整。
在一种可能的实施方式中,所述第三生成模块,在基于所述第一标注图像、以及所述第二图像,生成样本时,具体用于基于属于所述第一区域的像素点在所述第一图像中的位置,以及所述前景图像在所述第二图像中的位置,确定位置变换关系信息;基于所述位置变换关系信息,对所述第一标注图像进行调整,得到与所述第二图像对应的中间标注图像;基于所述中间标注图像、以及所述第二图像,生成所述样本。
在一种可能的实施方式中,所述第三生成模块,在基于所述中间标注图像、以及所述第二图像,生成所述样本时,具体用于对所述中间标注图像、和所述第二图像进行相同的形状变换操作,得到第二标注图像、以及变换图像;基于所述第二标注图像、以及所述变换图像,得到所述样本。
在一种可能的实施方式中,所述形状变换操作包括下述至少一种:旋转操作、缩小操作、放大操作、以及仿射变换。
第三方面,本公开实施例还提供一种计算机设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤。
第四方面,本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤。
关于上述样本生成装置、计算机设备及存储介质的效果描述参见上述样本生成方法的说明,这里不再赘述。
本公开实施例提供的样本生成方法、装置、计算机设备及存储介质,通过控制第一图像中除目标对象外的第二区域满足预设的颜色条件,从而能够基于该颜色条件,精确的将目标对象所在的第一区域从第一图像中确定出来,同时,也能够基于该颜色条件,精确的确定第一标注图像;基于原始背景图像和前景图像生成第二图像;基于第二图像和第一标注图像生成样本。生成的样本具有更高的标注精度,且能够节省标注成本。
为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,此处的附图被并入说明书中并构成本说明书中的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本公开实施例所提供的一种样本生成方法的流程图;
图2示出了本公开实施例所提供的基于原始背景图像和前景图像,生成第二图像的方法流程图;
图3示出了本公开实施例所提供的基于第一标注图像、以及第二图像,生成样本的方法流程图;
图4示出了本公开实施例所提供的一种样本生成装置的示意图;
图5示出了本公开实施例所提供的一种计算机设备结构的示意图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
另外,本公开实施例中的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。
在本文中提及的“多个或者若干个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
经研究发现,自然图像是在现实中通过常规光谱摄像机等方式获得的能表征现实场景的图片。标注图像是自然图像信息的精简,重点保留自然图像中的物体位置、物体边界等信息。训练神经网络模型需要的每一训练样本中包括一张自然图像和该自然图像对应的标注图像。标注图像的标注信息越精确,神经网络的性能也越好。
标注图像可以由人工标注或者使用标注工具标注,人工标注的人力成本和时间成本较大,且标注精度会受到标注人员的主观差异性影响,不够精准;使用标注工具标注图像的时间成本也很高,且标注的信息也不够准确精细。但训练出一个优异的神经网络模型,需要大量精细准确的训练样本。使用人工标注或者标注工具标注获取足够的训练样本耗费的成本极高,而且还无法保证训练样本的精度。
基于上述研究,本公开提供了一种样本生成方法、装置、计算机设备及存储介质,通过控制第一图像中除目标对象外的第二区域满足预设的颜色条件,从而能够基于该颜色条件,精确的将目标对象所在的第一区域从第一图像中确定出来,同时,也能够基于该颜色条件,精确的确定第一标注图像;基于原始背景图像、目标对象所对应的前景图像、以及第一标注图像,生成的样本具有更高的标注精度,且能够节省标注成本。
针对以上方案所存在的缺陷,均是发明人在经过实践并仔细研究后得出的结果,因此,上述问题的发现过程以及下文中本公开针对上述问题所提出的解决方案,都应该是发明人在本公开过程中对本公开做出的贡献。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
为便于对本实施例进行理解,首先对本公开实施例所公开的一种样本生成方法进行详细介绍,本公开实施例所提供的样本生成方法的执行主体一般为具有一定计算能力的计算机设备,该计算机设备例如包括:终端设备或服务器或其它处理设备,终端设备可以为用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字处理(Personal Digital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中,该样本生成方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
下面以执行主体为计算机设备为例对本公开实施例提供的样本生成方法加以说明。
参见图1所示,为本公开实施例提供的样本生成方法的流程图,包括以下步骤:
S101:获取包括目标对象的第一图像、以及原始背景图像;其中,第一图像中除目标对象所在第一区域外的第二区域的颜色,满足预设的颜色条件;
S102:基于第一图像生成包括目标对象的前景图像、以及与第一图像对应的第一标注图像;
S103:基于原始背景图像和前景图像,生成第二图像;
S104:基于第一标注图像、以及第二图像,生成样本。
本公开实施例通过控制第一图像中除目标对象外的第二区域满足预设的颜色条件,从而能够基于该颜色条件,精确的将目标对象所在的第一区域从第一图像中确定出来,同时,也能够基于该颜色条件,精确的确定第一标注图像;基于原始背景图像和前景图像生成第二图像;基于第二图像和第一标注图像生成样本。生成的样本具有更高的标注精度,且能够节省标注成本。
下面对上述S101~S104加以详细说明。
针对上述S101,第一图像中包含第一区域和第二区域;其中,位于第一区域中的像素点,属于目标对象,位于第二区域中的像素点,属于目标对象的背景;该第二区域的颜色,满足预设的颜色条件。
示例性的,预设的颜色条件包括:第二区域的像素点的像素值属于预设的像素值区间。此处,预设的像素值区间至少有一个。
示例性的,预设的颜色条件可为单一颜色,如可为绿色、白色、蓝色等,只要和目标对象的颜色相差较大的单一颜色即可,对此不做任何限定。
示例性的,第一区域中的像素点的像素值和第二区域的像素点的像素值具有较大区别。这样,可以方便将目标对象所在的第一区域从第一图像中确定出来。
在一种特殊情况下,第一区域中的部分像素点的像素值也可属于预设的像素值区间;此时,可以利用边缘检测算法,从第一图像中确定目标对象和背景之间的边缘,结合该边缘,能够将属于第一区域,但像素值属于预设的像素值区间的像素点确定出来。
目标对象例如可以是人物、植物、动物、物品等实物对象。
原始背景图像为不包含目标对象的任意图像。
示例性的,第一图像例如可以是在强约束场景下采集的包含目标对象的绿幕图像,强约束场景是指通过对光线和拍摄手法以及绿幕的材料等进行约束的场景,以保证采集到的图像的第二区域的像素点的像素值落在预设的像素值区间内;在目标对象是人物的情况下,原始背景图像就可以是不包含人物的自然风景图像、美食图像、场景图像等。
针对上述S102,前景图像为只包含第一图像中的目标对象的图像;在得到第一图像后,能够基于第一图像中各个像素点的像素值、以及预设的颜色条件,将属于目标对象的像素点从第一图像中筛选出来,进而得到前景图像。
第一标注图像中各个标注像素点的像素值,表征第一图像中位置与标注像素点对应的像素点所属的类别。
示例性的,第一标注图像即可为掩码图像,对此不做赘述。
示例性的,属于目标对象的像素点的类别标注为1,属于背景的像素点的类别标注为0,则第一图像中的某个像素点属于目标对象所在的第一区域,则与该像素点位置对应的标注像素点的像素值为1;第一图像中某个像素点属于背景所在的第二区域,则与该像素点位置对应的标注像素点的像素值为0。
示例性的,第一图像的第一区域为人物,第二区域为绿色,前景图像就是第一图像中的第一区域的图像部分,即只包含人物的图像部分;第一标注图像的尺寸与第一图像的尺寸相同,且第一标注图像中的标注像素点,与第一图像中的像素点位置一一对应。
在实施过程中,可以采用但不限于下述(1)和(2)中至少一种方式基于第一图像生成前景图像和第一标注图像:
(1):基于预设的颜色条件,从第一图像中确定属于目标对象的第一像素点;基于第一像素点在第一图像中的位置、以及第一像素点的像素值,生成前景图像。
基于预设的颜色条件,从第一图像中确定属于第二区域的第二像素点;基于第二像素点在第一图像中的位置,生成第一标注图像。
在一种可能的实施方式中,可以按照以下方法生成第一标注图像:
基于第二像素点在第一图像中的位置,确定第一区域和第二区域的边界像素点;基于边界像素点在第一图像中的位置,将第一区域和第二区域的边界进行柔化处理;基于柔化处理的结果,生成第一标注图像。
(2):基于预设的颜色条件,从第一图像中确定属于第二区域的第二像素点;将第一图像中除第二像素点外的其他像素点构成的图像确定为前景图像。
本步骤提供的生成前景图像和第一标注图像的方法,因为第一图像中的第二区域的像素点的像素值都落在预设的颜色区间内,可以依照预设的颜色阈值分离第一图像中的第二区域和第一区域的像素点,生成对应的第一标注图像和前景图像,简化了得到第一标注图像的过程,且保证了第一标注图像的精度。
针对上述S103,基于原始背景图像和前景图像,生成第二图像的方法可参照图2所示的流程:
S201:基于原始背景图像,生成与前景图像适配的背景图像。
具体实施时,由于原始背景图像的尺寸,内容等在很多情况下都无法直接与前景图像结合在一起,生成第二图像,因此可以基于原始背景图像生成与前景图像适配的背景图像,然后基于与前景图像适配的背景图像以及前景图像,生成第二图像。其中,背景图像与前景图像适配例如可以是背景图像和前景图像的图像尺寸、形状等保持预设的比例。
或者,还可以将背景图像的内容与前景图像匹配。例如,原始背景图像为马路,前景图像为在马路上行驶的汽车,在基于原始背景图像生成背景图像时,可以调整马路的分辨率,使得汽车的大小能够与马路的大小适配。
在基于原始背景图像,生成与前景图像适配的背景图像,例如可以包括:将原始背景图像进行下述至少一种处理,得到与前景图像适配的背景图像:放大处理、缩小处理、裁剪处理、亮度处理、对比度处理、以及旋转处理。
示例性的,前景图像为人物图像,原始背景图像是一张没有人物的风景图,但该图像的尺寸与前景图像的尺寸比例为2:1,预设的比例为4:3,通过缩小处理或者剪裁处理,调整原始背景图像的尺寸,就可以保证得到的背景图像的尺寸与前景图像的尺寸为4:3。
S202:基于背景图像以及前景图像,生成第二图像。
在一种可能的实施方式中,可以按照下述方法基于背景图像以及前景图像,生成第二图像:
对背景图像和/或前景图像,进行下述至少一种参数调整处理,并基于参数调整处理的结果,生成第二图像;参数调整处理包括:亮度参数调整、对比度调整、颜色变换、光照参数调整、以及尺寸调整。
要保证生成的第二图像的图像信息满足预设的图像信息,需要对背景图像或者前景图像或者同时对背景图像和前景图像进行参数调整。
也就是说,可以将前景图像和背景图像进行像素拼接,得到第二图像。第二图像即可为类自然图像,为了使得类自然图像更加具备真实性,还可对得到的类自然图像进行优化处理,对此不做赘述。
针对S104,基于第一标注图像、以及第二图像,生成样本可以参照图3所示的流程:
S301:基于属于第一区域的像素点在第一图像中的位置,以及前景图像在第二图像中的位置,确定位置变换关系信息。
S302:基于位置变换关系信息,对第一标注图像进行调整,得到与第二图像对应的中间标注图像。
S303:基于中间标注图像、以及第二图像,生成样本。
在一种可能的实施方式中,可以直接使用中间标注图像和第二图像生成样本。
在另一种可能的实施方式中,为了样本的多样性,可以对中间标注图像、和第二图像进行相同的形状变换操作,得到第二标注图像、以及变换图像;基于第二标注图像、以及变换图像,得到样本。
形状变换操作例如可以包括下述至少一种:旋转操作、缩小操作、放大操作、以及仿射变换。
本实施方式是为了保证生成的样本的多样性,经过对中间标注图像、和第二图像进行相同的形状变换操作可以得到多组不同的标注图像及其对应的变换图像,基于多组不同的标注图像及其对应的变换图像可以生成多个样本。
由前述内容可知,通过本公开可将多种途径获取到的背景图像贴到目标对象所在前景图像的后面,获得一张类自然图像,从而得到多种样本。况且,在生成样本之后,还可将样本输入到神经网络中进行训练,以得到更精确更自然的样本结果,对此不做赘述。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
基于同一发明构思,本公开实施例中还提供了与样本生成方法对应的样本生成装置,由于本公开实施例中的装置解决问题的原理与本公开实施例上述样本生成方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
参照图4所示,为本公开实施例提供的一种样本生成装置的示意图,所述装置包括:获取模块401、第一生成模块402、第二生成模块403以及第三生成模块404;其中,
获取模块401,用于获取包括目标对象的第一图像、以及原始背景图像;其中,所述第一图像中除所述目标对象所在第一区域外的第二区域的颜色,满足预设的颜色条件;
第一生成模块402,用于基于所述第一图像生成包括所述目标对象的前景图像、以及与所述第一图像对应的第一标注图像;
第二生成模块403,用于基于所述原始背景图像和所述前景图像,生成第二图像;
第三生成模块404,用于基于所述第一标注图像、以及所述第二图像,生成样本。
在一种可能的实施方式中,所述颜色条件,包括:
位于所述第二区域的像素点的像素值属于预设的像素值区间。
在一种可能的实施方式中,所述第一生成模块,在基于所述第一图像生成包括所述目标对象的前景图像时,具体用于基于所述颜色条件,从所述第一图像中确定属于所述目标对象的第一像素点;基于所述第一像素点在所述第一图像中的位置、以及所述第一像素点的像素值,生成所述前景图像。
在一种可能的实施方式中,所述第一生成模块,在基于所述第一图像生成与所述第一图像对应的第一标注图像时,具体用于基于所述颜色条件,从所述第一图像中确定属于所述第二区域的第二像素点;基于所述第二像素点在所述第一图像中的位置,生成所述第一标注图像。
在一种可能的实施方式中,所述第一生成模块,在基于所述第一像素点在所述第一图像中的位置,生成所述第一标注图像时,具体用于基于所述第二像素点在所述第一图像中的位置,确定所述第一区域和所述第二区域的边界像素点;基于所述边界像素点在所述第一图像中的位置,将所述第一区域和所述第二区域的边界进行柔化处理;基于柔化处理的结果,生成所述第一标注图像。
在一种可能的实施方式中,所述第二生成模块,在基于所述原始背景图像和所述前景图像,生成第二图像时,具体用于基于所述原始背景图像,生成与所述前景图像适配的背景图像;基于所述背景图像以及所述前景图像,生成所述第二图像。
在一种可能的实施方式中,所述第二生成模块,在基于所述原始背景图像,生成与所述前景图像适配的背景图像时,具体用于将所述原始背景图像进行下述至少一种处理,得到与所述前景图像适配的背景图像:放大处理、缩小处理、裁剪处理、以及旋转处理。
在一种可能的实施方式中,所述第二生成模块,在基于所述背景图像以及所述前景图像,生成所述第二图像时,具体用于对所述背景图像和/或所述前景图像,进行下述至少一种参数调整处理,并基于所述参数调整处理的结果,生成所述第二图像;所述参数调整处理包括:亮度参数调整、对比度调整、颜色变换、光照参数调整、以及尺寸调整。
在一种可能的实施方式中,所述第三生成模块,在基于所述第一标注图像、以及所述第二图像,生成样本时,具体用于基于属于所述第一区域的像素点在所述第一图像中的位置,以及所述前景图像在所述第二图像中的位置,确定位置变换关系信息;基于所述位置变换关系信息,对所述第一标注图像进行调整,得到与所述第二图像对应的中间标注图像;基于所述中间标注图像、以及所述第二图像,生成所述样本。
在一种可能的实施方式中,所述第三生成模块,在基于所述中间标注图像、以及所述第二图像,生成所述样本时,具体用于对所述中间标注图像、和所述第二图像进行相同的形状变换操作,得到第二标注图像、以及变换图像;基于所述第二标注图像、以及所述变换图像,得到所述样本。
在一种可能的实施方式中,所述形状变换操作包括下述至少一种:旋转操作、缩小操作、放大操作、以及仿射变换。
关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明,这里不再详述。
本公开实施例还提供了一种计算机设备,如图5所示,为本公开实施例提供的计算机设备结构示意图,包括:
处理器51和存储器52;所述存储器52存储有处理器51可执行的机器可读指令,处理器51用于执行存储器52中存储的机器可读指令,所述机器可读指令被处理器51执行时,处理器51执行下述步骤:
获取包括目标对象的第一图像、以及原始背景图像;其中,第一图像中除目标对象所在第一区域外的第二区域的颜色,满足预设的颜色条件;
基于第一图像生成包括目标对象的前景图像、以及与第一图像对应的第一标注图像;
基于原始背景图像和前景图像,生成第二图像;
基于第一标注图像、以及第二图像,生成样本。
上述存储器52包括内存521和外部存储器522;这里的内存521也称内存储器,用于暂时存放处理器51中的运算数据,以及与硬盘等外部存储器522交换的数据,处理器51通过内存521与外部存储器522进行数据交换。
本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中所述的样本生成方法的步骤。其中,该存储介质可以是易失性或非易失的计算机可读取存储介质。
本公开实施例还提供一种计算机程序产品,该计算机程序产品承载有程序代码,所述程序代码包括的指令可用于执行上述方法实施例中所述的样本生成方法的步骤,具体可参见上述方法实施例,在此不再赘述。
其中,上述计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software Development Kit,SDK)等等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本公开所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本公开的具体实施方式,用以说明本公开的技术方案,而非对其限制,本公开的保护范围并不局限于此,尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本公开实施例技术方案的精神和范围,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应所述以权利要求的保护范围为准。
Claims (14)
1.一种样本生成方法,其特征在于,包括:
获取包括目标对象的第一图像、以及原始背景图像;其中,所述第一图像中除所述目标对象所在第一区域外的第二区域的颜色,满足预设的颜色条件;
基于所述第一图像生成包括所述目标对象的前景图像、以及与所述第一图像对应的第一标注图像;
基于所述原始背景图像和所述前景图像,生成第二图像;
基于所述第一标注图像、以及所述第二图像,生成样本。
2.根据权利要求1所述的样本生成方法,其特征在于,所述颜色条件,包括:
位于所述第二区域的像素点的像素值属于预设的像素值区间。
3.根据权利要求1所述的样本生成方法,其特征在于,基于所述第一图像生成包括所述目标对象的前景图像,包括:
基于所述颜色条件,从所述第一图像中确定属于所述目标对象的第一像素点;
基于所述第一像素点在所述第一图像中的位置、以及所述第一像素点的像素值,生成所述前景图像。
4.根据权利要求1所述的样本生成方法,其特征在于,基于所述第一图像生成与所述第一图像对应的第一标注图像,包括:
基于所述颜色条件,从所述第一图像中确定属于所述第二区域的第二像素点;
基于所述第二像素点在所述第一图像中的位置,生成所述第一标注图像。
5.根据权利要求1所述的样本生成方法,其特征在于,所述基于所述第一像素点在所述第一图像中的位置,生成所述第一标注图像,包括:
基于所述第二像素点在所述第一图像中的位置,确定所述第一区域和所述第二区域的边界像素点;
基于所述边界像素点在所述第一图像中的位置,将所述第一区域和所述第二区域的边界进行柔化处理;
基于柔化处理的结果,生成所述第一标注图像。
6.根据权利要求1所述的样本生成方法,其特征在于,基于所述原始背景图像和所述前景图像,生成第二图像,包括:
基于所述原始背景图像,生成与所述前景图像适配的背景图像;
基于所述背景图像以及所述前景图像,生成所述第二图像。
7.根据权利要求6所述的样本生成方法,其特征在于,基于所述原始背景图像,生成与所述前景图像适配的背景图像,包括:
将所述原始背景图像进行下述至少一种处理,得到与所述前景图像适配的背景图像:放大处理、缩小处理、裁剪处理、以及旋转处理。
8.根据权利要求7所述的样本生成方法,其特征在于,基于所述背景图像以及所述前景图像,生成所述第二图像,包括:
对所述背景图像和/或所述前景图像,进行下述至少一种参数调整处理,并基于所述参数调整处理的结果,生成所述第二图像;
所述参数调整处理包括:亮度参数调整、对比度调整、颜色变换、光照参数调整、以及尺寸调整。
9.根据权利要求1所述的样本生成方法,其特征在于,所述基于所述第一标注图像、以及所述第二图像,生成样本,包括:
基于属于所述第一区域的像素点在所述第一图像中的位置,以及所述前景图像在所述第二图像中的位置,确定位置变换关系信息;
基于所述位置变换关系信息,对所述第一标注图像进行调整,得到与所述第二图像对应的中间标注图像;
基于所述中间标注图像、以及所述第二图像,生成所述样本。
10.根据权利要求9所述的样本生成方法,其特征在于,所述基于所述中间标注图像、以及所述第二图像,生成所述样本,包括:
对所述中间标注图像、和所述第二图像进行相同的形状变换操作,得到第二标注图像、以及变换图像;
基于所述第二标注图像、以及所述变换图像,得到所述样本。
11.根据权利要求10所述的样本生成方法,其特征在于,所述形状变换操作包括下述至少一种:旋转操作、缩小操作、放大操作、以及仿射变换。
12.一种样本生成装置,其特征在于,包括:
获取模块,用于获取包括目标对象的第一图像、以及原始背景图像;其中,所述第一图像中除所述目标对象所在第一区域外的第二区域的颜色,满足预设的颜色条件;
第一生成模块,用于基于所述第一图像生成包括所述目标对象的前景图像、以及与所述第一图像对应的第一标注图像;
第二生成模块,用于基于所述原始背景图像和所述前景图像,生成第二图像;
第三生成模块,用于基于所述第一标注图像、以及所述第二图像,生成样本。
13.一种计算机设备,其特征在于,包括:处理器、存储器,所述存储器存储有所述处理器可执行的机器可读指令,所述处理器用于执行所述存储器中存储的机器可读指令,所述机器可读指令被所述处理器执行时,所述处理器执行如权利要求1至11任一项所述的样本生成方法的步骤。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被计算机设备运行时,所述计算机设备执行如权利要求1至11任意一项所述的样本生成方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011259861.3A CN112381222A (zh) | 2020-11-12 | 2020-11-12 | 一种样本生成方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011259861.3A CN112381222A (zh) | 2020-11-12 | 2020-11-12 | 一种样本生成方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112381222A true CN112381222A (zh) | 2021-02-19 |
Family
ID=74583154
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011259861.3A Pending CN112381222A (zh) | 2020-11-12 | 2020-11-12 | 一种样本生成方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112381222A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105678724A (zh) * | 2015-12-29 | 2016-06-15 | 北京奇艺世纪科技有限公司 | 图像的背景替换方法及装置 |
CN107707831A (zh) * | 2017-09-11 | 2018-02-16 | 广东欧珀移动通信有限公司 | 图像处理方法和装置、电子装置和计算机可读存储介质 |
CN108171677A (zh) * | 2017-12-07 | 2018-06-15 | 腾讯科技(深圳)有限公司 | 一种图像处理方法及相关设备 |
CN109410211A (zh) * | 2017-08-18 | 2019-03-01 | 北京猎户星空科技有限公司 | 一种图像中目标物体的分割方法及装置 |
CN110838131A (zh) * | 2019-11-04 | 2020-02-25 | 网易(杭州)网络有限公司 | 自动抠图的实现方法、装置、电子设备以及介质 |
CN110889824A (zh) * | 2019-10-12 | 2020-03-17 | 北京海益同展信息科技有限公司 | 一种样本生成方法、装置、电子设备及计算机可读存储介质 |
CN111199531A (zh) * | 2019-12-27 | 2020-05-26 | 中国民航大学 | 基于泊松图像融合及图像风格化的交互式数据扩展方法 |
CN111862110A (zh) * | 2020-06-30 | 2020-10-30 | 辽宁向日葵教育科技有限公司 | 一种绿幕抠像方法、系统、设备和可读存储介质 |
-
2020
- 2020-11-12 CN CN202011259861.3A patent/CN112381222A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105678724A (zh) * | 2015-12-29 | 2016-06-15 | 北京奇艺世纪科技有限公司 | 图像的背景替换方法及装置 |
CN109410211A (zh) * | 2017-08-18 | 2019-03-01 | 北京猎户星空科技有限公司 | 一种图像中目标物体的分割方法及装置 |
CN107707831A (zh) * | 2017-09-11 | 2018-02-16 | 广东欧珀移动通信有限公司 | 图像处理方法和装置、电子装置和计算机可读存储介质 |
CN108171677A (zh) * | 2017-12-07 | 2018-06-15 | 腾讯科技(深圳)有限公司 | 一种图像处理方法及相关设备 |
CN110889824A (zh) * | 2019-10-12 | 2020-03-17 | 北京海益同展信息科技有限公司 | 一种样本生成方法、装置、电子设备及计算机可读存储介质 |
CN110838131A (zh) * | 2019-11-04 | 2020-02-25 | 网易(杭州)网络有限公司 | 自动抠图的实现方法、装置、电子设备以及介质 |
CN111199531A (zh) * | 2019-12-27 | 2020-05-26 | 中国民航大学 | 基于泊松图像融合及图像风格化的交互式数据扩展方法 |
CN111862110A (zh) * | 2020-06-30 | 2020-10-30 | 辽宁向日葵教育科技有限公司 | 一种绿幕抠像方法、系统、设备和可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6905602B2 (ja) | 画像照明方法、装置、電子機器および記憶媒体 | |
US9098534B2 (en) | Image display system, image display method, social network service system, and computer-readable medium | |
CN107204034B (zh) | 一种图像处理方法及终端 | |
CN112069339B (zh) | 背景图片处理及搜索结果展示方法、装置、设备和介质 | |
EP4261784A1 (en) | Image processing method and apparatus based on artificial intelligence, and electronic device, computer-readable storage medium and computer program product | |
JP2005151282A (ja) | 画像処理装置、画像処理方法、およびプログラム | |
CN110097616B (zh) | 一种联合绘画方法、装置、终端设备及可读存储介质 | |
CN113240760B (zh) | 一种图像处理方法、装置、计算机设备和存储介质 | |
JP5811416B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
CN103745430A (zh) | 一种数字图像的快速美容方法 | |
CN114723636A (zh) | 基于多特征融合的模型生成方法、装置、设备及存储介质 | |
RU2697627C1 (ru) | Способ корректировки освещенности объекта на изображении в последовательности изображений и вычислительное устройство пользователя, реализующее упомянутый способ | |
CN111068314B (zh) | 一种基于Unity的NGUI资源渲染处理方法及装置 | |
CN112686939A (zh) | 景深图像的渲染方法、装置、设备及计算机可读存储介质 | |
CN112634312A (zh) | 图像背景处理方法、装置、电子设备及存储介质 | |
CN112153303A (zh) | 一种视觉数据处理方法、装置、图像处理设备和存储介质 | |
CN113238692B (zh) | 区域选择方法、地图划分方法、装置、及计算机设备 | |
CN107644455B (zh) | 人脸图像合成方法和装置 | |
CN114363528B (zh) | 表盘生成方法、装置、终端设备及计算机可读存储介质 | |
CN106228165A (zh) | 一种照片分类的方法和移动终端 | |
CN109658360B (zh) | 图像处理的方法、装置、电子设备和计算机存储介质 | |
CN112236800A (zh) | 学习设备、图像生成设备、学习方法、图像生成方法和程序 | |
CN110942488B (zh) | 图像处理装置、图像处理系统、图像处理方法及记录介质 | |
CN112381222A (zh) | 一种样本生成方法、装置、计算机设备和存储介质 | |
CN112419218A (zh) | 图像处理方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |