CN111918049B - 三维成像的方法、装置、电子设备及存储介质 - Google Patents
三维成像的方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN111918049B CN111918049B CN202010818526.6A CN202010818526A CN111918049B CN 111918049 B CN111918049 B CN 111918049B CN 202010818526 A CN202010818526 A CN 202010818526A CN 111918049 B CN111918049 B CN 111918049B
- Authority
- CN
- China
- Prior art keywords
- image
- camera
- training
- dimensional
- shooting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/20—Image signal generators
- H04N13/204—Image signal generators using stereoscopic image cameras
- H04N13/207—Image signal generators using stereoscopic image cameras using a single 2D image sensor
- H04N13/221—Image signal generators using stereoscopic image cameras using a single 2D image sensor using the relative movement between cameras and objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T15/00—3D [Three Dimensional] image rendering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/20—Image signal generators
- H04N13/261—Image signal generators with monoscopic-to-stereoscopic image conversion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2200/00—Indexing scheme for image data processing or generation, in general
- G06T2200/04—Indexing scheme for image data processing or generation, in general involving 3D image data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Graphics (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Studio Devices (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
Abstract
本申请公开了一种三维成像的方法、装置、电子设备及存储介质。具体实现方案为:利用摄像机对第一物体进行初步的拍摄,得到第一图像;以所述第一图像作为基准,至少调整一次摄像机的摄像位置以及工作参数,并在每一次对所述摄像机调整之后利用所述摄像对所述第一物体进行拍摄,获得多个的第二图像;将所述多个的第二图像输入第一图像训练模型,其中,所述第一图像训练模型通过多组训练数据训练获得,所述多组训练数据中的每一组训练数据包括:第二物体的多个角度的图像、以及所述第二物体的三维图像信息;从所述第一图像训练模型中获得其输出的所述第一物体的三维图像信息;根据所述第一物体的三维图像信息,构建所述第一物体的三维图像。本申请实施例可以提高三维成像的效率及准确度。
Description
技术领域
本申请涉及三维成像的技术领域,尤其涉及三维成像的方法、装置、电子设备及存储介质。
背景技术
对某一物体进行拍摄并获得该物体的三维图像,一般来说,是利用照相机对物体进行各个角度的拍摄,并通过计算机将拍摄得到的照片进行合成,获得360度成像的三维图像。
但是,利用照相相对物体拍摄的各个角度的图片,角度过于随机、拍摄得到的每一张图片的清晰度或曝光情况等都不一样。在将这些拍摄情况参差不齐的图片输入到计算机中合成,其合成效果总是较为一般。有时候需要返回重新拍摄多个角度的图片,并重新合成。如此,合成效率低下。
发明内容
本申请提供一种三维成像的方法、装置、电子设备和存储介质,以解决或缓解现有技术中的一项或更多项技术问题。
根据本申请的一方面,提供了一种三维成像的方法,包括:
利用摄像机对第一物体进行初步的拍摄,得到第一图像;
以所述第一图像作为基准,至少调整一次摄像机的摄像位置以及工作参数,并在每一次对所述摄像机调整之后利用所述摄像机对所述第一物体进行拍摄,获得多个第二图像;
将所述多个第二图像输入第一图像训练模型,其中,所述第一图像训练模型通过多组训练数据训练获得,所述多组训练数据中的每一组训练数据包括:第二物体的多个角度的图像、以及所述第二物体的三维图像信息;
从所述第一图像训练模型中获得其输出的所述第一物体的三维图像信息;
根据所述第一物体的三维图像信息,构建所述第一物体的三维图像。
在一些实施方式中,所述以所述第一图像作为基准,至少调整一次摄像机的摄像位置以及工作参数,并在每一次对所述摄像机调整之后利用所述摄像机对所述第一物体进行拍摄,获得多个的第二图像,包括:
根据所述第一图像,确定所述摄像机在拍摄得到所述第一图像时其所在位置和工作参数、以及确定所述第一物体的尺寸信息;
根据所述摄像机在拍摄得到所述第一图像时其所在的位置和工作参数、以及所述第一物体的尺寸信息,确定用于调整所述摄像机的矩阵,其中,所述矩阵的行和列的数值表示所述摄像机所处的位置,所述矩阵中的每一个元素的数值表示所述摄像机的工作参数;
根据所述矩阵中的每一个元素,逐次调整所述摄像机,并在每一次调整摄像机后,利用调整后的摄像机对所述第一物体进行拍摄,获得所述矩阵中的每一个元素分别对应的第二图像。
在一些实施方式中,在获得所述第二图像之后,所述方法还包括:
识别所述第二图像中除了所述第一物体之外是否包括背景或其他物体;
如果所述第二图像除了所述第一物体之外还包括背景或其他物体,对所述第二图像处理,获得仅包括所述第一物体的第二图像。
在一些实施方式中,所述如果所述第二图像除了所述第一物体之外还包括背景或其他物体,对所述第二图像处理,包括:
将所述第二图像输入第二图像训练模型,其中,所述第二图像训练模型通过多组训练数据训练得到,所述多组训练数据中的每一组训练数据包括:包括第三物体和背景或其他物体的图像以及仅包括第三物体的图像;
从所述第二图像训练模型中获取其输出的仅包括所述第一物体的第二图像。
在一些实施方式中,所述根据所述第一物体的三维图像信息,构建所述第一物体的三维图像,包括:
从所述第一物体的三维图像信息中,获取组成所述第一物体的三维图像的每个像素点的三维坐标和像素;
将所述每个像素点的三维坐标和像素输入第三图像训练模型,其中,所述第三图像训练模型通过多组训练数据训练得到的,所述多组训练数据中的每一组训练数据包括:用于训练的三维图像中的每一个像素点的三维坐标和像素、以及所述用于训练的三维图像;
从所述第三图像训练模型中获取其输出的三维图像。
根据本申请的一方面,提供了一种三维成像的装置,包括:
第一图像获取模块,用于利用摄像机对第一物体进行初步的拍摄,得到第一图像;
第二图像获取模块,用于以所述第一图像作为基准,至少调整一次摄像机的摄像位置以及工作参数,并在每一次对所述摄像机调整之后利用所述摄像机对所述第一物体进行拍摄,获得多个第二图像;
第一模型输入模块,用于将所述多个第二图像输入第一图像训练模型,其中,所述第一图像训练模型通过多组训练数据训练获得,所述多组训练数据中的每一组训练数据包括:第二物体的多个角度的图像、以及所述第二物体的三维图像信息;
三维图像信息获取模块,用于从所述第一图像训练模型中获得其输出的所述第一物体的三维图像信息;
三维图像获取模块,用于根据所述第一物体的三维图像信息,构建所述第一物体的三维图像。
在一些实施方式中,所述第二图像获取模块包括:
第一图像信息获取单元,用于根据所述第一图像,确定所述摄像机在拍摄得到所述第一图像时其所在位置和工作参数、以及确定所述第一物体的尺寸信息;
矩阵确定单元,用于根据所述摄像机在拍摄得到所述第一图像时其所在的位置和工作参数、以及所述第一物体的尺寸信息,确定用于调整所述摄像的矩阵,其中,所述矩阵的行和列的数值表示所述摄像机所处的位置,所述矩阵中的每一个元素的数值表示所述摄像机的工作参数;
第二图像拍摄单元,用于根据所述矩阵中的每一个元素,逐次调整所述摄像机,并在每一次调整摄像机后,利用调整后的摄像机对所述第一物体进行拍摄,获得所述矩阵中的每一个元素分别对应的第二图像。
在一些实施方式中,所述三维图像获取模块包括:
信息获取单元,用于从所述第一物体的三维图像信息中,获取组成所述第一物体的三维图像的每个像素点的三维坐标和像素;
第三模型输入单元,用于将所述每个像素点的三维坐标和像素输入第三图像训练模型,其中,所述第三图像训练模型通过多组训练数据训练得到的,所述多组训练数据中的每一组训练数据包括:用于训练的三维图像中的每一个像素点的三维坐标和像素、以及所述用于训练的三维图像;
三维图像输出单元,用于从所述第三图像训练模型中获取其输出的三维图像。
根据本申请的一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请任意实施例提供的方法。
根据本申请的一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本申请实施例提供的方法。
根据本申请实施例,可以准确地多次调整摄像机的拍摄位置以及拍摄时的工作参数,来获得多张符合合成要求的图片。并且本发明并不直接采用图片合成的方式,而是对多个二维图片进行信息过滤,得到三维图像信息,然后利用三维图像信息来构建三维图像。如此,更为高效精准。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本申请公开的一些实施方式,而不应将其视为是对本申请范围的限制。
图1是本申请实施例的三维成像的方法的流程示意图;
图2是本申请实施例的第二图像获取的过程的示意图;
图3是本申请实施例是三维成像构建过程的示意图;
图4是本申请实施例提供的三维成像的装置的结构图;
图5是根据本申请实施例的三维成像的方法的电子设备的框图;
具体实施方式
在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本申请的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。
图1示出了本申请实施例的三维成像的方法的流程示意图。本申请实施例可以应用于摄影棚或摄影箱或其他摄像装置中,可以对位于任一物体进行拍摄并获取三维图像。如图1所示,该方法可以包括:
步骤S100、利用摄像机对第一物体进行初步的拍摄,得到第一图像;
步骤S200、以第一图像作为基准,至少调整一次摄像机的摄像位置以及工作参数,并在每一次对摄像机调整之后利用摄像机对第一物体进行拍摄,获得多个第二图像;
步骤S300、将多个第二图像输入第一图像训练模型,其中,第一图像训练模型通过多组训练数据训练获得,多组训练数据中的每一组训练数据包括:第二物体的多个角度的图像、以及第二物体的三维图像信息;
步骤S400、从第一图像训练模型中获得其输出的第一物体的三维图像信息;
步骤S500、根据第一物体的三维图像信息,构建第一物体的三维图像。
在本申请实施例中,可以利用摄像机首次拍摄的图像来逐次调整后续对物体进行拍摄的摄像机的位置以及工作参数,进而得来符合标准的多个角度的第二图像,提高拍摄效率。然后,在获得多个角度的第二图像之后,利用多个角度的第二图像,来提取组成物体的三维图像的信息,即上述第一物体的三维图像信息,然后再利用三维图像信息来构建三维图像,更为高效准确。
其中,在步骤S100中,第一物体仅用于区分第二物体,并无先后顺序,其表示待摄像以获得其三维图像的物体,该物体可以是静态的物体也可以是动物。对第一物体进行初步的拍摄可以是随机的,或者按照当前摄像机所在的位置以及所设置的工作参数对第一物体进行拍摄。这样可以不用在初步的拍摄中对摄像机进行调整。
本申请实施例的摄像装置可以包括摄像机、控制摄像机升降以及旋转的移动机构、以及处理器。处理器可以控制移动机构的升降以及旋转以调整摄像的位置,以及可以调整摄像机在不同位置上对第一物体进行拍摄时的工作参数。工作参数可以包括焦点、曝光程度、白平衡、光补偿等。
训练模型,可以是机器学习中的神经网络模型。神经网络(Neural Net works NN)是由大量的、简单的处理单元(称为神经元)广泛地互相连接而形成的复杂网络系统,它反映了人脑功能的许多基本特征,是一个高度复杂的非线性动力学习系统。神经网络具有大规模并行、分布式存储和处理、自组织、自适应和自学能力,特别适合处理需要同时考虑许多因素和条件的、不精确和模糊的信息处理问题。神经网络模型是以神经元的数学模型为基础来描述的。人工神经网络(Artificial Nuearl Newtokrs),是对人类大脑系统的一阶特性的一种描。简单地讲,它是一个数学模型。神经网络模型由网络拓扑节点的特点和学习规则来表示。
在本申请实施例中,将包括有一个设定物体,例如第二物体的多个角度的图像作为输入数据,输入到训练模型中,每一组输入的训练数据中都包括某一个物体的多个角度的图像以及该物体的三维图像信息,每一组所对应的物体可以是不一样的,也可以是相同的。以对应物体的三维图像信息作为监督数据,来对该物体的多个角度的图像进行训练,获得输出数据。从而完成对训练模型的训练。训练完成后的模型可以应用于上述步骤S300中。
当然,在一些实施例中,可以验证训练模型的精度或准确度,如果输出数据的准确度下降到设定的阈值,则可以对训练模型进行重新训练或者加深训练程度。训练数据可调取摄像机的历史数据或者其他途径输入的数据。
在上述步骤S400中,三维图像信息可以包括各像素点的三维坐标以及像素等。其可以记录物体的尺寸、形状、颜色等。
在上述步骤S200中,如图2所示,其对摄像机调整的过程以及获得第二图像的过程可以包括如下步骤:
步骤S210、根据第一图像,确定摄像机在拍摄得到第一图像时其所在位置和工作参数、以及确定第一物体的尺寸信息;
步骤S220、根据摄像机在拍摄得到第一图像时其所在的位置和工作参数、以及第一物体的尺寸信息,确定用于调整摄像机的矩阵,其中,矩阵的行和列的数值表示摄像机所处的位置,矩阵中的每一个元素的数值表示摄像机的工作参数;
步骤S230、根据矩阵中的每一个元素,逐次调整摄像机,并在每一次调整摄像机后,利用调整后的摄像机对第一物体进行拍摄,获得矩阵中的每一个元素分别对应的第二图像。
在本申请实施例中,通过第一图像,可以获知摄像机在拍摄时的位置,例如,移动摄像机的移动机所处的升降位置以及旋转位置,以及可以获知摄像机在拍摄时的工作参数,焦点、曝光情况、光平衡情况。当然,还可以获知第一图像所处的环境。如果环境内包括有其他物体,可以通过调整摄像机的位置以及摄像机的焦点的远近来避免其他物体的入镜。以及,通过第一图像以及摄像机所处的位置,可以确定第一物体的尺寸信息。
在一些实施例中,为了更准确地获取用于调整摄像机或摄像机的矩阵,可以在拍摄第一图像时,将拍摄第一图像的摄像位置以及工作参数也作一定的调整,尽可能地针第一物体周围的物体或背景物等也拍摄进第一图像中。以在步骤S200中拍摄第二图像时,可以调整摄像机的位置或工作参数来将第一物体周围的物体或背景排除在外。
对于矩阵,矩阵的行可以表示摄像机所处的高度,矩阵的列可以表示摄像机所处的旋转角度或旋转后的位置。当然,矩阵的行和列所表示的含义可以相互调换。对于位于矩阵中的某一行某一列中的一个元素的数值可以表示当摄像机位于该行该列所指示的位置时的工作参数。
其中,矩阵的行和列的范围、以及相邻两行或两列相隔的距离可以依据第一物体的尺寸信息来确定。第一物体的尺寸信息可以包括第一物体的高度、宽度以及厚度。对于不规定的物体,其高度可以取其体形的最大高度,宽度可以取其体形的最大宽度,厚度可以取其体形的最大厚度。
至于矩阵中的每一个元素的工作参数,可以参考相邻元素的工作参数以及与相邻元素之间距离来调整,这样调整的工作参数更为准确,获得的第二图像的效果图更好。
为了避免第二图像中包含有其他物体或背景信息,以提高从第二图像中获得的第一物体的三维图像信息的准确度,则在获得第二图像之后,本申请实施例提供的方法还包括:识别第二图像中除了第一物体之外是否包括背景或其他物体;以及,如果第二图像除了第一物体之外还包括背景或其他物体,对第二图像处理,获得仅包括第一物体的第二图像。
在本申请实施例中,可以利用第一图像来对第二图像进行识别。在拍摄第一图像时,从第一图像中可以识别到第一物体以及第一物体周围的环境。因此,可以利用第一图像或利用从第一图像中可以识别到第一物体以及第一物体周围的环境,来对第二图像进行识别,其是否包括降第一物体外的其他物体或背景等,如果有,则需要对第二图像进行处理或过滤,以得到仅包括第一物体的第二图像。
其中,可以利用神经网络模型来对包含有其他物体或背景的第二图像进行处理。具体地,如下:将第二图像输入第二图像训练模型,其中,第二图像训练模型通过多组训练数据训练得到,多组训练数据中的每一组训练数据包括:包括第三物体和背景或其他物体的图像以及仅包括第三物体的图像;以及,从第二图像训练模型中获取其输出的仅包括第一物体的第二图像。
在本申请实施例中,第二图像训练模型与第一图像训练模型类似,也是神经网络模型,在此不再赘述。
对于第二图像训练模型的训练可以如下:以包含第三物体、背景或其他物体的图像作为输入数据,输入到第二图像训练模型中,每一组输入的训练数据包括两张图像,其中一张图像包括某一个物体、背景以及其他物体的图像,另一张图像为此某一物体。本实施例中,以一组数据中的图像包括第三物体为例。以仅包括第三物体的图像作为监督数据,来对包含第三物体、背景或其他物体的图像,进行训练,获得输出数据。将监督数据与输出数据进行比较,调整第二图像训练模型的模型参数,如此不断训练,可以获得满精度要求的第二图像训练模型。
在本申请实施例中,三维图像信息可以包括第一物体的每一个像素点的三维坐标和像素。因此利用这些数据,可以构建三维图像。其中在一种实施例中,可以神经网络模型来构建三维图像,参见图3,该方法包括:
步骤S510、从第一物体的三维图像信息中,获取组成第一物体的三维图像的每个像素点的三维坐标和像素;
步骤S520、将每个像素点的三维坐标和像素输入第三图像训练模型,其中,第三图像训练模型通过多组训练数据训练得到的,多组训练数据中的每一组训练数据包括:用于训练的三维图像中的每一个像素点的三维坐标和像素、以及用于训练的三维图像;
步骤S530、从第三图像训练模型中获取其输出的三维图像。
在本申请实施例中,可以预先对第三图像训练模型进行训练,以用于训练的三维图像中的第一个像素点的三维坐标和像素,作为输入数据,输入到第三图像训练模型中,每一组输入的训练数据包括用于训练的三维图像中的每一个像素点的三维坐标和像素、以及用于训练的三维图像,以用于训练的三维图像作为监督数据,对用于训练的三维图像中的每一个像素点的三维坐标和像素进行训练,获得输出数据。将监督数据和输出数据进行比较,调整第三图像训练模型的模型参数,如此不断训练,可以获得满足精度要求的第三图像训练模型。
参见图4,本申请实施例还提供了一种三维成像的装置,包括:
第一图像获取模块100,用于利用摄像机对第一物体进行初步的拍摄,得到第一图像;
第二图像获取模块200,用于以第一图像作为基准,至少调整一次摄像机的摄像位置以及工作参数,并在每一次对摄像机调整之后利用摄像机对第一物体进行拍摄,获得多个第二图像;
第一模型输入模块300,用于将多个第二图像输入第一图像训练模型,其中,第一图像训练模型通过多组训练数据训练获得,多组训练数据中的每一组训练数据包括:第二物体的多个角度的图像、以及第二物体的三维图像信息;
三维图像信息获取模块400,用于从第一图像训练模型中获得其输出的第一物体的三维图像信息;
三维图像获取模块500,用于根据第一物体的三维图像信息,构建第一物体的三维图像。
在一种实施方式中,第二图像获取模块200包括:
第一图像信息获取单元,用于根据第一图像,确定摄像机在拍摄得到第一图像时其所在位置和工作参数、以及确定第一物体的尺寸信息;
矩阵确定单元,用于根据摄像机在拍摄得到第一图像时其所在的位置和工作参数、以及第一物体的尺寸信息,确定用于调整摄像机的矩阵,其中,矩阵的行和列的数值表示摄像机所处的位置,矩阵中的每一个元素的数值表示摄像机的工作参数;
第二图像拍摄单元,用于根据矩阵中的每一个元素,逐次调整摄像机,并在每一次调整摄像机后,利用调整后的摄像机对第一物体进行拍摄,获得矩阵中的每一个元素分别对应的第二图像。
在一种实施方式中,三维图像获取模块500包括:
信息获取单元,用于从第一物体的三维图像信息中,获取组成第一物体的三维图像的每个像素点的三维坐标和像素;
第三模型输入单元,用于将每个像素点的三维坐标和像素输入第三图像训练模型,其中,第三图像训练模型通过多组训练数据训练得到的,多组训练数据中的每一组训练数据包括:用于训练的三维图像中的每一个像素点的三维坐标和像素、以及用于训练的三维图像;
三维图像输出单元,用于从第三图像训练模型中获取其输出的三维图像。
如图5所示,其是根据本申请实施例的三维成像的方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图5所示,该电子设备包括:一个或多个处理器601、存储器602,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图5中以一个处理器601为例。
存储器602即为本申请所提供的非瞬时计算机可读存储介质。其中,存储器存储有可由至少一个处理器执行的指令,以使至少一个处理器执行本申请所提供的三维成像的方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的三维成像的方法。
存储器602作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的三维成像的方法对应的程序指令/模块(例如,附图3所示的通信建立模块110、请求接收模块120、种子发送模块130、秘钥接收模块140、秘钥比对模块150和第一状态设置模块160)。处理器601通过运行存储在存储器602中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的三维成像的方法。
存储器602可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据三维成像的方法的电子设备的使用所创建的数据等。此外,存储器602可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器602可选包括相对于处理器601远程设置的存储器,这些远程存储器可以通过网络连接至网关接入的方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
网关接入的方法的电子设备还可以包括:输入装置603和输出装置604。处理器601、存储器602、输入装置603和输出装置604可以通过总线或者其他方式连接,图4中以通过总线连接为例。
输入装置603可接收输入的数字或字符信息,以及产生与三维成像的方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置604可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (8)
1.一种三维成像的方法,其特征在于,包括:
利用摄像机对第一物体进行初步的拍摄,得到第一图像;
以所述第一图像作为基准,至少调整一次摄像机的摄像位置以及工作参数,并在每一次对所述摄像机调整之后利用所述摄像机对所述第一物体进行拍摄,获得多个第二图像;
将所述多个第二图像输入第一图像训练模型,其中,所述第一图像训练模型通过多组训练数据训练获得,所述多组训练数据中的每一组训练数据包括:第二物体的多个角度的图像、以及所述第二物体的三维图像信息;
从所述第一图像训练模型中获得其输出的所述第一物体的三维图像信息;
根据所述第一物体的三维图像信息,构建所述第一物体的三维图像;
其中,所述以所述第一图像作为基准,至少调整一次摄像机的摄像位置以及工作参数,并在每一次对所述摄像机调整之后利用所述摄像机对所述第一物体进行拍摄,获得多个第二图像,包括:
根据所述第一图像,确定所述摄像机在拍摄得到所述第一图像时其所在位置和工作参数、以及确定所述第一物体的尺寸信息;
根据所述摄像机在拍摄得到所述第一图像时其所在的位置和工作参数、以及所述第一物体的尺寸信息,确定用于调整所述摄像机的矩阵,其中,所述矩阵的行和列的数值表示所述摄像机所处的位置,所述矩阵的行表示所述摄像机所处的高度,所述矩阵的列表示所述摄像机所处的旋转角度,所述矩阵的行和列的范围依据所述第一物体的尺寸信息来确定,所述矩阵中的每一个元素的数值表示所述摄像机的工作参数;
根据所述矩阵中的每一个元素,逐次调整所述摄像机,并在每一次调整摄像机后,利用调整后的摄像机对所述第一物体进行拍摄,获得所述矩阵中的每一个元素分别对应的第二图像;
其中,在拍摄所述第一图像时,对拍摄所述第一图像的摄像位置和工作参数进行调整,使得所述第一物体周围的物体或背景物也拍摄在所述第一图像中,以使在拍摄所述第二图像时能够通过调整所述摄像机的位置或工作参数来将所述第一物体周围的物体或背景排除在外。
2.如权利要求1所述的方法,其特征在于,在获得所述第二图像之后,所述方法还包括:
识别所述第二图像中除了所述第一物体之外是否包括背景或其他物体;
如果所述第二图像除了所述第一物体之外还包括背景或其他物体,对所述第二图像处理,获得仅包括所述第一物体的第二图像。
3.如权利要求2所述的方法,其特征在于,所述如果所述第二图像除了所述第一物体之外还包括背景或其他物体,对所述第二图像处理,包括:
将所述第二图像输入第二图像训练模型,其中,所述第二图像训练模型通过多组训练数据训练得到,所述多组训练数据中的每一组训练数据包括:包括第三物体和背景或其他物体的图像以及仅包括第三物体的图像;
从所述第二图像训练模型中获取其输出的仅包括所述第一物体的第二图像。
4.如权利要求1所述的方法,其特征在于,所述根据所述第一物体的三维图像信息,构建所述第一物体的三维图像,包括:
从所述第一物体的三维图像信息中,获取组成所述第一物体的三维图像的每个像素点的三维坐标和像素;
将所述每个像素点的三维坐标和像素输入第三图像训练模型,其中,所述第三图像训练模型通过多组训练数据训练得到的,所述多组训练数据中的每一组训练数据包括:用于训练的三维图像中的每一个像素点的三维坐标和像素、以及所述用于训练的三维图像;
从所述第三图像训练模型中获取其输出的三维图像。
5.一种三维成像的装置,其特征在于,包括:
第一图像获取模块,用于利用摄像机对第一物体进行初步的拍摄,得到第一图像;
第二图像获取模块,用于以所述第一图像作为基准,至少调整一次摄像机的摄像位置以及工作参数,并在每一次对所述摄像机调整之后利用所述摄像机对所述第一物体进行拍摄,获得多个第二图像;
第一模型输入模块,用于将所述多个第二图像输入第一图像训练模型,其中,所述第一图像训练模型通过多组训练数据训练获得,所述多组训练数据中的每一组训练数据包括:第二物体的多个角度的图像、以及所述第二物体的三维图像信息;
三维图像信息获取模块,用于从所述第一图像训练模型中获得其输出的所述第一物体的三维图像信息;
三维图像获取模块,用于根据所述第一物体的三维图像信息,构建所述第一物体的三维图像;
其中,所述第二图像获取模块包括:
第一图像信息获取单元,用于根据所述第一图像,确定所述摄像机在拍摄得到所述第一图像时其所在位置和工作参数、以及确定所述第一物体的尺寸信息;
矩阵确定单元,用于根据所述摄像机在拍摄得到所述第一图像时其所在的位置和工作参数、以及所述第一物体的尺寸信息,确定用于调整所述摄像机的矩阵,其中,所述矩阵的行和列的数值表示所述摄像机所处的位置,所述矩阵的行表示所述摄像机所处的高度,所述矩阵的列表示所述摄像机所处的旋转角度,所述矩阵的行和列的范围依据所述第一物体的尺寸信息来确定,所述矩阵中的每一个元素的数值表示所述摄像机的工作参数;
第二图像拍摄单元,用于根据所述矩阵中的每一个元素,逐次调整所述摄像机,并在每一次调整摄像机后,利用调整后的摄像机对所述第一物体进行拍摄,获得所述矩阵中的每一个元素分别对应的第二图像;
其中,在拍摄所述第一图像时,对拍摄所述第一图像的摄像位置和工作参数进行调整,使得所述第一物体周围的物体或背景物也拍摄在所述第一图像中,以在拍摄所述第二图像时通过调整所述摄像机的位置或工作参数来将所述第一物体周围的物体或背景排除在外。
6.如权利要求5所述的装置,其特征在于,所述三维图像获取模块包括:
信息获取单元,用于从所述第一物体的三维图像信息中,获取组成所述第一物体的三维图像的每个像素点的三维坐标和像素;
第三模型输入单元,用于将所述每个像素点的三维坐标和像素输入第三图像训练模型,其中,所述第三图像训练模型通过多组训练数据训练得到的,所述多组训练数据中的每一组训练数据包括:用于训练的三维图像中的每一个像素点的三维坐标和像素、以及所述用于训练的三维图像;
三维图像输出单元,用于从所述第三图像训练模型中获取其输出的三维图像。
7. 一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-4中任一项所述的方法。
8.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-4任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010818526.6A CN111918049B (zh) | 2020-08-14 | 2020-08-14 | 三维成像的方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010818526.6A CN111918049B (zh) | 2020-08-14 | 2020-08-14 | 三维成像的方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111918049A CN111918049A (zh) | 2020-11-10 |
CN111918049B true CN111918049B (zh) | 2022-09-06 |
Family
ID=73283135
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010818526.6A Active CN111918049B (zh) | 2020-08-14 | 2020-08-14 | 三维成像的方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111918049B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117671402A (zh) * | 2022-08-22 | 2024-03-08 | 华为技术有限公司 | 识别模型训练方法、装置以及可移动智能设备 |
Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005227929A (ja) * | 2004-02-12 | 2005-08-25 | Nippon Telegr & Teleph Corp <Ntt> | 対象物の撮影画像の処理方法、画像表示システム、プログラム、および、記録媒体 |
CN104539931A (zh) * | 2014-12-05 | 2015-04-22 | 北京格灵深瞳信息技术有限公司 | 一种多目相机系统、装置及同步方法 |
CN107103641A (zh) * | 2017-03-23 | 2017-08-29 | 微景天下(北京)科技有限公司 | 三维重建成像系统和三维重建成像方法 |
CN107360364A (zh) * | 2017-06-28 | 2017-11-17 | 维沃移动通信有限公司 | 一种图像拍摄方法及主移动终端 |
CN107465907A (zh) * | 2017-08-16 | 2017-12-12 | 维沃移动通信有限公司 | 一种拍摄方法及移动终端 |
CN107516333A (zh) * | 2016-06-17 | 2017-12-26 | 长春理工大学 | 自适应De Bruijn彩色结构光编码方法 |
CN108495045A (zh) * | 2018-05-17 | 2018-09-04 | Oppo广东移动通信有限公司 | 图像拍摄方法、装置、电子装置以及存储介质 |
CN108615256A (zh) * | 2018-03-29 | 2018-10-02 | 西南民族大学 | 一种人脸三维重建方法及装置 |
CN109190469A (zh) * | 2018-07-27 | 2019-01-11 | 阿里巴巴集团控股有限公司 | 一种检测方法及装置、一种计算设备及存储介质 |
CN109255843A (zh) * | 2018-09-26 | 2019-01-22 | 联想(北京)有限公司 | 三维重建方法、装置及增强现实ar设备 |
CN110060331A (zh) * | 2019-03-14 | 2019-07-26 | 杭州电子科技大学 | 一种基于全卷积神经网络的单目相机室外三维重建方法 |
CN110113538A (zh) * | 2019-06-12 | 2019-08-09 | 北京百度网讯科技有限公司 | 智能拍摄设备、智能控制方法和装置 |
CN110163953A (zh) * | 2019-03-11 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 三维人脸重建方法、装置、存储介质和电子装置 |
WO2020042800A1 (zh) * | 2018-08-31 | 2020-03-05 | 阿里巴巴集团控股有限公司 | 用于辅助车辆定损图像拍摄的方法、装置及设备 |
WO2020098686A1 (zh) * | 2018-11-16 | 2020-05-22 | 广州市百果园信息技术有限公司 | 人脸检测模型的训练方法、人脸关键点的检测方法和装置 |
CN111279352A (zh) * | 2017-10-27 | 2020-06-12 | 汉阳大学校产学协力团 | 通过投球练习的三维信息获取系统及摄像头参数算出方法 |
CN111432195A (zh) * | 2020-03-30 | 2020-07-17 | 维沃移动通信(杭州)有限公司 | 一种图像拍摄方法及电子设备 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110298897A1 (en) * | 2010-06-08 | 2011-12-08 | Iva Sareen | System and method for 3d virtual try-on of apparel on an avatar |
US9396577B2 (en) * | 2012-02-16 | 2016-07-19 | Google Inc. | Using embedded camera parameters to determine a position for a three-dimensional model |
JP6572099B2 (ja) * | 2015-11-06 | 2019-09-04 | キヤノン株式会社 | 撮像装置及びその制御方法、ならびにプログラム |
JP6733267B2 (ja) * | 2016-03-31 | 2020-07-29 | 富士通株式会社 | 情報処理プログラム、情報処理方法および情報処理装置 |
-
2020
- 2020-08-14 CN CN202010818526.6A patent/CN111918049B/zh active Active
Patent Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005227929A (ja) * | 2004-02-12 | 2005-08-25 | Nippon Telegr & Teleph Corp <Ntt> | 対象物の撮影画像の処理方法、画像表示システム、プログラム、および、記録媒体 |
CN104539931A (zh) * | 2014-12-05 | 2015-04-22 | 北京格灵深瞳信息技术有限公司 | 一种多目相机系统、装置及同步方法 |
CN107516333A (zh) * | 2016-06-17 | 2017-12-26 | 长春理工大学 | 自适应De Bruijn彩色结构光编码方法 |
CN107103641A (zh) * | 2017-03-23 | 2017-08-29 | 微景天下(北京)科技有限公司 | 三维重建成像系统和三维重建成像方法 |
CN107360364A (zh) * | 2017-06-28 | 2017-11-17 | 维沃移动通信有限公司 | 一种图像拍摄方法及主移动终端 |
CN107465907A (zh) * | 2017-08-16 | 2017-12-12 | 维沃移动通信有限公司 | 一种拍摄方法及移动终端 |
CN111279352A (zh) * | 2017-10-27 | 2020-06-12 | 汉阳大学校产学协力团 | 通过投球练习的三维信息获取系统及摄像头参数算出方法 |
CN108615256A (zh) * | 2018-03-29 | 2018-10-02 | 西南民族大学 | 一种人脸三维重建方法及装置 |
CN108495045A (zh) * | 2018-05-17 | 2018-09-04 | Oppo广东移动通信有限公司 | 图像拍摄方法、装置、电子装置以及存储介质 |
CN109190469A (zh) * | 2018-07-27 | 2019-01-11 | 阿里巴巴集团控股有限公司 | 一种检测方法及装置、一种计算设备及存储介质 |
WO2020042800A1 (zh) * | 2018-08-31 | 2020-03-05 | 阿里巴巴集团控股有限公司 | 用于辅助车辆定损图像拍摄的方法、装置及设备 |
CN109255843A (zh) * | 2018-09-26 | 2019-01-22 | 联想(北京)有限公司 | 三维重建方法、装置及增强现实ar设备 |
WO2020098686A1 (zh) * | 2018-11-16 | 2020-05-22 | 广州市百果园信息技术有限公司 | 人脸检测模型的训练方法、人脸关键点的检测方法和装置 |
CN110163953A (zh) * | 2019-03-11 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 三维人脸重建方法、装置、存储介质和电子装置 |
CN110060331A (zh) * | 2019-03-14 | 2019-07-26 | 杭州电子科技大学 | 一种基于全卷积神经网络的单目相机室外三维重建方法 |
CN110113538A (zh) * | 2019-06-12 | 2019-08-09 | 北京百度网讯科技有限公司 | 智能拍摄设备、智能控制方法和装置 |
CN111432195A (zh) * | 2020-03-30 | 2020-07-17 | 维沃移动通信(杭州)有限公司 | 一种图像拍摄方法及电子设备 |
Non-Patent Citations (2)
Title |
---|
国产落叶松规格材销槽承压试验研究;刘柯珍等;《安徽农业科学》;20110615(第17期);全文 * |
基于HOG/PCA/SVM的跨年龄人脸识别算法;彭思江等;《吉首大学学报(自然科学版)》;20180925(第05期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111918049A (zh) | 2020-11-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112541963B (zh) | 三维虚拟形象生成方法、装置、电子设备和存储介质 | |
CN111291885B (zh) | 近红外图像的生成方法、生成网络的训练方法和装置 | |
CN111753961B (zh) | 模型训练方法和装置、预测方法和装置 | |
JP6504590B2 (ja) | 画像のセマンティックセグメンテーションのためのシステム及びコンピューター実施方法、並びに非一時的コンピューター可読媒体 | |
WO2022179581A1 (zh) | 一种图像处理方法及相关设备 | |
CN111968203B (zh) | 动画驱动方法、装置、电子设备及存储介质 | |
CN112489102A (zh) | 三维重建方法、装置、设备以及存储介质 | |
CN111784757B (zh) | 深度估计模型的训练方法、深度估计方法、装置及设备 | |
CN111488821B (zh) | 用于识别交通信号灯倒计时信息的方法及装置 | |
CN113205560A (zh) | 多深度相机的标定方法、装置、设备及存储介质 | |
CN112241716B (zh) | 训练样本的生成方法和装置 | |
CN111507924B (zh) | 视频帧的处理方法和装置 | |
CN111523467B (zh) | 人脸跟踪方法和装置 | |
CN107959798A (zh) | 视频数据实时处理方法及装置、计算设备 | |
CN111918049B (zh) | 三维成像的方法、装置、电子设备及存储介质 | |
CN111710008B (zh) | 人流密度的生成方法、装置、电子设备以及存储介质 | |
CN115222896A (zh) | 三维重建方法、装置、电子设备及计算机可读存储介质 | |
JP7475959B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
CN111986263B (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN114461078B (zh) | 一种基于人工智能的人机交互方法 | |
CN114255177B (zh) | 成像中的曝光控制方法、装置、设备及存储介质 | |
CN110728227B (zh) | 图像处理的方法及装置 | |
CN112508830B (zh) | 图像处理模型的训练方法、装置、设备及存储介质 | |
CN115841520A (zh) | 一种相机内参标定方法、装置、电子设备及介质 | |
CN117252914A (zh) | 深度估计网络的训练方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |