[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

WO2019054304A1 - 撮像装置 - Google Patents

撮像装置 Download PDF

Info

Publication number
WO2019054304A1
WO2019054304A1 PCT/JP2018/033266 JP2018033266W WO2019054304A1 WO 2019054304 A1 WO2019054304 A1 WO 2019054304A1 JP 2018033266 W JP2018033266 W JP 2018033266W WO 2019054304 A1 WO2019054304 A1 WO 2019054304A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
imaging
unit
distance
pixel
Prior art date
Application number
PCT/JP2018/033266
Other languages
English (en)
French (fr)
Inventor
征志 中田
Original Assignee
株式会社ソニー・インタラクティブエンタテインメント
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社ソニー・インタラクティブエンタテインメント filed Critical 株式会社ソニー・インタラクティブエンタテインメント
Priority to US16/644,260 priority Critical patent/US11064182B2/en
Publication of WO2019054304A1 publication Critical patent/WO2019054304A1/ja
Priority to US17/341,807 priority patent/US11438568B2/en
Priority to US17/875,981 priority patent/US20220385879A1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/204Image signal generators using stereoscopic image cameras
    • H04N13/207Image signal generators using stereoscopic image cameras using a single 2D image sensor
    • H04N13/218Image signal generators using stereoscopic image cameras using a single 2D image sensor using spatial multiplexing
    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B3/00Simple or compound lenses
    • G02B3/0006Arrays
    • G02B3/0037Arrays characterized by the distribution or form of lenses
    • G02B3/0056Arrays characterized by the distribution or form of lenses arranged along two different directions in a plane, e.g. honeycomb arrangement of lenses
    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B5/00Optical elements other than lenses
    • G02B5/20Filters
    • G02B5/201Filters in the form of arrays
    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B7/00Mountings, adjusting means, or light-tight connections, for optical elements
    • G02B7/28Systems for automatic generation of focusing signals
    • G02B7/30Systems for automatic generation of focusing signals using parallactic triangle with a base line
    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B7/00Mountings, adjusting means, or light-tight connections, for optical elements
    • G02B7/28Systems for automatic generation of focusing signals
    • G02B7/34Systems for automatic generation of focusing signals using different areas in a pupil plane
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L27/00Devices consisting of a plurality of semiconductor or other solid-state components formed in or on a common substrate
    • H01L27/14Devices consisting of a plurality of semiconductor or other solid-state components formed in or on a common substrate including semiconductor components sensitive to infrared radiation, light, electromagnetic radiation of shorter wavelength or corpuscular radiation and specially adapted either for the conversion of the energy of such radiation into electrical energy or for the control of electrical energy by such radiation
    • H01L27/144Devices controlled by radiation
    • H01L27/146Imager structures
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L27/00Devices consisting of a plurality of semiconductor or other solid-state components formed in or on a common substrate
    • H01L27/14Devices consisting of a plurality of semiconductor or other solid-state components formed in or on a common substrate including semiconductor components sensitive to infrared radiation, light, electromagnetic radiation of shorter wavelength or corpuscular radiation and specially adapted either for the conversion of the energy of such radiation into electrical energy or for the control of electrical energy by such radiation
    • H01L27/144Devices controlled by radiation
    • H01L27/146Imager structures
    • H01L27/14601Structural or functional details thereof
    • H01L27/1462Coatings
    • H01L27/14621Colour filter arrangements
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L27/00Devices consisting of a plurality of semiconductor or other solid-state components formed in or on a common substrate
    • H01L27/14Devices consisting of a plurality of semiconductor or other solid-state components formed in or on a common substrate including semiconductor components sensitive to infrared radiation, light, electromagnetic radiation of shorter wavelength or corpuscular radiation and specially adapted either for the conversion of the energy of such radiation into electrical energy or for the control of electrical energy by such radiation
    • H01L27/144Devices controlled by radiation
    • H01L27/146Imager structures
    • H01L27/14601Structural or functional details thereof
    • H01L27/14625Optical elements or arrangements associated with the device
    • H01L27/14627Microlenses
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/257Colour aspects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/296Synchronisation thereof; Control thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/45Cameras or camera modules comprising electronic image sensors; Control thereof for generating image signals from two or more image sensors being of different type or operating in different modes, e.g. with a CMOS sensor for moving images in combination with a charge-coupled device [CCD] for still images
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/50Constructional details
    • H04N23/55Optical parts specially adapted for electronic image sensors; Mounting thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/67Focus control based on electronic image sensor signals
    • H04N23/672Focus control based on electronic image sensor signals based on the phase difference signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N25/00Circuitry of solid-state image sensors [SSIS]; Control thereof
    • H04N25/10Circuitry of solid-state image sensors [SSIS]; Control thereof for transforming different wavelengths into image signals
    • H04N25/11Arrangement of colour filter arrays [CFA]; Filter mosaics
    • H04N25/13Arrangement of colour filter arrays [CFA]; Filter mosaics characterised by the spectral characteristics of the filter elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N25/00Circuitry of solid-state image sensors [SSIS]; Control thereof
    • H04N25/70SSIS architectures; Circuits associated therewith
    • H04N25/703SSIS architectures incorporating pixels for producing signals other than image signals
    • H04N25/704Pixels specially adapted for focusing, e.g. phase difference pixel sets
    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B5/00Optical elements other than lenses
    • G02B5/30Polarising elements
    • G02B5/3025Polarisers, i.e. arrangements capable of producing a definite output polarisation state from an unpolarised input state
    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B5/00Optical elements other than lenses
    • G02B5/30Polarising elements
    • G02B5/3025Polarisers, i.e. arrangements capable of producing a definite output polarisation state from an unpolarised input state
    • G02B5/3058Polarisers, i.e. arrangements capable of producing a definite output polarisation state from an unpolarised input state comprising electrically conductive elements, e.g. wire grids, conductive particles
    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03BAPPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
    • G03B11/00Filters or other obturators specially adapted for photographic purposes
    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03BAPPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
    • G03B35/00Stereoscopic photography
    • G03B35/08Stereoscopic photography by simultaneous recording
    • G03B35/10Stereoscopic photography by simultaneous recording having single camera with stereoscopic-base-defining system
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/66Remote control of cameras or camera parts, e.g. by remote control devices

Definitions

  • the present invention relates to an imaging device.
  • the conventional methods for capturing 3D images have the following problems. (1) When viewing a video on a head mounted display, if the line connecting the user's eyes becomes oblique or vertical due to tilting the neck, etc., the camera position at the time of shooting will differ and it will be difficult to obtain appropriate parallax. Become. (2) If the optical size of each of the two cameras is increased to obtain high image quality, the overall size of the camera system increases. (3) A blind spot occurs at a close distance between lenses of a large camera.
  • the present invention has been made in view of these problems, and one object is to provide an improved technique for providing a suitable three-dimensional image.
  • an imaging device is a first imaging unit that images a subject, and a second imaging unit installed at a peripheral position of the first imaging unit and that images the subject. Generating data for output based on a plurality of second imaging units having a smaller optical size than the first imaging unit, an image captured by the first imaging unit, and an image captured by the plurality of second imaging units And an image processing unit.
  • FIG. 6 It is a figure which shows notionally the structure of the imaging device in related technology. It is a figure which shows the structural example of the pixel with which the related art imaging device is provided. It is a figure which illustrates the pixel arrangement in the related art imaging device. It is a figure which shows the outline of the structure of the image sensor in related technology. In related art, it is a figure for demonstrating the principle which acquires distance information by phase difference. It is a figure for demonstrating the relationship between the image acquired by related technology, and a focal distance. It is a figure which shows typically the relationship of the focal distance in the case of FIG. 6, and a phase difference. It is a figure which shows the functional block of the image processing part in related technology.
  • FIG. 21 (a) is a view schematically showing the arrangement of cameras in the prior art
  • FIG. 21 (b) is a view schematically showing the arrangement of the cameras in the first embodiment
  • FIG. 22 (a) is a view schematically showing an arrangement of cameras in the related art
  • FIG. 22 (b) is a view schematically showing an arrangement of cameras in the first embodiment. It is a block diagram which shows the function structure of the imaging device of 1st Example.
  • FIG. 1 is a diagram conceptually showing the structure of the imaging device in the present embodiment.
  • the imaging device 12 includes an imaging optical system 14, an aperture 18, an imaging element 20, and an image processing unit 22.
  • the imaging optical system 14 has a general configuration including a focusing lens for forming an image of a subject on an imaging surface of the imaging device 20. In the drawing, one lens is shown as representative.
  • the diaphragm 18 has an opening and has a general configuration for adjusting the amount of incident light by changing its aperture.
  • the imaging device 20 includes a two-dimensional array of pixels, converts the intensity of incident light into a charge, and outputs the charge to the image processing unit 22.
  • the pixel in this embodiment mode has a structure in which at least a microlens, a polarizer, and a photodiode are integrally stacked.
  • a phase difference image obtained by dividing incident light into two images is obtained.
  • a region corresponding to one microlens is referred to as one pixel region.
  • a plurality of photodiodes are provided for one pixel.
  • the photodiode is a representative example of a mechanism for converting the intensity of incident light into charge
  • the present invention is not limited to this. That is, even if any photoelectric conversion mechanism is employed instead of the photodiode, the present embodiment can be realized similarly, and one unit mechanism for converting light into charge can be used instead of each photodiode.
  • the polarizer may be provided to all the pixels, or may be provided discretely to some of the pixels.
  • the image processing unit 22 performs image processing using the two-dimensional distribution of the luminance of light output from the imaging device 20, and generates a general color image and a distance image representing the distance to the subject as a pixel value.
  • the imaging device 12 may be further provided with an operation unit by the user and a mechanism for executing an imaging operation, an adjustment operation of imaging conditions, and the like according to the content of the operation.
  • the imaging device 12 establishes a communication with an external information processing device such as a game machine by wire or wireless, and has a mechanism for transmitting generated data and receiving control signals such as a data transmission request. Good. However, since these mechanisms may be similar to those of a general imaging device, the description thereof is omitted.
  • FIG. 2 shows an example of the structure of a pixel included in the imaging device 12.
  • the figure schematically shows the functional structure of the element cross section, and detailed structures such as interlayer insulating films and wirings are omitted. Further, in the drawing, the cross-sectional structure of two adjacent pixels is illustrated.
  • the pixel 110 includes a microlens layer 112, a color filter layer 114, a polarizer layer 116, and a photoelectric conversion layer 118.
  • the microlens layer 112 is provided for each pixel and condenses the light incident through the diaphragm 18.
  • the color filter layer 114 transmits light of a different color for each pixel.
  • the polarizer layer 116 includes a wire grid type polarizer in which a plurality of linear conductor members, for example, members (wires) such as tungsten and aluminum are arranged in stripes at intervals smaller than the wavelength of incident light.
  • Polarized luminance is obtained by converting the transmitted polarization component into a charge in the photoelectric conversion layer 118.
  • An image acquisition technique using a wire grid type polarizer as illustrated is disclosed, for example, in Japanese Patent Application Laid-Open No. 2012-80065 and the like.
  • the element structure of the imaging device 12 in the present embodiment is not limited to that illustrated.
  • the polarizer is not limited to the wire grid type, and may be any practical one such as a linear dichroism polarizer.
  • a cross section of the wire extending in the depth direction of the drawing is shown as a polarizer, but the principal axis angle of the polarizer is four, and the direction of the wire is different accordingly.
  • the polarizer layer 116 may have regions with and without a polarizer depending on the pixel. In the region where the polarizer is not provided, the light transmitted through the color filter layer 114 is incident on the photoelectric conversion layer 118 as it is.
  • the photoelectric conversion layer 118 includes a general photodiode and outputs incident light as a charge. As described above, in this embodiment, by providing a plurality of photodiodes for one microlens, light transmitted through different regions of the focusing lens is separately converted into charges.
  • a technique for performing focus detection based on the phase difference of light detected in this manner is put to practical use as a method of phase difference autofocus (see, for example, Japanese Patent Application Laid-Open No. 2013-106194).
  • the distance to the subject is acquired using the phase difference. If the detection values of a plurality of photodiodes provided in one pixel are summed, the luminance for one pixel in a general imaging device can be obtained. That is, according to the configuration of the pixels shown in FIG. 2, a general color image, a distance image, and a polarization image can be obtained simultaneously.
  • FIG. 3 exemplifies a pixel array in the imaging device 20.
  • the figure schematically shows a combination of layers when a partial region of the imaging device 20 is viewed from the top, and a vertically long rectangle indicates one photodiode (for example, the photodiode 120).
  • the pair of left and right two photodiodes correspond to one pixel (for example, pixel 122).
  • the color filters in the color filter layer 114 are arranged in a Bayer pattern, and any of red, green and blue light is detected for each pixel. In the figure, they are indicated by the letters "R", "G” and "B" respectively.
  • polarizers are provided in the pixels 124 a and 124 b shown by thick lines.
  • the thick diagonal lines in these pixels 124a and 124b indicate the wires that make up the polarizer. That is, the pixels 124a, 124b are provided with polarizers of different principal axis angles. Although two types of polarizers whose main axis angles are orthogonal to each other are illustrated in the figure, another pixel is used to provide four types of polarizers having main axis angles every 45 degrees.
  • Each polarizer transmits polarization components in a direction orthogonal to the direction of the wire.
  • the photodiode provided in the lower layer outputs a charge representing the luminance of the polarized light component in four directions at 45 ° intervals.
  • detection values from two photodiodes provided in one pixel may be summed.
  • the pixel provided with the polarizer is a green pixel.
  • the pixels provided with the polarizer can be made relatively close to each other, and it is possible to obtain polarization luminance of a plurality of azimuths of the same color with high resolution.
  • a polarization image of four directions can be obtained by separating and interpolating this for each polarization direction.
  • the polarization image it is possible to obtain the normal vector of the object surface.
  • the normal vector represents the inclination of a minute area on the surface of the subject, and this can be used to interpolate the distance value at the feature point obtained based on the phase difference. Since the distance value and the normal vector due to the phase difference are simultaneously obtained from the photographed images of the same viewpoint by the same imaging device 12, accurate interpolation can be realized without the need for alignment and the like.
  • the color filter layer 114 may be removed from the pixel 110.
  • the color filter may be a dye-based filter such as cyan or magenta.
  • the arrangement shown in FIG. 3 is merely an example, and the pixel arrangement of this embodiment is not limited to this.
  • the density of pixels provided with a polarizer may be further increased, or polarizers may be provided in all the pixels.
  • FIG. 4 shows the outline of the structure of the image sensor in the present embodiment.
  • the image sensor 170 includes a pixel unit 172, a row scanning unit 174 as a peripheral circuit, a horizontal selection unit 176, a column scanning unit 180, and a control unit 178.
  • the pixel section 172 is formed by arranging the pixels as shown in FIG. 2 in a matrix.
  • Each photodiode in the photoelectric conversion layer 118 is connected to the row scanning unit 174 for each row, the horizontal selection unit 176 for each column, and the column scanning unit 180.
  • the row scanning unit 174 is configured by a shift register, an address decoder, and the like, and drives each pixel row by row.
  • the signal output from the pixel selectively scanned by the row scanning unit 174 is supplied to the horizontal selection unit 176.
  • the horizontal selection unit 176 is configured by an amplifier, a horizontal selection switch, and the like.
  • the column scanning unit 180 is configured of a shift register, an address decoder, and the like, and drives in order while operating each horizontal selection switch of the horizontal selection unit 176.
  • the signal from each pixel supplied to the horizontal selection unit 176 is output to the outside by the selective scanning by the column scanning unit 180.
  • the control unit 178 generates a timing signal, and controls the drive timing of the horizontal selection unit 176, the column scanning unit 180, and the like.
  • the peripheral circuit as illustrated may be divided into two depending on the presence or absence of a polarizer so that the timing and interval of data reading can be controlled independently.
  • the frame rate of the pixel including the polarizer may be increased.
  • it is possible to increase the detection sensitivity of the movement of the surface of the subject by obtaining the distribution of the normal vector at a high frequency using the luminance distribution of polarized light output at a high rate. How to control the timing of data reading may be determined according to the processing content of the subsequent stage, the required detection sensitivity, and the like.
  • FIG. 5 is a diagram for explaining the principle of acquiring distance information by phase difference.
  • This figure shows a state in which the light from the subject 130 enters the imaging surface 134 of the imaging device 20 through the focusing lens 132 of the imaging optical system 14 as viewed from the upper side of the imaging space.
  • the states (a), (b) and (c) it is assumed that the distances from the imaging surface 134 to the subject 130 are different, and the subject 130 in the state (b) is at the in-focus position, that is, the focusing surface 138.
  • the light emitted from one point of the subject 130 forms an image at one point on the imaging surface 134 as illustrated. Therefore, one point of the subject 130 corresponds to one pixel, and even if two photodiodes are provided in one pixel, the luminous flux detected by them is from substantially the same point of the subject 130.
  • the position where the light forms an image is the imaging surface 134 It slips away.
  • the photodiode on the left side for example, the photodiode 138a
  • the photodiode on the right side for example, the photodiode 138b
  • phase difference images two images in which the luminances detected by the left photodiode and the right photodiode are pixel values are referred to as “phase difference images”, and the shift amount of the image of the same object in both is referred to as “phase difference”.
  • FIG. 6 is a diagram for explaining the relationship between an image acquired in the present embodiment and a focal length.
  • the figure schematically shows a phase difference image when the space in which the face and the cube exist is photographed.
  • the left and right images the left is detected by the left photodiode and the right is detected by the right photodiode.
  • a phase difference of (A'-A) occurs in the cube image.
  • (B) is the case where the cube is in focus. In this case, the cube image is at a distance A from the left edge of the image in both of the phase difference images, and there is no phase difference.
  • there is a B'-B phase difference in the image of the face there is a B'-B phase difference in the image of the face.
  • the phase difference may take a negative value because the direction in which the object deviates is reversed depending on whether the object is closer or farther than the focal distance.
  • FIG. 7 schematically shows the relationship between the focal length and the phase difference in the case of FIG.
  • the solid line in the figure shows the phase difference of the face, and the broken line shows the phase difference of the cube as a change with respect to the focal length.
  • the characteristics of the phase difference are not limited to those illustrated, due to various factors of the optical system.
  • the focal length is F1
  • the phase difference of the face is 0, and the cube has a phase difference of A'-A.
  • the focal length is F2
  • the phase difference of the cube is 0, and the face has a phase difference of B'-B.
  • the phase difference is uniquely determined by the focal length.
  • the focal length can be obtained similarly to the focusing function in a general imaging device.
  • the relationship between the distance of the subject from the focal distance (focus plane) and the phase difference is prepared in advance as a table that is experimentally obtained from an image obtained by actually shooting a subject at a known distance.
  • the distance from the imaging surface to the subject can be calculated by obtaining the distance from the focal plane based on the observed phase difference and further adding the focal length.
  • the brightness of light observed through the polarizer changes with the main axis angle ⁇ pol of the polarizer as in the following equation.
  • I max and I min are the maximum value and the minimum value of the observed luminance, respectively, and ⁇ is the polarization phase. If to shaft angle theta pol four types as described above were obtained polarization image, the brightness I of pixels at the same position will satisfy the formula 1 for each spindle angle theta pol. Therefore, I max , I min , and ⁇ can be obtained by approximating a curve passing through those coordinates (I, ⁇ pol ) to a cosine function using a least squares method or the like. The degree of polarization ⁇ is determined by the following equation using I max and I min thus determined.
  • the normal to the object surface can be expressed by an azimuth angle ⁇ that represents the angle of the light incident surface (emission surface in the case of diffuse reflection) and a zenith angle ⁇ that represents the angle on the surface.
  • the spectrum of reflected light is represented by a linear sum of the spectrum of specular reflection and diffuse reflection.
  • specular reflection is light that is specularly reflected on the surface of an object
  • diffuse reflection is light that is scattered by pigment particles that make up the object.
  • the above-mentioned azimuth angle ⁇ is a principal axis angle that gives the minimum luminance I min in Equation 1 in the case of specular reflection, and is a principal axis angle that gives the maximum luminance I max in Equation 1 in the case of diffuse reflection.
  • the zenith angle ⁇ has the following relationship with the degree of polarization s s in the case of specular reflection and the degree of polarization d d in the case of diffuse reflection, respectively.
  • n is the refractive index of the object.
  • the zenith angle ⁇ can be obtained by substituting the degree of polarization ⁇ obtained in Equation 2 into either ⁇ s or d d in Equation 3. From the azimuth angle ⁇ and the zenith angle ⁇ thus obtained, the normal vectors (p x , p y , p z ) are obtained as follows.
  • the normal vector of the object shown in the pixel can be determined from the relationship between the luminance I represented by each pixel of the polarization image and the principal axis angle ⁇ pol of the polarizer, and the normal vector distribution can be obtained as the entire image it can.
  • the normal can be determined with higher accuracy by adopting an appropriate model of specular reflection and diffuse reflection based on the color and material.
  • specular reflection and diffuse reflection since various techniques for separating specular reflection and diffuse reflection have been proposed, such techniques may be applied to obtain the normal more strictly.
  • FIG. 8 shows functional blocks of the image processing unit 22 in the present embodiment.
  • the functional blocks shown in FIG. 17 and FIG. 17 and FIG. 20 described later can be realized as hardware in the configuration of an imaging device, various arithmetic circuits, a microprocessor, a buffer memory, etc. Is realized by the program to be Therefore, it is understood by those skilled in the art that these functional blocks can be realized in various forms by hardware only, software only, or a combination thereof, and is not limited to any of them.
  • the image processing unit 22 acquires two-dimensional data of luminance from the imaging device 20 and performs predetermined preprocessing, a focal length acquisition unit 30 which acquires an actual focal length, and a distance image based on the phase difference.
  • Feature point acquiring unit 34 that generates the normal point image generating unit 36 that generates a normal image from polarization luminance of a plurality of azimuths, and complements the distance value based on the phase difference using a normal vector to generate a distance image
  • the pixel value acquisition unit 32 acquires the luminance signal detected by the imaging device 20 as two-dimensional data, and performs predetermined preprocessing such as A / D conversion and clamping processing.
  • the focal length acquisition unit 30 reads out from the memory the focal length acquired in a focusing function (not shown) included in the imaging device 2 and the like. In an environment where focal length adjustment is possible, the data is read out each time the focal length changes. In an apparatus in which the focal length is fixed, the setting value is obtained in the beginning.
  • the feature point distance acquisition unit 34 includes a phase difference detection unit 46, a distance value acquisition unit 48, and a distance correspondence table 50.
  • the phase difference detection unit 46 separates pixel values detected by the left photodiode and the right photodiode among the pixel values acquired by the pixel value acquisition unit 32, and generates a phase difference image. At this time, all pixels in the Bayer arrangement may be processed, or only green pixels may be processed. Then, the feature points of both are extracted, and the phase difference is acquired for each feature point by specifying the position representing the same feature point in the subject.
  • the distance correspondence table 50 stores a distance correspondence table in which the distance from the focus plane is associated with the phase difference.
  • the distance value acquisition unit 48 refers to the distance correspondence table based on the phase difference acquired by the phase difference detection unit 46, and acquires a distance value corresponding to the phase difference. Then, the absolute value of the distance from the imaging surface is acquired for each feature point by adding to the focal length acquired from the focal length acquisition unit 30.
  • the normal-line image generation unit 36 extracts the value of the pixel provided with the polarizer among the pixel values acquired by the pixel value acquisition unit 32, and further separates and interpolates for each principal axis angle of the polarizer to obtain a plurality of azimuths. Generate a polarized image of At this time, detection values by two photodiodes provided in one pixel are summed up to form one pixel value. Further, by interpolating the polarization luminance of each azimuth, polarization luminances of a plurality of azimuths are acquired for the same position coordinate on the image plane. Then, the normal vector is calculated using Equations 1 to 4 based on the change in polarization luminance with respect to the azimuth.
  • the normal image generation unit 36 generates a normal image having three elements of the normal vector obtained for each pixel as pixel values. This image can basically have the same resolution as the captured image. On the other hand, depending on the normal vector and the resolution required for the subsequent distance image, the normal image may be generated at a lower resolution than the captured image.
  • the distance image generation unit 38 complements the distance value to the feature point generated by the feature point distance acquisition unit 34 using the normal image generated by the normal image generation unit 36 to obtain the pixel of the distance of the object surface. Generate a distance image represented as a value. That is, although the feature point distance acquiring unit 34 can acquire distance values for feature points such as the contour of the image of the subject and the surface pattern whose phase difference is known, it extracts feature points such as a monochrome smooth object surface. It is difficult to calculate the distance of the difficult area.
  • the normal image generation unit 36 can obtain the inclination of the object surface in detail for each minute area. Therefore, the normal vector is obtained by sequentially giving the slope based on the normal vector acquired by the normal image generation unit 36, starting from the distance value at the feature point acquired by the feature point distance acquisition unit 34. The distance can be determined with the same resolution as in.
  • the defect correction unit 40 corrects the pixel value of the pixel provided with the polarizer among the pixel values acquired by the pixel value acquisition unit 32.
  • a pixel provided with a polarizer reflects a polarization component in the same direction as the principal axis angle of the polarizer, light reaching the photodiode has lower intensity than light incident on the imaging surface. Therefore, by correcting the luminance of the pixel to a level similar to that of the surrounding pixels, it is possible to prevent some pixels of the color image from becoming a black point.
  • interpolation may be performed using peripheral pixel values, or the reduction rate of the light amount due to the polarizer may be obtained by experiment etc., and a constant based on that may be multiplied by the corresponding pixel value.
  • the detection values of the pair of photodiodes are summed and handled as one pixel value.
  • the color image generation unit 42 demosaic-processes the image after defect correction to generate a color image in which one pixel has three color values. That is, by interpolating the pixel values obtained in the Bayer arrangement as shown in FIG. 3 for each color, all the pixels have three elements. General demosaicing techniques can be applied to this process.
  • the output unit 44 acquires at least the data of the distance image generated by the distance image generation unit 38 and the data of the color image generated by the color image generation unit 42, and sequentially transmits the data to an external device.
  • the output unit 44 may temporarily store the data in a memory, a recording medium, or the like, and transmit the data to an external device at an appropriate timing according to a user operation or the like, or the user can carry it out.
  • various information processing can be performed accurately using them. For example, since the position of the subject in the three-dimensional space is known along with the color, they can be once arranged in the virtual space, and the display image can be reconstructed according to the viewpoint of the user wearing the head mounted display. At this time, virtual reality and augmented reality can be realized by generating an image for the left viewpoint and an image for the right viewpoint and displaying the display screen of the head mounted display in the left and right areas divided into two.
  • the output unit 44 may further output the normal image generated by the normal image generation unit 36.
  • the information on the normal line can be used for motion detection because it represents a change in the posture of the subject with higher sensitivity than the image of the subject itself.
  • the image processing unit 22 of the imaging device 12 can generate the distance image together with the color image, the load of the information processing apparatus that performs various processes using it can be suppressed, and Power consumption can be reduced.
  • At least one of the distance image generation unit 38, the feature point distance acquisition unit 34, and the normal image generation unit 36 may be provided in an information processing apparatus other than the imaging apparatus 12.
  • a logic circuit having at least a part of the functions as illustrated may be provided in the lower layer of the pixel array to be a stacked image sensor.
  • FIG. 9 schematically shows the transition of a photographed image in the image processing unit 22.
  • the pixel value acquisition unit 32 acquires data of a captured image such as the image 220.
  • a cube is shown as a subject.
  • the data to be acquired strictly includes information on the brightness of natural light or polarized light detected by the left photodiode and the right photodiode.
  • the feature point distance acquisition unit 34 acquires the phase difference of the feature point as described above, and generates data 222 of the distance value for the feature point from it and the focal length.
  • the data 222 shown in the figure is expressed in the form of a distance image in which the higher the distance value is, the higher the brightness is, and the place where the distance value is not obtained is the lowest brightness.
  • FIG. 3 when a pair of photodiodes are disposed on the left and right with respect to the area of one pixel, the phase difference appears in the horizontal direction of the image plane. Therefore, as shown in data 222, an accurate phase difference can not be specified for the edge in the horizontal direction, and the distance value is also indefinite.
  • the normal image generation unit 36 generates a normal image 224 using polarization images of a plurality of directions.
  • a part of the distribution of normal vectors of the cube surface is indicated by arrows, but in practice the normal vectors can be determined in pixel units.
  • the distance image generation unit 38 applies the inclination of the surface based on the normal vector in pixel units, starting from the distance of the edge portion obtained by the data 222 of the distance value based on the phase difference.
  • the distance between the edges in the data 222 is a plane, and the distance value of the surface including the horizontal edge portion where the distance value can not be obtained.
  • position information 226 in the world coordinate system can be acquired for a portion of the cube surface that is viewed as a captured image.
  • the distance image generation unit 38 may generate information related to the position coordinates of the object surface in such a three-dimensional space, or may generate a distance image in which the distance value is represented on the image plane.
  • FIG. 10 is a flowchart showing a processing procedure in which the image processing unit 22 in the present embodiment generates and outputs various data from the captured image.
  • the pixel value acquisition unit 32 acquires, from the imaging device 20, data of luminance detected by each photodiode (S10).
  • the obtained luminance data is supplied to the feature point distance acquisition unit 34, the normal image generation unit 36, and the defect correction unit 40.
  • the feature point distance acquisition unit 34 separates the luminance detected by the left photodiode and the right photodiode to generate a phase difference image, and acquires the phase difference by correlating the feature points (S14). Then, based on the phase difference and the focal length, the distance value for the pixels constituting the feature point is specified (S16).
  • the normal image generation unit 36 generates polarization images of a plurality of azimuths by extracting values of pixels detecting polarization and separating and interpolating the values for each principal axis angle of the polarizer (S18). Then, by acquiring the azimuth dependency of the polarization luminance at the same position, a normal vector is calculated for each pixel or in a unit larger than that, and a normal image is generated (S20).
  • the distance image generation unit 38 generates a distance image in which the distance value is complemented by obtaining the distance value using the normal image at a position where the distance value is not obtained by the phase difference (S22).
  • the defect correction unit 40 performs defect correction to amplify the luminance level of the pixel whose polarization is detected so as to be the same level as the other pixels (S24).
  • the color image generation unit 42 generates a color image by demosaicing the image of the corrected Bayer array (S26).
  • the output unit 44 sequentially outputs the data of the color image and the distance image to an external device or a memory (S28). At this time, data of the normal image may be output simultaneously.
  • the output target may be switched according to the request from the output destination device. If it is not necessary to end photographing or data output by a user operation or the like, the processing from S10 to S28 is repeated for each image frame (N in S30). If it is necessary to end the process, all the processes are ended (Y in S30).
  • the distance image generation unit 38 When the distance image generation unit 38 generates a distance image in S22, the distance images generated for a predetermined number of plural image frames are accumulated, and data obtained by averaging them is used as the distance image at that time.
  • the output may be performed at time intervals corresponding to a plurality of image frames. As a result, the ratio of noise components included in the distance image generated from one image frame can be reduced, and a distance image with high accuracy can be output.
  • the optimum number of frames for storing the distance image is determined by experiment or the like in consideration of the required accuracy and time resolution. Alternatively, the number of frames may be adaptively changed according to the luminance level of the actual captured image or the like.
  • the imaging device of this embodiment includes a structure in which a polarizer is provided on the upper layer of the pair of photodiodes.
  • a polarizer is provided on the upper layer of the pair of photodiodes.
  • FIG. 11 is a diagram for explaining the positional relationship between the polarizer and the photodiode. The figure shows a cross section of the laminated structure of the polarizer layers 230a, 230b, 230c and the photodiode pairs 232a, 232b, 232c and their positional relationship 234a, 234b, 234c viewed from the top.
  • FIG. 12 schematically shows a wire arrangement of polarizers at different positions on the imaging surface.
  • the shape of the polarizer is changed according to the position on the imaging device 20 to make the detection sensitivity in the photodiode uniform.
  • the loss of incident light is reduced by narrowing the wire width of the polarizer of the pixels 240b and 240c in the peripheral portion as compared to the pixel 240a in the central portion.
  • the wire width is gradually narrowed according to the distance from the center.
  • the wire height may be lowered or both the width and height may be changed according to the distance from the center.
  • the entire arrangement of the wires may be shifted by a small amount in line symmetry with respect to the center line.
  • the pixel 240b on the left side on the imaging device 20 shifts the entire wire array to the left
  • the pixel 240c on the right side shifts the entire wire array to the right.
  • the amount of incident light can be increased according to the angle.
  • the width, height, and shift amount of the wire optimize the values so as to minimize the in-plane distribution in the actual photographed image. At this time, as described in FIG. 11, the sensitivity difference between the pair of photodiodes is also minimized.
  • FIG. 13 and FIG. 14 are diagrams for explaining the unit of data and the generation path of various information in the case of making the reading unit different depending on the presence or absence of the polarizer.
  • each detection value is summed up and used as a pixel unit value 266 (S54) to be used for generating a polarized image or to determine the color value of the pixel in a color image (S56, S58) ).
  • polarization information and phase difference information are acquired only from the pixel provided with the polarizer.
  • the detection values summed up in the pixel 262 provided with a polarizer are used as they are for generating a polarization image or for determining the color value of the pixel in a color image (S66, S68).
  • the phase difference information is acquired from other than the pixel provided with the polarizer.
  • the sensitivity of the phase difference information can be increased as compared with the case of FIG. 13, the accuracy can be maintained even in an environment where the illuminance is low. By thus changing the reading unit depending on the presence or absence of the polarizer, it is possible to reduce the reading time while acquiring necessary information.
  • the value of a pixel provided with a polarizer may not be used to generate a color image, and pixel values in the periphery without a polarizer may be interpolated.
  • the reading unit and the data generation path may be optimized according to the accuracy and resolution required for various data, the surrounding illumination environment, the limitation of processing time, and the like.
  • the illuminance may be measured or the communication environment for data transmission may be measured, and switching may be performed according to the result.
  • FIG. 15 shows variations of polarizers at pixel values for which polarizers are provided.
  • polarizers with one main axis angle are provided for one pixel as described above. And, by changing the main axis angle every 45 °, four types of pixels as illustrated are obtained. These pixels are arranged at equal intervals or in proximity to each other on the imaging device 20. Since dispersing pixels where a polarizer is provided disperses pixels whose luminance level is lowered due to reflection, when a phase difference image or a color image is generated by pixels which are not provided with a polarizer, holes are accurately filled by interpolation. Can.
  • the entire imaging device 20 with pixels as shown in (b).
  • polarizers having different principal axis angles are provided in each of the regions corresponding to the pair of photodiodes.
  • two types of pixels are illustrated, each of which is a pair of polarizers whose principal axis angles differ by 90 °.
  • the process of acquiring the distance value from the phase difference is based on comparing the distributions of detection values by the left and right photodiodes.
  • the process of acquiring a normal vector from polarization information includes a process of comparing detected values of light transmitted through polarizers having different principal axis angles. Therefore, in the case of using a polarizer as shown in (c), the processing for acquiring the phase difference and the processing for acquiring the normal can be shared in that the detection values of the left and right photodiodes are compared.
  • FIG. 16 shows a variation of the photodiode provided in one pixel.
  • the photodiodes are arranged one by one in the left and right areas obtained by dividing the pixel area in the vertical direction.
  • the phase difference appears only in the horizontal direction of the image plane. Therefore, as described in FIG. 9, the phase difference becomes indeterminate with respect to some feature points such as an edge in the horizontal direction, and the distance value can not be obtained. Therefore, as illustrated, one photodiode may be disposed in each of four regions formed by dividing one pixel (for example, the pixel 280) into two in the vertical and horizontal directions.
  • the detection values of two vertically adjacent photodiodes are summed, the same phase difference image as that of the left photodiode and the right photodiode described above can be obtained, and the phase difference of the horizontal direction component can be acquired.
  • the detection values of two adjacent photodiodes are summed, a phase difference image can be obtained by the upper photodiode and the lower photodiode, and the phase difference of the vertical direction component can be acquired. As a result, the distance value can be obtained regardless of the direction of the feature point.
  • a polarizer with one principal axis angle is provided in each pixel, but as shown in FIG. 15, the principal axis angle of the polarizer is made different for each photodiode, and the presence or absence of the polarizer is controlled.
  • a photodiode may be provided for each of the four divided regions also for the pixel without a polarizer. Such non-polarizer pixels and certain pixels may be periodically arranged.
  • the color of the color filter may be the same in the pixel, or may be different for each photodiode.
  • one photodiode may be provided in each of the upper and lower areas divided in the lateral direction, or the pixel area may be divided into smaller than two rows and two columns, and the photodiodes may be arranged in each area.
  • FIG. 17 shows the configuration of functional blocks of the system when the imaging device is configured by a stereo camera.
  • This system includes an imaging device 300 and an information processing device 302.
  • the imaging device 300 includes a first imaging unit 12a and a second imaging unit 12b.
  • the first imaging unit 12a and the second imaging unit 12b correspond to the imaging device 12 shown in FIG. 1, respectively, and arrange them in the left and right so as to have a predetermined interval, thereby forming an imaging device 300.
  • the first imaging unit 12a is a left viewpoint
  • the second imaging unit 12b is a right viewpoint camera.
  • Each of the first imaging unit 12a and the second imaging unit 12b includes an image processing unit having the function shown in FIG. Therefore, the first imaging unit 12a of the imaging device 300 outputs the data of the distance image and the color image of the left viewpoint, and the second imaging unit 12b outputs the data of the distance image and the color image of the right viewpoint.
  • the information processing apparatus 302 acquires an image data acquisition unit 304 that acquires image data from the imaging apparatus 300, a subject information generation unit 306 that integrates the information to generate comprehensive information related to the position and orientation of the subject, and the information And an output data generation unit 308 that generates output data using the
  • the image data acquisition unit 304 acquires, from the imaging device 300, data of distance images and color images acquired for at least each of the left and right viewpoints.
  • the subject information generation unit 306 generates final information on the position, posture, shape, and the like of the subject by integrating the distance images acquired from the imaging device 300. That is, with respect to a portion of the subject which can not be seen from one of the viewpoints of the first imaging unit 12a and the second imaging unit 12b, data is compensated using the other distance image to minimize the portion where the distance is indefinite. .
  • the subject information generation unit 306 may further generate and integrate a distance image separately according to the principle of triangulation using color images of left and right viewpoints or luminance images of left and right viewpoints.
  • the output data generation unit 308 generates data to be output, such as a display image, using the color image and the distance image of the left and right viewpoints.
  • general processing such as linear matrix (color matrix) and gamma correction is performed at the time of output, and output to the display device.
  • FIG. 18 is a diagram for describing processing in which the subject information generation unit 306 integrates distance images of left and right viewpoints. As shown in the upper part of the figure, when the three-dimensional space 320 in which two cubes 322a and 322b exist is photographed from the left and right viewpoints L and R, a left viewpoint image 324a and a right viewpoint image 324b are obtained.
  • the area where the first imaging unit 12a and the second imaging unit 12b can independently obtain distance values is limited to a portion appearing as an image in the left viewpoint image 324a and the right viewpoint image 324b, respectively.
  • the left side of the cube 322b is seen only from the left viewpoint L
  • the right side of the cube 322a is seen only from the right viewpoint R, so their distance values are included in only one of the distance images. Therefore, the subject information generation unit 306 reduces the area where the distance value is indeterminate by applying the value of the other distance image to the area on the subject whose value is not obtained in one of the distance images.
  • the subject information generation unit 306 can generate information related to the position of the subject in the world coordinate system whose number of viewpoints is not limited to one by integrating the distance images of the plurality of viewpoints. The position is obtained for each minute area on the surface of the subject, and as a result, the posture and the shape of the subject are also obtained.
  • the accuracy can be enhanced by using the average value of them as the distance value.
  • the subject information generation unit 306 may itself generate a distance image using color images of left and right viewpoints, and may further integrate the results. In this case, further distance values can be obtained for regions viewed from both viewpoints, and as a result, three distance values can be obtained for the regions. If the average value of them is used as the distance value, the accuracy can be further improved. However, depending on the required accuracy, the processing time can be shortened by omitting the generation of a distance image using a color image.
  • the subject information generation unit 306 may further fill in the hole of the distance value by another means or further improve the accuracy.
  • a deep learning technique is being put to practical use as machine learning using a neural network.
  • the subject information generation unit 306 is made to learn so that the distance value and the change thereof can be derived from the color in the color image and the change thereof, the shape of the image, and the like. Then, using the color image that is actually acquired, the distance value of the region that can not be seen from the viewpoint of the imaging device may be estimated, or the distance value of the viewed region may be corrected to improve the accuracy.
  • this method is provided with a subject information generation unit having the same function in an information processing apparatus (not shown) connected to the imaging device 12. It is also good. This function is particularly effective in expanding the area where the distance value can be obtained or enhancing the accuracy in the case where the viewpoint of the imaging device is limited or the photographing environment where the luminance is not sufficient.
  • the function of the information processing apparatus 302 including the subject information generation unit 306 or a part of the functions of the imaging apparatus 300 may be provided to another apparatus connected to the network or a plurality of apparatuses may share the operation. You may do it. At this time, the information processing apparatus 302 or a display apparatus (not shown) may sequentially acquire the results, and appropriately perform its own processing or display an image accordingly.
  • FIG. 19 is a diagram for describing a method of acquiring state information such as the position, posture, and shape of a subject in a three-dimensional space by shooting while moving the imaging device 12.
  • the illustrated example shows how the imaging device 12 is moved along a circular orbit centered on a cube that is a subject.
  • an acceleration sensor is provided in the imaging device 12, and the imaging time, the captured image, and the position and orientation of the imaging device 12 in a three-dimensional space are associated with each other and recorded. Then, based on the color image and the distance image obtained for the viewpoint at each shooting time of a predetermined rate, a model space such as the three-dimensional space 320 of FIG. 18 is filled with the acquired data.
  • Such processing may be performed by the distance image generation unit 38 inside the imaging device 12 or may be performed by the subject information generation unit 306 of the information processing device 302.
  • the processing load on the information processing apparatus 302 can be reduced, and an increase in processing time can be suppressed.
  • how to move the imaging device 12 is not limited to that illustrated.
  • the imaging device 12 may be moved in a range corresponding to the movable range of the virtual viewpoint with respect to the image to be finally displayed.
  • the photographed image may be obtained in all directions by rotating the imaging device 12. Further, among the data acquired while moving the imaging device 12 as described above, memory consumption can be suppressed by devising that only the value for the feature point is accumulated for the distance value.
  • the imaging device 12 instead of moving the imaging device 12, similar information can be obtained by arranging three or more photographed images. Also in this case, the plurality of imaging devices 12 are installed to face each other so that the optical axis converges in the vicinity of the subject, as illustrated. Alternatively, the imaging device 12 may be installed in the opposite direction so that the optical axis diverges outward. In these cases, color images and range images at the same time can be obtained in a plurality of fields of view. It may be connected by stitching processing to obtain wide-angle information. At this time, only a part of the plurality of installed imaging devices may be the imaging device 12 having the functional block shown in FIG.
  • a function of generating a distance image is provided, and the other imaging apparatuses generate only a color image.
  • processing resources can be concentrated on necessary targets, such as processing at a later stage such as processing and superimposing virtual objects with high accuracy.
  • FIG. 20 shows functional blocks of an imaging apparatus having a function of focusing using a phase difference of polarization.
  • the imaging device 400 includes a pixel value acquisition unit 402 for acquiring detection values by each photodiode, a polarization phase difference detection unit 404 for detecting a phase difference of a polarization image from detection values by two photodiodes of pixels provided with a polarizer. And a focusing unit 406 that adjusts the position of the lens based on the phase difference of polarization and focuses on the appropriate position.
  • the pixel value acquisition unit 402 reads out a detection value by a photodiode in at least a pixel provided with a polarizer, and performs predetermined preprocessing such as A / D conversion and clamping processing.
  • the polarization phase difference detection unit 404 separates the polarization luminance distribution detected by the left photodiode and the right photodiode, and generates polarization images of four directions for each. Then, a polarization degree image representing the polarization degree obtained using Expression 2 on the image plane or a normal image representing the normal vector obtained from the polarization degree on the image plane are generated as a phase difference image.
  • the figure shows the phase contrast images 410a, 410b with polarization generated as such.
  • general natural light phase difference images 412 a and 412 b are shown for comparison.
  • a disk-shaped object is shown.
  • the outlines of the subject are obtained as feature points in the general natural light phase difference images 412a and 412b, while the information on the subject surface is scarce.
  • the change in luminance may be small and may not be regarded as a feature point. Therefore, when specifying the position of the feature point of these images 412a and 412b as shown by the arrow and focusing from the phase difference, it is conceivable that accurate adjustment can not be performed due to the lack of information.
  • the phase difference images 410a and 410b representing the degree of polarization or the normal vector represent the unevenness of the object surface, so they have higher sensitivity to the shape than the image of natural light and are less susceptible to illumination. Therefore, even if it looks like a uniform image, changes corresponding to the shape appear as an image as shown. Therefore, as indicated by the arrows, more positions of feature points on which the phase difference is based can be obtained. If these positional relationships are integrated to derive a phase difference and focusing is performed based thereon, more accurate and quick adjustment can be realized.
  • the focusing unit 406 derives an appropriate position of the lens based on the phase difference and performs adjustment, as in general focusing processing.
  • the illustrated imaging device 400 shows a functional block focusing only on the focusing function, but by combining with the image processing unit 22 shown in FIG. 8, a distance based on luminance data obtained by focusing with high accuracy It may be possible to output an image or a color image.
  • the image pickup device a plurality of photodiodes are provided for one microlens, and a polarizer is provided in an intermediate layer of at least a part of the microlens and the photodiode. Do. Thereby, the polarization image and the phase difference image can be simultaneously acquired. Then, the distance at the feature point of the subject is obtained based on the phase difference, and the distance between the feature points is complemented using the normal vector obtained from the polarization to obtain a distance value with respect to a wide area of the photographed image You can get
  • the distance on the object on the subject which is captured in the image of one viewpoint but not captured in the image of the other viewpoint becomes indefinite.
  • the distance can be derived if it appears in the captured image, so in some cases more distance data can be obtained using a stereo camera. Therefore, it can be used as a substitute for a stereo camera, and the imaging device having a distance measuring function can be miniaturized.
  • the results of the left and right photographed images can be integrated, so that a wider range of distance values can be obtained, and the position and orientation of the subject in three-dimensional space can be accurately reproduced.
  • the accuracy of distance information can be further improved by obtaining and integrating distance images as in the prior art using color images of left and right viewpoints. Since these methods do not depend on light of a specific wavelength band such as infrared light, information can be similarly obtained outdoors.
  • the present invention can be applied to all types of information processing without restriction on the processing of the latter stage.
  • acquisition of distance values based on phase difference generation of a normal image based on polarization, and processing of integrating them to generate a distance image can basically be performed in row units or several units of image planes.
  • the line buffer can be implemented by an arithmetic circuit in the imaging apparatus. Therefore, it is possible to share the function with an apparatus that performs information processing and display processing using various data, and to cope with photographing and display at a high frame rate.
  • phase difference of polarization since it is possible to acquire the phase difference of polarization, it is possible to extract the change of the shape as the feature point with high sensitivity even if the object surface is a rough surface that is not extracted as the feature point in the natural light image. Therefore, it is possible to obtain much information as the basis of the phase difference, and it is possible to further improve the accuracy of the conventional focusing function. Even in the case of a stereo camera, more feature points can be obtained than the luminance image of natural light by using the polarization degree image and the normal image, and thus a distance image by acquiring corresponding points from images of left and right viewpoints The generation accuracy of can also be enhanced.
  • the detection subject is not limited to the photodiode as long as it is a mechanism for converting light into charge.
  • some or all of the photodiodes may be used as the organic photoelectric conversion film.
  • the material and structure of the organic photoelectric conversion film can be appropriately determined by using a known technique described in WO 2014/156659 and the like.
  • a distance measurement technology by irradiating light of a predetermined wavelength band such as infrared light. That is, a mechanism for irradiating the reference light to the imaging device 12 is provided, and the reflected light is detected by the photodiode. By irradiating the reference light in a random pattern, it is possible to create feature points even on the surface of an object with a few feature points.
  • the processing in the image processing unit is the same as that of the present embodiment, but there are many feature points that are the basis of the phase difference, so distance values based on the phase difference can be acquired at more locations. Therefore, the accuracy of the complementation using the normal vector is improved, and the distance information can be obtained more accurately.
  • An illuminance sensor may be further provided in the imaging device 12 to irradiate the reference light when the illuminance is lower than a predetermined value to prevent the deterioration of analysis accuracy due to the illuminance decrease.
  • the imaging device in the present embodiment may be realized by a general camera whose main function is acquisition of a color image, or may be provided in another device having an imaging function.
  • it may be provided in a high-performance mobile phone, a portable terminal, a personal computer, a capsule endoscope, a wearable terminal and the like.
  • the functions of the defect correction unit 40 and the color image generation unit 42 may be omitted, and only the distance image may be output.
  • the color filter layer of the imaging device may be omitted.
  • all pixel regions are divided into partial regions, and photodiodes are arranged respectively.
  • one photodiode is made to correspond to one microlens. May be included.
  • one photodiode may be provided for a pixel provided with a polarizer. In this case, the phase difference image is acquired from the other pixels.
  • a plurality of photodiodes may be provided only for pixels provided with a polarizer. In any case, it is possible to obtain the same effect by omitting the process of summing the detection values described in the present embodiment.
  • Embodiment The embodiment of the present invention can be appropriately combined with the above-described related art.
  • first to fifth examples will be described as embodiments of the present invention.
  • FIGS. 21 (a) and (b) and FIGS. 22 (a) and (b) show the arrangement of cameras in the related art and the arrangement of cameras in the first embodiment in comparison.
  • 21 (a) and (b) and FIGS. 22 (a) and (b) show the appearance of the camera viewed from the front (in other words, the object side), that is, the lens arrangement of the camera is schematically shown. It shows.
  • FIG. 21A schematically shows an arrangement of cameras in the prior art.
  • the two large cameras 502 have an inter-pupil distance IPD (typically 60 mm). ⁇ 70 mm) may have been set apart.
  • IPD inter-pupil distance
  • the size of the imaging device indicated by the broken line in other words, the size of the camera system may be increased, which may cause a problem.
  • FIG. 21B schematically shows the arrangement of the cameras in the first embodiment.
  • a plurality of small cameras 504 for imaging the same subject are provided on the left and right of one large camera 502 for imaging a certain subject.
  • the large camera 502 has a relatively large optical size
  • the small camera 504 has a relatively small optical size.
  • large camera 502 has a larger lens size than small camera 504.
  • images captured by two small cameras 504 provided apart from each other by IPD can be acquired as parallax images, and the image quality of parallax images can be improved using images captured by the large camera 502. it can.
  • FIG. 22 (a) also schematically shows the arrangement of cameras in the prior art.
  • the large cameras 502 need to be arranged in the vertical direction, and the size of the imaging device is further increased.
  • the vertical inter-camera distance may exceed the IPD, ie, problems with size and IPD limitations may have occurred.
  • FIG. 22B also schematically shows the arrangement of the cameras in the first embodiment.
  • a plurality of small cameras 504 are provided on the left, right, upper and lower sides of the large camera 502. According to this aspect, it is possible to obtain upper and lower parallax images in addition to the left and right parallax images while suppressing an increase in the size of the imaging device 500.
  • the imaging apparatus 500 generates a parallax image and / or a wide-angle image to be displayed on a head mounted display (hereinafter, also referred to as “HMD”).
  • FIG. 23 is a block diagram showing a functional configuration of the imaging device 500 of the embodiment.
  • the imaging device 500 includes one large-sized imaging unit 510, two small-sized imaging units 512, and an image processing unit 514.
  • each element described as a functional block that performs various processes can be configured by hardware as a circuit block, a memory, or another LSI, and software can be configured as a memory. It is realized by the program etc. which were loaded to. Therefore, it is understood by those skilled in the art that these functional blocks can be realized in various forms by hardware only, software only, or a combination thereof, and is not limited to any of them.
  • a computer program including a plurality of modules corresponding to a plurality of functional blocks in FIG. 23 may be installed in the imaging device 500 storage.
  • the CPU or GPU of the imaging device 500 may exert the function of each functional block by reading out the computer program to the main memory and executing it.
  • the large image capturing unit 510 corresponds to the large camera 502 in FIG. 21B and captures an image of an object present in front of the image capturing apparatus 500.
  • the subject includes, for example, a three-dimensional space and an object present there.
  • the compact imaging unit 512 corresponds to the compact camera 504 in FIG. 21B and captures an image of the subject.
  • the optical size of the large image pickup unit 510 is larger than the optical size of the small image pickup unit 512, and the large image pickup unit 510 can obtain an image with higher image quality than the small image pickup unit 512.
  • two small imaging units 512 are disposed in proximity to the left and right of the large imaging unit 510.
  • a plurality of small-sized imaging units 512 may be disposed above and below (or at an oblique position) the large-sized imaging unit 510.
  • three or more compact imaging units 512 may be disposed in the direction in which parallax should be obtained.
  • the image processing unit 514 generates data to be output to an external device based on the image captured by the large-sized imaging unit 510 and the image captured by the small-sized imaging unit 512.
  • the image processing unit 514 includes a characteristic storage unit 520, a pixel data acquisition unit 522, an adjustment unit 524, a generation unit 526, and an output unit 528.
  • the characteristic storage unit 520 stores data (hereinafter, also referred to as “characteristic data”) regarding the characteristic of the image captured by the large-size imaging unit 510.
  • the characteristic storage unit 520 stores characteristic data of an image captured by each of the plurality of small-sized imaging units 512.
  • the characteristic data can also be said to be data indicating the characteristic of the pixel value acquired from the imaging element of each imaging unit.
  • the characteristic data may also include data indicating at least one feature or tendency of hue, lightness, and saturation.
  • the characteristic data is data indicating the content or degree of difference when the characteristic of the image picked up by the large image pickup unit 510 and the characteristic of the image picked up by each of the plurality of small image pickup units 512 are different. May be included.
  • the characteristic data stored in the characteristic storage unit 520 may indicate the characteristic calculated from the data after shooting, but the camera (each of the large image pickup unit 510 and the small image pickup unit 512) or the image pickup element In the test process at the time of manufacturing the (image sensor), the characteristics of the image may be measured and stored in the ROM of the camera or the imaging device (characteristic storage unit 520).
  • characteristic measurement in a test process in a test process after manufacturing a single camera or an imaging device, signals from pixels, noises, and the like obtained when lenses, illuminance, wavelengths, and the like are changed may be measured.
  • the deviation of the stitching position, the contrast, and the color difference after combining a plurality of cameras (for example, the large imaging unit 510 and the small imaging unit 512) It may be measured.
  • the pixel data acquisition unit 522 acquires data of an image captured by the large image capturing unit 510, that is, a value of each pixel. In addition, the pixel data acquisition unit 522 acquires data of an image captured by each of the plurality of small-sized imaging units 512, that is, a value of each pixel.
  • the characteristics of the image picked up by the large image pickup unit 510 may be different from the characteristics of the image picked up by each of the plurality of small image pickup units 512.
  • an image captured by the large-sized imaging unit 510 may be reddish, while an image captured by the small-sized imaging unit 512 may be bluish.
  • the color of the image obtained by combining the two images may be unnatural. Therefore, the adjustment unit 524 determines the characteristics of the image captured by the large-sized imaging unit 510 and the characteristics of the images captured by the plurality of small-sized imaging units 512 based on the characteristic data stored in the characteristic storage unit 520. Adjust to match.
  • the adjustment unit 524 matches the characteristics of the image captured by each of the plurality of small-sized imaging units 512 with the characteristics of the image captured by the large-sized imaging unit 510.
  • the images taken by each of the above are corrected.
  • the property storage unit 520 may store property data indicating a difference between the property of the image captured by the large-size imaging unit 510 and the property of the image captured by each of the plurality of small-size imaging units 512.
  • the adjustment unit 524 may adjust the pixel values acquired from each of the plurality of small-sized imaging units 512 so as to offset the difference indicated by the characteristic data.
  • the image of the large-sized imaging unit 510 and the image of the small-sized imaging unit 512 it is possible to generate a natural-looking image based on both images.
  • the image quality is degraded when the image is corrected. Therefore, the high-quality image captured by the large-size imaging unit 510 is corrected by correcting the low-quality image captured by the small-size imaging unit 512 without touching the high-quality image captured by the large-size imaging unit 510. It is possible to suppress the image quality deterioration of the image. As a result, it is possible to suppress the deterioration of the image quality also for the image obtained by combining the image of the large image pickup unit 510 and the image of the small image pickup unit 512. In particular, it is suitable for displaying the image of the large-sized imaging unit 510 inside the field of view of the user (that is, in a region where the resolution of the user's eyes is high).
  • the adjustment unit 524 inputs, to the generation unit 526, data of the image captured by the large-size imaging unit 510 and data of the image captured by each of the plurality of small-size imaging units 512 (data after the above correction).
  • the generation unit 526 generates data to be output to an external device based on the input data of the plurality of types of images. In the embodiment, a VR image, an AR image, or a wide angle image is generated.
  • the output unit 528 transmits the data generated by the generation unit 526 to a predetermined external device (such as an information processing device).
  • the output unit 528 of the embodiment transmits the VR image, the AR image, or the wide-angle image generated by the generation unit 526 to the HMD, and displays the image on the screen of the HMD.
  • the output unit 528 may store the data generated by the generation unit 526 in a predetermined storage device or recording medium.
  • the generation unit 526 may combine the image captured by the large image capturing unit 510 with the image captured by the plurality of small image capturing units 512, and may output a wide-angle image as a result of combining to the output unit 528.
  • FIG. 24 shows an example of image composition.
  • the central image 530 is a relatively high quality image captured by the large image capturing unit 510.
  • the left image 532 a is an image of relatively low image quality captured by the compact imaging unit 512 installed on the left side of the large imaging unit 510.
  • the right image 532 b is an image of relatively low image quality captured by the small imaging unit 512 installed on the right side of the large imaging unit 510.
  • low quality areas are hatched.
  • the generation unit 526 may generate the combined image 534 by combining the left image 532a on the left side of the center image 530 and combining the right image 532b on the right side of the center image 530.
  • a composite image 534 a wide-angle image in which an occlusion area that can not be captured by the large-size imaging unit 510 is complemented.
  • the resolution of the human eye is higher at the center and lower at the periphery.
  • the central portion of the composite image 534 is high quality, ie, it can provide a wide angle image suitable for human eyes.
  • the generation unit 526 may change the combining ratio (in other words, the blending ratio) according to the position at which the image is combined. For example, the generation unit 526 may increase the reflection ratio of the pixel value of the left image 532a as approaching the peripheral region in the overlapping portion of the central image 530 and the left image 532a (the same applies to the right image 532b). Conversely, as the central region is approached, the reflection ratio of the pixel values of the central image 530 may be increased. Thereby, it is possible to suppress the user from feeling uncomfortable with the composite image 534 due to the difference in the image quality between the center image 530 and the left image 532a (the same applies to the right image 532b).
  • the combining ratio in other words, the blending ratio
  • the generation unit 526 is based on at least two of the image captured by the large image capturing unit 510 and the plurality of images captured by the plurality of small image capturing units 512, data relating to parallax and data relating to the distance to the subject. And / or may be generated. Data on distance can be said to be depth information.
  • the generating unit 526 causes the HMD to display an image generated by each of the two small imaging units 512. It may be determined as For example, the generation unit 526 generates an image captured by the left small-size imaging unit 512 (referred to as “left image”) as an image for the left eye and an image captured by the right small-sized imaging unit 512 (referred to as the “right image”). ) May be determined as an image for the right eye.
  • left image an image captured by the left small-size imaging unit 512
  • right image an image captured by the right small-sized imaging unit 512
  • the generation unit 526 may store the correspondence between the image (referred to as “center image”) captured by the large-size imaging unit 510 and the left image. This correspondence may be, for example, the correspondence between the pixels of one image and the pixels of the other image, or may be the correspondence between pixels imaging the same portion (position) of the subject.
  • the generation unit 526 may correct the value of each pixel in the left image based on the value of the corresponding pixel in the center image, or may replace it, for example.
  • the generation unit 526 may store the correspondence between the right image and the center image, and correct the value of each pixel in the right image based on the value of the corresponding pixel in the center image.
  • the image quality of the left eye image and the right eye image can be improved.
  • the generation unit 526 may newly generate an image for the left eye and an image for the right eye based on the data of the center image, the data of the left image, and the data of the right image.
  • the distance between the left small-sized imaging unit 512 and the right small-sized imaging unit 512 may be different from the IPD, and may be, for example, 100 mm or more.
  • FIG. 25 is a flowchart showing processing of the generation unit 526 in the first embodiment.
  • the generation unit 526 detects the parallax between the left image and the right image (in other words, the size of the deviation of the imaging position of the subject). In addition, the generation unit 526 detects the parallax between the left image and the center image. The generation unit 526 also detects the parallax between the right image and the center image (S10). The generation unit 526 estimates the distance to the subject based on the parallax detected in S10 (S12).
  • the generation unit 526 may generate first distance data indicating the distance to the subject by triangulation based on the parallax between the left image and the right image. Further, the generation unit 526 may generate second distance data indicating the distance to the subject by triangulation based on the parallax between the left image and the center image. The generation unit 526 may also generate third distance data indicating the distance to the subject by triangulation based on the parallax between the right image and the center image. The generation unit 526 may generate a distance image representing the distance to the subject as a pixel value as the first to third distance data. The generation unit 526 may generate a final estimated value of distance by smoothing the first to third distance data.
  • the generation unit 526 obtains RGB data of each of the left image, the center image, and the right image (S14), and generates a composite image (for example, the composite image 534 in FIG. 24) obtained by combining the left image, the center image, and the right image S16).
  • a composite image for example, the composite image 534 in FIG. 24
  • the generation unit 526 generates parallax information conforming to the position of the eye of the user wearing the HMD by inverse calculation of triangulation based on the distance to the subject (S18).
  • the generation unit 526 generates an image for the left eye and an image for the right eye based on the parallax information obtained in S18 (S20). For example, the image for the left eye and the image for the right eye having a shift indicated by the parallax information generated in S18 may be extracted from the composite image generated in S16.
  • the generation unit 526 outputs the left-eye image and the right-eye image to the output unit 528, and causes the HMD to display the image (S22).
  • the generation unit 526 may output the distance image to the output unit 528, and the output unit 528 may transmit the distance image to a predetermined external device.
  • the imaging apparatus 500 of the first embodiment it is possible to obtain parallax images and wide-angle images in various directions including the vertical direction while suppressing the enlargement of the apparatus. In addition, it is easy to secure the image quality of the image while suppressing the increase in size of the device.
  • FIG. 26 schematically illustrates the configuration of an imaging device 500 according to the second embodiment.
  • the figure shows the configuration when the imaging device 500 is viewed from the top.
  • the imaging device 500 includes a plurality of large-sized imaging units 510 (three in FIG. 26) and a plurality of small-sized imaging units 512 (two in FIG. 26).
  • the plurality of large-size imaging units 510 capture subjects in directions different from one another, and in FIG.
  • At least one small-sized imaging unit 512 (all small-sized imaging units 512 in the second embodiment) is provided between a plurality of large-sized imaging units 510.
  • the generation unit 526 generates a wide-angle image (an image of 180 ° in FIG. 26) obtained by combining the plurality of images captured by the plurality of large-sized imaging units 510 and the plurality of images captured by the plurality of small-sized imaging units 512. May be
  • the angle of view of the large image pickup unit 510 is indicated by a broken line
  • the angle of view of the small image pickup unit 512 is indicated by an alternate long and short dash line.
  • the lens end portions 542 of the plurality of large image pickup units 510 are configured to be closer to the subject than the lens end portions 544 of the plurality of small image pickup units 512.
  • the circle connecting the lens front ends 544 of the plurality of small imaging units 512 is configured to be inside (the radius becomes smaller) than the circle connecting the lens front ends 542 of the plurality of large imaging units 510 . This prevents the small imaging unit 512 from being included in the angle of view of the large imaging unit 510, in other words, prevents the small imaging unit 512 from appearing in the high-quality image imaged by the large imaging unit 510. it can.
  • FIG. 27 schematically illustrates the configuration of an imaging device 500 according to the third embodiment.
  • the figure schematically shows the configuration when the imaging device 500 is viewed from the front.
  • the imaging apparatus 500 includes a plurality of large imaging units (large imaging units 510a and 510b) and a plurality of small imaging units (small imaging units 512a to 512f).
  • the large image pickup unit 510a and the large image pickup unit 510b image the same direction, in other words, an image of an object existing in the same direction.
  • the small imaging unit 512a, the small imaging unit 512b, and the small imaging unit 512c are disposed around the large imaging unit 510a, and the small imaging unit 512d, the small imaging unit 512e, and the small imaging unit 512f are disposed around the large imaging unit 510b. Be done.
  • Each of the small size imaging unit 512a to the small size imaging unit 512f captures an image in the same direction as the large size imaging unit 510a and the large size imaging unit 510b.
  • the small imaging unit may be further disposed at an oblique position of the large imaging unit.
  • the large image pickup unit 510a and the large image pickup unit 510b are provided at separate positions of the IPD.
  • the generation unit 526 generates an image for the right eye based on the high quality image captured by the large image pickup unit 510a, and generates an image for the left eye based on the high quality image captured by the large image pickup unit 510b.
  • the distance between the large imaging unit 510 a and the large imaging unit 510 b may be different from that of the IPD. In that case, the distance to the subject is determined based on the high-quality images captured by the plurality of large-sized imaging units and the low-quality images captured by the plurality of small-sized imaging units. An image for the left eye may be generated.
  • the imaging device 500 is an HMD based on an output signal of a sensor (acceleration sensor, gyro sensor, etc.) mounted on the HMD and / or an image of the appearance of the HMD captured by a predetermined camera. It further comprises an attitude detection unit that detects an attitude.
  • the posture detection unit detects, as the posture of the HMD, the gaze direction of the user wearing the HMD and the inclination of the gaze of the user (in other words, the inclination of a line connecting both eyes).
  • the generation unit 526 of the imaging device 500 selects a part of the plurality of images captured by the plurality of imaging units according to the gaze direction detected by the posture detection unit and / or the inclination of the gaze. May be
  • the generation unit 526 may generate the right-eye image and the left-eye image based on the selected image. For example, when the line of sight of the user is inclined obliquely to the left, the upper side, and the right, the lower side, the generation unit 526 generates an image for the left eye using an image captured by the compact imaging unit 512a.
  • the captured image may be used to generate an image for the right eye.
  • the generation unit 526 may improve the image quality of the image for the left eye and the image for the right eye using images captured by the large image capturing unit 510a and the large image capturing unit 510b. .
  • the generation unit 526 may generate an image for the left eye using a captured image by the small-size imaging unit 512b when the line of sight direction of the user has moved further to the left. For example, the generation unit 526 derives the distance data to the subject for generating the left-eye image and the color data of the subject using the image captured by the large image capturing unit 510a and the image captured by the small image capturing unit 512b. May be
  • the generation unit 526 may generate an image for the right eye using an image captured by the compact imaging unit 512e when the line of sight direction of the user has moved further to the right.
  • the small image pickup units at the upper, lower, left, and right positions of each of the plurality of large image pickup units, appropriate parallax according to the change in the gaze direction of the user and the change in the inclination of the gaze. It becomes easy to present the image to the user.
  • a plurality of images obtained by imaging the subject by a plurality of imaging units are required.
  • the occlusion of parallax generated in the large image pickup unit is interpolated by the image pickup data by the small image pickup unit.
  • the generation unit 526 sets the distance to the subject in the occlusion area not included in the image captured by the large image capturing unit 510 b in the image captured by the large image capturing unit 510 a as the distance from the large image capturing unit 510 a. Derivation is performed based on an image captured by the small imaging unit 512a, the small imaging unit 512b, or the small imaging unit 512c installed in the periphery.
  • the distance to the subject in the area included in at least one of the image captured by the large image capturing unit 510a and the image captured by the large image capturing unit 510b can be obtained without omission.
  • the imaging apparatus 500 of the fourth embodiment enhances the quality of output data by using the result of machine learning (deep learning or the like).
  • the imaging apparatus 500 of the fourth embodiment further includes a learning result storage unit (not shown) that stores the result of machine learning.
  • the learning result storage unit includes (1) a first learning result for obtaining a distance to a subject based on a plurality of images obtained from a plurality of imaging units, and (2) an image captured by a small imaging unit 512.
  • the second learning result to be corrected by the image captured by the large image capturing unit 510 is stored.
  • the first learning result is a result of machine learning based on a combination of the parallax between the plurality of images obtained from the plurality of imaging units and the distance to the subject, and the parallax between the plurality of images is input May be a program that outputs the distance to the subject. Further, the first learning result may be data indicating a correspondence between parallax between a plurality of images and a distance to a subject. The first learning result may be a program that outputs the distance to the subject based on the RGB information of the captured image as disclosed in “Japanese Patent Application Laid-Open No. 2016-157188”.
  • the second learning result when the subject is an object moving from the imaging range of the large imaging unit 510 to the imaging range of the small imaging unit 512, the shape of the object indicated by the captured image (for example, central image) of the large imaging unit 510 And the program for setting the image of the object with respect to the captured image (for example, the left image or the right image) of the compact imaging unit 512. Also, the second learning result identifies the object based on the shape of the object of the center image 530 when the same object appears across the center image, the left image, and the right image, and the shape that the object should have May be a program that reflects the left image and the right image.
  • the technology related to the former second learning result is also disclosed in “Japanese Patent Laid-Open No. 2012-203439”.
  • the techniques related to the latter second learning result are also disclosed in "Japanese Patent Application Laid-Open No. 2005-128959” and "Japanese Patent Application Laid-Open No. 2005-319018".
  • the generation unit 526 of the imaging apparatus 500 is based on at least two of the image captured by the large-sized imaging unit 510 and the image captured by the plurality of small-sized imaging units 512. Generate data on the distance to the subject. In the fourth embodiment, the generation unit 526 further corrects data related to the distance to the subject based on the first learning result stored in the learning result storage unit. In addition, the generation unit 526 corrects the image captured by the small-size imaging unit 512 based on the image captured by the large-size imaging unit 510 and the second learning result stored in the learning result storage unit.
  • FIG. 28 is a flowchart showing processing of the generation unit in the fourth embodiment. Since S30 and S32 of FIG. 28 are the same as S10 and S12 of FIG. 24, the description will be omitted.
  • the generation unit 526 corrects the distance to the subject estimated in S32 according to the first learning result (S34). For example, the average value of the distance obtained in S32 and the distance obtained according to the first learning result may be used as the corrected distance. Since S36 of FIG. 28 is the same as S14 of FIG. 24, the description is omitted.
  • the generation unit 526 corrects the RGB data acquired in S36 according to the second learning result (S38). For example, RGB data indicating an object identified in the center image 530 may be reflected on RGB data of the left image 532a or the right image 532b.
  • the following S40 to S46 are the same as S16 to S22 in FIG. Note that one of the correction processing of S34 and the correction processing of S38 may be executed.
  • the image pickup elements (image sensors) of the respective image pickup units may be formed on the same substrate.
  • a shielding member partition
  • an imaging element which should detect light transmitted through a lens of a certain imaging unit does not detect light transmitted through a lens of another imaging unit.
  • the pixel data acquisition unit 522 of the imaging device 500 acquires the pixel value of the region corresponding to the large imaging unit 510 in the imaging device as the pixel value of the image imaged by the large imaging unit 510.
  • the pixel data acquisition unit 522 is a pixel of an image captured by the compact imaging unit 512a (or compact imaging unit 512b) in the pixel value of the region corresponding to the compact imaging unit 512a (or compact imaging unit 512b) in the imaging device. Get as a value.
  • the plurality of imaging units share the imaging device on a single substrate, the number of parts of the imaging device 500 can be reduced, and the manufacturing cost of the imaging device 500 can be reduced.
  • the image processing unit 514 may be provided in the imaging element.
  • the imaging device 500 is a stacked image sensor in which a logic circuit (and / or a control circuit) mounting the function of the image processing unit 514 is provided in the lower layer of the pixel array. May be configured as As a result, many image processings are completed in the image sensor, so that the processing speed can be increased, the processing in the latter stage can be reduced in weight, and the processing load on the external device can be reduced.
  • At least one of the one or more large-sized imaging units 510 and the plurality of small-sized imaging units 512 may be provided with a polarizer that transmits a polarization component in a predetermined direction among the light transmitted through the lens.
  • each of the large-sized imaging unit 510 and the small-sized imaging unit 512 may include an imaging optical system 14, an aperture 18, and an imaging device 20 as shown in FIG. 1 of the related art.
  • the imaging device 20 may include a two-dimensional array of pixels, and the pixels may have a structure in which a microlens, a polarizer, and a photodiode are integrally stacked.
  • a plurality of types of polarizers having a plurality of types of principal axis angles may be provided in a plurality of imaging units (or a pixel unit in a single imaging unit). According to the first modification, it is possible to obtain a polarized image (or a plurality of types of polarized images corresponding to a plurality of directions). Thereby, it is possible to obtain the normal vector of the object surface using the polarization image.
  • a second modified example related to the first modified example will be described.
  • a photodiode photoelectric conversion unit which is a unit for converting light transmitted through a microlens into electric charge
  • a photodiode may be provided in each of a plurality of partial areas obtained by dividing a pixel area corresponding to one microlens.
  • At least one of the one or more large-sized imaging units 510 and the plurality of small-sized imaging units 512 may be provided with pixels capable of detecting four or more wavelength bands (herein referred to as “special pixels”).
  • the four or more wavelength bands include, for example, a first wavelength band (red), a second wavelength band (green), a third wavelength band (blue), and other wavelength bands (for example, yellow, magenta, etc.) May be.
  • wavelength bands infrared, ultraviolet etc.
  • Data on four or more wavelength bands is also called multispectral data and is also called hyperspectral data.
  • An imaging apparatus 500 stores a spectrum data storage unit that stores data indicating detection results of four or more wavelength bands (that is, the features of the spectrum) and a predetermined correspondence with an object that is a subject. You may provide further.
  • the generation unit 526 obtains the detection results of four or more types of wavelength bands output from the imaging unit including the special pixel with reference to the correspondence stored in the spectrum data storage unit, and an object corresponding to the detection result. May be identified.
  • the generation unit 526 may generate an output image in which data (pixel values) of colors associated in advance with the specified object is set in the area of the specified object.
  • the spectrum data storage unit may store data indicating a correspondence between detection results of four or more types of wavelength bands and types of light sources.
  • the type of light source may include, for example, a sun, a fluorescent lamp, and an LED.
  • the generation unit 526 may acquire detection results of four or more types of wavelength bands output from the imaging unit including the special pixel, and specify a light source corresponding to the detection result. Then, the generation unit 526 may generate an output image in which a color corresponding to the specified light source is set. According to the third modification, it becomes easy to identify an object (for example, water and alcohol) which is difficult to distinguish by visible light. In addition, estimation of the light source is facilitated.
  • the image captured by the compact imaging unit 512 includes noise such as light shot noise. Since the small-sized imaging unit 512 has a small optical size, the signal-to-noise ratio of the image captured by the small-sized imaging unit 512 tends to decrease when the surroundings become dark. In other words, the small imaging unit 512 is more likely to deteriorate the signal noise ratio of the captured image than the large imaging unit 510.
  • the imaging apparatus 500 further includes a measurement unit that measures the signal-to-noise ratio of the image captured by each of the plurality of small-sized imaging units 512.
  • the generation unit 526 performs pixel addition on the images captured by each of the plurality of small-size imaging units 512 in accordance with the signal-to-noise ratio.
  • a known method may be adopted for pixel addition.
  • the generation unit 526 sets a plurality of adjacent pixels (for example, two pixels) as one virtual pixel with respect to a captured image of the small-sized imaging unit 512 in which the signal noise ratio is less than a predetermined threshold.
  • the captured image of the compact imaging unit 512 may be corrected by setting the sum of values to a pixel value of one virtual pixel. According to the fourth modified example, it is possible to suppress the deterioration of the signal-to-noise ratio caused by the change in the surrounding environment of the image captured by the small size imaging unit 512.
  • the imaging apparatus 500 including the plurality of imaging units and the image processing unit 514 has been described.
  • a plurality of imaging devices independent of each other corresponding to the large imaging unit 510 and the small imaging unit 512, and an information processing apparatus including the function of the image processing unit 514 are provided.
  • a cooperative camera system may be constructed. The techniques described in the embodiments and the modifications are also applicable to the camera system.
  • 500 imaging apparatus 510 large-sized imaging unit, 512 small-sized imaging unit, 514 image processing unit, 520 characteristic storage unit, 522 pixel data acquisition unit, 524 adjustment unit, 526 generation unit, 528 output unit.
  • the present invention is applicable to an apparatus or system for processing an image.

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • General Physics & Mathematics (AREA)
  • Power Engineering (AREA)
  • Optics & Photonics (AREA)
  • Electromagnetism (AREA)
  • Condensed Matter Physics & Semiconductors (AREA)
  • Computer Hardware Design (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Human Computer Interaction (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Studio Devices (AREA)
  • Automatic Focus Adjustment (AREA)
  • Stereoscopic And Panoramic Photography (AREA)
  • Focusing (AREA)
  • Cameras In General (AREA)
  • Blocking Light For Cameras (AREA)
  • Exposure Control For Cameras (AREA)
  • Camera Bodies And Camera Details Or Accessories (AREA)
  • Color Television Image Signal Generators (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Closed-Circuit Television Systems (AREA)
  • Image Processing (AREA)
  • Length Measuring Devices By Optical Means (AREA)

Abstract

撮像装置500は、大型撮像部510と、大型撮像部510より光学サイズが小さい複数の小型撮像部512と、画像処理部514を備える。大型撮像部510は、撮像装置500外部の被写体を撮像する。複数の小型撮像部512は、大型撮像部510の周辺位置に設置され、上記被写体を撮像する。画像処理部514は、大型撮像部510により撮像された画像と、複数の小型撮像部512により撮像された画像とに基づいて、出力用のデータを生成する。

Description

撮像装置
 本発明は、撮像装置に関する。
 ヘッドマウントディスプレイ等に表示させる視差のついた3次元映像を撮る場合、典型的には、同一のカメラを2台配置して被写体を撮像していた。
特開2017-16431号公報
 3次元映像を撮る従来の手法には以下のような課題があった。(1)ヘッドマウントディスプレイでの映像視聴時に、首を傾ける等によりユーザの両目を結ぶラインが斜めや縦になると、撮影時のカメラ位置と差が出てしまい適切な視差を得ることが困難になる。(2)高い画質を得るために2つのカメラそれぞれの光学サイズを大きくすると、カメラシステム全体として大型化してしまう。(3)大型カメラのレンズの間には、近接距離において死角が発生する。
 本発明はこうした課題に鑑みてなされたものであり、1つの目的は、好適な3次元映像を提供するための改善された技術を提供することである。
 上記課題を解決するために、本発明のある態様の撮像装置は、被写体を撮像する第1撮像部と、第1撮像部の周辺位置に設置され、被写体を撮像する第2撮像部であって、第1撮像部より光学サイズが小さい複数の第2撮像部と、第1撮像部により撮像された画像と、複数の第2撮像部により撮像された画像とに基づいて出力用のデータを生成する画像処理部と、を備える。
 なお、以上の構成要素の任意の組合せ、本発明の表現をシステム、コンピュータプログラム、コンピュータプログラムを読み取り可能に記録した記録媒体、データ構造などの間で変換したものもまた、本発明の態様として有効である。
 本発明によれば、好適な3次元映像を提供することを支援できる。
関連技術における撮像装置の構成を概念的に示す図である。 関連技術の撮像装置が備える画素の構造例を示す図である。 関連技術の撮像素子における画素配列を例示する図である。 関連技術におけるイメージセンサの構造の概略を示す図である。 関連技術において、位相差により距離情報を取得する原理を説明するための図である。 関連技術で取得される画像と焦点距離の関係を説明するための図である。 図6のケースにおける焦点距離と位相差の関係を模式的に示す図である。 関連技術における画像処理部の機能ブロックを示す図である。 関連技術の画像処理部における撮影画像の変遷を模式的に示す図である。 関連技術における画像処理部が、撮影された画像から各種データを生成、出力する処理手順を示すフローチャートである。 関連技術における偏光子とフォトダイオードの位置的関係を説明するための図である。 関連技術における撮像面上の異なる位置における偏光子のワイヤ配列を模式的に示す図である。 関連技術において偏光子の有無によって読み出し単位を異ならせる場合の、データの単位と各種情報の生成経路を説明するための図である。 関連技術において偏光子の有無によって読み出し単位を異ならせる場合の、データの単位と各種情報の生成経路を説明するための図である。 関連技術において、偏光子を設ける画素値における偏光子のバリエーションを示す図である。 関連技術において、一画素に設けるフォトダイオードのバリエーションを示す図である。 関連技術において、撮像装置をステレオカメラで構成したときの、システムの機能ブロックの構成を示す図である。 関連技術において、被写体情報生成部が左右視点の距離画像を統合する処理を説明するための図である。 関連技術において、撮像装置を移動させながら撮影することにより、3次元空間における被写体の状態情報を取得する手法を説明するための図である。 関連技術における、偏光の位相差を利用して合焦する機能を有する撮像装置の機能ブロックを示す図である。 図21(a)は、従来におけるカメラの配置態様を模式的に示す図であり、図21(b)は、第1実施例におけるカメラの配置態様を模式的に示す図である。 図22(a)は、従来におけるカメラの配置態様を模式的に示す図であり、図22(b)は、第1実施例におけるカメラの配置態様を模式的に示す図である。 第1実施例の撮像装置の機能構成を示すブロック図である。 画像合成の例を示す図である。 第1実施例における生成部の処理を示すフローチャートである。 第2実施例の撮像装置の構成を模式的に示す図である。 第3実施例の撮像装置の構成を模式的に示す図である。 第4実施例における生成部の処理を示すフローチャートである。
 (関連技術)
 図1は、本実施の形態における撮像装置の構成を概念的に示す図である。撮像装置12は、結像光学系14、絞り18、撮像素子20、および画像処理部22を含む。結像光学系14は被写体の像を撮像素子20の撮像面に結像させる合焦レンズを含む一般的な構成を有する。なお図では1枚のレンズで代表させて示している。絞り18は開口部を有し、その口径を変化させることにより、入射する光の量を調整する一般的な構成を有する。
 撮像素子20は画素の2次元配列を含み、入射した光の強さを電荷に変換して画像処理部22に出力する。本実施の形態における画素は少なくとも、マイクロレンズ、偏光子、フォトダイオードを一体的に積層させた構造を有する。ここで1つのマイクロレンズに対し複数のフォトダイオードを設けることにより、入射光を2つの画像に分割してなる位相差画像を取得する。以後の説明では1つのマイクロレンズに対応する領域を1つの画素領域とする。
 つまり1画素に対し複数のフォトダイオードを設ける。なおフォトダイオードは入射した光の強度を電荷に変換する機構の代表例であるが、本実施の形態をこれに限る趣旨ではない。すなわちフォトダイオードの代わりにいかなる光電変換機構を採用しても、本実施の形態を同様に実現でき、光を電荷に変換する1単位の機構を各フォトダイオードの代わりに用いることができる。また偏光子は全ての画素に設けてもよいし、一部の画素に離散的に設けてもよい。
 画像処理部22は、撮像素子20から出力された光の輝度の2次元分布を用いて画像処理を行い、一般的なカラー画像と、被写体までの距離を画素値として表した距離画像を生成する。なお撮像装置12にはさらに、ユーザによる操作手段と、操作内容に応じて撮影動作や撮影条件の調整動作などを実行する機構が設けられていてよい。また撮像装置12は、ゲーム機など外部の情報処理装置と、有線または無線により通信を確立し、生成したデータを送信したりデータ送信要求などの制御信号を受信したりする機構を有していてよい。ただしこれらの機構は一般的な撮像装置と同様でよいため説明は省略する。
 図2は撮像装置12が備える画素の構造例を示している。なお同図は素子断面の機能的な構造を模式的に示しており、層間絶縁膜や配線などの詳細な構造は省略している。また同図では隣接した2画素分の断面構造を例示している。画素110はマイクロレンズ層112、カラーフィルタ層114、偏光子層116、および光電変換層118を含む。マイクロレンズ層112は画素ごとに設けられ、絞り18を経て入射した光を集光する。
 カラーフィルタ層114は、画素ごとに異なる色の光を透過する。偏光子層116は、複数の線状の導体部材、例えばタングステンやアルミなどの部材(ワイヤ)を入射光の波長より小さい間隔でストライプ状に配列させたワイヤグリッド型偏光子を含む。マイクロレンズ層112により集光されカラーフィルタ層114を透過した光が偏光子層116に入射すると、偏光子のラインと平行な方向の偏光成分は反射され、垂直な偏光成分のみが透過する。
 透過した偏光成分を光電変換層118で電荷に変換することにより偏光輝度が取得される。図示するようなワイヤグリッド型偏光子を用いた画像取得技術については、例えば特開2012-80065号公報などに開示されている。ただし本実施の形態における撮像装置12の素子構造は図示するものに限らない。例えば偏光子はワイヤグリッド型に限らず、線二色性偏光子など実用化されているもののいずれでもよい。なお同図では偏光子として、図面の奥行き方向に伸張するワイヤの断面を表しているが、偏光子の主軸角度は4通りとし、それに応じてワイヤの向きも異なる。
 また図示するように偏光子層116には、画素によって偏光子を備える領域と備えない領域があってよい。偏光子を設けない領域では、カラーフィルタ層114を透過した光がそのまま光電変換層118に入射する。光電変換層118は一般的なフォトダイオードを含み、入射した光を電荷として出力する。上述したように本実施の形態では、1つのマイクロレンズに対しフォトダイオードを複数設けることにより、合焦レンズの異なる領域を透過した光を別々に電荷に変換する。
 そのようにして検出した光の位相差に基づき焦点検出を行う技術は位相差オートフォーカスの一手法として実用化されている(例えば特開2013-106194号公報参照)。本実施の形態では当該位相差を利用して被写体までの距離を取得する。1画素に設けた複数のフォトダイオードによる検出値を合計すれば、一般的な撮像装置における1画素分の輝度が得られる。すなわち図2に示した画素の構成によれば、一般的なカラー画像、距離画像、偏光画像を同時に得ることができる。
 図3は、撮像素子20における画素配列を例示している。同図は撮像素子20の一部の領域を上面から見たときの各層の組み合わせを模式的に示しており、縦長の長方形が1つのフォトダイオード(例えばフォトダイオード120)を示している。左右2つのフォトダイオードの対が1画素(例えば画素122)に対応する。またカラーフィルタ層114におけるカラーフィルタはベイヤ配列とし、画素ごとに赤、緑、青のいずれかの光を検出する。図ではそれぞれ「R」、「G」、「B」の文字で示している。
 また太線枠で示した画素124a、124bには偏光子を設ける。これらの画素124a、124bにおける太い斜線は偏光子を構成するワイヤを示している。すなわち画素124a、124bは、異なる主軸角度の偏光子を備えている。図では主軸角度が互いに直交する2種類の偏光子が例示されているが、さらに別の画素を利用して、45°おきの主軸角度を有する4種類の偏光子を設ける。
 各偏光子は、ワイヤの方向に直交する方向の偏光成分を透過する。これにより下層に設けたフォトダイオードは、45°おきの4方向の偏光成分の輝度を表す電荷を出力する。当該画素から偏光輝度のみを得る場合は、1画素に設けた2つのフォトダイオードからの検出値を合計してよい。ベイヤ配列においては緑(G)に割り当てられる画素の密度が最も高いため、この例では、偏光子を設ける画素を緑の画素としている。
 これにより、偏光子を設ける画素を比較的近接させることができ、同じ色の複数方位の偏光輝度を高い分解能で得ることができる。これを偏光方位ごとに分離して補間することにより4方向の偏光画像が得られる。当該偏光画像を利用すれば、被写体表面の法線ベクトルを求めることができる。法線ベクトルは被写体表面の微小面積の傾斜を表していため、これを利用すれば、位相差に基づき取得される、特徴点における距離値を補間できる。同じ撮像装置12による同一視点の撮影画像から、位相差による距離値と法線ベクトルが同時に得られるため、位置合わせ等の必要なく正確な補間を実現できる。
 なお画像表示などの目的でカラー画像を用いることがない場合、画素110からカラーフィルタ層114を除いた構成としてもよい。この場合、輝度画像、距離画像、および法線画像を得ることができる。あるいはカラーフィルタを、シアンやマゼンダなどの染料系フィルタとしてもよい。また図3に示した配列はあくまで例示であり、本実施の形態の画素配列をこれに限る趣旨ではない。例えば偏光子を設ける画素の密度をさらに高くしてもよいし、全ての画素に偏光子を設けてもよい。
 図4は本実施の形態におけるイメージセンサの構造の概略を示している。イメージセンサ170は画素部172と、周辺回路としての行走査部174、水平選択部176、列走査部180、制御部178を含む。画素部172は図2で示したような画素をマトリクス状に配列させてなる。
 光電変換層118における各フォトダイオードは、行ごとに行走査部174、列ごとに水平選択部176および列走査部180に接続されている。行走査部174はシフトレジスタやアドレスデコーダなどによって構成され、各画素を行単位で駆動する。行走査部174によって選択走査された画素から出力される信号は水平選択部176に供給される。水平選択部176は、アンプや水平選択スイッチなどによって構成される。
 列走査部180はシフトレジスタやアドレスデコーダなどによって構成され、水平選択部176の各水平選択スイッチを操作しつつ順番に駆動する。列走査部180による選択走査により、水平選択部176に供給された各画素からの信号が外部へ出力される。制御部178は、タイミング信号を生成し、水平選択部176および列走査部180などの駆動タイミングを制御する。
 本実施の形態のある態様では、偏光子を含む画素と含まない画素が存在する。この場合、偏光子を含む画素は入射光の一部を反射するため、偏光子を含まない画素よりフォトダイオードに到達する光の強度が小さくなる。また、偏光子を含む画素と含まない画素とでは、前者の方が得られる情報が多くなる。これらのことを考慮し、図示するような周辺回路を偏光子の有無によって2つに分け、データ読み出しのタイミングや間隔を独立に制御できるようにしてもよい。
 例えば偏光子を含む画素のフレームレートを小さくし、電荷の蓄積時間を他の画素より長くすることにより、画像平面全体で同レベルの輝度が得られるようにする。このようにすると、偏光子の有無にかかわらず画像全体を均一に扱える。あるいは逆に、偏光子を含む画素のフレームレートを高くしてもよい。この場合、高レートで出力される偏光の輝度分布を用いて、法線ベクトルの分布を高い頻度で求めることにより、被写体の面の動きの検出感度を上げることができる。データ読み出しのタイミングをどのように制御するかは、後段の処理内容や求められる検出感度などに応じて決定してよい。
 図5は、位相差により距離情報を取得する原理を説明するための図である。同図は被写体130からの光が、結像光学系14の合焦レンズ132を経て撮像素子20の撮像面134に入射する経路を、撮像空間の上側から見た状態を示している。状態(a)、(b)、(c)は、撮像面134から被写体130までの距離が異なり、状態(b)における被写体130が、ピントが合った位置、すなわちピント面138にあるとする。
 つまり状態(b)では、図示するように、被写体130の一点から出た光が、撮像面134において一点に結像する。したがって被写体130の一点は1つの画素に対応し、1画素に2つのフォトダイオードを設けても、それらにより検出される光束は被写体130の略同一の点からのものである。一方、被写体130が状態(a)のようにピント面138より奥にあったり、状態(c)のようにピント面138より手前にあったりすると、光が一点に結像する位置が撮像面134からずれる。
 その結果、合焦レンズ132を左右(図の上下)に2分割してなる領域のどちらを通過したかで、その光束を捉える画素にずれが生じる。図の右側に拡大して示すように、マイクロレンズ136を透過した光のうち図の上側からの光は図の下側のフォトダイオード138bを介して、図の下側からの光は図の上側のフォトダイオード138aを介して検出される。以後、フォトダイオードの対のうち、撮像面から見て左側のフォトダイオード(例えばフォトダイオード138a)を左フォトダイオード、右側のフォトダイオード(例えばフォトダイオード138b)を右フォトダイオードとも呼ぶ。
 結果として、各画素のうち左フォトダイオードにより検出された輝度のみを抽出してなる画像と、右フォトダイオードにより検出された輝度のみを抽出してなる画像とでは、光束を捉える画素のずれに応じたずれが生じる。当該ずれ量は、被写体130とピント面138との距離に依存する。また被写体130がピント面138より撮像面134に近いか遠いかで、ずれる方向が逆転する。以後、左フォトダイオードおよび右フォトダイオードにより検出された輝度をそれぞれ画素値とする2つの画像を「位相差画像」、両者における同じ被写体の像のずれ量を「位相差」と呼ぶ。
 図6は、本実施の形態で取得される画像と焦点距離の関係を説明するための図である。同図は、顔と立方体が存在する空間を撮影したときの位相差画像を模式的に示しており、左右の画像のうち左が左フォトダイオードにより検出された画像、右が右フォトダイオードにより検出された画像である。このうち(a)は、顔に焦点が合っている場合である。この場合、顔の像は位相差画像の双方において左端からBの距離にあり位相差が生じていない。一方、立方体の像には(A’-A)の位相差が生じている。(b)は立方体に焦点が合っている場合である。この場合、立方体の像は位相差画像の双方において画像の左端からAの距離にあり位相差が生じていない。一方、顔の像にはB’-Bの位相差が生じている。
 上述のとおり、被写体が焦点距離より近いか遠いかでずれる方向が逆になるため、位相差は負の値をとり得る。図7は、図6のケースにおける焦点距離と位相差の関係を模式的に示している。図の実線は顔の位相差、破線は立方体の位相差を、焦点距離に対する変化として示している。ただし実際には光学系の様々な要因により、位相差の特性は図示するものに限らない。焦点距離がF1のとき、図6の(a)で示したように顔の位相差は0であり、立方体にはA’-Aの位相差が生じる。焦点距離がF2のときは、図6の(b)で示したように立方体の位相差は0であり、顔にはB’-Bの位相差が生じる。
 すなわち被写体までの距離が固定値のとき、焦点距離によって位相差が一意に定まる。換言すれば、焦点距離と位相差が定まれば、被写体までの距離を特定できる。焦点距離は、一般的な撮像装置における合焦機能と同様に取得できる。また焦点距離(ピント面)からの被写体の距離と位相差との関係は、既知の距離にある被写体を実際に撮影した画像から実験的に求めたものをテーブルとして準備しておく。これにより、観測された位相差に基づきピント面からの距離を求め、さらに焦点距離を加算することで、撮像面から被写体までの距離を算出できる。
 次に、偏光画像から法線ベクトルを得る手法について説明する。複数方向の偏光成分の画像を利用して被写体の様々な情報を取得する技術は従来、研究が進められている。被写体表面の法線ベクトルを求める方法についても、例えば、Gary Atkinson and Edwin R. Hancock, "Recovery of Surface Orientation from Diffuse Polarization", IEEE Transactions on Image Processing, June 2006, 15(6), pp.1653-1664、特開2009-58533号公報などに開示されており、本実施の形態ではそれらを適宜採用してよい。以下、概要を説明する。
 まず偏光子を介して観察される光の輝度は、偏光子の主軸角度θpolに対し次の式のように変化する。
Figure JPOXMLDOC01-appb-M000001
 ここでImax、Iminはそれぞれ、観測される輝度の最大値、最小値であり、φは偏光位相である。上述のとおり4通りの主軸角度θpolに対し偏光画像を取得した場合、同じ位置にある画素の輝度Iは、各主軸角度θpolに対し式1を満たすことになる。したがって、それらの座標(I,θpol)を通る曲線を、最小二乗法等を用いて余弦関数に近似することにより、Imax、Imin、φを求めることができる。そのように求めたImax、Iminを用いて、次の式により偏光度ρが求められる。
Figure JPOXMLDOC01-appb-M000002
 対象物表面の法線は、光の入射面(拡散反射の場合は出射面)の角度を表す方位角αと、当該面上での角度を表す天頂角θで表現できる。また二色性反射モデルによれば、反射光のスペクトルは、鏡面反射と拡散反射のスペクトルの線形和で表される。ここで鏡面反射は物体の表面で正反射する光であり、拡散反射は物体を構成する色素粒子により散乱された光である。上述の方位角αは、鏡面反射の場合は式1において最小輝度Iminを与える主軸角度であり、拡散反射の場合は式1において最大輝度Imaxを与える主軸角度である。
 天頂角θは、鏡面反射の場合の偏光度ρ、拡散反射の場合の偏光度ρと、それぞれ次のような関係にある。
Figure JPOXMLDOC01-appb-M000003
 ここでnは対象物の屈折率である。式2で得られる偏光度ρを式3のρ、ρのどちらかに代入することにより天頂角θが得られる。こうして得られた方位角α、天頂角θにより、法線ベクトル(p,p,p)は次のように得られる。
Figure JPOXMLDOC01-appb-M000004
 このように偏光画像の各画素が表す輝度Iと偏光子の主軸角度θpolとの関係から、当該画素に写る対象物の法線ベクトルが求められ、像全体として法線ベクトル分布を得ることができる。例えばゲームのコントローラなど対象物を限定できる態様においては、その色や材質に基づき鏡面反射と拡散反射のうち適切なモデルを採用することにより、より高い精度で法線を求めることができる。一方、鏡面反射と拡散反射を分離する手法が様々に提案されているため、そのような技術を適用してより厳密に法線を求めてもよい。
 図8は、本実施の形態における画像処理部22の機能ブロックを示している。同図及び後述する図17、図20に示す各機能ブロックは、ハードウェア的には、撮像素子、各種演算回路、マイクロプロセッサ、バッファメモリなどの構成で実現でき、ソフトウェア的には、メモリに格納されるプログラムで実現される。したがって、これらの機能ブロックがハードウェアのみ、ソフトウェアのみ、またはそれらの組合せによっていろいろな形で実現できることは当業者には理解されるところであり、いずれかに限定されるものではない。
 画像処理部22は、撮像素子20から輝度の2次元データを取得し所定の前処理を実施する画素値取得部32、実際の焦点距離を取得する焦点距離取得部30、位相差に基づき距離画像を生成する特徴点距離取得部34、複数方位の偏光輝度から法線画像を生成する法線画像生成部36、位相差に基づく距離値を、法線ベクトルを用いて補完し距離画像を生成する距離画像生成部38、画素値の欠陥を補正する欠陥補正部40、デモザイク処理によりカラー画像を生成するカラー画像生成部42、および、距離画像とカラー画像のデータを出力する出力部44を備える。
 画素値取得部32は、撮像素子20が検出した輝度信号を2次元データとして取得し、A/D変換、クランプ処理など所定の前処理を施す。焦点距離取得部30は、撮像装置2が備える図示しない合焦機能などにおいて取得されている焦点距離をメモリから読み出す。焦点距離の調整が可能な環境においては、焦点距離が変化する都度、そのデータを読み出す。焦点距離を固定とする装置においては、その設定値を初期に取得しておく。
 特徴点距離取得部34は、位相差検出部46、距離値取得部48、および距離対応テーブル50を含む。位相差検出部46は、画素値取得部32が取得した画素値のうち、左フォトダイオードおよび右フォトダイオードにより検出された画素値を分離して位相差画像を生成する。このとき、ベイヤ配列のまま全ての画素を処理対象としてもよいし、緑の画素のみを処理対象とするなどでもよい。そして両者の特徴点を抽出し、被写体における同じ特徴点を表す位置を特定することにより、特徴点ごとに位相差を取得する。
 距離対応テーブル50は、ピント面からの距離と位相差とを対応づけた距離対応テーブルを格納する。距離値取得部48は、位相差検出部46が取得した位相差に基づき距離対応テーブルを参照し、位相差に対応する距離値を取得する。そして焦点距離取得部30から取得した焦点距離に加算することにより、撮像面からの距離の絶対値を特徴点ごとに取得する。
 法線画像生成部36は、画素値取得部32が取得した画素値のうち、偏光子を備えた画素の値を抽出し、さらに偏光子の主軸角度ごとに分離、補間することにより、複数方位の偏光画像を生成する。このとき、一つの画素に設けられた2つのフォトダイオードによる検出値を合計して1つの画素値とする。また各方位の偏光輝度を補間することにより、画像平面上の同じ位置座標に対し複数方位の偏光輝度を取得する。そして方位に対する偏光輝度の変化に基づき、式1から式4を用いて法線ベクトルを算出する。
 法線画像生成部36は、画素ごとに得られた法線ベクトルの3要素を画素値とする法線画像を生成する。この画像は基本的には、撮影画像と同じ解像度を持つことができる。一方、法線ベクトルや後段の距離画像に求められる解像度によっては、撮影画像より低い解像度で法線画像を生成してもよい。
 距離画像生成部38は、特徴点距離取得部34が生成した、特徴点に対する距離値を、法線画像生成部36が生成した法線画像を用いて補完することにより、被写体表面の距離を画素値として表した距離画像を生成する。すなわち特徴点距離取得部34は、位相差が判明するような被写体の像の輪郭や表面の模様などの特徴点については距離値を取得できるものの、単色で滑らかな物体表面など特徴点が抽出しづらい領域の距離を算出することが難しい。
 一方、法線画像生成部36は、物体表面の傾きを微小面積ごとに詳細に取得できる。したがって、特徴点距離取得部34が取得した特徴点における距離値を始点として、法線画像生成部36が取得した法線ベクトルに基づく傾斜を順次与えていくことで、法線ベクトルを得たのと同様の解像度で距離を求めることができる。欠陥補正部40は、画素値取得部32が取得した画素値のうち、偏光子を備える画素の画素値を補正する。
 偏光子を備える画素は、偏光子の主軸角度と同じ方位の偏光成分を反射するため、フォトダイオードへ到達する光は、撮像面へ入射した光より強度が低くなっている。したがって当該画素の輝度を、周囲の画素と同程度のレベルになるように補正することで、カラー画像の一部の画素が黒点となるのを防ぐ。補正処理として、周辺の画素値を用いて補間してもよいし、偏光子による光量の低下割合を実験などにより求めておき、それに基づく定数を該当する画素値に乗算するようにしてもよい。なお欠陥補正部40においても、一対のフォトダイオードによる検出値を合計し1つの画素値として扱う。
 カラー画像生成部42は、欠陥補正後の画像をデモザイク処理することにより、1画素が色の3要素の値を有するカラー画像を生成する。すなわち図3で示すようなベイヤ配列で得られている画素値を色ごとに補間することで、全ての画素が3要素を有するようにする。この処理には一般的なデモザイクの手法を適用できる。出力部44は、少なくとも距離画像生成部38が生成した距離画像のデータと、カラー画像生成部42が生成したカラー画像のデータを取得し、順次外部の装置に送信する。
 あるいは出力部44は、メモリや記録媒体などにそれらのデータを一旦格納し、ユーザ操作などに応じた適切なタイミングで外部の装置に送信したり、ユーザが持ち出したりできるようにしてもよい。本実施の形態では、同程度の解像度でカラー画像と距離画像を同時に取得できるため、それらを用いて様々な情報処理を精度よく行える。例えば被写体の3次元空間での位置が、その色と共に判明するため、それらを一旦、仮想空間に配置し、ヘッドマウントディスプレイを装着したユーザの視点に応じて表示画像を再構成できる。このとき左視点用の画像と右視点用の画像を生成し、ヘッドマウントディスプレイの表示画面を2分割してなる左右の領域に表示すれば、仮想現実や拡張現実を実現できる。
 なお出力部44は、法線画像生成部36が生成した法線画像をさらに出力してもよい。法線の情報は被写体の像そのものより高い感度で被写体の姿勢の変化を表すため、動き検出に用いることができる。なお図示するように撮像装置12の画像処理部22において、カラー画像とともに距離画像を生成できるようにすると、それを用いて各種処理を実施する情報処理装置の負荷を抑えられるとともに、当該装置での消費電力を抑えることができる。
 一方、距離画像生成部38や、特徴点距離取得部34、法線画像生成部36の少なくともいずれかを、撮像装置12以外の情報処理装置に設けるようにしてもよい。あるいは図示するような機能の少なくとも一部の機能を有するロジック回路を画素配列の下層に設け、積層型のイメージセンサとしてもよい。これにより、当該イメージセンサ内で多くの画像処理が完結するため、処理を高速化できるとともに、後段の処理が軽量化され大型の演算器を設ける必要がなくなる。
 図9は、画像処理部22における撮影画像の変遷を模式的に示している。まず画素値取得部32は画像220のような撮影画像のデータを取得する。図示する例では被写体として立方体が写っている。取得するデータは厳密には、左フォトダイオードおよび右フォトダイオードにより検出した、自然光あるいは偏光の輝度の情報を含む。特徴点距離取得部34は上述のとおり特徴点の位相差を取得し、それと焦点距離とから特徴点に対する距離値のデータ222を生成する。
 図示するデータ222は、距離値が小さいほど高い輝度とし、距離値が得られない箇所は最低輝度とする距離画像の形式で表している。この場合、被写体である立方体のうち輝度勾配の高いエッジ部分が特徴点として抽出され、さらに位相差画像における位相差が判明する部分のみ、距離値を得ることができる。図3で示すように、一対のフォトダイオードを、1画素の領域に対し左右に配置すると、位相差は画像平面の水平方向に表れる。そのためデータ222に示すように、水平方向のエッジについては正確な位相差が特定できず、距離値も不定となる。
 一方、法線画像生成部36は、複数方位の偏光画像を用いて法線画像224を生成する。図では立方体表面の法線ベクトルの分布の一部を矢印で示しているが、実際には法線ベクトルを画素単位で求めることができる。距離画像生成部38は、位相差に基づく距離値のデータ222で得られているエッジ部分の距離を始点として、法線ベクトルに基づく表面の傾斜を画素単位で適用していく。その結果、データ222におけるエッジの間が平面であることや、距離値が得られなかった水平方向のエッジ部分を含めた表面の距離値が判明する。
 これにより、立方体表面のうち撮影画像として見えている部分について、ワールド座標系における位置情報226を取得することができる。距離画像生成部38は、このような3次元空間での被写体表面の位置座標に係る情報を生成してもよいし、画像平面に距離値を表した距離画像を生成してもよい。
 次に、これまで述べた構成によって実現できる画像処理部22の動作について説明する。図10は、本実施の形態における画像処理部22が、撮影された画像から各種データを生成、出力する処理手順を示すフローチャートである。まず画素値取得部32は、撮像素子20から、各フォトダイオードにより検出された輝度のデータを取得する(S10)。得られた輝度データは、特徴点距離取得部34、法線画像生成部36、欠陥補正部40に供給される。
 特徴点距離取得部34は、左フォトダイオードおよび右フォトダイオードにより検出された輝度を分離して位相差画像を生成し、特徴点の対応をとることで位相差を取得する(S14)。そして位相差と焦点距離に基づき特徴点を構成する画素に対する距離値を特定する(S16)。法線画像生成部36は、偏光を検出している画素の値を抽出するとともにそれを偏光子の主軸角度ごとに分離し補間することで、複数方位の偏光画像を生成する(S18)。そして同じ位置における偏光輝度の方位依存性を取得することにより、法線ベクトルを画素ごと、あるいはそれより大きい単位で算出し、法線画像を生成する(S20)。
 距離画像生成部38は、位相差によって距離値が求められない箇所について、法線画像を用いて距離値を求めることにより、距離値が補完された距離画像を生成する(S22)。一方、欠陥補正部40は、偏光を検出している画素の輝度レベルを、その他の画素と同レベルとなるように増幅させる欠陥補正を行う(S24)。カラー画像生成部42は、補正されたベイヤ配列の画像をデモザイク処理することによりカラー画像を生成する(S26)。
 出力部44は、カラー画像と距離画像のデータを順次、外部の装置あるいはメモリなどに出力する(S28)。このとき同時に法線画像のデータも出力してよい。出力先の装置からの要求に従って出力対象を切り替えてもよい。ユーザ操作などにより撮影やデータ出力を終了させる必要がなければ、S10からS28までの処理を画像フレーム単位で繰り返す(S30のN)。処理を終了させる必要が生じたら全ての処理を終了させる(S30のY)。
 なお距離画像生成部38がS22において距離画像を生成する際は、所定数の複数の画像フレームに対し生成した距離画像を蓄積し、それらを平均化したデータをその時点での距離画像として、当該複数の画像フレームに対応する時間間隔で出力するようにしてもよい。これにより、1つの画像フレームから生成した距離画像に含まれるノイズ成分の割合を軽減でき、精度の高い距離画像を出力できる。距離画像を蓄積するフレーム数は、求められる精度や時間分解能などに鑑み実験などにより最適値を求めておく。あるいは実際の撮影画像の輝度レベルなどに応じて、フレーム数を適応的に変化させてもよい。
 本実施の形態の撮像素子には、一対のフォトダイオードの上層に偏光子を設けた構造が含まれる。位相差を正確に求めるには一対のフォトダイオードで同等の輝度レベルを検出していることが前提となるが、偏光子のレイアウトによってはそのバランスが崩れることが考えられる。図11は、偏光子とフォトダイオードの位置的関係を説明するための図である。図は偏光子層230a、230b、230cとフォトダイオードの対232a、232b、232cの積層構造の断面と、上面から見たそれらの位置関係234a、234b、234cを示している。
 まず(a)のように偏光子層230aに偏光子を設けない画素の場合、入射光が損失なくフォトダイオードに到達する。したがってフォトダイオードの対により検出する輝度レベルは同等である。(b)や(c)のように偏光子層230b、230cに偏光子が存在する画素では、偏光子のワイヤでの反射によりフォトダイオードに到達する光は入射光の5割ほどになる。2つのフォトダイオードによる検出値を合計して画素値とし、カラー画像を生成する際は、上述のとおり所定値を乗算したり周囲の検出値を用いて補間したりすることにより、周囲の画素と同等の輝度レベルにできる。
 一方、(b)のように偏光子のワイヤ配列が、画素の縦方向の中心線236に対し非対称となっていると、一対のフォトダイオード232bに相対するワイヤによる被覆面積が左右で異なってしまう。これにより、一対のフォトダイオード間で検出感度に差が生じることになる。このような画素を含めて位相差画像を生成すると、正確に位相差を検出できない可能性がある。ワイヤの面積比に基づく所定値を、感度が低い方のフォトダイオードによる検出値に乗算することによりレベルを均質化することも考えられるが、ノイズをも増幅してしまい位相差の精度が向上するとは限らない。
 したがって(c)に示すように、画素の縦方向の中心線236に対し対称となるように偏光子のワイヤを配列させることが望ましい。これにより、1つの画素内でフォトダイオードにより検出される輝度レベルへの偏光子による影響を軽減できる。偏光子による光の検出感度差は、撮像素子20の面内における画素の位置によっても生じる。図12は、撮像面上の異なる位置における偏光子のワイヤ配列を模式的に示している。
 上段の側面図に示すように、撮像素子20中心近傍の画素240aでは、光がほぼ垂直に入射する一方、中心からの距離が大きくなるほど入射角度(CRA;チーフレイアングル)が大きくなる。そのため周辺部ほど偏光子のワイヤによる実効的な遮蔽効果が大きくなり、光が入射しづらくなる結果、中心部と比較し光の検出感度が低くなる。このことは、上述した位相差画像における輝度レベルのバランスのみならず、偏光を用いた法線画像や、偏光輝度を補正して生成するカラー画像においても面内分布を生じさせる。
 そのため好適には、撮像素子20上の位置によって偏光子の形状を変化させ、フォトダイオードにおける検出感度を均一にする。図示する例では中心部の画素240aと比較し、周辺部の画素240b、240cの偏光子のワイヤの幅を細くすることで入射光の損失を少なくしている。実際には中心部からの距離に応じてワイヤ幅を徐々に細くしていく。あるいは中心からの距離に応じてワイヤ高を低くしたり、幅と高さの双方を変化させたりしてもよい。
 またはワイヤの配列全体を、中心線に対し線対称に微小量だけシフトさせてもよい。例えば撮像素子20上の左側の画素240bはワイヤ配列全体を左側へ、右側の画素240cはワイヤ配列全体を右側へシフトさせる。このようにしても光の入射量を角度に応じて高めることができる。ワイヤの幅、高さ、配列のシフト量は、実際の撮影画像において面内分布を最小限とするように値を最適化する。この際、図11で説明したように、一対のフォトダイオードの感度差も最小となるようにする。
 これまで述べた態様では、全てのフォトダイオードによる検出値を個々に読み出し、画像処理部22において必要なデータを抽出したり補間したりした。この場合、一般的な画素値と比較し、データの読み出しに多くの時間を要し、フレームレートに制約が生じることが考えられる。そのため、読み出し単位を偏光子の有無によって異ならせ、読み出しに要する時間を短縮することが考えられる。図13、図14は、偏光子の有無によって読み出し単位を異ならせる場合の、データの単位と各種情報の生成経路を説明するための図である。
 図13の場合、偏光子を設けない画素260については、2つのフォトダイオードによる検出値を合算し、画素単位の値264として読み出す。一方、偏光子を設けた画素262については、2つのフォトダイオードによる検出値をそれぞれ読み出す。それらのデータは画素値取得部32を経て各機能ブロックに供給される。偏光子を設けない画素260における合算された検出値はそのままカラー画像の生成に用いることができる(S50)。
 偏光子を設けた画素262に対する2つのフォトダイオードのそれぞれにより検出された値は位相差画像の生成に用いる(S52)。またこの段階で各検出値を合算し、画素単位の値266とすることで(S54)、偏光画像の生成に用いたり、カラー画像における当該画素のカラー値の決定に用いたりする(S56、S58)。この場合、偏光子を設けた画素のみから、偏光情報と位相差情報を取得することになる。偏光子を設けた画素262の割合が低く、かつ比較的照度が高い環境においては、図示するような経路とすることにより、精度をある程度保ちつつ読み出し時間を削減でき、高速化を実現できる。
 図14の場合、偏光子を設けない画素260については、2つのフォトダイオードによる検出値をそれぞれ読み出す。一方、偏光子を設けた画素262については、2つのフォトダイオードによる検出値を合算し、画素単位の値268として読み出す。それらのデータは画素値取得部32を経て各機能ブロックに供給される。偏光子を設けない画素260に対する2つのフォトダイオードのそれぞれにより検出された値は位相差画像の生成に用いる(S60)。またこの段階で各検出値を合算し、画素単位の値270とすることで(S62)、カラー画像の生成に用いる(S64)。
 偏光子を設けた画素262における合算された検出値はそのまま偏光画像の生成に用いたり、カラー画像における当該画素のカラー値の決定に用いたりする(S66、S68)。この場合、位相差情報は偏光子を設けた画素以外から取得することになる。この場合、図13の場合と比較し位相差情報の感度を上げることができるため、照度が低い環境でも精度を維持することができる。このように偏光子の有無によって読み出し単位を異ならせることにより、必要な情報を取得しつつ読み出し時間を削減できる。
 なお求められる情報の種類や精度、解像度によっては、図13、図14で示した処理を全て行わなくてもよい。例えば偏光子を設けた画素の値はカラー画像の生成には用いず、偏光子のない周囲の画素値を補間するようにしてもよい。また各種データに必要な精度や解像度、周囲の照明環境、処理時間の制限などに応じて、読み出し単位やデータ生成の経路を最適化してよい。照度を計測したりデータ伝送のための通信環境を計測したりして、その結果に応じて切り替えてもよい。
 図15は、偏光子を設ける画素値における偏光子のバリエーションを示している。まず(a)に示す4種類の画素は、これまで述べたように1画素に対し1つの主軸角度の偏光子を設けている。そして主軸角度を45°おきに異ならせることにより、図示するような4種類の画素となる。これらの画素を等間隔、あるいは近接させて撮像素子20に配置する。偏光子を設ける画素を分散させると、反射によって輝度レベルが低くなる画素も分散するため、偏光子を設けない画素によって位相差画像やカラー画像を生成した場合に、補間によって精度よく穴を埋めることができる。
 一方、図示するような4種類の画素を2行2列の4画素などに近接させて配置すると、方位による偏光輝度の変化をほぼ同じ位置で正確に取得できるため、法線ベクトルの精度を高めることができる。(b)に示す4種類の画素は、フォトダイオードの対の片方に対応する領域のみに、4方向の主軸角度の偏光子を設けている。この場合、偏光子のない状態での輝度を同じ画素領域の他方のフォトダイオードから取得できるため、偏光子によって低くなった輝度レベルを正確に増幅させることができる。
 このようにすると位相差も比較的正確に取得できるため、撮像素子20の全体を(b)に示すような画素で構成することも考えられる。また(c)に示す画素は、フォトダイオードの対に対応する領域のそれぞれに、主軸角度の異なる偏光子を設けている。図示する例では、主軸角度が90°異なる偏光子をそれぞれ対とする2種類の画素を示している。
 位相差から距離値を取得する処理は、左右のフォトダイオードによる検出値の分布を比較することを基本としている。一方、偏光情報から法線ベクトルを取得する処理は、主軸角度が異なる偏光子を透過してなる光の検出値を比較する処理を含む。そのため(c)に示すような偏光子とすると、左右のフォトダイオードによる検出値を比較する点において、位相差を取得する処理と法線を取得する処理を共通化できるため、駆動回路をより単純化できる。
 図16は、一画素に設けるフォトダイオードのバリエーションを示している。これまで述べた例では、画素領域を縦方向に2分割した左右の領域に、フォトダイオードを1つずつ配置した。この場合、位相差は画像平面の水平方向のみに表れる。そのため図9で説明したように、水平方向のエッジなど一部の特徴点については位相差が不定となり距離値を得ることができない。そこで図示するように、1つの画素(例えば画素280)を縦横双方向に2分割してなる4つの領域に、フォトダイオードを1つずつ配置してもよい。
 この場合、縦に隣接する2つのフォトダイオードによる検出値を合算すれば、これまで述べた左フォトダイオード、右フォトダイオードと同じ位相差画像が得られ、水平方向成分の位相差を取得できる。一方、横に隣接する2つのフォトダイオードによる検出値を合算すれば、上側のフォトダイオードと下側のフォトダイオードで位相差画像が得られ、垂直方向成分の位相差を取得できる。結果として、特徴点の方向によらず距離値を求めることができる。
 なお図示する例では、各画素に1つの主軸角度の偏光子を設けているが、図15に示したように、フォトダイオード単位で偏光子の主軸角度を異ならせたり、偏光子の有無を制御したりしてもよい。また偏光子のない画素についても、同様に4分割した領域ごとにフォトダイオードを設けてよい。そのような偏光子のない画素とある画素とを周期的に配置してもよい。
 またカラーフィルタについても、画素内で同じ色としてもよいし、フォトダイオードごとに色を異ならせてもよい。このほか、横方向に2分割した上下の領域に1つずつフォトダイオードを設けてもよいし、画素領域を2行2列より細かく分割し、それぞれの領域にフォトダイオードを配置してもよい。
 撮像装置12の変形例として、これまで述べた構成を有する撮像装置を2つ設け、ステレオカメラとして実現させてもよい。図17は、撮像装置をステレオカメラで構成したときの、システムの機能ブロックの構成を示している。このシステムは、撮像装置300と情報処理装置302を含む。
 撮像装置300は、第1撮像部12a、第2撮像部12bを備える。第1撮像部12a、第2撮像部12bはそれぞれ図1で示した撮像装置12に対応し、それらを所定の間隔を有するように左右に配置することで撮像装置300とする。以後の説明では第1撮像部12aを左視点、第2撮像部12bを右視点のカメラとする。第1撮像部12a、第2撮像部12bはそれぞれが、図8で示した機能を有する画像処理部を備える。したがって撮像装置300の第1撮像部12aからは左視点の距離画像とカラー画像のデータが、第2撮像部12bからは右視点の距離画像とカラー画像のデータが出力される。
 情報処理装置302は、撮像装置300から画像のデータを取得する画像データ取得部304、それらを統合して被写体の位置や姿勢に係る総合的な情報を生成する被写体情報生成部306、およびその情報を用いて出力データを生成する出力データ生成部308を備える。画像データ取得部304は、少なくとも左右の視点のそれぞれに対し取得された距離画像とカラー画像のデータを撮像装置300から取得する。
 被写体情報生成部306は、撮像装置300から取得した距離画像を統合することにより、被写体の位置、姿勢、形状などに係る最終的な情報を生成する。すなわち被写体のうち第1撮像部12a、第2撮像部12bの一方の視点からは見えない部分について、他方の距離画像を用いてデータを補填することにより、距離が不定の部分を最小限にする。被写体情報生成部306はさらに、左右視点のカラー画像あるいは左右視点の輝度画像を用いて三角測量の原理により別途、距離画像を生成し統合してもよい。
 出力データ生成部308は、左右視点のカラー画像と距離画像を用いて表示画像など出力すべきデータを生成する。表示画像を生成する場合は、出力時にリニアマトリックス(カラーマトリックス)やガンマ補正など一般的な処理を施し表示装置に出力する。図18は、被写体情報生成部306が左右視点の距離画像を統合する処理を説明するための図である。同図上段に示すように、2つの立方体322a、322bが存在する3次元空間320を左右の視点L、Rから撮影すると、左視点画像324aおよび右視点画像324bが得られる。
 第1撮像部12aおよび第2撮像部12bが単独で距離値を取得できる領域は、それぞれ左視点画像324aおよび右視点画像324bに像として表れる部分に限られる。図示する例では、立方体322bの左側面は左視点Lからのみ見え、立方体322aの右側面は右視点Rからのみ見えるため、それらの距離値はどちらか一方の距離画像のみに含まれる。したがって被写体情報生成部306は、一方の距離画像で値が得られていない被写体上の領域に、他方の距離画像の値を当てはめることで、距離値が不定の領域を削減する。
 その結果、3次元空間320により近いモデル空間を再現することができる。つまり被写体情報生成部306は、複数視点の距離画像を統合することにより、視点が1つに限定されないワールド座標系での被写体の位置に係る情報を生成できる。当該位置は、被写体表面の微少領域ごとに得られるため、結果として被写体の姿勢や形状についても求めていることになる。
 なお両視点から見える領域については、2つの距離値が得られているため、それらの平均値を距離値とするなどにより精度を高めることができる。さらに被写体情報生成部306は、左右視点のカラー画像を用いて自らも距離画像を生成し、その結果をさらに統合してもよい。この場合、両視点から見える領域についてさらに距離値が得られるため、結果として当該領域については3つの距離値が得られることになる。それらの平均値を距離値とすれば、より精度を高めることができる。ただし要求される精度によっては、カラー画像を用いた距離画像の生成を省略することで処理時間を短縮できる。
 なお被写体情報生成部306は、さらに別の手段により距離値の穴を埋めたり、精度をさらに高めたりしてもよい。例えばニューラルネットワークを用いた機械学習としてディープラーニング(深層学習)の技術が実用化されつつある。これを利用し、カラー画像における色やその変化、像の形状などから、距離値やその変化を導出できるように、被写体情報生成部306に学習させる。そして実際に取得されたカラー画像を用いて、撮像装置の視点から見えない領域の距離値を推定したり、見えている領域の距離値を補正して精度を高めたりしてもよい。
 この手法は単眼の撮像装置12が出力する距離画像のデータに対しても同様の効果を発揮するため、撮像装置12と接続した図示しない情報処理装置に同機能を有する被写体情報生成部を設けてもよい。この機能は、撮像装置の視点が限定されている場合や輝度が十分でない撮影環境などにおいて、距離値が得られる領域を広げたり精度を高めたりするのに特に有効である。なお被写体情報生成部306を含む情報処理装置302の機能や、撮像装置300の一部の機能を、ネットワークに接続されている他の装置に設けたり、複数の装置で分担させたりして演算を行わせてもよい。このとき情報処理装置302や図示しない表示装置は、その結果を順次取得し、それに応じて適宜自らの処理を行ったり画像を表示したりしてもよい。
 また図17で示したように、撮像装置300をステレオカメラとすることで、単眼の撮像装置では見えない領域の距離値を得ることができる。これを発展させ、撮像装置12を可動とすることで、距離値が得られる領域をさらに拡張させてもよい。図19は、撮像装置12を移動させながら撮影することにより、3次元空間における被写体の位置、姿勢、形状などの状態情報を取得する手法を説明するための図である。
 図示する例は、被写体である立方体を中心とする円軌道で撮像装置12を移動させる様子を示している。ここで撮像装置12には加速度センサを設け、撮影時刻、撮影画像、および3次元空間での撮像装置12の位置や姿勢を対応づけて記録していく。そして所定レートの各撮影時刻における視点に対し得られるカラー画像と距離画像に基づき、図18の3次元空間320のようなモデル空間を、取得されたデータで埋めていく。このような処理は撮像装置12内部の距離画像生成部38で実施してもよいし、情報処理装置302の被写体情報生成部306で実施してもよい。
 撮像装置12の内部で実施するようにすると、情報処理装置302の処理の負荷を軽減でき、処理時間の増大を抑えられる。なお撮像装置12の移動のさせ方は図示するものに限らない。例えば最終的に表示させたい画像に対する仮想視点の可動範囲と対応する範囲に限定して撮像装置12を移動させてもよい。あるいは撮像装置12を自転させることにより全方位に対し撮影画像を得るようにしてもよい。またこのように撮像装置12を移動させながら取得したデータのうち、距離値については特徴点に対する値のみを蓄積していくなどの工夫によって、メモリ消費を抑えることができる。
 あるいは撮像装置12を移動させる代わりに、3つ以上の撮影画像を配置させても同様の情報を得ることができる。この場合も図示するのと同様に、光軸が被写体近傍に収束するように複数の撮像装置12を向き合うように設置する。あるいはそれとは逆向きに、光軸が外側に発散するように撮像装置12を設置してもよい、これらの場合は、同時刻におけるカラー画像と距離画像が複数の視野で得られるため、それらをスティッチング処理によりつなぎ合わせて広角の情報としてもよい。このとき、設置した複数の撮像装置のうちの一部のみ、図8で示した機能ブロックを有する撮像装置12としてもよい。
 例えば実空間において特に詳細な情報を得たい被写体を撮影する撮像装置のみ、距離画像を生成する機能を設け、それ以外の撮像装置はカラー画像のみを生成する。このようにすることで、例えば広いスタジアムの様子を全方位に渡り撮影しつつ、競技者などメインの被写体については位置や姿勢を詳細に求めることができる。これにより、加工や仮想オブジェクトの重畳など後段の処理を高精度に行うなど、処理リソースを必要な対象に集中させることができる。
 本実施の形態の撮像素子の構成によれば、偏光子を透過した光を2つのフォトダイオードにより検出するため、偏光画像の位相差を取得することができる。これを利用すると、位相差を用いた合焦機能の精度を高めることができる。図20は、偏光の位相差を利用して合焦する機能を有する撮像装置の機能ブロックを示している。撮像装置400は、各フォトダイオードによる検出値を取得する画素値取得部402、偏光子を設けた画素の2つフォトダイオードによる検出値から偏光画像の位相差を検出する偏光位相差検出部404、および偏光の位相差に基づきレンズの位置を調整し適切な位置に合焦させる合焦部406を備える。
 画素値取得部402は、少なくとも偏光子を備えた画素におけるフォトダイオードによる検出値を読み出し、A/D変換やクランプ処理など所定の前処理を実施する。偏光位相差検出部404は、左フォトダイオードおよび右フォトダイオードにより検出される偏光輝度分布を分離し、それぞれに対し4方位の偏光画像を生成する。そして式2を用いて得られる偏光度を画像平面に表した偏光度画像、あるいは偏光度から得られる法線ベクトルを画像平面に表した法線画像を、位相差画像として生成する。図にはそのようにして生成された、偏光を用いた位相差画像410a、410bを示している。
 また図の下段には、一般的な自然光の位相差画像412a、412bを比較用に示している。図示する例では円板状の被写体が写っている。被写体の表面が単色で比較的滑らかな形状の場合、一般的な自然光の位相差画像412a、412bでは、被写体の輪郭線が特徴点として得られる一方、被写体表面については情報が乏しい。照明によっては被写体表面に凹凸があっても輝度の変化が小さく特徴点として捉えられないこともある。そのためこれらの画像412a、412bの特徴点の位置を矢印に示すように特定し、その位相差から合焦させる場合、情報の乏しさから正確な調整ができないことが考えられる。
 一方、偏光度あるいは法線ベクトルを表した位相差画像410a、410bは、被写体表面の起伏を表すため、自然光の画像より形状に対する感度が高く、照明の影響を受けにくい。そのため、見かけは一様な像であっても、図示するように形状に応じた変化が画像として表れる。したがって、矢印で示すように位相差の根拠となる特徴点の位置がより多く得られる。これらの位置関係を統合して位相差を導出し、それに基づき合焦処理を行えば、より正確かつ迅速な調整を実現できる。
 合焦部406は一般的な合焦処理と同様、位相差に基づきレンズの適切な位置を導出し調整を実施する。なお図示した撮像装置400は、合焦機能のみに着目した機能ブロックを示しているが、図8で示した画像処理部22と組み合わせることにより、高精度に合焦させてなる輝度データに基づく距離画像やカラー画像を出力できるようにしてもよい。
 以上述べた本実施の形態によれば、撮像素子として、1つのマイクロレンズに対し複数のフォトダイオードを設けるとともに、少なくとも一部のマイクロレンズとフォトダイオードの中間層に、偏光子を設けた構造とする。これにより偏光画像と位相差画像を同時に取得できる。そして位相差に基づき被写体の特徴点における距離を求め、偏光から得られる法線ベクトルを用いて特徴点の間の距離を補完することにより、単眼カメラでありながら撮影画像の広い領域に対し距離値を得ることができる。
 一般的なステレオカメラを用いた測距技術では、一方の視点の画像に写っていても他方の視点の画像に写っていない被写体上の面については距離が不定になってしまう。本実施の形態の上記手法によれば、撮影画像に写っていれば距離を導出できるため、場合によってはステレオカメラを用いるより多くの距離データが得られる。このためステレオカメラの代わりとして用いることができ、測距機能を有する撮像装置を小型化できる。
 また、そのような撮像装置をステレオカメラとして実現すれば、左右の撮影画像の結果を統合できるため、さらに広い範囲の距離値が得られ、3次元空間における被写体の位置や姿勢を精度よく再現できる。さらに左右視点のカラー画像を用いて従来どおり距離画像を求め統合することにより、距離情報の精度をより向上させることができる。これらの手法は赤外光など特定の波長帯の光に依存しないため、屋外などでも同様に情報を得ることができる。
 また偏光子を設ける画素と設けない画素を適切に制御できるため、従来通りの輝度レベルでカラー画像や位相差画像を生成することができる。これにより、後段の処理が制限されるといったことなくあらゆる情報処理への応用が可能である。また、位相差に基づく距離値の取得、偏光に基づく法線画像の生成、および、それらを統合して距離画像を生成する処理は基本的に、画像平面の行単位あるいは数行単位で行えるため、ラインバッファを用いることにより撮像装置内の演算回路で実装できる。そのため各種データを用いた情報処理や表示処理を行う装置と機能を分担でき、高いフレームレートでの撮影や表示に対応させることができる。
 さらに偏光の位相差を取得できるため、自然光の画像では特徴点として抽出されないような起伏の乏しい被写体表面であっても、形状の変化を特徴点として高い感度で抽出できる。したがって位相差の根拠となる情報を多く得ることができ、従来の合焦機能の精度をより高めることができる。なおステレオカメラとして実現する場合も、偏光度画像や法線画像を利用することにより、自然光の輝度画像より多くの特徴点が得られるため、左右視点の画像から対応点を取得することによる距離画像の生成精度も高めることができる。
 以上、本発明を実施の形態をもとに説明した。上記実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
 例えば本実施の形態ではフォトダイオードを用いたが、光を電荷に変換する機構であれば、検出主体はフォトダイオードに限らない。例えば一部、または全てのフォトダイオードを、有機光電変換膜としてもよい。例えば国際公開2014/156659号などに記載される公知技術を用いて、有機光電変換膜の材料や構造を適宜決定することができる。
 また、赤外線など所定の波長帯の光を照射することによる測距技術と組み合わせてもよい。すなわち撮像装置12に参照光を照射する機構を設け、フォトダイオードによってその反射光を検出する。参照光をランダムなパターンで照射することにより、特徴点の乏しい被写体表面でも特徴点を作り出すことができる。画像処理部における処理は本実施の形態と同様であるが、位相差の根拠となる特徴点が多いため、位相差に基づく距離値を、より多くの箇所で取得できる。したがって法線ベクトルを用いた補完の精度が向上し、より正確に距離の情報を得ることができる。撮像装置12にさらに照度センサを設け、照度が所定値より低い場合に参照光を照射するようにして、照度低下による解析精度の悪化を防止してもよい。
 さらに本実施の形態における撮像装置は、カラー画像の取得が主たる機能である一般的なカメラで実現してもよいし、撮像機能を有するその他の装置に設けてもよい。例えば高機能携帯電話、携帯端末、パーソナルコンピュータ、カプセル内視鏡、ウェアラブル端末などに設けてもよい。このような装置においてカラー画像を取得する必要がない場合、欠陥補正部40やカラー画像生成部42の機能を省略し、距離画像のみを出力するようにしてもよい。この場合、撮像素子のカラーフィルタ層を省略してもよい。
 また本実施の形態の撮像素子は原則として、全ての画素領域を部分領域に分割し、それぞれにフォトダイオードを配置したが、部分領域に分割せず1つのマイクロレンズに対応させて1つのフォトダイオードを設けた画素が含まれていてもよい。例えば偏光子を設けた画素については1つのフォトダイオードを設けてもよい。この場合、位相差画像はその他の画素から取得する。あるいは逆に、偏光子を設けた画素のみ複数のフォトダイオードを設けてもよい。いずれの場合も、本実施の形態で述べた検出値の合算処理を省略して、同様の効果を得ることができる。
 (実施の形態)
 本発明の実施の形態は、上記の関連技術と適宜組み合わせ可能である。以下、本発明の実施の形態として第1実施例~第5実施例を説明する。
 (第1実施例)
 第1実施例の撮像装置の概要を説明する。図21(a)(b)および図22(a)(b)は、従来におけるカメラの配置態様と、第1実施例におけるカメラの配置態様を対比して示す。また、図21(a)(b)および図22(a)(b)は、カメラを正面(言い換えれば被写体側)から見た外観を示しており、すなわち、カメラのレンズの並びを模式的に示している。
 図21(a)は、従来におけるカメラの配置態様を模式的に示す。従来、視差を反映した右目画像および左目画像(総称して「視差画像」とも呼ぶ。)を得るために、2つの大型カメラ502が瞳孔間距離IPD(Inter-Pupillary Distance、典型的には60ミリ~70ミリ)離して設けられることがあった。この場合、破線で示す撮像装置のサイズ、言い換えれば、カメラシステムのサイズが大きくなり問題が生じることがあった。
 図21(b)は、第1実施例におけるカメラの配置態様を模式的に示す。第1実施例の撮像装置500の一態様では、或る被写体を撮像する1つの大型カメラ502の左右に、同じ被写体を撮像する複数の小型カメラ504を設けた。大型カメラ502は、光学サイズが相対的に大きく、小型カメラ504は、光学サイズが相対的に小さい。典型的には、大型カメラ502は、小型カメラ504よりレンズのサイズが大きい。同図の例では、IPDだけ離して設けた2つの小型カメラ504による撮像画像を視差画像として取得することができ、また、視差画像の画質を大型カメラ502による撮像画像を用いて向上することができる。
 図22(a)も、従来におけるカメラの配置態様を模式的に示す。従来、縦方向の示唆画像を得るためには大型カメラ502を縦方向に並べる必要があり、撮像装置のサイズがさらに大きくなる。例えば、縦方向のカメラ間距離がIPDを超過することがあり、すなわち、サイズおよびIPDの制限における問題が生じることがあった。
 図22(b)も、第1実施例におけるカメラの配置態様を模式的に示す。第1実施例の撮像装置500の一態様では、大型カメラ502の左右および上下に、複数の小型カメラ504を設けた。この態様によると、撮像装置500のサイズの増大を抑制しつつ、左右の視差画像に加えて上下の視差画像を得ることができる。
 第1実施例の撮像装置500は、ヘッドマウントディスプレイ(以下「HMD」とも呼ぶ。)に表示させる視差画像、および/または、広角画像を生成する。図23は、実施例の撮像装置500の機能構成を示すブロック図である。撮像装置500は、1つの大型撮像部510と、2つの小型撮像部512と、画像処理部514を備える。
 本明細書のブロック図において、さまざまな処理を行う機能ブロックとして記載される各要素は、ハードウェア的には、回路ブロック、メモリ、その他のLSIで構成することができ、ソフトウェア的には、メモリにロードされたプログラムなどによって実現される。したがって、これらの機能ブロックがハードウェアのみ、ソフトウェアのみ、またはそれらの組合せによっていろいろな形で実現できることは当業者には理解されるところであり、いずれかに限定されるものではない。例えば、図23の複数の機能ブロックに対応する複数のモジュールを含むコンピュータプログラムが撮像装置500ストレージにインストールされてもよい。撮像装置500のCPUまたはGPUは、そのコンピュータプログラムをメインメモリへ読み出して実行することにより、各機能ブロックの機能を発揮してもよい。
 大型撮像部510は、図21(b)の大型カメラ502に対応し、撮像装置500の前方に存在する被写体を撮像する。被写体は、例えば、3次元空間とそこに存在する物体を含む。小型撮像部512は、図21(b)の小型カメラ504に対応し、上記被写体を撮像する。大型撮像部510の光学サイズは、小型撮像部512の光学サイズより大きく、大型撮像部510は、小型撮像部512より高画質の画像を得ることができる。
 第1実施例では、図21(b)と同様に、大型撮像部510の左右に近接させて2つの小型撮像部512を配置する。変形例として、大型撮像部510の上下(さらには斜め位置)に複数の小型撮像部512を配置してもよい。例えば、視差を得るべき方向に、3つ以上の小型撮像部512を配置してもよい。
 画像処理部514は、大型撮像部510により撮像された画像と、小型撮像部512により撮像された画像とに基づいて、外部装置へ出力するデータを生成する。画像処理部514は、特性記憶部520、画素データ取得部522、調整部524、生成部526、出力部528を含む。
 特性記憶部520は、大型撮像部510により撮像された画像の特性に関するデータ(以下「特性データ」とも呼ぶ。)を記憶する。また、特性記憶部520は、複数の小型撮像部512のそれぞれにより撮像された画像の特性データを記憶する。特性データは、各撮像部の撮像素子から取得された画素値の特性を示すデータとも言える。また、特性データは、色相、明度、彩度のうち少なくとも1つの特徴または傾向を示すデータを含んでもよい。また、特性データは、大型撮像部510により撮像された画像の特性と、複数の小型撮像部512のそれぞれにより撮像された画像の特性とが相違する場合に、相違の内容や度合いを示すデータを含んでもよい。
 なお、特性記憶部520に記憶される特性データは、撮影後のデータから算出された特性を示すものであってもよいが、カメラ(大型撮像部510、小型撮像部512のそれぞれ)もしくは撮像素子(イメージセンサ)の製造時のテスト工程において、画像の特性を計測し、カメラもしくは撮像素子のROM(特性記憶部520)に格納しておいてもよい。テスト工程における特性計測の例として、単体のカメラもしくは撮像素子の製造後のテスト工程において、レンズ、照度、波長等を変えたときに得られる画素からの信号、ノイズ等を計測してもよい。別の例として、複数台のカメラ(例えば大型撮像部510と小型撮像部512)を組み合わせた後のスティッチング位置のズレや明暗差、色差を、複数台のカメラの組み合わせた後のテスト工程において計測してもよい。
 画素データ取得部522は、大型撮像部510により撮像された画像のデータ、すなわち各画素の値を取得する。また、画素データ取得部522は、複数の小型撮像部512のそれぞれにより撮像された画像のデータ、すなわち各画素の値を取得する。
 大型撮像部510により撮像された画像の特性と、複数の小型撮像部512のそれぞれにより撮像された画像の特性とは異なることがある。例えば、大型撮像部510により撮像された画像は赤味を帯びる一方で、小型撮像部512により撮像された画像は青味を帯びることがある。この場合、両者の画像を合成した画像の色彩が不自然になってしまうことがある。そこで、調整部524は、特性記憶部520に記憶された特性データに基づいて、大型撮像部510により撮像された画像の特性と、複数の小型撮像部512のそれぞれにより撮像された画像の特性とを一致させるよう調整する。
 具体的には、調整部524は、複数の小型撮像部512のそれぞれにより撮像された画像の特性を、大型撮像部510により撮像された画像の特性に一致させるように、複数の小型撮像部512のそれぞれにより撮像された画像を補正する。例えば、特性記憶部520は、大型撮像部510により撮像された画像の特性と、複数の小型撮像部512のそれぞれにより撮像された画像の特性との差異を示す特性データを記憶してもよい。この場合、調整部524は、特性データが示す差異を相殺するように、複数の小型撮像部512のそれぞれから取得された画素値を調整してもよい。
 このように、大型撮像部510の画像と小型撮像部512の画像が同等の特性になるように調整することで、両者の画像に基づいて自然な見栄えの画像を生成することができる。また一般的に、画像を補正すると画質が低下する。そこで、大型撮像部510により撮像された高画質の画像には手を加えず、小型撮像部512により撮像された低画質の画像を補正することで、大型撮像部510により撮像された高画質の画像の画質低下を抑制できる。これにより、大型撮像部510の画像と小型撮像部512の画像を合成した画像についても画質低下を抑制できる。特に、大型撮像部510の画像を、ユーザの視野の内側(すなわちユーザの目の解像度が高い領域)に表示する場合に好適である。
 調整部524は、大型撮像部510により撮像された画像のデータと、複数の小型撮像部512のそれぞれにより撮像された画像のデータ(上記補正後のデータ)を生成部526へ入力する。生成部526は、入力された複数種類の画像のデータに基づいて、外部装置へ出力するデータを生成する。実施例ではVR画像、AR画像、または広角画像を生成する。
 出力部528は、生成部526により生成されたデータを所定の外部装置(情報処理装置等)へ送信する。実施例の出力部528は、生成部526により生成されたVR画像、AR画像、または広角画像をHMDへ送信して、HMDの画面に表示させる。なお、出力部528は、生成部526により生成されたデータを所定の記憶装置や記録メディアへ格納してもよい。
 生成部526の具体的な処理を説明する。
 生成部526は、大型撮像部510により撮像された画像と、複数の小型撮像部512により撮像された画像とを合成し、合成した結果の広角画像を出力部528へ出力してもよい。図24は、画像合成の例を示す。中央画像530は、大型撮像部510により撮像された比較的高画質の画像である。左画像532aは、大型撮像部510の左側に設置された小型撮像部512により撮像された比較的低画質の画像である。右画像532bは、大型撮像部510の右側に設置された小型撮像部512により撮像された比較的低画質の画像である。図24では、低画質の領域に斜線を付している。
 生成部526は、左画像532aを中央画像530の左側に合成し、右画像532bを中央画像530の右側に合成することにより合成画像534を生成してもよい。これにより、大型撮像部510では撮像できないオクルージョン領域を補完した広角画像を合成画像534として得ることができる。人間の目の解像度は中心ほど高く、周辺領域ほど低い。合成画像534の中心部分は高画質であり、すなわち、人の目に好適な広角画像を提供することができる。
 また、生成部526は、画像を合成する位置に応じて合成比率(言い換えればブレンド率)を変化させてもよい。例えば、生成部526は、中央画像530と左画像532a(右画像532bも同様)との重複部分のうち、周辺領域に近づくほど左画像532aの画素値の反映割合を高くしてもよい。逆に、中央領域に近づくほど中央画像530の画素値の反映割合を高くしてもよい。これにより、中央画像530と左画像532a(右画像532bも同様)との画質の違いにより、ユーザが合成画像534に対して違和感を抱くことを抑制できる。
 また、生成部526は、大型撮像部510により撮像された画像と、複数の小型撮像部512により撮像された複数の画像のうち少なくとも2つに基づいて、視差に関するデータと被写体までの距離に関するデータの少なくとも一方を生成してもよい。距離に関するデータは、深度情報とも言える。
 図21(b)で示したように、2つの小型撮像部512の距離がIPDに等しい場合、生成部526は、2つの小型撮像部512のそれぞれにより生成された画像をHMDに表示させる視差画像として決定してもよい。例えば、生成部526は、左側の小型撮像部512により撮像された画像(「左画像」と呼ぶ。)を左目用画像、右側の小型撮像部512により撮像された画像(「右画像」と呼ぶ。)を右目用画像として決定してもよい。
 この場合に、生成部526は、大型撮像部510で撮像された画像(「中央画像」と呼ぶ。)と左画像との対応関係を記憶してもよい。この対応関係は、例えば、一方の画像の画素と他方の画像の画素との対応関係であってもよく、被写体の同じ部分(位置)を撮像する画素の対応関係であってもよい。生成部526は、左画像における各画素の値を、中央画像において対応する画素の値に基づいて補正してもよく、例えば置き換えてもよい。同様に、生成部526は、右画像と中央画像との対応関係を記憶し、右画像における各画素の値を、中央画像において対応する画素の値に基づいて補正してもよい。これにより、左目用画像と右目用画像の画質を向上することができる。
 また、生成部526は、中央画像のデータ、左画像のデータ、右画像のデータに基づいて、左目用画像と右目用画像を新たに生成してもよい。この場合、左側の小型撮像部512と右側の小型撮像部512との距離は、IPDと異なってもよく、例えば100ミリ以上であってもよい。
 図25は、第1実施例における生成部526の処理を示すフローチャートである。生成部526は、左画像と右画像間の視差(言い換えれば、被写体の撮像位置のずれの大きさ)を検出する。また、生成部526は、左画像と中央画像間の視差を検出する。また、生成部526は、右画像と中央画像間の視差を検出する(S10)。生成部526は、S10で検出した視差に基づいて、被写体までの距離を推定する(S12)。
 例えば、生成部526は、左画像と右画像間の視差に基づく三角測量により、被写体までの距離を示す第1の距離データを生成してもよい。また、生成部526は、左画像と中央画像間の視差に基づく三角測量により、被写体までの距離を示す第2の距離データを生成してもよい。また、生成部526は、右画像と中央画像間の視差に基づく三角測量により、被写体までの距離を示す第3の距離データを生成してもよい。生成部526は、第1~第3の距離データとして、被写体までの距離を画素値として表した距離画像を生成してもよい。生成部526は、第1~第3の距離データを平滑化等することにより、最終的な距離の推定値を生成してもよい。
 生成部526は、左画像、中央画像、右画像それぞれのRGBデータを取得し(S14)、左画像、中央画像、右画像を合成した合成画像(例えば図24の合成画像534)を生成する(S16)。なお、S12~S14の処理と、S14~S16の処理の順序に制約はなく、両方の処理を並行して実行してもよい。
 生成部526は、被写体までの距離に基づいて、HMDを装着したユーザの目の位置に適合する視差情報を三角測量の逆算により生成する(S18)。生成部526は、S18で求めた視差情報に基づいて、左目用画像および右目用画像を生成する(S20)。例えば、S16で生成した合成画像から、S18で生成した視差情報が示すずれを有する左目用画像および右目用画像を抽出してもよい。生成部526は、左目用画像および右目用画像を出力部528へ出力し、HMDに表示させる(S22)。なお、生成部526は、距離画像を出力部528へ出力し、出力部528は、その距離画像を所定の外部装置へ送信してもよい。
 第1実施例の撮像装置500によると、装置の大型化を抑制しつつ、縦方向を含む様々な方向の視差画像、および広角画像を得ることができる。また、装置の大型化を抑制しつつ、画像の画質を担保しやすくなる。
 (第2実施例)
 第2実施例以降、第1実施例に対応する構成要素に、第1実施例と同じ符号を付して説明する。また、第2実施例以降、第1実施例と異なる点を主に説明し、重複する説明は適宜省略する。
 図26は、第2実施例の撮像装置500の構成を模式的に示す。同図は、撮像装置500を上から見た構成を示している。撮像装置500は、複数の大型撮像部510(図26では3台)と、複数の小型撮像部512(図26では2台)を備える。複数の大型撮像部510は、互いに異なる方向の被写体を撮像し、図26では45°ずつずれた方向を撮像する。少なくとも1つの小型撮像部512(第2実施例では全ての小型撮像部512)は、複数の大型撮像部510の間に設けられる。生成部526は、複数の大型撮像部510により撮像された複数の画像と、複数の小型撮像部512により撮像された複数の画像を合成した広角画像(図26では180°の画像)を生成してもよい。
 図26では、大型撮像部510の画角を破線で示し、小型撮像部512の画角を一点鎖線で示している。複数の大型撮像部510の間に小型撮像部512を設けることにより、大型撮像部510の近接領域に死角540が生じることを防止できる。
 また、図26で示すように、複数の大型撮像部510のレンズ先端部542は、複数の小型撮像部512のレンズ先端部544より被写体の近くになるよう構成される。言い換えれば、複数の大型撮像部510のレンズ先端部542を結んだ円より、複数の小型撮像部512のレンズ先端部544を結んだ円が内側になる(半径が小さくなる)ように構成される。これにより、大型撮像部510の画角に小型撮像部512が含まれることを防止でき、言い換えれば、大型撮像部510により撮像された高画質画像に小型撮像部512が映りこんでしまうことを防止できる。
 (第3実施例)
 図27は、第3実施例の撮像装置500の構成を模式的に示す。同図は、撮像装置500を正面から見た構成を模式的に示している。撮像装置500は、複数の大型撮像部(大型撮像部510a、大型撮像部510b)と、複数の小型撮像部(小型撮像部512a~小型撮像部512f)を備える。大型撮像部510aと大型撮像部510bは、同一方向を撮像し、言い換えれば、同一方向に存在する被写体を撮像する。
 小型撮像部512a、小型撮像部512b、小型撮像部512cは、大型撮像部510aの周辺に配置され、小型撮像部512d、小型撮像部512e、小型撮像部512fは、大型撮像部510bの周辺に配置される。小型撮像部512a~小型撮像部512fのそれぞれは、大型撮像部510aおよび大型撮像部510bと同一方向を撮像する。なお、大型撮像部の斜め位置に小型撮像部をさらに配置してもよい。
 第3実施例では、大型撮像部510aと大型撮像部510bは、IPDの分離れた位置に設けられる。生成部526は、大型撮像部510aで撮像された高画質画像に基づいて右目用画像を生成し、大型撮像部510bで撮像された高画質画像に基づいて左目用画像を生成する。変形例として、大型撮像部510aと大型撮像部510bの距離はIPDと異なってもよい。その場合、複数の大型撮像部により撮像された高画質画像と、複数の小型撮像部により撮像された低画質画像とに基づいて被写体までの距離を求め、その距離に基づいて、右目用画像および左目用画像を生成してもよい。
 第3実施例では、撮像装置500は、HMDに搭載されたセンサ(加速度センサ、ジャイロセンサ等)の出力信号、および/または、所定のカメラがHMDの外観を撮像した画像に基づいて、HMDの姿勢を検出する姿勢検出部をさらに備える。姿勢検出部は、HMDの姿勢として、HMDを装着したユーザの視線方向と、ユーザの視線の傾き(言い換えれば、両目を結ぶラインの傾き)を検出する。
 撮像装置500の生成部526は、姿勢検出部により検出された視線方向、および/または、視線の傾きに応じて、複数の撮像部により撮像された複数の画像のうち一部の画像を選択してもよい。生成部526は、選択した画像に基づいて、右目用画像と左目用画像を生成してもよい。例えば、ユーザの視線が、左が上、右が下の斜めに傾いている場合、生成部526は、小型撮像部512aによる撮像画像を使用して左目用画像を生成し、小型撮像部512fによる撮像画像を使用して右目用画像を生成してもよい。この場合、第1実施例で説明したように、生成部526は、大型撮像部510aと大型撮像部510bによる撮像画像を使用して、左目用画像と右目用画像の画質を向上させてもよい。
 また、図27の小型撮像部512bと小型撮像部512eは、IPDよりも離れた位置に設けられる。生成部526は、ユーザの視線方向がそれまでより左に移動した場合、小型撮像部512bによる撮像画像を使用して左目用画像を生成してもよい。例えば、生成部526は、大型撮像部510aによる撮像画像と、小型撮像部512bによる撮像画像とを使用して、左目用画像を生成するための被写体までの距離データ、被写体の色彩データを導出してもよい。
 同様に、生成部526は、ユーザの視線方向がそれまでより右に移動した場合、小型撮像部512eによる撮像画像を使用して右目用画像を生成してもよい。このように、第3実施例では、複数の大型撮像部それぞれの上下左右や斜め位置に小型撮像部を配置することにより、ユーザの視線方向の変化や視線の傾きの変化に応じた適切な視差画像をユーザへ提示しやすくなる。
 ところで、HMDに表示させる右目用画像および左目用画像を生成するために必要な被写体までの距離を求めるには、複数の撮像部により上記被写体を撮像した複数の画像が必要である。しかし、大型撮像部510aによる撮像画像と、大型撮像部510bによる撮像画像の間には、一方の画像にしか写っていない領域(オクルージョン領域)が存在する。そのため、大型撮像部510aによる撮像画像と、大型撮像部510bによる撮像画像だけでは、オクルージョン領域における視差が求められず、オクルージョン領域における被写体までの距離を求めることができない。
 そこで、第3実施例では、大型撮像部で生じる視差のオクルージョンを、小型撮像部による撮像データにより補間する。具体的には、生成部526は、大型撮像部510aにより撮像された画像の中の、大型撮像部510bにより撮像された画像には映らないオクルージョン領域における被写体までの距離を、大型撮像部510aの周辺に設置された小型撮像部512a、小型撮像部512b、または小型撮像部512cにより撮像された画像に基づいて導出する。これにより、大型撮像部510aによる撮像画像と、大型撮像部510bによる撮像画像の少なくとも一方に含まれる領域における被写体までの距離を漏れなく求めることができる。
 (第4実施例)
 第4実施例の撮像装置500は、機械学習(ディープラーニング等)の結果を利用することにより出力データの品質を高める。
 第4実施例の撮像装置500は、機械学習の結果を記憶する学習結果記憶部(不図示)をさらに備える。学習結果記憶部は、(1)複数の撮像部から得られた複数の画像に基づいて被写体までの距離を求めるための第1学習結果と、(2)小型撮像部512により撮像された画像を、大型撮像部510により撮像された画像により補正するための第2学習結果を記憶する。
 第1学習結果は、複数の撮像部から得られた複数の画像間の視差と、被写体までの距離との組み合わせに基づく機械学習の結果であって、複数の画像間の視差が入力された場合に被写体までの距離を出力するプログラムであってもよい。また、第1学習結果は、複数の画像間の視差と、被写体までの距離との対応関係を示すデータであってもよい。また、第1学習結果は、「特開2016-157188号公報」に開示されているように、撮像画像のRGB情報に基づいて、被写体までの距離を出力するプログラムであってもよい。
 第2学習結果は、被写体が大型撮像部510の撮像範囲から、小型撮像部512の撮像範囲へ移動する物体の場合に、大型撮像部510の撮像画像(例えば中央画像)が示す上記物体の形状に基づき、小型撮像部512の撮像画像(例えば左画像または右画像)に対して上記物体の画像を設定するプログラムであってもよい。また、第2学習結果は、同じ物体が中央画像、左画像、右画像に跨って映っている場合に、中央画像530の物体の形状を基に物体を識別し、その物体の本来あるべき形状を左画像および右画像に反映させるプログラムであってもよい。前者の第2学習結果に関連する技術は「特開2012-203439号公報」にも開示されている。後者の第2学習結果に関連する技術は「特開2005-128959号公報」と「特開2005-319018号公報」にも開示されている。
 第1実施例で説明したように、撮像装置500の生成部526は、大型撮像部510により撮像された画像と、複数の小型撮像部512により撮像された画像のうち少なくとも2つに基づいて、被写体までの距離に関するデータを生成する。第4実施例では、生成部526はさらに、学習結果記憶部に記憶された第1学習結果に基づいて、被写体までの距離に関するデータを補正する。また、生成部526は、大型撮像部510により撮像された画像と、学習結果記憶部に記憶された第2学習結果に基づいて、小型撮像部512により撮像された画像を補正する。
 図28は、第4実施例における生成部の処理を示すフローチャートである。図28のS30、S32は、図24のS10、S12と同じであるため説明を省略する。生成部526は、第1学習結果にしたがって、S32で推定した被写体までの距離を補正する(S34)。例えば、S32で求めた距離と、第1学習結果により求めた距離との平均値を補正後の距離としてもよい。図28のS36は、図24のS14と同じであるため説明を省略する。
 生成部526は、第2学習結果にしたがって、S36で取得したRGBデータを補正する(S38)。例えば、中央画像530の中で識別された物体を示すRGBデータを、左画像532aまたは右画像532bのRGBデータへ反映させてもよい。以下のS40~S46は、図24のS16~S22と同じであるため説明を省略する。なお、S34の補正処理と、S38の補正処理のいずれか一方を実行する構成でもよい。
 (第5実施例)
 大型撮像部510と複数の小型撮像部512は、レンズが撮像部単位で個別に設けられる一方、各撮像部の撮像素子(イメージセンサ)が同一基板上に形成されてもよい。上記基板では、或る撮像部のレンズを透過した光を検知すべき撮像素子が、他の撮像部のレンズを透過した光を検知しないよう内部に遮蔽部材(仕切り)が設けられてもよい。
 撮像装置500の画素データ取得部522は、撮像素子における大型撮像部510に対応する領域の画素値を、大型撮像部510により撮像された画像の画素値として取得する。また、画素データ取得部522は、撮像素子における小型撮像部512a(または小型撮像部512b)に対応する領域の画素値を、小型撮像部512a(または小型撮像部512b)により撮像された画像の画素値として取得する。この態様によると、複数の撮像部が単一基板上の撮像素子を共有するため、撮像装置500の部品点数を低減でき、また、撮像装置500の製造コストを低減できる。
 第5実施例の撮像装置500では、画像処理部514が撮像素子内に設けられてもよい。具体的には、関連技術に既述したように、撮像装置500は、画像処理部514の機能を実装したロジック回路(および/または制御回路)を画素配列の下層に設けた積層型のイメージセンサとして構成されてもよい。これにより、当該イメージセンサ内で多くの画像処理が完結するため、処理を高速化できるとともに、後段の処理が軽量化され、外部装置の処理負荷を低減できる。
 以上、本発明を第1実施例~第5実施例をもとに説明した。これらの実施例は例示であり、各構成要素あるいは各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。以下、変形例を示す。
 第1変形例を説明する。1つ以上の大型撮像部510と複数の小型撮像部512の少なくとも1つに、レンズを透過した光のうち所定方位の偏光成分を透過させる偏光子を設けてもよい。具体的には、大型撮像部510と小型撮像部512のそれぞれは、関連技術の図1に示すように、結像光学系14、絞り18、撮像素子20を含んでもよい。撮像素子20は、画素の2次元配列を含んでもよく、この画素は、マイクロレンズ、偏光子、フォトダイオードを一体的に積層させた構造を有してもよい。
 複数種類の主軸角度を有する複数種類の偏光子が、複数の撮像部(もしくは単一の撮像部内の画素単位)に設けられてもよい。第1変形例によると、偏光画像(もしくは複数方向に対応する複数種類の偏光画像)を得ることができる。これにより、偏光画像を利用して被写体表面の法線ベクトルを求めることができる。
 第1変形例に関連する第2変形例を説明する。1つ以上の大型撮像部510と複数の小型撮像部512の少なくとも1つに、マイクロレンズを透過した光を電荷に変換する単位であるフォトダイオード(光電変換部)を含む画素の配列において、1つのマイクロレンズに対応する画素領域を分割してなる複数の部分領域のそれぞれにフォトダイオードを設けてもよい。関連技術に記載したように、1つのマイクロレンズに対し複数のフォトダイオードを設けることにより、入射光を2つの画像に分割してなる位相差画像を取得することができる。そして、位相差画像が示す位相差を利用して、被写体までの距離を取得することができる。
 第3変形例を説明する。1つ以上の大型撮像部510と複数の小型撮像部512の少なくとも1つに、4つ以上の波長帯を検出可能な画素(ここでは「特殊画素」と呼ぶ。)を設けてもよい。4種類以上の波長帯は、例えば、第1波長帯(赤)、第2波長帯(緑)、第3波長帯(青)と、それ以外の波長帯(例えば黄、マゼンタ等)を含むものでもよい。また、可視光以外の波長帯(赤外、紫外等)を含むものでもよい。4種類以上の波長帯に関するデータは、マルチスペクトルデータとも呼ばれ、ハイパースペクトルデータとも呼ばれる。
 第3変形例の撮像装置500は、4種類以上の波長帯の検出結果(すなわちスペクトルの特徴)と、被写体である物体との予め定められた対応関係を示すデータを記憶するスペクトルデータ記憶部をさらに備えてもよい。生成部526は、スペクトルデータ記憶部に記憶された対応関係を参照して、特殊画素を含む撮像部から出力された4種類以上の波長帯の検出結果を取得し、その検出結果に対応する物体を特定してもよい。生成部526は、特定した物体の領域に、特定した物体に予め対応付けられた色彩のデータ(画素値)を設定した出力用の画像を生成してもよい。
 また、スペクトルデータ記憶部は、4種類以上の波長帯の検出結果と、光源の種類との対応関係を示すデータを記憶してもよい。光源の種類は、例えば、太陽、蛍光灯、LEDを含んでもよい。生成部526は、特殊画素を含む撮像部から出力された4種類以上の波長帯の検出結果を取得し、その検出結果に対応する光源を特定してもよい。そして生成部526は、特定した光源に応じた色彩を設定した出力用の画像を生成してもよい。第3変形例によると、可視光では識別が困難な物体(例えば水とアルコール)の識別が容易になる。また、光源の推定が容易になる。
 第4変形例を説明する。小型撮像部512により撮像された画像には、光ショットノイズ等の雑音が含まれる。小型撮像部512は光学サイズが小さいため、周囲が暗くなると、小型撮像部512の撮像画像の信号雑音比は小さくなりやすい。言い換えれば、小型撮像部512は、大型撮像部510よりも撮像画像の信号雑音比が悪化しやすい。
 第4実施例では、撮像装置500は、複数の小型撮像部512のそれぞれにより撮像された画像の信号雑音比を計測する計測部をさらに備える。生成部526は、複数の小型撮像部512のそれぞれにより撮像された画像に対して、その信号雑音比に応じて画素加算を実行する。画素加算には公知の方法手法を採用してよい。例えば、生成部526は、信号雑音比が所定の閾値未満になった小型撮像部512の撮像画像について、隣接する複数個(例えば2個)の画素を仮想的な1画素として、複数個の画素値の合計を仮想的な1画素の画素値に設定することにより、上記小型撮像部512の撮像画像を補正してもよい。第4変形例によると、小型撮像部512による撮像画像の、周囲の環境変化に伴う信号雑音比の悪化を抑制できる。
 なお、上述した実施例では、複数の撮像部と、画像処理部514とを備える撮像装置500を説明した。変形例として、大型撮像部510および小型撮像部512に対応する互いに独立した複数の撮像装置と、画像処理部514の機能を含む情報処理装置とを備え、複数の撮像装置と情報処理装置とが連携するカメラシステムが構築されてもよい。各実施例および変形例に記載の技術は上記カメラシステムにも適用可能である。
 上述した実施例および変形例の任意の組み合わせもまた本発明の実施の形態として有用である。組み合わせによって生じる新たな実施の形態は、組み合わされる実施例および変形例それぞれの効果をあわせもつ。また、請求項に記載の各構成要件が果たすべき機能は、実施例および変形例において示された各構成要素の単体もしくはそれらの連携によって実現されることも当業者には理解されるところである。
 500 撮像装置、 510 大型撮像部、 512 小型撮像部、514 画像処理部、 520 特性記憶部、 522 画素データ取得部、 524 調整部、 526 生成部、 528 出力部。
 本発明は、画像を処理する装置またはシステムに適用できる。

Claims (18)

  1.  被写体を撮像する第1撮像部と、
     前記第1撮像部の周辺位置に設置され、前記被写体を撮像する第2撮像部であって、前記第1撮像部より光学サイズが小さい複数の第2撮像部と、
     前記第1撮像部により撮像された画像と、前記複数の第2撮像部により撮像された画像とに基づいて出力用のデータを生成する画像処理部と、
     を備えることを特徴とする撮像装置。
  2.  前記画像処理部は、前記第1撮像部により撮像された画像と、前記複数の第2撮像部により撮像された画像のうち少なくとも2つに基づいて、視差に関するデータと、前記被写体までの距離に関するデータの少なくとも一方を生成することを特徴とする請求項1に記載の撮像装置。
  3.  前記画像処理部は、前記第1撮像部により撮像された画像と、前記複数の第2撮像部により撮像された画像とを合成し、画像を合成する位置に応じて合成比率を変化させることを特徴とする請求項1または2に記載の撮像装置。
  4.  複数の第1撮像部を備え、
     前記複数の第1撮像部は、互いに異なる方向の被写体を撮像し、
     少なくとも1つの第2撮像部は、前記複数の第1撮像部の間に設けられることを特徴とする請求項1から3のいずれかに記載の撮像装置。
  5.  前記複数の第1撮像部のレンズ先端は、前記複数の第2撮像部のレンズ先端より被写体の近くに設置されることを特徴とする請求項4に記載の撮像装置。
  6.  前記第1撮像部と前記複数の第2撮像部は、レンズが個別に設けられる一方、撮像素子が同一基板上に形成されることを特徴とする請求項1から5のいずれかに記載の撮像装置。
  7.  前記撮像素子は、前記画像処理部を含むことを特徴とする請求項6に記載の撮像装置。
  8.  前記第1撮像部もしくは前記複数の第2撮像部の少なくとも1つに、レンズを透過した光のうち所定方位の偏光成分を透過させる偏光子を設けることを特徴とする請求項1から7のいずれかに記載の撮像装置。
  9.  前記第1撮像部もしくは前記複数の第2撮像部の少なくとも1つに、レンズを透過した光を電荷に変換する単位である光電変換部を含む画素の配列において、1つの前記レンズに対応する画素領域を分割してなる複数の部分領域のそれぞれに、前記光電変換部を設けることを特徴とする請求項1から8のいずれかに記載の撮像装置。
  10.  前記第1撮像部もしくは前記複数の第2撮像部の少なくとも1つに、4つ以上の波長帯を検出可能な画素を設けることを特徴とする請求項1から9のいずれかに記載の撮像装置。
  11.  前記画像処理部は、前記第1撮像部により撮像された画像と、前記複数の第2撮像部により撮像された画像のうち少なくとも2つに基づいて、前記被写体までの距離に関するデータを生成し、その距離に関するデータを、機械学習により予め得られたデータに基づいて補正することを特徴とする請求項1から10のいずれかに記載の撮像装置。
  12.  前記画像処理部は、前記第1撮像部により撮像された画像と、機械学習により予め得られたデータとに基づいて、前記第2撮像部により撮像された画像を補正することを特徴とする請求項1から11のいずれかに記載の撮像装置。
  13.  前記第1撮像部により撮像された画像の特性と、前記複数の第2撮像部のそれぞれにより撮像された画像の特性に関するデータを記憶する記憶部をさらに備え、
     前記画像処理部は、前記第1撮像部により撮像された画像の特性と、前記複数の第2撮像部のそれぞれにより撮像された画像の特性とを一致させるよう調整することを特徴とする請求項1から12のいずれかに記載の撮像装置。
  14.  前記画像処理部は、前記複数の第2撮像部のそれぞれにより撮像された画像の特性を、前記第1撮像部により撮像された画像の特性に一致させるように、前記複数の第2撮像部のそれぞれにより撮像された画像を補正することを特徴とする請求項13に記載の撮像装置。
  15.  前記画像処理部は、前記複数の第2撮像部のそれぞれにより撮像された画像に対して、その信号雑音比に応じて画素加算を実行することを特徴とする請求項1から14のいずれかに記載の撮像装置。
  16.  同一の方向を撮像する複数の第1撮像部を備え、
     前記複数の第1撮像部の周辺位置に、前記複数の第2撮像部を設置したことを特徴とする請求項1から15のいずれかに記載の撮像装置。
  17.  少なくとも2つの第2撮像部は、ユーザの瞳孔間距離より離した位置に設けられることを特徴とする請求項16に記載の撮像装置。
  18.  前記画像処理部は、1つの第1撮像部により撮像された画像の中の、別の第1撮像部により撮像された画像には映らない領域における被写体までの距離を、当該第1撮像部の周辺に設置された第2撮像部により撮像された画像に基づいて導出することを特徴とする請求項16に記載の撮像装置。
PCT/JP2018/033266 2017-09-15 2018-09-07 撮像装置 WO2019054304A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US16/644,260 US11064182B2 (en) 2017-09-15 2018-09-07 Imaging apparatus
US17/341,807 US11438568B2 (en) 2017-09-15 2021-06-08 Imaging apparatus
US17/875,981 US20220385879A1 (en) 2017-09-15 2022-07-28 Imaging Apparatus

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017178302A JP6951917B2 (ja) 2017-09-15 2017-09-15 撮像装置
JP2017-178302 2017-09-15

Related Child Applications (2)

Application Number Title Priority Date Filing Date
US16/644,260 A-371-Of-International US11064182B2 (en) 2017-09-15 2018-09-07 Imaging apparatus
US17/341,807 Continuation US11438568B2 (en) 2017-09-15 2021-06-08 Imaging apparatus

Publications (1)

Publication Number Publication Date
WO2019054304A1 true WO2019054304A1 (ja) 2019-03-21

Family

ID=65723294

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2018/033266 WO2019054304A1 (ja) 2017-09-15 2018-09-07 撮像装置

Country Status (3)

Country Link
US (3) US11064182B2 (ja)
JP (4) JP6951917B2 (ja)
WO (1) WO2019054304A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7028814B2 (ja) * 2019-02-07 2022-03-02 ファナック株式会社 外形認識装置、外形認識システム及び外形認識方法
KR102099232B1 (ko) * 2019-07-03 2020-04-08 주식회사 레티널 소형 반사부를 이용한 카메라 모듈 및 이를 이용한 증강 현실용 광학 장치
US11233963B2 (en) * 2019-12-27 2022-01-25 Omnivision Technologies, Inc. Devices and methods for obtaining three-dimensional shape information using polarization and phase detection photodiodes
WO2021192814A1 (ja) * 2020-03-27 2021-09-30 ソニーグループ株式会社 情報処理装置と情報処理方法および情報処理システム
US20230387165A1 (en) * 2020-10-12 2023-11-30 Nippon Telegraph And Telephone Corporation Optical element, image sensor and imaging device
JP2023115632A (ja) * 2022-02-08 2023-08-21 ソニーセミコンダクタソリューションズ株式会社 信号処理装置、プログラム
KR102478304B1 (ko) * 2022-02-23 2022-12-19 주식회사 코비스테크놀로지 중공사막 카트리지 검사 장치 및 방법

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06141246A (ja) * 1992-04-09 1994-05-20 Olympus Optical Co Ltd 撮像装置
JP2000112019A (ja) * 1998-10-08 2000-04-21 Olympus Optical Co Ltd 電子3眼カメラ装置
JP2007295113A (ja) * 2006-04-21 2007-11-08 Matsushita Electric Ind Co Ltd 撮像装置
JP2009048033A (ja) * 2007-08-22 2009-03-05 Panasonic Corp 立体画像撮像装置
WO2011114572A1 (ja) * 2010-03-19 2011-09-22 富士フイルム株式会社 撮像装置、方法およびプログラム並びにこれに用いる記録媒体
JP2012156775A (ja) * 2011-01-26 2012-08-16 Toshiba Corp カメラモジュール
WO2013099169A1 (ja) * 2011-12-27 2013-07-04 パナソニック株式会社 ステレオ撮影装置
WO2014196216A1 (ja) * 2013-06-05 2014-12-11 株式会社 東芝 イメージセンサ装置及びその製造方法

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6205259B1 (en) 1992-04-09 2001-03-20 Olympus Optical Co., Ltd. Image processing apparatus
US20010054989A1 (en) * 1993-10-22 2001-12-27 Matthew Zavracky Color sequential display panels
JP2763000B2 (ja) * 1997-07-08 1998-06-11 ソニー株式会社 再生装置
JP2003298920A (ja) 2002-03-29 2003-10-17 Fuji Photo Film Co Ltd デジタルカメラ
JP2004241825A (ja) 2003-02-03 2004-08-26 Konica Minolta Holdings Inc 携帯端末
US20050088515A1 (en) * 2003-10-23 2005-04-28 Geng Z. J. Camera ring for three-dimensional (3D) surface imaging
US7180602B2 (en) * 2003-12-11 2007-02-20 Nuonics, Inc. Agile spectral interferometric microscopy
US7639208B1 (en) * 2004-05-21 2009-12-29 University Of Central Florida Research Foundation, Inc. Compact optical see-through head-mounted display with occlusion support
JP2006333132A (ja) * 2005-05-26 2006-12-07 Sony Corp 撮像装置及び撮像方法、プログラム、プログラム記録媒体並びに撮像システム
US7566855B2 (en) * 2005-08-25 2009-07-28 Richard Ian Olsen Digital camera with integrated infrared (IR) response
US8254712B2 (en) * 2007-03-30 2012-08-28 Fujifilm Corporation Image processing apparatus, image processing method, image managing apparatus, image managing method, computer program product, and image order sheet
JP4984257B2 (ja) * 2008-02-28 2012-07-25 大日本印刷株式会社 会場設営シミュレーション装置、プログラム、媒体、簡易な画像変形合成方法
WO2012029299A1 (ja) * 2010-08-31 2012-03-08 パナソニック株式会社 撮影装置、再生装置、および画像処理方法
JP5695395B2 (ja) * 2010-11-19 2015-04-01 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 立体画像生成方法及びその装置
JP5874334B2 (ja) 2011-11-15 2016-03-02 株式会社ニコン 画像処理装置、撮像装置、画像処理プログラムおよび撮像装置の制御プログラム
EP2597483B8 (de) * 2011-11-25 2017-06-07 Safran Vectronix AG Entfernungsmesser
JP5943613B2 (ja) * 2012-01-16 2016-07-05 キヤノン株式会社 画像処理装置及び画像処理装置の制御方法
JP5998862B2 (ja) * 2012-11-09 2016-09-28 株式会社ソシオネクスト 動画像処理装置
WO2015045785A1 (ja) * 2013-09-30 2015-04-02 富士フイルム株式会社 画像処理装置、撮像装置、画像処理方法及び画像処理プログラム
US10402665B2 (en) * 2014-05-14 2019-09-03 Mobileye Vision Technologies, Ltd. Systems and methods for detecting traffic signs
KR102250192B1 (ko) * 2014-05-19 2021-05-10 삼성전자주식회사 이종 화소 구조를 갖는 이미지 센서
US10547825B2 (en) * 2014-09-22 2020-01-28 Samsung Electronics Company, Ltd. Transmission of three-dimensional video
KR101580585B1 (ko) * 2014-12-02 2015-12-28 서울시립대학교 산학협력단 전정색영상과 적외선영상의 융합 방법 및 장치
US20160165211A1 (en) * 2014-12-08 2016-06-09 Board Of Trustees Of The University Of Alabama Automotive imaging system
JP6447121B2 (ja) 2014-12-26 2019-01-09 株式会社リコー 画像処理装置、画像処理方法、撮像システム、画像処理システム、およびプログラム
CN107533210A (zh) * 2015-01-14 2018-01-02 因维萨热技术公司 相位检测自动聚焦
JP6611477B2 (ja) 2015-06-08 2019-11-27 キヤノン株式会社 撮像装置、発光制御方法、プログラム
JP6488203B2 (ja) 2015-07-01 2019-03-20 株式会社ソニー・インタラクティブエンタテインメント 画像処理装置、画像処理システム、多視点カメラ、および画像処理方法
JP6552315B2 (ja) 2015-07-27 2019-07-31 キヤノン株式会社 撮像装置
US10217189B2 (en) * 2015-09-16 2019-02-26 Google Llc General spherical capture methods
US20170094251A1 (en) * 2015-09-30 2017-03-30 Faro Technologies, Inc. Three-dimensional imager that includes a dichroic camera
JP6808409B2 (ja) 2015-11-25 2021-01-06 キヤノン株式会社 イメージセンサおよび撮像装置
US9674504B1 (en) * 2015-12-22 2017-06-06 Aquifi, Inc. Depth perceptive trinocular camera system
EP3395066B1 (en) * 2015-12-25 2022-08-03 BOE Technology Group Co., Ltd. Depth map generation apparatus, method and non-transitory computer-readable medium therefor
US10638920B2 (en) * 2016-06-13 2020-05-05 Capsovision Inc Method and apparatus of lens alignment for capsule
US10242442B2 (en) * 2016-10-27 2019-03-26 International Business Machines Corporation Detection of outlier lesions based on extracted features from skin images
US10810721B2 (en) * 2017-03-14 2020-10-20 Adobe Inc. Digital image defect identification and correction
US10401872B2 (en) * 2017-05-23 2019-09-03 Gopro, Inc. Method and system for collision avoidance

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06141246A (ja) * 1992-04-09 1994-05-20 Olympus Optical Co Ltd 撮像装置
JP2000112019A (ja) * 1998-10-08 2000-04-21 Olympus Optical Co Ltd 電子3眼カメラ装置
JP2007295113A (ja) * 2006-04-21 2007-11-08 Matsushita Electric Ind Co Ltd 撮像装置
JP2009048033A (ja) * 2007-08-22 2009-03-05 Panasonic Corp 立体画像撮像装置
WO2011114572A1 (ja) * 2010-03-19 2011-09-22 富士フイルム株式会社 撮像装置、方法およびプログラム並びにこれに用いる記録媒体
JP2012156775A (ja) * 2011-01-26 2012-08-16 Toshiba Corp カメラモジュール
WO2013099169A1 (ja) * 2011-12-27 2013-07-04 パナソニック株式会社 ステレオ撮影装置
WO2014196216A1 (ja) * 2013-06-05 2014-12-11 株式会社 東芝 イメージセンサ装置及びその製造方法

Also Published As

Publication number Publication date
JP6951917B2 (ja) 2021-10-20
JP2019054463A (ja) 2019-04-04
JP2022003817A (ja) 2022-01-11
US20220385879A1 (en) 2022-12-01
JP7170810B2 (ja) 2022-11-14
JP2024019210A (ja) 2024-02-08
JP2023014082A (ja) 2023-01-26
US20210306610A1 (en) 2021-09-30
US11064182B2 (en) 2021-07-13
US11438568B2 (en) 2022-09-06
US20200204786A1 (en) 2020-06-25
JP7393498B2 (ja) 2023-12-06

Similar Documents

Publication Publication Date Title
JP7170810B2 (ja) 撮像装置、画像生成方法およびコンピュータプログラム
JP6821028B2 (ja) 撮像装置および画像データ読み出し方法
WO2019082820A1 (ja) カメラシステム
US8885067B2 (en) Multocular image pickup apparatus and multocular image pickup method
KR101843994B1 (ko) 이종 이미저를 구비한 모놀리식 카메라 어레이를 이용한 이미지의 캡처링 및 처리
JP5649091B2 (ja) 画像キャプチャ装置および画像キャプチャ方法
KR20230008893A (ko) Vr/ar 응용에서 심도 증강을 위한 다중-기선 카메라 어레이 시스템 아키텍처
CN103688536B (zh) 图像处理装置、图像处理方法
WO2012029251A1 (en) Stereoscopic imaging method and system that divides a pixel matrix into subgroups
JP2015521411A (ja) πフィルタ群を用いてパターン化されたカメラモジュール
JP6422924B2 (ja) 撮像装置および被写体情報取得方法
WO2013027504A1 (ja) 撮像装置
TWI599809B (zh) 鏡頭模組陣列、影像感測裝置與數位縮放影像融合方法
WO2013005489A1 (ja) 撮像装置、画像処理装置
US10122990B2 (en) Imaging system and method of producing context and focus images
JP5982907B2 (ja) 画像処理装置、および画像処理方法、並びにプログラム
JP5453328B2 (ja) 立体撮像システム、補正装置およびそのプログラム
WO2013005602A1 (ja) 撮像装置、画像処理装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18856997

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18856997

Country of ref document: EP

Kind code of ref document: A1