[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

WO2019026388A1 - 画像生成装置および画像生成方法 - Google Patents

画像生成装置および画像生成方法 Download PDF

Info

Publication number
WO2019026388A1
WO2019026388A1 PCT/JP2018/019556 JP2018019556W WO2019026388A1 WO 2019026388 A1 WO2019026388 A1 WO 2019026388A1 JP 2018019556 W JP2018019556 W JP 2018019556W WO 2019026388 A1 WO2019026388 A1 WO 2019026388A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
pixel
viewpoint
original image
map
Prior art date
Application number
PCT/JP2018/019556
Other languages
English (en)
French (fr)
Inventor
佐々木 伸夫
Original Assignee
株式会社ソニー・インタラクティブエンタテインメント
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社ソニー・インタラクティブエンタテインメント filed Critical 株式会社ソニー・インタラクティブエンタテインメント
Priority to JP2019533914A priority Critical patent/JP7057785B2/ja
Priority to US16/630,061 priority patent/US11050993B2/en
Publication of WO2019026388A1 publication Critical patent/WO2019026388A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/332Displays for viewing with the aid of special glasses or head-mounted displays [HMD]
    • H04N13/344Displays for viewing with the aid of special glasses or head-mounted displays [HMD] with head-mounted left-right displays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/122Improving the 3D impression of stereoscopic images by modifying image signal contents, e.g. by filtering or adding monoscopic depth cues
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/111Transformation of image signals corresponding to virtual viewpoints, e.g. spatial image interpolation
    • H04N13/117Transformation of image signals corresponding to virtual viewpoints, e.g. spatial image interpolation the virtual viewpoint locations being selected by the viewers or determined by viewer tracking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/15Processing image signals for colour aspects of image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/366Image reproducers using viewer tracking

Definitions

  • the present invention relates to an image generation apparatus and an image generation method for generating a stereoscopic image.
  • Three-dimensional display devices such as a three-dimensional television and a head mounted display capable of presenting images in three dimensions are used.
  • Devices capable of presenting images in three dimensions in portable terminals such as mobile phones and portable game machines have also been developed, and opportunities for general users to view stereoscopic images are increasing.
  • a three-dimensional display device that displays a stereoscopic image enables a user to stereoscopically view an image by showing an image with parallax to the left and right eyes of the user.
  • the present invention has been made in view of these problems, and an object thereof is to provide a technology capable of generating a high-quality three-dimensional image with a small delay even if the viewpoint is displaced.
  • This image generation device is an image generation device that generates an image that can stereoscopically view an object using a pair of original images acquired from different left and right viewpoints, and the object is in virtual space when the user's viewpoint is moved.
  • the color value of each pixel of the image corresponding to the viewpoint at each time point is acquired, and
  • An original image operation unit that generates a new color map at each point in time by combining color values of pixels representing the same image in a color map representing an image corresponding to a viewpoint, and a color corresponding to each pixel of a display image
  • a display image generation unit that determines a color value of the pixel based on a color value at a position on the map, and an output unit that outputs data of the display image.
  • This image generation method is an image generation method for generating an image that allows an object to be viewed stereoscopically using a pair of original images acquired from different left and right viewpoints, and the object is in virtual space when the user's viewpoint is moved.
  • the color value of each pixel of the image corresponding to the viewpoint at each time point is acquired, and Generating a new color map at each point in time by combining the color values of the pixels representing the same image in the color map representing the image corresponding to the viewpoint, and on the color map corresponding to each pixel of the display image And determining the color value of the pixel based on the color value at the position, and outputting the data of the display image.
  • high-quality stereoscopic images can be presented with less delay even if the viewpoint is displaced.
  • FIG. 7 is a diagram for describing a relationship between movement amount components in the Z-axis direction and the X-axis direction among movement amounts of a viewpoint and movement amounts of pixels of an original image according to the present embodiment.
  • FIG. 7 is a diagram for describing a relationship between movement amount components in the Z-axis direction and the Y-axis direction among movement amounts of a viewpoint and movement amounts of pixels of an original image according to the present embodiment.
  • FIG. 10 is a diagram for describing a method of calculating an image reference vector in extended reference in the present embodiment. It is a figure which shows typically the relationship between the displacement vector in this Embodiment, and a pixel area.
  • FIG. 10 is a flowchart showing an outline of a processing procedure for determining an image reference vector for each pixel on the image reference vector map. It is a figure for demonstrating the interpolation method of the image reference vector in this Embodiment.
  • FIG. 10 is a diagram for describing a method of calculating an image reference vector in extended reference in the present embodiment. It is a figure which shows typically the relationship between the displacement vector in this Embodiment, and a pixel area.
  • FIG. 10 is a diagram for describing a method of calculating an image reference vector in extended reference in the present embodiment. It is a figure which shows typically the relationship between the displacement vector in this Embodiment, and a pixel area.
  • it is a flowchart showing an outline of a processing procedure for determining
  • FIG. 9 is a flowchart showing a processing procedure of generating an image reference vector map by the original image operation unit 254 in S12 of FIG. 8.
  • FIG. 19 is a diagram showing the procedure of the process of writing in the Z buffer for generating an image reference vector having a self-image as a reference in S22 of FIG. 18.
  • FIG. 19 is a flow chart showing a procedure of setting processing of an image reference vector having a self-image as a reference in S22 of FIG. 18.
  • FIG. 21 is a diagram for describing an AtomicMin instruction used when writing a Z value to the Z buffer 264 in S36 of FIG. 19; It is a figure which shows the procedure of the process which integrates the process of FIG. 19, 20 and produces
  • FIG. 19 is a diagram showing the procedure of the process of writing in the Z buffer for generating an image reference vector having a self-image as a reference in S22 of FIG. 18.
  • FIG. 21 is a diagram for describing an AtomicMin
  • FIG. 9 is a flowchart showing a procedure of generating a display image using the image reference vector map by the display image generation unit 268 in S14 of FIG. 8. It is a figure for demonstrating the positional relationship of a display image, an image reference vector map, and an original image in this Embodiment. It is a figure for demonstrating the recursive filter introduced in this Embodiment. It is a figure which shows typically the production
  • FIG. 1 It is a figure which shows typically the production
  • FIG. 16 is a diagram for describing a relationship between movement amount components in the Z-axis direction and the X-axis direction among movement amounts of a viewpoint and movement amounts of pixels between image reference vector maps according to the present embodiment.
  • FIG. 17 is a diagram for describing a relationship between movement amount components in the Z-axis direction and the Y-axis direction among movement amounts of a viewpoint and movement amounts of pixels between image reference vector maps according to the present embodiment. . It is a figure which shows typically the example of a change of the display image by inclination of a viewer's head in this Embodiment.
  • FIG. 8 is a diagram for describing a method of adjusting the position of the map screen in accordance with the position of the viewpoint in the present embodiment. It is a flowchart which shows the process sequence which the original image operation part of the image generation apparatus in this Embodiment adjusts the position of an image on XY plane according to the position of a viewer's head.
  • the present embodiment relates to a three-dimensional image display system which causes stereoscopic vision by causing an image for the right eye among parallax images to reach the right eye and an image for the left eye to reach the left eye.
  • the display mode of the image and the view mode of the viewer are not limited.
  • a mode may be considered in which parallax images are displayed simultaneously or alternately on a flat panel display or screen and viewed using polarized glasses or shutter glasses.
  • a head mounted display that can present an image independently to the left and right eyes.
  • the latter will be mainly described as an example.
  • FIG. 1 is an external view of a head mounted display 100.
  • Head mounted display 100 includes a body portion 110, a forehead contact portion 120, and a temporal portion contact portion 130.
  • the head mounted display 100 is a display device mounted on the head of a viewer to view still images and moving images displayed on the display and to listen to sounds and music output from headphones.
  • the motion sensor built in or externally attached to the head mounted display 100 can measure posture information such as the rotation angle and tilt of the head of the viewer wearing the head mounted display 100.
  • FIG. 2 is a block diagram of the image display system in the present embodiment.
  • the head mounted display 100 is connected to the image generation apparatus 200 via an interface 280 that connects peripheral devices such as wireless communication or USB.
  • the image generation device 200 may be further connected to a server via a network.
  • the server may provide the image generation apparatus 200 with an online application such as a game in which a plurality of users can participate via the network.
  • the image generation device 200 may be any of a game device, a personal computer, a portable terminal, and the like. Further, the image generation device 200 and the head mounted display 100 may be integrally configured.
  • FIG. 3 is a diagram for explaining a form of display realized by the image display system.
  • a plane representing an image is further arranged in a virtual space. That is, conceptually, as shown in (a), the screen 50 on which the image is displayed is disposed on the field 52 in the virtual space so that the viewer 54 can view it via the view screen 56.
  • the view screen 56 corresponds to the field of view of the image displayed on the head mounted display 100.
  • the appearance of the screen 50 also changes according to the change in the relative position to the virtual world. For example, as shown in (a), when the viewer 54 is on the right side with respect to the screen 50, the image generation device 200 generates an image as shown in (b) corresponding to a line of sight as shown by an arrow. It is displayed on the display 100.
  • the field 52 in the virtual space only represents the coordinate system of the virtual space, and is not the purpose of limiting the shape or the like. Moreover, it is not necessary to display necessarily.
  • FIG. 4 schematically shows an image generated by the image generation device 200 in order to realize the aspect of FIG.
  • the image displayed on the image screen 50 in the present embodiment is configured by a pair of stereoscopic images for parallax, that is, an image 60 a for the left eye and an image 60 b for the right eye.
  • an image 60 a for the left eye and an image 60 b for the right eye.
  • the same object appears to the right in the left-eye image 60a and to the left in the right-eye image 60b.
  • the position of the viewpoint with respect to the image screen 50 is different between the left and right eyes, it is necessary to perform perspective transformation from each viewpoint.
  • the right eye is closer to the image screen 50 than the left eye, and the angle to the axis perpendicular to the plane of the image screen 50 is large.
  • the shape and position of the frame of the image screen 50 are different for the left-eye image 60a and the right-eye image 60b, and when they are superimposed on the same plane, the positional relationship shown in the plane 62 is obtained.
  • the left eye image 60a and the right eye image 60b By generating the left eye image 60a and the right eye image 60b and displaying the former in the area for the left eye and the latter in the area for the right eye in the area formed by dividing the screen of the head mounted display 100 horizontally.
  • the object appearing on the image screen 50 can be seen as a solid in the state shown in (b) of FIG.
  • a lens is provided between the screen of the head mounted display 100 and the eyes of the viewer so that an image appears in the entire visual field of the left and right eyes. Therefore, lens distortion correction is performed on the left-eye image 60a and the right-eye image 60b so that the original image is visually recognized when viewed through the lens.
  • parallax images for stereoscopic viewing are prepared, and an aspect is realized in which it can be viewed from a free viewpoint.
  • a virtual world is defined in a three-dimensional space, and an object of the virtual world is projected on a view screen according to the left and right viewpoints of the viewer to generate a parallax image There is.
  • the viewpoint of the viewer is limited as it is.
  • FIG. 5 is a diagram for explaining the relationship between parallax and an image given at the stage of acquiring a parallax image.
  • This figure schematically shows a state in which the virtual space including the left and right viewpoints (cameras 70a and 70b) assumed, the image screen 76 from which a parallax image is acquired, and an object 78 captured in the parallax image is viewed.
  • the parallax image may be an image captured by a stereo camera, and the cameras 70a and 70b correspond to stereo cameras in that case.
  • the plane of the pair of parallax images is simultaneously represented by the image screen 76.
  • the parallax image originally acquired on the image screen 76 in this manner may be referred to as an "original image" in order to distinguish it from the display image at the viewing stage.
  • the direction perpendicular to the plane of the original image is taken as the Z axis
  • the horizontal and vertical directions in the image plane are taken as the X axis and the Y axis.
  • An image of the object 78 appears in the original image.
  • a point 80 on the surface of the object 78 appears at a position 84a away from the optical axis 82a by a from the left camera 70a and at a position 84b away from the optical axis 82b by b from the right camera 70b.
  • the parallax Dp for the point 80 is a + b.
  • objects may exist at various positions, and images are represented in the left and right original images with parallax according to the distance in the depth direction.
  • the distance Zp from the image screen 76 to the point 80 on the object 78 is determined as follows by triangle similarity using the parallax Dp.
  • Ewp is the distance between the left and right cameras 70a and 70b
  • Scp is the distance from the cameras 70a and 70b to the image screen 76.
  • FIG. 6 shows the relationship between the viewpoint and the image when viewing a parallax image from an appropriate position.
  • the format of the diagram is the same as that of FIG.
  • the positional relationship at the time of parallax image acquisition shown in FIG. 5 is applied to such a space, as shown in the figure, the position of the image screen 76 such that the viewpoints 88a and 88b of the viewer are at the same position as the cameras 70a and 70b.
  • either the left or right original image is divided into minute triangles having a pixel center as a vertex, and arranged in a virtual three-dimensional space according to each distance Zp.
  • the distance Zp is obtained by the above-described parallax Dp.
  • each minute triangle is projected on the left and right view screens corresponding to the viewpoint of the viewer, and the inside is drawn by texture mapping.
  • FIG. 7 shows the images of the same object represented in the left and right original images in an overlapping manner. Boundaries of pixel regions of the left-eye original image 90a and the right-eye original image 90b are indicated by a grid of solid lines and broken lines, respectively. Even in the case of a pixel set representing the image 92 of the same object as illustrated, the boundaries of the pixels of both images do not necessarily match. At this time, for example, a region corresponding to a certain pixel (for example, a pixel 94 in a bold line frame) in the left-eye original image 90a spans two pixels in the right-eye original image 90b.
  • a region corresponding to a certain pixel for example, a pixel 94 in a bold line frame
  • the parallax value obtained for the pixel 94 of the original image 90a for the left eye is a sub-pixel unit smaller than the pixel. That is, even if the pixels represent approximately the same image, a slight difference occurs in the position on the represented object depending on which of the left and right original images is the reference, which causes a difference in disparity value in units of sub-pixels . As a result, the data representing the parallax value for each pixel often does not match in the left and right original images. In other words, by generating a “parallax value image” that holds the parallax value in pixel units for each of the left and right original images, parallax information in sub-pixel units, and thus depth information, is generated in the image. It can be reflected.
  • the quality of the final display image is likely to deteriorate due to the two-step process of backprojecting the divided minute area into the three-dimensional space and projecting the minute area in the three-dimensional space onto the view screen. Even if the point of view of the viewer is at an appropriate position as shown in FIG. 6 and there is no need to convert the image originally, the image quality is wasted due to the intervention of such processing.
  • the perspective transformation of the corrected image with respect to the view screen is required, but this can be done for one triangle covering the entire corrected image, so it is very expensive using conventional graphics hardware It is possible to process with efficiency.
  • the position of the viewpoint in the state where the camera and the viewer's view frustum coincide as shown in FIG. 6 is used as a base point, and the focus is placed on the movement of the viewpoint from there and the change in the image.
  • FIG. 8 is a flowchart showing an outline of a processing procedure in which the image generation apparatus 200 in the present embodiment generates a display image from an original image.
  • the image generating apparatus 200 acquires the position of the viewpoint of the viewer and the direction of the line of sight (S10).
  • the motion sensor incorporated in the head mounted display 100 can acquire the posture of the viewer's head.
  • the viewer can be photographed by an imaging device (not shown), and the position and posture of the viewer's head can be acquired based on the image of the light emission marker provided on the surface of the head mounted display 100 or the like.
  • an imaging device (not shown) for capturing an image corresponding to the viewer's field of view may be provided on the head mounted display 100 side, and the position and orientation of the head may be acquired by a technique such as SLAM (Simultaneous Localization and Mapping).
  • SLAM Simultaneous Localization and Mapping
  • the image generation apparatus 200 sets the view screen to correspond to the position of the viewpoint and the direction of the line of sight, and calculates which position of the original image the pixel on the view screen corresponds to (S12). More specifically, first, the movement amount of each pixel constituting the image so that the object represented in the image does not change according to the movement of the viewpoint, that is, the position of the object appears to be fixed in the virtual space. The movement direction is determined to generate a corrected image in which the original image is changed. At this time, the plane (image screen) for generating the correction image may be at the same position as the original image, or may be translated in the Z-axis direction according to the movement of the viewpoint.
  • perspective transformation is applied to the entire corrected image according to the direction of the line of sight.
  • the display image is drawn by reflecting the color value of the position in the original image on the pixels of the view screen (S14).
  • parallax images to be displayed can be generated.
  • the visual field corresponds to the movement of the viewpoint without interposing the back projection to the virtual three dimensional space. A stereoscopic image without distortion can be viewed.
  • the two-stage process of S12 and S14 of FIG. 8 can also be realized by sequentially changing the original image itself. That is, by moving the viewpoint, a corrected image is generated by temporarily changing the original image, and a display image can be drawn by performing perspective transformation on the view screen. However, in this case, since the conversion process is performed twice on the original image, the quality of the display image may not be maintained. Therefore, instead of generating the above-described second original image, an image map is generated that indicates which position of the original image each pixel in the corrected image according to the viewpoint movement has originally been.
  • the image map is projected onto the view screen to identify the positional relationship between the view screen and the map, and it is confirmed which position of the original image the pixel on the view screen corresponds to and the color value from the original image To get In this way, the operation on the original image is required only once, and the image quality can be maintained at the original image level.
  • the information indicating which position of each pixel in the correction image corresponds to which position of the original image is a vector value whose start and end points are defined on the image plane, and hence it will be called “image reference vector” hereinafter.
  • a map corresponding to an image plane which holds information of a movement reference vector for each pixel on a corrected image, is called an "image reference vector map" or simply "map".
  • FIG. 9 shows the internal circuit configuration of the image generation apparatus 200.
  • the image generation device 200 includes a central processing unit (CPU) 222, a graphics processing unit (GPU) 224, and a main memory 226. These units are connected to one another via a bus 230. An input / output interface 228 is further connected to the bus 230.
  • CPU central processing unit
  • GPU graphics processing unit
  • main memory 226 main memory
  • the input / output interface 228 includes a peripheral device interface such as USB or IEEE 1394, a communication unit 232 including a wired or wireless LAN network interface, a storage unit 234 such as a hard disk drive or nonvolatile memory, a display device such as a head mounted display 100 An output unit 236 for outputting data, an input unit 238 for inputting data from the head mounted display 100, and a recording medium drive unit 240 for driving a removable recording medium such as a magnetic disk, an optical disk or a semiconductor memory are connected.
  • a peripheral device interface such as USB or IEEE 1394
  • a communication unit 232 including a wired or wireless LAN network interface
  • a storage unit 234 such as a hard disk drive or nonvolatile memory
  • a display device such as a head mounted display 100
  • An output unit 236 for outputting data an input unit 238 for inputting data from the head mounted display 100
  • a recording medium drive unit 240 for driving a removable recording medium such as a magnetic disk, an optical disk or
  • the CPU 222 controls the entire image generating apparatus 200 by executing the operating system stored in the storage unit 234.
  • the CPU 222 also executes various programs read from the removable storage medium and loaded into the main memory 226 or downloaded via the communication unit 232.
  • the GPU 224 has a function of a geometry engine and a function of a rendering processor, performs drawing processing according to a drawing command from the CPU 222, and stores a display image in a frame buffer (not shown). Then, the display image stored in the frame buffer is converted into a video signal and output to the output unit 236.
  • the main memory 226 is configured by a RAM (Random Access Memory), and stores programs and data necessary for processing.
  • FIG. 10 shows functional blocks of the image generation apparatus 200 in the present embodiment. At least a part of the functions of the image generation apparatus 200 shown in FIG. 10 may be mounted on the head mounted display 100. Alternatively, at least a part of the functions of the image generation device 200 may be implemented on a server connected to the image generation device 200 via a network. The image generation apparatus 200 may be part of an information processing apparatus such as a game machine or a personal computer.
  • FIG. 9 The figure draws the block diagram which paid its attention mainly to the function which produces
  • these functional blocks can be realized with the configuration of the CPU, GPU, various memories, etc. shown in FIG. 9, and in software, they can be loaded into memory from recording media etc., data input function, data retention It is realized by a program that exhibits various functions such as functions, image processing functions, and communication functions. Therefore, it is understood by those skilled in the art that these functional blocks can be realized in various forms by hardware only, software only, or a combination thereof, and is not limited to any of them.
  • the image generation apparatus 200 acquires a position and orientation of the head mounted display 100, a position / attitude acquisition unit 250, a view screen control unit 252 that controls the view screen based on the position of the viewpoint and the direction of the line of sight, An original image operation unit 254 that generates a reference vector map, an original image data storage unit 256 that stores data of the original image, a reference data storage unit 262 that stores intermediate data such as an image reference vector map, and an image reference vector map A display image generation unit 268 for drawing a display image on a view screen, and an output unit 270 for outputting data of the generated display image.
  • the position / posture acquisition unit 250 acquires the position and / or posture of the viewer's head by any of the above-described means.
  • the view screen control unit 252 determines the position of the viewpoint of the viewer and the direction of the line of sight based on the position and orientation of the head acquired by the position and orientation acquisition unit 250, and sets the view screen according to it.
  • the display images drawn on the view screen are, for example, the left-eye image 60a and the right-eye image 60b shown in FIG. 4, and the view screens are also set for the left eye and the right eye.
  • the original image operation unit 254 calculates the movement amount and the direction of the pixels constituting the image of the object according to the position of the viewpoint. Then, an image reference vector representing which position on the original image each pixel on the screen corresponds to is generated. Furthermore, an image reference vector map in which the vector is associated with each pixel of the image plane on the screen is generated for each of the left and right eyes.
  • the distance Zp in the virtual space of the object represented on the image is required.
  • the distance Zp is obtained as described above from the parallax Dp of the left and right original images.
  • the original image data storage unit 256 stores left and right original image data 258 and left and right parallax value image data 260 for holding parallax values for each pixel of each image.
  • the parallax value images are prepared separately for the left and right, in order to utilize information of subpixel accuracy as described above.
  • distance value image data may be prepared in which the distance Zp is held for each pixel of the left and right images.
  • the original image operation unit 254 provides pixels for referencing the original image for the right eye in the image reference vector map for the left eye, and provides pixels for referencing the original image for the left eye in the image reference vector map for the right eye. You may This is because one of the left and right original images may be a blind spot and not appear as an image in the other. If it is necessary to display such blind spots due to movement of the viewpoint, such details can be reproduced with high precision by acquiring data from the other image.
  • the original image operation unit 254 may further prepare an image reference vector for the expansion by expanding the parallax value held by the parallax value image to the outside of the image. Details will be described later.
  • the original image operation unit 254 further generates a color map in which color values obtained in the past are represented on the same image plane as the image reference vector map when a recursive filter described later is introduced.
  • a recursive filter described later By combining the color values of the current frame acquired from the original image using the image reference vector with the color values determined in the previous frame for the pixels representing the surface of the same object acquired from the color map, It is assumed that the color value of the corresponding pixel. In this way, the filter is applied in the time direction to suppress the flicker that occurs near the contour of the object.
  • the map of the color values of the current frame so determined is used as a new color map to determine the color values of the next frame.
  • the original image operation unit 254 also moves the image reference vector map in the X-axis and Y-axis directions according to the displacement amounts of the X component and the Y component of the viewpoint of the viewer under specific conditions. As a result, even if the viewer's head is inclined or the posture is broken, it is possible to stereoscopically view an original high-quality image as well as possible.
  • the reference data storage unit 262 stores the left and right image reference vector maps 266 generated by the original image operation unit 254, and at the stage of creating them, the Z value for determining whether to write the image reference vector A storage area for the Z buffer 264 for storing information is provided.
  • the reference data storage unit 262 also stores the color map 267 described above.
  • the display image generation unit 268 determines a color value and draws a display image by referring to the original image data 258 corresponding to each pixel of the view screen set by the view screen control unit 252 or the pixel value of the color map 267. . That is, the image reference vector map is mapped on the view screen by perspective transformation, and the original image is referred to based on the image reference vector acquired at the position on the map corresponding to the pixel on the view screen. decide.
  • pixel values on the view screen are determined with reference to the color map 267 instead of the image reference vector.
  • the original image data 258 stored in the original image data storage unit 256 may be data of multiple resolutions, and the resolution used for drawing may be switched according to the degree of reduction ratio by perspective transformation.
  • a method of suppressing image flicker by switching the resolution of the original image and performing texture mapping is known as mip mapping.
  • LOD Level of Detail
  • LOD Level of Detail
  • the output unit 270 outputs the data of the left and right display images generated by the display image generation unit 268 to the head mounted display 100 at a predetermined rate. At this time, the display image may be subjected to lens distortion correction and then output. The output unit 270 may further output sound data such as music for menu screens and sounds included in various contents.
  • FIG. 11 is a diagram for explaining the relationship between the movement amount components in the Z-axis direction and the X-axis direction among the movement amounts of the viewpoint and the movement amounts of the pixels of the original image according to that.
  • the viewpoint after moving by -z_off in the Z-axis direction from the viewpoints 88a and 88b in the state shown in FIG. 6 by x_off in the X-axis direction is shown as a representative of the viewpoint 332 of the right eye.
  • the image screen 76 is moved by ⁇ z_off in the Z-axis direction, and an image reference vector is generated for each pixel on the plane.
  • the image screen 76 may not be moved.
  • the image screen after movement is called a "map screen" 334.
  • the image reference vector is information indicating the correspondence of pixels when the object 78 in the virtual space appears to be fixed when the original image is viewed from the viewpoint 88 b and when the map screen 334 is viewed from the viewpoint 332 after movement. It is.
  • the object 78 appears fixed when viewed from the viewpoint 332.
  • the point of intersection between the image screen 76 and the line in the Z-axis direction passing through the midpoint of the line segment connecting the viewpoints 88a and 88b serving as the base point is the origin O of the image regardless of the left eye and the right eye.
  • the movement of the viewpoint 88b in the Z-axis direction is extracted and considered.
  • the viewpoint 330 after movement and the map screen 334 are obtained by translating both in parallel in the negative direction of the Z axis by z_off.
  • the movement of the viewpoint in the Z-axis direction causes the line of sight to see it to move substantially in the X-axis direction. Let the movement amount at this time be gx.
  • the position ixR2 on the map screen 334 corresponding to the position ixR on the image screen 76 by moving the screen by z_off is determined as follows.
  • the displacement dx2 from the position ixR2 on the map screen 334 is determined as follows.
  • dx2: x_off + gx Zp-z_off: Scp + Zp-z_off
  • dx2 (x_off + gx) * (Zp-z_off) / (Scp + Zp-z_off)
  • the position txR on the map screen 334 corresponding to the position ixR on the image screen 76 due to the movement of the z_off and x_off viewpoints is expressed as follows using dx2 described above.
  • the movement of the viewpoint of the left eye can be calculated in the same manner as follows.
  • ixL, ixL2, and txL are the horizontal position of the original image for the left eye on the image screen 76, the corresponding position when the image screen is moved by z_off, and the left viewpoint is moved by z_off and x_off. However, it is a position on the map screen 334 for not changing the object 78.
  • FIG. 12 is a diagram for explaining the relationship between the movement amount components in the Z-axis direction and the Y-axis direction of the movement amount of the viewpoint and the movement amount of the pixels of the original image according to that.
  • the orientation of the coordinate axes is different from that in FIG. 11, and the horizontal axis of the figure is taken as the Y axis. That is, since the virtual space is viewed from the side, the viewpoints 88 of both eyes overlap one.
  • the calculation method is basically the same as that described in FIG. That is, the image seen at the position iy in the Y-axis direction of the original image on the image screen 76 is moved to the position ty on the map screen 334 so that the object 78 looks fixed.
  • the figure in the vicinity of ty is shown separately and enlarged.
  • the movement amount gy in the Y-axis direction of the sight line due to the movement of the viewpoint 88 by ⁇ z_off in the Z-axis direction is determined as follows.
  • gy -iy * z_off / Scp
  • the negative sign is given here because iy is in the negative region below the origin O in the illustrated example.
  • the position iy2 on the map screen 334 corresponding to the position iy on the image screen 76 by moving the screen by z_off is determined as follows.
  • this operation includes division, since Scp is a constant, only division needs to be performed once for the entire process.
  • the movement amount dy2 from the position iy2 on the map screen 334 is as follows.
  • dy2 (y_off + gy) * (Zp-z_off) / (Scp + Zp-z_off)
  • the position ty on the map screen 334 corresponding to the position iy on the image screen 76 due to the movement of the z_off and y_off viewpoints is expressed as follows using dy 2 described above.
  • the correspondence relationship between the position (tx, ty) on the image reference vector map and the position (ix, iy) on the original image according to each component (x_off, y_off, z_off) of the movement amount of the viewpoint Can be derived with a small amount of computation.
  • the positions txR and txL in the X-axis direction in the left and right images are collectively referred to as tx, ixR and ixL, respectively.
  • the original image operation unit 254 generates an image reference vector that refers to the other original image for pixels that should express such an image, so that the part that was a blind spot can be drawn more accurately.
  • Such a technique is called cross-reference of parallax images.
  • FIG. 13 illustrates the relationship between the movement amount components in the Z-axis direction and the X-axis direction of the movement amount of the viewpoint and the movement amount of pixels when referring to the original image for the left eye in the image reference vector map for the right eye FIG.
  • the concept of the calculation is the same as that shown in FIG. 11, except that the position ixL in the image for the left eye corresponding to the original starting point ixR is the starting point.
  • Ewosc Ewp-Dp
  • txR is obtained as follows, starting from the position ixL on the original image for the left eye.
  • txR ixL + Ewosc-gx + dx2
  • the parallax Dp used to calculate Ewosc is a value given to the pixels of the original image for the left eye and held by the parallax value image for the left eye.
  • txL ixR-Ewosc + gx + dx2
  • the parallax Dp used to calculate Ewosc is a value that is given to the pixels of the original image for the right eye and held by the parallax value image for the right eye.
  • the image reference vector can be set for each pixel of the image reference vector map, as in the case where the cross reference is not made.
  • FIG. 14 is a diagram for explaining a calculation method of an image reference vector in the extended reference.
  • the camera 350 is set to the right of the right viewpoint 88b with the interval Ewp, and the third original image is obtained. Get it.
  • an image reference vector is set so as to refer to the third original image.
  • the concept of calculation is the same as in the case of cross reference shown in FIG. 13, but instead of using ixL in the left-eye original image as the starting point, the corresponding position ixRE on the third original image is used as the starting point.
  • Ewosc is given as follows from the viewpoint interval Ewp and the parallax Dp corresponding to the pixel at the position ixRE in the parallax value image generated corresponding to the third original image.
  • Ewosc Ewp-Dp
  • txR is obtained as follows, starting from the position ixRE on the third original image.
  • txR ixRE-Ewosc-gx + dx2
  • the image reference vector is the displacement from the position (ix, iy) on the original image to the position (tx, ty) on the image reference vector map with respect to the movement of the viewpoint described above (hereinafter referred to as "displacement vector" It is a vector that traces) backwards.
  • FIG. 15 schematically shows the relationship between the displacement vector and the pixel area.
  • the squares shown in the figure represent each pixel area of the original image and the image reference vector map.
  • FIG. 16 is a flowchart showing an outline of a processing procedure for determining an image reference vector for each pixel on the image reference vector map.
  • one of the pixels of the image reference vector map is set as a reference pixel (S100), and a displacement destination corresponding to the movement of the viewpoint is calculated for a total of four points of the center and three nearby points (S102).
  • the inverse vector of the displacement vector having the Z value closer to the viewpoint is written as the image reference vector of the pixel of the displacement destination (S108). If the displacement destination does not overlap in S104, the inverse vector of the displacement vector is directly written as the image reference vector of the pixel of the displacement destination (N in S104, S108).
  • the write destination in S108 is set as a buffer memory for the image reference vector map because the pixel which is the displacement destination may be overwritten by the Z comparison when the pixel at the displacement destination overlaps in the calculation for the reference pixel thereafter.
  • the image reference vector is obtained by obtaining the pixel of the displacement destination by the movement of the viewpoint with the pixel center on the original image and the neighborhood thereof as the starting point. According to such a procedure, it is conceivable that as a result of the end point of the displacement vector being separated even at the close starting point in the original image, a pixel in which the image reference vector is not set (hereinafter sometimes referred to as "hole") occurs. This is because, for example, part of the original image is stretched at the pixel level due to movement of the viewpoint.
  • the original image operation unit 254 interpolates the image reference vector using surrounding pixels.
  • FIG. 17 is a diagram for explaining an image reference vector interpolation method.
  • the pixel array shown in the figure it is assumed that there is a hole of an image reference vector in a pixel surrounded by a bold line frame.
  • the simplest method is to interpolate according to the average value of the image reference vectors set in the surrounding pixels.
  • the image reference vector used for interpolation is assumed to be obtained from the displacement vector based on the movement of the viewpoint, and it is avoided to use the vector obtained by interpolation for further interpolation.
  • an image reference vector is given to upper, lower, right, and left pixels (pixels D, C, D, A, and B) of a pixel of a target thick line frame, as shown by arrows
  • the average of those four image reference vectors Let the vector be the target image reference vector.
  • the weights may be changed and averaged according to the position of the target pixel. For example, by weighting twice the upper, lower, left, and right pixels (pixels D, C, A, and B) among the surrounding eight pixels, the image reference vectors of eight pixels A to H are weighted and averaged.
  • pixels and weights used for interpolation may be determined according to the directionality of the image reference vector. For example, in the illustrated example, image reference vectors of surrounding pixels are all close to horizontal. From this, it is presumed that the portion is horizontally extended from the original image, and that the hole is caused thereby. Therefore, in this case, linear interpolation is performed using the left and right pixels A and B among the pixels around the target, or the pixels are weighted with a larger weight and averaged to achieve accuracy according to the situation. High interpolation can be realized.
  • an average vector of image reference vectors of four pixels above, below, left, and right of the target pixel is determined, and an angle ⁇ between it and the horizontal direction (X-axis direction) of the image is ⁇ 30 ° ⁇ ⁇ 30 ° or 150 ° ⁇ ⁇
  • the image reference vectors of the left and right pixels A and B are averaged to obtain a target image reference vector.
  • the angle ⁇ is 60 ° ⁇ ⁇ 120 ° or 240 ° ⁇ ⁇ 300 °
  • the image reference vectors of the upper and lower pixels D and C are averaged to be a target image reference vector. If the angle ⁇ is otherwise, the image reference vectors of the upper, lower, left, and right pixels are averaged to obtain the target image reference vector.
  • the processing may be speeded up while maintaining the accuracy by using the image reference vectors of the left and right pixels for interpolation always without determining the angle as described above.
  • the same interpolation calculation is performed regardless of the stretched direction since the color image has no information.
  • extra colors may be mixed, which may adversely affect the quality of the displayed image.
  • the above-described interpolation method is based on the assumption that a so-called legal image reference vector derived from displacement vector calculation is given to surrounding pixels.
  • an image reference vector which is not interpolated may be searched around the hole, and the vector may be used for interpolation as it is.
  • the search priority is ordered at eight pixels around the target.
  • the order of pixels A, B, C, D, E, F, G, H can be considered.
  • search is performed in that order, and the initially detected non-interpolated image reference vector is adopted as the target vector.
  • the color value since the color value is not determined at the generation step of the image reference vector, the color value can be finally determined with the positional accuracy of the sub-pixel.
  • FIG. 18 is a flow chart showing a processing procedure of generating an image reference vector map by the original image operation unit 254 in S12 of FIG.
  • the Z buffer and the image reference vector map buffer are initialized (S20).
  • an image reference vector to which the self image is referred is set (S22).
  • the self-image refers to the original image for the right eye for the map for the right eye, and the original image for the left eye for the map for the left eye.
  • an image reference vector is set with reference to the original image other than the self image by cross reference and extended reference (S24).
  • the image reference vector map is completed for both eyes by performing the processing shown in the same figure for the left eye and the right eye respectively. It should be noted that since pixels for which data are not held in the parallax value image do not have an object, there is no image reference vector that points to such pixels. As a result, the image reference vector map may have an area where the image reference vector map does not exist, such as outside the image of the object.
  • FIG. 19 shows the procedure of the process of writing in the Z buffer for generating an image reference vector having a self-image as a reference in S22 of FIG.
  • This figure shows a process of one unit using the reference pixel set in the original image and three points shifted by 0.5 pixel from the center in consideration of the hardware configuration. ing.
  • the next FIG. 19 is also the same.
  • data 370 relating to those parallax values is acquired, and the respective Z values and the position of the pixel of the displacement destination by the displacement vector are obtained (S32).
  • the parallax value of the reference pixel is read out from the parallax value image data 260 stored in the original image data storage unit 256.
  • the other three parallax values are determined by interpolation based on the parallax values of the pixels adjacent to the reference pixel.
  • the “Valid flag” in the data 370 represents validity / invalidity of the associated disparity value. As described above, the area in which no object exists originally has no disparity value, so the Valid flag indicates invalid. When the parallax value is invalid, the subsequent processes such as calculation of displacement vector are also invalid.
  • the processing of S32 can be efficiently performed in parallel at four points by using a general pixel shader. However, when processing is parallelized, the order in which the results are output can not be determined. Therefore, it is checked whether or not the displacement destination output earlier is the same pixel as the displacement destination output later, and if so, sorting is performed in order of proximity to the viewpoint (S34).
  • the Z value closest to the viewpoint is written to the pixel of the displacement destination in the Z buffer (S36).
  • the Z value closest to the viewpoint can be written at a stretch regardless of the output order of parallel processing.
  • the displacement vector of a point located at a distance smaller than the pixel width as shown in FIG. 15 there is a high possibility that the pixel of the displacement destination overlaps. Therefore, extra pixel information can be efficiently eliminated by performing Z comparison in the shader, and the number of accesses to the Z buffer 264 can be reduced.
  • identification information indicating that the reference destination is a self-image is also written in the Z buffer 264, so that priority is given to data of cross reference and extended reference.
  • FIG. 20 shows a procedure of setting processing of an image reference vector having a self-image as a reference in S22 of FIG.
  • the reference pixel determined in the original image and data 370 relating to three parallax values shifted from the center by 0.5 pixels are acquired, and each Z value, the position of the pixel of the displacement destination by the displacement vector, and An image reference vector that is the inverse of the displacement vector is determined (S40).
  • S40 the result is sorted by the Z value to determine the image reference vector of the write candidate for each of the displacement destination pixels (S42).
  • the Z value of the corresponding pixel in the Z buffer 264 generated by the processing of the previous reference pixel is compared with the Z value for the image reference vector of the write candidate (S44), and the Z value of the image reference vector of the write candidate is Z If it matches the Z value in the buffer 264, the image reference vector is written to the corresponding pixel of the image reference vector map 266 (S46).
  • the image reference vector can be determined by the same procedure.
  • identification information indicating that the reference destination is a self-image is already written at the time of creation of the Z buffer, new writing is not performed on the pixel. Then, when the Z value of the cross reference and the extension reference is written, identification information of the image of the reference destination is also written in the Z buffer.
  • writing the image reference vector writing is performed only when the identification information of the image to be processed matches the identification information written in the Z buffer. By such processing, it is possible to set an image reference vector which refers to another image only for the pixel that is not filled in with the reference of the self image in the image reference vector map.
  • FIG. 21 is a diagram for describing an AtomicMin instruction used when writing the Z value to the Z buffer 264 in S36 of FIG.
  • (a) schematically shows how an AtomicMin instruction is issued from each of four processors "P1", “P2", “P3” and "P4".
  • Each processor designates an address in the memory at an independent timing, and issues an instruction of AtomicMin (address, value) by using a value to be written in the address as a packet.
  • the write destination pixel corresponds to the address in the memory
  • the Z value corresponds to the value to be written.
  • the instructions form a matrix in the order they were issued.
  • the figure shows how packets 504a, 504b, 504c and 504d included in the instructions issued by the processors P4, P3, P2 and P1 respectively form a matrix in this order according to the correspondence of hatching patterns. .
  • the order is not limited to this.
  • Each packet is sent to the line in the secondary cache 502 that corresponds to the specified address, as shown in FIG. At this time, if the destination line does not overlap, the value of the packet is written to the corresponding line as it is. In the example of (b), the values of the packets 504a, 504b, and 504c are written in the corresponding line.
  • the written values are compared, but as a result of not comparing the values of each other's packets, the larger value may be written depending on the timing. possible.
  • the minimum value By guaranteeing that atomic operation will start processing the next packet after completion of processing for a certain packet, the minimum value always remains in the secondary cache 502, and thus the minimum Z value for each pixel of the Z buffer. I can write it.
  • the AtomicMin instruction requires reading back from the main memory to the secondary cache 502, and in the case where successive writes to the same address, the throughput depends on the processing speed on the secondary cache 502, and the packet The longer bit length requires a larger comparator.
  • the Z buffer 264 is first completed by such an AtomicMin instruction, and the Z value and the image reference vector are calculated again and compared with the Z value of the Z buffer 264. Whether to write the image reference vector is determined. That is, the Z value is calculated in duplicate. This may be done in a single calculation to streamline the process.
  • FIG. 22 shows a procedure of processing for integrating the processing of FIGS. 19 and 20 to efficiently generate the image reference vector map 266.
  • the drawing is the same as in FIGS.
  • the reference pixel determined in the original image and data 370 relating to three parallax values shifted from the center by 0.5 pixels are acquired, and each Z value and the displacement destination by the displacement vector are obtained.
  • An image reference vector that is the inverse of the pixel position and displacement vector is determined (S40).
  • the results are sorted by the Z value to determine the image reference vector of the write candidate for each of the displacement destination pixels (S42). That is, in this method, the pre-generation of the Z buffer 264 as shown in FIG. 19 is not performed.
  • the atomic Min instruction is issued using the packet generated in S40 and containing both the Z value and the image reference vector, thereby simultaneously writing to the Z buffer 264 and the image reference vector map 266 (S50).
  • the figure illustrates the structure of a packet 504 that is the target of the AtomicMin instruction.
  • the packet 504 is configured by data of “Z value”, “image ID”, “X offset value”, and “Y offset value”.
  • image ID indicates identification information of a reference destination image
  • X offset value and Y offset value indicate x component and y component of an image reference vector.
  • the packet 504 has a 64-bit size, with the upper 32 bits allocated to the “Z value” and the “image ID”, and the lower 32 bits allocated to the “Xoffset value” and the “Y offset value”. However, this is not intended to limit the number of bits and data structure.
  • a packet 504 having a structure as shown is generated in parallel to the reference pixel and three points in the vicinity as described above. Then, each processor targets the entire packet 504, designates the address of the pixel to be displaced, and issues an AtomicMin instruction.
  • an AtomicMin instruction that targets 64 bits is issued. If the write destination is not duplicated, the upper 32 bits of data are written to the Z buffer 264, and the lower 32 bits of data are written to the displaced pixel of the image reference vector map 266. If the write destination is duplicated, the Z buffer 264 and the image reference vector map 266 are overwritten with the upper 32 bits of data and the lower 32 bits of data, respectively, if the later packet has a smaller value.
  • the packet to be compared contains the data of the image reference vector, it means that the comparison of only the Z value is not performed, but by assigning the Z value to the upper bits, the large Z value There is no data written with.
  • the magnitude of the component of the image reference vector can affect the result only when the Z values completely match, since the Z values match in the first place, either image reference vector is displayed even if it is written The influence on the image is small.
  • only the upper bits may be strictly compared by adding the process of masking the lower bits as part of the atomic operation. That is, in this example, when the write destination pixels overlap, only the upper 32 bits or only the bits representing the Z value are compared, and if the value is smaller, the value of the upper bits is written to the Z buffer 264 and the same packet The lower bit value is written to the image reference vector map 266.
  • the accuracy of the image reference vector map 266 is improved.
  • the size of the comparator can be determined by the number of bits of the Z value to be compared, regardless of the data length of the entire packet. As a result, even if the data length of the entire packet is increased by increasing the number of bits of the image reference vector or including data of various attributes, implementation is easy.
  • the calculation of Z value can be performed once and the image reference vector map 266 is generated. The speed can be greatly improved.
  • FIG. 23 is a flowchart showing a procedure of generating a display image using the image reference vector map by the display image generation unit 268 in S14 of FIG.
  • the display image generation unit 268 acquires the position and orientation of the view screen according to the position of the viewpoint and the direction of the line of sight at that time from the view screen control unit 252, and maps the image reference vector map thereon (S72).
  • the target pixel to be drawn is set (S74).
  • the sampling point of the image reference vector map corresponding to the target pixel is specified, and the image reference vector at that position is acquired (S76).
  • the color value at the position indicated by the image reference vector acquired in S76 is acquired and the target pixel is drawn (S80). If the original image is a mipmap, the LOD to determine the mipmap level of the reference destination The color value is obtained from the original image of the level corresponding to the LOD.
  • the processing of S74 to S80 is repeated until all pixels of the display image are drawn (N of S82). If all pixels have been drawn, the processing is ended (Y in S82).
  • the left and right eye display images can be generated by performing the processing shown in FIG.
  • FIG. 24 is a diagram for explaining the positional relationship between a display image, an image reference vector map, and an original image.
  • the pixel array shown by the dotted line in (a) is a part of the display image 380, and the shaded pixel array is a part of the image reference vector map 382, respectively, and they are superimposed to show the correspondence of positions.
  • the shape of the image reference vector map 382 may be distorted by perspective transformation, but each pixel is represented by a square in FIG.
  • the pixel array of (b) is a part of the original image 386.
  • a position in the pixel 388 on the image reference vector map 382 corresponding to the position of the center thereof is set as a sampling point 384.
  • An image reference vector indicated by an open arrow at the sampling point 384 is, for example, a pixel 388 including the sampling point 384 and three adjacent pixels adjacent to the pixel 384, two lines 2 indicated by dark shading Determined based on the four-pixel image reference vector of the column. Basically, it can be determined by interpolating the image reference vector of these four pixels.
  • FIG. 25 is a diagram for explaining the recursive filter introduced in the present embodiment.
  • the figure schematically shows a state where the viewer 302 and the map screen 300 are looked over. Now, it is assumed that the viewer 302 moves as shown by arrow A. At this time, as described above, the image of the object 304 is also moved on the screen plane while moving the map screen 300 as indicated by the arrow B so that the object 304 appears to be fixed in the virtual space. However, movement of the map screen 300 itself is not essential.
  • the image reference vector is determined on the map screen at that time, and the color value is obtained by referring to the original image accordingly.
  • color values determined for the viewpoint of the previous frame are stored as a color map 267.
  • the color values of the previous frame include the color values of the previous frame, and as a result, the color map is information including the history of the past color values.
  • the original image operation unit 254 combines the color value of the corresponding position in the color map 267 of the previous frame with the color value obtained from the original image with respect to the viewpoint at the current point, thereby obtaining the color map of the current frame. create.
  • the image of the same object 304 travels on the map screen 300 with the movement of the viewpoint of the viewer 302. Therefore, the “corresponding position” referred to on the color map 267 of the previous frame is not the same position on the image plane but a position representing the same part of the image of the same object before movement.
  • the ratio indicates the synthesis ratio, and a good value is determined by experiments and the like. Note that the calculation method of synthesis is not limited to the above equation, and synthesis may be performed at a larger rate as time is closer.
  • the display image generation unit 268 refers to the position on the color map corresponding to the pixel of the display image, and determines the color value of the pixel. That is, at this stage, it is not necessary to refer to the original image using the image reference vector.
  • the recursive filter may be introduced in setting the color values of all the pixels, or may be introduced only in a portion where flicker is likely to occur. In the former case, it is only necessary to refer to the color map in the process of drawing the display image.
  • the end point or Z value of the image reference vector has a difference of a predetermined value or more, or a different image is referred to
  • the recursive filter may be applied only to the pixels included in the area.
  • the application condition may be only one of them, or two or more of them may be adopted.
  • FIG. 26 to 28 schematically show the color map generation procedure in the case of introducing a recursive filter.
  • FIG. 26 shows the procedure for determining the color value of the pixel to which the recursive filter is not applied in the color map.
  • the original image 406 is referred to based on the image reference vector of the target pixel in the image reference vector map 402 generated for the current viewpoint (S200).
  • the color value of the reference destination is appropriately filtered to determine the color value, and the color value is written in the corresponding pixel of the color map 404 (S202). That is, in this case, the color map 400 generated in the previous frame is not used.
  • FIG. 27 shows the first stage of processing for determining the color value of the pixel to which the recursive filter is applied in the color map.
  • the original image 406 is referred to based on the image reference vector of the target pixel in the image reference vector map 402 generated for the current point of view (S204). Further, the position corresponding to the target pixel in the color map 400 generated in the previous frame is obtained and referred to. That is, the displacement vector of the object according to the movement of the viewpoint to the current time is calculated from the previous frame in which the color map 400 was generated, and the "corresponding position" is found by tracing the inverse vector.
  • FIG. 28 shows the process of the second stage which is performed after FIG. 27 for determining the color value of the pixel to which the recursive filter is to be applied. That is, the color value determined from the reference destination of the original image 406 in S204 of FIG. 27 is New_Color, and the color value determined from the reference destination of the color map 400 of the previous frame in S206 in FIG. It writes in the corresponding pixel of the color map 404 (S208, S210).
  • the color map 404 of the current frame is completed.
  • the color map 404 is replaced with the color map 400 of the previous frame.
  • FIG. 29 schematically shows a procedure in which the display image generation unit 268 determines the color value for each pixel of the display image for the pixels to which the recursive filter is not applied.
  • a sampling point in the image reference vector map 402 is determined for each pixel 410 in the display image (S212), and the image reference vector around it is interpolated to refer to the original image 406 Are identified (S214). Then, the color value of the reference destination is filtered or the like to obtain the color value of the pixel 410 in the display image (S216).
  • FIG. 30 schematically shows a procedure in which the display image generation unit 268 determines the color value for each pixel of the display image for the pixel to which the recursive filter is applied.
  • a sampling point in the image reference vector map 402 is determined for each pixel 410 in the display image (S218).
  • the position corresponding to the sampling point in the color map 404 of the current frame is referred to (S220).
  • the color value of the pixel 410 in the display image is determined by interpolating the pixels around the sampling point in the color map 404 (S222).
  • color maps 400, 404 are generated on the image plane corresponding to the current image reference vector map. Therefore, in order to obtain the corresponding position in the color map 400 of the previous frame from the processing in S206 of FIG. 27, that is, the position in the image reference vector map 402 of the current frame, the displacement of the image position between the image reference vector maps is determined. There is a need.
  • FIG. 31 is a diagram for explaining the relationship between movement amount components in the Z-axis direction and the X-axis direction among movement amounts of a viewpoint and movement amounts of pixels between image reference vector maps according to the movement amounts.
  • FIG. 11 shows the movement of the right eye
  • FIG. 11 shows displacement of pixels from the image screen 76 to the map screen 334 a due to the viewpoints 88a and 88b as base points, the viewpoint 332 of the right eye after movement, and the movement. It is similar to The image reference vector map of the previous frame shall be generated on this map screen 334a.
  • the map screen 334b in the current frame moves by - ⁇ Z from the map screen 334a of the previous frame Do.
  • the moving destination txR of the pixel in the state of FIG. 11 further moves to the position txR2 on the map screen 334b.
  • the region is shown enlarged on the upper right.
  • the displacement amount from txR to txR2 finally becomes ⁇ dx 2 ⁇ gx.
  • the position shifted in the X-axis direction by ⁇ dx 2 + ⁇ gx obtained by reversing the positive and negative of the displacement amount may be referred to.
  • FIG. 32 is a diagram for explaining the relationship between the movement amount components in the Z-axis direction and the Y-axis direction of the movement amount of the viewpoint and the movement amount of the pixel between the image reference vector maps according to that.
  • the viewpoint 88 as the base point, the viewpoint 332 after movement, and the displacement of the pixel from the image screen 76 to the map screen 334a due to the movement are the same as those shown in FIG.
  • the map screen 334a is of the previous frame, and the viewpoint is further moved by - ⁇ Z in the Z axis direction and by ⁇ Y in the Y axis direction by the time of the next frame.
  • the map screen 334 b of the current frame moves by ⁇ Z from the map screen 334 a of the previous frame.
  • the moving destination ty of the pixel in the state of FIG. 12 further moves to the position ty2 on the map screen 334b.
  • the region is shown enlarged on the upper right.
  • the displacement amount from ty to ty2 finally becomes ⁇ dy2 ⁇ gy.
  • the position displaced in the Y axis direction by ⁇ dy 2 + ⁇ gy obtained by reversing the positive and negative of the displacement amount may be referred to. This relationship is common to the right and left eyes.
  • the image reference vector map of the previous frame is stored together with the color map, and based on the change of the image reference vector of the same pixel, the corresponding pixel position of the previous frame is referred It is conceivable to obtain it first. However, in this case, it is necessary to perform exception processing when the reference target original image differs between frames. Further, a storage area for storing the image reference vector map of the previous frame is further required. From such a viewpoint, as shown in FIGS. 31 and 32, the derivation method of the reference destination based on the virtual space is selected.
  • the image displayed as described above defines the object in a three-dimensional space and projects the image on the screen plane, and the original information is two-dimensional on the parallax image. Therefore, depending on the movement amount of the viewpoint, all pixels of the display image can not be represented only by the pixels of the original image or the image for extended reference, and a hole or a gap may be exposed. In this case, it is conceivable that the outline of the image of the object is deformed or that the pixels appear to be separated and floated. Also, aliasing and flicker may occur. This is also caused by the tilt of the viewer's head.
  • FIG. 33 schematically shows an example of change of the display image due to the tilt of the viewer's head.
  • the head of the viewer 432 is upright and the axis thereof coincides with the Y-axis direction of the display screen 430a, the image of the object in the display image on the left and the right It will be out of alignment. In this case, the situation is the same as when the original parallax image is acquired, and the object can be suitably viewed stereoscopically.
  • the head of the viewer 432 is inclined as shown in (b)
  • the left and right display images are generated according to the displacement, so the displacement occurs in a direction different from the X-axis direction of the display screen 430b. .
  • Such a change may cause a hole in the image of the object, or the user may not be able to view stereoscopic vision properly and may cause discomfort such as intoxication.
  • the display image changes excessively to correspond to the change of the viewpoint, even though there is no intention to look around the object in particular.
  • the head is often slightly inclined even if it is intended to be upright. As a result, if the image is not displayed properly, the viewer will feel uncomfortable. In other words, in order to see the original proper image, the posture must be strictly correct.
  • FIG. 34 is a diagram for describing a method of adjusting the position of the map screen in accordance with the position of the viewpoint. This figure shows the positional relationship between the eyes and the map screen in a perspective view.
  • An image for left eye 440 a and an image for right eye 440 b are generated on the map screen.
  • the entities of the left-eye image 440a and the right-eye image 440b are left and right image reference vector maps, but they are hereinafter referred to as the left-eye image 440a and the right-eye image 440b.
  • the X axis and the Y axis of the viewer's viewpoints 88a and 88b from the cameras 70a and 70b when acquiring the original image.
  • the displacement amounts in the Z-axis direction are sequentially input.
  • the displacement amounts in the axial direction of the left viewpoint 88a are (x_off_L, y_off_L, z_off_L)
  • the displacement amounts in the axial direction of the right viewpoint 88b are (x_off_R, y_off_R, z_off_R).
  • the left-eye image 440a and the right-eye image 440b are displaced in the same direction by the same amount with respect to the displacement amount in the Z-axis direction (z_off_R, z_off_L).
  • the image of the object can be represented without the calculation method as described in FIGS. 11 to 14 being broken.
  • the left-eye image 440a and the right-eye image 440b are similarly moved in the X-axis direction and the Y-axis direction according to the movement of the viewpoint so as to suppress a defect caused by head inclination and the like.
  • displacement amounts in the X-axis direction and the Y-axis direction at this time are X_Ave_off and Y_Ave_off, respectively, they are determined as follows.
  • X_Ave_off (x_off_R + x_off_L) / 2
  • Y_Ave_off (y_off_R + y_off_L) / 2 That is, the image is moved in the same direction by the average value of the displacement amounts of both viewpoints.
  • the left-eye image 440 a and the right-eye image 440 b are similarly moved in order to maintain the view frustum at the time of acquisition of the original image.
  • Displacement amount of left eye viewpoint (X_off_L-X_Ave_off, Y_off_L-Y_Ave_off)
  • Displacement amount of right eye viewpoint (X_off_R-X_Ave_off, Y_off_R-Y_Ave_off)
  • FIG. 35 is a flowchart showing a processing procedure in which the original image operation unit 254 of the image generation device 200 adjusts the position of the image on the XY plane according to the position of the head of the observer. This flow chart is performed in parallel with the display image being output according to the processing procedure shown in FIG.
  • a predetermined condition for performing adjustment is satisfied (S300).
  • the predetermined condition when the observer inputs such an instruction, the timing of switching in a mode of switching and displaying a plurality of still images, the timing of switching of a scene in a mode of displaying a moving image, etc. are considered.
  • any of general input methods may be used, such as assigning a function for the instruction input to predetermined input means of an input device (not shown).
  • the position / posture acquisition unit 250 also acquires a signal from the input device and supplies the signal to the original image operation unit 254.
  • the timing is such that the movement of the image is not noticeable as described above.
  • the original image operation unit 254 may appropriately determine the timing with reference to timeline information and the like relating to the content of the image, which is included in the original image data 258.
  • the original image operation unit 254 may monitor a change in the posture of the viewer, and after a change of a predetermined amount or more occurs, it may be set as a condition determined that the stability is obtained.
  • the change of the viewer's posture can be obtained from the measurement value of the motion sensor built in the head mount display.
  • the display device is a 3D television receiver
  • an imaging device (not shown) for photographing a viewer may be separately provided, and the change in posture may be acquired by analyzing the photographed image by a general method. For example, when a large posture change is detected, such as when the viewer falls over, it is determined that the stability is obtained when the posture after the change continues for a predetermined time.
  • the condition of S300 any one of the above-described examples may be adopted, or two or more may be adopted. As long as the condition is not satisfied, the monitoring is continued (N at S300).
  • the displacement amounts (x_off_R, y_off_R) and (x_off_L, y_off_L) of the viewpoint at that time are acquired (S302). Then, the average value of the displacement amounts of the left and right viewpoints is calculated for each of the X-axis component and the Y-axis component to be the image adjustment amount (X_Ave_off, Y_Ave_off) (S304).
  • a value obtained by subtracting the adjustment amount of the image from the displacement amount of the left and right viewpoints is used as a new displacement amount (S306), thereby substantially moving the image on the XY plane
  • the viewpoint when the displacement amount is obtained in S302 is the base point.
  • the displacement amounts of the left and right viewpoints of the nth frame are set as follows using the ratio ratio.
  • the ratio becomes 1 at the M-th frame from the timing when the condition is satisfied, and the adjustment for the adjustment amount obtained in S304 is completed.
  • the number of frames M for completing the adjustment may be set to an appropriate value by experiment or the like, or may be adaptively determined based on the displacement amount of the viewpoint at the time when the condition is satisfied in S300. For example, when the displacement amount at that time is large, the adjustment amount of the image also becomes large, so the number of frames M is increased and the adjustment is performed in a relatively long time. When adjusting gradually in this manner, the viewer may be able to recognize that the adjustment is in progress. For example, during the adjustment period, an icon indicating that may be displayed in any part of the display image, or an attribute such as a color of an object to be displayed may be changed.
  • an original image generated in advance is changed according to the movement or direction of the viewpoint to be a display image.
  • an image reference vector map indicating the difference from the position in the original image is used without using the original image itself.
  • the color value of the pixel representing the image of the same object in the time until that time is synthesized with the color value acquired from the original image.
  • the pixel value is large due to a minute change in the viewpoint. It is possible to suppress flicker due to change and return.
  • the image plane for generating the image reference vector map is adjusted in accordance with the XY component of the movement of the viewpoint.
  • 100 head mounted display 200 image generation device, 222 CPU, 224 GPU, 226 main memory, 250 position / attitude acquisition unit, 252 view screen control unit, 254 original image operation unit, 256 original image data storage unit, 258 original image data , 260 disparity value image data, 262 reference data storage unit, 264 Z buffer, 266 image reference vector map, 267 color map, 268 display image generation unit, 270 output unit.
  • the present invention can be used for various information processing devices such as game devices, image display devices, image reproduction devices, personal computers, and information processing systems including any of them.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Processing Or Creating Images (AREA)

Abstract

画像生成装置200の位置・姿勢取得部250は、ユーザ頭部の位置や姿勢の情報を取得する。ビュースクリーン制御部252は、ユーザの視点に応じたビュースクリーンを設定する。原画像操作部254は、ユーザの視点の移動に応じてオブジェクトが固定されて見えるように画素の変位を求め視点に対応する画像のカラー値を取得するとともに、前フレームの視点に対応するカラーマップのカラー値を合成し、新たなカラーマップとする。表示画像生成部268は、ビュースクリーンにおける各画素の値を、対応する位置のカラーマップにより決定し表示画像を生成する。出力部270は表示画像を出力する。

Description

画像生成装置および画像生成方法
 本発明は、立体映像を生成する画像生成装置および画像生成方法に関する。
 映像を立体的に提示できる3次元テレビやヘッドマウントディスプレイ等の3次元表示デバイスが利用されている。携帯電話や携帯ゲーム機等の携帯端末機において映像を立体的に提示できるデバイスも開発されており、一般のユーザが立体的な映像を視聴する機会が増加してきている。
 立体的な映像を表示する3次元表示デバイスは、ユーザの左右の目に視差のある画像を見せることでユーザが画像を立体視することを可能にする。左右の目に視差のある画像を見せるために特殊な光学メガネを利用する方式や、光学メガネを使わずにパララックスバリアやレンチキュラーレンズを用いる方式などがある。
 歪みのない立体映像を見せるためには、ユーザの視点に基づく正確な視差画像を生成する必要がある。したがって視点の動きを許容して立体映像を提示するには、一般的には仮想3次元空間にオブジェクトを配置しカメラ座標系を変化させて射影するなどの処理が必要になる。しかしながら画像の質や精度を追求するほど、そのような処理に要する時間が増え、表示が視点の動きに追随しにくくなる。また元の視差画像のデータに多くの操作が加わることにより、画質が劣化する可能性が高くなる。
 本発明はこうした課題に鑑みてなされたものであり、その目的は、視点が変位しても高品質な立体画像を少ない遅延で生成できる技術を提供することにある。
 本発明のある態様は画像生成装置に関する。この画像生成装置は、左右の異なる視点から取得された一対の原画像を用いて、オブジェクトを立体視できる画像を生成する画像生成装置であって、ユーザの視点の移動に対しオブジェクトが仮想空間で固定されるように、当該視点の移動に応じて原画像の画素の変位を算出することにより、各時点での視点に対応する画像の各画素のカラー値を取得するとともに、前の時点での視点に対応する画像を表すカラーマップにおける同じ像を表す画素のカラー値を合成することにより、各時点での新たなカラーマップを生成する原画像操作部と、表示画像の各画素に対応するカラーマップ上の位置におけるカラー値に基づき、当該画素のカラー値を決定する表示画像生成部と、表示画像のデータを出力する出力部と、を備えたことを特徴とする。
 本発明の別の態様は画像生成方法に関する。この画像生成方法は、左右の異なる視点から取得された一対の原画像を用いて、オブジェクトを立体視できる画像を生成する画像生成方法であって、ユーザの視点の移動に対しオブジェクトが仮想空間で固定されるように、当該視点の移動に応じて原画像の画素の変位を算出することにより、各時点での視点に対応する画像の各画素のカラー値を取得するとともに、前の時点での視点に対応する画像を表すカラーマップにおける同じ像を表す画素のカラー値を合成することにより、各時点での新たなカラーマップを生成するステップと、表示画像の各画素に対応するカラーマップ上の位置におけるカラー値に基づき、当該画素のカラー値を決定するステップと、表示画像のデータを出力するステップと、を含むことを特徴とする。
 なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置などの間で変換したものもまた、本発明の態様として有効である。
 本発明によると、視点が変位しても高品質な立体画像を少ない遅延で提示できる。
本実施の形態におけるヘッドマウントディスプレイの外観図である。 本実施の形態における画像表示システムの構成図である。 本実施の形態の画像表示システムによって実現される表示の形態を説明するための図である。 本実施の形態の画像生成装置が生成する画像を模式的に示す図である。 本実施の形態において視差画像を取得する段階で与えられる視差と画像の関係を説明するための図である。 適切な位置から視差画像を鑑賞する場合の視点と画像の関係を示す図である。 左右の原画像に表される同一のオブジェクトの像を重ねて示す図である。 本実施の形態における画像生成装置が、原画像から表示画像を生成する処理手順の概略を示すフローチャートである。 本実施の形態における画像生成装置の内部回路構成を示す図である。 本実施の形態における画像生成装置の機能ブロックを示す図である。 本実施の形態において、視点の移動量のうちZ軸方向およびX軸方向の移動量成分と、それに応じた原画像の画素の移動量との関係を説明するための図である。 本実施の形態において、視点の移動量のうちZ軸方向およびY軸方向の移動量成分と、それに応じた原画像の画素の移動量との関係を説明するための図である。 本実施の形態において、視点の移動量のうちZ軸方向およびX軸方向の移動量成分と、右目用の画像参照ベクトルマップにおいて左目用の原画像を参照する際の画素の移動量との関係を説明するための図である。 本実施の形態において、拡張参照における画像参照ベクトルの計算手法を説明するための図である。 本実施の形態における変位ベクトルと画素領域の関係を模式的に示す図である。 本実施の形態において、画像参照ベクトルマップ上の各画素に対し画像参照ベクトルを決定する処理手順の概略を示すフローチャートである。 本実施の形態における画像参照ベクトルの補間手法を説明するための図である。 図8のS12において原画像操作部254が画像参照ベクトルマップを生成する処理手順を示すフローチャートである。 図18のS22において、自己画像を参照先とする画像参照ベクトルを生成するためのZバッファへの書き込み処理の手順を示す図である。 図18のS22において、自己画像を参照先とする画像参照ベクトルの設定処理の手順を示すフローチャートである。 図19のS36においてZバッファ264にZ値を書き込む際に用いるAtomicMin命令について説明するための図である。 図19、20の処理を統合して画像参照ベクトルマップを効率的に生成する処理の手順を示す図である。 図8のS14において、表示画像生成部268が画像参照ベクトルマップを用いて表示画像を生成する手順を示すフローチャートである。 本実施の形態における、表示画像、画像参照ベクトルマップ、および原画像の位置的関係を説明するための図である。 本実施の形態で導入する再帰型フィルタを説明するための図である。 本実施の形態において再帰型フィルタを導入した場合のカラーマップの生成手順を模式的に示す図である。 本実施の形態において再帰型フィルタを導入した場合のカラーマップの生成手順を模式的に示す図である。 本実施の形態において再帰型フィルタを導入した場合のカラーマップの生成手順を模式的に示す図である。 本実施の形態における表示画像生成部が、再帰型フィルタを適用しない画素について表示画像の画素ごとにカラー値を決定する手順を模式的に示す図である。 本実施の形態における表示画像生成部が、再帰型フィルタを適用する画素について表示画像の画素ごとにカラー値を決定する手順を模式的に示す図である。 本実施の形態において、視点の移動量のうちZ軸方向およびX軸方向の移動量成分と、それに応じた画像参照ベクトルマップ間での画素の移動量との関係を説明するための図である。 本実施の形態において、視点の移動量のうちZ軸方向およびY軸方向の移動量成分と、それに応じた画像参照ベクトルマップ間での画素の移動量との関係を説明するための図である。 本実施の形態における、鑑賞者の頭部の傾きによる表示画像の変化例を模式的に示す図である。 本実施の形態において、視点の位置に応じてマップスクリーンの位置を調整する手法を説明するための図である。 本実施の形態における画像生成装置の原画像操作部が、観察者の頭部の位置に応じて画像の位置をXY平面上で調整する処理手順を示すフローチャートである。
 本実施の形態は、視差画像のうち右目用画像を右目に、左目用画像を左目に到達させることにより立体視させる3次元画像表示システムに関する。その限りにおいて画像の表示形態や鑑賞者の鑑賞形態は限定されない。例えば平板型ディスプレイやスクリーンに同時あるいは交互に視差画像を表示させ、偏光眼鏡やシャッター眼鏡により鑑賞する態様が考えられる。あるいは左右の目に対し独立に画像を提示できるヘッドマウントディスプレイを利用することも考えられる。ここでは主に、後者を例に説明する。
 図1は、ヘッドマウントディスプレイ100の外観図である。ヘッドマウントディスプレイ100は、本体部110、前頭部接触部120、および側頭部接触部130を含む。ヘッドマウントディスプレイ100は、鑑賞者の頭部に装着してディスプレイに表示される静止画や動画などを鑑賞し、ヘッドホンから出力される音声や音楽などを聴くための表示装置である。ヘッドマウントディスプレイ100に内蔵または外付けされたモーションセンサにより、ヘッドマウントディスプレイ100を装着した鑑賞者の頭部の回転角や傾きといった姿勢情報を計測することができる。
 図2は、本実施の形態における画像表示システムの構成図である。ヘッドマウントディスプレイ100は、無線通信またはUSBなどの周辺機器を接続するインタフェース280で画像生成装置200に接続される。画像生成装置200は、さらにネットワークを介してサーバに接続されてもよい。その場合、サーバは、複数のユーザがネットワークを介して参加できるゲームなどのオンラインアプリケーションを画像生成装置200に提供してもよい。画像生成装置200はゲーム装置、パーソナルコンピュータ、携帯端末などのいずれでもよい。また画像生成装置200とヘッドマウントディスプレイ100とを一体的に構成してもよい。
 図3は、画像表示システムによって実現される表示の形態を説明するための図である。本実施の形態では、画像を表す平面を、さらに仮想空間に配置した状態を作り出す。すなわち観念的には(a)に示すように、画像を表示させたスクリーン50を仮想空間における場52上に配置させ、鑑賞者54が、ビュースクリーン56を介してそれを鑑賞できるようにする。ここでビュースクリーン56は、ヘッドマウントディスプレイ100に表示される画像の視野に対応する。
 鑑賞者54が仮想空間を見ながら移動すると、仮想世界との相対位置の変化に応じてスクリーン50の見え方も変化する。例えば(a)に示すように、鑑賞者54がスクリーン50に対し右方にいる場合、画像生成装置200は矢印で示すような視線に対応する(b)のような画像を生成し、ヘッドマウントディスプレイ100に表示させる。なお仮想空間における場52は仮想空間の座標系を表象しているに過ぎず、形状などを限定する主旨ではない。また必ずしも表示させなくてよい。
 図4は、図3の態様を実現するために画像生成装置200が生成する画像を模式的に示している。本実施の形態において画像スクリーン50に表示させる画像は、立体視用の一対の視差画像、すなわち左目用画像60aおよび右目用画像60bで構成される。図3で示すような画像を立体視させるためには、同じオブジェクトが左目用画像60aでは右寄りに、右目用画像60bでは左寄りに表れる。
 また画像スクリーン50に対する視点の位置が左右の目で異なるため、それぞれの視点から透視変換を行う必要がある。例えば図3に示すように鑑賞者が画像スクリーン50に対し右方にいる場合、左目より右目の方が画像スクリーン50に近く、画像スクリーン50の平面に垂直な軸に対する角度が大きくなる。結果として画像スクリーン50の枠の形状および位置は左目用画像60a、右目用画像60bで異なり、それらを同一平面上に重ねて表すと、平面62に示すような位置関係となる。
 このような左目用画像60a、右目用画像60bを生成し、ヘッドマウントディスプレイ100の画面を左右に分割してなる領域のうち左目に対する領域に前者を、右目に対する領域に後者を表示させることにより、鑑賞者には図3の(b)で示される状態で画像スクリーン50に表れるオブジェクトが立体に見えるようになる。なお実際には、ヘッドマウントディスプレイ100の画面と鑑賞者の目の間にはレンズが設けられ、左右の目の視野全体に画像が表れるようにする。そのため左目用画像60a、右目用画像60bにはそれぞれ、レンズを介して見たときに本来の画像が視認されるようなレンズ歪み補正が施される。
 このように本実施の形態では、立体視用の視差画像が準備されており、それを自由な視点で鑑賞できるような態様を実現する。仮想的な空間を立体視させる技術としては、仮想世界が3次元空間で定義済みであり、鑑賞者の左右の視点に応じたビュースクリーンに仮想世界のオブジェクトを射影して視差画像を生成する技術がある。一方、3次元動画のようにあらかじめ撮影または生成された2次元画像を立体視させる場合、元々視差が与えられているためそのままでは鑑賞者の視点が限定される。
 図5は、視差画像を取得する段階で与えられる視差と画像の関係を説明するための図である。同図は想定する左右の視点(カメラ70a、70b)、視差画像が取得される画像スクリーン76、および視差画像に写るオブジェクト78を含む仮想的な空間を俯瞰した状態を模式的に示している。なお視差画像はステレオカメラで撮影した画像とすることもでき、カメラ70a、70bはその場合のステレオカメラに相当する。
 また同図では一対の視差画像の平面を画像スクリーン76で同時に表している。以後、このように画像スクリーン76上で元々取得されている視差画像を、鑑賞段階での表示画像と区別するために「原画像」と呼ぶことがある。また以後の説明において原画像の平面と垂直な方向をZ軸、画像平面における水平方向および垂直方向をそれぞれX軸、Y軸とする。
 原画像にはオブジェクト78の像が表れている。例えばオブジェクト78表面のある点80は、左のカメラ70aからは光軸82aから右側にaだけ離れた位置84aに、右のカメラ70bからは光軸82bから左側にbだけ離れた位置84bに表れる。つまり点80に対する視差Dpはa+bである。実際には様々な位置にオブジェクトが存在してよく、その深さ方向の距離に応じた視差で、左右の原画像に像が表される。
 画像スクリーン76からオブジェクト78上の点80までの距離Zpは、視差Dpを用いて三角形の相似により次のように求められる。
 Ewp : Exp - Dp = Scp + Zp : Zp
 よって
 Zp = Scp * Ewp / Dp - Scp
ここでEwpは左右のカメラ70a、70bの間隔、Scpはカメラ70a、70bから画像スクリーン76までの距離である。
 このように得られた視差画像を上述のように鑑賞する場合を考える。図6は適切な位置から視差画像を鑑賞する場合の視点と画像の関係を示している。図の形式は図5と同様である。画像を鑑賞する段階では、鑑賞者の視点88a、88bと、それらから距離Scsだけ隔てた位置に鑑賞者が見るビュースクリーン86が存在する。そのような空間に図5で示した視差画像取得時の位置関係を当てはめた場合、図示するように鑑賞者の視点88a、88bがカメラ70a、70bと同じ位置になるように画像スクリーン76の位置を決め、その位置での視差画像をビュースクリーン86にそれぞれ射影すれば、オブジェクト78を歪みなく立体視できる。
 これは原画像を取得した際のカメラ70a、70bの視錐台と、それを鑑賞する際の視点88a、88bの視錐台がそれぞれ一致していることに相当する。一方、鑑賞者が移動して視点88a、88bが図示するような位置関係から外れると、オブジェクトが歪んで見えたり適正に立体視できなかったりすることが考えられる。場合によっては体調に悪影響を及ぼすこともある。
 このような視点の移動を許容して適正に立体視させるためには、与えられた2次元画像を一旦、3次元の仮想空間に逆射影したうえ、再度ビュースクリーンに射影することが考えられる。例えば左右どちらかの原画像を、画素中心を頂点とする微小三角形に分割し、それぞれの距離Zpに応じて仮想3次元空間に配置する。距離Zpは上述の視差Dpにより求められる。そして鑑賞者の視点に対応する左右のビュースクリーンに各微小三角形を射影し、内部をテクスチャマッピングにより描画する。
 しかしながらこの場合、次に述べるような問題が生じる。図7は左右の原画像に表される同一のオブジェクトの像を重ねて示している。左目用の原画像90a、右目用の原画像90bの画素領域の境界を、それぞれ実線、破線の格子で示している。図示するように同じオブジェクトの像92を表す画素集合であっても、両画像の画素の境界が一致するとは限らない。このとき、例えば左目用の原画像90a中のある画素(例えば太線枠の画素94)に対応する領域は、右目用の原画像90bでは2つの画素にまたがっている。
 この場合、左目用の原画像90aの画素94に対して得られる視差値は画素より小さいサブピクセルの単位となる。つまりおよそ同じ像を表す画素であっても、左右どちらの原画像を基準とするかで、表されるオブジェクト上の位置に微小な差が生じ、それがサブピクセル単位の視差値の差を生む。結果として画素ごとに視差値を表したデータは、左右の原画像で一致しないことが多い。換言すれば、画素単位で視差の値を保持する「視差値画像」を、左右の原画像のそれぞれに対して生成しておくことにより、サブピクセル単位での視差情報、ひいては奥行き情報を画像に反映させることができる。
 一方、上述のように原画像を微小三角形に分割して仮想3次元空間に配置する場合、左右どちらかの原画像を選択せざるを得ず、奥行き情報も選択された画像を基準とした情報のみとなる。その結果、サブピクセル単位での詳細な画像表現が困難になる。また一般的に異なる視点から取得された画像間では光の鏡面反射の成分や屈折光の成分が異なることが普通であるが、オブジェクトを単独の点群あるいは微小三角形の集まりで表現すると、これらの情報が欠落してしまい結果的にオブジェクトの質感を損ねることになる。
 さらに、分割した微少領域を3次元空間に逆射影する処理、3次元空間における微少領域をビュースクリーンに射影する処理、という2段階の処理により、最終的な表示画像の品質が劣化しやすい。鑑賞者の視点が図6に示すような適切な位置にあり、本来は画像の変換の必要がなくても、そのような処理が介在することにより無駄に画質が劣化することになる。
 また従来の処理では、例えば大量のメモリを準備し3次元の仮想空間に逆射影した情報を点群あるいは微小三角形の集合として保存しておいたとしても、再度ビュースクリーンに対する各点の透視変換が必要であり、処理の負荷が大きい。このため原画像を動画としたり鑑賞者の移動が早かったりした場合は特に、看過できないレイテンシを生む。そこで本実施の形態では、原画像と表示画像を直接的に関連づけることで、画質の劣化やレイテンシを最小限に抑える。具体的には、視点の移動に応じたビュースクリーンの変化に対し、原画像の像がどのように移動するかをビュースクリーン上の画素ごとに計算して描画する。
 この計算において、視点が移動しても、それに応じて仮想空間でのオブジェクトの位置が変化したり歪んだりすることがないように原画像を補正した補正画像を、原画像と同一平面、または原画像と平行な平面上で生成する。これにより、各点の4x4の透視変換マトリックスを用いた透視変換処理が簡略化され、少ない演算量で画素ごとの変位を計算することが可能になる。また、最終的にビュースクリーンに対する補正画像の透視変換が必要になるが、これは補正画像全体をカバーする一つの三角形に対し実行すればよいため、従来のグラフィックスハードウェアを用いて非常に高い効率で処理することが可能である。なお以後の説明では、図6に示した、カメラと鑑賞者の視錐台が一致した状態での視点の位置を基点とし、そこからの視点の移動とそれによる画像の変化に主眼を置く。
 図8は、本実施の形態における画像生成装置200が、原画像から表示画像を生成する処理手順の概略を示すフローチャートである。画像生成装置200はまず、鑑賞者の視点の位置と視線の方向を取得する(S10)。例えばヘッドマウントディスプレイ100に内蔵したモーションセンサにより鑑賞者の頭部の姿勢を取得できる。また図示しない撮像装置で鑑賞者を撮影し、ヘッドマウントディスプレイ100の表面に設けた発光マーカーの像などに基づき鑑賞者の頭部の位置や姿勢を取得できる。
 あるいはヘッドマウントディスプレイ100側に、鑑賞者の視野に対応する画像を撮影する図示しない撮像装置を設け、SLAM(Simultaneous Localization and Mapping)などの技術により頭部の位置や姿勢を取得してもよい。このように頭部の位置や姿勢を取得できれば、鑑賞者の視点の位置および視線の方向はおよそ特定できる。鑑賞者の視点や視線を取得する手法は、ヘッドマウントディスプレイ100を利用する場合に限らず様々に考えられることは当業者には理解されるところである。
 次に画像生成装置200は、視点の位置や視線の方向に対応するようにビュースクリーンを設定し、ビュースクリーン上の画素が原画像のどの位置に対応するかを計算する(S12)。より詳細にはまず、視点の動きに応じて画像に表されているオブジェクトが変化しないように、すなわちオブジェクトの位置が仮想空間で固定されて見えるように、像を構成する各画素の移動量、移動方向を求めて原画像を変化させた補正画像を生成する。この際、補正画像を生成する平面(画像スクリーン)は原画像と同じ位置でもよいし、視点の動きに応じてZ軸方向に平行移動させてもよい。
 そのうえで、視線の方向に応じて補正画像全体に透視変換をかける。定性的には、このような一連の動きを逆に辿ることにより、ビュースクリーンの画素ごとに原画像の対応する位置を求められる。そして原画像における当該位置のカラー値をビュースクリーンの画素に反映させることにより表示画像を描画する(S14)。これらの処理を左右の視点に対して行うことで、表示すべき視差画像を生成できる。当該視差画像のデータを、適宜レンズ歪み補正を施しヘッドマウントディスプレイ100に出力することで(S16)、仮想3次元空間への逆射影を介在させずに、視点の移動に対応するような視野で歪みのない立体画像を視認させることができる。
 図8のS12およびS14の2段階の処理は、原画像自体を順次変化させて実現することも可能である。すなわち視点の移動により、一旦、原画像を変化させた補正画像を生成し、それをビュースクリーン上に透視変換することにより表示画像を描画できる。ただしこの場合、原画像に対して2度の変換処理が施されるため、表示画像の品質が維持されない可能性がある。そこで上述の第2の原画像を生成する代わりに、視点移動に応じた補正画像における各画素が、元は原画像のどの位置にあったかを表す画像マップを生成する。
 そして当該画像マップをビュースクリーン上に射影してビュースクリーンとマップとの位置関係を特定したうえで、ビュースクリーン上の画素が原画像のどの位置に対応するかを確認して原画像からカラー値を取得する。このようにすることで、原画像に対する操作は1度ですむことになり、画質を原画像レベルに維持することができる。ここで補正画像における各画素が原画像のどの位置に対応するかを表す情報は、画像平面上で始点および終点が規定されるベクトル値となるため、以後、「画像参照ベクトル」と呼ぶ。また補正画像上で画素ごとに移動参照ベクトルの情報を保持する、画像平面に対応するマップを「画像参照ベクトルマップ」または単に「マップ」と呼ぶ。
 図9は画像生成装置200の内部回路構成を示している。画像生成装置200は、CPU(Central Processing Unit)222、GPU(Graphics Processing Unit)224、メインメモリ226を含む。これらの各部は、バス230を介して相互に接続されている。バス230にはさらに入出力インタフェース228が接続されている。
 入出力インタフェース228には、USBやIEEE1394などの周辺機器インタフェースや、有線又は無線LANのネットワークインタフェースからなる通信部232、ハードディスクドライブや不揮発性メモリなどの記憶部234、ヘッドマウントディスプレイ100などの表示装置へデータを出力する出力部236、ヘッドマウントディスプレイ100からデータを入力する入力部238、磁気ディスク、光ディスクまたは半導体メモリなどのリムーバブル記録媒体を駆動する記録媒体駆動部240が接続される。
 CPU222は、記憶部234に記憶されているオペレーティングシステムを実行することにより画像生成装置200の全体を制御する。CPU222はまた、リムーバブル記録媒体から読み出されてメインメモリ226にロードされた、あるいは通信部232を介してダウンロードされた各種プログラムを実行する。GPU224は、ジオメトリエンジンの機能とレンダリングプロセッサの機能とを有し、CPU222からの描画命令に従って描画処理を行い、表示画像を図示しないフレームバッファに格納する。そしてフレームバッファに格納された表示画像をビデオ信号に変換して出力部236に出力する。メインメモリ226はRAM(Random Access Memory)により構成され、処理に必要なプログラムやデータを記憶する。
 図10は、本実施の形態における画像生成装置200の機能ブロックを示している。なお図10で示した画像生成装置200の機能のうち少なくとも一部を、ヘッドマウントディスプレイ100に実装してもよい。あるいは、画像生成装置200の機能のうち少なくとも一部を、ネットワークを介して画像生成装置200に接続されたサーバに実装してもよい。また画像生成装置200を、ゲーム機やパーソナルコンピュータなどの情報処理装置の一部としてもよい。
 同図は画像生成装置200が有する機能のうち、主に表示画像を生成する機能に着目したブロック図を描いている。これらの機能ブロックは、ハードウェア的には、図9に示したCPU、GPU、各種メモリなどの構成で実現でき、ソフトウェア的には、記録媒体などからメモリにロードした、データ入力機能、データ保持機能、画像処理機能、通信機能などの諸機能を発揮するプログラムで実現される。したがって、これらの機能ブロックがハードウェアのみ、ソフトウェアのみ、またはそれらの組合せによっていろいろな形で実現できることは当業者には理解されるところであり、いずれかに限定されるものではない。
 画像生成装置200は、ヘッドマウントディスプレイ100の位置や姿勢を取得する位置・姿勢取得部250、視点の位置や視線の方向に基づきビュースクリーンを制御するビュースクリーン制御部252、視点の位置に基づき画像参照ベクトルマップを生成する原画像操作部254、原画像のデータを格納する原画像データ記憶部256、画像参照ベクトルマップなどの中間データを格納する参照データ記憶部262、画像参照ベクトルマップを用いてビュースクリーンに表示画像を描画する表示画像生成部268、および、生成された表示画像のデータを出力する出力部270を備える。
 位置・姿勢取得部250は、上述のような手段のいずれかにより鑑賞者の頭部の位置や姿勢を取得する。ビュースクリーン制御部252は、位置・姿勢取得部250により取得された頭部の位置や姿勢に基づいて鑑賞者の視点の位置や視線の方向を決定し、それに応じたビュースクリーンを設定する。ビュースクリーン上で描画される表示画像は、例えば図4で示した左目用画像60aおよび右目用画像60bであり、ビュースクリーンも左目用と右目用を設定する。
 原画像操作部254は、視点の位置に応じてオブジェクトの像を構成する画素の移動量および方向を計算する。そしてスクリーンにおける各画素が、原画像のどの位置に対応するかを表す画像参照ベクトルを生成する。さらに当該ベクトルをスクリーン上での画像平面の各画素に対応づけた画像参照ベクトルマップを、左右の目に対しそれぞれ生成する。
 後述するように画像参照ベクトルを決定するには、視点の移動量および移動方向に加え、画像上で表されているオブジェクトの、仮想空間における距離Zpが必要になる。距離Zpは左右の原画像の視差Dpから上述のように求められる。原画像データ記憶部256には、左右の原画像データ258と、それぞれの画像の画素ごとに視差値を保持する左右の視差値画像データ260が格納される。視差値画像を左右別々に用意するのは、上述したようにサブピクセル精度の情報を活用するためである。なお視差値画像データ260の代わりに、左右の画像の画素ごとに距離Zpを保持する距離値画像データを準備してもよい。
 原画像操作部254は、視点によっては左目用の画像参照ベクトルマップに右目用の原画像を参照する画素を設けたり、右目用の画像参照ベクトルマップに左目用の原画像を参照する画素を設けたりしてもよい。これは、左右の原画像のうち一方では死角になって像として表れていない箇所が、他方で表れている場合があるためである。視点の移動によってそのような死角部分を表示する必要が生じた場合、他方の画像からデータを取得することにより、そのような細部も高精度に再現することができる。原画像操作部254はさらに、視差値画像が保持する視差値を像の外側に拡張することにより、拡張分の画像参照ベクトルも準備してよい。詳細は後述する。
 原画像操作部254はさらに、後述する再帰型フィルタを導入する場合に、過去に求められたカラー値を、画像参照ベクトルマップと同じ画像平面に表したカラーマップを生成する。画像参照ベクトルを用いて原画像から取得した現フレームのカラー値に、カラーマップから取得した、同じオブジェクトの表面を表す画素に対し前フレームで決定されたカラー値を合成することで、現フレームの該当画素のカラー値とする。これにより時間方向にフィルタを施し、オブジェクトの輪郭付近などに生じるちらつきを抑制する。
 そのようにして決定した現フレームのカラー値のマップは、新たなカラーマップとして次のフレームのカラー値の決定に用いられる。原画像操作部254はまた、特定の条件において、鑑賞者の視点のX成分、Y成分の変位量に応じて、画像参照ベクトルマップをX軸およびY軸方向に移動させる。これにより、鑑賞者の頭部が傾いていたり姿勢が崩れたりしても、できるだけ本来の高品質な画像を良好な状態で立体視できるようにする。
 参照データ記憶部262は、原画像操作部254が生成した、左右の画像参照ベクトルマップ266を格納するほか、それを作成する段階で、画像参照ベクトルの書き込みの是非を判定するためのZ値の情報を格納するZバッファ264のための記憶領域を備える。参照データ記憶部262はまた、上述のカラーマップ267も格納する。表示画像生成部268は、ビュースクリーン制御部252が設定したビュースクリーンの各画素に対応する原画像データ258またはカラーマップ267の画素値を参照することにより、カラー値を決定し表示画像を描画する。すなわち画像参照ベクトルマップを透視変換によりビュースクリーン上にマッピングしたうえ、ビュースクリーン上の画素に対応するマップ上の位置で取得された画像参照ベクトルに基づき原画像を参照し、当該画素のカラー値を決定する。
 あるいはオブジェクトの輪郭近傍など所定の条件を満たす画素については、画像参照ベクトルの代わりにカラーマップ267を参照してビュースクリーン上の画素値を決定する。これを左右の目のそれぞれに対して行うことで、左目用、右目用の表示画像を生成できる。なお原画像データ記憶部256に格納する原画像データ258を複数解像度のデータとし、透視変換による縮小率の度合いに応じて描画に用いる解像度を切り替えてもよい。
 原画像の解像度を切り替えてテクスチャマッピングを行うことにより、画像のちらつきを抑える手法は、ミップマッピングとして知られている。ただし本実施の形態では、画像を分割してなる微小領域の縮小率ではなく、スクリーン上の画素が元の原画像から遷移するまでに経た視点の移動量に基づきLOD(Level of Detail)を計算し適切な解像度を選択する。これにより、透視変換によって原画像の微少領域がどのように変形しても、それとは独立に画素に対する適切な解像度を求めることができる。
 出力部270は、表示画像生成部268が生成した左右の表示画像のデータを、ヘッドマウントディスプレイ100に所定のレートで出力する。この際、表示画像にレンズ歪み補正を施したうえで出力してもよい。出力部270はさらに、メニュー画面用の音楽や各種コンテンツに含まれる音声などの音響データも出力してよい。
 次に原画像操作部254が画像参照ベクトルを計算する手法について説明する。図11は、視点の移動量のうちZ軸方向およびX軸方向の移動量成分と、それに応じた原画像の画素の移動量との関係を説明するための図である。同図では図6で示した状態における視点88a、88bからZ軸方向に-z_off、X軸方向にx_offだけ移動した後の視点を、右目の視点332を代表させて示している。
 この移動に対し、Z軸方向に画像スクリーン76を-z_offだけ移動させ、その平面上での各画素に対し画像参照ベクトルを生成する。ただしZ軸方向の視点の移動量が比較的小さい場合などは画像スクリーン76を移動させなくてもよい。以後、移動後の画像スクリーンを「マップスクリーン」334と呼ぶ。画像参照ベクトルは、視点88bから原画像をみたときと、移動後の視点332からマップスクリーン334を見たときで、仮想空間にあるオブジェクト78が固定されて見えるときの画素の対応関係を表す情報である。例えば視点88bから見て右目用の原画像のX軸方向の位置ixRに見える像を、マップスクリーン334上の位置txRに移動させ、視点332から見れば、オブジェクト78は固定されて見える。
 なお基点となる視点88a、88bを結んだ線分の中点を通るZ軸方向の線と画像スクリーン76との交点を、左目用、右目用に関わらず画像の原点Oとする。まず視点88bのZ軸方向の動きを取り出して考える。このとき元の視点88bと画像スクリーン76との関係を維持したまま、両者をz_offだけZ軸の負の方向に平行移動することにより、移動後の視点330とマップスクリーン334が得られる。一方、オブジェクト78は固定されるため、視点のZ軸方向の動きにより、それを見る視線は実質上、X軸方向に移動していることになる。このときの移動量をgxとする。
 三角形の相似により
 b : gx = Scp : z_off
である。したがって移動量gxは次のように求められる。
 gx = b * z_off / Scp
 一方、スクリーンをz_offだけ移動させたことによる、画像スクリーン76上の位置ixRに対応するマップスクリーン334上の位置ixR2は次のように求められる。
 ixR - ixR2 : z_off = b : Scp
よって
 ixR2 = ixR - b * z_off / Scp = ixR - gx
 上述のgxに、さらに最終的な視点332へのX軸方向の移動分x_offを考慮すると、マップスクリーン334上の位置ixR2からの移動量dx2は次のように求められる。
 dx2 : x_off + gx = Zp - z_off : Scp + Zp - z_off
よって
 dx2 = (x_off + gx)*(Zp - z_off) / (Scp + Zp - z_off)
 z_offおよびx_offの視点の移動による、画像スクリーン76上の位置ixRに対応するマップスクリーン334上の位置txRを上述のdx2を用いて表すと、次にようになる。
 txR = ixR2 + dx2 = ixR - gx + dx2
すなわちtxRとixRとの差は、原画像におけるオブジェクトの像の位置、原画像に与えられているオブジェクトの視差値(または画像スクリーンまでの距離)、および視点の移動量に依存する。
 左目の視点の移動についても同様に計算でき、次のようになる。
 gx = a * z_off / Scp
 ixL2 = ixL +gx
 dx2 = (x_off - gx)*(Zp -z_off) / (Scp + Zp - z_off)
 txL = ixL2 + dx2 = ixL + gx + dx2
 ここでixL、ixL2、txLは、画像スクリーン76上での左目用の原画像における水平方向の位置、画像スクリーンをz_offだけ移動させたときの対応する位置、左の視点がz_off、x_offだけ移動してもオブジェクト78を変化させないためのマップスクリーン334上の位置である。
 図12は、視点の移動量のうちZ軸方向およびY軸方向の移動量成分と、それに応じた原画像の画素の移動量との関係を説明するための図である。図11と座標軸の向きが異なり、図の横軸をY軸としている。つまり仮想空間を横から見た状態であるため、両目の視点88は1つに重なっている。計算手法は基本的に図11で説明したのと同様である。すなわち画像スクリーン76における原画像のY軸方向の位置iyに見える像を、オブジェクト78が固定されて見えるように、マップスクリーン334上の位置tyに移動させる。
 同図ではty近傍の図を別途、拡大して示している。まず視点88がZ軸方向に-z_offだけ動いたことによる、視線のY軸方向の移動量gyは次のように求められる。
 gy = - iy * z_off / Scp
ここで負の符号がつくのは、図示する例ではiyが原点Oより下の負の領域にあるためである。一方、スクリーンをz_offだけ移動させたことによる、画像スクリーン76上の位置iyに対応するマップスクリーン334上の位置iy2は次のように求められる。
 iy2 = iy - iy * z_off / Scp = iy + gy
この演算は除算を含むが、Scpは定数のため全体の処理に対して一回だけ割り算を実行しておけばよい。
 上述のgyに、さらに最終的な視点332へのY軸方向の移動分y_offを考慮すると、マップスクリーン334上の位置iy2からの移動量dy2は次のようになる。
 dy2 = (y_off + gy)*(Zp - z_off) / (Scp + Zp - z_off)
 z_offおよびy_offの視点の移動による、画像スクリーン76上の位置iyに対応するマップスクリーン334上の位置tyを上述のdy2を用いて表すと、次にようになる。
 ty = iy2 + dy2 = iy + gy +dy2
この計算は、左右どちらの画像でも同じである。なおdy2の演算における(Scp+Zp-z_off)による除算は、一般的な透視変換処理のパースペクティブ除算に相当するものであることを指摘しておく。
 このようにして、視点の移動量の各成分(x_off,y_off,z_off)に応じた、画像参照ベクトルマップ上の位置(tx,ty)と原画像上の位置(ix,iy)との対応関係を少ない演算量で導出できる。なお左右の画像におけるX軸方向の位置txRおよびtxLをtx、ixRおよびixLをixと総称している。
 次に、左右の画像参照ベクトルマップの一方において、他方の原画像を参照する場合の画像参照ベクトルの計算手法を説明する。上述のとおり左右の原画像には、取得時には死角になり像として表れていないが、視点の移動によって見えるようになる部分が存在し得る。原画像操作部254はそのような像を表現すべき画素に対し、他方の原画像を参照する画像参照ベクトルを生成することで、死角であった部分をより正確に描画できるようにする。このような技術を視差画像の相互参照と呼ぶ。
 図13は、視点の移動量のうちZ軸方向およびX軸方向の移動量成分と、右目用の画像参照ベクトルマップにおいて左目用の原画像を参照する際の画素の移動量との関係を説明するための図である。計算にあたっての考え方は図11で示したのと同様であるが、本来の始点であるixRに対応する、左目用の画像における位置ixLが始点となる点が異なる。
 すなわち図11と同様、右目の視点の移動に着目すると、z_offおよびx_offの視点の移動による画像スクリーン76上の位置ixRに対応するマップスクリーン334上の位置txRは上述のとおり、
 txR = ixR2 + dx2 = ixR - gx + dx2
である。右目用の原画像における位置ixRと、それに対応する左目用の原画像の位置ixLとは次の関係にある。
 ixR = ixL + Ewosc
 ここでEwoscは、視点88a、88bの間隔Ewpと、原画像における視差Dp=a+bから次にように与えられる。
 Ewosc = Ewp - Dp
 結果としてtxRは、左目用の原画像上の位置ixLを始点とすると、次のように求められる。
 txR = ixL + Ewosc - gx +dx2
 なおEwoscの算出に用いる視差Dpは、左目用の原画像の画素に対して与えられている、左目の視差値画像が保持する値である。左目の視点の移動についても同様に計算できる。すなわち画像スクリーン76上の位置ixLに対応するマップスクリーン334上の位置txLは
 txL = ixL2 + dx2 = ixL + gx + dx2
であるから、右目用の原画像上の位置ixRを始点とすると、次のようになる。
 txL = ixR - Ewosc + gx + dx2
 ただしEwoscの算出に用いる視差Dpは、右目用の原画像の画素に対して与えられている、右目の視差値画像が保持する値である。視点移動によるY軸方向の位置の移動は、相互参照しない場合と同様に、下記の通りとなる。
 ty = iy2 + dy2 = iy + gy + dy2
以上の計算により、相互参照しない場合と同様に、画像参照ベクトルマップの各画素に対し画像参照ベクトルを設定できる。
 上記は左右の原画像における相互参照の手法であるが、原画像を取得した際の左右のカメラのさらに外側を視点とする原画像を別途取得しておくことにより、元の左右の原画像の相互参照では補えなかった画素をさらに補うこともできる。ここで、外側の視点から取得した原画像を参照先とする手法を拡張参照と呼ぶ。
 図14は、拡張参照における画像参照ベクトルの計算手法を説明するための図である。この例では、元の左右の原画像を取得した際に想定された視点88a、88bのうち、右の視点88bのさらに右側に、間隔Ewpをあけてカメラ350を設定し、第3の原画像を取得しておく。そして視点88bにおいて死角となり右目用原画像で表されていなかった部分について、視点の移動により描画する必要が生じたら、当該第3の原画像を参照するように画像参照ベクトルを設定する。計算にあたっての考え方は図13で示した相互参照の場合と同様であるが、左目用原画像におけるixLを始点とする代わりに、第3の原画像上の対応する位置ixREを始点とする。
 すなわち図11と同様、右目の視点の移動に着目すると、z_offおよびx_offの視点の移動による画像スクリーン76上の位置ixRに対応するマップスクリーン334上の位置txRは上述のとおり、
 txR = ixR2 + dx2 = ixR - gx + dx2
である。右目用の原画像における位置ixRと、それに対応する第3の原画像の位置ixREとは次の関係にある。
 ixR = ixRE - Ewosc
 ここでEwoscは、視点の間隔Ewpと、第3の原画像に対応して生成されている視差値画像における、位置ixREの画素に対応する視差Dpから次にように与えられる。
 Ewosc = Ewp - Dp
 結果としてtxRは、第3の原画像上の位置ixREを始点とすると、次のように求められる。
 txR = ixRE - Ewosc - gx + dx2
 左の視点88aのさらに左側に設置したカメラにより第4の原画像を取得しておき、左目用の表示画像の描画時に参照する場合も同様に計算できる。すなわち画像スクリーン76上の位置ixLに対応するマップスクリーン334上の位置txLは
 txL = ixL2 + dx2 = ixL + gx + dx2
であるから、第4の原画像上の位置ixLEを始点とすると、次のようになる。
 txL = ixLE + Ewosc + gx + dx2
 視点移動によるY軸方向の位置の移動は、相互参照しない場合と同様に、下記の通りとなる。
 ty = iy2 + dy2 = iy + gy + dy2
以上の計算により、画像参照ベクトルマップの各画素に対し画像参照ベクトルを設定できる。
 なお上述は、右の視点88bのさらに右側、および左の視点88aのさらに左側に、それぞれ間隔Ewpをあけてカメラを設定した例を説明したが、これを拡張して間隔をn倍、すなわちn*Ewpとした場合は、txR、txLはそれぞれ次にように求められる。
 txR = ixRE - Ewosc * n - gx + dx2
 txL = ixLE + Ewosc * n + gx + dx2
 ところで画像参照ベクトルは、これまで説明した、視点の移動に対する原画像上の位置(ix,iy)から画像参照ベクトルマップ上の位置(tx,ty)への変位(以後、「変位ベクトル」と呼ぶ)を逆に辿るベクトルである。ただし画像参照ベクトルの決定には、画像平面上での画素領域を考慮する必要がある。図15は、変位ベクトルと画素領域の関係を模式的に示している。同図に示すマス目は、原画像および画像参照ベクトルマップの各画素領域を表す。ここで各画素を、領域の左上の位置座標を代表点として(ix,iy)=(0,0)、(1,0)、(2,0)、・・といった整数値で表すとする。この場合、画素領域の中心の位置座標は(ix+0.5,iy+0.5)(ix,iy=0,1,2,・・・)である。
 (a)に示すように原画像における、ある画素360の中心の位置座標(ix+0.5,iy+0.5)を、視点の移動に応じて変位ベクトル(dx2,dy2)の分だけ変位させると、その位置座標は多くの場合、変位先の画素362の中心からずれる。この変位ベクトルのみから画素362の画像参照ベクトルを決定すると、ずれ量によって精度にばらつきが生じることが考えられる。そこでサブピクセル単位で周囲の変位ベクトルを考慮する。
 具体的には(b)に示すように、対象の画素360の中心の位置座標(ix+0.5,iy+0.5)からの変位に加え、当該中心から右方向に半画素分、下方向に半画素、右および下方向にそれぞれ半画素分だけ離れた点364a(ix+1.0,iy+0.5)、点364b(ix+0.5,iy+1.0)、点364c(ix+1.0,iy+1.0)からの変位を求める。すなわち変位ベクトルを4点に対し求め、その分だけ各点を変位させることにより変位後の位置座標を得る。さらに当該位置座標の小数を切り捨てれば、変位先の画素を示す整数値が得られる。なお変位ベクトルを取得する間隔は半画素分の長さに限らず、画素領域の一辺の長さより小さければよい。
 図示する例では2点の変位先が画素362に重複している。この場合、Z値を比較することによりどちらかを選択する。Z値は原画像に対応する視差値画像から、原画像の画素ごとに求められ、変位ベクトルの算出にも用いられる。図16は、画像参照ベクトルマップ上の各画素に対し画像参照ベクトルを決定する処理手順の概略を示すフローチャートである。まず画像参照ベクトルマップの画素のうち1つを基準画素として設定し(S100)、その中心および近傍3点の合計4点について、視点の動きに応じた変位先を計算する(S102)。
 変位先の画素が重複しているか否かを確認し(S104)、重複している場合はそれらのZ値を比較する(S104のY、S106)。そしてより視点に近いZ値を有する変位ベクトルの逆ベクトルを、当該変位先の画素の画像参照ベクトルとして書き込む(S108)。S104において変位先が重複していなければ、そのまま変位ベクトルの逆ベクトルを、当該変位先の画素の画像参照ベクトルとして書き込む(S104のN、S108)。なおS108における書き込み先は、以後の基準画素に対する計算で変位先の画素が重複した際、これもZ比較によって上書きされることがあるため、画像参照ベクトルマップ用のバッファメモリとする。
 原画像の全ての画素が基準画素とされていない間は(S110のN)、S100からS108の処理を繰り替えし、全ての画素が基準画素として設定されたら処理を終了する(S110のY)。このようにサブピクセル単位で変位ベクトルを求め、それから画像参照ベクトルを選別すると、画素単位で変位ベクトルを求めそれを補間して画像参照ベクトルを決定するような手法と比較し精度が均一化する。上述のように0.5画素の距離にある変位ベクトルを確認する結果、画像参照ベクトルの参照先の位置の誤差は最大でも0.25画素となり、精度も向上する。
 このように画像参照ベクトルは、原画像上の画素中心とその近傍を始点として、視点の移動による変位先の画素を求めることによって得られる。そのような手順によれば、原画像では近接した始点でも変位ベクトルの終点が離間した結果、画像参照ベクトルが設定されない画素(以後「穴」と呼ぶことがある)が生じることが考えられる。これは視点の移動によって原画像の一部が画素レベルで引き延ばされることなどに起因する。上述のように、画素より細かい単位で変位ベクトルを求め、画素数より多くの終点を作り出すことにより穴の発生を抑えられるが、そのようにしても拡大などにより終点に該当しない画素、ひいては穴が生じる可能性がある。そこで原画像操作部254は、周囲の画素を利用して画像参照ベクトルを補間する。
 図17は、画像参照ベクトルの補間手法を説明するための図である。同図に示す画素配列において、太線枠で囲まれた画素に画像参照ベクトルの穴があるとする。この場合、最も単純には、周囲の画素に設定されている画像参照ベクトルの平均値により補間することが考えられる。ただし補間に用いる画像参照ベクトルは、視点の移動に基づく変位ベクトルから得られたものとし、補間によって得られたベクトルをさらに補間に用いることは避ける。
 例えばターゲットとする太線枠の画素の上下左右の画素(画素D、C、D、A、B)に、矢印で示すように画像参照ベクトルが与えられていれば、それら4つの画像参照ベクトルの平均ベクトルをターゲットの画像参照ベクトルとする。あるいはターゲットの画素に対する位置に応じて重みを変化させて平均化してもよい。例えば周囲の8画素のうち上下左右の画素(画素D、C、A、B)に2倍の重みをつけて、A~Hの8画素の画像参照ベクトルを加重平均する。
 あるいは画像参照ベクトルの方向性に応じて補間に用いる画素や重みを決定してもよい。例えば図示する例では、周囲の画素の画像参照ベクトルが全て水平に近くなっている。このことから当該部分が原画像から水平方向に引き延ばされたものであり、穴はそれによって生じたことが推定される。したがってこの場合、ターゲットの周囲の画素のうち、左右の画素A、Bを用いて線形補間したり、それらの画素に、より大きい重みをつけて平均化したりすることにより、状況に応じた精度の高い補間を実現できる。
 例えばターゲットの画素の上下左右の4画素の画像参照ベクトルの平均ベクトルを求め、それと画像の水平方向(X軸方向)とのなす角度θが-30°<θ<30°または150°<θ<210°のとき、左右の画素A、Bの画像参照ベクトルを平均してターゲットの画像参照ベクトルとする。角度θが60°<θ<120°または240°<θ<300°のとき、上下の画素D、Cの画像参照ベクトルを平均してターゲットの画像参照ベクトルとする。角度θがそれ以外のときは上下左右の画素の画像参照ベクトルを平均してターゲットの画像参照ベクトルとする。
 なお上述のような角度のしきい値や、それによって補間に用いる画素を選択するか重みを変化させるか、といった態様の組み合わせは様々に考えられる。鑑賞者の頭部は上下運動より水平運動であることが多く、結果として画素の変位も水平方向が多いと考えられる。したがって上述のように角度の判定を行わず、常に左右の画素の画像参照ベクトルを補間に用いるようにして、精度を維持しつつ処理を高速化してもよい。
 本実施の形態ではこのように、視点の移動による画像の局所的な伸張が生じても、ベクトルを補間対象とすることにより、方向性に基づいた計算式の選択が可能である。また実際のカラー値に対する操作は、最終的に表示画像を描画する段階に限られるため、この補間処理が表示画像の品質に与える悪影響を抑えられる。例えば画像参照ベクトルを導入せず、直接カラー画像を補間する場合、このような方向性に基づく調整は行えない。
 例えば一方向に引き延ばされた結果生じた穴であっても、カラー画像にはその情報がないため、引き延ばされた方向に関わらず同様の補間計算となる。その結果、余計な色が混じり、表示画像の品質にも悪影響を与え得る。画像参照ベクトルは視点の動きによる画素の移動を表しているという特性上、図17に示すように画素単位で大きな変化が生じるものではない。結果として、たとえ方向性に関わらずターゲットの周囲の画素を補間に利用しても大きな誤差にはなりにくく、混色による画質の劣化も防止できる。
 なお上述した補間手法は、変位ベクトル計算から導き出されたいわば正当な画像参照ベクトルが周囲の画素に与えられていることを前提としていた。一方、2画素以上が連続して穴となっている場合は、その周囲で補間でない画像参照ベクトルを探索し、当該ベクトルをそのまま補間に用いてもよい。例えば図17において、ターゲットの周囲の8つの画素に探索の優先順位を規則づけておく。一例として画素A、B、C、D、E、F、G、Hといった順序が考えられる。そしてその順で探索し、最初に検出された補間でない画像参照ベクトルをターゲットのベクトルとして採用する。いずれの補間手法にしても、画像参照ベクトルの生成段階ではカラー値が確定してないため、最終的にはサブピクセルの位置精度でカラー値を決定することができる。
 図18は、図8のS12において原画像操作部254が画像参照ベクトルマップを生成する処理手順を示すフローチャートである。まずZバッファおよび画像参照ベクトルマップのバッファを初期化する(S20)。次に自己画像を参照先とする画像参照ベクトルを設定する(S22)。ここで自己画像とは、右目用のマップについては右目用原画像、左目用のマップについては左目用原画像を指す。次に相互参照および拡張参照により自己画像以外の原画像を参照先とする画像参照ベクトルを設定する(S24)。
 S22、S24の処理においてZバッファへの書き込みを並列して行う。次に、画像参照ベクトルの穴を補間する(S26)。同図に示す処理を、左目用、右目用でそれぞれ行うことにより画像参照ベクトルマップが両目に対し完成する。なお視差値画像においてデータが保持されていない画素はオブジェクトが存在しないことになるため、そのような画素を指す画像参照ベクトルも存在しない。結果として画像参照ベクトルマップには、オブジェクトの像の外側などに、画像参照ベクトルマップが存在しない領域があってよい。
 図19は、図18のS22において、自己画像を参照先とする画像参照ベクトルを生成するためのZバッファへの書き込み処理の手順を示している。この図は図15で示したように、原画像に定めた基準画素と、その中心から0.5画素分ずれた3点を用いた一単位の処理を、ハードウェアの構成を考慮して示している。次の図19も同様である。まずそれらの視差値に係るデータ370を取得し、それぞれのZ値と、変位ベクトルによる変位先の画素の位置を求める(S32)。基準画素の視差値は原画像データ記憶部256に格納された視差値画像データ260から読み出す。その他の3点の視差値は、基準画素と隣接する画素の視差値に基づき補間処理により求める。
 データ370における「Validフラグ」は、対応づけられた視差値の有効/無効を表す。上述のとおりオブジェクトが存在しない領域は本来、視差値も存在しないためValidフラグは無効を示す。視差値が無効の場合、変位ベクトルの計算等、以後の処理も無効となる。S32の処理は、一般的なピクセルシェーダを用いることにより、4点について並列に処理でき効率がよい。ただし処理を並列化すると、結果を出力する順序が定まらない。そのため、先に出力された変位先が後に出力された変位先と同じ画素であるか否かを確認し、そのようであれば視点に近い順にソートしていく(S34)。
 変位先の画素が重複していなければそのままとする。そして全ての結果が揃ったら、Zバッファのうち変位先の画素に、最も視点に近いZ値を書き込む(S36)。このとき不可分操作のうち「AtomicMin」命令を利用することにより、並列処理の出力順に関わらず最も視点に近いZ値を一気に書き込むことができる。図15のように画素幅より小さい距離にある点の変位ベクトルは、その変位先の画素が重複する可能性が高い。そのためシェーダ内でZ比較を行うことにより余分な画素情報を効率的に排除でき、Zバッファ264へのアクセス回数を軽減できる。なおZバッファ264には、参照先が自己画像であることを示す識別情報も書き込むことにより、相互参照や拡張参照のデータより優先されるようにする。
 図20は、図18のS22において、自己画像を参照先とする画像参照ベクトルの設定処理の手順を示している。まず原画像に定めた基準画素と、その中心から0.5画素分ずれた3点の視差値に係るデータ370を取得し、それぞれのZ値と、変位ベクトルによる変位先の画素の位置、および変位ベクトルの逆ベクトルである画像参照ベクトルを求める(S40)。そして図19のS34と同様、変位先の画素が重複している場合はZ値による結果のソートを行うことにより、変位先の画素ごとに書き込み候補の画像参照ベクトルを決定する(S42)。
 そして以前の基準画素の処理により生成されたZバッファ264における該当画素のZ値と、書き込み候補の画像参照ベクトルに対するZ値とを比較し(S44)、書き込み候補の画像参照ベクトルのZ値がZバッファ264におけるZ値と一致していれば、画像参照ベクトルマップ266の該当画素に当該画像参照ベクトルを書き込む(S46)。図18のS24において相互参照および拡張参照時の画像参照ベクトルを設定する場合、自己画像の代わりにその他の画像に対し基準画素を定めることにより、基本的には図19、20で示したのと同様の手順で画像参照ベクトルを決定できる。
 ただしZバッファの作成時に、すでに参照先が自己画像であることを示す識別情報が書き込まれている場合、当該画素には新たな書き込みは行わない。そして相互参照および拡張参照のZ値を書き込んだ場合は、当該Zバッファに、参照先の画像の識別情報も書き込んでおく。そして画像参照ベクトルの書き込み時は、処理対象の画像の識別情報とZバッファに書き込まれた識別情報が一致する場合にのみ書き込みを行う。このような処理により、画像参照ベクトルマップにおいて、自己画像の参照で埋まらなかった画素についてのみ、他の画像を参照先とする画像参照ベクトルを設定できる。
 図21は、図19のS36においてZバッファ264にZ値を書き込む際に用いるAtomicMin命令について説明するための図である。まず(a)は、4つのプロセッサ「P1」、「P2」、「P3」、「P4」からそれぞれAtomicMin命令が発行された様子を模式的に示している。各プロセッサはそれぞれ独立したタイミングにおいて、メモリ内のアドレスを指定したうえ、そこに書き込むべき値をパケットとしてAtomicMin(アドレス,値)なる命令を発行する。本実施の形態では、書き込み先の画素がメモリ内のアドレス、Z値が書き込むべき値に相当する。
 それらの命令は、発行された順に行列を形成する。図では網掛け模様の対応関係により、プロセッサP4、P3、P2、P1がそれぞれ発行した命令に含まれるパケット504a、504b、504c、504dが、この順で行列を形成している様子を示している。ただし順番はこれに限らない。各パケットは図の(b)に示すように、指定されたアドレスに対応する、2次キャッシュ502内のラインに送られる。このとき送り先のラインが重複しない場合、パケットの値はそのまま該当ラインに書き込まれる。(b)の例では、パケット504a、504b、504cの値が該当ラインに書き込まれている。
 なお書き込みに際し、メインメモリの書き込み先アドレスのデータが該当ラインにキャッシュされていない場合は、まずメインメモリから当該データをリードバックし、そこにパケットの値を書き込む。(b)の段階において、残ったパケット504dの書き込み先が、書き込み済みのパケット504bと同じアドレスであった場合、両者の値を比較し、パケット504dの値の方が小さければ、(c)に示すように当該パケット504dの値で上書きする。この処理には、前に書き込まれた値の読み出し、比較、必要に応じた書き込み、という手順が必要となる。
 仮に2つの命令が並列に実行された場合、書き込み済みの値に対しての比較はなされるが、互いのパケット同士の値が比較されない結果、タイミングによっては大きい方の値が書き込まれてしまうことがあり得る。アトミック操作によって、あるパケットに係る処理の完了後に次のパケットの処理を開始することを保証すれば、必ず最小の値が2次キャッシュ502に残り、ひいてはZバッファの各画素に最小のZ値を書き込める。ここでAtomicMin命令は、メインメモリから2次キャッシュ502へのリードバックが必要である、同じアドレスへの書き込みが連続する場合、そのスループットは2次キャッシュ502上での処理速度に依存する、パケットのビット長が長くなると、より大きな比較器が必要になる、といった特性を有する。
 ところで図19、20で示した手法によれば、まずこのようなAtomicMin命令によりZバッファ264を完成させ、再びZ値と画像参照ベクトルを計算してZバッファ264のZ値と比較することにより、画像参照ベクトルの書き込みの是非を判定している。すなわちZ値を2重に計算している。これを一度の計算で済ませ処理を効率化させてもよい。図22は、図19、20の処理を統合して画像参照ベクトルマップ266を効率的に生成する処理の手順を示している。
 図の示し方は図19、20と同様である。まず図20と同様、原画像に定めた基準画素と、その中心から0.5画素分ずれた3点の視差値に係るデータ370を取得し、それぞれのZ値と、変位ベクトルによる変位先の画素の位置、および変位ベクトルの逆ベクトルである画像参照ベクトルを求める(S40)。そして変位先の画素が重複している場合にZ値による結果のソートを行うことにより、変位先の画素ごとに書き込み候補の画像参照ベクトルを決定する(S42)。すなわちこの手法では、図19で示したようなZバッファ264の事前生成を行わない。
 その代わりに、S40で生成した、Z値と画像参照ベクトルの双方を含むパケットを用いてAtomicMin命令を発行することにより、Zバッファ264および画像参照ベクトルマップ266への書き込みを同時に行う(S50)。同図には、AtomicMin命令の対象とするパケット504の構造を例示している。この例でパケット504は、「Z値」、「画像ID」、「Xoffset値」、「Yoffset値」なるデータにより構成される。
 ここで「画像ID」は参照先の画像の識別情報、「Xoffset値」および「Yoffset値」は画像参照ベクトルのx成分およびy成分を示す。またパケット504は64ビットのサイズを有し、上位32ビットが「Z値」および「画像ID」に、下位32ビットが「Xoffset値」および「Yoffset値」に割り当てられている。ただしビット数やデータ構造をこれに限定する趣旨ではない。図示するような構造のパケット504を、上述のとおり基準画素とその近傍の3点に対し並列に生成する。そしてそれぞれのプロセッサが、当該パケット504全体を対象とし、変位先の画素のアドレスを指定してAtomicMin命令を発行する。
 つまり図示する例では64ビットを対象とするAtomicMin命令が発行される。書き込み先が重複していなければ、上位32ビットのデータをZバッファ264に、下位32ビットのデータを画像参照ベクトルマップ266の変位先の画素に書き込む。書き込み先が重複している場合は、後のパケットの方が値が小さければ、その上位32ビットのデータと下位32ビットのデータで、Zバッファ264と画像参照ベクトルマップ266をそれぞれ上書きする。
 この場合、比較対象のパケットに画像参照ベクトルのデータが含まれていることから、純粋にZ値のみの比較を行っていないことになるが、上位ビットにZ値を割り当てることにより、大きいZ値を有するデータが書き込まれることはない。Z値が完全に一致する場合のみ、画像参照ベクトルの成分の大小が結果に影響を与え得るが、そもそもZ値が一致していることから、どちらの画像参照ベクトルが書き込まれても表示される画像への影響は小さい。
 一方、アトミック操作の一部として下位ビットをマスクする処理を加えることにより、上位ビットのみを厳密に比較するようにしてもよい。すなわちこの例では、書き込み先の画素が重複している場合、上位32ビットあるいはそのうちZ値を表すビットのみを比較し、値が小さければ当該上位ビットの値をZバッファ264に書き込み、同じパケットの下位ビットの値を画像参照ベクトルマップ266に書き込む。
 このようにマスク処理を加えることにより、厳密にZ値のみを比較できるため、画像参照ベクトルマップ266の精度が向上する。また比較器のサイズはパケット全体のデータ長によらず、比較対象のZ値のビット数により決定できる。結果として、画像参照ベクトルのビット数を増やしたり、様々な属性のデータを含めたりしてパケット全体のデータ長が大きくなっても、実装が容易である。アトミック操作にマスク処理を加えるか否かに関わらず、画像参照ベクトルの情報をパケットに含めたうえでAtomicMin命令により書き込みを行えば、Z値の計算が一度ですみ、画像参照ベクトルマップ266の生成速度を格段に向上させることができる。
 次に画像参照ベクトルマップを用いて最終的な表示画像を生成する手法について説明する。図23は、図8のS14において、表示画像生成部268が画像参照ベクトルマップを用いて表示画像を生成する手順を示すフローチャートである。まず表示画像生成部268は、ビュースクリーン制御部252からその時点での視点の位置や視線の方向に応じたビュースクリーンの位置や姿勢を取得し、それに画像参照ベクトルマップをマッピングする(S72)。そのうえで描画すべき対象画素を設定する(S74)。
 そして対象画素に対応する画像参照ベクトルマップのサンプリング点を特定し、その位置における画像参照ベクトルを取得する(S76)。次に、原画像のうちS76で取得した画像参照ベクトルの示す位置のカラー値を取得し対象画素を描画する(S80)なお原画像をミップマップとしている場合、参照先のミップマップレベルを決定づけるLODを算出し、当該LODに対応するレベルの原画像からカラー値を取得する。表示画像の全画素が描画されるまで(S82のN)、S74~S80の処理を繰り返す。全画素が描画されたら処理を終了する(S82のY)。同図に示す処理を、左右それぞれ行うことにより、左目用、右目用の表示画像を生成できる。
 図24は表示画像、画像参照ベクトルマップ、および原画像の位置的関係を説明するための図である。(a)の点線で示した画素配列は表示画像380、網掛けされた画素配列は画像参照ベクトルマップ382の、それぞれ一部であり、位置の対応を示すように重ねて示している。なお画像参照ベクトルマップ382は透視変換により形状が歪んでいることがあり得るが、わかりやすさのために同図では各画素を正方形で表している。(b)の画素配列は原画像386の一部である。
 表示画像380において、太線枠で示した画素を描画対象画素とすると、その中心の位置に対応する、画像参照ベクトルマップ382上の画素388内の位置をサンプリング点384とする。当該サンプリング点384における白抜き矢印で示した画像参照ベクトルは、例えばサンプリング点384を含む画素388と、それに隣接しサンプリング点384に近い3画素で構成される、濃い網掛けで示した2行2列の4画素の画像参照ベクトルに基づき決定する。基本的には、これら4つの画素の画像参照ベクトルを補間することにより決定できる。
 ただし4つの画像参照ベクトルが同じ原画像を参照先としていない場合、4画素のZ値が大きく異なりオブジェクトの段差を跨いでいることが疑われるとき、その他、補間に適さない画像参照ベクトルが混じっている場合は例外として補間は行わない。そのようにしてサンプリング点384の画像参照ベクトルが求められたら、原画像386のうち当該画像参照ベクトルが指す位置をカラー値のサンプリング点390とする。そしてカラー値のサンプリング点390を含む2行2列の4画素を補間することにより、表示画像の描画対象画素のカラー値を決定する。
 このような処理において、画像参照ベクトルマップ382の隣接した画素が示す画像参照ベクトルの参照先が、原画像386においても近接している場合は、画像参照ベクトルの補間、および原画像におけるカラー値の補間が良好に機能し、精度の高いカラー値が得られる。一方、画像参照ベクトルの参照先が原画像386で離間していたり、Z値が大きく異なる画素が隣接していたりすると、視点の僅かな移動によってカラー値が大きく変動し、表示時にちらつきの原因になる。
 そこで前フレームまでに決定されたカラー値を用いて現フレームのカラー値の変動を緩和する再帰型フィルタを導入する。図25は、本実施の形態で導入する再帰型フィルタを説明するための図である。同図は鑑賞者302、マップスクリーン300を俯瞰した様子を模式的に示している。いま鑑賞者302が矢印Aのように移動したとする。このときこれまで説明したように、仮想空間でオブジェクト304が固定されて見えるように、マップスクリーン300を矢印Bのように移動させつつ、オブジェクト304の像もスクリーン平面上で移動させる。ただしマップスクリーン300自体の移動は必須ではない。
 これまで述べた態様では現時点での視点に対し、その時点のマップスクリーン上で画像参照ベクトルを決定し、それに従い原画像を参照することでカラー値を得た。再帰型フィルタを導入した場合は、前のフレームの視点に対し決定されたカラー値をカラーマップ267として保存しておく。当該前のフレームのカラー値には、その前のフレームのカラー値が含まれているため、結果としてカラーマップは、過去のカラー値の履歴を含む情報となる。原画像操作部254は、現時点での視点に対し原画像から得られたカラー値に、前フレームのカラーマップ267における対応する位置のカラー値を合成していくことで、現フレームのカラーマップを作成する。
 上述したように、同じオブジェクト304の像は、鑑賞者302の視点の移動とともに、マップスクリーン300上で移動する。したがって前フレームのカラーマップ267上で参照する「対応する位置」とは、画像平面での同じ位置ではなく、移動前の同じオブジェクトの像の同じ箇所を表す位置である。現時点での視点に対し原画像から求めたカラー値をNew_Color、前フレームのカラーマップ267における対応する位置のカラー値をOld_Colorとすると、現フレームの最終的なカラー値Save_Colorを次のように決定する。
 Save _Color = ratio * New_Color + (1-ratio) * Old_Color
 ここでratioは合成割合を示し、実験などにより良好な値を決定する。なお合成の演算手法は上式に限らず、時間が近いほど大きな割合で合成するなどでもよい。このようにしてカラーマップを作成したら、表示画像生成部268は、表示画像の画素に対応するカラーマップ上の位置を参照し、当該画素のカラー値を決定する。すなわちこの段階では、画像参照ベクトルを用いて原画像を参照する必要はなくなる。
 このようにすることで、補間対象の画素が変化するなどにより、その時点の視点のみから求められた画像参照ベクトルやカラー値が急激に変化しても、当該画素が表す像のそれまでのカラー値によって変化が緩和され、ちらつきの発生を抑えることができる。再帰型フィルタは全ての画素のカラー値の設定に導入してもよいし、ちらつきが生じる可能性の高い部分にのみ導入してもよい。前者の場合、表示画像の描画処理においてはカラーマップのみを参照すればよいことになる。
 一方、上述のように画像参照ベクトルやカラー値のサンプリングにおいて、近傍の画素が保持するデータによる補間が良好に機能している箇所については、画像参照ベクトルを用いて原画像を直接参照する方が元の色を鮮明に表すことができる。したがって、隣接する所定数の画素からなる領域(例えば補間に用いる4画素分の領域)において、画像参照ベクトルの終点またはZ値に所定値以上の差がある場合や、異なる画像を参照先とする画素が存在する場合、当該領域に含まれる画素にのみ再帰型フィルタを適用してもよい。適用条件はそれらのうち1つのみとしてもよいし、2つ以上を採用してもよい。
 図26~28は、再帰型フィルタを導入した場合のカラーマップの生成手順を模式的に示している。まず図26は、カラーマップのうち、再帰型フィルタの適用対象外の画素のカラー値を決定する手順を示している。まず現時点での視点に対し生成された画像参照ベクトルマップ402における対象画素の画像参照ベクトルに基づき、原画像406を参照する(S200)。そして参照先のカラー値を適宜フィルタリングしてカラー値を決定し、カラーマップ404の対応する画素に書き込む(S202)。すなわちこの場合、前フレームで生成されたカラーマップ400は用いない。
 図27は、カラーマップのうち、再帰型フィルタの適用対象の画素のカラー値を決定する第1段階の処理を示している。まず図26と同様、現時点での視点に対し生成された画像参照ベクトルマップ402における対象画素の画像参照ベクトルに基づき、原画像406を参照する(S204)。さらに前フレームで生成されたカラーマップ400における、対象画素に対応する位置を求め、参照する。すなわちカラーマップ400が生成された前フレームから、現時点までの視点の移動に応じたオブジェクトの変位ベクトルを計算し、その逆ベクトルを辿ることで「対応する位置」が判明する。
 図28は、図27の後になされる、再帰型フィルタの適用対象の画素のカラー値を決定する第2段階の処理を示している。すなわち図27のS204において原画像406の参照先から求めたカラー値をNew_Color、図27のS206において前フレームのカラーマップ400の参照先から求めたカラー値をOld_Colorとして、上式によりSave_Colorを求め、カラーマップ404の対応する画素に書き込む(S208、S210)。図26~28の処理を、画像参照ベクトルマップ402の全画素を対象画素として繰り返すことで、現フレームのカラーマップ404が完成する。次のフレームの描画時は、当該カラーマップ404が前フレームのカラーマップ400に置き換わる。
 図29は表示画像生成部268が、再帰型フィルタを適用しない画素について表示画像の画素ごとにカラー値を決定する手順を模式的に示している。この場合、図24で示したように、表示画像における画素410ごとに、画像参照ベクトルマップ402におけるサンプリング点を決定し(S212)、その周囲の画像参照ベクトルを補間して原画像406の参照先を特定する(S214)。そして当該参照先のカラー値をフィルタリングするなどして、表示画像における画素410のカラー値とする(S216)。
 図30は表示画像生成部268が、再帰型フィルタを適用する画素について表示画像の画素ごとにカラー値を決定する手順を模式的に示している。まず図29と同様、表示画像における画素410ごとに、画像参照ベクトルマップ402におけるサンプリング点を決定する(S218)。次に現フレームのカラーマップ404における、当該サンプリング点に対応する位置を参照する(S220)。そしてカラーマップ404におけるサンプリング点の周囲の画素を補間することにより、表示画像における画素410のカラー値を決定する(S222)。
 このような処理においてカラーマップ400、404は、その時点での画像参照ベクトルマップに対応する画像平面上で生成される。したがって図27のS206の処理、すなわち現フレームの画像参照ベクトルマップ402における位置から、前フレームのカラーマップ400における対応する位置を求めるには、画像参照ベクトルマップ間での像の位置の変位を求める必要がある。
 図31は、視点の移動量のうちZ軸方向およびX軸方向の移動量成分と、それに応じた画像参照ベクトルマップ間での画素の移動量との関係を説明するための図である。同図は右目の移動について示しており、基点となる視点88a、88b、移動後の右目の視点332、および当該移動による画像スクリーン76からマップスクリーン334a上への画素の変位は、図11で示したのと同様である。前フレームの画像参照ベクトルマップは、このマップスクリーン334a上で生成されるものとする。
 そして次のフレームの時刻までに、右目がさらにZ軸方向に-ΔZ、X軸方向にΔxだけ移動したとすると、現フレームにおけるマップスクリーン334bは、前フレームのマップスクリーン334aから、-ΔZだけ移動する。すると、図11の状態での画素の移動先txRはさらにマップスクリーン334b上での位置txR2に移動する。図では当該領域を拡大して右上に示している。
 まず、視点およびマップスクリーンがΔZ移動したことによるX軸方向への移動量をΔgxとすると、三角形の相似により、
 Δz : Δgx = Scp : Exp / 2 + x_off - txR
である。したがって移動量Δgxは次のように求められる。
 Δgx = (Ewp /2 + x_off - txR) * Δz / Scp
 また、視点がX軸方向へ実質Δgx+Δxだけ移動することによる、マップスクリーン334b上での移動量をΔdx2とすると、三角形の相似により、
 Δgx + Δx : Δdx2 = Scp + Zp - z_off - Δz : Zp - z_off -Δz
である。従って移動量Δdx2は次のように求められる。
 Δdx2 = ( Zp - z_off -Δz )* ( Δgx + Δx )/ ( Scp + Zp - z_off - Δz )
 Δdx2の始点は、マップスクリーンがΔzだけ移動することで-Δgx移動するため、最終的にtxRからtxR2への変位量はΔdx2-Δgxとなる。現フレームの画像参照ベクトルマップから前フレームのカラーマップを参照するには、当該変位量の正負を逆転させた-Δdx2+ΔgxだけX軸方向に変位させた位置を参照先とすればよい。
 左目についても同様の計算により、-Δdx2+Δgxに下式を代入することにより、参照先までのX軸方向の距離が得られる。
 Δgx = -(Ewp /2 - x_off + txL) * Δz / Scp
 Δdx2 = ( Zp - z_off -Δz )* ( Δgx + Δx )/ ( Scp + Zp - z_off - Δz )
 図32は、視点の移動量のうちZ軸方向およびY軸方向の移動量成分と、それに応じた画像参照ベクトルマップ間での画素の移動量との関係を説明するための図である。基点となる視点88、移動後の視点332、および当該移動による画像スクリーン76からマップスクリーン334a上への画素の変位は、図12で示したのと同様である。このマップスクリーン334aを前フレームのものとし、次のフレームの時刻までに、視点がさらにZ軸方向に-ΔZ、Y軸方向にΔYだけ移動したとする。このとき現フレームのマップスクリーン334bは、前フレームのマップスクリーン334aから、-ΔZだけ移動する。
 すると、図12の状態での画素の移動先tyはさらにマップスクリーン334b上での位置ty2に移動する。図では当該領域を拡大して右上に示している。まず、視点およびマップスクリーンがΔZ移動したことによるY軸方向への移動量をΔgyとすると、三角形の相似により、
 Δz : Δgy = Scp : y_off - ty
である。したがって移動量Δgxは次のように求められる。
 Δgy = ( y_off - ty ) * Δz / Scp
 また、視点がY軸方向へ実質Δgy+Δyだけ移動することによる、マップスクリーン334b上での移動量をΔdy2とすると、三角形の相似により、
 Δgy + Δy : Δdy2 = Scp + Zp - z_off - Δz : Zp - z_off -Δz
である。従って移動量Δdx2は次のように求められる。
 Δdy2 = ( Zp - z_off -Δz )* ( Δgy + Δy )/ ( Scp + Zp - z_off - Δz )
 Δdy2の始点は、マップスクリーンがΔzだけ移動することで-Δgy移動するため、最終的にtyからty2への変位量はΔdy2-Δgyとなる。現フレームの画像参照ベクトルマップから前フレームのカラーマップを参照するには、当該変位量の正負を逆転させた-Δdy2+ΔgyだけY軸方向に変位させた位置を参照先とすればよい。この関係は右目と左目で共通である。
 カラーマップ上の参照先を取得する別の手法として、カラーマップとともに前フレームの画像参照ベクトルマップを保存しておき、同じ画素の画像参照ベクトルの変化に基づき、前フレームの対応する画素位置を参照先として取得することが考えられる。ただしこの場合、参照先の原画像がフレーム間で異なる場合に例外処理を行う必要がある。また前フレームの画像参照ベクトルマップを保存する分の記憶領域がさらに必要となる。そのような観点から、図31、32に示すように仮想空間に基づく参照先の導出手法を選択している。
 これまで述べたようにして表示される画像は、オブジェクトを3次元空間で定義し、スクリーン平面に射影する態様と異なり、元々の情報が視差画像の2次元上のものである。そのため視点の移動量によっては、元の画像や拡張参照用の画像の画素のみでは表示画像の全ての画素を表現しきれなくなり、穴や隙間が表出する可能性がある。この場合、オブジェクトの像の輪郭が変形したり、画素が離れて浮いているように見えたりすることが考えられる。またエリアシングやちらつきが生じる場合もある。このことは、鑑賞者の頭部の傾きによっても生じる。
 図33は、鑑賞者の頭部の傾きによる表示画像の変化例を模式的に示している。(a)のように鑑賞者432の頭部が直立し、その軸が表示画面430aのY軸方向と一致しているときは、左右の表示画像においてオブジェクトの像はX軸方向に視差分だけずれた状態となる。この場合、元の視差画像を取得したときと同じ状況となり、オブジェクトは適性に立体視できる。一方、(b)のように鑑賞者432の頭部が傾いていると、左右の表示画像はそれに応じた変位で生成されるため、ずれは表示画面430bのX軸方向とは異なる方向に生じる。
 このような変化においてオブジェクトの像に穴が生じたり、適正な立体視ができず酔いなどの不快感を与えたりすることがある。例えば鑑賞者が寝転んだ状態で画像を見ている場合、特にオブジェクトを回り込んで見たいという意図はなくても、視点の変化に対応するように表示画像が過分に変化してしまう。また人の特性として、頭部を直立させているつもりでも微妙に傾いていることが多い。それにより画像が適性に表示されないと、鑑賞者に違和感を与えることになる。換言すれば、本来の適正な画像を見るためには厳密に正しい姿勢でなければならない、ということになる。
 このような状況を改善するため、原画像操作部254は、好適なタイミングでマップスクリーンの位置をX軸およびY軸方向にも調整し、鑑賞者が意図しないような表示画像の過分な変化を抑制する。図34は、視点の位置に応じてマップスクリーンの位置を調整する手法を説明するための図である。同図は両眼とマップスクリーンとの位置関係を斜視図で示している。マップスクリーン上には、左目用画像440aと右目用画像440bが生成される。なお左目用画像440aと右目用画像440bの実体は左右の画像参照ベクトルマップであるが、以後は左目用画像440aと右目用画像440bと呼ぶ。
 一方、原画像操作部254には、これまで述べたように、原画像を取得したときのカメラ70a、70b(図6を参照)からの、鑑賞者の視点88a、88bのX軸、Y軸、Z軸方向の変位量が逐次入力されている。図示するように、左の視点88aの各軸方向の変位量を(x_off_L,y_off_L,z_off_L)、右の視点88bの各軸方向の変位量を(x_off_R,y_off_R,z_off_R)とする。これまで説明したように、Z軸方向の変位量(z_off_R,z_off_L)に対しては、左目用画像440a、右目用画像440bを同じ方向に同じ量だけ変位させる。これにより鑑賞者が前に移動しても図11~14で説明したような演算手法が破綻することなくオブジェクトの像を表すことができる。
 さらに上述したように、頭部の傾きなどによって生じる不具合を抑制するように、左目用画像440a、右目用画像440bを、視点の動きに応じてX軸方向、Y軸方向に同じように移動させる。このときのX軸方向、Y軸方向への変位量をそれぞれ、X_Ave_off、Y_Ave_offとすると、それらは次のように決定する。
 X_Ave_off = ( x_off_R + x_off_L )/2
 Y_Ave_off = ( y_off_R + y_off_L )/2
すなわち、両視点の変位量の平均値の分だけ、同方向に画像を移動させる。左目用画像440aと右目用画像440bを同様に移動させるのは、原画像取得時の視錐台を維持するためである。
 このように画像を移動させるためには、図11~14で説明した画素の変位の演算において、左右の視点のX軸方向、Y軸方向の変位量(x_off,y_off)から画像の移動分を減算すればよい。すなわち左目用画像、右目用画像について別々に記載すると、次のようになる。
 左目の視点の変位量:( X_off_L - X_Ave_off, Y_off_L - Y_Ave_off)
 右目の視点の変位量:( X_off_R - X_Ave_off, Y_off_R - Y_Ave_off)
 画像の調整量である(X_Ave_off、Y_Ave_off)を、視点の移動に伴い常時変化させると、オブジェクトの像の視差が正しくなくなり、鑑賞者に不快感を与えることがあり得る。したがって限定的かつ適切なタイミングにおいて調整量を更新することが望ましい。図35は、画像生成装置200の原画像操作部254が、観察者の頭部の位置に応じて画像の位置をXY平面上で調整する処理手順を示すフローチャートである。このフローチャートは、図8で示した処理手順により表示画像が出力されている状態で、それと並行して実施する。
 そのような状態において、調整を実施するための所定の条件を満たすかどうかを監視する(S300)。ここで所定の条件とは、観察者がそのような指示入力をした場合、複数の静止画を切り替えて表示する態様においてその切り替わりのタイミング、動画を表示する態様においてシーンの切り替わりのタイミングなどが考えられる。観察者の指示入力を条件とする場合は、図示しない入力装置の所定の入力手段に当該指示入力のための機能を割り付けるなど、一般的な入力方法のいずれを利用してもよい。
 この場合、位置・姿勢取得部250は、当該入力装置からの信号も取得し、原画像操作部254に供給する。観察者の意思以外を条件とする場合は、好適には上述のとおり画像の移動が目立たないようなタイミングとする。当該タイミングは、原画像データ258に含めておいた、画像の内容に係るタイムライン情報などを参照して、原画像操作部254が適宜決定してもよい。あるいは原画像操作部254は、鑑賞者の姿勢の変化を監視し、所定量以上の変化が生じた後、安定性が得られたと判定したタイミングを条件としてもよい。
 鑑賞者の姿勢の変化は、ヘッドマウントディスプレイに内蔵したモーションセンサの計測値から取得できる。表示装置を3Dテレビ受像器とする場合、鑑賞者を撮影する図示しない撮像装置を別途設け、撮影画像を一般的な手法により解析することにより姿勢の変化を取得してもよい。例えば鑑賞者が寝転がったなど大きな姿勢の変化を検出したら、変化後の姿勢が所定時間継続した時点で安定性が得られたと判定する。S300の条件には、上述した例のうちいずれか1つを採用してもよいし、2つ以上を採用してもよい。条件が満たされないうちは、そのまま監視を継続する(S300のN)。
 条件が満たされたら(S300のY)、その時点での視点の、基点からの変位量(x_off_R,y_off_R)、(x_off_L,y_off_L)を取得する(S302)。そして左右の視点の変位量の平均値をX軸成分、Y軸成分ごとに計算することで、画像の調整量(X_Ave_off、Y_Ave_off)とする(S304)。そして以後の画像参照ベクトルの算出には、左右の視点の変位量から画像の調整量を減算した値を新たな変位量として用いる(S306)これにより実質的に、画像がXY平面上で移動したことになり、以後はS302で変位量を得たときの視点が基点となる。
 S306の処理において1フレームで瞬間的に画像の位置を変化させると、鑑賞者が立体視の基準を見失い不快感を持つことがあり得る。そこでS306の処理を複数フレームに渡り徐々に実施することにより、画像の変化を緩やかにしてもよい。例えばS300の条件が満たされてから調整が終了するまでにMフレーム分の時間をかけるとする。このときnフレーム目(ただしnは1以上M以下の自然数)の調整量の割合ratioをつぎのように設定する。
 ratio = ( n / M)1/8
 割合ratioを用いて、nフレーム目の左右の視点の変位量を次のように設定する。
 左目の視点の変位量:(( X_off_L - X_Ave_off ) * ratio + X_off_L * (1-ratio),
            (Y_off_L - Y_Ave_off ) * ratio + Y_off_L *(1-ratio))
 右目の視点の変位量:(( X_off_R - X_Ave_off ) * ratio + X_off_R * (1-ratio),
            (Y_off_R - Y_Ave_off ) * ratio + Y_off_R * (1-ratio))
条件を満たしたタイミングからMフレーム目でratio=1となり、S304で求めた調整量分の調整が完了する。
 調整を完了させるフレーム数Mは、実験などにより適正値を設定しておいてもよいし、S300で条件を満たした時点での視点の変位量などにより適応的に決定してもよい。例えばその時点での変位量が大きい場合、画像の調整量も大きくなるため、フレーム数Mを大きくして比較的長い時間をかけて調整を実施する。このように徐々に調整する場合、調整中であることを鑑賞者が認識できるようにしてもよい。例えば調整している期間において、その旨を示すアイコンを表示画像のいずれかの箇所に表示させてもよいし、表示対象のオブジェクトの色などの属性を変化させてもよい。
 鑑賞者の指示入力により調整を行う場合は特に、そのようにすることで指示入力が受け付けられていることを示し、鑑賞者に安心感を与えることができる。S306の処理により画像の位置調整が終了したら、S300に戻り、再び所定の条件を満たすか否かを監視し、満たした場合はS302~S306の調整処理を実施する。
 以上述べた本実施の形態によれば、左右の視差画像を用いて立体視を実現するシステムにおいて、あらかじめ生成された原画像を、視点の動きや方向に応じて変化させて表示画像とする。このような視点の移動を反映した変換には、原画像そのものを用いずに、原画像における位置との差分を示す画像参照ベクトルマップを用いる。これにより、原画像に対する変換操作は、最終的に表示画像の画素値を決定するときのみとなるため、原画像からの画質の劣化を抑えられる。
 このとき、現フレームに対し生成した画像参照ベクトルマップを用いて原画像から取得したカラー値に、それまでの時間において同じオブジェクトの像を表していた画素のカラー値を合成することにより再帰型フィルタを実現する。これにより、画像参照ベクトルのばらつきが大きかったり、Z値の変化が大きかったり、別の原画像を参照していたりして不連続性が顕著な箇所において、微小な視点の変化で大きく画素値が変化したり戻ったりすることによるちらつきを抑えることができる。
 また画像表示時には、画像参照ベクトルマップを生成する画像平面を、視点の動きのXY成分に応じて調整する。これにより、鑑賞者本人が気づかないような頭部の揺れや傾きがあったり、頬杖をついたり寝転んだりと姿勢が崩れていても、本来の高品質な画像を良好に立体視させることができる。すなわち基点となる視点を可変とすることで、適正な立体視を実現するために鑑賞者に許容される姿勢の幅を増やすことができる。この調整を、鑑賞者の指示入力に応じて行ったり、画像の内容が切り替わるタイミングに合わせて行ったりすることで、突然の変化に立体視の認識が追いつかず不快感を与えるのを防止できる。さらに調整を数フレーム分の時間をかけて実施することにより、調整による状況変化をシームレスに達成させることができる。
 以上、本発明を実施の形態をもとに説明した。上記実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
 100 ヘッドマウントディスプレイ、 200 画像生成装置、 222 CPU、 224 GPU、 226 メインメモリ、 250 位置・姿勢取得部、 252 ビュースクリーン制御部、 254 原画像操作部、 256 原画像データ記憶部、 258 原画像データ、 260 視差値画像データ、 262 参照データ記憶部、 264 Zバッファ、 266 画像参照ベクトルマップ、 267 カラーマップ、 268 表示画像生成部、 270 出力部。
 以上のように本発明は、ゲーム装置、画像表示装置、画像再生装置、パーソナルコンピュータなど各種情報処理装置や、それらのいずれかを含む情報処理システムなどに利用可能である。

Claims (15)

  1.  左右の異なる視点から取得された一対の原画像を用いて、オブジェクトを立体視できる画像を生成する画像生成装置であって、
     ユーザの視点の移動に対し前記オブジェクトが仮想空間で固定されるように、当該視点の移動に応じて前記原画像の画素の変位を算出することにより、各時点での視点に対応する画像の各画素のカラー値を取得するとともに、前の時点での視点に対応する画像を表すカラーマップにおける同じ像を表す画素のカラー値を合成することにより、前記各時点での新たなカラーマップを生成する原画像操作部と、
     表示画像の各画素に対応する前記カラーマップ上の位置におけるカラー値に基づき、当該画素のカラー値を決定する表示画像生成部と、
     前記表示画像のデータを出力する出力部と、
     を備えたことを特徴とする画像生成装置。
  2.  前記原画像操作部はさらに、前記原画像の各画素の変位に基づき、変位後の位置を始点とし前記原画像における変位前の位置を終点とする参照ベクトルを、画像平面に画素ごとに表したベクトルマップを、各時点での視点に対応させて生成し、
     前記表示画像生成部は、表示画像の各画素の画素値を、当該画素に対応する前記ベクトルマップ上の位置における前記参照ベクトルに基づき、前記原画像上の対応する位置における画素値を参照することにより決定するか、前記カラーマップ上の位置におけるカラー値に基づき決定するか、を画素ごとに切り替えることを特徴とする請求項1に記載の画像生成装置。
  3.  前記原画像操作部は、前記前の時点での視点に対応する前記カラーマップにおけるカラー値を合成するか否かを、画素ごとに切り替えることを特徴とする請求項2に記載の画像生成装置。
  4.  前記表示画像生成部および前記原画像操作部は、画像平面の所定範囲における前記参照ベクトルの終点に所定値以上の差があるとき、当該範囲に含まれる画素について、前記カラーマップを用いた処理を実施することを特徴とする請求項2または3に記載の画像生成装置。
  5.  前記表示画像生成部および前記原画像操作部は、画像平面の所定範囲において表されるオブジェクトの距離を示すZ値に所定値以上の差があるとき、当該範囲に含まれる画素について、前記カラーマップを用いた処理を実施することを特徴とする請求項2または3に記載の画像生成装置。
  6.  前記表示画像生成部および前記原画像操作部は、画像平面の所定範囲において、前記参照ベクトルが参照先とする前記原画像が異なる画像である画素が存在するとき、当該範囲に含まれる画素について、前記カラーマップを用いた処理を実施することを特徴とする請求項2または3に記載の画像生成装置。
  7.  前記原画像操作部は、ユーザの視点の移動に対し前記オブジェクトが仮想空間で固定されるように、前記前の時点での視点に対応する画像から前記各時点での視点に対応する画像までの前記視点の移動に応じた画素の変位を算出することにより、前記カラーマップにおける同じ像を表す画素を特定することを特徴とする請求項1から6のいずれかに記載の画像生成装置。
  8.  前記原画像操作部は、前記原画像の各画素の変位を、1つの画素領域より狭い間隔で取得し、それらの変位後の位置と前記ベクトルマップにおける画素領域との位置関係により、前記参照ベクトルを画素ごとに決定することを特徴とする請求項2から6のいずれかに記載の画像生成装置。
  9.  前記原画像操作部は、前記ベクトルマップにおける1つの画素領域に、前記原画像における複数の位置からの変位後の位置が重複する場合、前記複数の位置において表されるオブジェクトの距離が近い変位を用いて、当該画素領域の前記参照ベクトルを決定することを特徴とする請求項8に記載の画像生成装置。
  10.  前記原画像操作部は、前記原画像におけるオブジェクトの距離値を前記ベクトルマップにおける変位後の位置に対応づける処理を、前記原画像における所定数の位置に対し並列に実施したうえ、各結果のアトミック操作により、前記ベクトルマップにおける画素領域ごとに最小の距離値を選択して対応づけたZバッファを生成することを特徴とする請求項9に記載の画像生成装置。
  11.  前記原画像操作部は、前記原画像におけるオブジェクトの距離値と前記参照ベクトルの対を前記ベクトルマップにおける変位後の位置に対応づける処理を、前記原画像における所定数の位置に対し並列に実施したうえ、前記Zバッファにおける対応する位置の距離値と比較することにより、前記ベクトルマップに表す前記参照ベクトルを画素領域ごとに決定することを特徴とする請求項10に記載の画像生成装置。
  12.  前記原画像操作部は、前記原画像におけるオブジェクトの距離値を上位ビットに、前記参照ベクトルを下位ビットに表したデータを前記ベクトルマップにおける変位後の位置に対応づける処理を、前記原画像における所定数の位置に対し並列に実施したうえ、各結果のアトミック操作により、前記ベクトルマップにおける画素領域ごとに、最小の距離値を有するデータを選択することにより、前記ベクトルマップに表す前記参照ベクトルを画素領域ごとに決定することを特徴とする請求項9に記載の画像生成装置。
  13.  前記原画像操作部は、前記アトミック操作の一部として前記データのうち前記下位ビットをマスクすることにより、前記最小の距離値を有するデータを画素領域ごとに選択することを特徴とする請求項12に記載の画像生成装置。
  14.  左右の異なる視点から取得された一対の原画像を用いて、オブジェクトを立体視できる画像を生成する画像生成方法であって、
     ユーザの視点の移動に対し前記オブジェクトが仮想空間で固定されるように、当該視点の移動に応じて前記原画像の画素の変位を算出することにより、各時点での視点に対応する画像の各画素のカラー値を取得するとともに、前の時点での視点に対応する画像を表すカラーマップにおける同じ像を表す画素のカラー値を合成することにより、前記各時点での新たなカラーマップを生成するステップと、
     表示画像の各画素に対応する前記カラーマップ上の位置におけるカラー値に基づき、当該画素のカラー値を決定するステップと、
     前記表示画像のデータを出力するステップと、
     を含むことを特徴とする画像生成装置による画像生成方法。
  15.  左右の異なる視点から取得された一対の原画像を用いて、オブジェクトを立体視できる画像を生成するコンピュータプログラムであって、
     ユーザの視点の移動に対し前記オブジェクトが仮想空間で固定されるように、当該視点の移動に応じて前記原画像の画素の変位を算出することにより、各時点での視点に対応する画像の各画素のカラー値を取得するとともに、前の時点での視点に対応する画像を表すカラーマップにおける同じ像を表す画素のカラー値を合成することにより、前記各時点での新たなカラーマップを生成する機能と、
     表示画像の各画素に対応する前記カラーマップ上の位置におけるカラー値に基づき、当該画素のカラー値を決定する機能と、
     前記表示画像のデータを出力する機能と、
     をコンピュータに実現させることを特徴とするコンピュータプログラム。
PCT/JP2018/019556 2017-08-01 2018-05-21 画像生成装置および画像生成方法 WO2019026388A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019533914A JP7057785B2 (ja) 2017-08-01 2018-05-21 画像生成装置および画像生成方法
US16/630,061 US11050993B2 (en) 2017-08-01 2018-05-21 Image generating apparatus and image generating method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JPPCT/JP2017/027920 2017-08-01
PCT/JP2017/027920 WO2019026183A1 (ja) 2017-08-01 2017-08-01 画像生成装置および画像生成方法

Publications (1)

Publication Number Publication Date
WO2019026388A1 true WO2019026388A1 (ja) 2019-02-07

Family

ID=65232403

Family Applications (2)

Application Number Title Priority Date Filing Date
PCT/JP2017/027920 WO2019026183A1 (ja) 2017-08-01 2017-08-01 画像生成装置および画像生成方法
PCT/JP2018/019556 WO2019026388A1 (ja) 2017-08-01 2018-05-21 画像生成装置および画像生成方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
PCT/JP2017/027920 WO2019026183A1 (ja) 2017-08-01 2017-08-01 画像生成装置および画像生成方法

Country Status (3)

Country Link
US (1) US11050993B2 (ja)
JP (1) JP7057785B2 (ja)
WO (2) WO2019026183A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021131803A1 (ja) 2019-12-26 2021-07-01 富士フイルム株式会社 組成物、熱伝導シート、熱伝導シート付きデバイス

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102475632B1 (ko) * 2017-12-19 2022-12-09 에스뻬쎄엠 에스아 바이오아크릴아마이드 및 아크릴산을 기초로 하는 음이온성 수용성 중합체의 제조 방법

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04184683A (ja) * 1990-11-20 1992-07-01 Matsushita Electric Ind Co Ltd 動画像生成方法および動きベクトル算出方法
JP2000069408A (ja) * 1998-08-25 2000-03-03 Mitsubishi Electric Corp ビデオ映像による空間表現装置
JP2006197036A (ja) * 2005-01-11 2006-07-27 Ntt Docomo Shikoku Inc 立体画像表示装置および立体画像表示方法
JP2007052304A (ja) * 2005-08-19 2007-03-01 Mitsubishi Electric Corp 映像表示システム
JP2012080294A (ja) * 2010-09-30 2012-04-19 Toshiba Corp 電子機器、映像処理方法、及びプログラム
JP2013143702A (ja) * 2012-01-11 2013-07-22 Sharp Corp 仮想視点画像生成装置、仮想視点画像生成方法、制御プログラム、記録媒体、および立体表示装置
JP2016092512A (ja) * 2014-10-31 2016-05-23 株式会社ソニー・コンピュータエンタテインメント 画像生成装置、画像生成方法および較正方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04184683A (ja) * 1990-11-20 1992-07-01 Matsushita Electric Ind Co Ltd 動画像生成方法および動きベクトル算出方法
JP2000069408A (ja) * 1998-08-25 2000-03-03 Mitsubishi Electric Corp ビデオ映像による空間表現装置
JP2006197036A (ja) * 2005-01-11 2006-07-27 Ntt Docomo Shikoku Inc 立体画像表示装置および立体画像表示方法
JP2007052304A (ja) * 2005-08-19 2007-03-01 Mitsubishi Electric Corp 映像表示システム
JP2012080294A (ja) * 2010-09-30 2012-04-19 Toshiba Corp 電子機器、映像処理方法、及びプログラム
JP2013143702A (ja) * 2012-01-11 2013-07-22 Sharp Corp 仮想視点画像生成装置、仮想視点画像生成方法、制御プログラム、記録媒体、および立体表示装置
JP2016092512A (ja) * 2014-10-31 2016-05-23 株式会社ソニー・コンピュータエンタテインメント 画像生成装置、画像生成方法および較正方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021131803A1 (ja) 2019-12-26 2021-07-01 富士フイルム株式会社 組成物、熱伝導シート、熱伝導シート付きデバイス

Also Published As

Publication number Publication date
US11050993B2 (en) 2021-06-29
WO2019026183A1 (ja) 2019-02-07
JP7057785B2 (ja) 2022-04-20
JPWO2019026388A1 (ja) 2020-03-19
US20200162716A1 (en) 2020-05-21

Similar Documents

Publication Publication Date Title
JP6681467B2 (ja) 画像生成装置および画像生成方法
JP6584664B2 (ja) 画像生成装置および画像生成方法
JP6561216B2 (ja) 光学フローを使用した中間ビューの生成
JP4065488B2 (ja) 3次元画像生成装置、3次元画像生成方法及び記憶媒体
JP2017532847A (ja) 立体録画及び再生
JP7358448B2 (ja) 画像生成装置、ヘッドマウントディスプレイ、および画像生成方法
JP7150134B2 (ja) ヘッドマウントディスプレイおよび画像表示方法
JP7326442B2 (ja) 広角画像からの視差推定
JP7057785B2 (ja) 画像生成装置および画像生成方法
JP7142762B2 (ja) 表示装置および画像表示方法
JP6802928B2 (ja) 画像生成装置および画像生成方法
JP6920440B2 (ja) 画像生成装置および画像生成方法
CN118368526A (zh) 全景视频录制的方法、装置、设备及存储介质

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18840866

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2019533914

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18840866

Country of ref document: EP

Kind code of ref document: A1