[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP5436458B2 - 多視点画像符号化方法、多視点画像復号方法、多視点画像符号化装置、多視点画像復号装置、多視点画像符号化プログラムおよび多視点画像復号プログラム - Google Patents

多視点画像符号化方法、多視点画像復号方法、多視点画像符号化装置、多視点画像復号装置、多視点画像符号化プログラムおよび多視点画像復号プログラム Download PDF

Info

Publication number
JP5436458B2
JP5436458B2 JP2010550440A JP2010550440A JP5436458B2 JP 5436458 B2 JP5436458 B2 JP 5436458B2 JP 2010550440 A JP2010550440 A JP 2010550440A JP 2010550440 A JP2010550440 A JP 2010550440A JP 5436458 B2 JP5436458 B2 JP 5436458B2
Authority
JP
Japan
Prior art keywords
image
predicted image
correction parameter
decoding
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010550440A
Other languages
English (en)
Other versions
JPWO2010092772A1 (ja
Inventor
信哉 志水
英明 木全
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2010550440A priority Critical patent/JP5436458B2/ja
Publication of JPWO2010092772A1 publication Critical patent/JPWO2010092772A1/ja
Application granted granted Critical
Publication of JP5436458B2 publication Critical patent/JP5436458B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Description

本発明は、ある被写体を撮影する複数のカメラにより撮影された画像を符号化する多視点画像符号化方法およびその装置と、その多視点画像符号化方法により符号化された符号データを復号する多視点画像復号方法およびその装置と、その多視点画像符号化方法の実現に用いられる多視点画像符号化プログラムと、その多視点画像復号方法の実現に用いられる多視点画像復号プログラムとに関する。
本願は、2009年2月12日に、日本に出願された特願2009−29249号に基づき優先権を主張し、その内容をここに援用する。
多視点画像とは、複数のカメラで同じ被写体と背景を撮影した複数の画像のことであり、多視点動画像(多視点映像)とは、その動画像のことである。
一般的な動画像符号化や多視点動画像符号化に用いられる技術として、動き補償予測と視差補償予測とが提案されている。
動き補償予測は、H.264に代表される近年の動画像符号化方式の国際標準にも採用されている手法であり、符号化対象フレームを既に符号化済みの参照フレームとの間で被写体の動きを補償して画像信号のフレーム間差分を取り、その差分信号のみを符号化する(非特許文献1参照)。
一方、視差補償予測は、参照フレームとして別のカメラで撮影されたフレームを用いることで被写体の視差を補償して、画像信号のフレーム間差分を取りながら符号化する(非特許文献2参照)。
ここで用いられる視差とは、異なる位置に配置されたカメラの画像平面上で、被写体上の同じ位置が投影される位置の差である。視差補償予測では、これを二次元ベクトルで表現して符号化を行っている。図8に示す通り、視差がカメラと被写体のカメラからの距離(デプス)とに依存して発生する情報であるため、この原理を利用した視点合成予測(視点補間予測)と呼ばれる方式が存在する。
視点合成予測(視点補間予測)では、符号化側もしくは復号側で得られた多視点映像に対して、カメラの位置情報と三角測量の原理とを用いて被写体のデプスを推定し、その推定されたデプスを用いて符号化対象フレームを合成(補間)して予測画像とする方式である(特許文献1、非特許文献3参照)。なお、符号化側でデプスを推定する場合には、使用したデプスを符号化する必要がある。
視差補償予測や視点合成予測では、カメラの撮像素子の応答に個体差があったり、カメラごとにゲインコントロールやガンマ補正が行われていたり、カメラごとに被写体深度や絞りなどの設定が異なっていたり、シーンに方向依存の照明効果があったりすると、符号化効率が劣化する。この理由は、符号化対象フレームと参照フレームとで被写体の輝度や色が同じであるという前提で予測を行っているためである。
こうした被写体の輝度や色の変化に対応すべく検討された方式として、輝度補償や色補正と呼ばれるものがある。この方式においては、参照フレームの輝度や色を補正したものを予測に使用するフレームとすることで、符号化する予測残差を小さく抑える。
H.264では、1次関数を用いて補正するWeighted Prediction が採用されており(非特許文献1参照)、非特許文献3では、色テーブルを用いて補正する方式が提案されている。
特開2007−036800号公報,“映像符号化方法、映像復号方法、映像符号化プログラム、映像復号プログラム及びそれらのプログラムを記録したコンピュータ読み取り可能な記録媒体”
ITU-T Rec. H.264/ISO/IEC 11496-10, "Advanced video coding for generic audiovisual services", Final Committee Draft, Document JVT-E022d7, September 2002.(pp.10-13, pp.62-73) Hideaki Kimata and Masaki Kitahara, "Preliminary results on multiple view video coding (3DAV)", document M10976 MPEG Redmond Meeting, July, 2004. K.Yamamoto, M.Kitahara, H.Kimata, T.Yendo, T.Fujii, M.Tanimoto, S.Shimizu, K.Kamikura, and Y.Yashima, "Multiview Video Coding Using View Interpolation and Color Correction," IEEE Transactions on Circuits and System for Video Technology, Vol.17, No.11, pp.1436-1449, November, 2007.
上記の輝度補償や色補正を用いた符号化の場合、次の二つの問題が存在する。
一つ目の問題は、輝度補償・色補正パラメータを付加することによる符号量の増加である。通常の視差補償予測や視点合成(補間)予測では符号化する必要のなかった輝度補償・色補正パラメータを符号化する必要が生じるため、符号化効率が低下する。
二つ目の問題は、局所的なミスマッチへの対応能力の欠如である。ここで、ミスマッチとは、符号化対象フレームと参照フレームや視点合成画像との間に存在する輝度や色の不一致のことを言う。
通常の動画像符号化におけるフェードやフラッシュの場合、画面全体が同様に変化するため、単一の補正パラメータで十分な輝度補償や色補正を行うことが可能である。しかしながら、被写体が完全拡散反射体ではないことや、カメラごとに被写界深度やフォーカスが完全に一致していないことによるミスマッチはシーンではなく、被写体に依存するミスマッチであり局所的なものである。そのため、単一の補正パラメータによる輝度補償や色補正では予測差分を十分に小さくすることができない。
この問題に対して、局所的な変化に対応するために複数の補正パラメータを用いる方法も考えられる。しかしながら、この方法を用いると、複数の補正パラメータを符号化する符号量だけでなく、画像領域ごとにどの補正パラメータを用いるのかを示す情報を符号化する必要が生じるため、更なる符号量の増大を招くことになり一つ目の問題を解決することができない。
本発明はかかる事情に鑑みてなされたものであって、カメラ間で局所的な輝度や色のミスマッチを伴うような多視点画像(多視点の静止画像や動画像)においても、高能率な符号化を実現し、かつ、その実現にあたって必要とされる符号量の削減を実現する新たな多視点画像符号化および復号技術を提供することを目的とする。
[1]本発明の基本的な技術思想
前述の課題を解決するために、本発明では、符号化/復号対象フレームを分割して、領域ごとに符号化/復号を行う場合において、以下の手段を講ずる。
まず、処理対象領域だけでなく、その処理対象領域に隣接する既に符号化/復号済みの領域においても、同一の予測方法で予測画像を生成する。次に、隣接領域における予測画像と復号画像とから輝度や色のミスマッチを補正する補正パラメータを推定する。次に、推定した補正パラメータを用いて、処理対象領域について生成した予測画像を補正することで、実際に使用する補正予測画像を生成する。
符号化対象フレームと参照フレームとを比較して補正パラメータを算出する従来の方法の場合は、符号化対象フレームは復号側では入手不可能なため、補正パラメータを符号化する必要がある。
一方、本発明では、隣接領域における予測画像と復号画像とから補正パラメータを推定することから、符号化/復号済みフレームと参照フレーム(予測画像の生成元となったフレーム)とを比較して補正パラメータを算出する。どちらのフレームも復号側で入手可能なものであるため、補正パラメータを符号化する必要がない。つまり、本発明によって符号量増加の問題を解決することが可能である。
また、符号化処理は入力信号をできるだけ忠実に変換する処理であるため、符号化対象フレームと符号化/復号済みフレームはほぼ同じものとみなすことが可能である。つまり、本発明によって算出される補正パラメータは予測画像を符号化対象フレームに近づけ、符号化する予測差分を十分小さくすることができる。
また、本発明では、補正パラメータを処理対象領域ごとに隣接領域の情報を用いて推定する。これにより、局所的な輝度や色のミスマッチに応じた補正を行うことが可能となる。
上記の多視点画像符号化/復号において、推定した補正パラメータを用いて隣接領域の予測画像を補正し、その結果と隣接領域の符号化/復号済み画像とを比較することで、補正パラメータの信頼度を算出することができる。その信頼度が閾値を超えない場合(信頼度が低い場合)は、補正パラメータによる補正を行わずに、処理対象領域について生成した予測画像をそのまま補正予測画像としてもよい。なお、信頼度としては、補正した予測画像と符号化/復号済み画像の差分の最大値や分散値などが大きくなるほど、信頼度が低い値を示すことになる関数(逆数などのような関数)により算出される値を用いることが可能である。
また、補正パラメータを推定する際、隣接領域における予測画像と符号化/復号済み画像との画素ごとの差分を求め、その差分値に応じて隣接領域の画素をクラスタリングし、最も要素数の多いクラスタに属する画素のみを用いて補正パラメータを導出するという方法を用いることも可能である。
[2]本発明の構成
次に、本発明の多視点画像符号化装置および多視点画像復号装置の構成について説明する。
[2−1]本発明の多視点画像符号化装置の構成
本発明の多視点画像符号化装置は、第1のカメラで撮影された被写体の入力画像を複数の符号化対象領域に分割して、前記第1のカメラとは異なる位置に配置された第2のカメラで撮影された前記被写体の既に符号化済みの画像を用いて、符号化対象領域ごとに予測符号化を行うことによって多視点画像(多視点の静止画像や動画像)を符号化する装置であって、(1)前記入力画像において符号化対象領域に隣接する既に復号済みの領域をサンプル領域として設定するサンプル領域設定部と、(2)符号化対象領域とサンプル領域とに属する画素について、前記第2のカメラで撮影された前記符号化済みの画像から予測画像を生成する予測画像生成部と、(3)サンプル領域についての予測画像および前記サンプル領域について既に復号された復号画像に基づいて、輝度や色のミスマッチを補正する補正パラメータを推定する補正パラメータ推定部と、(4)補正パラメータを用いて、符号化対象領域についての予測画像を補正して第1の補正予測画像を生成する予測画像補正部と、(5)第1の補正予測画像を用いて、符号化対象領域の画像信号を符号化して符号データを生成する画像符号化部と、(6)この符号データを復号して、符号化対象領域における復号画像を生成する画像復号部とを備える。
本発明の実施形態による多視点画像符号化装置は、さらに、(7)推定された補正パラメータを用いて、サンプル領域に対する予測画像を補正して第2の補正予測画像を生成するサンプル画像補正部と、(8)この第2の補正予測画像および復号画像に基づいて、推定された補正パラメータを評価する補正パラメータ評価部とを備えてもよい。この場合には、予測画像補正部は、推定された補正パラメータの評価値と予め定められた閾値とを比較することによって、推定された補正パラメータの信頼度が高いと判断した場合には推定された補正パラメータを用いて符号化対象領域についての予測画像を補正して前記第1の補正予測画像を生成し、この補正パラメータの信頼度が低いと判断した場合には符号化対象領域に対する予測画像を第1の予測画像とするようにしてもよい。
また、本発明の実施形態による多視点画像符号化装置は、さらに、(9)サンプル領域に属する画素を、予測画像と復号画像との差分値を用いてクラスタリングするサンプル画素分類部と、(10)クラスタリングで得られたクラスタの内、最も要素数の多いクラスタに属する画素をサンプル領域として設定しなおして修正されたサンプル領域を設定するサンプル領域修正部とを備えてもよい。この場合には、補正パラメータ推定部は、修正されたサンプル領域に属する画素のみを用いて補正パラメータの推定を行うようにしてもよい。
以上の各処理手段が動作することで実現される本発明の多視点画像符号化方法はコンピュータプログラムでも実現できる。このコンピュータプログラムは、適当なコンピュータ読み取り可能な記録媒体に記録して提供されたり、ネットワークを介して提供され、本発明を実施する際にインストールされてCPUなどの制御手段上で動作することにより本発明を実現する。
[2−2]本発明の多視点画像復号装置の構成
本発明の多視点画像復号装置は、第1のカメラで撮影された被写体の画像を前記第1のカメラとは異なる位置に配置された第2のカメラで撮影された前記被写体の画像を用いて符号化した復号対象画像の符号データを、前記第2のカメラで撮影された既に復号済みの前記被写体の画像を用いて、前記復号対象画像を分割した複数の復号対象領域ごとに復号を行う装置であって、(1)前記復号対象画像において復号対象領域に隣接する既に復号済みの領域をサンプル領域として設定するサンプル領域設定部と、(2)復号対象領域と設定されたサンプル領域とに属する画素について、前記第2のカメラで撮影された前記符号化済みの画像から予測画像を生成する予測画像生成部と、(3)設定されたサンプル領域についての予測画像および前記サンプル領域について既に復号された復号画像に基づいて、輝度および色のミスマッチを補正する補正パラメータを推定する補正パラメータ推定部と、(4)この補正パラメータを用いて、復号対象領域に対する予測画像を補正して第1の補正予測画像を生成する予測画像補正部と、(5)この第1の補正予測画像を用いて、復号対象領域の画像信号を符号データから復号する画像復号部とを備える。
本発明の実施形態による多視点画像復号装置は、さらに、(6)推定された補正パラメータを用いて、サンプル領域についての前記予測画像を補正して第2の補正予測画像を生成するサンプル画像補正部と、(7)この第2の補正予測画像および前記復号画像に基づいて、推定された補正パラメータを評価する補正パラメータ評価部とを備えてもよい。この場合には、予測画像補正部は、前記補正パラメータの評価値と予め定められた閾値とを比較することによって、前記補正パラメータの信頼度が高いと判断した場合にはこの補正パラメータを用いて復号対象領域についての前記予測画像を補正して前記第1の補正予測画像を生成し、前記補正パラメータの信頼度が低いと判断した場合には復号対象領域についての前記予測画像を前記第1の予測画像とするようにしてもよい。
また、本発明の実施形態による多視点画像復号装置は、さらに、(8)サンプル領域に属する画素を、前記予測画像と前記復号画像との差分値を用いてクラスタリングするサンプル画素分類部と、(9)クラスタリングで得られたクラスタの内、最も要素数の多いクラスタに属する画素をサンプル領域として設定しなおして修正されたサンプル領域を設定するサンプル領域修正部とを備えてもよい。この場合には、補正パラメータ推定部は、修正されたサンプル領域に属する画素のみを用いて前記補正パラメータの推定を行うようにしてもよい。
以上の各処理手段が動作することで実現される本発明の多視点画像復号方法はコンピュータプログラムでも実現できるものであり、このコンピュータプログラムは、適当なコンピュータ読み取り可能な記録媒体に記録して提供されたり、ネットワークを介して提供され、本発明を実施する際にインストールされてCPUなどの制御手段上で動作することにより本発明を実現する。
本発明によれば、カメラ間で輝度や色のミスマッチが局所的に生じている場合においても、このミスマッチに対処するための補正パラメータを局所的に求めるようにしていることから、予測差分を小さくすることができるようになる。したがって、効率的な多視点画像や多視点動画像の符号化および復号を実現することができる。
しかも、本発明によれば、そのようにして求める補正パラメータを別途符号化/復号する必要がないことから、多視点画像や多視点動画像の符号化および復号にあたっての符号量を大幅に削減することができる。
本発明の第1の実施形態による多視点映像符号化装置を示すブロック図である。 本発明の第1の実施形態による多視点映像符号化装置が実行する処理を示すフローチャートである。 本発明の第1の実施形態による多視点映像符号化装置が実行する処理の詳細を示すフローチャートである。 本発明の第1の実施形態による多視点映像符号化装置が実行する処理を示すフローチャートである。 本発明の第2の実施形態による多視点映像復号装置を示すブロック図である。 本発明の第2の実施形態による多視点映像復号装置が実行する処理を示すフローチャートである。 本発明の第2の実施形態による多視点映像復号装置が実行する処理の詳細を示すフローチャートである。 視差補償予測方式を示す図である。
以下、本発明の実施形態を示す図面を参照して本発明を詳細に説明する。
なお、以下の説明では、映像(フレーム)に位置を特定可能な情報(記号[]で挟まれた情報であり、座標値もしくは座標値に対応付け可能なインデックス)を付加することで、その位置の画素によってサンプリングされた映像信号を示す。
[1]本発明の第1の実施形態例による多視点映像符号化装置
図1に、本発明の第1の実施形態に係る多視点映像符号化装置100の装置構成を図示する。
図1に示すように、実施形態例1の多視点映像符号化装置100は、符号化対象画像入力部101と、符号化対象画像メモリ102と、参照カメラ画像入力部103と、参照カメラ画像メモリ104と、予測画像生成部105と、補正パラメータ推定部106と、予測画像補正部107と、画像符号化部108と、画像復号部109と、復号画像メモリ110とを備える。
符号化対象画像入力部101は、第1のカメラで撮影された被写体の画像のフレームを符号化対象として入力する。符号化対象画像メモリ102は、入力された符号化対象フレームを蓄積する。参照カメラ画像入力部103は、第1のカメラとは別の第2のカメラで同一の被写体を撮影して得られた画像のフレームを参照フレームとして入力する。参照カメラ画像メモリ104は、入力された参照フレームを蓄積する。予測画像生成部105は、参照フレームを用いて符号化対象フレームの予測画像を生成する。補正パラメータ推定部106は、符号化対象領域の周辺領域における予測画像および復号画像に基づいて補正パラメータを推定する。予測画像補正部107は、推定された補正パラメータを用いて符号化対象領域の予測画像を補正する。画像符号化部108は、補正された予測画像を予測信号として使用しながら符号化対象領域の画像信号を符号化する。画像復号部109は、符号化された画像信号を復号する。復号画像メモリ110は、復号された画像を蓄積する。
図2に、このように構成される本実施形態の多視点映像符号化装置100の実行する処理フローを示す。
次に、この処理フローに従って、本実施形態の多視点映像符号化装置100が実行する処理について詳細に説明する。
まず、符号化対象画像入力部101により符号化対象フレームOrgが入力されて符号化対象画像メモリ102に格納される。参照カメラ画像入力部103により参照フレームRefが入力されて参照カメラ画像メモリ104に格納される[A1]。
入力される参照フレームは、既に符号化済みの画像を復号した画像フレームである。これは、復号装置で得られる情報と同じ情報を用いることでドリフト等の符号化ノイズの発生を抑えるためである。ただし、これらの符号化ノイズの発生を許容する場合は、符号化前のオリジナルが入力されても構わない。なお、参照フレームが複数存在する場合には、ここで複数の参照フレームが入力される。
次に、符号化装置100は、符号化対象フレームを複数の符号化対象領域に分割し、その符号化対象領域ごとに予測画像を生成・補正しながら、画像符号化部108で符号化対象フレームの画像信号を符号化する[A2−A9]。
つまり、符号化処理ブロックのインデックスをblk、総符号化処理ブロック数をnumBlksで表すとすると、blkを0で初期化した後[A2]、blkに1を加算しながら[A8]、blkがnumBlksになるまで[A9]、以下の処理[A3−A7]を繰り返す。
符号化処理ブロックごとに繰り返される処理では、符号化装置100は、まず予測画像生成部105で参照フレームを用いながら、同一の生成手法を用いて、ブロックblk(符号化対象領域)とその周辺の符号化済み領域(サンプル領域)に対する予測画像Predを生成する[A3]。
ここで、周辺領域としてはブロックblkに隣接する符号化処理ブロックや隣接画素など、様々な単位のものを用いることが可能である。どのような定義の周辺領域を使用しても構わないが、復号側で使用する定義と同じものを使用する必要がある。本実施形態例では、ブロックblkの周辺の符号化済み領域に含まれる画素の集合をNblkで表し、ブロックblkに含まれる画素の集合をCblkで表す。
予測画像の生成方法としては、参照フレームRefを用いるものであればどのようなものを用いても構わないが、ブロックblkとその周辺領域では同じ方法で予測画像Predを生成する。例えば、視差ベクトルを用いた視差補償予測を用いる場合には、単一の視差ベクトルdvを用いて、次の式(1)のように予測画像Predを生成する。
∀p∈Cblk∪Nblk, Pred[p]=Ref[p+dv] ・・・・ 式(1)
また、視点合成(補間)予測を用いる場合には、参照フレームRefを用いて符号化対象カメラの画像全体を合成(補間)した視点合成(補間)画像Synthに対して、次の式(2)のように予測画像Predを生成する。
∀p∈Cblk∪Nblk, Pred[p]=Synth[p] ・・・・ 式(2)
次に、周辺領域における予測画像と復号画像Decとを用いて、補正パラメータ推定部106で補正パラメータを求める[A4]。
補正方法や補正パラメータ推定としては、どのような方法を用いても構わないが、復号側で使用されるものと同じ方法を用いる必要がある。
補正方法として、例えば、オフセットによる補正、1次関数を用いた補正、タップ長kの二次元線形フィルタ処理などがある。補正対象の画素をpとし、補正前の値をIn、補正後の値をOutとすると、これらは、それぞれ、以下の式(3)〜式(5)で表すことが可能である。
Figure 0005436458
オフセットによる補正や1次関数を用いた補正は、線形フィルタ処理による補正の特殊な例である。なお、補正処理は線形処理である必要はなく、補正パラメータ推定が可能であれば非線形フィルタを使用しても構わない。非線形な補正方法の例としてはガンマ補正がある。ガンマ補正は次の式(6)で表すことができる。
Figure 0005436458
これらの補正モデルの例では、それぞれ、offset、(α,β)、({Fi,j }, o)、(γ,a,b)が補正パラメータとなる。
周辺領域においては、補正前の値が予測画像であり、理想的な補正後の値が復号画像となる。したがって、それらの差が小さくなるように補正パラメータを求めると精度の高い補正が行える。
例えば、オフセット値による補正では、次の式(7)を用いてoffsetを求めることが可能である。なお、‖‖はその集合の要素数を表す。
Figure 0005436458
また、一次関数による補正を行う場合には、二乗誤差を最小化する補正パラメータを導出する方法として最小二乗法を用いて求めることが可能である。その場合の補正パラメータ(α,β)は次の式(8)で表される。
Figure 0005436458
これらの補正パラメータは輝度や色差信号ごとに求めても良いし、RGBなどの色チャンネルごとに求めても構わない。また、例えば、Rチャンネルの0〜127と128〜255とで別の補正パラメータを用いた補正を行うというように、各チャンネルを細分化して一定のレンジごとに異なる補正を行うことも可能である。
補正パラメータが推定できたら、予測画像補正部107でブロックblk に対する予測画像Pred を補正パラメータに従って補正して、補正予測画像CPred を生成する[A5]。
この補正予測画像CPred の生成処理は、具体的には、図3の処理フローに示すように、画素ごとに行われる。図3の処理フローにおいて、pix は画素の識別情報を表し、 numPixblk はブロックblk 内の画素数を表す。
例えば、オフセット値を用いた補正を行う場合には、次の式(9)に従ってCPred が生成される。
∀p∈Cblk ,CPred [p]=Pred [p]+offset ・・・・ 式(9)
補正方法(補正モデル)として、オフセット値を用いた式(3)の補正を行う場合の例で説明する。図4に示すように、処理A4で、周辺の符号化済み領域の予測画像の画素値をIn とし、周辺の符号化済み領域の復号画像の画素値をOutとした場合のoffsetを推定することによって、画素値変換式となる補正モデルが決定される。次に、処理A5で、その決定した画素値変換式のIn に、ブロックblk の予測画像の画素値を代入することによって、ブロックblk の予測画像が補正される。
ブロックblk の予測画像に対する補正が完了したら、画像符号化部108においてブロックblk に対する符号化対象フレームOrgを、補正予測画像CPred を予測信号としながら符号化を行う[A6]。
どのような符号化方法を用いても構わないが、H.264など一般的な符号化手法では、OrgとCPred との差分に対して、DCT・量子化・2値化・エントロピー符号化を施すことによって符号化を行う。
符号化結果のビットストリームは多視点映像符号化装置100の出力となる。これとともに、ブロックごとに画像復号部109で復号され、復号結果であるところの復号画像Decが他のブロックにおける補正パラメータ推定のために復号画像メモリ110に格納される[A7]。
このようにして、本実施形態の多視点映像符号化装置100は、カメラ間で局所的な輝度や色のミスマッチを伴うような多視点映像を高能率に符号化できるようにするために、このミスマッチに対処するための補正パラメータを局所的に求める。さらに、符号量の増加を回避するために、その補正パラメータを別途符号化/復号する必要がない形態で求めるようにしつつ、その多視点映像の符号化を実行する。
本実施形態例では、予測モードが1つしか存在しない場合で説明をしたが、複数存在する予測化モードの中から符号化効率の最も良くなるものを1つ選択して符号化を行う多視点映像符号化装置100の場合でも、本発明を用いることが可能である。
具体的には、各予測モードに対して処理A3−A6を行い、符号化効率を比較して、最終的に最も符号化効率の高かった予測モードに対する符号化結果を多視点映像符号化装置100の出力とするとともに画像復号部109に送る。このとき、画像符号化部108から予測画像生成部105にどのような予測モードを用いるのかを伝える制御信号が送られる。図1の破線はこの制御信号を表している。
[2]本発明の第2の実施形態例による多視点映像復号装置
次に、本発明の第2の実施形態例について説明する。
図5に、本発明の実施形態例2に係る多視点映像復号装置200の装置構成を図示する。
図5に示すように、本実施形態の多視点映像復号装置200は、符号データ入力部201と、符号データメモリ202と、参照カメラ画像入力部203と、参照カメラ画像メモリ204と、予測画像生成部205と、補正パラメータ推定部206と、予測画像補正部207と、画像復号部208と、復号画像メモリ209とを備える。符号データ入力部201は、第1のカメラによって撮影された被写体の画像フレームの符号データを復号対象として入力する。符号データメモリ202は、入力された符号データを蓄積する。参照カメラ画像入力部203は、参照フレームとなる第1のカメラとは別の第2のカメラによって撮影された同一の被写体の画像フレームを入力する。参照カメラ画像メモリ204は、入力された参照フレームを蓄積する。予測画像生成部205は、参照フレームを用いて復号対象フレームの予測画像を生成する。補正パラメータ推定部206は、復号対象領域の周辺領域における予測画像および復号画像に基づいて補正パラメータを推定する。予測画像補正部207は、推定された補正パラメータを用いて復号対象領域の予測画像を補正する。画像復号部208は、補正された予測画像を予測信号として使用しながら復号対象領域の符号データを復号する。復号画像メモリ209は、復号された画像を蓄積する。
図6に、このように構成される第2実施形態の多視点映像復号装置200の実行する処理フローを示す。
次に、この処理フローに従って、多視点映像復号装置200が実行する処理について詳細に説明する。
まず、符号データ入力部201により符号データが入力されて符号データメモリ202に格納される。参照カメラ画像入力部203により参照フレームRef )が入力されて参照カメラ画像メモリ204に格納される[B1]。参照フレームRef は、その参照フレームRef を撮影したカメラに対応付けて設けられる多視点映像復号装置200により既に復号されている。
なお、参照フレームが複数存在する場合には、ここで複数の参照フレームが入力される。
次に、復号装置200は、復号対象フレームを複数の復号対象領域に分割し、その復号対象領域ごとに予測画像を生成・補正しながら、画像復号部208で復号対象フレームの画像信号を復号する[B2−B8]。
つまり、復号処理ブロックのインデックスをblk 、総復号処理ブロック数を numBlksで表すとすると、復号装置200は、blk を0で初期化した後[B2]、blk に1を加算しながら[B7]、blk が numBlks になるまで[B8]、以下の処理[B3−B6]を繰り返す。
復号処理ブロックごとに繰り返される処理では、復号装置200は、まず予測画像生成部205で参照フレームを用いながら、同一の生成手法を用いて、ブロックblk (復号対象領域)とその周辺の復号済み領域(サンプル領域)に対する予測画像Pred を生成する[B3]。
ここでの処理は実施形態例1の処理A3と同じである。処理A3と同様に、周辺領域としてはブロックblk に隣接する復号処理ブロックや隣接画素など、様々な単位のものを用いることが可能である。どのような定義の周辺領域を使用しても構わないが、符号化側で使用された定義と同じものを使用する必要がある。本実施形態例では、ブロックblk の周辺の復号済み領域に含まれる画素の集合をNblk で表し、ブロックblk に含まれる画素の集合をCblkで表す。
なお、ここで行われる予測画像(第1および第2カメラ間の予測画像)の生成手法としては、符号化側で用いられたものと同様の方法を用いる必要がある。複数の予測モードの中から1つを選んで符号化が行われている場合、符号データにどの予測モードが使われたかを示す情報が含まれている。そのため、予測画像生成部205ではその制御信号を受け取り、指定された予測方法でブロックblk と周辺領域の予測画像を生成する。図5の破線はこの制御信号を表している。
次に、周辺領域における予測画像と復号画像Decとを用いて、補正パラメータ推定部206で補正パラメータを求める[B4]。
補正方法や補正パラメータ推定にはどのような方法を用いても構わないが、符号化側で使用されたものと同じ方法を用いる必要がある。ここでの処理は実施形態例1の処理A4と同じである。
補正パラメータが推定できたら、予測画像補正部207でブロックblk に対する予測画像Pred を補正パラメータに従って補正して、補正予測画像CPred を生成する[B5]。
ここでの処理は実施形態例1の処理A5と同じであり、図7の処理フローに示すように、画素ごとに行われる。ここで、図7の処理フローにおいて、pix は画素の識別情報を表し、 numPixblk はブロックblk 内の画素数を表す。
ブロックblk の予測画像に対する補正が完了したら、画像復号部208においてブロックblk に対する符号データを、補正予測画像CPred を予測信号としながら復号して、ブロックblk に対する復号画像Dec[blk] を得る[B6]。
ここで行われる復号処理は符号データを生成するときに用いられた方法に対応するものを使う必要がある。例えば、H.264を用いて符号化されている場合、エントロピー復号、多値化、逆量子化、逆DCTを行い復号された残差信号に対して予測信号を足し合わせることで復号処理が行われる。
復号結果の復号画像は多視点映像復号装置200の出力となるとともに、他のブロックにおける補正パラメータ推定のために復号画像メモリ209に格納される。
このようにして、図5のように構成される多視点映像復号装置200は、図1のように構成される多視点映像符号化装置100の生成した多視点映像復号の符号データを復号するように処理する。
上記説明を行った実施形態例1および実施形態例2では、全てのブロックにおいて補正を行うようにしているが、ブロックごとに1ビットのフラグ情報を符号化することで、補正を行うか否かを選択する構成をとることもできる。
また、1ビットのフラグ情報を符号化せずに、補正パラメータの信頼度を測定し、その信頼度に応じて補正をするのか否かを選択する方法もある。
具体的には、処理A4および処理B4において補正パラメータを求めた後に、以下の式(10)〜式(12)に示すような補正の確からしさと有効性を表現する値を求める。その値があらかじめ与えられた閾値よりも大きな場合にのみ、処理A5および処理B5においてブロックblk の予測画像を補正する。
Figure 0005436458
ここで、式(10)の第1項は復号画像Decと補正前の予測画像Pred との差分絶対値和を示し、第2項は復号画像Decと補正予測画像CPred との差分絶対値和を示す。これらから、式(10)は補正することによって真値と予測値との差分絶対値和がどの程度削減されたかを示す。また、式(11)の第1項は復号画像Decと補正前の予測画像Pred との差分二乗和を示し、第2項は復号画像Decと補正予測画像CPred との差分二乗和を示すこれらから、式(11)は、補正することによって真値と予測値との差分二乗和がどの程度削減されたかを示す。また、式(12)は補正モデルが得られているサンプルに対してどの程度確からしいかを表す値である。
これらの式(10)〜式(12)に示す値は、どの値も処理対象ブロックではなく周辺領域の値を用いて求められているため、全体で用いる閾値のみを符号化して復号側に通知するだけでよい。
よりロバストな補正パラメータを求めるために、第1の実施形態および第2の実施形態における周辺領域の設定において、周辺領域における画素の中で外れ値を持つものを補正パラメータ推定時のサンプルから除く処理を行うことができる。
例えば、周辺領域における各画素を、復号画像と予測画像との差分を尺度にしてクラスタリングし、最も要素数の多いクラスタに属する画素のみを補正パラメータ推定に用いる周辺画素集合Nblk の要素とする。
最も簡単なクラスタリング方法としては、復号画像と予測画像との差分値の分散がある閾値以下なら全体として1つのクラスタとし、閾値より大きい場合は差分値の平均を境界にして2つのクラスタに分割する方法がある。この場合、全てのクラスタに含まれる画素の復号画像と予測画像との差分値の分散がある閾値以下になったらクラスタリングを終了する。
より複雑なクラスタリング方法としては、初めは各画素で1つのクラスタとし、ある2つのクラスタを融合した際に、クラスタ内の画素の復号画像と予測画像との差分値の分散の増加が最も少ないものを順に融合していく方法がある。この場合、どの2つのクラスタを融合してもある閾値を超える分散を持つクラスタが発生してしまう場合にクラスタリングを終了する。
なお、本実施形態例では、1つのカメラの1フレームを符号化又は復号する処理を説明したが、この処理をフレームごとに繰り返すことで多視点映像の符号化又は復号を実現することが可能である。さらに、カメラごとに繰り返すことで複数のカメラの多視点映像の符号化又は復号を実現することが可能である。
以上説明した処理は、コンピュータとソフトウェアプログラムとによっても実現することができる。そのプログラムはコンピュータ読み取り可能な記録媒体に記録して提供することも、ネットワークを通して提供することも可能である。
また、以上の実施形態では多視点映像符号化装置および多視点映像復号装置を中心に説明したが、この多視点映像符号化装置の各部の動作に対応したステップによって本実施形態の多視点映像符号化方法を実現することができる。また、この多視点映像復号装置の各部の動作に対応したステップによって本実施形態の多視点映像復号方法を実現することができる。
以上、図面を参照して本発明の実施形態を説明してきたが、上記実施の形態は本発明の例示に過ぎず、本発明が上記実施の形態に限定されるものでないことは明らかである。
したがって、本発明を逸脱しない範囲で構成要素の追加、省略、置換、その他の変更を行っても良い。
本発明は多視点画像の符号化手法に適用できるものであり、本発明を適用することで、カメラ間で輝度や色のミスマッチが局所的に生じている場合においても、効率的な多視点画像や多視点動画像の符号化および復号を実現できる。また、その実現にあたっての符号量を大幅に削減することができる。
100 多視点映像符号化装置
101 符号化対象画像入力部
102 符号化対象画像メモリ
103 参照カメラ画像入力部
104 参照カメラ画像メモリ
105 予測画像生成部
106 補正パラメータ推定部
107 予測画像補正部
108 画像符号化部
109 画像復号部
110 復号画像メモリ
200 多視点映像復号装置
201 符号データ入力部
202 符号データメモリ
203 参照カメラ画像入力部
204 参照カメラ画像メモリ
205 予測画像生成部
206 補正パラメータ推定部
207 予測画像補正部
208 画像復号部
209 復号画像メモリ

Claims (16)

  1. 第1のカメラで撮影された被写体の入力画像を複数の符号化対象領域に分割し、前記第1のカメラとは異なる位置に配置された第2のカメラで撮影された前記被写体の既に符号化済みの画像を用いて前記符号化対象領域ごとに予測符号化を行う多視点画像符号化方法であって、
    前記入力画像において前記符号化対象領域に隣接する既に復号済みの領域をサンプル領域として設定するサンプル領域設定ステップと、
    前記符号化対象領域と前記サンプル領域とに属する画素について、前記第2のカメラで撮影された前記符号化済みの画像から予測画像を生成する予測画像生成ステップと、
    前記サンプル領域についての前記予測画像および前記サンプル領域について既に復号された復号画像に基づいて、輝度および色のミスマッチを補正する補正パラメータを推定する補正パラメータ推定ステップと、
    前記補正パラメータを用いて、前記符号化対象領域についての前記予測画像を補正して第1の補正予測画像を生成する予測画像補正ステップと、
    前記第1の補正予測画像を用いて、前記符号化対象領域の画像信号を符号化して符号データを生成する画像符号化ステップと、
    前記符号データを復号して、前記符号化対象領域の復号画像を生成する画像復号ステップと、
    を有する多視点画像符号化方法。
  2. 請求項1に記載の多視点画像符号化方法において、
    前記補正パラメータを用いて、前記サンプル領域についての前記予測画像を補正して第2の補正予測画像を生成するサンプル画像補正ステップと、
    前記第2の補正予測画像および前記復号画像に基づいて、前記補正パラメータを評価する補正パラメータ評価ステップとを備え、
    前記予測画像補正ステップでは、前記補正パラメータの評価値と予め定められた閾値とを比較することによって、前記補正パラメータの信頼度が高いと判断した場合には前記補正パラメータを用いて前記符号化対象領域についての前記予測画像を補正して前記第1の補正予測画像を生成し、前記補正パラメータの信頼度が低いと判断した場合には前記符号化対象領域についての前記予測画像を前記第1の予測画像とする
    多視点画像符号化方法。
  3. 請求項1に記載の多視点画像符号化方法において、
    前記サンプル領域に属する画素を、前記予測画像と前記復号画像との差分値を用いてクラスタリングするサンプル画素分類ステップと、
    前記クラスタリングで得られたクラスタの内、最も要素数の多いクラスタに属する画素を前記サンプル領域として設定しなおし修正されたサンプル領域を設定するサンプル領域修正ステップとを備え、
    前記補正パラメータ推定ステップでは、前記修正されたサンプル領域に属する画素のみを用いて前記補正パラメータの推定を行う
    多視点画像符号化方法。
  4. 第1のカメラで撮影された被写体の画像を前記第1のカメラとは異なる位置に配置された第2のカメラで撮影された前記被写体の画像を用いて符号化した復号対象画像の符号データを、前記第2のカメラで撮影された既に復号済みの前記被写体の画像を用いて、前記復号対象画像を分割した複数の復号対象領域ごとに復号を行う多視点画像復号方法であって、
    前記復号対象画像において前記復号対象領域に隣接する既に復号済みの領域をサンプル領域として設定するサンプル領域設定ステップと、
    前記復号対象領域と前記サンプル領域とに属する画素について、前記第2のカメラで撮影された前記復号済みの画像から予測画像を生成する予測画像生成ステップと、
    前記サンプル領域についての前記予測画像および前記サンプル領域について既に復号された復号画像に基づいて、輝度および色のミスマッチを補正する補正パラメータを推定する補正パラメータ推定ステップと、
    前記補正パラメータを用いて、前記復号対象領域についての前記予測画像を補正して第1の補正予測画像を生成する予測画像補正ステップと、
    前記第1の補正予測画像を用いて、前記復号対象領域の画像信号を前記符号データから復号する画像復号ステップと、
    を有する多視点画像復号方法。
  5. 請求項4に記載の多視点画像復号方法において、
    前記補正パラメータを用いて、前記サンプル領域についての前記予測画像を補正して第2の補正予測画像を生成するサンプル画像補正ステップと、
    前記第2の補正予測画像および前記復号画像に基づいて、前記補正パラメータを評価する補正パラメータ評価ステップとを備え、
    前記予測画像補正ステップでは、前記補正パラメータの評価値と予め定められた閾値とを比較することによって、前記補正パラメータの信頼度が高いと判断した場合には前記補正パラメータを用いて前記復号対象領域についての前記予測画像を補正して前記第1の補正予測画像を生成し、前記補正パラメータの信頼度が低いと判断した場合には前記復号対象領域についての前記予測画像を前記第1の予測画像とする
    多視点画像復号方法。
  6. 請求項4に記載の多視点画像復号方法において、
    前記サンプル領域に属する画素を、前記予測画像と前記復号画像との差分値を用いてクラスタリングするサンプル画素分類ステップと、
    前記クラスタリングで得られたクラスタの内、最も要素数の多いクラスタに属する画素をサンプル領域として設定しなおし修正されたサンプル領域を設定するサンプル領域修正ステップとを備え、
    前記補正パラメータ推定ステップでは、前記修正されたサンプル領域に属する画素のみを用いて前記補正パラメータの推定を行う
    多視点画像復号方法。
  7. 第1のカメラで撮影された被写体の入力画像を複数の符号化対象領域に分割し、前記第1のカメラとは別の第2のカメラで撮影された前記被写体の既に符号化済みの画像を用いて前記符号化対象領域ごとに予測符号化を行う多視点画像符号化装置であって、
    前記入力画像において前記符号化対象領域に隣接する既に復号済みの領域をサンプル領域として設定するサンプル領域設定部と、
    前記符号化対象領域と前記サンプル領域とに属する画素について、前記第2のカメラで撮影された前記符号化済みの画像から予測画像を生成する予測画像生成部と、
    前記サンプル領域についての前記予測画像および前記サンプル領域について既に復号された復号画像に基づいて、輝度および色のミスマッチを補正する補正パラメータを推定する補正パラメータ推定部と、
    前記補正パラメータを用いて、前記符号化対象領域についての前記予測画像を補正して補正予測画像を生成する予測画像補正部と、
    前記補正予測画像を用いて、前記符号化対象領域の画像信号を符号化して符号データを生成する画像符号化部と、
    前記符号データを復号して、前記符号化対象領域の復号画像を生成する画像復号部と、
    を有する多視点画像符号化装置。
  8. 第1のカメラで撮影された被写体の画像を前記第1のカメラとは別の第2のカメラで撮影された前記被写体の画像を用いて符号化した復号対象画像の符号データを、前記第2のカメラで撮影された既に復号済みの前記被写体の画像を用いて、前記復号対象画像を分割した複数の復号対象領域ごとに復号を行う多視点画像復号装置であって、
    前記復号対象画像において前記復号対象領域に隣接する既に復号済みの領域をサンプル領域として設定するサンプル領域設定部と、
    前記復号対象領域と前記サンプル領域とに属する画素について、前記第2のカメラで撮影された前記復号済みの画像から予測画像を生成する予測画像生成部と、
    前記サンプル領域についての前記予測画像および前記サンプル領域について既に復号された復号画像に基づいて、輝度および色のミスマッチを補正する補正パラメータを推定する補正パラメータ推定部と、
    前記補正パラメータを用いて、前記復号対象領域についての前記予測画像を補正して補正予測画像を生成する予測画像補正部と、
    前記補正予測画像を用いて、前記復号対象領域の画像信号を符号データから復号する画像復号部と、
    を有する多視点画像復号装置。
  9. 請求項1ないし3のいずれか1項に記載の多視点画像符号化方法をコンピュータに実行させるための多視点画像符号化プログラム。
  10. 請求項4ないし6のいずれか1項に記載の多視点画像復号方法コンピュータに実行させるための多視点画像復号プログラム。
  11. 第1のカメラで撮影された被写体の入力画像を複数の符号化対象領域に分割し、前記第1のカメラとは異なる位置に配置された第2のカメラで撮影された前記被写体の既に符号化済みの画像を用いて前記符号化対象領域ごとに予測符号化を行う多視点画像符号化方法であって、
    前記入力画像において前記符号化対象領域に隣接する既に復号済みの領域をサンプル領域として設定するサンプル領域設定ステップと、
    前記符号化対象領域に属する画素について、前記第2のカメラで撮影された前記符号化済みの画像から第1の予測画像を生成する第1の予測画像生成ステップと、
    前記サンプル領域に属する画素について、前記第2のカメラで撮影された前記符号化済みの画像から、前記第1の予測画像生成ステップと同じ方法で、第2の予測画像を生成する第2の予測画像生成ステップと、
    前記サンプル領域についての前記第2の予測画像および前記サンプル領域について既に復号された復号画像に基づいて、輝度および色のミスマッチを補正する補正パラメータを推定する補正パラメータ推定ステップと、
    前記補正パラメータを用いて、前記符号化対象領域についての前記第1の予測画像を補正して第1の補正予測画像を生成する予測画像補正ステップと、
    前記第1の補正予測画像を用いて、前記符号化対象領域の画像信号を符号化して符号データを生成する画像符号化ステップと、
    前記符号データを復号して、前記符号化対象領域の復号画像を生成する画像復号ステップと、
    を有する多視点画像符号化方法。
  12. 請求項11に記載の多視点画像符号化方法において、
    前記第1の予測画像生成ステップは、前記第2のカメラで撮影された前記符号化済みの画像から、前記第1のカメラで撮影された画像を合成して前記符号化対象領域についての視点合成画像を前記第1の予測画像として生成し、
    前記第2の予測画像生成ステップは、前記第2のカメラで撮影された前記符号化済みの画像から、前記第1のカメラで撮影された画像を合成して前記サンプル領域についての視点合成画像を前記第2の予測画像として生成する
    多視点画像符号化方法
  13. 請求項11または12に記載の多視点画像符号化方法において、
    前記補正パラメータを用いて、前記第2の予測画像生成ステップで生成された前記第2の予測画像を補正して、第2の補正予測画像を生成するサンプル画像補正ステップと、
    前記第2の補正予測画像と前記サンプル領域についての復号画像とに基づいて、前記補正パラメータを評価する補正パラメータ評価ステップとを備え、
    前記予測画像補正ステップでは、前記補正パラメータの評価値と予め定められた閾値とを比較することによって、前記補正パラメータの信頼度が高いと判断した場合には前記補正パラメータを用いて前記符号化対象領域についての前記予測画像を補正して前記第1の補正予測画像を生成し、前記補正パラメータの信頼度が低いと判断した場合には前記符号化対象領域についての前記予測画像を前記第1の予測画像とする
    多視点画像符号化方法。
  14. 第1のカメラで撮影された被写体の画像を前記第1のカメラとは異なる位置に配置された第2のカメラで撮影された前記被写体の画像を用いて符号化した復号対象画像の符号データを、前記第2のカメラで撮影された既に復号済みの前記被写体の画像を用いて、前記復号対象画像を分割した複数の復号対象領域ごとに復号を行う多視点画像復号方法であって、
    前記復号対象画像において前記復号対象領域に隣接する既に復号済みの領域をサンプル領域として設定するサンプル領域設定ステップと、
    前記復号対象領域に属する画素について、前記第2のカメラで撮影された前記復号済みの画像から第1の予測画像を生成する第1の予測画像生成ステップと、
    前記サンプル領域に属する画素について、前記第2のカメラで撮影された前記復号済みの画像から、前記第1の予測画像生成ステップと同じ方法で、第2の予測画像を生成する第2の予測画像生成ステップと、
    前記サンプル領域についての前記第2の予測画像および前記サンプル領域について既に復号された復号画像に基づいて、輝度および色のミスマッチを補正する補正パラメータを推定する補正パラメータ推定ステップと、
    前記補正パラメータを用いて、前記復号対象領域についての前記第1の予測画像を補正して第1の補正予測画像を生成する予測画像補正ステップと、
    前記第1の補正予測画像を用いて、前記復号対象領域の画像信号を前記符号データから復号する画像復号ステップと、
    を有する多視点画像復号方法。
  15. 請求項14に記載の多視点画像復号方法において、
    前記第1の予測画像生成ステップは、前記第2のカメラで撮影された前記復号済みの画像から、前記第1のカメラで撮影された画像を合成して前記復号対象領域についての視点合成画像を前記第1の予測画像として生成し、
    前記第2の予測画像生成ステップは、前記第2のカメラで撮影された前記復号済みの画像から、前記第1のカメラで撮影された画像を合成して前記サンプル領域についての視点合成画像を前記第2の予測画像として生成する
    多視点画像復号方法
  16. 請求項14または15に記載の多視点画像復号方法において、
    前記補正パラメータを用いて、前記第2の予測画像生成ステップで生成された前記第2の予測画像を補正して、第2の補正予測画像を生成するサンプル画像補正ステップと、
    前記第2の補正予測画像と前記サンプル領域についての復号画像とに基づいて、前記補正パラメータを評価する補正パラメータ評価ステップとを備え、
    前記予測画像補正ステップでは、前記補正パラメータの評価値と予め定められた閾値とを比較することによって、前記補正パラメータの信頼度が高いと判断した場合には前記補正パラメータを用いて前記復号対象領域についての前記予測画像を補正して前記第1の補正予測画像を生成し、前記補正パラメータの信頼度が低いと判断した場合には前記復号対象領域についての前記予測画像を前記第1の予測画像とする
    多視点画像復号方法。
JP2010550440A 2009-02-12 2010-02-05 多視点画像符号化方法、多視点画像復号方法、多視点画像符号化装置、多視点画像復号装置、多視点画像符号化プログラムおよび多視点画像復号プログラム Active JP5436458B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010550440A JP5436458B2 (ja) 2009-02-12 2010-02-05 多視点画像符号化方法、多視点画像復号方法、多視点画像符号化装置、多視点画像復号装置、多視点画像符号化プログラムおよび多視点画像復号プログラム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2009029249 2009-02-12
JP2009029249 2009-02-12
PCT/JP2010/000713 WO2010092772A1 (ja) 2009-02-12 2010-02-05 多視点画像符号化方法、多視点画像復号方法、多視点画像符号化装置、多視点画像復号装置、多視点画像符号化プログラムおよび多視点画像復号プログラム
JP2010550440A JP5436458B2 (ja) 2009-02-12 2010-02-05 多視点画像符号化方法、多視点画像復号方法、多視点画像符号化装置、多視点画像復号装置、多視点画像符号化プログラムおよび多視点画像復号プログラム

Publications (2)

Publication Number Publication Date
JPWO2010092772A1 JPWO2010092772A1 (ja) 2012-08-16
JP5436458B2 true JP5436458B2 (ja) 2014-03-05

Family

ID=42561621

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010550440A Active JP5436458B2 (ja) 2009-02-12 2010-02-05 多視点画像符号化方法、多視点画像復号方法、多視点画像符号化装置、多視点画像復号装置、多視点画像符号化プログラムおよび多視点画像復号プログラム

Country Status (10)

Country Link
US (1) US8532411B2 (ja)
EP (1) EP2398241A1 (ja)
JP (1) JP5436458B2 (ja)
KR (1) KR101287458B1 (ja)
CN (1) CN102308584B (ja)
BR (1) BRPI1008226A2 (ja)
CA (1) CA2751297C (ja)
RU (1) RU2525850C2 (ja)
TW (2) TWI432034B (ja)
WO (1) WO2010092772A1 (ja)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2398241A1 (en) * 2009-02-12 2011-12-21 Nippon Telegraph And Telephone Corporation Multi-view image encoding method, multi-view image decoding method, multi-view image encoding device, multi-view image decoding device, multi-view image encoding program, and multi-view image decoding program
RU2498522C2 (ru) * 2009-02-23 2013-11-10 Ниппон Телеграф Энд Телефон Корпорейшн Способ кодирования многоракурсных изображений, способ декодирования многоракурсных изображений, устройство кодирования многоракурсных изображений, устройство декодирования многоракурсных изображений, компьютерно-читаемый носитель, содержащий программу кодирования многоракурсных изображений, и компьютерно-читаемый носитель, содержащий программу декодирования многоракурсных изображений
JP5281632B2 (ja) * 2010-12-06 2013-09-04 日本電信電話株式会社 多視点画像符号化方法,多視点画像復号方法,多視点画像符号化装置,多視点画像復号装置およびそれらのプログラム
JP5781313B2 (ja) * 2011-01-12 2015-09-16 株式会社Nttドコモ 画像予測符号化方法、画像予測符号化装置、画像予測符号化プログラム、画像予測復号方法、画像予測復号装置及び画像予測復号プログラム
US9615079B2 (en) 2011-03-18 2017-04-04 Sony Corporation Image processing apparatus and image processing method
MX358407B (es) * 2011-08-31 2018-08-20 Sony Corp Dispositivo de codificacion, metodo de codificacion, dispositivo de descodificacion y metodo de descodificacion.
WO2013115024A1 (ja) * 2012-01-31 2013-08-08 ソニー株式会社 画像処理装置および画像処理方法
RU2493668C1 (ru) * 2012-03-15 2013-09-20 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ кодирования/декодирования многоракурсной видеопоследовательности на основе локальной коррекции яркости и контрастности опорных кадров без передачи дополнительных служебных данных
WO2013159330A1 (en) * 2012-04-27 2013-10-31 Nokia Corporation An apparatus, a method and a computer program for video coding and decoding
US20130329800A1 (en) * 2012-06-07 2013-12-12 Samsung Electronics Co., Ltd. Method of performing prediction for multiview video processing
RU2510944C2 (ru) 2012-07-03 2014-04-10 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ кодирования/декодирования многоракурсной видео последовательности на основе адаптивной локальной коррекции яркости опорных кадров без передачи дополнительных параметров (варианты)
RU2609753C2 (ru) * 2012-07-11 2017-02-02 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ и устройство для обработки видеосигнала
US9350970B2 (en) 2012-12-14 2016-05-24 Qualcomm Incorporated Disparity vector derivation
JP6027143B2 (ja) 2012-12-27 2016-11-16 日本電信電話株式会社 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、画像符号化プログラム、および画像復号プログラム
CN104919799A (zh) * 2013-01-07 2015-09-16 联发科技股份有限公司 用于三维视频编解码的从深度到视差矢量转换的方法和装置
EP3016075A1 (en) 2014-11-03 2016-05-04 Graphine NV Prediction system for texture streaming
JP2016134803A (ja) * 2015-01-20 2016-07-25 キヤノン株式会社 画像処理装置及び画像処理方法
US11082708B2 (en) * 2018-01-08 2021-08-03 Qualcomm Incorporated Multiple-model local illumination compensation
US10715810B2 (en) * 2018-02-20 2020-07-14 Qualcomm Incorporated Simplified local illumination compensation
US11237454B2 (en) 2018-11-12 2022-02-01 Massachusetts Institute Of Technology Scalable feedback control of single-photon sources for photonic quantum technologies
JP7168848B2 (ja) * 2018-11-21 2022-11-10 日本電信電話株式会社 評価装置、評価方法、及びプログラム。
EP3706419A1 (en) * 2019-03-08 2020-09-09 InterDigital VC Holdings, Inc. Multi-model local illumination compensation for video encoding or decoding
US11997308B2 (en) 2019-03-08 2024-05-28 Interdigital Madison Patent Holdings, Sas Local illumination compensation for video encoding or decoding
US10867190B1 (en) * 2019-11-27 2020-12-15 Aimotive Kft. Method and system for lane detection
CN111353434A (zh) * 2020-02-28 2020-06-30 北京市商汤科技开发有限公司 信息识别方法及装置、系统、电子设备和存储介质

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4875095A (en) * 1987-06-30 1989-10-17 Kokusai Denshin Denwa Kabushiki Kaisha Noise-shaping predictive coding system
JP2938412B2 (ja) * 1996-09-03 1999-08-23 日本電信電話株式会社 動画像の輝度変化補償方法、動画像符号化装置、動画像復号装置、動画像符号化もしくは復号プログラムを記録した記録媒体および動画像の符号化データを記録した記録媒体
US7064783B2 (en) * 1999-12-31 2006-06-20 Stmicroelectronics, Inc. Still picture format for subsequent picture stitching for forming a panoramic image
JP3519673B2 (ja) * 2000-07-07 2004-04-19 松下電器産業株式会社 動画データ作成装置及び動画符号化装置
EP2775478A3 (en) * 2002-10-15 2015-12-09 Samsung Electronics Co., Ltd Information storage medium with data structure for multi-angle and apparatus therefor
KR100679740B1 (ko) * 2004-06-25 2007-02-07 학교법인연세대학교 시점 선택이 가능한 다시점 동영상 부호화/복호화 방법
US9088802B2 (en) * 2005-01-07 2015-07-21 Nippon Telegraph And Telephone Corporation Video encoding method and apparatus, video decoding method and apparatus, programs therefor, and storage media for storing the programs
JP4414379B2 (ja) 2005-07-28 2010-02-10 日本電信電話株式会社 映像符号化方法、映像復号方法、映像符号化プログラム、映像復号プログラム及びそれらのプログラムを記録したコンピュータ読み取り可能な記録媒体
ZA200805337B (en) * 2006-01-09 2009-11-25 Thomson Licensing Method and apparatus for providing reduced resolution update mode for multiview video coding
US8154585B2 (en) * 2006-01-12 2012-04-10 Lg Electronics Inc. Processing multiview video
JP2007257287A (ja) * 2006-03-23 2007-10-04 Tokyo Institute Of Technology 画像レジストレーション方法
BRPI0719856B1 (pt) 2006-10-18 2020-09-15 Interdigital Vc Holdings, Inc Métodos, aparelhos e meio de armazenamento não transitório para compensação de iluminação e cor local sem sinalização explícita
JP2009029249A (ja) 2007-07-26 2009-02-12 Bridgestone Corp 空気入りタイヤ
EP2398241A1 (en) * 2009-02-12 2011-12-21 Nippon Telegraph And Telephone Corporation Multi-view image encoding method, multi-view image decoding method, multi-view image encoding device, multi-view image decoding device, multi-view image encoding program, and multi-view image decoding program
RU2498522C2 (ru) * 2009-02-23 2013-11-10 Ниппон Телеграф Энд Телефон Корпорейшн Способ кодирования многоракурсных изображений, способ декодирования многоракурсных изображений, устройство кодирования многоракурсных изображений, устройство декодирования многоракурсных изображений, компьютерно-читаемый носитель, содержащий программу кодирования многоракурсных изображений, и компьютерно-читаемый носитель, содержащий программу декодирования многоракурсных изображений
US8363721B2 (en) * 2009-03-26 2013-01-29 Cisco Technology, Inc. Reference picture prediction for video coding
JP4986086B2 (ja) * 2010-02-26 2012-07-25 ブラザー工業株式会社 画像形成装置、及び、ずれ量測定プログラム

Also Published As

Publication number Publication date
JPWO2010092772A1 (ja) 2012-08-16
CN102308584B (zh) 2015-01-07
TW201424405A (zh) 2014-06-16
WO2010092772A1 (ja) 2010-08-19
US20110286678A1 (en) 2011-11-24
EP2398241A1 (en) 2011-12-21
CA2751297C (en) 2014-05-13
RU2525850C2 (ru) 2014-08-20
TWI432034B (zh) 2014-03-21
TW201034469A (en) 2010-09-16
KR20110114614A (ko) 2011-10-19
CN102308584A (zh) 2012-01-04
US8532411B2 (en) 2013-09-10
BRPI1008226A2 (pt) 2019-09-24
RU2011132661A (ru) 2013-03-27
CA2751297A1 (en) 2010-08-19
KR101287458B1 (ko) 2013-07-19

Similar Documents

Publication Publication Date Title
JP5436458B2 (ja) 多視点画像符号化方法、多視点画像復号方法、多視点画像符号化装置、多視点画像復号装置、多視点画像符号化プログラムおよび多視点画像復号プログラム
JP5521202B2 (ja) 多視点画像符号化方法、多視点画像復号方法、多視点画像符号化装置、多視点画像復号装置、多視点画像符号化プログラムおよび多視点画像復号プログラム
US9253504B2 (en) Methods and apparatus for adaptive reference filtering
JP5303754B2 (ja) 多視点映像符号化方法、多視点映像復号方法、多視点映像符号化装置、多視点映像復号装置、及びプログラム
US11743475B2 (en) Advanced video coding method, system, apparatus, and storage medium
KR102518627B1 (ko) 이미지 인코딩 방법, 디코딩방법, 인코더 및 디코더
US20080095239A1 (en) Method for video frame rate conversion
CN114793282B (zh) 带有比特分配的基于神经网络的视频压缩
KR101818900B1 (ko) 향상된 동적 범위를 갖는 신호들에 대한 계층간 예측
CN105075256A (zh) 编码多个输入图像的方法及装置、存放程序的存储介质
JP5421739B2 (ja) 動画像符号化装置、動画像復号化装置、および、動画像符号化方法
JP2018050150A (ja) 画像符号化装置、画像符号化方法及びコンピュータプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130111

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20130605

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20130726

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131210

R150 Certificate of patent or registration of utility model

Ref document number: 5436458

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350