JP4538699B2 - データ処理装置およびデータ処理方法、並びに記録媒体 - Google Patents
データ処理装置およびデータ処理方法、並びに記録媒体 Download PDFInfo
- Publication number
- JP4538699B2 JP4538699B2 JP2000164026A JP2000164026A JP4538699B2 JP 4538699 B2 JP4538699 B2 JP 4538699B2 JP 2000164026 A JP2000164026 A JP 2000164026A JP 2000164026 A JP2000164026 A JP 2000164026A JP 4538699 B2 JP4538699 B2 JP 4538699B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- block
- teacher
- tap
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【発明の属する技術分野】
本発明は、データ処理装置およびデータ処理方法、並びに記録媒体に関し、特に、例えば、不可逆圧縮された画像等を復号する場合等に用いて好適なデータ処理装置およびデータ処理方法、並びに記録媒体に関する。
【0002】
【従来の技術】
例えば、ディジタル画像データは、そのデータ量が多いため、そのまま記録や伝送を行うには、大容量の記録媒体や伝送媒体が必要となる。そこで、一般には、画像データを圧縮符号化することにより、そのデータ量を削減してから、記録や伝送が行われる。
【0003】
画像を圧縮符号化する方式としては、例えば、静止画の圧縮符号化方式であるJPEG(Joint Photographic Experts Group)方式や、動画の圧縮符号化方式であるMPEG(Moving Picture Experts Group)方式等がある。
【0004】
例えば、JPEG方式による画像データの符号化/復号は、図1に示すように行われる。
【0005】
即ち、図1(A)は、従来のJPEG符号化装置の一例の構成を示している。
【0006】
符号化対象の画像データは、ブロック化回路1に入力され、ブロック化回路1は、そこに入力される画像データを、8×8画素の64画素でなるブロックに分割する。ブロック化回路1で得られる各ブロックは、DCT(Discrete Cosine Transform)回路2に供給される。DCT回路2は、ブロック化回路1からのブロックに対して、DCT(離散コサイン変換)処理を施し、1個のDC(Direct Current)成分と、水平方向および垂直方向についての63個の周波数成分(AC(Alternating Current)成分)の、合計64個のDCT係数に変換する。各ブロックごとの64個のDCT係数は、DCT回路2から量子化回路3に供給される。
【0007】
量子化回路3は、所定の量子化テーブルにしたがって、DCT回路2からのDCT係数を量子化し、その量子化結果(以下、適宜、量子化DCT係数という)を、量子化に用いた量子化テーブルとともに、エントロピー符号化回路4に供給する。
【0008】
ここで、図1(B)は、量子化回路3において用いられる量子化テーブルの例を示している。量子化テーブルには、一般に、人間の視覚特性を考慮して、重要性の高い低周波数のDCT係数は細かく量子化し、重要性の低い高周波数のDCT係数は粗く量子化するような量子化ステップが設定されており、これにより、画像の画質の劣化を抑えて、効率の良い圧縮が行われるようになっている。
【0009】
エントロピー符号化回路4は、量子化回路3からの量子化DCT係数に対して、例えば、ハフマン符号化等のエントロピー符号化処理を施して、量子化回路3からの量子化テーブルを付加し、その結果得られる符号化データを、JPEG符号化結果として出力する。
【0010】
次に、図1(C)は、図1(A)のJPEG符号化装置が出力する符号化データを復号する、従来のJPEG復号装置の一例の構成を示している。
【0011】
符号化データは、エントロピー復号回路11に入力され、エントロピー復号回路11は、符号化データを、エントロピー符号化された量子化DCT係数と、量子化テーブルとに分離する。さらに、エントロピー復号回路11は、エントロピー符号化された量子化DCT係数をエントロピー復号し、その結果得られる量子化DCT係数を、量子化テーブルとともに、逆量子化回路12に供給する。逆量子化回路12は、エントロピー復号回路11からの量子化DCT係数を、同じくエントロピー復号回路11からの量子化テーブルにしたがって逆量子化し、その結果得られるDCT係数を、逆DCT回路13に供給する。逆DCT回路13は、逆量子化回路12からのDCT係数に、逆DCT処理を施し、その結果られる8×8画素の(復号)ブロックを、ブロック分解回路14に供給する。ブロック分解回路14は、逆DCT回路13からのブロックのブロック化を解くことで、復号画像を得て出力する。
【0012】
【発明が解決しようとする課題】
図1(A)のJPEG符号化装置では、その量子化回路3において、ブロックの量子化に用いる量子化テーブルの量子化ステップを大きくすることにより、符号化データのデータ量を削減することができる。即ち、高圧縮を実現することができる。
【0013】
しかしながら、量子化ステップを大きくすると、いわゆる量子化誤差も大きくなることから、図1(C)のJPEG復号装置で得られる復号画像の画質が劣化する。即ち、復号画像には、ぼけや、ブロック歪み、モスキートノイズ等が顕著に現れる。
【0014】
従って、符号化データのデータ量の削減しながら、復号画像の画質を劣化させないようにするには、あるいは、符号化データのデータ量を維持して、復号画像の画質を向上させるには、JPEG復号した後に、何らかの画質向上のための処理を行う必要がある。
【0015】
しかしながら、JPEG復号した後に、画質向上のための処理を行うことは、処理が煩雑になり、最終的に復号画像が得られるまでの時間も長くなる。
【0016】
本発明は、このような状況に鑑みてなされたものであり、JPEG符号化された画像等から、効率的に、画質の良い復号画像を得ること等ができるようにするものである。
【0017】
【課題を解決するための手段】
本発明の第1のデータ処理装置は、学習を行うことにより求められたタップ係数を取得する取得手段と、変換データのブロックである新変換ブロックのうちの注目している注目新変換ブロックの変換データを得るための予測演算に用いる量子化変換データとして、少なくとも、その注目新変換ブロック以外の新変換ブロックに対応する、量子化変換データのブロックである変換ブロックにおける、注目新変換ブロックの変換データのうちの、注目している注目データとの相関が所定の閾値以上となる量子化変換データの位置が示される位置パターン、または、注目データとの相関が所定の順位以内になる量子化変換データの位置が示される位置パターンに基づいて、その位置パターンにより示される位置に配置されている量子化変換データを抽出し、予測タップとして出力する予測タップ抽出手段と、タップ係数と予測タップとの線形1次予測演算を行うことにより、量子化変換データを、変換データに変換する演算手段とを備え、タップ係数は、所定のデータに対し、少なくとも、直交変換処理または周波数変換処理を所定のブロック単位で施すことにより得られるブロック単位の、教師となる教師データを量子化することにより、生徒となる生徒データを生成し、教師データのブロックである教師ブロックのうちの注目している注目教師ブロックの教師データを求めるための予測演算に用いる生徒データとして、少なくとも、その注目教師ブロック以外の教師ブロックに対応する、生徒データのブロックである生徒ブロックにおける、注目教師ブロックの教師データのうちの、注目している注目データとの相関が所定の閾値以上となる生徒データの位置が示される位置パターン、または、注目データとの相関が所定の順位以内になる生徒データの位置が示される位置パターンに基づいて、その位置パターンにより示される位置に配置されている生徒データを抽出し、予測タップとして出力し、タップ係数と予測タップとの線形1次予測演算を行うことにより得られる教師データの予測値の予測誤差が、統計的に最小になるように学習を行う学習処理により求められたものであることを特徴とする。
【0019】
第1のデータ処理装置には、タップ係数を記憶している記憶手段をさらに設けることができ、この場合、取得手段には、記憶手段から、タップ係数を取得させることができる。
【0020】
第1のデータ処理装置において、変換データは、所定のデータを、少なくとも、離散コサイン変換したものとすることができる。
【0021】
第1のデータ処理装置には、注目新変換ブロックの変換データのうちの、注目している注目データを、幾つかのクラスのうちのいずれかにクラス分類するのに用いる量子化変換データを抽出し、クラスタップとして出力するクラスタップ抽出手段と、クラスタップに基づいて、注目データのクラスを求めるクラス分類を行うクラス分類手段とをさらに設けることができ、この場合、演算手段には、予測タップおよび注目データのクラスに対応するタップ係数を用いて予測演算を行わせることができる。
【0022】
第1のデータ処理装置において、予測タップ抽出手段には、注目新変換ブロックの周辺の新変換ブロックに対応する変換ブロックから、予測タップとする量子化変換データを抽出させることができる。
【0023】
第1のデータ処理装置において、予測タップ抽出手段には、注目新変換ブロックに対応する変換ブロックと、注目新変換ブロック以外の新変換ブロックに対応する変換ブロックとから、予測タップとする量子化変換データを抽出させることができる。
【0028】
第1のデータ処理装置において、所定のデータは、動画または静止画の画像データとすることができる。
【0029】
本発明の第1のデータ処理方法は、学習を行うことにより求められたタップ係数を取得する取得ステップと、変換データのブロックである新変換ブロックのうちの注目している注目新変換ブロックの変換データを得るための予測演算に用いる量子化変換データとして、少なくとも、その注目新変換ブロック以外の新変換ブロックに対応する、量子化変換データのブロックである変換ブロックにおける、注目新変換ブロックの変換データのうちの、注目している注目データとの相関が所定の閾値以上となる量子化変換データの位置が示される位置パターン、または、注目データとの相関が所定の順位以内になる量子化変換データの位置が示される位置パターンに基づいて、その位置パターンにより示される位置に配置されている量子化変換データを抽出し、予測タップとして出力する予測タップ抽出ステップと、タップ係数と予測タップとの線形1次予測演算を行うことにより、量子化変換データを、変換データに変換する演算ステップとを備え、タップ係数は、所定のデータに対し、少なくとも、直交変換処理または周波数変換処理を所定のブロック単位で施すことにより得られるブロック単位の、教師となる教師データを量子化することにより、生徒となる生徒データを生成し、教師データのブロックである教師ブロックのうちの注目している注目教師ブロックの教師データを求めるための予測演算に用いる生徒データとして、少なくとも、その注目教師ブロック以外の教師ブロックに対応する、生徒データのブロックである生徒ブロックにおける、注目教師ブロックの教師データのうちの、注目している注目データとの相関が所定の閾値以上となる生徒データの位置が示される位置パターン、または、注目データとの相関が所定の順位以内になる生徒データの位置が示される位置パターンに基づいて、その位置パターンにより示される位置に配置されている生徒データを抽出し、予測タップとして出力し、タップ係数と予測タップとの線形1次予測演算を行うことにより得られる教師データの予測値の予測誤差が、統計的に最小になるように学習を行う学習処理により求められたものであることを特徴とする。
【0030】
本発明の第1の記録媒体は、学習を行うことにより求められたタップ係数を取得する取得ステップと、変換データのブロックである新変換ブロックのうちの注目している注目新変換ブロックの変換データを得るための予測演算に用いる量子化変換データとして、少なくとも、その注目新変換ブロック以外の新変換ブロックに対応する、量子化変換データのブロックである変換ブロックにおける、注目新変換ブロックの変換データのうちの、注目している注目データとの相関が所定の閾値以上となる量子化変換データの位置が示される位置パターン、または、注目データとの相関が所定の順位以内になる量子化変換データの位置が示される位置パターンに基づいて、その位置パターンにより示される位置に配置されている量子化変換データを抽出し、予測タップとして出力する予測タップ抽出ステップと、タップ係数と予測タップとの線形1次予測演算を行うことにより、量子化変換データを、変換データに変換する演算ステップとを実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体であり、タップ係数は、所定のデータに対し、少なくとも、直交変換処理または周波数変換処理を所定のブロック単位で施すことにより得られるブロック単位の、教師となる教師データを量子化することにより、生徒となる生徒データを生成し、教師データのブロックである教師ブロックのうちの注目している注目教師ブロックの教師データを求めるための予測演算に用いる生徒データとして、少なくとも、その注目教師ブロック以外の教師ブロックに対応する、生徒データのブロックである生徒ブロックにおける、注目教師ブロックの教師データのうちの、注目している注目データとの相関が所定の閾値以上となる生徒データの位置が示される位置パターン、または、注目データとの相関が所定の順位以内になる生徒データの位置が示される位置パターンに基づいて、その位置パターンにより示される位置に配置されている生徒データを抽出し、予測タップとして出力し、タップ係数と予測タップとの線形1次予測演算を行うことにより得られる教師データの予測値の予測誤差が、統計的に最小になるように学習を行う学習処理により求められたものであることを特徴とする。
【0031】
本発明の第2のデータ処理装置は、データに対し、少なくとも、直交変換処理または周波数変換処理を所定のブロック単位で施すことにより得られるブロック単位の、教師となる教師データを量子化することにより、生徒となる生徒データを生成する生徒データ生成手段と、教師データのブロックである教師ブロックのうちの注目している注目教師ブロックの教師データを求めるための予測演算に用いる生徒データとして、少なくとも、その注目教師ブロック以外の教師ブロックに対応する、生徒データのブロックである生徒ブロックにおける、注目教師ブロックの教師データのうちの、注目している注目データとの相関が所定の閾値以上となる生徒データの位置が示される位置パターン、または、注目データとの相関が所定の順位以内になる生徒データの位置が示される位置パターンに基づいて、その位置パターンにより示される位置に配置されている生徒データを抽出し、予測タップとして出力する予測タップ抽出手段と、タップ係数と予測タップとの線形1次予測演算を行うことにより得られる教師データの予測値の予測誤差が、統計的に最小になるように学習を行い、タップ係数を求める学習手段とを備えることを特徴とする。
【0033】
第2のデータ処理装置において、教師データは、データを、少なくとも、離散コサイン変換したものとすることができる。
【0034】
第2のデータ処理装置には、注目教師ブロックの教師データのうちの、注目している注目教師データを、幾つかのクラスのうちのいずれかにクラス分類するのに用いる生徒データを抽出し、クラスタップとして出力するクラスタップ抽出手段と、クラスタップに基づいて、注目教師データのクラスを求めるクラス分類を行うクラス分類手段とをさらに設けることができ、この場合、学習手段には、予測タップおよび注目教師データのクラスに対応するタップ係数を用いて予測演算を行うことにより得られる教師データの予測値の予測誤差が、統計的に最小になるように学習を行い、クラスごとのタップ係数を求めさせることができる。
【0035】
第2のデータ処理装置において、予測タップ抽出手段には、注目教師ブロックの周辺の教師ブロックに対応する生徒ブロックから、予測タップとする生徒データを抽出させることができる。
【0036】
第2のデータ処理装置において、予測タップ抽出手段には、注目教師ブロックに対応する生徒ブロックと、注目教師ブロック以外の教師ブロックに対応する生徒ブロックとから、予測タップとする生徒データを抽出させることができる。
【0040】
第2のデータ処理装置において、データは、動画または静止画の画像データとすることができる。
【0041】
本発明の第2のデータ処理方法は、データに対し、少なくとも、直交変換処理または周波数変換処理を所定のブロック単位で施すことにより得られるブロック単位の、教師となる教師データを量子化することにより、生徒となる生徒データを生成する生徒データ生成ステップと、教師データのブロックである教師ブロックのうちの注目している注目教師ブロックの教師データを求めるための予測演算に用いる生徒データとして、少なくとも、その注目教師ブロック以外の教師ブロックに対応する、生徒データのブロックである生徒ブロックにおける、注目教師ブロックの教師データのうちの、注目している注目データとの相関が所定の閾値以上となる生徒データの位置が示される位置パターン、または、注目データとの相関が所定の順位以内になる生徒データの位置が示される位置パターンに基づいて、その位置パターンにより示される位置に配置されている生徒データを抽出し、予測タップとして出力する予測タップ抽出ステップと、タップ係数と予測タップとの線形1次予測演算を行うことにより得られる教師データの予測値の予測誤差が、統計的に最小になるように学習を行い、タップ係数を求める学習ステップとを備えることを特徴とする。
【0042】
本発明の第2の記録媒体は、データに対し、少なくとも、直交変換処理または周波数変換処理を所定のブロック単位で施すことにより得られるブロック単位の、教師となる教師データを量子化することにより、生徒となる生徒データを生成する生徒データ生成ステップと、教師データのブロックである教師ブロックのうちの注目している注目教師ブロックの教師データを求めるための予測演算に用いる生徒データとして、少なくとも、その注目教師ブロック以外の教師ブロックに対応する、生徒データのブロックである生徒ブロックにおける、注目教師ブロックの教師データのうちの、注目している注目データとの相関が所定の閾値以上となる生徒データの位置が示される位置パターン、または、注目データとの相関が所定の順位以内になる生徒データの位置が示される位置パターンに基づいて、その位置パターンにより示される位置に配置されている生徒データを抽出し、予測タップとして出力する予測タップ抽出ステップと、タップ係数と予測タップとの線形1次予測演算を行うことにより得られる教師データの予測値の予測誤差が、統計的に最小になるように学習を行い、タップ係数を求める学習ステップとを実行させるためのプログラムが記録されていることを特徴とする。
【0043】
本発明の第1のデータ処理装置およびデータ処理方法、並びに記録媒体においては、学習を行うことにより求められたタップ係数が取得され、新変換ブロックのうちの注目している注目新変換ブロックの新たな変換データを得るための予測演算に用いる量子化変換データとして、少なくとも、その注目新変換ブロック以外の新変換ブロックに対応する量子化変換ブロックにおける、注目新変換ブロックの変換データのうちの、注目している注目データとの相関が所定の閾値以上となる量子化変換データの位置が示される位置パターン、または、注目データとの相関が所定の順位以内になる量子化変換データの位置が示される位置パターンに基づいて、その位置パターンにより示される位置に配置されている量子化変換データが抽出され、予測タップとして出力される。そして、タップ係数と予測タップとの線形1次予測演算を行うことにより、量子化変換データが、変換データに変換される。また、タップ係数は、所定のデータに対し、少なくとも、直交変換処理または周波数変換処理を所定のブロック単位で施すことにより得られるブロック単位の、教師となる教師データを量子化することにより、生徒となる生徒データを生成し、教師データのブロックである教師ブロックのうちの注目している注目教師ブロックの教師データを求めるための予測演算に用いる生徒データとして、少なくとも、その注目教師ブロック以外の教師ブロックに対応する、生徒データのブロックである生徒ブロックにおける、注目教師ブロックの教師データのうちの、注目している注目データとの相関が所定の閾値以上となる生徒データの位置が示される位置パターン、または、注目データとの相関が所定の順位以内になる生徒データの位置が示される位置パターンに基づいて、その位置パターンにより示される位置に配置されている生徒データを抽出し、予測タップとして出力し、タップ係数と予測タップとの線形1次予測演算を行うことにより得られる教師データの予測値の予測誤差が、統計的に最小になるように学習を行う学習処理により求められたものである。
【0044】
本発明の第2のデータ処理装置およびデータ処理方法、並びに記録媒体においては、データに対し、少なくとも、直交変換処理または周波数変換処理を所定のブロック単位で施すことにより得られるブロック単位の教師データを量子化することにより、生徒データが生成される。そして、教師ブロックのうちの注目している注目教師ブロックの教師データを求めるための予測演算に用いる生徒データとして、少なくとも、その注目教師ブロック以外の教師ブロックに対応する生徒ブロックにおける、注目教師ブロックの教師データのうちの、注目している注目データとの相関が所定の閾値以上となる生徒データの位置が示される位置パターン、または、注目データとの相関が所定の順位以内になる生徒データの位置が示される位置パターンに基づいて、その位置パターンにより示される位置に配置されている生徒データが抽出され、予測タップとして出力される。さらに、タップ係数と予測タップとの線形1次予測演算を行うことにより得られる教師データの予測値の予測誤差が、統計的に最小になるように学習が行われ、タップ係数が求められる。
【0045】
【発明の実施の形態】
図2は、本発明を適用した画像伝送システムの一実施の形態の構成例を示している。
【0046】
伝送すべき画像データは、エンコーダ21に供給されるようになっており、エンコーダ21は、そこに供給される画像データを、例えば、JPEG符号化し、符号化データとする。即ち、エンコーダ21は、例えば、前述の図1(A)に示したJPEG符号化装置と同様に構成されており、画像データをJPEG符号化する。エンコーダ21がJPEG符号化を行うことにより得られる符号化データは、例えば、半導体メモリ、光磁気ディスク、磁気ディスク、光ディスク、磁気テープ、相変化ディスクなどでなる記録媒体23に記録され、あるいは、また、例えば、地上波、衛星回線、CATV(Cable Television)網、インターネット、公衆回線などでなる伝送媒体24を介して伝送される。
【0047】
デコーダ22は、記録媒体23または伝送媒体24を介して提供される符号化データを受信して、元の画像データに復号する。この復号化された画像データは、例えば、図示せぬモニタに供給されて表示等される。
【0048】
次に、図3は、図2のデコーダ22の構成例を示している。
【0049】
符号化データは、エントロピー復号回路31に供給されるようになっており、エントロピー復号回路31は、符号化データを、エントロピー復号して、その結果得られるブロックごとの量子化DCT係数Qを、係数変換回路32に供給する。なお、符号化データには、図1(C)のエントロピー復号回路11で説明した場合と同様に、エントロピー符号化された量子化DCT係数の他、量子化テーブルも含まれるが、量子化テーブルは、後述するように、必要に応じて、量子化DCT係数の復号に用いることが可能である。
【0050】
係数変換回路32は、エントロピー復号回路31からの量子化DCT係数Qと、後述する学習を行うことにより求められるタップ係数を用いて、所定の予測演算を行うことにより、ブロックごとの量子化DCT係数を、8×8画素の元のブロックに復号する。
【0051】
ブロック分解回路33は、係数変換回路32において得られる、復号されたブロック(復号ブロック)のブロック化を解くことで、復号画像を得て出力する。
【0052】
次に、図4のフローチャートを参照して、図3のデコーダ22の処理について説明する。
【0053】
符号化データは、エントロピー復号回路31に順次供給され、ステップS1において、エントロピー復号回路31は、符号化データをエントロピー復号し、ブロックごとの量子化DCT係数Qを、係数変換回路32に供給する。係数変換回路32は、ステップS2において、エントロピー復号回路31からのブロックごとの量子化DCT係数Qを、タップ係数を用いた予測演算を行うことにより、ブロックごとの画素値に復号し、ブロック分解回路33に供給する。ブロック分解回路33は、ステップS3において、係数変換回路32からの画素値のブロック(復号ブロック)のブロック化を解くブロック分解を行い、その結果得られる復号画像を出力して、処理を終了する。
【0054】
次に、図3の係数変換回路32では、例えば、クラス分類適応処理を利用して、量子化DCT係数を、画素値に復号することができる。
【0055】
クラス分類適応処理は、クラス分類処理と適応処理とからなり、クラス分類処理によって、データを、その性質に基づいてクラス分けし、各クラスごとに適応処理を施すものであり、適応処理は、以下のような手法のものである。
【0056】
即ち、適応処理では、例えば、量子化DCT係数と、所定のタップ係数との線形結合により、元の画素の予測値を求めることで、量子化DCT係数が、元の画素値に復号される。
【0057】
具体的には、例えば、いま、ある画像を教師データとするとともに、その画像を、ブロック単位でDCT処理し、さらに量子化して得られる量子化DCT係数を生徒データとして、教師データである画素の画素値yの予測値E[y]を、幾つかの量子化DCT係数x1,x2,・・・の集合と、所定のタップ係数w1,w2,・・・の線形結合により規定される線形1次結合モデルにより求めることを考える。この場合、予測値E[y]は、次式で表すことができる。
【0058】
E[y]=w1x1+w2x2+・・・
・・・(1)
式(1)を一般化するために、タップ係数wjの集合でなる行列W、生徒データxijの集合でなる行列X、および予測値E[yj]の集合でなる行列Y’を、
【数1】
で定義すると、次のような観測方程式が成立する。
【0059】
XW=Y’
・・・(2)
ここで、行列Xの成分xijは、i件目の生徒データの集合(i件目の教師データyiの予測に用いる生徒データの集合)の中のj番目の生徒データを意味し、行列Wの成分wjは、生徒データの集合の中のj番目の生徒データとの積が演算されるタップ係数を表す。また、yiは、i件目の教師データを表し、従って、E[yi]は、i件目の教師データの予測値を表す。なお、式(1)の左辺におけるyは、行列Yの成分yiのサフィックスiを省略したものであり、また、式(1)の右辺におけるx1,x2,・・・も、行列Xの成分xijのサフィックスiを省略したものである。
【0060】
そして、この観測方程式に最小自乗法を適用して、元の画素値yに近い予測値E[y]を求めることを考える。この場合、教師データとなる真の画素値yの集合でなる行列Y、および画素値yに対する予測値E[y]の残差eの集合でなる行列Eを、
【数2】
で定義すると、式(2)から、次のような残差方程式が成立する。
【0061】
XW=Y+E
・・・(3)
【0062】
この場合、元の画素値yに近い予測値E[y]を求めるためのタップ係数wjは、自乗誤差
【数3】
を最小にすることで求めることができる。
【0063】
従って、上述の自乗誤差をタップ係数wjで微分したものが0になる場合、即ち、次式を満たすタップ係数wjが、元の画素値yに近い予測値E[y]を求めるため最適値ということになる。
【0064】
【数4】
・・・(4)
【0065】
そこで、まず、式(3)を、タップ係数wjで微分することにより、次式が成立する。
【0066】
【数5】
・・・(5)
【0067】
式(4)および(5)より、式(6)が得られる。
【0068】
【数6】
・・・(6)
【0069】
さらに、式(3)の残差方程式における生徒データxij、タップ係数wj、教師データyi、および残差eiの関係を考慮すると、式(6)から、次のような正規方程式を得ることができる。
【0070】
【数7】
・・・(7)
【0071】
なお、式(7)に示した正規方程式は、行列(共分散行列)Aおよびベクトルvを、
【数8】
で定義するとともに、ベクトルWを、数1で示したように定義すると、式
AW=v
・・・(8)
で表すことができる。
【0072】
式(7)における各正規方程式は、生徒データxijおよび教師データyiのセットを、ある程度の数だけ用意することで、求めるべきタップ係数wjの数Jと同じ数だけたてることができ、従って、式(8)を、ベクトルWについて解くことで(但し、式(8)を解くには、式(8)における行列Aが正則である必要がある)、最適なタップ係数(ここでは、自乗誤差を最小にするタップ係数)wjを求めることができる。なお、式(8)を解くにあたっては、例えば、掃き出し法(Gauss-Jordanの消去法)などを用いることが可能である。
【0073】
以上のようにして、最適なタップ係数wjを求めておき、さらに、そのタップ係数wjを用い、式(1)により、元の画素値yに近い予測値E[y]を求めるのが適応処理である。
【0074】
なお、例えば、教師データとして、JPEG符号化する画像と同一画質の画像を用いるとともに、生徒データとして、その教師データをDCTおよび量子化して得られる量子化DCT係数を用いた場合、タップ係数としては、JPEG符号化された画像データを、元の画像データに復号するのに、予測誤差が、統計的に最小となるものが得られることになる。
【0075】
従って、JPEG符号化を行う際の圧縮率を高くしても、即ち、量子化に用いる量子化ステップを粗くしても、適応処理によれば、予測誤差が、統計的に最小となる復号処理が施されることになり、実質的に、JPEG符号化された画像の復号処理と、その画質を向上させるための処理とが、同時に施されることになる。その結果、圧縮率を高くしても、復号画像の画質を維持することができる。
【0076】
また、例えば、教師データとして、JPEG符号化する画像よりも高画質の画像を用いるとともに、生徒データとして、その教師データの画質を、JPEG符号化する画像と同一画質に劣化させ、さらに、DCTおよび量子化して得られる量子化DCT係数を用いた場合、タップ係数としては、JPEG符号化された画像データを、高画質の画像データに復号するのに、予測誤差が、統計的に最小となるものが得られることになる。
【0077】
従って、この場合、適応処理によれば、JPEG符号化された画像の復号処理と、その画質をより向上させるための処理とが、同時に施されることになる。なお、上述したことから、教師データまたは生徒データとなる画像の画質を変えることで、復号画像の画質を任意のレベルとするタップ係数を得ることができる。
【0078】
また、上述の場合には、教師データとして画像データを用い、生徒データとして量子化DCT係数を用いるようにしたが、その他、例えば、教師データとしてDCT係数を用い、生徒データとして、そのDCT係数を量子化した量子化DCT係数を用いるようにすることも可能である。この場合、適応処理によれば、量子化DCT係数から、量子化誤差を低減(抑制)したDCT係数を予測するためのタップ係数が得られることになる。
【0079】
図5は、以上のようなクラス分類適応処理により、量子化DCT係数を画素値に復号する、図3の係数変換回路32の第1の構成例を示している。
【0080】
エントロピー復号回路31(図3)が出力するブロックごとの量子化DCT係数は、予測タップ抽出回路41およびクラスタップ抽出回路42に供給されるようになっている。
【0081】
予測タップ抽出回路41は、そこに供給される量子化DCT係数のブロック(以下、適宜、DCTブロックという)に対応する画素値のブロック(この画素値のブロックは、現段階では存在しないが、仮想的に想定される)(以下、適宜、画素ブロックという)を、順次、注目画素ブロックとし、さらに、その注目画素ブロックを構成する各画素を、例えば、いわゆるラスタスキャン順に、順次、注目画素とする。さらに、予測タップ抽出回路41は、注目画素の画素値を予測するのに用いる量子化DCT係数を、パターンテーブル記憶部46のパターンテーブルを参照することで抽出し、予測タップとする。
【0082】
即ち、パターンテーブル記憶部46は、注目画素についての予測タップとして抽出する量子化DCT係数の、注目画素に対する位置関係を表したパターン情報が登録されているパターンテーブルを記憶しており、予測タップ抽出回路41は、そのパターン情報に基づいて、量子化DCT係数を抽出し、注目画素についての予測タップを構成する。
【0083】
予測タップ抽出回路41は、8×8の64画素でなる画素ブロックを構成する各画素についての予測タップ、即ち、64画素それぞれについての64セットの予測タップを、上述のようにして構成し、積和演算回路45に供給する。
【0084】
クラスタップ抽出回路42は、注目画素を、幾つかのクラスのうちのいずれかに分類するためのクラス分類に用いる量子化DCT係数を抽出して、クラスタップとする。
【0085】
なお、JPEG符号化では、画像が、画素ブロックごとに符号化(DCT処理および量子化)されることから、ある画素ブロックに属する画素は、例えば、すべて同一のクラスにクラス分類することとする。従って、クラスタップ抽出回路42は、ある画素ブロックの各画素については、同一のクラスタップを構成する。即ち、クラスタップ抽出回路42は、例えば、図6に示すように、注目画素が属する画素ブロックに対応するDCTブロックのすべての量子化DCT係数、即ち、8×8の64個の量子化DCT係数を、クラスタップとして抽出する。但し、クラスタップは、注目画素ごとに、異なる量子化DCT係数で構成することが可能である。
【0086】
ここで、画素ブロックに属する各画素を、すべて同一のクラスにクラス分類するということは、その画素ブロックをクラス分類することと等価である。従って、クラスタップ抽出回路42には、注目画素ブロックを構成する64画素それぞれをクラス分類するための64セットのクラスタップではなく、注目画素ブロックをクラス分類するための1セットのクラスタップを構成させれば良く、このため、クラスタップ抽出回路42は、画素ブロックごとに、その画素ブロックをクラス分類するために、その画素ブロックに対応するDCTブロックの64個の量子化DCT係数を抽出して、クラスタップとするようになっている。
【0087】
なお、クラスタップを構成する量子化DCT係数は、上述したパターンのものに限定されるものではない。
【0088】
クラスタップ抽出回路42において得られる、注目画素ブロックのクラスタップは、クラス分類回路43に供給されるようになっており、クラス分類回路43は、クラスタップ抽出回路42からのクラスタップに基づき、注目画素ブロックをクラス分類し、その結果得られるクラスに対応するクラスコードを出力する。
【0089】
ここで、クラス分類を行う方法としては、例えば、ADRC(Adaptive Dynamic Range Coding)等を採用することができる。
【0090】
ADRCを用いる方法では、クラスタップを構成する量子化DCT係数が、ADRC処理され、その結果得られるADRCコードにしたがって、注目画素ブロックのクラスが決定される。
【0091】
なお、KビットADRCにおいては、例えば、クラスタップを構成する量子化DCT係数の最大値MAXと最小値MINが検出され、DR=MAX-MINを、集合の局所的なダイナミックレンジとし、このダイナミックレンジDRに基づいて、クラスタップを構成する量子化DCT係数がKビットに再量子化される。即ち、クラスタップを構成する量子化DCT係数の中から、最小値MINが減算され、その減算値がDR/2Kで除算(量子化)される。そして、以上のようにして得られる、クラスタップを構成するKビットの各量子化DCT係数を、所定の順番で並べたビット列が、ADRCコードとして出力される。従って、クラスタップが、例えば、1ビットADRC処理された場合には、そのクラスタップを構成する各量子化DCT係数は、最小値MINが減算された後に、最大値MAXと最小値MINとの平均値で除算され、これにより、各量子化DCT係数が1ビットとされる(2値化される)。そして、その1ビットの量子化DCT係数を所定の順番で並べたビット列が、ADRCコードとして出力される。
【0092】
なお、クラス分類回路43には、例えば、クラスタップを構成する量子化DCT係数のレベル分布のパターンを、そのままクラスコードとして出力させることも可能であるが、この場合、クラスタップが、N個の量子化DCT係数で構成され、各量子化DCT係数に、Kビットが割り当てられているとすると、クラス分類回路43が出力するクラスコードの場合の数は、(2N)K通りとなり、量子化DCT係数のビット数Kに指数的に比例した膨大な数となる。
【0093】
従って、クラス分類回路43においては、クラスタップの情報量を、上述のADRC処理や、あるいはベクトル量子化等によって圧縮してから、クラス分類を行うのが好ましい。
【0094】
ところで、本実施の形態では、クラスタップは、上述したように、64個の量子化DCT係数で構成される。従って、例えば、仮に、クラスタップを1ビットADRC処理することにより、クラス分類を行うこととしても、クラスコードの場合の数は、264通りという大きな値となる。
【0095】
そこで、本実施の形態では、クラス分類回路43において、クラスタップを構成する量子化DCT係数から、重要性の高い特徴量を抽出し、その特徴量に基づいてクラス分類を行うことで、クラス数を低減するようになっている。
【0096】
即ち、図7は、図5のクラス分類回路43の構成例を示している。
【0097】
クラスタップは、電力演算回路51に供給されるようになっており、電力演算回路51は、クラスタップを構成する量子化DCT係数を、幾つかの空間周波数帯域のものに分け、各周波数帯域の電力を演算する。
【0098】
即ち、電力演算回路51は、クラスタップを構成する8×8個の量子化DCT係数を、例えば、図8に示すような4つの空間周波数帯域S0,S1,S2,S3に分割する。
【0099】
ここで、クラスタップを構成する8×8個の量子化DCT係数それぞれを、アルファベットxに、図6に示したような、ラスタスキャン順に、0からのシーケンシャルな整数を付して表すこととすると、空間周波数帯域S0は、4個の量子化DCT係数x0,x1,x8,x9から構成され、空間周波数帯域S1は、12個の量子化DCT係数x2,x3,x4,x5,x6,x7,x10,x11,x12,x13,x14,x15から構成される。また、空間周波数帯域S2は、12個の量子化DCT係数x16,x17,x24,x25,x32,x33,x40,x41,x48,x49,x56,x57から構成され、空間周波数帯域S3は、36個の量子化DCT係数x18,x19,x20,x21,x22,x23,x26,x27,x28,x29,x30,x31,x34,x35,x36,x37,x38,x39,x42,x43,x44,x45,x46,x47,x50,x51,x52,x53,x54,x55,x58,x59,x60,x61,x62,x63から構成される。
【0100】
さらに、電力演算回路51は、空間周波数帯域S0,S1,S2,S3それぞれについて、量子化DCT係数のAC成分の電力P0,P1,P2,P3を演算し、クラスコード生成回路52に出力する。
【0101】
即ち、電力演算回路51は、空間周波数帯域S0については、上述の4個の量子化DCT係数x0,x1,x8,x9のうちのAC成分x1,x8,x9の2乗和x1 2+x8 2+x9 2を求め、これを、電力P0として、クラスコード生成回路52に出力する。また、電力演算回路51は、空間周波数帯域S1についての、上述の12個の量子化DCT係数のAC成分、即ち、12個すべての量子化DCT係数の2乗和を求め、これを、電力P1として、クラスコード生成回路52に出力する。さらに、電力演算回路51は、空間周波数帯域S2とS3についても、空間周波数帯域S1における場合と同様にして、それぞれの電力P2とP3を求め、クラスコード生成回路52に出力する。
【0102】
クラスコード生成回路52は、電力演算回路51からの電力P0,P1,P2,P3を、閾値テーブル記憶部53に記憶された、対応する閾値TH0,TH1,TH2,TH3とそれぞれ比較し、それぞれの大小関係に基づいて、クラスコードを出力する。即ち、クラスコード生成回路52は、電力P0と閾値TH0とを比較し、その大小関係を表す1ビットのコードを得る。同様に、クラスコード生成回路52は、電力P1と閾値TH1、電力P2と閾値TH2、電力P3と閾値TH3を、それぞれ比較することにより、それぞれについて、1ビットのコードを得る。そして、クラスコード生成回路52は、以上のようにして得られる4つの1ビットのコードを、例えば、所定の順番で並べることにより得られる4ビットのコード(従って、0乃至15のうちのいずれかの値)を、注目画素ブロックのクラスを表すクラスコードとして出力する。従って、本実施の形態では、注目画素ブロックは、24(=16)個のクラスのうちのいずれかにクラス分類されることになる。
【0103】
閾値テーブル記憶部53は、空間周波数帯域S0乃至S3の電力P0乃至P3とそれぞれ比較する閾値TH0乃至TH3を記憶している。
【0104】
なお、上述の場合には、クラス分類処理に、量子化DCT係数のDC成分x0が用いられないが、このDC成分x0をも用いてクラス分類処理を行うことも可能である。
【0105】
図5に戻り、以上のようなクラス分類回路43が出力するクラスコードは、係数テーブル記憶部44およびパターンテーブル記憶部46に、アドレスとして与えられる。
【0106】
係数テーブル記憶部44は、後述するようなタップ係数の学習処理が行われることにより得られるタップ係数が登録された係数テーブルを記憶しており、クラス分類回路43が出力するクラスコードに対応するアドレスに記憶されているタップ係数を積和演算回路45に出力する。
【0107】
ここで、本実施の形態では、画素ブロックがクラス分類されるから、注目画素ブロックについて、1つのクラスコードが得られる。一方、画素ブロックは、本実施の形態では、8×8画素の64画素で構成されるから、注目画素ブロックについて、それを構成する64画素それぞれを復号するための64セットのタップ係数が必要である。従って、係数テーブル記憶部44には、1つのクラスコードに対応するアドレスに対して、64セットのタップ係数が記憶されている。
【0108】
積和演算回路45は、予測タップ抽出回路41が出力する予測タップと、係数テーブル記憶部44が出力するタップ係数とを取得し、その予測タップとタップ係数とを用いて、式(1)に示した線形予測演算(積和演算)を行い、その結果得られる注目画素ブロックの8×8画素の画素値を、対応するDCTブロックの復号結果として、ブロック分解回路33(図3)に出力する。
【0109】
ここで、予測タップ抽出回路41においては、上述したように、注目画素ブロックの各画素が、順次、注目画素とされるが、積和演算回路45は、注目画素ブロックの、注目画素となっている画素の位置に対応した動作モード(以下、適宜、画素位置モードという)となって、処理を行う。
【0110】
即ち、例えば、注目画素ブロックの画素のうち、ラスタスキャン順で、i番目の画素を、piと表し、画素piが、注目画素となっている場合、積和演算回路45は、画素位置モード#iの処理を行う。
【0111】
具体的には、上述したように、係数テーブル記憶部44は、注目画素ブロックを構成する64画素それぞれを復号するための64セットのタップ係数を出力するが、そのうちの画素piを復号するためのタップ係数のセットをWiと表すと、積和演算回路45は、動作モードが、画素位置モード#iのときには、予測タップと、64セットのタップ係数のうちのセットWiとを用いて、式(1)の積和演算を行い、その積和演算結果を、画素piの復号結果とする。
【0112】
パターンテーブル記憶部46は、後述するような量子化DCT係数の抽出パターンを表すパターン情報の学習処理が行われることにより得られるパターン情報が登録されたパターンテーブルを記憶しており、クラス分類回路43が出力するクラスコードに対応するアドレスに記憶されているパターン情報を、予測タップ抽出回路41に出力する。
【0113】
ここで、パターンテーブル記憶部46においても、係数テーブル記憶部44について説明したのと同様の理由から、1つのクラスコードに対応するアドレスに対して、64セットのパターン情報(各画素位置モードごとのパターン情報)が記憶されている。
【0114】
次に、図9のフローチャートを参照して、図5の係数変換回路32の処理について説明する。
【0115】
エントロピー復号回路31が出力するブロックごとの量子化DCT係数は、予測タップ抽出回路41およびクラスタップ抽出回路42において順次受信され、予測タップ抽出回路41は、そこに供給される量子化DCT係数のブロック(DCTブロック)に対応する画素ブロックを、順次、注目画素ブロックとする。
【0116】
そして、クラスタップ抽出回路42は、ステップS11において、そこで受信した量子化DCT係数の中から、注目画素ブロックをクラス分類するのに用いるものを抽出して、クラスタップを構成し、クラス分類回路43に供給する。
【0117】
クラス分類回路43は、ステップS12において、クラスタップ抽出回路42からのクラスタップを用いて、注目画素ブロックをクラス分類し、その結果得られるクラスコードを、係数テーブル記憶部44およびパターンテーブル記憶部46に出力する。
【0118】
即ち、ステップS12では、図10のフローチャートに示すように、まず最初に、ステップS21において、クラス分類回路43(図7)の電力演算回路51が、クラスタップを構成する8×8個の量子化DCT係数を、図8に示した4つの空間周波数帯域S0乃至S3に分割し、それぞれの電力P0乃至P3を演算する。この電力P0乃至P3は、電力演算回路51からクラスコード生成回路52に出力される。
【0119】
クラスコード生成回路52は、ステップS22において、閾値テーブル記憶部53から閾値TH0乃至TH3を読み出し、電力演算回路51からの電力P0乃至P3それぞれと、閾値TH0乃至TH3それぞれとを比較し、それぞれの大小関係に基づいたクラスコードを生成して、リターンする。
【0120】
図9に戻り、ステップS12において以上のようにして得られるクラスコードは、クラス分類回路43から係数テーブル記憶部44およびパターンテーブル記憶部46に対して、アドレスとして与えられる。
【0121】
係数テーブル記憶部44は、クラス分類回路43からのアドレスとしてのクラスコードを受信すると、ステップS13において、そのアドレスに記憶されている64セットのタップ係数を読み出し、積和演算回路45に出力する。また、パターンテーブル記憶部46も、クラス分類回路43からのアドレスとしてのクラスコードを受信すると、ステップS13において、そのアドレスに記憶されている64セットのパターン情報を読み出し、予測タップ抽出回路41に出力する。
【0122】
そして、ステップS14に進み、予測タップ抽出回路41は、注目画素ブロックの画素のうち、ラスタスキャン順で、まだ、注目画素とされていない画素を、注目画素として、その注目画素の画素位置モードに対応するパターン情報にしたがって、その注目画素の画素値を予測するのに用いる量子化DCT係数を抽出し、予測タップとして構成する。この予測タップは、予測タップ抽出回路41から積和演算回路45に供給される。
【0123】
積和演算回路45は、ステップS15において、ステップS13で係数テーブル記憶部44が出力する64セットのタップ係数のうち、注目画素に対する画素位置モードに対応するタップ係数のセットを取得し、そのタップ係数のセットと、ステップS14で予測タップ抽出回路41から供給された予測タップとを用いて、式(1)に示した積和演算を行い、注目画素の画素値の復号値を得る。
【0124】
そして、ステップS16に進み、予測タップ抽出回路41は、注目画素ブロックのすべての画素を、注目画素として処理を行ったかどうかを判定する。ステップS16において、注目画素ブロックのすべての画素を、注目画素として、まだ処理を行っていないと判定された場合、ステップS14に戻り、予測タップ抽出回路41は、注目画素ブロックの画素のうち、ラスタスキャン順で、まだ、注目画素とされていない画素を、新たに注目画素として、以下、同様の処理を繰り返す。
【0125】
また、ステップS16において、注目画素ブロックのすべての画素を、注目画素として処理を行ったと判定された場合、即ち、注目画素ブロックのすべての画素の復号値が得られた場合、積和演算回路45は、その復号値で構成される画素ブロック(復号ブロック)を、ブロック分解回路33(図3)に出力し、処理を終了する。
【0126】
なお、図9のフローチャートにしたがった処理は、予測タップ抽出回路41が、新たな注目画素ブロックを設定するごとに繰り返し行われる。
【0127】
次に、図11は、図5の係数テーブル記憶部44に記憶させるタップ係数の学習処理を行うタップ係数学習装置の一実施の形態の構成例を示している。
【0128】
ブロック化回路61には、1枚以上の学習用の画像データが、学習時の教師となる教師データとして供給されるようになっており、ブロック化回路61は、教師データとしての画像を、JPEG符号化における場合と同様に、8×8画素の画素ブロックにブロック化する。
【0129】
DCT回路62は、ブロック化回路61がブロック化した画素ブロックを、順次、注目画素ブロックとして読み出し、その注目画素ブロックを、DCT処理することで、DCT係数のブロックとする。このDCT係数のブロックは、量子化回路63に供給される。
【0130】
量子化回路63は、DCT回路62からのDCT係数のブロックを、JPEG符号化に用いられるのと同一の量子化テーブルにしたがって量子化し、その結果得られる量子化DCT係数のブロック(DCTブロック)を、予測タップ抽出回路64およびクラスタップ抽出回路65に順次供給する。
【0131】
予測タップ抽出回路64は、注目画素ブロックの画素のうち、ラスタスキャン順で、まだ、注目画素とされていない画素を、注目画素として、その注目画素について、パターンテーブル記憶部70から読み出されるパターン情報を参照することにより、図5の予測タップ抽出回路41が構成するのと同一の予測タップを、量子化回路63の出力から、必要な量子化DCT係数を抽出することで構成する。この予測タップは、学習時の生徒となる生徒データとして、予測タップ抽出回路64から正規方程式加算回路67に供給される。
【0132】
クラスタップ抽出回路65は、注目画素ブロックについて、図5のクラスタップ抽出回路42が構成するのと同一のクラスタップを、量子化回路63の出力から、必要な量子化DCT係数を抽出することで構成する。このクラスタップは、クラスタップ抽出回路65からクラス分類回路66に供給される。
【0133】
クラス分類回路66は、クラスタップ抽出回路65からのクラスタップを用いて、図5のクラス分類回路43と同一の処理を行うことで、注目画素ブロックをクラス分類し、その結果得られるクラスコードを、正規方程式加算回路67およびパターンテーブル記憶部70に供給する。
【0134】
正規方程式加算回路67は、ブロック化回路61から、教師データとしての注目画素(の画素値)を読み出し、予測タップ構成回路64からの生徒データとしての予測タップ(を構成する量子化DCT係数)、および注目画素を対象とした足し込みを行う。
【0135】
即ち、正規方程式加算回路67は、クラス分類回路66から供給されるクラスコードに対応するクラスごとに、予測タップ(生徒データ)を用い、式(8)の行列Aにおける各コンポーネントとなっている、生徒データどうしの乗算(xinxim)と、サメーション(Σ)に相当する演算を行う。
【0136】
さらに、正規方程式加算回路67は、やはり、クラス分類回路66から供給されるクラスコードに対応するクラスごとに、予測タップ(生徒データ)および注目画素(教師データ)を用い、式(8)のベクトルvにおける各コンポーネントとなっている、生徒データと教師データの乗算(xinyi)と、サメーション(Σ)に相当する演算を行う。
【0137】
なお、正規方程式加算回路67における、上述のような足し込みは、各クラスについて、注目画素に対する画素位置モードごとに行われる。
【0138】
正規方程式加算回路67は、以上の足し込みを、ブロック化回路61に供給された教師画像を構成する画素すべてを注目画素として行い、これにより、各クラスについて、画素位置モードごとに、式(8)に示した正規方程式がたてられる。
【0139】
タップ係数決定回路68は、正規方程式加算回路67においてクラスごとに(かつ、画素位置モードごとに)生成された正規方程式を解くことにより、クラスごとに、64セットのタップ係数を求め、係数テーブル記憶部69の、各クラスに対応するアドレスに供給する。
【0140】
なお、学習用の画像として用意する画像の枚数や、その画像の内容等によっては、正規方程式加算回路67において、タップ係数を求めるのに必要な数の正規方程式が得られないクラスが生じる場合があり得るが、タップ係数決定回路68は、そのようなクラスについては、例えば、デフォルトのタップ係数を出力する。
【0141】
係数テーブル記憶部69は、タップ係数決定回路68から供給されるクラスごとの64セットのタップ係数を記憶する。
【0142】
パターンテーブル記憶部70は、図5のパターンテーブル記憶部46が記憶しているのと同一のパターンテーブルを記憶しており、クラス分類回路66からのクラスコードに対応するアドレスに記憶されている64セットのパターン情報を読み出し、予測タップ抽出回路64に供給する。
【0143】
次に、図12のフローチャートを参照して、図11のタップ係数学習装置の処理(学習処理)について説明する。
【0144】
ブロック化回路61には、学習用の画像データが、教師データとして供給され、ブロック化回路61は、ステップS31において、教師データとしての画像データを、JPEG符号化における場合と同様に、8×8画素の画素ブロックにブロック化して、ステップS32に進む。ステップS32では、DCT回路62が、ブロック化回路61がブロック化した画素ブロックを、順次読み出し、その注目画素ブロックを、DCT処理することで、DCT係数のブロックとし、ステップS33に進む。ステップS33では、量子化回路63が、DCT回路62において得られたDCT係数のブロックを順次読み出し、JPEG符号化に用いられるのと同一の量子化テーブルにしたがって量子化して、量子化DCT係数で構成されるブロック(DCTブロック)とする。
【0145】
そして、ステップS34に進み、クラスタップ抽出回路65は、ブロック化回路61でブロック化された画素ブロックのうち、まだ注目画素ブロックとされていないものを、注目画素ブロックとする。さらに、クラスタップ抽出回路65は、注目画素ブロックをクラス分類するのに用いる量子化DCT係数を、量子化回路63で得られたDCTブロックから抽出して、クラスタップを構成し、クラス分類回路66に供給する。クラス分類回路66は、ステップS35において、図10のフローチャートで説明した場合と同様に、クラスタップ抽出回路65からのクラスタップを用いて、注目画素ブロックをクラス分類し、その結果得られるクラスコードを、正規方程式加算回路67およびパターンテーブル記憶部70に供給して、ステップS36に進む。
【0146】
これにより、パターンテーブル記憶部70は、クラス分類回路66からのクラスコードに対応するアドレスに記憶された64セットのパターン情報を読み出し、予測タップ抽出回路64に供給する。
【0147】
ステップS36では、予測タップ抽出回路64が、注目画素ブロックの画素のうち、ラスタスキャン順で、まだ、注目画素とされていない画素を、注目画素として、パターンテーブル記憶部70からの64セットのパターン情報のうちの、注目画素の画素位置モードに対応するものにしたがって、図5の予測タップ抽出回路41が構成するのと同一の予測タップを、量子化回路63の出力から必要な量子化DCT係数を抽出することで構成する。そして、予測タップ抽出回路64は、注目画素についての予測タップを、生徒データとして、正規方程式加算回路67に供給し、ステップS37に進む。
【0148】
ステップS37では、正規方程式加算回路67は、ブロック化回路61から、教師データとしての注目画素を読み出し、生徒データとしての予測タップ(を構成する量子化DCT係数)、および教師データとしての注目画素を対象として、式(8)の行列Aとベクトルvの、上述したような足し込みを行う。なお、この足し込みは、クラス分類回路66からのクラスコードに対応するクラスごとに、かつ注目画素に対する画素位置モードごとに行われる。
【0149】
そして、ステップS38に進み、予測タップ抽出回路64は、注目画素ブロックのすべての画素を、注目画素として、足し込みを行ったかどうかを判定する。ステップS38において、注目画素ブロックのすべての画素を、注目画素として、まだ足し込みを行っていないと判定された場合、ステップS36に戻り、予測タップ抽出回路64は、注目画素ブロックの画素のうち、ラスタスキャン順で、まだ、注目画素とされていない画素を、新たに注目画素として、以下、同様の処理を繰り返す。
【0150】
また、ステップS38において、注目画素ブロックのすべての画素を、注目画素として、足し込みを行ったと判定された場合、ステップS39に進み、ブロック化回路61は、教師データとしての画像から得られたすべての画素ブロックを、注目画素ブロックとして処理を行ったかどうかを判定する。ステップS39において、教師データとしての画像から得られたすべての画素ブロックを、注目画素ブロックとして、まだ処理を行っていないと判定された場合、ステップS34に戻り、ブロック化回路61でブロック化された画素ブロックのうち、まだ注目画素ブロックとされていないものが、新たに注目画素ブロックとされ、以下、同様の処理が繰り返される。
【0151】
一方、ステップS39において、教師データとしての画像から得られたすべての画素ブロックを、注目画素ブロックとして処理を行ったと判定された場合、即ち、例えば、正規方程式加算回路67において、各クラスについて、画素位置モードごとの正規方程式が得られた場合、ステップS40に進み、タップ係数決定回路68は、各クラスの画素位置モードごとに生成された正規方程式を解くことにより、各クラスごとに、そのクラスの64の画素位置モードそれぞれに対応する64セットのタップ係数を求め、係数テーブル記憶部69の、各クラスに対応するアドレスに供給して記憶させ、処理を終了する。
【0152】
以上のようにして、係数テーブル記憶部69に記憶された各クラスごとのタップ係数が、図5の係数テーブル記憶部44に記憶されている。
【0153】
従って、係数テーブル記憶部44に記憶されたタップ係数は、線形予測演算を行うことにより得られる元の画素値の予測値の予測誤差(ここでは、自乗誤差)が、統計的に最小になるように学習を行うことにより求められたものであり、その結果、図5の係数変換回路32によれば、JPEG符号化された画像を、元の画像に限りなく近い画像に復号することができる。
【0154】
また、上述したように、JPEG符号化された画像の復号処理と、その画質を向上させるための処理とが、同時に施されることとなるので、JPEG符号化された画像から、効率的に、画質の良い復号画像を得ることができる。
【0155】
次に、図13は、図5のパターンテーブル記憶部46および図11のパターンテーブル記憶部70に記憶させるパターン情報の学習処理を行うパターン学習装置の一実施の形態の構成例を示している。
【0156】
ブロック化回路151には、1枚以上の学習用の画像データが供給されるようになっており、ブロック化回路151は、学習用の画像を、JPEG符号化における場合と同様に、8×8画素の画素ブロックにブロック化する。なお、ブロック化回路151に供給する学習用の画像データは、図11のタップ係数学習装置のブロック化回路61に供給される学習用の画像データと同一のものであっても良いし、異なるものであっても良い。
【0157】
DCT回路152は、ブロック化回路151がブロック化した画素ブロックを、順次読み出し、その画素ブロックを、DCT処理することで、DCT係数のブロックとする。このDCT係数のブロックは、量子化回路153に供給される。
【0158】
量子化回路153は、DCT回路152からのDCT係数のブロックを、JPEG符号化に用いられるのと同一の量子化テーブルにしたがって量子化し、その結果得られる量子化DCT係数のブロック(DCTブロック)を、加算回路154およびクラスタップ抽出回路155およびに順次供給する。
【0159】
加算回路154は、ブロック化回路151において得られた画素ブロックを、順次、注目画素ブロックとし、その注目画素ブロックの画素のうち、ラスタスキャン順で、まだ、注目画素とされていない画素を、注目画素として、クラス分類回路156が出力する注目画素のクラスコードごとに、その注目画素と、量子化回路153が出力する量子化DCT係数との間の相関値(相互相関値)を求めるための加算演算を行う。
【0160】
即ち、パターン情報の学習処理では、例えば、図14(A)に示すように、注目画素が属する注目画素ブロックに対応するDCTブロックを中心とする3×3個のDCTブロックの各位置にある量子化DCT係数それぞれと、注目画素とを対応させることを、図14(B)に示すように、学習用の画像から得られる画素ブロックすべてについて行うことで、画素ブロックの各位置にある画素それぞれと、画素ブロックに対応するDCTブロックを中心とする3×3個のDCTブロックの各位置にある量子化DCT係数それぞれとの間の相関値を演算し、画素ブロックの各位置にある画素それぞれについて、例えば、図14(C)において■印で示すように、その画素との相関値が大きい位置関係にある量子化DCT係数の位置パターンを、パターン情報とするようになっている。即ち、図14(C)は、画素ブロックの左から3番目で、上から1番目の画素との相関が大きい位置関係にある量子化DCT係数の位置パターンを、■印で表しており、このような位置パターンが、パターン情報とされる。
【0161】
ここで、画素ブロックの左からx+1番目で、上からy+1番目の画素を、A(x,y)と表すとともに(本実施の形態では、x,yは、0乃至7(=8−1)の範囲の整数)、その画素が属する画素ブロックに対応するDCTブロックを中心とする3×3個のDCTブロックの左からs+1番目で、上からt+1番目の量子化DCT係数をB(s,t)と表すと(本実施の形態では、s,tは、0乃至23(=8×3−1)の範囲の整数)、画素A(x,y)と、その画素A(x,y)に対して所定の位置関係にある量子化DCT係数B(s,t)との相互相関値RA(x,y)B(s,t)は、次式で表される。
【0162】
但し、式(9)において(後述する式(10)乃至(12)においても同様)、サメーション(Σ)は、学習用の画像から得られた画素ブロックすべてについての加算を表す。また、A'(x,y)は、学習用の画像から得られた画素ブロックの位置(x,y)にある画素(値)の平均値を、B'(s,t)は、学習用の画像から得られた画素ブロックに対する3×3個のDCTブロックの位置(s,t)にある量子化DCT係数の平均値をそれぞれ表す。
【0163】
従って、学習用の画像から得られた画素ブロックの総数をNと表すと、平均値A'(x,y)およびB'(s,t)は、次式のように表すことができる。
【0164】
A'(x,y)=(ΣA(x,y))/N
B'(s,t)=(ΣB(s,t))/N
・・・(10)
【0165】
式(10)を式(9)に代入すると、次式が導かれる。
【0166】
【0167】
式(11)より、相関値RA(x,y)B(s,t)を求めるには、
ΣA(x,y),ΣB(s,t),ΣA(x,y)2,ΣB(s,t)2,Σ(A(x,y)B(s,t))
・・・(12)
の合計5式の加算演算を行う必要があり、加算回路154は、この5式の加算演算を行う。
【0168】
なお、ここでは、説明を簡単にするために、クラスを考慮しなかったが、図13のパターン学習装置では、加算回路154は、式(12)の5式の加算演算を、クラス分類回路156から供給されるクラスコードごとに分けて行う。従って、上述の場合には、サメーション(Σ)は、学習用の画像から得られた画素ブロックすべてについての加算を表すこととしたが、クラスを考慮する場合には、式(12)のサメーション(Σ)は、学習用の画像から得られた画素ブロックうち、各クラスに属するものについての加算を表すことになる。
【0169】
図13に戻り、加算回路154は、学習用の画像について、クラスごとに、画素ブロックの各位置にある画素と、その画素ブロックに対応するDCTブロックを中心とする3×3個のDCTブロックの各位置にある量子化DCT係数との相関値を演算するための式(12)に示した加算演算結果を得ると、その加算演算結果を、相関係数算出回路157に出力する。
【0170】
クラスタップ抽出回路155は、注目画素ブロックについて、図5のクラスタップ抽出回路42が構成するのと同一のクラスタップを、量子化回路153の出力から、必要な量子化DCT係数を抽出することで構成する。このクラスタップは、クラスタップ抽出回路155からクラス分類回路156に供給される。
【0171】
クラス分類回路156は、クラスタップ抽出回路155からのクラスタップを用いて、図5のクラス分類回路43と同一の処理を行うことで、注目画素ブロックをクラス分類し、その結果得られるクラスコードを、加算回路154に供給する。
【0172】
相関係数算出回路157は、加算回路154の出力を用いて、式(11)にしたがい、クラスごとに、画素ブロックの各位置にある画素と、その画素ブロックに対応するDCTブロックを中心とする3×3個のDCTブロックの各位置にある量子化DCT係数との相関値を演算し、パターン選択回路158に供給する。
【0173】
パターン選択回路158は、相関係数算出回路157からの相関値に基づいて、画素ブロックの各位置にある8×8の画素それぞれとの相関値が大きい位置関係にあるDCT係数の位置を、クラスごとに認識する。即ち、パターン選択回路158は、例えば、画素ブロックの各位置にある画素との相関値(の絶対値)が所定の閾値以上となっているDCT係数の位置を、クラスごとに認識する。あるいは、また、パターン選択回路158は、例えば、画素ブロックの各位置にある画素との相関値が所定の順位以上であるDCT係数の位置を、クラスごとに認識する。そして、パターン選択回路158は、クラスごとに認識した、8×8画素それぞれについての(画素位置モードごとの)64セットのDCT係数の位置パターンを、パターン情報として、パターンテーブル記憶部159に供給する。
【0174】
なお、パターン選択回路158において、画素ブロックの各位置にある画素との相関値が所定の順位以上であるDCT係数の位置を認識するようにした場合には、その認識されるDCT係数の位置の数は固定(所定の順位に相当する値)となるが、画素ブロックの各位置にある画素との相関値が所定の閾値以上となっているDCT係数の位置を認識するようにした場合には、その認識されるDCT係数の位置の数は、可変になる。
【0175】
パターンテーブル記憶部159は、パターン選択回路158が出力するパターン情報を記憶する。
【0176】
次に、図15のフローチャートを参照して、図13のパターン学習装置の処理(学習処理)について説明する。
【0177】
ブロック化回路151には、学習用の画像データが供給され、ブロック化回路61は、ステップS51において、その学習用の画像データを、JPEG符号化における場合と同様に、8×8画素の画素ブロックにブロック化して、ステップS52に進む。ステップS52では、DCT回路152が、ブロック化回路151がブロック化した画素ブロックを、順次読み出し、その画素ブロックを、DCT処理することで、DCT係数のブロックとし、ステップS53に進む。ステップS53では、量子化回路153が、DCT回路152において得られたDCT係数のブロックを順次読み出し、JPEG符号化に用いられるのと同一の量子化テーブルにしたがって量子化して、量子化DCT係数で構成されるブロック(DCTブロック)とする。
【0178】
そして、ステップS54に進み、加算回路154は、ブロック化回路151でブロック化された画素ブロックのうち、まだ注目画素ブロックとされていないものを、注目画素ブロックとする。さらに、ステップS54では、クラスタップ抽出回路155は、注目画素ブロックをクラス分類するのに用いる量子化DCT係数を、量子化回路63で得られたDCTブロックから抽出して、クラスタップを構成し、クラス分類回路156に供給する。クラス分類回路156は、ステップS55において、図10のフローチャートで説明した場合と同様に、クラスタップ抽出回路155からのクラスタップを用いて、注目画素ブロックをクラス分類し、その結果得られるクラスコードを、加算回路154に供給して、ステップS56に進む。
【0179】
ステップS56では、加算回路154が、注目画素ブロックの画素のうち、ラスタスキャン順で、まだ、注目画素とされていない画素を、注目画素として、その注目画素の位置(画素位置モード)ごとに、かつ、クラス分類回路156から供給されるクラスコードごとに、式(12)に示した加算演算を、ブロック化回路151でブロック化された学習用の画像と、量子化回路153が出力する量子化DCT係数を用いて行い、ステップS57に進む。
【0180】
ステップS57では、加算回路154は、注目画素ブロックのすべての画素を、注目画素として、加算演算を行ったかどうかを判定する。ステップS57において、注目画素ブロックのすべての画素を、注目画素として、まだ加算演算を行っていないと判定された場合、ステップS56に戻り、加算回路154は、注目画素ブロックの画素のうち、ラスタスキャン順で、まだ、注目画素とされていない画素を、新たに注目画素として、以下、同様の処理を繰り返す。
【0181】
また、ステップS57において、注目画素ブロックのすべての画素を、注目画素として、加算演算を行ったと判定された場合、ステップS58に進み、加算回路154は、学習用の画像から得られたすべての画素ブロックを、注目画素ブロックとして処理を行ったかどうかを判定する。ステップS58において、教師用の画像から得られたすべての画素ブロックを、注目画素ブロックとして、まだ処理を行っていないと判定された場合、ステップS54に戻り、ブロック化回路151でブロック化された画素ブロックのうち、まだ注目画素ブロックとされていないものが、新たに注目画素ブロックとされ、以下、同様の処理が繰り返される。
【0182】
一方、ステップS58において、学習用の画像から得られたすべての画素ブロックを、注目画素ブロックとして処理を行ったと判定された場合、ステップS59に進み、相関係数算出回路157は、加算回路154における加算演算結果をを用いて、式(11)にしたがい、クラスごとに、画素ブロックの各位置にある画素と、画素ブロックに対応するDCTブロックを中心とする3×3個のDCTブロックの各位置にある量子化DCT係数との相関値を演算し、パターン選択回路158に供給する。
【0183】
パターン選択回路158は、ステップS60において、相関係数算出回路157からの相関値に基づいて、画素ブロックの各位置にある8×8の画素それぞれとの相関値が大きい位置関係にあるDCT係数の位置を、クラスごとに認識し、そのクラスごとに認識した8×8画素それぞれについての64セットのDCT係数の位置パターンを、パターン情報として、パターンテーブル記憶部159に供給して記憶させ、処理を終了する。
【0184】
以上のようにして、パターンテーブル記憶部159に記憶された各クラスごとの64セットのパターン情報が、図5のパターンテーブル記憶部46および図11のパターンテーブル記憶部70に記憶されている。
【0185】
従って、図5の係数変換回路32では、注目画素について、それとの相関が大きい位置にある量子化DCT係数が、予測タップとして抽出され、そのような予測タップを用いて、量子化DCT係数が、元の画素値に復号されるため、例えば、予測タップとする量子化DCT係数を、ランダムに抽出する場合に比較して、復号画像の画質を向上させることが可能となる。
【0186】
なお、JPEG符号化では、8×8画素の画素ブロック単位で、DCTおよび量子化が行われることにより、8×8の量子化DCT係数からなるDCTブロックが構成されるから、ある画素ブロックの画素を、クラス分類適応処理によって復号する場合には、その画素ブロックに対応するDCTブロックの量子化DCT係数を、予測タップとして用いることが考えられる。
【0187】
しかしながら、画像においては、ある画素ブロックに注目した場合に、その画素ブロックの画素と、その周辺の画素ブロックの画素との間には、少なからず相関があるのが一般的である。従って、上述のように、ある画素ブロックに対応するDCTブロックを中心とする3×3個のDCTブロック、即ち、ある画素ブロックに対応するDCTブロックだけでなく、それ以外のDCTブロックからも、注目画素との相関が大きい位置関係にある量子化DCT係数を抽出して、予測タップとして用いることによって、画素ブロックに対応するDCTブロックの量子化DCT係数だけを、予測タップとして用いる場合に比較して、復号画像の画質を向上させることが可能となる。
【0188】
ここで、ある画素ブロックの画素と、その周辺の画素ブロックの画素との間に、少なからず相関があることからすれば、ある画素ブロックに対応するDCTブロックを中心とする3×3個のDCTブロックの量子化DCT係数すべてを、予測タップとして用いることにより、画素ブロックに対応するDCTブロックの量子化DCT係数だけを、予測タップとして用いる場合に比較して、復号画像の画質を向上させることが可能である。
【0189】
但し、ある画素ブロックに対応するDCTブロックを中心とする3×3個のDCTブロックの量子化DCT係数すべてを、予測タップとすると、予測タップを構成する量子化DCT係数の数は576(=8×8×3×3)となり、図5の積和演算回路45において行う必要のある積和演算の回数が多くなる。
【0190】
そこで、その576の量子化DCT係数のうち、注目画素との相関が大きい位置関係にある量子化DCT係数を抽出して、予測タップとして用いることによって、図5の積和演算回路45における演算量の増加を抑えながら、復号画像の画質を向上させることが可能となる。
【0191】
なお、上述の場合には、ある画素ブロックに対応するDCTブロックを中心とする3×3個のDCTブロックの量子化DCT係数から、注目画素との相関が大きい位置関係にある量子化DCT係数を予測タップとして抽出するようにしたが、予測タップとする量子化DCT係数は、その他、ある画素ブロックに対応するDCTブロックを中心とする5×5個等のDCTブロックの量子化DCT係数から抽出するようにしても良い。即ち、どのような範囲のDCTブロックから、予測タップとする量子化DCT係数を抽出するかは、特に限定されるものではない。
【0192】
また、あるDCTブロックの量子化DCT係数は、対応する画素ブロックの画素から得られたものであるから、注目画素について予測タップを構成するにあたっては、その注目画素の画素ブロックに対応するDCTブロックの量子化DCT係数は、すべて、予測タップとするのが望ましいと考えられる。
【0193】
そこで、図13のパターン選択回路158には、画素ブロックに対応するDCTブロックの量子化DCT係数は、必ず、予測タップとして抽出されるようなパターン情報を生成させるようにすることができる。この場合、パターン選択回路158では、画素ブロックに対応するDCTブロックの周囲に隣接する8個のDCTブロックから、相関値の大きい量子化DCT係数が選択され、その量子化DCT係数の位置のパターンと、画素ブロックに対応するDCTブロックの量子化DCT係数すべての位置のパターンとをあわせたものが、最終的な、パターン情報とされることになる。
【0194】
次に、図16は、図3の係数変換回路32の第2の構成例を示している。なお、図中、図5における場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。即ち、図16の係数変換回路32は、逆量子化回路71が新たに設けられている他は、基本的に、図5における場合と同様に構成されている。
【0195】
図16の実施の形態において、逆量子化回路71には、エントロピー復号回路31(図3)において符号化データをエントロピー復号することにより得られるブロックごとの量子化DCT係数が供給される。
【0196】
なお、エントロピー復号回路31においては、上述したように、符号化データから、量子化DCT係数の他、量子化テーブルも得られるが、図16の実施の形態では、この量子化テーブルも、エントロピー復号回路31から逆量子化回路71に供給されるようになっている。
【0197】
逆量子化回路71は、エントロピー復号回路31からの量子化DCT係数を、同じくエントロピー復号回路31からの量子化テーブルにしたがって逆量子化し、その結果られるDCT係数を、予測タップ抽出回路41およびクラスタップ抽出回路42に供給する。
【0198】
従って、予測タップ抽出回路41とクラスタップ抽出回路42では、量子化DCT係数ではなく、DCT係数を対象として、予測タップとクラスタップがそれぞれ構成され、以降も、DCT係数を対象として、図5における場合と同様の処理が行われる。
【0199】
このように、図16の実施の形態では、量子化DCT係数ではなく、DCT係数を対象として処理が行われるため、係数テーブル記憶部44に記憶させるタップ係数は、図5における場合と異なるものとする必要がある。
【0200】
そこで、図17は、図16の係数テーブル記憶部44に記憶させるタップ係数の学習処理を行うタップ係数学習装置の一実施の形態の構成例を示している。なお、図中、図11における場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。即ち、図17のタップ係数学習装置は、量子化回路63の後段に、逆量子化回路81が新たに設けられている他は、図11における場合と基本的に同様に構成されている。
【0201】
図17の実施の形態において、逆量子化回路81は、逆量子化回路63が出力する量子化DCT係数を、図16の逆量子化回路71と同様に逆量子化し、その結果得られるDCT係数を、予測タップ抽出回路64およびクラスタップ抽出回路65に供給する。
【0202】
従って、予測タップ抽出回路64とクラスタップ抽出回路65では、量子化DCT係数ではなく、DCT係数を対象として、予測タップとクラスタップがそれぞれ構成され、以降も、DCT係数を対象として、図11における場合と同様の処理が行われる。
【0203】
その結果、DCT係数が量子化され、さらに逆量子化されることにより生じる量子化誤差の影響を低減するタップ係数が得られることになる。
【0204】
次に、図18は、図16のパターンテーブル記憶部46および図17のパターンテーブル記憶部70に記憶させるパターン情報の学習処理を行うパターン学習装置の一実施の形態の構成例を示している。なお、図中、図13における場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。即ち、図18のパターン学習装置は、量子化回路153の後段に、逆量子化回路91が新たに設けられている他は、図13における場合と基本的に同様に構成されている。
【0205】
図18の実施の形態において、逆量子化回路91は、逆量子化回路153が出力する量子化DCT係数を、図16の逆量子化回路71や、図17の逆量子化回路81と同様に逆量子化し、その結果得られるDCT係数を、加算回路154およびクラスタップ抽出回路155に供給する。
【0206】
従って、加算回路154とクラスタップ抽出回路155では、量子化DCT係数ではなく、DCT係数を対象として処理が行われる。即ち、加算回路154は、上述の加算演算を、量子化回路153が出力する量子化DCT係数に替えて、逆量子化回路91が出力するDCT係数を用いて行い、クラスタップ抽出回路155も、量子化回路153が出力する量子化DCT係数に替えて、逆量子化回路91が出力するDCT係数を用いて、クラスタップを構成する。そして、以降は、図13における場合と同様の処理が行われることにより、パターン情報が求められる。
【0207】
次に、図19は、図3の係数変換回路32の第3の構成例を示している。なお、図中、図5における場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。即ち、図19の係数変換回路32は、積和演算回路45の後段に、逆DCT回路101が新たに設けられている他は、基本的に、図5における場合と同様に構成されている。
【0208】
逆DCT回路101は、積和演算回路45の出力を逆DCT処理することにより、画像に復号して出力する。従って、図19の実施の形態では、積和演算回路45は、予測タップ抽出回路41が出力する予測タップを構成する量子化DCT係数と、係数テーブル記憶部44に記憶されたタップ係数とを用いた積和演算を行うことにより、DCT係数を出力する。
【0209】
このように、図19の実施の形態では、量子化DCT係数が、タップ係数との積和演算により、画素値に復号されるのではなく、DCT係数に変換され、さらに、そのDCT係数が、逆DCT回路101で逆DCTされることにより、画素値に復号される。従って、係数テーブル記憶部44に記憶させるタップ係数は、図5における場合と異なるものとする必要がある。
【0210】
そこで、図20は、図19の係数テーブル記憶部44に記憶させるタップ係数の学習処理を行うタップ係数学習装置の一実施の形態の構成例を示している。なお、図中、図11における場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。即ち、図20のタップ係数学習装置は、正規方程式加算回路67に対し、教師データとして、学習用の画像の画素値ではなく、DCT回路62が出力する、学習用の画像をDCT処理したDCT係数が与えられるようになっている他は、図11における場合と同様に構成されている。
【0211】
従って、図20の実施の形態では、正規方程式加算回路67が、DCT回路62が出力するDCT係数を教師データとするとともに、予測タップ構成回路64が出力する予測タップを構成する量子化DCT係数を生徒データとして、上述の足し込みを行う。そして、タップ係数決定回路68は、そのような足し込みにより得られる正規方程式を解くことにより、タップ係数を求める。その結果、図20のタップ係数学習装置では、量子化DCT係数を、量子化回路63における量子化による量子化誤差を低減(抑制)したDCT係数に変換するタップ係数が求められることになる。
【0212】
図19の係数変換回路32では、積和演算回路45が、上述のようなタップ係数を用いて積和演算を行うため、その出力は、予測タップ抽出回路41が出力する量子化DCT係数を、その量子化誤差を低減したDCT係数に変換したものとなる。従って、そのようなDCT係数が、逆DCT回路101で逆DCTされることにより、量子化誤差の影響による画質の劣化を低減した復号画像が得られることになる。
【0213】
次に、図21は、図19のパターンテーブル記憶部46および図20のパターンテーブル記憶部70に記憶させるパターン情報の学習処理を行うパターン学習装置の一実施の形態の構成例を示している。なお、図中、図13における場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。即ち、図21のパターン学習装置は、加算回路154に対し、ブロック化回路151が出力する学習用の画像の画素ではなく、DCT回路152が出力するDCT係数が供給されるようになっている他は、図13における場合と同様に構成されている。
【0214】
図13の実施の形態では、予測タップを構成する量子化DCT係数とタップ係数とを用いた積和演算によって、画素を復号するために、画素との相関が大きい位置関係にある量子化DCT係数を求めて、その量子化DCT係数の位置パターンを、パターン情報としたが、図21の実施の形態では、予測タップを構成する量子化DCT係数とタップ係数とを用いた積和演算によって、量子化誤差を低減したDCT係数を得るために、DCT係数と相関が大きい位置関係にある量子化DCT係数を求めて、その量子化DCT係数の位置パターンを、パターン情報として求める必要がある。
【0215】
そこで、図21の実施の形態では、加算回路154は、ブロック化回路151において得られた画素ブロックではなく、その画素ブロックを、DCT回路152でDCT処理したDCT係数のブロックを、順次、注目ブロックとし、その注目ブロックのDCT係数のうち、ラスタスキャン順で、まだ、注目DCT係数とされていないDCT係数を、注目DCT係数として、クラス分類回路156が出力する注目DCT係数のクラスコードごとに、その注目DCT係数と、量子化回路153が出力する量子化DCT係数との間の相関値(相互相関値)を求めるための加算演算を行う。
【0216】
即ち、図21のパターン学習装置による学習処理では、例えば、図22(A)に示すように、注目DCT係数が属する注目ブロックに対応する、量子化DCT係数のDCTブロックを中心とする3×3個のDCTブロックの各位置にある量子化DCT係数それぞれと、注目DCT係数とを対応させることを、図22(B)に示すように、学習用の画像から得られるDCT係数のブロックすべてについて行うことで、DCT係数のブロックの各位置にあるDCT係数それぞれと、そのブロックに対応するDCTブロックを中心とする3×3個のDCTブロックの各位置にある量子化DCT係数それぞれとの間の相関値を演算し、DCT係数のブロックの各位置にあるDCT係数それぞれについて、例えば、図22(C)において■印で示すように、そのDCT係数との相関値が大きい位置関係にある量子化DCT係数の位置パターンを、パターン情報とするようになっている。即ち、図22(C)は、DCT係数のブロックの左から2番目で、上から1番目のDCT係数との相関が大きい位置関係にある量子化DCT係数の位置パターンを、■印で表しており、このような位置パターンが、パターン情報とされる。
【0217】
ここで、DCT係数のブロックの左からx+1番目で、上からy+1番目の画素を、A(x,y)と表すとともに、そのDCT係数が属するブロックに対応するDCTブロックを中心とする3×3個のDCTブロックの左からs+1番目で、上からt+1番目の量子化DCT係数をB(s,t)と表すと、DCT係数A(x,y)と、そのDCT係数A(x,y)に対して所定の位置関係にある量子化DCT係数B(s,t)との相互相関値RA(x,y)B(s,t)は、上述の式(9)乃至(12)で説明した場合と同様にして求めることができる。
【0218】
図21に戻り、相関係数算出回路157は、上述のようにして、加算回路154が行う加算演算の結果を用いて、DCT係数と、量子化DCT係数との間の相関値を求める。そして、パターン選択回路158は、その相関値を大きくする位置関係にある量子化DCT係数の位置パターンを求め、パターン情報とする。
【0219】
次に、図23は、図3の係数変換回路32の第4の構成例を示している。なお、図中、図5、図16、または図19における場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。即ち、図23の係数変換回路32は、図16における場合と同様に、逆量子化回路71が新たに設けられ、かつ、図19における場合と同様に、逆DCT回路101が新たに設けられている他は、図5における場合と同様に構成されている。
【0220】
従って、図23の実施の形態では、予測タップ抽出回路41とクラスタップ抽出回路42では、量子化DCT係数ではなく、DCT係数を対象として、予測タップとクラスタップがそれぞれ構成される。さらに、図23の実施の形態では、積和演算回路45は、予測タップ抽出回路41が出力する予測タップを構成するDCT係数と、係数テーブル記憶部44に記憶されたタップ係数とを用いた積和演算を行うことにより、量子化誤差を低減したDCT係数を得て、逆DCT回路101に出力する。
【0221】
次に、図24は、図23の係数テーブル記憶部44に記憶させるタップ係数の学習処理を行うタップ係数学習装置の一実施の形態の構成例を示している。なお、図中、図11、図17、または図20における場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。即ち、図24のタップ係数学習装置は、図17における場合と同様に、逆量子化回路81が新たに設けられ、さらに、図20における場合と同様に、正規方程式加算回路67に対し、教師データとして、学習用の画像の画素値ではなく、DCT回路62が出力する、学習用の画像をDCT処理したDCT係数が与えられるようになっている他は、図11における場合と同様に構成されている。
【0222】
従って、図24の実施の形態では、正規方程式加算回路67が、DCT回路62が出力するDCT係数を教師データとするとともに、予測タップ構成回路64が出力する予測タップを構成するDCT係数(量子化され、逆量子化されたもの)を生徒データとして、上述の足し込みを行う。そして、タップ係数決定回路68は、そのような足し込みにより得られる正規方程式を解くことにより、タップ係数を求める。その結果、図24のタップ係数学習装置では、量子化され、さらに逆量子化されたDCT係数を、その量子化および逆量子化による量子化誤差を低減したDCT係数に変換するタップ係数が求められることになる。
【0223】
次に、図25は、図23のパターンテーブル記憶部46および図24のパターンテーブル記憶部70に記憶させるパターン情報の学習処理を行うパターン学習装置の一実施の形態の構成例を示している。なお、図中、図13、図18、または図21における場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。即ち、図25のパターン学習装置は、図18における場合と同様に、逆量子化回路91が新たに設けられているとともに、図21における場合と同様に、加算回路154に対し、ブロック化回路151が出力する学習用の画像の画素ではなく、DCT回路152が出力するDCT係数が供給されるようになっている他は、図13における場合と同様に構成されている。
【0224】
従って、図25の実施の形態では、加算回路154は、ブロック化回路151において得られた画素ブロックではなく、その画素ブロックを、DCT回路152でDCT処理したDCT係数のブロックを、順次、注目ブロックとし、その注目ブロックのDCT係数のうち、ラスタスキャン順で、まだ、注目DCT係数とされていないDCT係数を、注目DCT係数として、クラス分類回路156が出力する注目DCT係数のクラスコードごとに、その注目DCT係数と、逆量子化回路91が出力する、量子化され、さらに逆量子化されたDCT係数との間の相関値(相互相関値)を求めるための加算演算を行う。そして、相関係数算出回路157は、加算回路154が行う加算演算の結果を用いて、DCT係数と、量子化されて逆量子化されたDCT係数との間の相関値を求め、パターン選択回路158は、その相関値を大きくする位置関係にある、量子化されて逆量子化されたDCT係数の位置パターンを求めて、パターン情報とする。
【0225】
次に、図26は、図3の係数変換回路32の第5の構成例を示している。なお、図中、図5における場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。即ち、図26の係数変換回路32は、クラスタップ抽出回路42およびクラス分類回路43が設けられていない他は、基本的に、図5における場合と同様に構成されている。
【0226】
従って、図26の実施の形態では、クラスという概念がないが、このことは、クラスが1つであるとも考えるから、係数テーブル記憶部44には、1クラスのタップ係数だけが記憶されており、これを用いて処理が行われる。
【0227】
従って、図26の実施の形態では、係数テーブル記憶部44に記憶されているタップ係数は、図5における場合と異なるものとなっている。
【0228】
そこで、図27は、図26の係数テーブル記憶部44に記憶させるタップ係数の学習処理を行うタップ係数学習装置の一実施の形態の構成例を示している。なお、図中、図11における場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。即ち、図27のタップ学習装置は、クラスタップ抽出回路65およびクラス分類回路66が設けられていない他は、図11における場合と基本的に同様に構成されている。
【0229】
従って、図27のタップ係数学習装置では、正規方程式加算回路67において、上述の足し込みが、クラスには無関係に、画素位置モード別に行われる。そして、タップ係数決定回路68において、画素位置モードごとに生成された正規方程式を解くことにより、タップ係数が求められる。
【0230】
次に、図26および図27の実施の形態では、上述したように、クラスが1つだけである(クラスがない)から、図26のパターンテーブル記憶部46および図27のパターンテーブル記憶部70には、1クラスのパターン情報だけが記憶されている。
【0231】
そこで、図28は、図26のパターンテーブル記憶部46および図27のパターンテーブル記憶部70に記憶させるパターン情報の学習処理を行うパターン学習装置の一実施の形態の構成例を示している。なお、図中、図13における場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。即ち、図28のパターン学習装置は、クラスタップ抽出回路155およびクラス分類回路156が設けられていない他は、図13における場合と基本的に同様に構成されている。
【0232】
従って、図28のパターン学習装置では、加算回路154において、上述の加算演算が、クラスには無関係に、画素位置モード別に行われる。そして、相関係数算出回路157においても、クラスに無関係に、画素位置モードごとに相関値が求められる。さらに、パターン選択回路158においても、相関係数算出回路157で得られた相関値に基づいて、クラスに無関係に、画素位置モードごとにパターン情報が求められる。
【0233】
なお、例えば、図5の実施の形態では、パターンテーブル記憶部46に、クラスごとのパターン情報を記憶させておき、クラス分類回路43が出力するクラスコードに対応するクラスのパターン情報を用いて、予測タップを構成するようにしたが、図5のパターンテーブル記憶部46には、図28のパターン学習装置で得られる1クラスのパターン情報を記憶させておき、そのパターン情報を用いて、クラスに無関係に、予測タップを構成するようにすることも可能である。
【0234】
次に、上述した一連の処理は、ハードウェアにより行うこともできるし、ソフトウェアにより行うこともできる。一連の処理をソフトウェアによって行う場合には、そのソフトウェアを構成するプログラムが、汎用のコンピュータ等にインストールされる。
【0235】
そこで、図29は、上述した一連の処理を実行するプログラムがインストールされるコンピュータの一実施の形態の構成例を示している。
【0236】
プログラムは、コンピュータに内蔵されている記録媒体としてのハードディスク205やROM203に予め記録しておくことができる。
【0237】
あるいはまた、プログラムは、フロッピーディスク、CD-ROM(Compact Disc Read Only Memory),MO(Magneto optical)ディスク,DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリなどのリムーバブル記録媒体211に、一時的あるいは永続的に格納(記録)しておくことができる。このようなリムーバブル記録媒体211は、いわゆるパッケージソフトウエアとして提供することができる。
【0238】
なお、プログラムは、上述したようなリムーバブル記録媒体211からコンピュータにインストールする他、ダウンロードサイトから、ディジタル衛星放送用の人工衛星を介して、コンピュータに無線で転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送し、コンピュータでは、そのようにして転送されてくるプログラムを、通信部208で受信し、内蔵するハードディスク205にインストールすることができる。
【0239】
コンピュータは、CPU(Central Processing Unit)202を内蔵している。CPU202には、バス201を介して、入出力インタフェース210が接続されており、CPU202は、入出力インタフェース210を介して、ユーザによって、キーボードや、マウス、マイク等で構成される入力部207が操作等されることにより指令が入力されると、それにしたがって、ROM(Read Only Memory)203に格納されているプログラムを実行する。あるいは、また、CPU202は、ハードディスク205に格納されているプログラム、衛星若しくはネットワークから転送され、通信部208で受信されてハードディスク205にインストールされたプログラム、またはドライブ209に装着されたリムーバブル記録媒体211から読み出されてハードディスク205にインストールされたプログラムを、RAM(Random Access Memory)204にロードして実行する。これにより、CPU202は、上述したフローチャートにしたがった処理、あるいは上述したブロック図の構成により行われる処理を行う。そして、CPU202は、その処理結果を、必要に応じて、例えば、入出力インタフェース210を介して、LCD(Liquid CryStal Display)やスピーカ等で構成される出力部206から出力、あるいは、通信部208から送信、さらには、ハードディスク205に記録等させる。
【0240】
ここで、本明細書において、コンピュータに各種の処理を行わせるためのプログラムを記述する処理ステップは、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はなく、並列的あるいは個別に実行される処理(例えば、並列処理あるいはオブジェクトによる処理)も含むものである。
【0241】
また、プログラムは、1のコンピュータにより処理されるものであっても良いし、複数のコンピュータによって分散処理されるものであっても良い。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであっても良い。
【0242】
なお、本実施の形態では、画像データを対象としたが、本発明は、その他、例えば、音声データにも適用可能である。
【0243】
さらに、本実施の形態では、静止画を圧縮符号化するJPEG符号化された画像を対象としたが、本発明は、動画を圧縮符号化する、例えば、MPEG符号化された画像を対象とすることも可能である。
【0244】
また、本実施の形態では、少なくとも、DCT処理を行うJPEG符号化された符号化データの復号を行うようにしたが、本発明は、その他の直交変換または周波数変換によって、ブロック単位(ある所定の単位)で変換されたデータの復号や変換に適用可能である。即ち、本発明は、例えば、サブバンド符号化されたデータや、フーリエ変換されたデータ等を復号したり、それらの量子化誤差等を低減したデータに変換する場合にも適用可能である。
【0245】
さらに、本実施の形態では、デコーダ22において、復号に用いるタップ係数を、あらかじめ記憶しておくようにしたが、タップ係数は、符号化データに含めて、デコーダ22に提供するようにすることが可能である。パターン情報についても、同様である。
【0246】
また、本実施の形態では、タップ係数を用いた線形1次予測演算によって、復号や変換を行うようにしたが、復号および変換は、その他、2次以上の高次の予測演算によって行うことも可能である。
【0247】
さらに、本実施の形態では、予測タップを、注目画素ブロックに対応するDCTブロックと、その周辺のDCTブロックの量子化DCT係数から構成するようにしたが、クラスタップも同様に構成することが可能である。
【0248】
【発明の効果】
本発明の第1のデータ処理装置およびデータ処理方法、並びに記録媒体によれば、効率的に、質の良いデータを得ることが可能となる。
【0249】
本発明の第2のデータ処理装置およびデータ処理方法、並びに記録媒体によれば、効率的に、質の良いデータを得ることが可能となる。
【図面の簡単な説明】
【図1】従来のJPEG符号化/復号を説明するための図である。
【図2】本発明を適用した画像伝送システムの一実施の形態の構成例を示す図である。
【図3】図2のデコーダ22の構成例を示すブロック図である。
【図4】図3のデコーダ22の処理を説明するフローチャートである。
【図5】図3の係数変換回路32の第1の構成例を示すブロック図である。
【図6】クラスタップの例を説明する図である。
【図7】図5のクラス分類回路43の構成例を示すブロック図である。
【図8】図5の電力演算回路51の処理を説明するための図である。
【図9】図5の係数変換回路32の処理を説明するフローチャートである。
【図10】図9のステップS12の処理のより詳細を説明するフローチャートである。
【図11】タップ係数を学習するタップ係数学習装置の第1実施の形態の構成例を示すブロック図である。
【図12】図11のタップ係数学習装置の処理を説明するフローチャートである。
【図13】パターン情報を学習するパターン学習装置の第1実施の形態の構成例を示すブロック図である。
【図14】図13の加算回路154の処理を説明するための図である。
【図15】図13のパターン学習装置の処理を説明するフローチャートである。
【図16】図3の係数変換回路32の第2の構成例を示すブロック図である。
【図17】タップ係数学習装置の第2実施の形態の構成例を示すブロック図である。
【図18】パターン学習装置の第2実施の形態の構成例を示すブロック図である。
【図19】図3の係数変換回路32の第3の構成例を示すブロック図である。
【図20】タップ係数学習装置の第3実施の形態の構成例を示すブロック図である。
【図21】パターン学習装置の第3実施の形態の構成例を示すブロック図である。
【図22】図21の加算回路154の処理を説明するための図である。
【図23】図3の係数変換回路32の第4の構成例を示すブロック図である。
【図24】タップ係数学習装置の第4実施の形態の構成例を示すブロック図である。
【図25】パターン学習装置の第4実施の形態の構成例を示すブロック図である。
【図26】図3の係数変換回路32の第5の構成例を示すブロック図である。
【図27】タップ係数学習装置の第5実施の形態の構成例を示すブロック図である。
【図28】パターン学習装置の第5実施の形態の構成例を示すブロック図である。
【図29】本発明を適用したコンピュータの一実施の形態の構成例を示すブロック図である。
【符号の説明】
21 エンコーダ, 22 デコーダ, 23 記録媒体, 24 伝送媒体, 31 エントロピー復号回路, 32 係数変換回路, 33 ブロック分解回路, 41 予測タップ抽出回路, 42 クラスタップ抽出回路, 43クラス分類回路, 44 係数テーブル記憶部, 45積和演算回路, 46パターンテーブル記憶部, 51 電力演算回路, 52 クラスコード生成回路, 53 閾値テーブル記憶部, 61 ブロック化回路, 62 DCT回路, 63 量子化回路, 64 予測タップ抽出回路, 65 クラスタップ抽出回路, 66 クラス分類回路, 67 正規方程式加算回路, 68 タップ係数決定回路, 69 係数テーブル記憶部, 70 パターンテーブル記憶部, 71,81 逆量子化回路, 91 逆量子化回路, 101 逆DCT回路, 151 ブロック化回路, 152 DCT回路, 153 量子化回路, 154 加算回路, 155 クラスタップ抽出回路, 156 クラス分類回路, 157 相関係数算出回路, 158 パターン選択回路, 159 パターンテーブル記憶部, 201 バス, 202 CPU, 203 ROM, 204 RAM, 205 ハードディスク, 206 出力部, 207 入力部, 208 通信部, 209 ドライブ, 210 入出力インタフェース, 211 リムーバブル記録媒体
Claims (17)
- 所定のデータに対し、少なくとも、直交変換処理または周波数変換処理を所定のブロック単位で施し、量子化することにより得られるブロック単位の量子化変換データから、量子化される前の変換データを得る処理を行うデータ処理装置であって、
学習を行うことにより求められたタップ係数を取得する取得手段と、
前記変換データのブロックである新変換ブロックのうちの注目している注目新変換ブロックの前記変換データを得るための予測演算に用いる前記量子化変換データとして、少なくとも、その注目新変換ブロック以外の新変換ブロックに対応する、前記量子化変換データのブロックである変換ブロックにおける、前記注目新変換ブロックの前記変換データのうちの、注目している注目データとの相関が所定の閾値以上となる前記量子化変換データの位置が示される位置パターン、または、前記注目データとの相関が所定の順位以内になる前記量子化変換データの位置が示される位置パターンに基づいて、その位置パターンにより示される位置に配置されている量子化変換データを抽出し、予測タップとして出力する予測タップ抽出手段と、
前記タップ係数と前記予測タップとの線形1次予測演算を行うことにより、前記量子化変換データを、前記変換データに変換する演算手段と
を備え、
前記タップ係数は、
前記所定のデータに対し、少なくとも、直交変換処理または周波数変換処理を所定のブロック単位で施すことにより得られるブロック単位の、教師となる教師データを量子化することにより、生徒となる生徒データを生成し、
前記教師データのブロックである教師ブロックのうちの注目している注目教師ブロックの教師データを求めるための予測演算に用いる前記生徒データとして、少なくとも、その注目教師ブロック以外の教師ブロックに対応する、前記生徒データのブロックである生徒ブロックにおける、前記注目教師ブロックの前記教師データのうちの、注目している注目データとの相関が所定の閾値以上となる前記生徒データの位置が示される位置パターン、または、前記注目データとの相関が所定の順位以内になる前記生徒データの位置が示される位置パターンに基づいて、その位置パターンにより示される位置に配置されている生徒データを抽出し、予測タップとして出力し、
前記タップ係数と前記予測タップとの線形1次予測演算を行うことにより得られる前記教師データの予測値の予測誤差が、統計的に最小になるように学習を行う
学習処理により求められたものである
ことを特徴とするデータ処理装置。 - 前記タップ係数を記憶している記憶手段をさらに備え、
前記取得手段は、前記記憶手段から、前記タップ係数を取得する
ことを特徴とする請求項1に記載のデータ処理装置。 - 前記変換データは、前記所定のデータを、少なくとも、離散コサイン変換したものである
ことを特徴とする請求項1に記載のデータ処理装置。 - 前記注目新変換ブロックの前記変換データのうちの、注目している注目データを、幾つかのクラスのうちのいずれかにクラス分類するのに用いる前記量子化変換データを抽出し、クラスタップとして出力するクラスタップ抽出手段と、
前記クラスタップに基づいて、前記注目データのクラスを求めるクラス分類を行うクラス分類手段と
をさらに備え、
前記演算手段は、前記予測タップおよび前記注目データのクラスに対応する前記タップ係数を用いて予測演算を行う
ことを特徴とする請求項1に記載のデータ処理装置。 - 前記予測タップ抽出手段は、前記注目新変換ブロックの周辺の新変換ブロックに対応する変換ブロックから、前記予測タップとする量子化変換データを抽出する
ことを特徴とする請求項1に記載のデータ処理装置。 - 前記予測タップ抽出手段は、前記注目新変換ブロックに対応する変換ブロックと、前記注目新変換ブロック以外の新変換ブロックに対応する変換ブロックとから、前記予測タップとする量子化変換データを抽出する
ことを特徴とする請求項1に記載のデータ処理装置。 - 前記所定のデータは、動画または静止画の画像データである
ことを特徴とする請求項1に記載のデータ処理装置。 - 所定のデータに対し、少なくとも、直交変換処理または周波数変換処理を所定のブロック単位で施し、量子化することにより得られるブロック単位の量子化変換データから、量子化される前の変換データを得る処理を行うデータ処理方法であって、
学習を行うことにより求められたタップ係数を取得する取得ステップと、
前記変換データのブロックである新変換ブロックのうちの注目している注目新変換ブロックの前記変換データを得るための予測演算に用いる前記量子化変換データとして、少なくとも、その注目新変換ブロック以外の新変換ブロックに対応する、前記量子化変換データのブロックである変換ブロックにおける、前記注目新変換ブロックの前記変換データのうちの、注目している注目データとの相関が所定の閾値以上となる前記量子化変換データの位置が示される位置パターン、または、前記注目データとの相関が所定の順位以内になる前記量子化変換データの位置が示される位置パターンに基づいて、その位置パターンにより示される位置に配置されている量子化変換データを抽出し、予測タップとして出力する予測タップ抽出ステップと、
前記タップ係数と前記予測タップとの線形1次予測演算を行うことにより、前記量子化変換データを、前記変換データに変換する演算ステップと
を備え、
前記タップ係数は、
前記所定のデータに対し、少なくとも、直交変換処理または周波数変換処理を所定のブロック単位で施すことにより得られるブロック単位の、教師となる教師データを量子化することにより、生徒となる生徒データを生成し、
前記教師データのブロックである教師ブロックのうちの注目している注目教師ブロックの教師データを求めるための予測演算に用いる前記生徒データとして、少なくとも、その注目教師ブロック以外の教師ブロックに対応する、前記生徒データのブロックである生徒ブロックにおける、前記注目教師ブロックの前記教師データのうちの、注目している注目データとの相関が所定の閾値以上となる前記生徒データの位置が示される位置パターン、または、前記注目データとの相関が所定の順位以内になる前記生徒データの位置が示される位置パターンに基づいて、その位置パターンにより示される位置に配置されている生徒データを抽出し、予測タップとして出力し、
前記タップ係数と前記予測タップとの線形1次予測演算を行うことにより得られる前記教師データの予測値の予測誤差が、統計的に最小になるように学習を行う
学習処理により求められたものである
ことを特徴とするデータ処理方法。 - 所定のデータに対し、少なくとも、直交変換処理または周波数変換処理を所定のブロック単位で施し、量子化することにより得られるブロック単位の量子化変換データから、量子化される前の変換データを得る処理を行うデータ処理を、コンピュータに行わせるプログラムが記録されている記録媒体であって、
学習を行うことにより求められたタップ係数を取得する取得ステップと、
前記変換データのブロックである新変換ブロックのうちの注目している注目新変換ブロックの前記変換データを得るための予測演算に用いる前記量子化変換データとして、少なくとも、その注目新変換ブロック以外の新変換ブロックに対応する、前記量子化変換データのブロックである変換ブロックにおける、前記注目新変換ブロックの前記変換データのうちの、注目している注目データとの相関が所定の閾値以上となる前記量子化変換データの位置が示される位置パターン、または、前記注目データとの相関が所定の順位以内になる前記量子化変換データの位置が示される位置パターンに基づいて、その位置パターンにより示される位置に配置されている量子化変換データを抽出し、予測タップとして出力する予測タップ抽出ステップと、
前記タップ係数と前記予測タップとの線形1次予測演算を行うことにより、前記量子化変換データを、前記変換データに変換する演算ステップと
を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体であり、
前記タップ係数は、
前記所定のデータに対し、少なくとも、直交変換処理または周波数変換処理を所定のブロック単位で施すことにより得られるブロック単位の、教師となる教師データを量子化することにより、生徒となる生徒データを生成し、
前記教師データのブロックである教師ブロックのうちの注目している注目教師ブロックの教師データを求めるための予測演算に用いる前記生徒データとして、少なくとも、その注目教師ブロック以外の教師ブロックに対応する、前記生徒データのブロックである生徒ブロックにおける、前記注目教師ブロックの前記教師データのうちの、注目している注目データとの相関が所定の閾値以上となる前記生徒データの位置が示される位置パターン、または、前記注目データとの相関が所定の順位以内になる前記生徒データの位置が示される位置パターンに基づいて、その位置パターンにより示される位置に配置されている生徒データを抽出し、予測タップとして出力し、
前記タップ係数と前記予測タップとの線形1次予測演算を行うことにより得られる前記教師データの予測値の予測誤差が、統計的に最小になるように学習を行う
学習処理により求められたものである
ことを特徴とする記録媒体。 - データに対し、少なくとも、直交変換処理または周波数変換処理を所定のブロック単位で施し、量子化することにより得られるブロック単位の量子化変換データを、量子化される前の変換データに変換するのに用いるタップ係数を学習するデータ処理装置であって、
データに対し、少なくとも、直交変換処理または周波数変換処理を所定のブロック単位で施すことにより得られるブロック単位の、教師となる教師データを量子化することにより、生徒となる生徒データを生成する生徒データ生成手段と、
前記教師データのブロックである教師ブロックのうちの注目している注目教師ブロックの教師データを求めるための予測演算に用いる前記生徒データとして、少なくとも、その注目教師ブロック以外の教師ブロックに対応する、前記生徒データのブロックである生徒ブロックにおける、前記注目教師ブロックの前記教師データのうちの、注目している注目データとの相関が所定の閾値以上となる前記生徒データの位置が示される位置パターン、または、前記注目データとの相関が所定の順位以内になる前記生徒データの位置が示される位置パターンに基づいて、その位置パターンにより示される位置に配置されている生徒データを抽出し、予測タップとして出力する予測タップ抽出手段と、
前記タップ係数と前記予測タップとの線形1次予測演算を行うことにより得られる前記教師データの予測値の予測誤差が、統計的に最小になるように学習を行い、前記タップ係数を求める学習手段と
を備えることを特徴とするデータ処理装置。 - 前記教師データは、データを、少なくとも、離散コサイン変換したものである
ことを特徴とする請求項10に記載のデータ処理装置。 - 前記注目教師ブロックの前記教師データのうちの、注目している注目教師データを、幾つかのクラスのうちのいずれかにクラス分類するのに用いる前記生徒データを抽出し、クラスタップとして出力するクラスタップ抽出手段と、
前記クラスタップに基づいて、前記注目教師データのクラスを求めるクラス分類を行うクラス分類手段と
をさらに備え、
前記学習手段は、前記予測タップおよび前記注目教師データのクラスに対応するタップ係数を用いて予測演算を行うことにより得られる前記教師データの予測値の予測誤差が、統計的に最小になるように学習を行い、クラスごとの前記タップ係数を求める
ことを特徴とする請求項10に記載のデータ処理装置。 - 前記予測タップ抽出手段は、注目教師ブロックの周辺の教師ブロックに対応する前記生徒ブロックから、前記予測タップとする前記生徒データを抽出する
ことを特徴とする請求項10に記載のデータ処理装置。 - 前記予測タップ抽出手段は、注目教師ブロックに対応する前記生徒ブロックと、注目教師ブロック以外の教師ブロックに対応する前記生徒ブロックとから、前記予測タップとする前記生徒データを抽出する
ことを特徴とする請求項10に記載のデータ処理装置。 - 前記データは、動画または静止画の画像データである
ことを特徴とする請求項10に記載のデータ処理装置。 - データに対し、少なくとも、直交変換処理または周波数変換処理を所定のブロック単位で施し、量子化することにより得られるブロック単位の量子化変換データを、量子化される前の変換データに変換するのに用いるタップ係数を学習するデータ処理方法であって、
データに対し、少なくとも、直交変換処理または周波数変換処理を所定のブロック単位で施すことにより得られるブロック単位の、教師となる教師データを量子化することにより、生徒となる生徒データを生成する生徒データ生成ステップと、
前記教師データのブロックである教師ブロックのうちの注目している注目教師ブロックの教師データを求めるための予測演算に用いる前記生徒データとして、少なくとも、その注目教師ブロック以外の教師ブロックに対応する、前記生徒データのブロックである生徒ブロックにおける、前記注目教師ブロックの前記教師データのうちの、注目している注目データとの相関が所定の閾値以上となる前記生徒データの位置が示される位置パターン、または、前記注目データとの相関が所定の順位以内になる前記生徒データの位置が示される位置パターンに基づいて、その位置パターンにより示される位置に配置されている生徒データを抽出し、予測タップとして出力する予測タップ抽出ステップと、
前記タップ係数と前記予測タップとの線形1次予測演算を行うことにより得られる前記教師データの予測値の予測誤差が、統計的に最小になるように学習を行い、前記タップ係数を求める学習ステップと
を備えることを特徴とするデータ処理方法。 - データに対し、少なくとも、直交変換処理または周波数変換処理を所定のブロック単位で施し、量子化することにより得られるブロック単位の量子化変換データを、量子化される前の変換データに変換するのに用いるタップ係数を学習するデータ処理を、コンピュータに行わせるプログラムが記録されている記録媒体であって、
データに対し、少なくとも、直交変換処理または周波数変換処理を所定のブロック単位で施すことにより得られるブロック単位の、教師となる教師データを量子化することにより、生徒となる生徒データを生成する生徒データ生成ステップと、
前記教師データのブロックである教師ブロックのうちの注目している注目教師ブロックの教師データを求めるための予測演算に用いる前記生徒データとして、少なくとも、その注目教師ブロック以外の教師ブロックに対応する、前記生徒データのブロックである生徒ブロックにおける、前記注目教師ブロックの前記教師データのうちの、注目している注目データとの相関が所定の閾値以上となる前記生徒データの位置が示される位置パターン、または、前記注目データとの相関が所定の順位以内になる前記生徒データの位置が示される位置パターンに基づいて、その位置パターンにより示される位置に配置されている生徒データを抽出し、予測タップとして出力する予測タップ抽出ステップと、
前記タップ係数と前記予測タップとの線形1次予測演算を行うことにより得られる前記教師データの予測値の予測誤差が、統計的に最小になるように学習を行い、前記タップ係数を求める学習ステップと
を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000164026A JP4538699B2 (ja) | 2000-06-01 | 2000-06-01 | データ処理装置およびデータ処理方法、並びに記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000164026A JP4538699B2 (ja) | 2000-06-01 | 2000-06-01 | データ処理装置およびデータ処理方法、並びに記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001346210A JP2001346210A (ja) | 2001-12-14 |
JP4538699B2 true JP4538699B2 (ja) | 2010-09-08 |
Family
ID=18667697
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000164026A Expired - Fee Related JP4538699B2 (ja) | 2000-06-01 | 2000-06-01 | データ処理装置およびデータ処理方法、並びに記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4538699B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2154893A1 (en) * | 2008-08-13 | 2010-02-17 | Thomson Licensing | Method for modifying a reference block of a reference image, method for encoding or decoding a block of an image by help of a reference block and device therefor and storage medium or signal carrying a block encoded by help of a modified reference block |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0346484A (ja) * | 1989-07-14 | 1991-02-27 | Hitachi Ltd | 画像処理装置 |
JPH0779434A (ja) * | 1993-09-06 | 1995-03-20 | Sony Corp | ディジタル画像信号の受信/再生装置 |
-
2000
- 2000-06-01 JP JP2000164026A patent/JP4538699B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0346484A (ja) * | 1989-07-14 | 1991-02-27 | Hitachi Ltd | 画像処理装置 |
JPH0779434A (ja) * | 1993-09-06 | 1995-03-20 | Sony Corp | ディジタル画像信号の受信/再生装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2001346210A (ja) | 2001-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100731708B1 (ko) | 데이터 처리 장치와 데이터 처리 방법, 및 기록 매체 | |
JP5957559B2 (ja) | 大きいサイズの変換単位を用いた映像符号化、復号化方法及び装置 | |
EP3350992A1 (en) | Methods and apparatuses for encoding and decoding digital images or video streams | |
WO2020261314A1 (ja) | 画像符号化方法、及び画像復号方法 | |
JP4517448B2 (ja) | データ処理装置およびデータ処理方法、並びに記録媒体 | |
JP4538699B2 (ja) | データ処理装置およびデータ処理方法、並びに記録媒体 | |
JP4752088B2 (ja) | データ処理装置およびデータ処理方法、並びに記録媒体 | |
JP4678454B2 (ja) | データ処理装置およびデータ処理方法、並びに記録媒体 | |
JP4419287B2 (ja) | 画像処理装置および画像処理方法、並びに記録媒体 | |
JP4538698B2 (ja) | データ処理装置およびデータ処理方法、並びに記録媒体 | |
JP4147789B2 (ja) | 画像処理装置および画像処理方法、並びにプログラムおよび記録媒体 | |
JP2001345707A (ja) | データ処理装置およびデータ処理方法、並びに記録媒体 | |
JP4081745B2 (ja) | 復号装置および復号方法、学習装置および学習方法、並びにプログラムおよび記録媒体 | |
JP4154647B2 (ja) | データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体 | |
JP4491701B2 (ja) | データ処理装置およびデータ処理方法、並びに記録媒体 | |
JP4649770B2 (ja) | 画像データ処理装置および方法、記録媒体、並びにプログラム | |
JP2001285648A (ja) | 画像処理装置および画像処理方法、並びに記録媒体 | |
WO2021117082A1 (ja) | 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、及びプログラム | |
JP2004015381A (ja) | 画像処理装置および方法、記録媒体、並びにプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070220 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090818 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090915 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091109 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100527 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100609 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130702 Year of fee payment: 3 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111114 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |