JP2642545B2 - 視覚特性のブロック直交変換領域への変換方法 - Google Patents
視覚特性のブロック直交変換領域への変換方法Info
- Publication number
- JP2642545B2 JP2642545B2 JP26205091A JP26205091A JP2642545B2 JP 2642545 B2 JP2642545 B2 JP 2642545B2 JP 26205091 A JP26205091 A JP 26205091A JP 26205091 A JP26205091 A JP 26205091A JP 2642545 B2 JP2642545 B2 JP 2642545B2
- Authority
- JP
- Japan
- Prior art keywords
- spatial
- block
- orthogonal transform
- impulse
- visual characteristics
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Image Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
【0001】
【産業上の利用分野】この発明は画像の圧縮符号化装置
において用いられ、特に人間の視覚特性を考慮した量子
化あるいは評価を行う場合に、視覚特性(周波数特性)
をブロック直交変換領域に変換する変換方式に関するも
のである。
において用いられ、特に人間の視覚特性を考慮した量子
化あるいは評価を行う場合に、視覚特性(周波数特性)
をブロック直交変換領域に変換する変換方式に関するも
のである。
【0002】
【従来の技術】従来の視覚特性の領域変換方式として
は、例えば文献:「可変長符号化方式における視覚特性
を考慮したDCT係数の最適量子化」(電子情報通信学
会技術研究報告 IE90−101)に開示されるもの
があった。図3は、この従来の方式を説明するための図
であり、以下、従来の方式の処理手順について説明す
る。 図3に於いて、N×Nのブロックサイズの直交変換
領域の視覚特性を得るため、先ず、N×Nのブロックの
値が全てAとなる直交変換領域のブロックデータを入力
する。
は、例えば文献:「可変長符号化方式における視覚特性
を考慮したDCT係数の最適量子化」(電子情報通信学
会技術研究報告 IE90−101)に開示されるもの
があった。図3は、この従来の方式を説明するための図
であり、以下、従来の方式の処理手順について説明す
る。 図3に於いて、N×Nのブロックサイズの直交変換
領域の視覚特性を得るため、先ず、N×Nのブロックの
値が全てAとなる直交変換領域のブロックデータを入力
する。
【0003】 このブロックデータを直交変換し、空
間領域のインパルスを得る。この時インパルスの高さが
1となるように前記係数Aを調節する。
間領域のインパルスを得る。この時インパルスの高さが
1となるように前記係数Aを調節する。
【0004】 空間領域のインパルスを離散フーリエ
変換(DFT)を用いて空間周波数領域に変換する。
変換(DFT)を用いて空間周波数領域に変換する。
【0005】 空間周波数領域のデータに対して同じ
く空間周波数領域の視覚特性H(k,m)を掛ける。
く空間周波数領域の視覚特性H(k,m)を掛ける。
【0006】 このデータを逆離散フーリエ変換(I
DFT)を用いて空間領域に変換し、視覚特性による空
間インパルス応答を得る。
DFT)を用いて空間領域に変換し、視覚特性による空
間インパルス応答を得る。
【0007】 最後に、この空間インパルス応答を逆
直交変換することにより所定の直交変換領域に変換し、
直交変換領域における視覚特性を得る。この場合視覚特
性は複素数で表されるのでそのノルムを求め更に前記係
数Aで正規化することにより直交変換領域における正規
化された視覚特性が得られる。
直交変換することにより所定の直交変換領域に変換し、
直交変換領域における視覚特性を得る。この場合視覚特
性は複素数で表されるのでそのノルムを求め更に前記係
数Aで正規化することにより直交変換領域における正規
化された視覚特性が得られる。
【0008】表1は8×8のブロックにおいて、視距離
LをL=1024(画素)とし、直交変換として離散余
弦変換(DCT)を用いた場合のDCTにおける視覚特
性の一例を示したものである。
LをL=1024(画素)とし、直交変換として離散余
弦変換(DCT)を用いた場合のDCTにおける視覚特
性の一例を示したものである。
【0009】
【表1】
【0010】
【発明が解決しようとする課題】しかしながら、従来の
変換方式をブロック直交変換領域に応用した場合、本来
多数のブロックに広がるはずの視覚特性による空間イン
パルス応答が1つのブロックに折り返され、正確なイン
パルス応答が得られなくなり、従って正確な視覚特性の
変換が出来なくなるという問題点があった。
変換方式をブロック直交変換領域に応用した場合、本来
多数のブロックに広がるはずの視覚特性による空間イン
パルス応答が1つのブロックに折り返され、正確なイン
パルス応答が得られなくなり、従って正確な視覚特性の
変換が出来なくなるという問題点があった。
【0011】この発明は以上述べた視覚特性による空間
インパルス応答が1つのブロックに折り返される結果正
確なインパルス応答が得られなくなり、従って正確な視
覚特性の変換が出来なくなるというブロック分割による
視覚特性への悪影響を除去し視覚特性を正確に変換する
変換方式を提供することを目的とする。
インパルス応答が1つのブロックに折り返される結果正
確なインパルス応答が得られなくなり、従って正確な視
覚特性の変換が出来なくなるというブロック分割による
視覚特性への悪影響を除去し視覚特性を正確に変換する
変換方式を提供することを目的とする。
【0012】
【課題を解決するための手段】この発明は前記課題を解
決するために、(a)空間領域中のM×Nの空間インパ
ルスをmM×nNに領域拡張し、(m,n,M,N:正
の整数) (b)前記領域拡張された空間インパルスを
空間周波数領域に変換し、(c)前記空間周波数領域に
変換された空間インパルスに空間周波数領域における視
覚特性を乗じ、空間領域に逆変換して空間インパルス応
答を求め、(d)前記空間インパルス応答をブロック直
交変換領域に変換し、各ブロックの同一成分のノルム値
を求め、(e)前記空間インパルスをブロック直交変換
領域に変換し、各成分の絶対値を求め、(f)前記空間
インパルス応答のノルム値と前記空間インパルスの絶対
値との比によりブロック直交変換領域における視覚特性
を求めることを特徴とする。
決するために、(a)空間領域中のM×Nの空間インパ
ルスをmM×nNに領域拡張し、(m,n,M,N:正
の整数) (b)前記領域拡張された空間インパルスを
空間周波数領域に変換し、(c)前記空間周波数領域に
変換された空間インパルスに空間周波数領域における視
覚特性を乗じ、空間領域に逆変換して空間インパルス応
答を求め、(d)前記空間インパルス応答をブロック直
交変換領域に変換し、各ブロックの同一成分のノルム値
を求め、(e)前記空間インパルスをブロック直交変換
領域に変換し、各成分の絶対値を求め、(f)前記空間
インパルス応答のノルム値と前記空間インパルスの絶対
値との比によりブロック直交変換領域における視覚特性
を求めることを特徴とする。
【0013】
【作用】この発明によれば、M×Nのブロックサイズの
空間インパルスを有する空間領域をブロックサイズに応
じて設定可変な拡張倍率m,nによりm・M×n・Nの
領域に拡張する際に、空間インパルス応答に折り返しが
生じないように拡張倍率を選択すると共に該拡張領域に
於いて前記空間インパルスのピーク点を空間の中央付近
に配置し、該拡張領域において空間周波数領域に変換さ
れたのち視覚特性が付与されブロック直交変換された空
間インパルスのノルム値とブロック直交変換された空間
インパルスの絶対値との比を求め、これによりブロック
直交変換領域における視覚特性を求めており、前記空間
インパルスの折り返しによる歪みの生じない正確な視覚
特性の変換を可能としている。
空間インパルスを有する空間領域をブロックサイズに応
じて設定可変な拡張倍率m,nによりm・M×n・Nの
領域に拡張する際に、空間インパルス応答に折り返しが
生じないように拡張倍率を選択すると共に該拡張領域に
於いて前記空間インパルスのピーク点を空間の中央付近
に配置し、該拡張領域において空間周波数領域に変換さ
れたのち視覚特性が付与されブロック直交変換された空
間インパルスのノルム値とブロック直交変換された空間
インパルスの絶対値との比を求め、これによりブロック
直交変換領域における視覚特性を求めており、前記空間
インパルスの折り返しによる歪みの生じない正確な視覚
特性の変換を可能としている。
【0014】
【実施例】以下、本発明の一実施例を図面を参照しなが
ら詳述する。
ら詳述する。
【0015】図1は本発明の一実施例を示す装置の機能
ブロック図であり、図1において、入力101はM×N
のブロックサイズ(M,Nは高速変換等の都合上M,N
=2P と設定されることが多い)の空間インパルスであ
る。このインパルスのピーク点は後述のインパルス応答
の特性を考慮してブロックの中央付近に置かれる。
ブロック図であり、図1において、入力101はM×N
のブロックサイズ(M,Nは高速変換等の都合上M,N
=2P と設定されることが多い)の空間インパルスであ
る。このインパルスのピーク点は後述のインパルス応答
の特性を考慮してブロックの中央付近に置かれる。
【0016】空間領域拡張手段1は、前記入力101の
M×Nのブロックを中心として空間領域をmM×nNの
領域に拡張する。但し、m,nは正の整数で、インパル
ス応答に折り返しが生じないようにブロックサイズに応
じた好適な値が後述のように選択される。
M×Nのブロックを中心として空間領域をmM×nNの
領域に拡張する。但し、m,nは正の整数で、インパル
ス応答に折り返しが生じないようにブロックサイズに応
じた好適な値が後述のように選択される。
【0017】離散フーリエ変換(DFT)手段2は、拡
張されたmM×nNの空間領域102を空間周波数領域
に変換する。
張されたmM×nNの空間領域102を空間周波数領域
に変換する。
【0018】視覚特性付加手段3は、空間周波数領域に
変換された空間インパルス103に視覚特性テーブル9
から出力される空間周波数領域における視覚特性111
を乗算する。
変換された空間インパルス103に視覚特性テーブル9
から出力される空間周波数領域における視覚特性111
を乗算する。
【0019】逆離散フーリエ変換(IDFT)4は、視
覚特性が付加され空間周波数領域に変換された空間イン
パルス104を再び空間領域に変換する。この結果、視
覚特性による空間インパルス応答105が得られる。
覚特性が付加され空間周波数領域に変換された空間イン
パルス104を再び空間領域に変換する。この結果、視
覚特性による空間インパルス応答105が得られる。
【0020】ブロック直交変換手段5は前記空間インパ
ルス応答105をM×Nのブロック直交変換領域に変換
すると共に前記空間インパルス入力101を1ブロック
のみブロック直交変換する。
ルス応答105をM×Nのブロック直交変換領域に変換
すると共に前記空間インパルス入力101を1ブロック
のみブロック直交変換する。
【0021】ノルム演算手段6は、ブロック直交変換さ
れた前記各ブロックの同一成分106のノルム演算を行
い、絶対値手段7は直交変換された前記空間インパルス
108の絶対値演算を行う。
れた前記各ブロックの同一成分106のノルム演算を行
い、絶対値手段7は直交変換された前記空間インパルス
108の絶対値演算を行う。
【0022】比較正規化手段8は視覚特性の付加された
空間インパルスの直交変換値107と空間インパルスの
直交変換値109との比を取り必要に応じて正規化を行
いブロック直交変換領域における視覚特性110を出力
する。
空間インパルスの直交変換値107と空間インパルスの
直交変換値109との比を取り必要に応じて正規化を行
いブロック直交変換領域における視覚特性110を出力
する。
【0023】次に視覚特性のブロック直交変換領域への
変換方式の詳細および手順を図2を参照して説明する。
変換方式の詳細および手順を図2を参照して説明する。
【0024】 先ずM×Nのブロックサイズの空間イ
ンパルス[X(k,l)]31を入力する。但し[・]
は行列を表し、k,lは0≦k<M,0≦l<Nの離散
値をとる。
ンパルス[X(k,l)]31を入力する。但し[・]
は行列を表し、k,lは0≦k<M,0≦l<Nの離散
値をとる。
【0025】
【数1】
【0026】 前記空間インパルス[X(k,l)]
が中央となるように空間を(m×n)倍に拡張し(但し
m,n≧1)、拡張された領域のデータを全て“0”と
する。尚、拡張倍率m,nは例えばM,N=8の場合
m,n≧3、M,N=16の場合m,n≧2、M,N≧
32の場合m,n≧1とすると空間インパルス応答が1
つのブロックに折り返されることのない良好な結果が得
られる。
が中央となるように空間を(m×n)倍に拡張し(但し
m,n≧1)、拡張された領域のデータを全て“0”と
する。尚、拡張倍率m,nは例えばM,N=8の場合
m,n≧3、M,N=16の場合m,n≧2、M,N≧
32の場合m,n≧1とすると空間インパルス応答が1
つのブロックに折り返されることのない良好な結果が得
られる。
【0027】 領域拡張された空間インパルス32を
離散フーリエ変換(DFT)する。このDFTは次式
(2)で表される。
離散フーリエ変換(DFT)する。このDFTは次式
(2)で表される。
【0028】
【数2】
【0029】 [F(u,v)]33に視覚特性のD
FT値[HF (u,v)]34を掛けこの値35を逆離
散フーリエ変換(IDFT)し空間領域に戻す。このI
DFTは次式(3)で表される。得られた[XH (k,
l)]36は前記空間インパルスの視覚特性による応答
となる。
FT値[HF (u,v)]34を掛けこの値35を逆離
散フーリエ変換(IDFT)し空間領域に戻す。このI
DFTは次式(3)で表される。得られた[XH (k,
l)]36は前記空間インパルスの視覚特性による応答
となる。
【0030】
【数3】
【0031】 前記インパルス応答[XH (k,
l)]に対してM×Nのブロック直交変換を施すと共に
前記空間インパルス[X(k,l)]も同様にブロック
直交変換する。このブロック直交変換はそれぞれ次式
(4)、(5)で表される。但し、式(4)における
(i,j)はブロック番号を表し、[C]は任意の直交
変換関数行列であり[Ct ]はその転置行列である。
l)]に対してM×Nのブロック直交変換を施すと共に
前記空間インパルス[X(k,l)]も同様にブロック
直交変換する。このブロック直交変換はそれぞれ次式
(4)、(5)で表される。但し、式(4)における
(i,j)はブロック番号を表し、[C]は任意の直交
変換関数行列であり[Ct ]はその転置行列である。
【0032】 [CH (i,j) (u,v) ]=[Ct ]・[XH (i・M+k,j ・ N+l)]・[C] (4) [CX (u,v) ]=[Ct ]・[X(k,l) ]・[C] (5) [CH (i,j) (u,v) ]37は[CX (u,v) ]39の
視覚特性を示しているが、視覚特性の画像圧縮、評価へ
の応用を考えて[CH (i,j) (u,v) ]の各ブロックの同
一成分のノルム‖CH (u,v) ‖を次式(6)により対象
となる行列の各要素の絶対値の二乗和の平方根として定
義し、[‖CH (u,v) ‖]38を求めると共に[C
X (u,v) ]の各要素の絶対値からなる[|CX (u,v)
|]40を求める。
視覚特性を示しているが、視覚特性の画像圧縮、評価へ
の応用を考えて[CH (i,j) (u,v) ]の各ブロックの同
一成分のノルム‖CH (u,v) ‖を次式(6)により対象
となる行列の各要素の絶対値の二乗和の平方根として定
義し、[‖CH (u,v) ‖]38を求めると共に[C
X (u,v) ]の各要素の絶対値からなる[|CX (u,v)
|]40を求める。
【0033】
【数4】
【0034】 最後に、式(7)で与えられる[‖C
H (u,v) ‖]と[|CX (u,v) |]との各要素間の比を
求め、ブロック直交変換領域における視覚特性とする。
視覚特性[HC ]41は必要に応じて正規化、あるいは
K倍することが可能である。 HC (u,v) =‖CH (u,v) ‖/|CX (u,v) | (7) L=1024,S=3,M,N=8,m,n=3の場合
の視覚特性をブロック余弦変換領域に変換した例を表2
から表5に示す。表2は空間インパルス応答[XH ]を
示したものであり、表3は[XH ]をブロック余弦変換
した[CH ]を示したものである。表4は空間インパル
スをブロック余弦変換した[Cx ]を示し、表5はブロ
ック余弦変換領域における視覚特性[HC ]である。
H (u,v) ‖]と[|CX (u,v) |]との各要素間の比を
求め、ブロック直交変換領域における視覚特性とする。
視覚特性[HC ]41は必要に応じて正規化、あるいは
K倍することが可能である。 HC (u,v) =‖CH (u,v) ‖/|CX (u,v) | (7) L=1024,S=3,M,N=8,m,n=3の場合
の視覚特性をブロック余弦変換領域に変換した例を表2
から表5に示す。表2は空間インパルス応答[XH ]を
示したものであり、表3は[XH ]をブロック余弦変換
した[CH ]を示したものである。表4は空間インパル
スをブロック余弦変換した[Cx ]を示し、表5はブロ
ック余弦変換領域における視覚特性[HC ]である。
【0035】
【表2】
【0036】
【表3】
【0037】
【表4】
【0038】
【表5】
【0039】
【発明の効果】以上説明したように、本発明によれば視
覚特性の空間インパルス応答を正確に表現し、この空間
インパルス応答の広がりによる周囲ブロックへの影響を
適切に表現しているので、適切な視覚特性のブロック直
交変換領域への変換が実現出来る。
覚特性の空間インパルス応答を正確に表現し、この空間
インパルス応答の広がりによる周囲ブロックへの影響を
適切に表現しているので、適切な視覚特性のブロック直
交変換領域への変換が実現出来る。
【0040】また、画像圧縮符号化装置等では画像の視
覚特性に適した量子化法または符号化法は重要な役割を
果たしているので正確な視覚特性を用いることにより画
像の圧縮符号化効率を大幅に向上させることが可能とな
り、また画像の品質向上も可能となる。
覚特性に適した量子化法または符号化法は重要な役割を
果たしているので正確な視覚特性を用いることにより画
像の圧縮符号化効率を大幅に向上させることが可能とな
り、また画像の品質向上も可能となる。
【図1】本発明の一実施例を示す装置の機能ブロック図
である。
である。
【図2】本発明の変換方式の説明図である。
【図3】従来方式の説明図である。
1 空間領域拡張手段 2 DFT手段 3 視覚特性付加手段 4 IDFT手段 5 ブロック直交変換手段 6 ノルム演算手段 7 絶対値演算手段 8 比較・正規化手段 9 視覚特性テーブル
Claims (1)
- 【請求項1】(a)空間領域中のM×Nの空間インパル
スをmM×nNに領域拡張し、(m,n,M,N:正の
整数) (b)前記領域拡張された空間インパルスを空間周波数
領域に変換し、 (c)前記空間周波数領域に変換された空間インパルス
に空間周波数領域における視覚特性を乗じ、空間領域に
逆変換して空間インパルス応答を求め、 (d)前記空間インパルス応答をブロック直交変換領域
に変換し、各ブロックの同一成分のノルム値を求め、 (e)前記空間インパルスをブロック直交変換領域に変
換し、各成分の絶対値を求め、 (f)前記空間インパルス応答のノルム値と前記空間イ
ンパルスの絶対値との比によりブロック直交変換領域に
おける視覚特性を求めることを特徴とする視覚特性のブ
ロック直交変換領域への変換方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26205091A JP2642545B2 (ja) | 1991-10-09 | 1991-10-09 | 視覚特性のブロック直交変換領域への変換方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26205091A JP2642545B2 (ja) | 1991-10-09 | 1991-10-09 | 視覚特性のブロック直交変換領域への変換方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH06113278A JPH06113278A (ja) | 1994-04-22 |
JP2642545B2 true JP2642545B2 (ja) | 1997-08-20 |
Family
ID=17370342
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP26205091A Expired - Fee Related JP2642545B2 (ja) | 1991-10-09 | 1991-10-09 | 視覚特性のブロック直交変換領域への変換方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2642545B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0951504A (ja) * | 1995-08-03 | 1997-02-18 | Matsushita Electric Ind Co Ltd | 画像符号化装置及び画像復号化装置 |
-
1991
- 1991-10-09 JP JP26205091A patent/JP2642545B2/ja not_active Expired - Fee Related
Non-Patent Citations (1)
Title |
---|
IEEE TRANSACTIONS ON COMMUNICATIONS VOL.COM−33〜6!(1985)P.551−557 |
Also Published As
Publication number | Publication date |
---|---|
JPH06113278A (ja) | 1994-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Neelamani et al. | JPEG compression history estimation for color images | |
JP4001935B2 (ja) | データ圧縮を用いたランダムノイズのフィルタリング装置 | |
EP0999521A2 (en) | High precision sub-pixel spatial alignment of digital images | |
Moulines et al. | Central Limit Theorem for the log-regression wavelet estimation of the memory parameter in the Gaussian semi-parametric context | |
JP2004506990A (ja) | 変換係数の整数近似方法ならび符号器および復号器 | |
JP3302731B2 (ja) | 画像拡大方法 | |
JP2642545B2 (ja) | 視覚特性のブロック直交変換領域への変換方法 | |
Berg et al. | An efficient structure and algorithm for image representation using nonorthogonal basis images | |
JP3107609B2 (ja) | 視覚特性のブロックオーバーラップ直交変換領域への変換方式 | |
JP3198996B2 (ja) | 直交変換符号化画像の画像サイズ変換方法 | |
Caporale et al. | Frequency warping biorthogonal frames | |
Asiryan et al. | Image Compression Using Discrete Weyl-Heisenberg Transform | |
Mukhopadhyay | Image resizing in the compressed domain | |
US6567568B1 (en) | Pixel interpolating device capable of preventing noise generation | |
Anker et al. | Wave equation on general noncompact symmetric spaces | |
JP2916607B2 (ja) | 画像拡大装置 | |
US7711204B2 (en) | 1-D image restoration using a sliding window method | |
JP3775180B2 (ja) | 画像処理方法及び装置 | |
JPH1185971A (ja) | 階調変換方法および装置 | |
KR102645739B1 (ko) | 딥러닝을 이용한 임의배율 초해상도 시스템 및 이를 이용한 초해상화 방법 | |
Rajakumar et al. | Lossy image compression using multiwavelet transform for wireless transmission | |
Scholefield et al. | Accurate image registration using approximate Strang-Fix and an application in super-resolution | |
Minguillon et al. | Uniform quantization error for Laplacian sources with applications to JPEG standard | |
Takahashi et al. | An enlargement method of digital images based on Laplacian pyramid representation | |
Irfan et al. | A Novel Technique for Image Super Resolution Based on Sparse Representations and Compact Entity Extraction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 19970325 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080502 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090502 Year of fee payment: 12 |
|
LAPS | Cancellation because of no payment of annual fees |