[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JPH06168096A - データ符号化方式及びデータ復元方式 - Google Patents

データ符号化方式及びデータ復元方式

Info

Publication number
JPH06168096A
JPH06168096A JP4319579A JP31957992A JPH06168096A JP H06168096 A JPH06168096 A JP H06168096A JP 4319579 A JP4319579 A JP 4319579A JP 31957992 A JP31957992 A JP 31957992A JP H06168096 A JPH06168096 A JP H06168096A
Authority
JP
Japan
Prior art keywords
data
dictionary
encoding
lzw
jib
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4319579A
Other languages
English (en)
Other versions
JP3231105B2 (ja
Inventor
Yasuhiko Nakano
泰彦 中野
Yoshiyuki Okada
佳之 岡田
Shigeru Yoshida
茂 吉田
Hirotaka Chiba
広隆 千葉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP31957992A priority Critical patent/JP3231105B2/ja
Publication of JPH06168096A publication Critical patent/JPH06168096A/ja
Application granted granted Critical
Publication of JP3231105B2 publication Critical patent/JP3231105B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Processing (AREA)

Abstract

(57)【要約】 【目的】 本発明は、ジブ・レンペル符号によるユニバ
ーサル符号化を用いたデータ符号化方式とデータ復元方
式に関し、文字コードや白黒2値画像などの混在情報の
圧縮率を向上させることを目的とする。 【構成】 LZW符号器AとLZW符号器Bは、混在情
報から成る原データ110を、所定のブロック単位でそ
れぞれ大局辞書121、局在辞書131を用いてLZW
符号列(圧縮データA,圧縮データB)に変換・圧縮
し、それぞれの圧縮データA,BをバッファA150,
B160に格納する。局在辞書131は、各ブロックの
LZW符号化が終了する毎に初期設定される。圧縮率比
較器160は、圧縮データAと圧縮データBのデータ量
を比較し、データ量の少ない方の圧縮データをMPX1
70から選択出力させる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ジブ・レンペル符号を
用いたユニバーサル符号化によりデータを圧縮するデー
タ符号化方式、及びデータ復元方式に関する。
【0002】
【従来の技術】近年、OA(オフィシャル・オートメー
ション)の発達に伴い、一文書中に文字、図形、画像な
ど様々のメディアを混在して取り込めるようになってき
ている。そして、文字コードや白黒2値画像等の混在情
報が、それらのレイアウト情報とともに、文書データと
してG4ファクシミリや光ディスクファイル・システム
などで扱われるようになってきており、それらの情報の
データ量も急速に増加してきている。これらのマルチメ
ディアから成る文書情報をディジタルデータとして利用
するとき、一般に、画像情報のデータ量は文字コードの
データ量に比較して10倍〜数10倍と多くなる。この
ため、データ蓄積やデータ伝送等で、画像情報を扱うと
きは、それらの処理を効率良く行うために、データの中
の冗長な部分を省いてデータ量を圧縮することにより、
記憶容量の削減や伝送の効率化を図っている。
【0003】しかしながら、大容量のファイルシステム
や文書データベースでは、文書データ中の文字コード情
報も全体として大きなものとなるため、画像情報のみな
らず文字コード情報の圧縮も必要となってくる。
【0004】文字コードや画像データなどの様々のデー
タを一つの方式でデータ圧縮できる方法として、ユニバ
ーサル符号化方式が知られており、その代表的な方法と
してジブ・レンペル符号(宗像清治、「Ziv-Lempelのデ
ータ圧縮法」、情報処理、Vol.26,No.1,Jan.1985年参
照)がある。
【0005】このジブ・レンペル符号には、 ユニバーサル型と 増分分解型(Incremental Paring) の2つのアルゴリズムがある。
【0006】さらに、ユバーサル型アルゴリズムの改良
として、LZW符号がある(T.C. Bell,"Better OPM/L T
ext Compression",IEEE Trans. on Commun., Vol.COM-3
4,No.12,Dec.1986参照)。
【0007】また、増分分解型アルゴリズムにも、その
改良型として、LZW符号がある(T.A. Welch,"A Techn
ique for High-Performance Data Compression",Comput
er,June 1984 参照)。
【0008】これらの符号化方式の内、高速処理ができ
ることと、アルゴリズムが簡単であることから、最近
は、LZW符号が、記憶装置に格納するファイルの圧縮
などに使用されるようになってきている。
【0009】ここで、上記ユニバーサル符号化な代表的
な方法であるジブ・レンペル符号のユニバーサル型及び
増分分解型の2つのアルゴリズムについて説明する。 1.ユニバーサル型のアルゴリズム このアルゴリズムは、演算量が多いが、高い圧縮率が得
られるものであり、符号化するデータを、過去のデータ
系列の任意の位置から一致する最大長の系列(部分列)
に区切り、過去の系列の複製として符号化する方法であ
る。
【0010】このようなユニバーサル型ジブ・レンペル
符号の符号化の基本概念を図15(a) に示す。同図(a)
に示すPバッファには過去のデータ系列である既に符号
化済みの入力データ「・・・abc・・・」が格納され
ている。一方、Qバッファにはこれから符号化するデー
タ(文字列)「abcdef」が入力・格納されてい
る。
【0011】このような状態において、Qバッファ内の
データを符号化する際には、Qバッファのデータ系列を
キーとしてPバッファ内のデータ系列を走査し、Pバッ
ファ内でQバッファ内のデータ系列に一致する最大長の
部分列(同図(a) の例では「abc」)を求める。そし
て、Pバッファ中のこの最大長の部分列を指定するため
に、同図(b) に示す形式の情報の組を符号化する。この
情報の組は、「Pバッファ中における最大一致系列の開
始位置」(同図(a) の例では「a」のアドレス)、「一
致する長さ」(同図(a) の例では「3」)、及び「次の
シンボル」(同図(a) の例では「d」)の3個の情報か
らなる。
【0012】続いて、このQバッファ内の符号化した系
列(この場合、「abc」)をPバッファ内に移動・格
納して新たな過去のデータ系列を得る。以下、Qバッフ
ァ内の残りのデータ系列「def」についても、同様の
操作を繰り返し、Qバッファ内の残りのデータ系列をP
バッファ内に既に格納されている部分列に分解し、上述
のようにして符号化すると共に、Pバッファ内のデータ
系列を更新する。
【0013】2.増分分解型のアルゴリズム このアルゴリズムは、圧縮率はユニバーサル型より劣る
が、アルゴリズムが簡単であり、計算も容易であること
から高速処理ができる。
【0014】このアルゴリズムの代表的な方法であるL
ZW符号化の方法を、図16に示すフローチャート、図
17に示す辞書(学習辞書)、及び図18に示すデータ
変換の模式図を用いて説明する。
【0015】LZW符号化は、書き替え可能な辞書(学
習用辞書)を1個持ち、入力文字列を相異なる文字列
(部分列)に分け、これらの文字列を出現した順に参照
番号を付けて上記辞書に登録すると共に、現在入力して
いる文字列を、上記辞書に既に登録されている最大長の
一致する文字列に割り当てられた参照番号で表わすこと
により符号化するものである。尚、以後の説明では、情
報理論で用いられる呼称を踏襲し、データの1ワード単
位を文字と呼び、データが任意ワードつながったものを
文字列と呼ぶ。
【0016】LZW符号化処理では、まず、ステップS
1で、予め辞書DC に、全文字につき一文字から成る文
字列を登録する初期化を行う。即ち、例えば、一文字を
8ビットコードで符号化する場合には、最大256種類
の全文字につき一文字からなる文字列を、辞書DC のア
ドレス0〜255番地に初期登録する。これにより、例
えば図17に示すように、辞書DC のアドレス0、1、
2、・・・、255に、アルファベット「a」、
「b」、「c」、・・・や、ひらがな、カタカナ、数字
等が登録される。尚、同図の左側に示す文字列テーブル
B1は説明を容易なものとするために、補助的に示した
ものである。
【0017】以下の説明では、説明を分かり易くするた
めに、図18に示すような入力文字列が入力された場合
の例を取り上げて説明する。まず、ステップS1で、辞
書DC の書込用先頭アドレスnに、上記初期登録された
最後の文字列の格納アドレスの次のアドレスである「2
56」を、新たに登録する文字列の辞書DC への格納ア
ドレスとして設定する。
【0018】続いて、同じくステップS1で、入力され
た最初の文字Kをキーデータ(インデックス)として辞
書Dc を検索し、参照番号ω(辞書DC に登録されてい
る文字Kの参照番号)を求め、これを語頭文字列(prefi
x string) とする。これにより、入力文字列が、例え
ば、図18に示すような「ababcbababaaa
aaaa」であれば、最初の文字Kである「a」をイン
デックスとして辞書DCが検索され、「a」の参照番号
「0」が参照番号ωとして求められ、この参照番号
「0」が語頭文字列となる(図18の出力コードの欄を
参照)。
【0019】次に、ステップS2で、入力文字列の次の
文字Kを読む。これにより、上記最初の入力文字の
「a」の次の文字「b」が読み込まれる。続いて、ステ
ップS3で、文字Kがあるか否かを判別する。これは、
入力文字列がまだ終了していないか否かを判別する処理
である。
【0020】図18に示す入力文字列の場合は、上記ス
テップS2で、「a」の次の文字「b」が読み込まれる
ので文字列がまだ終了しておらず、したがって、ステッ
プS3ではYesと判断し、次にステップS4で、文字
列「ωK」が辞書DC に登録されてあるか否か検索す
る。
【0021】これにより、ステップS1で求められた語
頭文字列ω(ここでは参照番号「0」)に、ステップS
2で読み込んだ文字K(ここでは「b」)を加えた文字
列「0b」が、辞書DC 内に登録されているか否かが調
べられる。
【0022】そして、この検索で、Noであれば、ステ
ップS6に進み、ステップS1で得られている文字Kの
参照番号ωの符号「code(ω)」を出力し、また文字列
「ωK」に新たな参照番号nを付与して辞書DC のアド
レスnに登録する。
【0023】これにより、図18に示す入力文字列の場
合、まず、「a」の参照番号ωである「0」の符号が出
力され、さらに、検出されなかった文字列「0b」が参
照番号「256」が付与されて、辞書DC のアドレス2
56に登録される。
【0024】続いて、同じくステップS6で、上記ステ
ップS2で読み込んだ入力文字Kを参照番号ωに置き換
えると共に、辞書DC のアドレスnを「1」インクリメ
ントして、ステップS2に戻り次の文字Kを読み込む。
【0025】これにより、図18の入力文字列の例であ
れば、参照番号ωが「b」の参照番号である「1」に置
き換えられ、次回新たに登録される文字列の辞書DC
での登録アドレスnがインクリメントされて「257」
に変わる。
【0026】一方、ステップS4で文字列「ωK」が辞
書DC に登録されていれば、この場合は、ステップS5
に進んで、その文字列「ωK」を参照番号ωに置き換
え、再びステップS2に戻ってステップS4で文字列
「ωK」が辞書DC から探せなくなるまでステップS2
〜S5を繰り返し、最大一致長の文字列の検索を続け
る。
【0027】このような方法で行われるLZW符号化の
処理を、図18に示す入文字列「ababcbabab
aaaaaaa」を取り上げて具体的に説明すると、ま
ず、最初の文字「a」を入力したとき、辞書DC には
「a」の他に一致する文字列がないので、「a」に付与
された参照番号「0」の符号code(0)を出力する。そ
して、拡張した文字列「ab」に参照番号「256」を
付与して辞書DC に登録する。実際の辞書登録は図13
の右側に示すように文字列「0b」の形で登録される。
【0028】続いて、2番目の文字「b」が新たな検索
文字列の先頭になる。この場合、辞書DC には文字
「b」の他に一致する文字がないので文字「b」に付さ
れている「1」の参照番号の符号code(1)を出力し、
同時に拡張した文字列「ba」もまだ辞書DC に登録さ
れていないので、文字列「ba」を「1a」で表わし、
参照番号「257」を付与して辞書DC に登録する。そ
して、次は、3番目の文字「a」が次の検索文字列「ω
K」の先頭になる。以下同様に、このような処理を続け
ていくことにより、図18に示す入力文字列「abab
cbababaaaaaaa」が、同図の出力コード欄
に示す「0、1、256、2、257、260、0、2
62、263」の符号列に変換・出力され、この結果と
して、入力文字列が圧縮される。
【0029】次に、上述の如くLZW符号化された符号
データを復元するアルゴリズムを、図19のフローチャ
ートを用いて説明する。また、この復元の具体例とし
て、図18に示すLZW符号化された出力符号列「0、
1、256、257、260、0、262、263」
を、入力符号列として図20(a) に再掲して説明の補助
とする。
【0030】先ず、ステップS11では、この場合も上
記LZW符号化のときと同様に、辞書Dd に全文字につ
き一文字から成る文字列を初期登録する。これから説明
する上記具体例では、各一文字「a」,「b」,
「c」、・・・を、それぞれ参照番号「0」、「1」、
「2」、・・・を付与して辞書Dd に登録し、また、辞
書Dd の書込用先頭アドレスnに、上記初期登録された
最後の文字列の格納アドレスの次のアドレスである「2
56」を、新たに登録する文字列の辞書Dd への格納ア
ドレスnとして設定する。
【0031】次に、同じくステップS11で、最初の符
号CODEを読み込み、この符号CODEに対応する参
照番号をOLDωにセットする。これにより、図20
(a)示す入力符号列の例では最初の入力符号である参
照番号「0」の符号code(0)が読み込まれて、参照番
号「0」に変換された後、OLDωにセットされる。
【0032】続いて、同じくステップS11で、参照番
号「OLDω」に対応する文字Kを復元する。この処理
では、最初の入力符号CODEは上述のようにして辞書
Ddに初期登録された一文字の参照番号のいずれかに該
当することから、その入力符号CODEに一致する符号
code(K)を辞書Dd から探し出し、該当文字「K」を
出力する。尚、この出力した文字「K」は後に必要に応
じて行われる例外処理に備えてFINcharにもセットし
ておく。
【0033】これにより、図20(a) に示す入力符号列
の例では、最初に参照番号「0」に対応する文字「a」
が、復元・出力されると共に、FINcharにもセットさ
れる。
【0034】続いて、ステップS12で、次の入力符号
CODEを読み込む。すなわち、図20(a) に示す入力
符号列の例では、「1」の符号code(1)が読み込まれ
る。そして、ステップS13で、新たに読み込まれた符
号CODEが有るか否か、すなわち符号入力の終了の有
無を判別する。図20(a) に示す入力符号列の例では、
ステップS12で参照番号「1」の符号code(1)が新
たな入力符号CODEとして読み込まれる。
【0035】このように、新たな入力符号CODEがあ
れば、ステップS14に進んで、この入力符号CODE
に対応する参照番号「ω」をINωにセットする。これ
により、図20(a) に示す入力符号の例では、参照番号
「1」がINωにセットされる。
【0036】つぎに、ステップS15で、上記参照番号
「ω」が辞書Dd に既に登録されているか否か(ω≧
n)を判別する。この処理では、通常、読み込んだ符号
CODEは前回までの処理で、辞書Dd に既に登録され
ているから、ω<nであり、ステップS16に進んで、
辞書Dd を検索して、上記参照番号「ω」に対応する文
字列ω′Kを辞書Dd から読み出し、参照番号「ω」に
対応する文字列が二文字の文字列「ω′K」であるか否
か判別する。そして二文字の文字列「ω′K」であった
場合には、ステップS17で文字「K」を一時的にスタ
ックし、参照番号「ω′」を新たな参照番号ωとして再
度ステップS16に戻り、このステップS16、S17
の手順を再帰的に参照番号ωに対応する文字列が一文字
「K」に成るまで繰り返し、最後ステップS18に進ん
で、まず上記最後に復元した文字Kを出力した後、ステ
ップS17でスタックした全ての文字をLIFO(Last
In First Out) 形式でポップアップして出力する(上記
ステップS12で読み込んだ符号CODEの復元・出
力)。さらに、ステップS18において、上記復元文字
列の第一文字KをFINcharにセットした後、前回復元
処理した参照番号OLDωと今回復元した文字列の最初
の一文字Kとから組(OLDω、K)で表わされる文字
列を、新たな参照番号「n」を付与して辞書Dd のアド
レスnに登録する。続いて、アドレスnを「1」インク
リメントして、その「n+1」を次に辞書Dd に登録す
る文字列の登録アドレスnとして設定し、さらにINω
にセットされていた今回復元された符号CODEに対応
する参照番号「ω」をOLDωに代入して、ステップS
12に戻る。
【0037】これにより、図20(a) に示す入力符号の
場合には、同(b) に示すように、2番目に読み込まれた
参照番号「1」の符号CODE(=code(1))から文
字「b」が復元・出力され、この文字「b」がFINch
arにセットされると共に、前回復元処理した符号COD
E(=code(0))に対応する参照番号「0」と今回復
元した一文字「b」との連なりから成る文字列「0b」
が新たな参照番号「256」が付与されて辞書Dd に登
録される。
【0038】そして、辞書Dd の登録アドレスnが「2
57」に更新された後、OLDωには今回、復元された
符号CODE(=code(1))に対応する参照番号
「1」がセットされ、ステップS12で3番目の符号co
de(856)が読み込まれる。
【0039】そして、辞書Dd の検索により求められた
文字列「0b」から文字列「ab」への置き換えが行わ
れて、文字列「ab」が出力される。同時に、前回復元
処理した符号code(1)に対応する参照番号「1」と今
回復元した文字列の第一文字「a」とを組み合わせた文
字列「1a」(=「ba」)が、新たな参照番号「25
7」が付与されて辞書Dd のアドレス「257」に登録
される。
【0040】一方、上記のステップS15の判別で、読
み込んだ符号code(ω)が前回までの処理で辞書Dd に
登録されていない場合(ω≧n)は、ステップS19に
進んで例外処理を行う。この例外処理では、まず、前回
復元した文字列の第一文字「FINchar」を出力した
後、前回復元処理した符号CODEに対応する参照番号
「OLDω」を参照番号ωとしてセットした後に、上記
前回復元した文字列の第一文字「FINchar」を加えた
文字列「OLDω、FINchar」を求め、この新たな文
字列に対応する参照番号をINωにセットしてからステ
ップS16に進む。
【0041】このことにより、例えば、図20(a) に示
す入力符号列の場合では、6番目に入力する「260」
の符号code(260)に対応する参照番号「260」
は、この時点では辞書Dd に定義されていない。この場
合は、まず、ステップS19で、前回復元された符号co
de(257)に対応する文字列「bab」の第一文字
(FINchar)が出力された後、上記前回復元処理した
符号code(257)に対応する参照番号「257」に前
回復元した文字列「ba」の最初の一文字「b」を加え
た文字列「257b」を求め、この文字列に対し参照番
号「260」を付与し、この参照番号をINωにセット
する。そして、次に、ステップS16→S17の処理を
繰り返すことにより、「a」、「b」の順に1文字づつ
スタックする。そしてステップS18で、ポップアップ
操作により文字列「ab」を出力して、最終的に符号co
de(280)を「bab」の文字列に復元・出力すると
共に、上記文字列「257b」を参照番号「260」を
付与して辞書Dd に登録する(同図(b) 〜(e) 参照)。
【0042】以下、同様な処理を順次繰り返すことによ
り、図20(a) に示す入力符号列が同図(e) に示す文字
列に復元される。
【0043】
【発明が解決しようとする課題】上述したジブ・レンペ
ル符号化によるデータ圧縮は、他の方式に見られるよう
な対象データの統計的な性質や定常性を予め仮定して圧
縮を行う方法でなく、符号すると元の情報に完全に復元
されるという情報保存型のデータ圧縮方法であることか
ら、例えば文字コードや、プログラムのソースコードも
しくはブジェクトコードのように、完全な復元が要求さ
れるデータの圧縮に適している。
【0044】また、ジブ・レンペル符号は、任意の記号
列に直接適用できるので、画像データを、一定量のデー
タに分割して、そのデータを文字コード同様に扱えば、
画像データもジブ・レンペル符号化によって圧縮するこ
とができる。したがって、例えば文字コードと画像デー
タのように性質が異なる複数種類のデータが混在する情
報をジブ・レンペル符号化により圧縮することは可能で
ある。
【0045】しかし、従来のジブ・レンペル符号化によ
るデータ圧縮は、1個の辞書のみ用いて行っており、こ
の辞書を入力データを符号化しながら作成・更新してい
き、辞書の容量が一杯になると直ちに即クリア(初期
化)するか、または容量が一杯になった後、圧縮率が悪
化してきた場合にクリアして、再び辞書の登録を最初か
ら始めるという方法でデータの符号化を行っている。こ
のため、上記辞書の容量が小さいと入力データの局所的
な性質は促えられるものの、十分な学習が行えず入力デ
ータの圧縮率は余り上がらない。
【0046】一方、上記辞書の容量を余り大きくする
と、入力データの大局的な性質は促えられているものの
入力データの局所的な変化への対応が鈍くなり、この面
でデータ圧縮率が悪化するという問題があった。
【0047】本発明は、このような従来の問題的に鑑み
なされたものであり、登録容量が異なる複数の書き換え
可能な辞書を用いてジブ・レンペル符号化を行うことに
より、入力データの大局的な性質と局所的な変化に対応
した効率的なジブ・レンペル符号化を行い、ジブ・レン
ペル符号化によるデータ圧縮の圧縮率を向上させること
を目的とする。
【0048】
【課題を解決するための手段】図1は、本発明(第1の
発明)の原理図である。この第1の発明は、ジブ・レン
ペル符号を用いたユニバーサル符号化によりデータ圧縮
するデータ符号化方において、入力データがある特定の
一定区間にわたってジブ・レンペル符号化される毎に初
期設定が行われる第1の辞書1と、前記入力データの連
続する複数の前記一定区間にわたるジブ・レンペル符号
化過程で生成される辞書データを全て登録できる第2の
辞書2と、入力されるデータを前記第1の辞書1を用い
てジブ・レンペル符号化すると共に、このジブ・レンペ
ル符号化過程で生ずる新たな辞書データを前記第1の辞
書1に登録する第1の符号化手段3と、該第1の符号化
手段1に入力されるデータを前記第2の辞書2を用いて
ジブ・レンペル符号化すると共に、このジブ・レンペル
符号化過程で生ずる新たな辞書データを前記第2の辞書
2に登録する第2の符号化手段4と、前記一定区間毎
に、前記第1の符号化手段3により得られたジブ・レン
ペル符号列と前記第2の符号化手段4により得られたジ
ブ・レンペル符号列のデータ量を比較し、データ量が少
ない方のジブ・レンペル符号列をこの符号化に用いられ
た辞書を示すフラグと共に出力する圧縮データ出力手段
5と、を備えたことを特徴とする。
【0049】上記第1の発明において前記一定区間は、
例えば、請求項2記載のように前記第1の辞書1が初期
設定されてから前記第2の符号化手段4がジブ・レンペ
ル符号化したデータ数が「0」からある特定の個数にな
るまでの期間であるように定義してもよい。
【0050】また、さらには、前記一定区間は、例え
ば、請求項3記載のように、前記第1の辞書1が初期設
定されてから、その登録容量が一杯になるまでの期間で
あるように定義してもよい。
【0051】また、さらに、前記一定区間は、例えば請
求項4記載のように、前記第1の辞書1の登録容量が一
杯になってから、前記第1の符号手段3から出力される
ジブ・レンペル符号列の入力データに対する圧縮率があ
る下限値まで低下するまでの期間であるように定義して
もよい。
【0052】さらに、前記一定区間は、例えば、請求項
5記載のように、第1の符号化手段3と第2の符号化手
段4が1個のジブ・レンペル符号を出力する期間である
ように設定してもよい。
【0053】そして、上記のような、各種構成におい
て、前記第1の符号化手段3と前記第2の符号化手段4
は、並行して同一入力データのジブ・レンペル符号化を
行うような構成にしてもよい。
【0054】次に図2は、もう1つの本発明(第2の発
明)の原理図である。この第2の発明は、上記第1の発
明のデータ符号化方式によってジブ・レンペル符号化さ
れた圧縮データを復元する復元方式であって、圧縮デー
タがある特定の一定区間にわたって復元される毎に初期
設定される第1の辞書11と、前記圧縮データの連続す
る複数の前記一定区間にわたって復元過程で生成される
辞書データを登録できる第2の辞書12と、前記フラグ
を参照して、復元すべき圧縮データの圧縮の際に用いら
れた辞書が、上記第1の発明の前記第1の辞書1または
前記第2の辞書2のいずれかであるかを判断して、第1
の辞書11または第2の辞書12のいずれか一方を選択
し、この辞書を用いて前記圧縮データを復元すると共
に、必要に応じて上記辞書にこの復元により得られた辞
書データを登録する復元手段13と、を備えたことを特
徴とする。
【0055】この第2の発明は、上記構成において、例
えば、前記一定区間は、前記第1の辞書11が初期設定
されてから前記復元手段13により復元された復元デー
タのデータ長がある特定の値に等しくなるまでの期間で
あるように定義してもよい。
【0056】また、さらに、前記一定区間は、例えば、
請求項9記載のように、前記第1の辞書11が初期設定
されてから、その登録容量が一杯になるまでの期間であ
るように定義してもよい。
【0057】また、さらには、前記一定区間は、例え
ば、請求項10記載のように前記復元手段13が1つの
ジブ・レンペル符号を入力してから、このジブ・レンペ
ル符号を復元するまでの期間であるように定義してもよ
い。
【0058】そして、上記各種構成において、前記復元
手段13は、前記第1の辞書12を用いた前記圧縮デー
タの復元と前記第2の辞書12を用いた前記圧縮データ
の復元を、並行して同時に行うような構成にしてもよ
い。
【0059】
【作用】まず、図1に示す第1の発明においては、例え
ば、第1の辞書1及び第2の辞書2に、予めアルファベ
ット、かな、英数字等の1文字が対応するジブ・レンペ
ル符号と、対応付けられて登録されている(初期設
定)。
【0060】そして、データが入力されると、第1の符
号化手段3は第1の辞書1を、第2の符号化手段4は第
2の辞書2を参照して、その入力データに対応するジブ
・レンペル符号がそれぞれの辞書に登録されてあるか調
べる。そして、登録されてあれば、次のデータを入力
し、先の入力データに今度の入力データを加えた文字列
がそれぞれの辞書に登録されてあるか調べる。第1の符
号化手段1と第2の符号化手段2は、このような辞書
1,2の検索処理を、入力した文字列がそれぞれの辞書
に登録されていないことが分かるまで繰り返す。そし
て、第1の符号化手段1と第2の符号化手段2は、現在
までに入力した文字列がそれぞれの辞書1,2に登録さ
れていないことが分かると、前回までの入力文字列に対
応するジブ・レンペル符号を出力すると共に、今回まで
の入力文字列にまだ未使用のジブ・レンペル符号を割り
当て、それぞれの辞書1,2に登録すると共に、今度
は、今回入力した文字(最新の入力文字)を次にジブ・
レンペル符号化する文字列の先頭文字として、上述した
処理を繰り返す。
【0061】このような処理が、何度も繰り返される
と、第1及び第2の辞書1,2には、どんどん新たな文
字列が登録されてゆく。そして、やがて、容量が小さい
第1の辞書1の登録容量が一杯になる。
【0062】第1の辞書1がこのような状態になると、
第1符号化手段1は、所定のタインミングで、第1の辞
書1を、上述のように初期設定する。したがって、第1
の辞書1には、これから入力されるデータに対応する文
字列を再び登録されるようになる。
【0063】一方、容量の大きい第2の辞書2には、最
初の入力データから最新の入力データまでの文字列の中
に現れる未登録がどんどん登録されていく。このため、
第2の辞書2には、入力データの大局的な性質を示す多
量の文字列がどんどん蓄積される。
【0064】他方、第1の辞書1は、入力データの一定
区間毎に初期設定されて、新たな登録を開始するので、
登録される文字列は入力データの局所的な性質を反映し
たものとなる。したがって第1の辞書1は入力データの
性質(種類)の変化に対応し易く、入力データの性質が
変化した場合には、第1の辞書1を用いた方が第2の辞
書2を用いた場合よりも圧縮率が高くなる。
【0065】このため、第1の符号化手段3と第2の符
号化手段4から出力される入力データの圧縮データ(ジ
ブ・レンペル符号列)のデータ量を、上記一定区間毎に
比較して、よりデータ量の少ない圧縮データを選択出力
することにより、データの圧縮率を従来よりも向上させ
ることができる。また、圧縮手段5は、上記圧縮データ
の出力の際に、この圧縮データが第1の辞書1または第
2の辞書2のいずれの辞書を用いてジブ・レンペル符号
化されたものであるかを示すフラグも出力する。このこ
とにより、圧縮データの復元側は、復元時にどの辞書を
用いればよいのか、復元前に知ることができるので、入
力する圧縮データの復元を正しく行うことができる。
【0066】次に、図2に示す上記第2の発明において
は、まず、第1の辞書11と第2の辞書12が、上記第
1の発明の辞書11,12と同様に初期設定される。こ
の初期設定が終了すると、復元手段13は上記第1の発
明により生成された圧縮データの復元を開始する。この
圧縮データは、(フラグ、圧縮データ)の複数の組の系
列から成り、復元手段13は、まずフラグを入力して、
続いて入力する圧縮データが第1の辞書1または第2の
辞書2のいずれの辞書を用いて圧縮されたものであるか
を判断し、第1の辞書1の場合には第1の辞書11を、
第2の辞書2の場合には第2の辞書12を参照して、以
後入力する圧縮データを前記一定区間単位で復元してい
く。また、復元手段13は、この復元過程において、上
記第1の発明の第1の符号化手段3及び第2の符号化手
段4と同様にして、第1の辞書1及び第2の辞書2に、
未登録の復元データをそのジブ・レンペル符号と対応付
けて登録していく。また、復元手段13は、上記発明の
場合と同様に、一定区間のデータ復元が終了する毎に第
1の辞書11を初期設定する。したがって、この第1の
辞書11も、上記第1の発明の第1の辞書1と同様にし
て、登録と初期設定が行われる。したがって、復元手段
3は、上記第1の発明から出力される圧縮データを正確
に復元することができる。
【0067】
【実施例】以下、図面を参照しながら、本発明の実施例
を説明する。図3は、本発明の一実施例のデータ符号化
システムの基本構成図である。
【0068】同図において、原データ110は、文字コ
ード、画像情報等の複数種類の情報が混在したデータで
あり、1つのファイルに格納されている。また、LZW
符号化A系120は、原データ110のLZW符号化を
行うLZW符号器Aと大局辞書121とから成り、原デ
ータ110の大局的な性質を大局辞書121により学習
しながら、LZW符号器Aにより上記原データ110の
LZW符号化を行う。大局辞書121は、十分に大きな
辞書容量を持つ書き換え可能な辞書であり、LZW符号
器Aによる上記原データ110のLZW符号化の過程
で、原データ110の大局的な性質が反映された辞書と
成る。
【0069】一方、LZW符号化B系130は、原デー
タ110のLZW符号化を行うLZW符号器Bと局所辞
書131から成り、原データ110の各部の性質の変化
(局所的な変化)を局所辞書131により把握・学習し
ながら、上記原データ110のLZW符号化を行う。局
所辞書131は、上記大局辞書121よりも小さな辞書
容量を持つ書き換え可能な辞書であり、LZW符号器B
による上記原データ110のLZW符号化の過程で、あ
る特定の入力データ数(以後、ブロックと表現する)単
位で、何度もクリア(初期設定)されながら新登録を繰
り返すことにより、原データ110の局所的な変化に対
応した辞書と成る。
【0070】これらLZW符号化A系120とLZW符
号化B系130は、それぞれLZW符号器A、LZW符
号器Bにより原データ110のLZW符号化を上記ブロ
ック単位で並行して行い、それぞれのLZW符号化によ
り得られた上記原データ110の各ブロックの圧縮デー
タA、圧縮データBをそれぞれ、バッファA150、バ
ッファB160に格納する。圧縮率比較器160は、バ
ッファA150に格納されているLZW符号データのデ
ータ量とバッファB160に格納されているLZW符号
データのデータ量を基に、LZW符号器Aによる原デー
タ110の各ブロックのデータの圧縮率AとLZW符号
器Bによる原データ110の各ブロックのデータの圧縮
率Bを、同一ブロック同士で比較し、上記圧縮データA
と上記圧縮データBの内、圧縮率の高い方の圧縮データ
を選択する旨を選択信号aによりMPX(マルチプレク
サ)170に指示する。
【0071】MPX170は、上記圧縮率比較共通14
0から加わる上記選択信号aの指示に従って、上記バッ
ファA150または上記バッファB160のいずれか一
方に格納されているデータ量のより小さい方の圧縮デー
タを選択出力する。
【0072】MPX170は、上記圧縮データの選択出
力を、上記原データ110の各ブロック毎に行うので、
MPX170から出力される圧縮データは、離散した時
系列のデータとなる。また、MPX170は、圧縮デー
タを選択出力する際、その先頭に、上記圧縮データが大
局辞書121または局所辞書131のいずれの辞書を用
いて得られたものであるかを示す辞書フラグを付けて出
力する。
【0073】このMPX170から出力される圧縮デー
タ系列180の構成を図4に示す。同図に示す(辞書フ
ラグ181,圧縮データ182)の組は、上記圧縮率
A,Bを比較する原データ110のLZW符号化のブロ
ック単位(符号化ブロック単位)で、MPX170から
出力される。
【0074】続いて、本発明の一実施例のデータ符号化
(データ圧縮)方式のアルゴリズムを図5のフローチャ
ートを参照しながら説明する。尚、この例では、LZW
符号化A系120のLZW符号器AとLZW符号化B系
120のLZW符号器Bは、共に不図示の入力カウンタ
を備えている。この入力カウンタは、入力データである
原データ110の符号化単位である1ブロックのデータ
数(例えば、100Kバイト)を計数するために使用さ
れる減算カウンタである。また、原データ110からの
データ入力は、1バイト単位で行い、この1バイトデー
タを文字コード以外のデータ(例えば、画像情報)であ
っても1文字として取り扱い、複数の文字から成る入力
データを文字列と表現する。
【0075】まず、LZW符号器AとLZW符号器Bは
共に、それぞれの入力カウンタに、原データ110の符
号化単位である1ブロックのデータ数(ブロックサイ
ズ)を、初期値として設定する(ステップS701)。
【0076】続いて、LZW符号器AとLZW符号器B
は、該当入力ファイルから原データ110の最初のデー
タを入力する(ステップS702)。次に、LZW符号
器AとLZW符号器Bは、上記入力データが上記該当入
力ファイルの終了を示す「EOF」(End of File) であ
るか否か判別し(ステップS703)、「EOF」であ
れば全ての原データ110のLZW符号化が終了したの
で、直ちに処理を終了するが、入力データが「EOF」
でなければ、入力カウンタを「1」デクリメントして
(ステップS704)、このデクリメントされた入力カ
ウンタの値が「0」(CT=0)になったか否か判別す
る(ステップS705)。このステップS705の判別
処理は、原データ110におけるある1ブロックの入力
データのLZW符号化が終了したか否かを判別する処理
である。
【0077】この判別で、CT=0でないときは、LZ
W符号器AとLZW符号器Bは、原データ110のある
1ブロックデータのLZW符号化がまだ終了していない
ものと判断し、上記ステップS70で入力されたデータ
のLZW符号化を同時に並行して開始する(S70
6)。
【0078】この並列処理において、LZW符号器Aは
大局辞書121を用いて上記入力データのLZW符号化
を行い(ステップS707A)、LZW符号器Bは局所
辞書131を用いて上記入力データのLZW符号化を行
う(ステップS707B)。
【0079】そして、LZW符号器Aは、大局辞書Aに
上記入力データに対応するLZW符号が登録されていれ
ば(S708A,YES)、その入力データも加えた文
字列のLZW符号化を試みるため、再びステップS70
2に戻り、次のデータを入力する。
【0080】したがって、LZW符号器Aは、上記ステ
ップS708Aで入力データ(1文字または文字列)が
大局辞書121に登録されていないと判断するまで、上
記ステップS702〜S706、ステップS707A〜
S709Aを繰り返す。
【0081】そして、LZW符号器Aは、上記ステップ
S708Aで、大局辞書121に今までに入力されたデ
ータ列(文字列)が登録されていないと判別すると(S
7081A,NO)、前回のステップS707Aで大局
辞書121から読み出したLZW符号をバッファA16
0に格納すると共に、今回のステップS707Aで大局
辞書121に登録されていないことが判明した入力デー
タ(一文字または文字列)に新たなLZW符号を割り当
て、これらの(入力データ,LZW符号)の組を上記入
力データをインデックスとして大局辞書121に登録し
た後(ステップS709A)、再びステップS702に
戻り上記該当入力ファイルから次にLZW符号化すべき
原データ110の新たなデータの入力を開始する。
【0082】LZW符号器Aは、以上のような動作を、
前記ステップS705で入力カウンタ値が「0」、すな
わち原データの最初のブロックのLZW符号化が全て終
了したと判断するまで行って、原データ110の最初の
ブロックの全データをLZW符号化し、このLZW符号
化により得られた上記原データ110の最初のブロック
の全データの圧縮データA(LZW符号列)をバッファ
Aに格納する。
【0083】一方、LZW符号器Bも、LZW符号器A
と並行に、局所辞書131を用いて上述したLZW符号
器Aと同様な処理を行い、原データ110の最初のブロ
ックの全データをLZW符号化し、このLZW符号化に
より得られた上記原データ110の最初のブロックの全
データの圧縮データBをバッファB160に格納する
(ステップS702〜S706,ステップS707B〜
S709B)。
【0084】以上のようにして、LZW符号器AとLZ
W符号器Bが、並行処理により原データ110の最初の
ブロックのLZW符号化を終了すると(S705,YE
S)、圧縮率比較器140は、バッファA150に格納
されているLZW符号器Aにより生成された上記圧縮デ
ータAとバッファB160に格納されているLZW符号
器Bにより生成された上記圧縮データBの容量の大きさ
を比較し(ステップS710)、圧縮データAの容量が
圧縮データBの容量以下であれば(ステップS710,
YES)、MPX170に対し、圧縮データAの方を選
択する旨を選択信号aにより指示する。
【0085】MPX170は、この選択信号aを入力す
ると、まず大局辞書121を用いた圧縮データであるこ
とを示すフラグAを出力ファイルに出力した後(ステッ
プS712)、バッファA150に格納されている大局
辞書121を用いた圧縮データAを上記出力ファイルに
選択出力する(ステップS713)。
【0086】一方、圧縮率比較器140は、上記ステッ
プS710で、圧縮データBの方が圧縮データAよりも
容量が小さいと判断すると(ステップS710,N
O)、MPX170に対し、圧縮データBの方を選択出
力する旨を選択信号aにより指示する。
【0087】MPX170は、この選択信号aを入力す
ると、まず局所辞書131を用いた圧縮データであるこ
とを示すフラグBを上記出力ファイルに出力した後(S
713)、バッファB160に格納されている局所辞書
131を用いて得られた圧縮データBを上記出力ファイ
ルに選択出力する(S714)。
【0088】このようにして、(フラグ、圧縮データ)
の組から成る最初のブロックの圧縮データが出力され
る。以上の処理が、原データ110の第2ブロック以降
の各ブロックについてブロック単位で行われ、LZW符
号器A並びにLZW符号器Bが、上記該当入力ファイル
内の原データ110の全データについてLZW符号化に
よるデータ圧縮が終了したと判断すると(ステップS7
03,YES)、原データ110の全データのLZW符
号化を終了する。
【0089】このようにして、原データの各ブロック毎
に大局辞書121を用いたLZW符号器Aによる圧縮デ
ータAと局所辞書131を用いたLZW符号器Bによる
圧縮データBの作成が並行して行われ、各ブロック毎に
圧縮データAまたは圧縮データBのいずれか一方の圧縮
率の高い方の圧縮データがその圧縮に用いられた辞書を
示すフラグ(フラグAまたはフラグB)と共に上記出力
ファイルに格納される。
【0090】したがって、原データ110を、各ブロッ
クのデータの性質に応じて各ブロック毎に最適なLZW
符号化を行い、原データ110を非常に高い圧縮率で効
率よく圧縮することができる。
【0091】尚、上記実施例では、バッファA150と
バッファB150に格納されている圧縮データA,Bの
容量を比較して圧縮率の優劣を判断するようにしている
が、LZW符号化A系120並びにLZW符号化B系1
30内に圧縮率を算出する手段を設け、この手段が、圧
縮率比較器160に対し直接に、圧縮データA,Bのそ
れぞれの圧縮率A,Bを出力するような構成にしてもよ
い。
【0092】さらに、上記の場合には、多量の入力デー
タから成るブロック単位でデータ圧縮率の比較を行って
いるが、1回のLZW符号化毎に符号化された入力デー
タ列(検索一致文字列)のデータ長の比較を行い、デー
タ長の短い方のLZW符号を、逐次、圧縮データとして
出力していくような構成にしてもよい。
【0093】図6は、上記データ符号化方式により原デ
ータ110をブロック単位でLZW符号化する際の大局
辞書121と局所辞書131の使用方法の一例を示す図
である。
【0094】同図(a)は、上記データ符号化方式によ
り原データ110をブロック単位でLZW符号化してい
く過程での大局辞書121と局所辞書131の登録個数
の変化を示す図であり、横軸がLZW符号化したデータ
数(入力データ数)に、縦軸が大局辞書121及び局所
辞書122の登録個数に対応している。また、縦軸のL
T ,LK の各目盛は、それぞれ、大局辞書121及び局
所辞書131の登録容量を示している。
【0095】また、同図(b)は、同図(a)と同じデ
ータ符号化過程における大局辞書121を用いた場合と
局所辞書131を用いた場合での、各ブロック毎のデー
タ圧縮率の比較を示す図であり、横軸が同図(a)と同
じ入力データ数、縦軸が各ブロックでのデータ圧縮率に
対応している。
【0096】この図6に示す例では、LZW符号器B
は、局所辞書131への登録個数が各ブロックのLZW
符号化の途中で一杯になった場合には、辞書登録を直ち
に停止する。また、LZW符号器Bは、各ブロックのL
ZW符号化を開始する前に、たえず局所辞書131をク
リア(初期設定)する。
【0097】この局所辞書131のクリアは、例えば、
一文字から成る全文字を初期の辞書情報として登録する
初期化処理である。同図に示すように、1ブロック目の
LZW符号化においては、局所辞書131と大局辞書1
21の登録情報は同一であり、しかも局所辞書131の
登録個数が原データ110の1ブロック目のLZW符号
化過程の途中で満杯になるため、1ブロック目の圧縮率
は、大局辞書121を用いて得られるLZW符号器Aの
出力する圧縮データAの方が、局所辞書131を用いて
られるLZW符号器Bの出力する圧縮データBよりも、
少しばかり圧縮率が高くなる。
【0098】また、原データ110の2ブロック目及び
3ブロック目のLZW符号化では、大局辞書121を用
いて得られる圧縮データBの圧縮率の方が、局所辞書1
31を用いて得られる圧縮データAよりもさらに圧縮率
が高くなる。しかしながら、原データ110の4ブロッ
ク目のLZW符号化においては、入力データの性質が変
化したため、局所辞書131を用いて得られる圧縮デー
タBの方が大局辞書121を用いて得られる圧縮データ
Aよりも圧縮率が少しばかり高くなる。
【0099】したがって、MPX170から出力される
圧縮データ系列は、(フラグA,圧縮データA1 ,フラ
グA,圧縮データA2 ,フラグA,圧縮データA3 ,フ
ラグB,圧縮データB4 ・・・)となる。尚、圧縮デー
タAおよび圧縮データBに付した添字i(i=1,2,
3,4,・・・)は、ブロックiの圧縮データを示す番
号である。
【0100】このように、図6に示す例では、局所辞書
131の登録個数を各ブロックのLZW符号化の後半で
登録容量が飽和してしまうような小容量に設定し、大局
辞書121の方の登録個数は、複数ブロックにまたがっ
てLZW符号化を行っても登録容量が飽和してしまわな
いような大容量に設定している。ここで、局所辞書13
1の登録容量がブロックのLZW符号化過程の途中で満
杯になった場合の他の対処方法を図7及び図9に示す。
【0101】図7に示す例では、局所辞書131への登
録が一杯になったらば(飽和したならば)、登録文字を
登録する分解成分の木(ツリー:tree)の最下位層
(最下位レベル)の成分及びそれらの成分に(節)に接
続している枝に付けられた文字(図8に示すレベルの場
合には、レベル3に属するX3 ,X9 ,X8 の各成分及
びそれらの成分に接続している枝に付けられた文字)を
削除する枝刈り削除処理または各登録文字の参照頻度を
基に参照回数の少ない登録文字から優先的に削除する処
理を行って、登録用の空スペースを確保し、この空スペ
ースに以後の新規の文字を登録するようにする。尚、分
解成分の木の構成については、前掲した宗像「Ziv−
Lempelのデータ圧縮法」の3.1入力列のインク
リメンタル分解に詳細に説明されている。
【0102】一方、図9に示す例では、局所辞書131
の登録容量が一杯になったときには、LRU(Leastly
Recent Used)方式により、最も古く登録された文字列を
1つ削除して、その変わりに新規の文字列を登録するよ
うにする。
【0103】さらに、図10に示す例は、局所辞書13
1が各ブロックのLZW符号化の過程で、決して登録容
量が一杯にならないように(飽和しないように)、局所
辞書131の登録容量を予め十分な大きさに確保してお
くものである。このようにした場合、LZW符号器Bの
データ圧縮率は、上記他の各方式局所辞書131よりも
大抵の場合高くなる。
【0104】さらに、図11に示す例は、ブロックの途
中までしかLZW符号化が進行していない場合でも、局
所辞書131の登録容量が一杯になったら直ちに局所辞
書131をクリアし、その後新たな辞書登録を再開する
ものである。
【0105】そして、さらに、図12に示す例は、局所
辞書131の登録容量が一杯になったならば(飽和した
ならば)新たな辞書登録を停止し、その後、データ圧縮
率を監視し続け、データ圧縮率が所定の基準値よりも低
くなったときにはデータ圧縮率が悪化したと判断し、こ
の時点で局所辞書131をクリアし、その後、再び辞書
登録を再開するものである。
【0106】次に、上記データ符号化システムから出力
される図4に示す構成の圧縮データ系列を元のデータに
復元するデータ復元システムの基本構成を図13に示
す。LZW復元化A系220は、登録容量の大きい大局
辞書221と、この大局辞書221を用いて圧縮データ
170を復元するLZW復元器Aから成る。
【0107】また、LZW復元化B系230は、登録容
量の小さな局所辞書231と、この局所辞書231を用
いて、圧縮データ172を復元するLZW復元器Bから
成る。
【0108】これらLZW復元化系220とLZW復元
化系230は、圧縮データBの復元を同時に並行して行
う。上記LZW復元器A並びに上記LZW復元器Bは、
それぞれ大局辞書221、局所辞書321を用いて復元
した復元データA、復元データBをMPX(マルチプレ
クサ)250に出力する。
【0109】辞書フラグ判別器240は、圧縮データ系
列180の辞書フラグ181を入力し、この辞書フラグ
181により、現在、LZW復元化A系220とLZW
復元化B系230とで、並行して復元されている圧縮デ
ータ182の作成に用いられた辞書(大局辞書121ま
たは局所辞書131)を判断し、上記現在復元中の圧縮
データ182のLZW符号化に用いられた辞書を指示す
る選択信号dを上記MPX250に出力する。
【0110】MPX250は、辞書フラグ判別器240
から入力する選択信号dの指示に応じて、大局辞書12
1が指示されていればLZW復元器Aから出力される復
元データAを、一方局所辞書131が指示されていれば
LZW復元器Bから出力される復元データBを選択出力
する。
【0111】続いて、上記構成のデータ復元システムに
より行われる前記図3に示すデータ符号化システムから
出力される圧縮データ系列180(図4参照)の復元方
法を図14のフローチャートを参照しながら説明する。
【0112】まず、LZW復元器AとLZW復元器B
は、上記データ符号化システムにおける原データ110
の符号化のブロックサイズ(1ブロックのデータ数)を
それぞれが内蔵している入力カウンタに設定する(S8
01)。
【0113】続いて、辞書フラグ判別器240は、ファ
イル(前記データ符号化システムにより生成された出力
ファイル)から圧縮データ182の先頭データ(第1入
力データ)すなわち辞書フラグ181(図4参照)を読
み出す(ステップS802)。
【0114】次に、LZW復元器AとLZW復元器B
は、同時に上記ファイルから辞書フラグ181に続く圧
縮データ182の最初のデータを入力し(ステップS8
03)、この入力データが上記ファイルの終了を示す
「EOF」(End of File)であるか否か判別する(ステ
ップS804)。
【0115】そして、LZW復元器AとLZW復元器B
が上記入力データが「EOF」でないと判別すると(ス
テップS804,NO)、辞書フラグ判別器240が上
記先に入力した辞書フラグ181により、上記入力デー
タが大局辞書121または局所辞書131のいずれの辞
書を用いてLZW符号化されたのか判断し、LZW符号
化に用いられた方の該当辞書を指示する選択信号dをM
PX250に出力する。この間、LZW復元器AとLZ
W復元器Bは、上記入力データの復元をそれぞれ大局辞
書221と局所辞書321を用いて並行して行い、それ
ぞれ復元データA,BとしてMPX250に出力する。
【0116】MPX250は上記辞書フラグ判別器24
0から加わる選択信号dに応じて、復元データAまたは
復元データBのいずれか一方の該当するデータを選択出
力する。ところで、LZW復元器AとLZW復元器B
は、復元データが、それぞれの辞書221、231に未
登録であった場合には、(この復元データ、この復元デ
ータに対応するLZW符号)の組をそれぞれ辞書22
1、231に登録する(以上、ステップS805)。
【0117】続いて、LZW復元器AとLZW復元器B
は、それぞれ入力カウンタを復元データの文字数分だけ
デクリメントし、それぞれの上記入力カウンタに現在復
元中のブロック(現ブロック)の残りの復元データの文
字数をセットする(S807)。
【0118】そして、次にLZW復元器AとLZW復元
器Bは、それぞれの入力カウンタの値が「0」、すなわ
ち、現ブロックの復元が全て終了したか否かを判別する
(ステップS808)。
【0119】そして、LZW復元器AとLZW復元器B
は、それぞれの入力カウンタの値が「0」でなく、ま
だ、現ブロックの復元が未終了であると判断すると、
(ステップS808,NO)、再びステップS803に
戻って、前記ファイルから次のデータを入力し現ブロッ
クの残りのデータを復元する処理を繰り返す(ステップ
S803〜S808の繰り返し)。
【0120】そして、LZW復元器AとLZW復元器B
は、上記ステップS808で現ブロックの圧縮データ1
82の全てについてデータの復元が終了したと判断する
と(ステップS808,YES)、LZW復元器A,
B,辞書フラグ判別器240,及びMPX250が再び
上記ステップS801〜S808の処理を行い、LZW
復元器AとLZW復元器Bが上記ステップS804で上
記ファイルから「EOF」を読み出すまで前記ファイル
に格納されている次ブロック以降の残りの全てのブロッ
クの圧縮データを復元する。
【0121】そして、LZW復元器AとLXW復元器B
は上記ファイルに格納されている全ブロックの圧縮デー
タ182の復元が終了したと判断すると(ステップS8
04,YES)、圧縮データ182の復元処理を終了す
る。
【0122】このようにして、上述した前記図5のフロ
ーチャートに示すデータ符号化方式により、ブロック単
位でLZW符号化されて圧縮されたデータを、各ブロッ
クの圧縮データ182の先頭に付加された辞書フラグ1
81を参照しながら、ブロック単位で順次復元する。
【0123】
【発明の効果】請求項1及び請求項6記載の第1の発明
によれば、小容量の第1の辞書と大容量の第2の辞書の
容量が異なる2つの辞書を備え、小容量の第1の辞書は
入力データの一定区間毎に初期設定するので、第2の辞
書だけでは対応しにくい入力データの性質の局所的な変
化に対応した辞書情報を第1の辞書に登録でき、この結
果として、第1の辞書により入力データの大局的な性質
に適応したLZW符号化を行えると共に、第1の辞書に
より入力データの局所的な性質に対応したLZW符号化
を行うことができるため、文字コードや白黒画像データ
など性質の異なる複数種類のデータが混在している入力
データを、全体的に従来のLZW符号化によるデータ圧
縮よりも高い圧縮でデータ圧縮することが可能になる。
【0124】また、請求項7乃至請求項10記載の第2
の発明によれば上記第1の発明と同等の機能を有する第
1及び第2の辞書を備えているので、復元手段は、上記
第1の発明が各圧縮データに付加して出力する各圧縮デ
ータの作成に用いられた辞書を示すフラグを参照するこ
とにより、上記第1の発明により圧縮されたデータを、
該当する辞書を参照かつ更新・登録することにより元の
データに完全に復元することができる。
【図面の簡単な説明】
【図1】本発明の原理図(その1)である。
【図2】本発明の原理図(その2)である。
【図3】本発明の一実施例のデータ符号化システムの基
本構成図である。
【図4】本発明の圧縮データ系列の構成を説明する図で
ある。
【図5】本発明のデータ符号化方式(データ圧縮方式)
の一実施例のアルゴリズムを説明するフローチャートで
ある。
【図6】大局辞書と局所辞書の使用方法の第1の例を示
す図である。
【図7】局所辞書の使用方法の他の例を示す図(その
1)である。
【図8】登録文字を登録する分解成分の木の構成を示す
図である。
【図9】局所辞書の使用方法の他の例を示す図(その
2)である。
【図10】局所辞書の使用方法の他の例を示す図(その
3)である。
【図11】局所辞書の使用方法の他の例を示す図(その
4)である。
【図12】局所辞書の使用方法の他の例を示す図(その
5)である。
【図13】本発明の一実施例のデータ復元システムの基
本構成図である。
【図14】上記データ復元システムにより行われるデー
タ復元方式のアルゴリズムを説明するフローチャートで
ある。
【図15】ユニバーサル型ジブ・レンペル符号の符号化
の基本概念を説明する図である。
【図16】LZW符号化のアルゴリズムを説明するフロ
ーチャートである。
【図17】LZW符号化に用いられる辞書の構成を説明
する図である。
【図18】LZW符号化方法を説明する模式図である。
【図19】LZW符号の復元アルゴリズムを説明するフ
ローチャートである。
【図20】LZW符号の復元の一具体例を説明するため
の模式図である。
【符号の説明】
1,11 第1の辞書 2,12 第2の辞書 3 第1の符号化手段 4 第2の符号化手段 5 圧縮データ出力手段 13 復元手段
───────────────────────────────────────────────────── フロントページの続き (72)発明者 千葉 広隆 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 ジブ・レンペル符号を用いたユニバーサ
    ル符号化によりデータ圧縮するデータ符号化方におい
    て、 入力データがある特定の一定区間にわたってジブ・レン
    ペル符号化される毎に初期設定が行われる第1の辞書
    (1)と、 前記入力データの連続する複数の前記一定区間にわたる
    ジブ・レンペル符号化過程で生成される辞書データを全
    て登録できる第2の辞書(2)と、 入力されるデータを前記第1の辞書(1)を用いてジブ
    ・レンペル符号化すると共に、このジブ・レンペル符号
    化過程で生ずる新たな辞書データを前記第1の辞書
    (1)に登録する第1の符号化手段(3)と、 該第1の符号化手段(1)に入力されるデータを前記第
    2の辞書(2)を用いてジブ・レンペル符号化すると共
    に、このジブ・レンペル符号化過程で生ずる新たな辞書
    データを前記第2の辞書(2)に登録する第2の符号化
    手段(4)と、 前記一定区間毎に、前記第1の符号化手段(3)により
    得られたジブ・レンペル符号列と前記第2の符号化手段
    (4)により得られたジブ・レンペル符号列のデータ量
    を比較し、データ量が少ない方のジブ・レンペル符号列
    をこの符号化に用いられた辞書を示すフラグと共に出力
    する圧縮データ出力手段(5)と、 を備えたことを特徴とするデータ符号化方式。
  2. 【請求項2】 前記一定区間は、前記第1の辞書(1)
    が初期設定されてから前記第2の符号化手段(4)がジ
    ブ・レンペル符号化したデータ数が「0」からある特定
    の個数になるまでの期間であることを特徴とする請求項
    1記載のデータ符号化方式。
  3. 【請求項3】 前記一定区間は、前記第1の辞書(1)
    が初期設定されてから、その登録容量が一杯になるまで
    の期間とすることを特徴とするデータ符号化方式。
  4. 【請求項4】 前記一定区間は、前記第1の辞書(1)
    の登録容量が一杯になってから、前記第1の符号手段
    (3)から出力されるジブ・レンペル符号列の入力デー
    タに対する圧縮率がある下限値まで低下するまでの期間
    であることを特徴とする請求項1記載のデータ符号化
    式。
  5. 【請求項5】 前記一定区間は、第1の符号化手段
    (3)と第2の符号化手段(4)が1個のジブ・レンペ
    ル符号を出力する期間であることを特徴とする請求項1
    記載のデータ符号化方式。
  6. 【請求項6】 前記第1の符号化手段(3)と前記第2
    の符号化手段(4)は、並行して同一入力データのジブ
    ・レンペル符号化を行うことを特徴とする請求項1,
    2,3,4または5記載のデータ符号化方式。
  7. 【請求項7】 請求項1記載のデータ符号化方式によっ
    てジブ・レンペル符号化された圧縮データを復元するデ
    ータ復元方式であって、 圧縮データがある特定の一定区間にわたって復元される
    毎に初期設定される第1の辞書(11)と、 前記圧縮データの連続する複数の前記一定区間にわたる
    復元過程で生成される辞書データを登録できる第2の辞
    書(12)と、 前記フラグを参照して、復元すべき圧縮データの圧縮の
    際に用いられた辞書が前記第1の辞書(1)または前記
    第2の辞書(2)のいずれかであるかを判断して、前記
    第1の辞書(11)または前記第2の辞書(12)のい
    ずれか一方の辞書を選択し、この選択した辞書を用いて
    前記圧縮データを復元すると共に、必要に応じて上記辞
    書にこの復元により得られた辞書データを登録する復元
    手段(13)と、 を備えたことを特徴とするデータ復元方式。
  8. 【請求項8】 前記一定区間は、前記第1の辞書(1
    1)が初期設定されてから前記復元手段(13)により
    復元された復元データのデータ長がある特定の値に等し
    くなるまでの期間であることを特徴とする請求項7記載
    のデータ復元方式。
  9. 【請求項9】 前記一定区間は、前記第1の辞書(1
    1)が初期設定されてから、その登録容量が一杯になる
    までの期間であることを特徴とする請求項7記載のデー
    タ復元方式。
  10. 【請求項10】 前記一定区間は、前記復元手段(1
    3)が1つのジブ・レンペル符号を入力してから、この
    ジブ・レンペル符号を復元するまでの期間であることを
    特徴とする請求項7記載のデータ復元方式。
  11. 【請求項11】 前記復元手段(13)は、前記第1の
    辞書(12)を用いた前記圧縮データの復元と前記第2
    の辞書(12)を用いた前記圧縮データの復元を、並行
    して同時に行うことを特徴とする請求項7,8,9,ま
    たは10記載のデータ復元方式。
JP31957992A 1992-11-30 1992-11-30 データ符号化方式及びデータ復元方式 Expired - Fee Related JP3231105B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP31957992A JP3231105B2 (ja) 1992-11-30 1992-11-30 データ符号化方式及びデータ復元方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP31957992A JP3231105B2 (ja) 1992-11-30 1992-11-30 データ符号化方式及びデータ復元方式

Publications (2)

Publication Number Publication Date
JPH06168096A true JPH06168096A (ja) 1994-06-14
JP3231105B2 JP3231105B2 (ja) 2001-11-19

Family

ID=18111845

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31957992A Expired - Fee Related JP3231105B2 (ja) 1992-11-30 1992-11-30 データ符号化方式及びデータ復元方式

Country Status (1)

Country Link
JP (1) JP3231105B2 (ja)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0788239A2 (en) * 1996-01-31 1997-08-06 Hitachi, Ltd. Method of and apparatus for compressing and decompressing data and data processing apparatus and network system using the same
JP2002314821A (ja) * 2001-04-18 2002-10-25 Ricoh Co Ltd 画像圧縮方法、画像伸張方法、画像圧縮装置及び画像伸張装置
JP2003333341A (ja) * 2002-04-25 2003-11-21 Microsoft Corp インククラスタの明示的な表現を用いた2レベルイメージの圧縮
JP2008219825A (ja) * 2007-03-08 2008-09-18 Fuji Xerox Co Ltd 情報処理装置、画像処理装置、画像符号化装置、情報処理プログラム、画像処理プログラム及び画像符号化プログラム
JP2009010871A (ja) * 2007-06-29 2009-01-15 Toshiba Corp 画面転送装置およびその方法ならびに画像転送のためのプログラム
JP2009087343A (ja) * 2007-09-28 2009-04-23 Arm Ltd データ処理装置用のトレースストリームを発生するための技術
JP2009188995A (ja) * 2008-02-08 2009-08-20 Toshiba Corp 画像処理装置および画像処理方法
US20090324110A1 (en) * 2008-06-30 2009-12-31 Mitsue Fujinuki Screen transfer apparatus and method thereof and program storage medium
JP2011114546A (ja) * 2009-11-26 2011-06-09 Fujitsu Ltd データ圧縮装置、データ伸長装置、データ圧縮プログラム、及びデータ伸長プログラム
US8532415B2 (en) 2007-10-30 2013-09-10 Nec Corporation Data compression method
JP2014204357A (ja) * 2013-04-08 2014-10-27 日本電信電話株式会社 サンプル文字列辞書作成方法及び装置
JP2014204358A (ja) * 2013-04-08 2014-10-27 日本電信電話株式会社 文字列圧縮における階層型サンプル文字列辞書作成方法及び装置
JP2015043502A (ja) * 2013-08-26 2015-03-05 株式会社日立製作所 通信装置及びデータ転送制御方法
CN115858476A (zh) * 2022-12-27 2023-03-28 广东南方电力通信有限公司 用于web开发系统中自定义表单获取数据的高效存储方法

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0788239A3 (en) * 1996-01-31 1999-03-17 Hitachi, Ltd. Method of and apparatus for compressing and decompressing data and data processing apparatus and network system using the same
EP0788239A2 (en) * 1996-01-31 1997-08-06 Hitachi, Ltd. Method of and apparatus for compressing and decompressing data and data processing apparatus and network system using the same
JP2002314821A (ja) * 2001-04-18 2002-10-25 Ricoh Co Ltd 画像圧縮方法、画像伸張方法、画像圧縮装置及び画像伸張装置
JP2003333341A (ja) * 2002-04-25 2003-11-21 Microsoft Corp インククラスタの明示的な表現を用いた2レベルイメージの圧縮
JP2008219825A (ja) * 2007-03-08 2008-09-18 Fuji Xerox Co Ltd 情報処理装置、画像処理装置、画像符号化装置、情報処理プログラム、画像処理プログラム及び画像符号化プログラム
JP2009010871A (ja) * 2007-06-29 2009-01-15 Toshiba Corp 画面転送装置およびその方法ならびに画像転送のためのプログラム
JP2009087343A (ja) * 2007-09-28 2009-04-23 Arm Ltd データ処理装置用のトレースストリームを発生するための技術
US8532415B2 (en) 2007-10-30 2013-09-10 Nec Corporation Data compression method
JP2009188995A (ja) * 2008-02-08 2009-08-20 Toshiba Corp 画像処理装置および画像処理方法
US20090324110A1 (en) * 2008-06-30 2009-12-31 Mitsue Fujinuki Screen transfer apparatus and method thereof and program storage medium
US8576237B2 (en) * 2008-06-30 2013-11-05 Kabushiki Kaisha Toshiba Screen transfer apparatus and method thereof and program storage medium
JP2011114546A (ja) * 2009-11-26 2011-06-09 Fujitsu Ltd データ圧縮装置、データ伸長装置、データ圧縮プログラム、及びデータ伸長プログラム
JP2014204357A (ja) * 2013-04-08 2014-10-27 日本電信電話株式会社 サンプル文字列辞書作成方法及び装置
JP2014204358A (ja) * 2013-04-08 2014-10-27 日本電信電話株式会社 文字列圧縮における階層型サンプル文字列辞書作成方法及び装置
JP2015043502A (ja) * 2013-08-26 2015-03-05 株式会社日立製作所 通信装置及びデータ転送制御方法
CN115858476A (zh) * 2022-12-27 2023-03-28 广东南方电力通信有限公司 用于web开发系统中自定义表单获取数据的高效存储方法
CN115858476B (zh) * 2022-12-27 2023-12-12 广东南方电力通信有限公司 用于web开发系统中自定义表单获取数据的高效存储方法

Also Published As

Publication number Publication date
JP3231105B2 (ja) 2001-11-19

Similar Documents

Publication Publication Date Title
JP3305190B2 (ja) データ圧縮装置及びデータ復元装置
JP3273119B2 (ja) データ圧縮・伸長装置
US5870036A (en) Adaptive multiple dictionary data compression
JP3258552B2 (ja) データ圧縮装置及びデータ復元装置
JP3397431B2 (ja) データ圧縮方法および装置ならびにデータ復元方法および装置
JPH0682370B2 (ja) 文字処理装置
JP3231105B2 (ja) データ符号化方式及びデータ復元方式
JP3241788B2 (ja) データ圧縮方式
JP2536422B2 (ja) デ―タ圧縮装置及びデ―タ復元装置
JP3350118B2 (ja) データ符号化方式及びデータ復元方式
JP3241787B2 (ja) データ圧縮方式
JP3127016B2 (ja) データ圧縮及び復元方法
JPH0628149A (ja) 複数種類データのデータ圧縮方法
JPH06161705A (ja) データ符号化方式及びデータ復元方式
JP3105598B2 (ja) ユニバーサル符号を用いたデータ圧縮方式
JP3242795B2 (ja) データ処理装置及びデータ処理方法
CN117200805B (zh) 一种mcu的低内存占用的压缩和解压方法及装置
JPH05152971A (ja) データ圧縮・復元方法
JP3100206B2 (ja) データ圧縮方法
JP3088740B2 (ja) データ圧縮及び復元方式
JPH06202844A (ja) データ圧縮復元処理装置
JP2799228B2 (ja) 辞書初期化方式
JP3051501B2 (ja) データ圧縮方法
JPH02190080A (ja) 画像符号化装置
JP3083329B2 (ja) データ圧縮復元方式

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20010904

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080914

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080914

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090914

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090914

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100914

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees