[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP4150452B2 - フォントの取得方法、登録方法および印刷方法 - Google Patents

フォントの取得方法、登録方法および印刷方法 Download PDF

Info

Publication number
JP4150452B2
JP4150452B2 JP32163098A JP32163098A JP4150452B2 JP 4150452 B2 JP4150452 B2 JP 4150452B2 JP 32163098 A JP32163098 A JP 32163098A JP 32163098 A JP32163098 A JP 32163098A JP 4150452 B2 JP4150452 B2 JP 4150452B2
Authority
JP
Japan
Prior art keywords
font
variant
index
pointer
secondary index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP32163098A
Other languages
English (en)
Other versions
JP2000148736A (ja
Inventor
彰夫 木戸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP32163098A priority Critical patent/JP4150452B2/ja
Priority to TW088118135A priority patent/TW501028B/zh
Priority to CNB991232445A priority patent/CN1183466C/zh
Priority to US09/444,040 priority patent/US6675358B1/en
Publication of JP2000148736A publication Critical patent/JP2000148736A/ja
Application granted granted Critical
Publication of JP4150452B2 publication Critical patent/JP4150452B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、複数の情報システム間で情報交換が可能かつ検索可能な方法で異体字を電子文書システムで取り扱うことができる、フォントの取得方法、登録方法および印刷方法に関するものである。
【0002】
【従来の技術】
従来から、戸籍管理、顧客管理等の人名・地名を取り扱うアプリケーション、および、古典等の文芸書の電子文書化・出版を行うためのアプリケーションでは、できるだけ多くの文字を取り扱いたいという要求が強かった。その要求に答えるための一つの方法として、ワープロ等の既存のシステムでは、「外字」もしくは「利用者定義文字」という概念を導入し、利用者環境において、その利用者独自の文字を作成・利用して要求に答えていた。
【0003】
しかしながら、この手法は一利用者もしくは一企業等の共通の外字もしくは利用者定義文字を共有する閉じた環境でのみ利用可能であり、インターネット等のオープンな環境ではそのような外字を使用した文書の情報交換は保証されなかった。つまり、電子文書の参照者の環境では、その文書の作成者が全く意図しなかった文字(字形)が表示されるという結果となった。
【0004】
また、外字を利用した文書の検索には大きな問題が生じていた。たとえば、高島という文字の高にいわゆる梯子高すなわち
【外1】
Figure 0004150452
を使用したい場合は、その
【外2】
Figure 0004150452
を外字として作成して使用する。この場合、外字の
【外3】
Figure 0004150452
は正字すなわち標準字形の「高」を用いた検索ではヒットしなかった。その両方の「高」の検索を行おうとする場合、論理和を用いた検索を行うか、または、異体字関係を定義したシソーラスを作成し、そのシソーラスを用いた曖昧検索を行う必要がある。しかしながら、そのどちらの方法も現実的ではなかった。
【0005】
すなわち、論理和を用いた検索を行うためには、利用者はその情報システムに外字として登録されている文字と、それらの文字と標準の文字との異体字関係を全て把握している必要がある。また、シソーラスを用いた手法では、外字は利用者が定義・使用するものであるため、シソーラスに定義されるべき文字は利用者ごとに異なり、共通のシソーラスを検索システムの提供者が作成し利用者に提供することはできなかった。
【0006】
上記の問題を解決するために、必要とされる文字を全て標準の文字として文字符号表上に定義してしまい、さらに、定義された文字の異体関係を定義したシソーラスを作成するという手法が考えられる。しかしながら、字体の細かい違いまでも区別できるように文字符号を定義しようとすると、必要とされる文字数は数十万とも無限とも言われており、その膨大な文字数を持つ文字符号を標準文字符号として全ての情報システム上でサポートすることは、情報システムの利用者全てにその実装コストを転嫁することとなり実質的ではなかった。また、数十万オーダーの漢字に対して異体字シソーラスを作成した場合、そのサイズは無視できないほどに大きくなり、検索速度に大きな影響を与えるであろうし、文字の追加に際してそのシソーラスを保守することは実質的に無理であった。
【0007】
【発明が解決しようとする課題】
上述した問題は、そもそも漢字という文字に造字機能があることにより発生している。すなわち、手書きの場合、もしくは、活字を用いた通常の出版の場合、必要に応じて字形を新たに作成し、字形の僅かな違いを人間が無視することによって、または、作成した字形にルビを振ることによって、正字と異体字の間の暗黙の関係を作成者と判読者が共有していた。この漢字の造字機能および曖昧な判読機能を情報システム上で実現しようとすると、外字といわれる利用者による文字の定義機能を提供することにより、漢字の造字機能は実現することができる。しかしながら、曖昧な判読機能は、既存の情報システムが曖昧な画像認識処理を行うには非力であったため、および、画像による情報交換では文字符号を用いた情報交換に比べて大きな情報量が必要とされるため、無視されてきた。
【0008】
インターネットの普及により、個人・企業の枠を超えて電子的な情報交換が一般的に行われるようになる以前は、印字された文字を媒体として情報交換を行っていたため、判読は利用者の責任においてなされ、情報システム側に曖昧な判読機能を持たせようとする要求が低かった。しかし、電子的な情報交換、および、電子的に蓄積された情報の検索が一般的に行われるようになってきた昨今、標準として規定されている情報交換可能な文字数の不足の問題、外字として造字された文字の情報交換の必要性、および、検索への要求が高くなってきている。
【0009】
本発明の目的は上述した課題を解消して、既存の文字符号の文字数の制約を超えて、電子文書の作成者が多くの文字を使用することを可能にする、フォントの取得方法、登録方法および印刷方法を提供しようとするものである。
【0010】
【課題を解決するための手段】
本発明のフォントの取得方法では、異体字フォントのイメージデータからなる異体字フォントデータファイルと;正字の文字符号値とその正字の文字符号値に対応した二次インデックスへのポインタとからなる主インデックステーブルと、異体字フォントデータファイル中の対象フォントの先頭バイトへのポインタと、主インデックスが同じ次の二次インデックスエントリへのポインタとから構成される二次インデックスのエントリデータからなる二次インデックステーブルとを備えるインデックス変換テーブルと;からなる異体字フォントファイルを利用する。
【0011】
異体字フォントファイルの利用方法は以下の通りである。電子文書中にインデクシングされた対象となる異体字フォントの正字の文字符号値と異体字番号に基づき、インデックス変換テーブルの主インデックステーブルを参照して、正字の文字符号値から正字の文字符号値に対応した二次インデックスへのポインタを取得し、取得したポインタで指示された二次インデックステーブルの二次インデックスのエントリデータの最初の番目が異体字番号と一致しない場合は、異体字番号と一致し且つ主インデックスが同じ次の番目の二次インデックスエントリが見つかるまで、二次インデックステーブルから主インデックスが同じ次の番目の二次インデックスエントリへの有効なポインタを順次に取得し、最初の番目または順次に取得した有効なポインタで指示された次の番目が異体字番号と一致する場合は、最初の番目または次の番目の二次インデックスのエントリデータから対象となる異体字フォントの先頭バイトへのポインタを取得し、取得したポインタで指示された異体字フォントデータファイル中の位置のフォントイメージを、対象となる異体字フォントとして取得する。
【0012】
また、本発明のフォントの登録方法では、異体字フォントファイルに異体字フォントを追加するにあたり、利用者が指定した異体字フォントファイルの異体字フォントデータファイルに追加すべき異体字フォントのイメージを表すフォントデータを、異体字フォントデータファイルにシーケンシャルに追加し登録し、登録後、インデックス変換テーブルにおいて、異体字フォントデータファイル中の先頭バイトへのポインタ、および、主インデックスが同じ次の二次インデックスエントリへのポインタを二次インデックスのエントリデータとして二次インデックステーブルに格納するとともに、利用者が定義した正字の文字符号値とその正字の文字符号値に対応した二次インデックスへのポインタを主インデックステーブルに格納する。
【0014】
さらにまた、本発明のフォントの印刷方法では、まず、フォントを印刷するにあたり、正字については正字の文字符号値を有するフォントをフォントライブラリーから取得して印刷する。同時に、異体字フォントのイメージデータからなる異体字フォントデータファイルと;正字の文字符号値とその正字の文字符号値に対応した二次インデックスへのポインタとからなる主インデックステーブルと、異体字フォントデータファイル中の対象フォントの先頭バイトへのポインタと、主インデックスが同じ次の二次インデックスエントリへのポインタとから構成される二次インデックスのエントリデータからなる二次インデックステーブルとを備えるインデックス変換テーブルと;からなる異体字フォントファイルを利用し、電子文書中にインデクシングされた対象となる異体字フォントの正字の文字符号値と異体字番号に基づき、インデックス変換テーブルの主インデックステーブルを参照して、正字の文字符号値から正字の文字符号値に対応した二次インデックスへのポインタを取得し、取得したポインタで指示された二次インデックステーブルの二次インデックスのエントリデータの最初の番目が異体字番号と一致しない場合は、異体字番号と一致し且つ主インデックスが同じ次の番目の二次インデックスエントリが見つかるまで、二次インデックステーブルから主インデックスが同じ次の番目の二次インデックスエントリへの有効なポインタを順次に取得し、最初の番目または順次に取得した有効なポインタで指示された次の番目が異体字番号と一致する場合は、最初の番目または次の番目の二次インデックスのエントリデータから対象となる異体字フォントの先頭バイトへのポインタを取得し、取得したポインタで指示された異体字フォントデータファイル中の位置のフォントイメージを取得して印刷する。
【0016】
上述したフォントの取得方法、登録方法および印刷方法では、既存の文字符号の文字数の制約を超えて、電子文書の作成者が多くの文字(字形)を使用することを可能にする。また、そのことによって、戸籍管理、顧客管理等の人名・地名を取り扱うアプリケーション、および、古典等の文芸書の電子文書化・出版等のアプリケーションが使用できる文字数の制約を取り除き、正確な字形を使用した人名、地名、文芸書の処理および蓄積を可能にする。さらに、利用者によって造字された文字の電子文書による情報交換を可能にする。すなわち、電子文書の受信者の環境において、その作成者の環境と同じ字形で造字された文字を表示可能にする。さらにまた、造字された文字を用いた電子文書の検索を可能にする。すなわち、正字と異体字を区別せずに文字列の検索を行う、もしくは、必要に応じて正字と異体字を区別せずに文字列の検索を行うことができる。
【0017】
また、本発明の好ましい態様として、電子文書中への異体字フォントの埋め込みを、ローカルシステムにおける文字符号、インラインフォントとして符号化された文字符号、または、リモートシステム上のフォントファイルの文字符号を示すURLを使用することで実施する。この場合は、既存の文字符号を用いて上記の要求を満たす電子文書処理システムを実現することにより、実装コストを削減することができる。
【0018】
【発明の実施の形態】
まず、本発明の異体字フォントの電子文書中へのインデクシングについて説明する。本発明では、異体字フォントを、対応する正字の文字符号値と、異体字フォントファイル名と、異体字番号とで、電子文書中へ指定する。そのため、インデクシングされた異体字フォントは、通常のフォントがフォント名および文字符号による一次元のインデックスを持つのに対し、二次元のインデックスから構成されている。この二次元のインデックスは、後述するようにフォントファイルの中に内蔵されたインデックス変換テーブルを参照することによって、フォントファイル中のフォントの位置情報に翻訳される。ここで、フォントの位置情報は、好ましくは、対象フォントのフォントファイルにおいて、フォントデータファイルの先頭からのフォント数からなるシーケンシャルなフォント番号、または、対象フォントデータの先頭バイトの位置を示すバイトインデックスである。
【0019】
異体字フォントの異体字番号(副インデックス)は、フォント名の中に符号化されるものとする。フォント名は、タイプフェースを示す情報、作成者を示す情報、異体字番号からなる。例えば、"MINCHO-ITAI@FOOBAR:2"とという構造を持つ。この場合、"MINCHO-ITAI" はタイプフェース名、"@" はタイプフェースと作成者情報を区切る区切り文字、FOOBAR" は作成者情報、":" は作成者情報と異体字番号を区切る区切り文字、"2" は異体字番号である。異体字フォントは、このフォント名とこのフォント名の後に続く正字の文字符号とから構成される。
【0020】
次に、インデックス変換テーブルを参照して上述した構成の異体字フォントをインデクシングする方法の一例を説明する。図1は異体字フォントのインデックス変換テーブルの一例の構成を示す図、図2は図1に示すインデックス変換テーブルを利用して異体字フォントをインデクシングする方法の一例を説明するためのフローチャートである。図1において、インデックス変換テーブルは、主インデックステーブル1と二次インデックステーブル3とから構成されている。主インデックステーブル1は、正字の文字符号値とその正字符号値に対応した二次インデックスへのポインタとから構成される。二次インデックステーブル3は、異体字フォントデータファイル中の対象フォントの先頭バイトへのポインタと、主インデックスが同じ次の二次インデックスエントリへのポインタとから構成される二次インデックスへのエントリデータ2から構成される。なお、4は、フォントファイル中の異体字フォントからなるフォントデータファイルである。このインデックス変換テーブルは、各利用者のフォントファイル中に内蔵されてフォントドライバが認識できるよう構成する。
【0021】
図2に従って、図1に示すインデックス変換テーブルを利用して異体字フォントをインデクシングする方法を説明する。まず、電子文書中にインデックスされた異体字フォントから正字の文字符号値を読み取り、主インデックステーブル1で利用する正字符号値番号のエントリを得る(S1)。主インデックステーブル1を参照することで、得られたエントリの内容から二次インデックステーブル3へのポインタを求める(S2)。この二次インデックステーブル3へのポインタは、異体字フォントの主インデックスで定義された正字のうち0番目のエントリとなる。次に、異体字フォントの副インデックスから得られた異体字番号で表される目的の二次インデックス値と、エントリの番目が一致するかどうかを検討する(S3)。目的の二次インデックス値とエントリの番目が一致した場合は、二次インデックステーブル3中の二次インデックスへのエントリデータ2から、フォントデータファイル4における対象フォントの先頭バイトへのポインタを得る(S4)。そして、得られた先頭バイトのポインタからフォントデータファイル4中の対象となるフォントをアクセスして表示等をする(S5)。
【0022】
一方、目的の二次インデックス値とエントリの番目とが一致しない場合は、二次インデックスへのエントリデータ2の中の主インデックスが同じ次の二次インデックスエントリへのポインタを読み取り、読み取ったポインタがナル(Null)かどうかを検討する(S6)。読み取ったポインタがナルの場合は、次のエントリが見つからないため、エラーを表示して(S7)終了する。読み取ったポインタがナルでない場合は、得られている二次インデックスへのエントリへのポインタを得、得られたポインタから主インデックスが同じ次の番目のエントリを得る(S8)。以後、ステップS3以降のステップを繰り返すことで、異体字フォントのインデクシングが終了する。なお、上述した例では、二次インデックスへのエントリデータ2として、フォントデータファイル4に対する対象フォントの先頭バイトへのポインタを利用したが、それに代えて、フォントデータファイル4に対する先頭からのフォント数からなるシーケンシャルなフォント番号を利用することもできる。
【0023】
次に、本発明の異体字フォントを含む電子文書の取り扱い方法を実施するシステムの一例について、図3を参照して説明する。図3に示すシステムは、電子文書を作成するための電子文書作成システム21と、電子文書を読み取るための電子文書読み取りシステム31とから構成されている。図3に示す例では、電子文書読み取りシステム31からの要求で、電子文書作成システム21で作成した電子文書を閲覧しようとする際、上述した構成の本発明の異体字フォントをインデクシングした電子文書12を利用する。
【0024】
電子文書作成システム21には、異体字フォントを作成するためのフォント作成ユーティリティ22と作成者固有の異体字フォントファイル23、および、異体字を含む電子文書を作成するために使用するフォント表示ユーティリティ24とワードプロセッサ等の電子文章作成ユーティリティ25と作成した電子文書ファイル26、さらに、異体字フォントファイル23と電子文書ファイル26を蓄積する電子文書サーバ27を備えている。また、電子文書読み取りシステム31には、異体字フォントを含む電子文書を読み取るための電子文書処理システム32、および、フォントドライバ33、ローカルフォント34、印刷装置35を備えている。
【0025】
以下、図3に示すシステムのうち、異体字フォントの作成ユーティリティ22、異体字フォントの表示ユーティリティ24、および、異体字フォントを取り扱うフォントドライバ33の構成について説明する。
【0026】
異体字フォントの作成ユーティリティ22は、利用者によって入力された、タイプフェース名と作成者の名前を持つフォントファイル中に(対応するフォントファイルがなければ作成する)、上述した本発明の構成を有する異体字フォントを追加する。異体字フォントの字形データは、フォントファイルのフォントデータファイル4にシーケンシャルに追加されるものとする。字形データの登録後、異体字フォントの作成ユーティリティ22はインデックス変換テーブルに新しいエントリを追加する。そのエントリに、登録した字形データの先頭バイトへのポインタと、利用者によって入力された対応する正字の文字符号(主インデックス)、および、主インデックスが同じ次の二次インデックスエントリへのポインタを副インデックスとして格納する。これらの操作は、上述したインデックス変換テーブルを利用した異体字フォントのインデックス方法を参照することができる。
【0027】
なお、異体字フォントの主インデックスの指定は、通常の外字作成ユーティリティの場合と同じく、フォントデータの作成者に委ねられる。このインデックスの指定により、作成された異体字は正字と対応づけられ、検索の際に利用されることとなる。この対応関係は文字符号として電子文書中に含まれるので、検索の際に曖昧検索のためのシソーラスを参照する必要がなくなる。また、正字と異体字の関係は、異体字の作成者が定義したものである。そのため、その電子文書の検索において、作成者側と閲覧者側の間で解釈の違いによる検索結果の違いが生じることもなくなる。
【0028】
異体字フォントの表示ユーティリティ24は、利用者から正字のフォント名および文字符号の入力を受け、情報システムによりサポートされるフォントライブラリを検索して、上記フォント名および文字符号を主インデックスとして持つフォントを全て表示装置上に表示する。さらに、キーボードまたはポインティングデバイスを通じて利用者からの表示したフォント群の中から特定のフォントを示す入力を得て、対応するフォントのフォント名を利用者もしくは異体字フォントの表示ユーティリティ24を呼び出したプログラムに返すものとする。本発明の好適例においては、異体字の表示ユーティリティ24は、かな漢字変換等のInput Method Editor (IME) によって呼び出される。IME は、さらにワードプロセッサ等のIME を呼び出したアプリケーションプログラムに、主インデックス(正字のフォント名および文字符号)と副インデックス(異体字番号)からなる本発明の異体字フォントを返すことにより、アプリケーションは電子文書中に指定された異体字フォントのフォント情報と正字の文字符号とを埋め込むことができる。
【0029】
図4に示すフローチャートに従って異体字フォントを取り扱うフォントドライバ33を説明する。まず、フォントドライバ33は、指定されたフォント名中に異体字番号を区切る区切り文字が存在するかどうかを検討する(S11)。区切り文字が存在しない場合は、通常処理に戻る(S12)。区切り文字が存在する場合は、先頭からその区切り文字の直前の文字までをフォント名として、システムがサポートするフォントライブラリを検索し、該当するフォントファイルを得る(S13)。さらに、上記区切り文字の直後の文字から最後の文字までの文字列を数値に変換し、それを異体字番号とする。そして、その異体字番号を副インデックスとし(S14)、指定された正字のフォント名およびそのフォント名に続く文字符号を主インデックスとする(S15)。次に、異体字フォントファイル中のインデックス変換テーブルを参照し、正・副からなる二次元のインデックスをフォントの位置情報に変換し、アクセスすべきフォント(字形データ)を得(S16)、表示装置上にそのフォントを印字する(S17)。このインデックス変換テーブルを参照する方法はすでに説明した方法と同じである。
【0030】
次に、本発明の好適例として、異体字フォントを電子文書中に埋め込む方法および異体字フォントを埋め込んだ電子文書の所定方法について説明する。本発明では、これから説明する異体字フォントの情報は、上述した本発明の異体字フォントを含む電子文書の取り扱い方法に付加して利用されている。まず、図3に示す例において、電子文書作成ユーティリティ25では、電子文書中のフォントの指定を行う制御シーケンスにおいて、そのフォントのフォント名および文字符号とともに、そのフォントが、ローカルシステム中に存在するのか、インラインフォントとしてその電子文書中に埋め込まれているのか、あるいは、リモートシステムに存在するのかを示すフォントロケーションを指定する。このフォントロケーションの指定は、例えば、HTML、XML 等での実装の場合、電子文書中の〈font〉タグにlocationキーワードを追加し、そのlocationキーワードは値として、ローカルシステムを示すLOCAL 、インラインフォントを示すINLINE、リモートシステム上のフォントファイルを示すURL (Universal Resource Locator)が持てるようにすることで行う。
【0031】
異体字フォントを埋め込んだ電子文書の処理システム32では、処理を行う電子文書のフォーマット中のフォントの指定を行う制御シーケンスのフォントロケーションを解釈し、指定されたフォントが、ローカルシステムに存在するのか(通常の正字フォントの場合)、その電子文書に埋め込まれたインラインフォントであるのか、それともリモートシステムに存在するのかを知る。
【0032】
参照されているフォントがローカルシステムに存在する場合は、各利用者のシステムに存在する電子文書作成者と同じ通常のフォントを参照し、通常の処理で文字の印字を行う。
【0033】
参照されているフォントがインラインフォントであった場合、電子文書の処理システム32は、埋め込まれているインラインフォントの復号を行い、電子文書の処理システム32が獲得した一時ストレージの中に異体字フォントのバイナリイメージを展開する。そして、展開されたフォントファイル、電子文書中で参照されているフォント名、文字符号(その異体字に対応する正字の文字符号)をフォントドライバ33に引き渡すことにより、その異体字の印字を行う。ここで、MIME (Multipurpose Internet Mail Extention) のメディアタイプとして定義されたインラインフォントには、インターネットで交換可能な電子文書の中にフォントが含まれるようにする。サブタイプとしては、TrueType、Type 1等の既存のフォントフォーマットおよび本発明が提案する複数のフォントファイルからなる複合フォントを示すフォーマットを指定できるようにする。インラインフォントとして電子文書中に埋め込まれるフォントは、好ましくはBase64符号化法によって符号化される。
【0034】
参照されているフォントがリモートシステムに存在する場合、フォントリソースを示すURL をインターネットを介して参照し、電子文書の処理システムが獲得した一時ストレージの中に異体字フォントのバイナリイメージをコピーする。そして、コピーされたフォントファイル、電子文書中で参照されているフォント名、文字符号をインラインフォントの場合と同じようにフォントドライバ33に引き渡すことにより、その文字の印字を行う。
【0035】
なお、上述した本発明の好適例では、異体字フォントを所定の構成にインデクシングした電子文書を対象として説明したが、インラインフォントを利用する場合は上述した本発明の異体字フォントのインデクシングによらなくでも異体字フォントを取り扱えることはいうまでもない。
【0036】
本発明では、電子文書中において、異体字は対応する正字の文字符号をもって表現される。しかしながら、その電子文書の印字に際しては、その電子文書の作成者によって作成された異体字フォントが参照されるため、印字字形としては作成者が意図した異体字がどの環境でも表示されることとなり、異なるシステム間における情報交換によって文字化けが起こることがなくなり、印字字形についても正確な情報交換が可能となる。
【0037】
最後に、異体字フォントを埋め込んだ電子文書中の文字列の検索を行う手法について説明する。本発明の異体字フォントを含む電子文書の取り扱い方法では、電子文書中にインデクシングされた異体字フォントは文字符号としては対応する正字と同じ符号値をもっている。そのため、通常のフォント情報を無視した検索の場合、正字に加えて、その正字に結びつけられた異体字もヒットすることになる。多くの場合、正字の検索の結果として正字と異体字の両方がヒットすることは、簡単な検索式により利用者が意図した文字列がヒットすることになり、検索として都合がよい。利用者が正字と異体字とを区別した検索を行いたい場合は、利用者は文字符号に加えて、フォント名を指示することで、検索エンジンに電子文書中の文字列の検索を行わせることができる。
【0038】
【発明の効果】
以上の説明から明らかなように、本発明のフォントの取得方法、登録方法および印刷方法では、異体字フォントをインデクシングした電子文書を所定の方法で取り扱うことで、既存の文字符号の文字数の制約を超えて、電子文書の作成者が多くの文字(字形)を使用することを可能にする。また、そのことによって、戸籍管理、顧客管理等の人名・地名を取り扱うアプリケーション、および、古典等の文芸書の電子文書化・出版等のアプリケーションが使用できる文字数の制約を取り除き、正確な字形を使用した人名、地名、文芸書の処理および蓄積を可能にする。さらに、利用者によって造字された文字の電子文書による情報交換を可能にする。すなわち、電子文書の受信者の環境において、その作成者の環境と同じ字形で造字された文字を表示可能にする。さらにまた、造字された文字を用いた電子文書の検索を可能にする。すなわち、正字と異体字を区別せずに文字列の検索を行う、もしくは、必要に応じて正字と異体字を区別せずに文字列の検索を行うことができる。
【図面の簡単な説明】
【図1】本発明の異体字フォントのインデックス変換テーブルの一例の構成を示す図である。
【図2】図1に示すインデックス変換テーブルを利用して異体字フォントをインデクシングする方法を説明するためのフローチャートである。
【図3】本発明の電子文書処理システムにおける異体字フォントの取り扱い方法の第1発明を説明するための図である。
【図4】異体字フォントを取り扱うフォントドライバにおける異体字フォントの取り扱い方法を説明するためのフローチャートである。
【符号の説明】
1 主インデックステーブル、2 二次インデックスへのエントリデータ、3二次インデックステーブル、4 フォントデータファイル、12 異体字フォントをインデクシングした電子文書、13 異体字フォントデータ、21 電子文書作成システム、22 フォント作成ユーティリティ、23 異体字フォントファイル、24 フォント表示ユーティリティ、25 電子文書作成ユーティリティ、26 電子文書ファイル、27 電子文書サーバ

Claims (3)

  1. 異体字フォントのイメージデータからなる異体字フォントデータファイルと;正字の文字符号値とその正字の文字符号値に対応した二次インデックスへのポインタとからなる主インデックステーブルと、異体字フォントデータファイル中の対象フォントの先頭バイトへのポインタと、主インデックスが同じ次の二次インデックスエントリへのポインタとから構成される二次インデックスのエントリデータからなる二次インデックステーブルとを備えるインデックス変換テーブルと;からなる異体字フォントファイルを利用し、
    電子文書中にインデクシングされた対象となる異体字フォントの正字の文字符号値と異体字番号に基づき、インデックス変換テーブルの主インデックステーブルを参照して、正字の文字符号値から正字の文字符号値に対応した二次インデックスへのポインタを取得し、取得したポインタで指示された二次インデックステーブルの二次インデックスのエントリデータの最初の番目が異体字番号と一致しない場合は、異体字番号と一致し且つ主インデックスが同じ次の番目の二次インデックスエントリが見つかるまで、二次インデックステーブルから主インデックスが同じ次の番目の二次インデックスエントリへの有効なポインタを順次に取得し、最初の番目または順次に取得した有効なポインタで指示された次の番目が異体字番号と一致する場合は、最初の番目または次の番目の二次インデックスのエントリデータから対象となる異体字フォントの先頭バイトへのポインタを取得し、取得したポインタで指示された異体字フォントデータファイル中の位置のフォントイメージを、対象となる異体字フォントとして取得することを特徴とするフォントの取得方法。
  2. 異体字フォントのイメージデータからなる異体字フォントデータファイルと;正字の文字符号値とその正字の文字符号値に対応した二次インデックスへのポインタとからなる主インデックステーブルと、異体字フォントデータファイル中の対象フォントの先頭バイトへのポインタと、主インデックスが同じ次の二次インデックスエントリへのポインタとから構成される二次インデックスのエントリデータからなる二次インデックステーブルとを備えるインデックス変換テーブルと;からなる異体字フォントファイルに異体字フォントを追加するにあたり、
    利用者が指定した異体字フォントファイルの異体字フォントデータファイルに追加すべき異体字フォントのイメージを表すフォントデータを、異体字フォントデータファイルにシーケンシャルに追加し登録し、登録後、インデックス変換テーブルにおいて、異体字フォントデータファイル中の登録したフォントデータの先頭バイトへのポインタ、および、主インデックスが同じ次の二次インデックスエントリへのポインタを二次インデックスのエントリデータとして二次インデックステーブルに格納するとともに、利用者が定義した正字の文字符号値とその正字の文字符号値に対応した二次インデックスへのポインタを主インデックステーブルに格納することを特徴とするフォントの登録方法。
  3. フォントを印刷するにあたり、
    正字については正字の文字符号値を有するフォントをフォントライブラリーから取得して印刷するとともに、
    異体字フォントのイメージデータからなる異体字フォントデータファイルと;正字の文字符号値とその正字の文字符号値に対応した二次インデックスへのポインタとからなる主インデックステーブルと、異体字フォントデータファイル中の対象フォントの先頭バイトへのポインタと、主インデックスが同じ次の二次インデックスエントリへのポインタとから構成される二次インデックスのエントリデータからなる二次インデックステーブルとを備えるインデックス変換テーブルと;からなる異体字フォントファイルを利用し、
    電子文書中にインデクシングされた対象となる異体字フォントの正字の文字符号値と異体字番号に基づき、インデックス変換テーブルの主インデックステーブルを参照して、正字の文字符号値から正字の文字符号値に対応した二次インデックスへのポインタを取得し、取得したポインタで指示された二次インデックステーブルの二次インデックスのエントリデータの最初の番目が異体字番号と一致しない場合は、異体字番号と一致し且つ主インデックスが同じ次の番目の二次インデックスエントリが見つかるまで、二次インデックステーブルから主インデックスが同じ次の番目の二次インデックスエントリへの有効なポインタを順次に取得し、最初の番目または順次に取得した有効なポインタで指示された次の番目が異体字番号と一致する場合は、最初の番目または次の番目の二次インデックスのエントリデータから対象となる異体字フォントの先頭バイトへのポインタを取得し、取得したポインタで指示された異体字フォントデータファイル中の位置のフォントイメージを取得して印刷する、
    よう構成されたフォントドライバーを使用することを特徴とするフォントの印刷方法。
JP32163098A 1998-11-12 1998-11-12 フォントの取得方法、登録方法および印刷方法 Expired - Fee Related JP4150452B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP32163098A JP4150452B2 (ja) 1998-11-12 1998-11-12 フォントの取得方法、登録方法および印刷方法
TW088118135A TW501028B (en) 1998-11-12 1999-10-20 A font access method, a font registration method, a font display method, a font printing method and a method for processing electronic documents in which variant fonts are included, and a recording medium therefor
CNB991232445A CN1183466C (zh) 1998-11-12 1999-10-28 字型访问,登记,显示和打印的方法
US09/444,040 US6675358B1 (en) 1998-11-12 1999-11-19 Font access, registration, display and printing method and a method for processing electronic documents having variant fonts

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP32163098A JP4150452B2 (ja) 1998-11-12 1998-11-12 フォントの取得方法、登録方法および印刷方法

Publications (2)

Publication Number Publication Date
JP2000148736A JP2000148736A (ja) 2000-05-30
JP4150452B2 true JP4150452B2 (ja) 2008-09-17

Family

ID=18134659

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32163098A Expired - Fee Related JP4150452B2 (ja) 1998-11-12 1998-11-12 フォントの取得方法、登録方法および印刷方法

Country Status (4)

Country Link
US (1) US6675358B1 (ja)
JP (1) JP4150452B2 (ja)
CN (1) CN1183466C (ja)
TW (1) TW501028B (ja)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001242850A (ja) * 2000-02-25 2001-09-07 Fujitsu Ltd 文字処理装置、文字処理システム、及び文字処理方法並びに記録媒体
US7197706B1 (en) * 2000-08-30 2007-03-27 Celartem Inc. Method and system for ensuring accurate font matching in documents
US7231602B1 (en) 2000-11-29 2007-06-12 Microsoft Corporation Live preview for reformatting document text
US10810355B1 (en) 2001-07-16 2020-10-20 Clantech, Inc. Allowing operating system access to non-standard fonts in a network document
US8522127B2 (en) * 2001-07-16 2013-08-27 Robert G. Adamson, III Allowing operating system access to non-standard fonts in a network document
JP2003044472A (ja) * 2001-07-31 2003-02-14 Canon Inc 情報処理装置、情報処理システム、情報処理装置の制御方法、記憶媒体、及び制御プログラム
US20040246516A1 (en) * 2003-06-03 2004-12-09 Curtis Reese Hard imaging systems, hard imaging management devices, hard imaging devices, articles of manufacture, hard imaging device operational methods, and hard imaging device configuration methods
US7583393B2 (en) * 2004-09-24 2009-09-01 Seiko Epson Corporation Multiple font management system and method
US7627818B2 (en) * 2006-05-31 2009-12-01 International Business Machines Corporation Displaying HTML text on a non-graphical console
US8201088B2 (en) * 2006-07-25 2012-06-12 Monotype Imaging Inc. Method and apparatus for associating with an electronic document a font subset containing select character forms which are different depending on location
CN101286092A (zh) 2007-04-11 2008-10-15 谷歌股份有限公司 具有第二语言模式的输入法编辑器
US20100199174A1 (en) * 2009-02-03 2010-08-05 Microsoft Corporation Extensible font file loading
US9319444B2 (en) 2009-06-22 2016-04-19 Monotype Imaging Inc. Font data streaming
CN101639846A (zh) * 2009-08-20 2010-02-03 无敌科技(西安)有限公司 供用户自定义字体的方法
CN101655835B (zh) * 2009-08-26 2011-08-03 北大方正集团有限公司 电子文档中文字信息处理、输出和字符检索的方法及装置
US8615709B2 (en) 2010-04-29 2013-12-24 Monotype Imaging Inc. Initiating font subsets
US20130215126A1 (en) * 2012-02-17 2013-08-22 Monotype Imaging Inc. Managing Font Distribution
JP2013182434A (ja) * 2012-03-01 2013-09-12 Nec System Technologies Ltd 外字取得端末、外字提供サーバ装置、外字取得システム、外字取得方法、及びプログラム
US9817615B2 (en) 2012-12-03 2017-11-14 Monotype Imaging Inc. Network based font management for imaging devices
US9569865B2 (en) 2012-12-21 2017-02-14 Monotype Imaging Inc. Supporting color fonts
WO2014110206A2 (en) 2013-01-09 2014-07-17 Monotype Imaging Inc. Advanced text editor
US9317777B2 (en) 2013-10-04 2016-04-19 Monotype Imaging Inc. Analyzing font similarity for presentation
US9691169B2 (en) 2014-05-29 2017-06-27 Monotype Imaging Inc. Compact font hinting
CN105528345B (zh) * 2014-09-28 2020-08-07 北大方正集团有限公司 终端、服务器和补字方法
US10115215B2 (en) 2015-04-17 2018-10-30 Monotype Imaging Inc. Pairing fonts for presentation
US11537262B1 (en) 2015-07-21 2022-12-27 Monotype Imaging Inc. Using attributes for font recommendations
US11334750B2 (en) 2017-09-07 2022-05-17 Monotype Imaging Inc. Using attributes for predicting imagery performance
US10909429B2 (en) 2017-09-27 2021-02-02 Monotype Imaging Inc. Using attributes for identifying imagery for selection
US11657602B2 (en) 2017-10-30 2023-05-23 Monotype Imaging Inc. Font identification from imagery

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5533180A (en) * 1994-04-07 1996-07-02 Top Computech Co. Ltd. Method of manipulating fonts containing large numbers of characters
JP3535266B2 (ja) * 1995-06-26 2004-06-07 富士通株式会社 外字拡張利用方式
CA2233023A1 (en) * 1995-09-25 1997-04-03 Edward A. Taft Optimum access to electronic documents
US5940581A (en) * 1996-03-21 1999-08-17 Apple Computer, Inc. Dynamic font management for large character sets
US5936636A (en) * 1996-05-16 1999-08-10 Sun Microsystems, Inc. Encoding schemes
JPH10301924A (ja) * 1997-04-25 1998-11-13 Fujitsu Ltd 業務別外字処理装置
US6377966B1 (en) * 1997-10-22 2002-04-23 Flashpoint Technology, Inc. Graphical interface to select characters representing phonetic articulation and no articulation groups
US6426751B1 (en) * 1999-04-01 2002-07-30 Adobe Systems Incorporated Font feature file processing

Also Published As

Publication number Publication date
CN1254894A (zh) 2000-05-31
CN1183466C (zh) 2005-01-05
JP2000148736A (ja) 2000-05-30
US6675358B1 (en) 2004-01-06
TW501028B (en) 2002-09-01

Similar Documents

Publication Publication Date Title
JP4150452B2 (ja) フォントの取得方法、登録方法および印刷方法
US8832150B2 (en) Variable user interface based on document access privileges
US6964015B2 (en) Redline extensible markup language (XML) schema
US6546385B1 (en) Method and apparatus for indexing and searching content in hardcopy documents
US7519900B2 (en) System and method for processing digital annotations
US7958444B2 (en) Visualizing document annotations in the context of the source document
US20030229857A1 (en) Apparatus, method, and computer program product for document manipulation which embeds information in document data
US20070036433A1 (en) Recognizing data conforming to a rule
US20010053252A1 (en) Method of knowledge management and information retrieval utilizing natural characteristics of published documents as an index method to a digital content store
US8359302B2 (en) Systems and methods for providing hi-fidelity contextual search results
JP2009522675A (ja) 遠隔に記憶されたテンプレートを使用する自動化された処理(書式を処理する方法、該書式を処理する装置)
JP2005535020A (ja) グリフレット
WO2008041367A1 (fr) Dispositif de recherche de document, procédé de recherche de document et programme de recherche de document
JP3521174B2 (ja) 情報フィルタリング装置および同装置に適用される関連情報提供方法
Goldberg XML: Visual quickstart guide
Hardy et al. Creating structured PDF files using XML templates
JPH11212997A (ja) 書籍データ登録方法および書籍データ登録システム
Nagy et al. DIA, OCR, AND THE WWW
Hara et al. Resource Sharing System for Humanity Researches.
Watkins The digital conversion of the CM Doke Collection of personal letters from MK Gandhi, together with other related materials: A case study by the Unisa Library Digital Resource Centre
Pani et al. Web-based information management: HTML, XML, PDF and image format: an analysis in comparison
Pitti Encoded Archival Description Retrospective Conversion Guidelines
Dixon How Can Documents Be Put onto the Web?.
Tao An XML deployment and search framework
Huang The Design of the CCCII and Its Application Considerations in Library Automation.

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060328

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060419

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060524

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20060629

A912 Removal of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20060714

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080528

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080630

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110704

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees