[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JPS60134959A - 符号列変換装置 - Google Patents

符号列変換装置

Info

Publication number
JPS60134959A
JPS60134959A JP58241985A JP24198583A JPS60134959A JP S60134959 A JPS60134959 A JP S60134959A JP 58241985 A JP58241985 A JP 58241985A JP 24198583 A JP24198583 A JP 24198583A JP S60134959 A JPS60134959 A JP S60134959A
Authority
JP
Japan
Prior art keywords
class
code string
dictionary
output
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58241985A
Other languages
English (en)
Inventor
Hideko Mikami
三上 秀子
Tetsuzo Uehara
上原 徹三
Tsutomu Ito
勉 伊藤
Toshio Hirozawa
広沢 敏夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP58241985A priority Critical patent/JPS60134959A/ja
Publication of JPS60134959A publication Critical patent/JPS60134959A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明に1、カナ漢字変換、漢字カナ変換、自然言語間
の変換などの符号列変換装置に係り、特に複数分野に渡
る内容の符号列の変換に好適な符号列変換装置に関する
〔発明の背景〕
符号列変換、例えば、カナ漢字変換において、変換の多
重性(いわゆる同音異義語、同音異字語)の問題が発生
ずる。この出力符号列が一意に定まらず複数の出力符号
列候補が存在するという問題に対処して、候補の中から
妥当な変換結果を与える可能性の強いものから順に表示
出力するか、最も可能性の強いものを選択して出力する
かのいずれかの方法が採用される。このため、符号列変
換装置は、その妥当性を判定する手段を有する必要があ
る。
従来、その手段は次のものがある。
(1) 符号列の使用頻度を利用する方法出力符号列の
使用頻度を予め辞書情報の中に保存し、出力符号夕1j
の候補をその頻度の高い方から優先順位付けする方法で
ある。
(2)分野の指定を利用する方法 変換の対象としている符号列全体の特性を示す分野1W
報をユーザに指定させ、入出力符号列の対応を与える辞
有金分野毎に用意するか、あるいは、同一辞書項目中に
分野旬の頻度情報を瀘〈ことによって、ユーザの指定し
た分野に該当する出力符号号列の候補を優先的に扱う方
法である。
(3)ユーザの選択結果を反映する方法会話型システム
においては、ユーザに出力符号列の候補を示し、ユーザ
が妥当な出力符号列を指示し、この指示情報を入力符号
列と出力符号列との対応あるいは辞書項目の識別情報と
いう形で保存し、以降に同一の入力符号列が出現したと
きに、この保存情報によって得られる出力符号列を優先
的に扱う方法である。
上記の方法(1)の問題は、入力符号列に現われる種々
の分野の記述を、−律に辞書項目と対応する頻度情報で
扱うには無理があるという点である。
上記の方法(2)は、方法(1)の問題の一解決法を与
えるが、多分野にまたがるひとまわりの入力符号列に対
する妥当な変換を与えることができない。
上記の方法(3)は、会話型システムの特性を有効に利
用した方法であるが、同一人力符号列の再現時にのみ効
果をもつという点で適用効果が制限される。
〔発明の目的〕
本発明の目的は、複数分野の重み情報を保持し、それに
従って出力符号列の候補間の順位を設定することによシ
、複数分野にまたがる符号列の変換結果の妥当性を向上
した符号列変換装置を提供することにある。
〔発明の概要〕 多分野にまたがる内容を記述する人力符号列の妥当な変
換を与えるため、本発明の符号列変換装置では、複数分
野の重み情報をクラス情報記憶部に保持し、かつ、入力
符号列と出力符号列の対応を与える辞書の項目に対応し
て当該項目の所属する分野を示すクラス決定手段を具備
することを特徴とする。
本発明の考え方を、以下に示す。
符号列の変換処理では入力符号列あるいはその部分列(
これをAとする)を辞書検索し、検索結果として得られ
る項目がn個あったものとする。
そのうち、1番目の項目の出力杓号列をBiで示す。こ
のBiに対してクラス決定手段が与える所属クラスの集
合をCiとする。入力勾号列Aに対する出力符号クリの
候補 Bll B2.・・・・・・+ B l +・・・・・
・、B7を妥当な符号列が上位に位置するように並べ換
えることが問題である。神々の入力符号列に対してこの
ような出力符号列を出力した結果、妥当な出力符号列が
上位に出力される率が高い程、符号列変換装置の性能が
高いことになる。
そこで本装置では、上記CIに含まれるクラスについて
、クラス情報記憶部の重み情報を参照し、その結果とし
て項目iに対する優先情報P+をめる。このようにして
めたP 1 + P 2 r・・・・・・。
Pnを優先情報の高い順に並べ換えた結果をP a 1
 、 P a 21 ”””、 P a nとするとき
、出力符号列は妥当性の高いものからB d 11 B
a 2+ ”””1 Bo nの順に並べられる。
〔発明の実施例〕
以下、本発明の一実施例を図面によシ詳細に説明する。
第1図は、本発明の一実施例を示す全体構成図であり、
カナ文字列を漢字カナ混p文字列に変換するカナ漢字変
換装置を示している。第1図において1は符号列の入出
力にユーザが用いる端末装置、2は端末入力制御部、3
は入力符号列を保持する入力情報部、4は辞書検索部、
5は辞書記憶部、6は検索項目記憶部、7はクラス情報
記憶部、8は優先処理部、9は出力符号列を置く出力バ
ッファ、10は端末出力制御、11は内部変換処理部、
12は出力合成部、13は複数出力表示フラグである。
端末装置1からカタカナ入力符号列(例えば「キジヲ」
と入力、されたとする)を入力すると、端末入力制御部
2はこれを入力記憶部3にセントし辞書検索部4を起動
する。辞書検索部4は入力符号列(この場合「キジヲ」
)に対応する辞書項目を解重記憶部5によって検索する
。辞書記憶部5にこの入力符号列に対する項目が存在し
ないと、辞書検索部4は入力符号列の後尾の19・1号
を除いて検索する。以下、更に項目が存在しないとき、
同様に1符号ずつ取除いて検索する。その結果、辞書記
憶部5よシ検索した辞書項目を出力合成部12に送p1
取除いた入力符号列の部分列を内部変換処理部11に送
シこれを起動する。上側の場合「キジ」に対する辞書項
目が存在するものとし、取除いた入力符号列を「ヲ」と
する。内部変換処理部11はこれを解重検索によらず内
部的に出力符号列(この場合「を」)に変換し、出力合
成部12に送るとともにそれを起動する。
辞書項目は、入力符号列フィールド、出力符号列フィー
ルド、所属クラス4種に対する利用度を示す数値フィー
ルドから成る。この辞書項目の形式を第2図に示す。本
実施例では、辞書項目に所属クラスの利用度を含ませる
ことによシ、辞書検索が同時にクラス決定手段となって
いる。上記の、「キジ」に対する辞書項目の内容を第3
図に示す。
ここで、辞書項目の出力符号列は「記事」 「雉」およ
び「生地」であり、「記事」に対する所属クラスiの利
用贋はC目で示した。
出力合成部12は、上記の辞1.検索項目中の、出力符
号列に内部変換処理部11から与えられた内部変換結果
を結合し、所属クラスの利用度とともに検索項目記憶部
6に記憶し、優先処理部8を起動する。上側において検
索項目記憶部6に記憶される内容を第4図に示す。
優先処理部8はクラス情報記憶部7の内容と、検索項目
記憶部6の各項目の利用度情報とから、各項目の優先度
をめ、複数出力表示フラグ13が値1であれば、それら
の項目のうち出力符号列の部分を優先度の順に出力バツ
7ア9にセットし、複数出力表示フラグ13が値0であ
れば、優先度の最も高い項目の出力符号列を出力バッフ
ァ9にセットする。出力バッファ9へのセットが終ると
優先処理部8は端末出力制御10を起動して、出力バッ
ファ9の中の出力符号列を端末装置1に出力させる。
クラス情報記憶部7は各クラスの重みづけ情報を保持す
る4個の要素の配列でおシ、第5図のように表わされる
。第5図のWjはクラスjの重みを表わす(j=1.2
,3.4)。
優先処理部8は検索項目記憶部6の各項目の利用度情報
とクラス情報記憶部7の重み情報を入力して優先情報を
める。項目iの優先情報をP+とすると、 Pl=Σ C1jXWj −1 である。優先処理部8はこのPlの大きい順に各項目を
出力バッファ9に送ることができる。
上側において、クラス1を一般分野、クラス2を後追分
野、クラス3を婦人分野、クラス4を生物分野と考え、 all=z 、 Ct2=3 、013=0 + C1
4=0C2i= 1 + C22= 0 + C2a 
=O、C24= 2Csx= 1 、Caz= 1 、
Caa=3 、C3a= 0なるクラス情報が設定され
ている場合、クラス情報記憶部7の値を W1=0.W2=0.W3=0.W4=1とすると、 P 1 = 0 r P 2 = 2 、 P a =
 0であり、「雉」が最優先に出力される。
また、 W1=0.W2=1.Vv3=1.W4−0ならば P1=3.p2=+Q、pa−4 であり「生地を」 「記事を」 「雉を」の順に優先さ
れる。
以上の如く、重み情報wjを適切に設定することにより
、出力符号列の順位を妥当なものとすることが可能であ
る。
〔発明の効果〕
本発明によれば、複数の分野にまたがる入力符号列テキ
ストを、出力符号列テキストに変換するに際し、出力符
号列候補の所属クラスの情報と各分野の重みとを勘案し
て、出力符号列を選択し、あるいは出力符号列候補の出
力順位を設定することが可能である。
【図面の簡単な説明】
第1図は本発明の一実施例を示す符号列変換装置の全体
構成図、第2図は辞書項目の形式を示す説明図、第3図
はある入力符号列に対して検索される辞書項目の内容の
例を示す説明図、第4図は検索項目記憶部の内容例を示
す説明図、第5図はクラス情報記憶部の形式を示す説明
図である。 1・・・端末装置、2・・・端末入力制御部、3・・・
入力記憶部、4・・・辞書検索部、5・・・辞書記憶部
、6・・・検索項目記憶部、7・・・クラス情報記憶部
、8・・・優先処理部、9・・・出力バッファ、10・
・・端末出力制御部、11・・・内部変換処理部、12
・・・出力合成部、慕1図 第2図 第+図 第5区

Claims (1)

  1. 【特許請求の範囲】 1、入力符号列を収容する入力記憶部と、該入力符号列
    に対応する工ないし複数個の出力符号列を収容する出力
    記憶部とを有する装置において、人力符号列あるいはそ
    の部分列と出力符号列あるいはその部分列との対応を与
    える項目の集合を保持する辞書記憶部と、辞書項目に対
    してその所属する工ないし複数個のクラスに対応する値
    を与えるクラス決定手段と、複数棟のクラスに関しクラ
    ス班みつけ情報を保持するクラス情報記憶部と、入力符
    号列の入力に対して該当する上記辞書記憶部の項目を検
    索する辞書検索部と、該辞書項目の所属クラスと上記ク
    ラス情報記憶部のクラス重みづけ情報とから上記検索の
    結果である該辞書項目の間の優先判定を行なう優先処理
    部とを具備したことを特徴とする符号列変換装置。 2、上記クラス決定手段の与える該辞書項目のクラス毎
    の値を、該辞書項目の所属するクラスと所属しないクラ
    スについて異なる値を取るものとし、さらに、上記クラ
    ス情報記憶部のクラス重みうけ情報を各クラスの重みを
    表わす数値とし、辞書項目毎にその所属クラスの重みづ
    け情報を加算して得られる数値の大小をもって該辞書項
    目間の優先判定を行なう優先処理部を有することを特徴
    とする特許請求の範囲第1項記載の符号列変換装置。 3、上記クラス決定手段の与える該辞書項目のクラス毎
    の値を、該辞書項目の所属するクラスについては該項目
    とクラスで決定される数値とし、所属しないクラスにつ
    いては値0とし、上記クラス情報記憶部のクラス重みづ
    け情報を各クラスの重みを表わす数値とし、該辞書項目
    毎に、該辞書項目に対応する各クラスの数値と重みづけ
    情報との積の和によって得られる数値を計算し、その大
    小をもって辞書項目間の優先判定を行なう優先処理部を
    有することを特徴とする特許請求の範囲第1項記載の符
    号列変換装置。 4、上記辞書検索において、入力符号列を部分列に分割
    し、その内1個の部分列について辞書検索を行ない、他
    の部分列については別途変換を行なう内部変換処理部と
    、辞書検索項目に該内部変換処理部の変換結果を付加す
    る出力合成部とを具備したことを特徴とする特許、請求
    の範囲第2項一1だは第3項記載の符号列変換装置。 5、上記優先処理の結果、優先順位が第1位でおる該Y
    ¥−書倹索項目を選択し、その出力符号列を上記出力合
    成部によって出力形式に整えて表示することを特徴とす
    る特計hh求の範囲第4項記載の符号列変換装置。 6、上記優先処理の結果、優先順位が第1位から下位の
    該辞1.検索項目へ順次その出力符号列を上記出力合成
    部によって出、方形式に整えて表示することを特徴とす
    る特許請求の範囲第4項記載の符号列変換装置。 7、上記クラス決定手段として、上記辞書記憶部の該辞
    書項目の中に出力符号列とともに、その所属クラスを識
    別する情報を収容することを特徴とする特許請求の範囲
    第1項記載の符号列変換装置
JP58241985A 1983-12-23 1983-12-23 符号列変換装置 Pending JPS60134959A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58241985A JPS60134959A (ja) 1983-12-23 1983-12-23 符号列変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58241985A JPS60134959A (ja) 1983-12-23 1983-12-23 符号列変換装置

Publications (1)

Publication Number Publication Date
JPS60134959A true JPS60134959A (ja) 1985-07-18

Family

ID=17082526

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58241985A Pending JPS60134959A (ja) 1983-12-23 1983-12-23 符号列変換装置

Country Status (1)

Country Link
JP (1) JPS60134959A (ja)

Similar Documents

Publication Publication Date Title
AU640828B2 (en) Database search processor
US5153831A (en) Electronic text
JP3525948B2 (ja) 情報検索装置
JPH02130673A (ja) データ検索方式
JPH021059A (ja) 連想検索システム
JPS60134959A (ja) 符号列変換装置
JP4247026B2 (ja) キーワード頻度算出方法及びそれを実行するプログラム
JPH08147289A (ja) かな漢字変換システム及びかな漢字変換方法
JPH07210565A (ja) 情報検索方法及び装置
JPH0514304B2 (ja)
JP2628775B2 (ja) 辞書作成装置
JPH02158870A (ja) データベース検索方式
JPS6126172A (ja) カナ漢字変換方式
JPH11143904A (ja) データベース検索方法,装置およびデータベース検索プログラムを記録した記録媒体
JPH04223550A (ja) 日本語処理装置
JP2537991B2 (ja) 文字入力装置および方法
JPS617937A (ja) 知識の連想検索方式
JPS60151779A (ja) 辞書検索方式
JPH0520323A (ja) 文字列変換装置
JPH11134340A (ja) データベース検索装置
JPH10269211A (ja) 日本語入力システムにおける日本語入力方法
JPH0816573A (ja) 日本語入力装置
JPH0748211B2 (ja) かな漢字変換装置
JPH01201723A (ja) 情報検索装置のキーワード処理方式
JPH0728835A (ja) 文書検索装置及びその方法