JPH01237877A - 漢字変換方式 - Google Patents
漢字変換方式Info
- Publication number
- JPH01237877A JPH01237877A JP63064950A JP6495088A JPH01237877A JP H01237877 A JPH01237877 A JP H01237877A JP 63064950 A JP63064950 A JP 63064950A JP 6495088 A JP6495088 A JP 6495088A JP H01237877 A JPH01237877 A JP H01237877A
- Authority
- JP
- Japan
- Prior art keywords
- word
- dictionary
- compound
- words
- provisional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000006243 chemical reaction Methods 0.000 title claims description 28
- 150000001875 compounds Chemical class 0.000 claims abstract description 40
- 238000000034 method Methods 0.000 claims description 19
- 230000000694 effects Effects 0.000 abstract description 6
- 240000000220 Panda oleosa Species 0.000 description 8
- 235000016496 Panda oleosa Nutrition 0.000 description 8
- 238000010586 diagram Methods 0.000 description 3
- 239000002131 composite material Substances 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
Landscapes
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(発明の技術分野〕
本発明は合成語の学習を効率良(行う漢字変換方式に関
する。
する。
かな等の読みから漢字あるいは漢字かな混じり文への変
換(以下、漢字変換と総称する)を行う場合、同音異字
語があれば、複数の漢字変換候補ができる。このような
場合、一般に変換候補に順序を付けて使用者に見せて選
択を行わせるようにしている。この表示順序は各単語が
記憶されている辞書内に書かれた同音異字の優先順位に
従い、その優先順位は使用者が最近選択したものが高い
優先順位となるような学習が行われている。これにより
使用者が一度選択した同音異字語は次には第1候補等の
高優先順位として表示されるようになる。同一文章内で
は同音異字語のうちの特定の1つの単語が多く使われる
という事実を考え合わせると、このような学習により漢
字入力の効率が大幅に向上する。これについては例えば
1983年12月12日発行の日経エレクトロニクスブ
ック「日本語処理」の第70ページに説明されている。
換(以下、漢字変換と総称する)を行う場合、同音異字
語があれば、複数の漢字変換候補ができる。このような
場合、一般に変換候補に順序を付けて使用者に見せて選
択を行わせるようにしている。この表示順序は各単語が
記憶されている辞書内に書かれた同音異字の優先順位に
従い、その優先順位は使用者が最近選択したものが高い
優先順位となるような学習が行われている。これにより
使用者が一度選択した同音異字語は次には第1候補等の
高優先順位として表示されるようになる。同一文章内で
は同音異字語のうちの特定の1つの単語が多く使われる
という事実を考え合わせると、このような学習により漢
字入力の効率が大幅に向上する。これについては例えば
1983年12月12日発行の日経エレクトロニクスブ
ック「日本語処理」の第70ページに説明されている。
辞書内に持つことができる単語の数は、辞書サイズと辞
書へのアクセス速度の面から限度がある。
書へのアクセス速度の面から限度がある。
そこで辞書に格納できない単語は辞書に格納されている
単語からアルゴリズムにより合成する。すなわち入力さ
れた読みのうちの辞書中の単語の読みと部分的に一致す
る部分を切り出すことにより入力された読みを構成要素
に分解し夫々の要素に対応する変換結果を所定の規則に
則って組み合わせる等のやりかたが取られている。これ
自体は当業者には周知の事項であるため、本明細書では
これ以上の説明は省略する。
単語からアルゴリズムにより合成する。すなわち入力さ
れた読みのうちの辞書中の単語の読みと部分的に一致す
る部分を切り出すことにより入力された読みを構成要素
に分解し夫々の要素に対応する変換結果を所定の規則に
則って組み合わせる等のやりかたが取られている。これ
自体は当業者には周知の事項であるため、本明細書では
これ以上の説明は省略する。
この合成語を他の同音異字語の中から選択した場合には
対応する単語が辞書中にないため、上述の学習はそのま
までは適用できない。そこでその合成語の要素となった
各単語についての学習を行いこれらの優先順位を上げる
ことにより、次回に同じ合成語が現れた場合の変換効率
を向上させようとしていた。
対応する単語が辞書中にないため、上述の学習はそのま
までは適用できない。そこでその合成語の要素となった
各単語についての学習を行いこれらの優先順位を上げる
ことにより、次回に同じ合成語が現れた場合の変換効率
を向上させようとしていた。
しかしながらこの従来方式では、合成語全体の学習は本
質的には行われていないことによる不都合が現れ、使い
勝手が充分に良好とは言えなかった。
質的には行われていないことによる不都合が現れ、使い
勝手が充分に良好とは言えなかった。
この不都合の例として例えば「報告会」と「最上階」と
いう語を「報告」と「会」、「最上」と「階」の合成語
として発生させる場合を考えよう。
いう語を「報告」と「会」、「最上」と「階」の合成語
として発生させる場合を考えよう。
「報告会」を漢字に変換した後には[かいJという読み
に対応する同音異字語の内「会」という漢字の優先順位
が上がり、「最上階」を漢字に変換した後では「階」な
る漢字の優先順位が上がる。
に対応する同音異字語の内「会」という漢字の優先順位
が上がり、「最上階」を漢字に変換した後では「階」な
る漢字の優先順位が上がる。
従って、「報告会」と「最上階」という語が両方とも多
数出現する文書をこのような漢字変換方式に基づく装置
で入力すると、「かい」の読みの学習効果により、「報
告階」や「最上会」なる変換候補が第1順位に頻繁に現
れ、学習を行うことが逆に変換効率を低下させる結果と
なる。
数出現する文書をこのような漢字変換方式に基づく装置
で入力すると、「かい」の読みの学習効果により、「報
告階」や「最上会」なる変換候補が第1順位に頻繁に現
れ、学習を行うことが逆に変換効率を低下させる結果と
なる。
本発明の課題は、上述した従来技術の問題点を解消し、
合成語について充分な学習を行うことができる漢字変換
方式を提供することである。
合成語について充分な学習を行うことができる漢字変換
方式を提供することである。
本発明の一実施例によれば、合成語が選択された場合は
、その合成語を暫定辞書に登録し、その後の学習はこの
暫定辞書の上で行うことにより、合成語の学習効果を高
める漢字変換方式が提供される。
、その合成語を暫定辞書に登録し、その後の学習はこの
暫定辞書の上で行うことにより、合成語の学習効果を高
める漢字変換方式が提供される。
第1図は本発明の漢字変換方式の一実施例を適用して構
成したかな漢字変換システムの構成を示すブロック図で
ある。
成したかな漢字変換システムの構成を示すブロック図で
ある。
同図において、入力部1から入力されたかな文字列は語
検索部2へ渡される。語検索部2では暫定辞書4と辞書
3を参照してこのかな文字列から単語や暫定辞書に既に
登録済の合成語(以下、これらを総称して語という)を
可能な限り取り出す。
検索部2へ渡される。語検索部2では暫定辞書4と辞書
3を参照してこのかな文字列から単語や暫定辞書に既に
登録済の合成語(以下、これらを総称して語という)を
可能な限り取り出す。
ここで辞書3には、このかな漢字変換システムの作成者
が始めから登録したかな漢字変換用データやその後この
システムの使用者等が追加登録したかな漢字変換用デー
タが入っており、また同音異字の単語の間で予め設定さ
れた優先順位も一緒に登録されている。暫定辞書4につ
いては以下で詳細に説明するが、使用者が漢字変換中に
選択した合成語や単語が、学習による優先順位を付して
自動的にここに登録される。
が始めから登録したかな漢字変換用データやその後この
システムの使用者等が追加登録したかな漢字変換用デー
タが入っており、また同音異字の単語の間で予め設定さ
れた優先順位も一緒に登録されている。暫定辞書4につ
いては以下で詳細に説明するが、使用者が漢字変換中に
選択した合成語や単語が、学習による優先順位を付して
自動的にここに登録される。
語検索部2によって取り出された語は合成語生成部5へ
渡される。語検索部2による取り出しの結果同音異字語
があった場合は、優先順位を付けて渡される。その際先
ず暫定辞書4から取り出された語に高い優先順位を付け
る。暫定辞書4からのものが出尽くした後、辞書3から
の語を暫定辞書4からのものよりも低い順位として辞書
3に登録されている順位に従って優先順位を割りつけて
渡す。
渡される。語検索部2による取り出しの結果同音異字語
があった場合は、優先順位を付けて渡される。その際先
ず暫定辞書4から取り出された語に高い優先順位を付け
る。暫定辞書4からのものが出尽くした後、辞書3から
の語を暫定辞書4からのものよりも低い順位として辞書
3に登録されている順位に従って優先順位を割りつけて
渡す。
合成語生成部5はもし必要なら語検索部2から渡された
各語から゛合成語を組立てた上で、語検索部2から渡さ
れた語とともに使用者選択部7へ渡す。この合成語の組
立が行われたときには、その合成語の優先順位は語検索
部2からのどの語よりも低い優先順位とする。また合成
語生成部5で複数の合成語が生成された場合のこれら相
互の優先順位の決め方は、その合成語の各要素の優先順
位、合成語を構成する要素の数、各要素間の結合度等の
文法的な法則その他各種の要因に基づいて行うことがで
きる。この決定法自体は本発明の要旨とは直接関係しな
いので、ここではこれ以上説明しない。
各語から゛合成語を組立てた上で、語検索部2から渡さ
れた語とともに使用者選択部7へ渡す。この合成語の組
立が行われたときには、その合成語の優先順位は語検索
部2からのどの語よりも低い優先順位とする。また合成
語生成部5で複数の合成語が生成された場合のこれら相
互の優先順位の決め方は、その合成語の各要素の優先順
位、合成語を構成する要素の数、各要素間の結合度等の
文法的な法則その他各種の要因に基づいて行うことがで
きる。この決定法自体は本発明の要旨とは直接関係しな
いので、ここではこれ以上説明しない。
使用者選択部7では合成語生成部5から与えられた語(
元々は語検索部2によって辞書3、暫定辞書4から検索
されたもの)および合成語(もしあれば)の同音異字語
を、これらに付随した優先順位に従って使用者に提示す
ることにより、図示されていない手段を用いて使用者に
その意図するものを選択せしめる。ここにおける提示法
や選択法の具体的な実現手法自体は周知事項なのでこれ
以上説明しない。
元々は語検索部2によって辞書3、暫定辞書4から検索
されたもの)および合成語(もしあれば)の同音異字語
を、これらに付随した優先順位に従って使用者に提示す
ることにより、図示されていない手段を用いて使用者に
その意図するものを選択せしめる。ここにおける提示法
や選択法の具体的な実現手法自体は周知事項なのでこれ
以上説明しない。
このようにして使用者により選択された同音異字語は出
力部8へ渡される。この同音異字語が第1優先順位でな
かった場合にはそれと同時に暫定辞書登録部6へも渡さ
れる。暫定辞書登録部6は暫定辞書4に対してこの同音
異字語の登録処理を行う。この処理においては、渡され
た同音異字語と同一のものが既に暫定辞書4に登録され
ていた場合にはその優先順位を第1優先順位に上げる。
力部8へ渡される。この同音異字語が第1優先順位でな
かった場合にはそれと同時に暫定辞書登録部6へも渡さ
れる。暫定辞書登録部6は暫定辞書4に対してこの同音
異字語の登録処理を行う。この処理においては、渡され
た同音異字語と同一のものが既に暫定辞書4に登録され
ていた場合にはその優先順位を第1優先順位に上げる。
まだ登録されていなかった場合には、その同音異字語を
暫定辞書4に登録し、同じ読みの他の綴りの同音異字語
が既に登録されていたのなら今登録した同音異字語の優
先順位を最上位にする。
暫定辞書4に登録し、同じ読みの他の綴りの同音異字語
が既に登録されていたのなら今登録した同音異字語の優
先順位を最上位にする。
このような登録処理をすることにより、辞書3には存在
しない合成語であっても、合成された形で暫定辞書4に
登録されまたそこで学習が通常の語と同様に行われる。
しない合成語であっても、合成された形で暫定辞書4に
登録されまたそこで学習が通常の語と同様に行われる。
辞書3中の語もそれが使用されれば暫定辞書4に登録さ
れる。従ってそれと同じ読みが与えられると、同一の語
が辞書3と暫定辞書4の双方から取り出されることにな
り、使用者に混乱を与える可能性がある。これを回避す
るためには、例えば語検索部2や合成語生成部5がその
ような重複を検出し2回目のものを抑止すればよい。
れる。従ってそれと同じ読みが与えられると、同一の語
が辞書3と暫定辞書4の双方から取り出されることにな
り、使用者に混乱を与える可能性がある。これを回避す
るためには、例えば語検索部2や合成語生成部5がその
ような重複を検出し2回目のものを抑止すればよい。
なお、暫定辞書4に登録された学習結果や新たな合成語
は後に辞書3に追加登録してもよい。また、複数の使用
者が入れ代わりでこのシステムを使用したり、あるいは
マルチユーザシステムで、複数の使用者が同時に使用す
る可能性がある場合には、辞書3を共通辞書、暫定辞書
4を各使用者別の辞書として構成することもできる。ま
た、入力しようとしている文書の種類や分野等に応じて
暫定辞書4を複数用意してもよい。
は後に辞書3に追加登録してもよい。また、複数の使用
者が入れ代わりでこのシステムを使用したり、あるいは
マルチユーザシステムで、複数の使用者が同時に使用す
る可能性がある場合には、辞書3を共通辞書、暫定辞書
4を各使用者別の辞書として構成することもできる。ま
た、入力しようとしている文書の種類や分野等に応じて
暫定辞書4を複数用意してもよい。
付言すれば、第1図に示したブロック図は本願発明の本
質を明確にするため、従来技術に属する部分については
構成要素およびこれら構成要素間のデータや制御の流れ
について簡略化して示しているが、当業者にとってはこ
れを参照して本発明を実施することは極めて容易である
ことは言うまでもない。
質を明確にするため、従来技術に属する部分については
構成要素およびこれら構成要素間のデータや制御の流れ
について簡略化して示しているが、当業者にとってはこ
れを参照して本発明を実施することは極めて容易である
ことは言うまでもない。
なお本発明は上で説明した実施例以外にも多様な実現形
態が可能である。
態が可能である。
例えばある程度長い読みを区切りなしで入力できるかな
漢字変換において頻繁に出現する合成語のパターンとし
て、例えば 「だい12かいJ というように、数字が途中に入るものがある。このよう
な合成語の場合でも、始めに説明したような理由で、合
成語を構成する各単語だけの学習では不都合が起こるの
で、本発明を適用するのは有効である。ただしこの場合
には、 「だい100かい」 のように、数字の部分を別の数に取り替えたものに対し
ても学習の効果が同様に及ぶことが望ましい。そこで、
この場合には、数字の部分をそのまま暫定辞書に登録す
るのではなく、例えば「だい*かいJ というように、数字から成る任意の文字列と一致すると
いう記号(ここでは*がそれを表す記号であるとしてい
る)の形で登録を行う。数字以外でもこのような「ワイ
ルドカード」規則を適用した方が好都合な局面にはこの
方式を適用できることは言うまでもない。
漢字変換において頻繁に出現する合成語のパターンとし
て、例えば 「だい12かいJ というように、数字が途中に入るものがある。このよう
な合成語の場合でも、始めに説明したような理由で、合
成語を構成する各単語だけの学習では不都合が起こるの
で、本発明を適用するのは有効である。ただしこの場合
には、 「だい100かい」 のように、数字の部分を別の数に取り替えたものに対し
ても学習の効果が同様に及ぶことが望ましい。そこで、
この場合には、数字の部分をそのまま暫定辞書に登録す
るのではなく、例えば「だい*かいJ というように、数字から成る任意の文字列と一致すると
いう記号(ここでは*がそれを表す記号であるとしてい
る)の形で登録を行う。数字以外でもこのような「ワイ
ルドカード」規則を適用した方が好都合な局面にはこの
方式を適用できることは言うまでもない。
また上に示した実施例では学習のアルゴリズムとして、
直前に使用された語の優先順位を最上位に上げ、同じ読
みの他の語については優先順位を皆−股下げる、と言う
ものを用いているが、本発明は他のアルゴリズムととも
に使用することができる。
直前に使用された語の優先順位を最上位に上げ、同じ読
みの他の語については優先順位を皆−股下げる、と言う
ものを用いているが、本発明は他のアルゴリズムととも
に使用することができる。
また、暫定辞書4には合成語およびその学習の結果だけ
を登録し、辞書3に既に登録されている単語の学習の結
果は辞書3等、暫定辞書4とは別の箇所に書き込んでも
よい。
を登録し、辞書3に既に登録されている単語の学習の結
果は辞書3等、暫定辞書4とは別の箇所に書き込んでも
よい。
また上に示した実施例では入力部1には読みとしてかな
文字列が与えられたが、ローマ字などのかな以外で読み
を表現する任意の入力を与えて構わない。更に、ローマ
字→かな→漢字(漢字かな混じり)というように、与え
られた読みを別の表現形式に変換した上で辞書を検索す
るようにしてもよい。
文字列が与えられたが、ローマ字などのかな以外で読み
を表現する任意の入力を与えて構わない。更に、ローマ
字→かな→漢字(漢字かな混じり)というように、与え
られた読みを別の表現形式に変換した上で辞書を検索す
るようにしてもよい。
以上詳細に説明したように、本発明によれば合成語につ
いても、始めから辞書に登録されている単語と同様な学
習効果が得られるので、使い込んでいくにつれて変換効
率が大幅に向上する漢字変換システムを実現することが
できる。
いても、始めから辞書に登録されている単語と同様な学
習効果が得られるので、使い込んでいくにつれて変換効
率が大幅に向上する漢字変換システムを実現することが
できる。
第1図は本発明の漢字変換方式の一実施例を通用して構
成したかな漢字変換システムの構成を示すブロック図で
ある。 1:入力部、 2:語検索部、 3:辞書、4:暫定辞
書、 5:合成語生成部、 6:暫定辞書登録部、 7:使用者選択部、8:出力部
。 出1頭人
成したかな漢字変換システムの構成を示すブロック図で
ある。 1:入力部、 2:語検索部、 3:辞書、4:暫定辞
書、 5:合成語生成部、 6:暫定辞書登録部、 7:使用者選択部、8:出力部
。 出1頭人
Claims (2)
- (1)入力された読みから漢字あるいは漢字かな混じり
文へ変換するための変換情報を記憶する辞書手段を有し
、前記辞書手段に記憶されていない語を前記辞書手段に
記憶されている語の合成語として生成する漢字変換方式
において、 前記辞書手段は第1辞書手段と第2辞書手段とを有し、 少なくとも前記生成された合成語であって変換結果とし
て採用されたものを前記第2辞書手段へ登録する ことを特徴とする漢字変換方式。 - (2)請求項1記載の漢字変換方式において、 前記第2辞書手段への登録に当たって合成語中の所定の
種類の文字列部分を当該種類の文字列の任意のものを指
示する形態で記述して登録を行うことを特徴とする漢字
変換方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63064950A JPH01237877A (ja) | 1988-03-18 | 1988-03-18 | 漢字変換方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63064950A JPH01237877A (ja) | 1988-03-18 | 1988-03-18 | 漢字変換方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH01237877A true JPH01237877A (ja) | 1989-09-22 |
Family
ID=13272824
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63064950A Pending JPH01237877A (ja) | 1988-03-18 | 1988-03-18 | 漢字変換方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH01237877A (ja) |
-
1988
- 1988-03-18 JP JP63064950A patent/JPH01237877A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS60235271A (ja) | かな漢字変換装置 | |
JPS60176169A (ja) | 文章処理装置 | |
JPH05113964A (ja) | 電子辞書 | |
JP3079844B2 (ja) | 全文データベースシステム | |
JPH01237877A (ja) | 漢字変換方式 | |
JPS59100941A (ja) | 仮名漢字変換装置 | |
JPH0452500B2 (ja) | ||
JPH0346857B2 (ja) | ||
JPH01214963A (ja) | 辞書引き装置 | |
JPH01307865A (ja) | 文字列検索方式 | |
JP3022080B2 (ja) | 全文データベースシステム | |
JPS6068425A (ja) | 学習機能を備えた仮名漢字変換装置 | |
JPS62263570A (ja) | 文書作成装置 | |
JP2633025B2 (ja) | 文章処理装置 | |
JPS60112175A (ja) | 仮名漢字変換装置における略称語変換方式 | |
JPS59116835A (ja) | 短縮入力機能付日本語入力装置 | |
JPH09282316A (ja) | 漢字仮名変換装置 | |
JPH0756944A (ja) | 全文データベースシステム | |
JPS6061824A (ja) | 文字変換装置 | |
JPS59167737A (ja) | かな漢字変換装置 | |
JPS61180360A (ja) | 文書編集装置 | |
JPH07225757A (ja) | 文書入力装置 | |
JPH05189414A (ja) | 文書作成装置及び方式 | |
JPS60140460A (ja) | カナ漢字変換装置における短縮変換方式 | |
JPS61169961A (ja) | ユ−ザ辞書を備えた文字処理装置 |