[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JPH01237877A - Kanji conversion system - Google Patents

Kanji conversion system

Info

Publication number
JPH01237877A
JPH01237877A JP63064950A JP6495088A JPH01237877A JP H01237877 A JPH01237877 A JP H01237877A JP 63064950 A JP63064950 A JP 63064950A JP 6495088 A JP6495088 A JP 6495088A JP H01237877 A JPH01237877 A JP H01237877A
Authority
JP
Japan
Prior art keywords
word
dictionary
compound
words
provisional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63064950A
Other languages
Japanese (ja)
Inventor
Toshihisa Aoki
俊久 青木
Akiyasu Zen
全 明康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hewlett Packard Japan Inc
Original Assignee
Yokogawa Hewlett Packard Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yokogawa Hewlett Packard Ltd filed Critical Yokogawa Hewlett Packard Ltd
Priority to JP63064950A priority Critical patent/JPH01237877A/en
Publication of JPH01237877A publication Critical patent/JPH01237877A/en
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

PURPOSE:To heighten the learning effect of a compound word by registering the compound word on a provisional dictionary when the compound word is selected, and performing following learning on the provisional dictionary. CONSTITUTION:A KANA (Japanese syllabary) character string inputted from an input part 1 is delivered to a word retrieval part 2. The word retrieval part 2 takes out a word and the compound word as many as possible to referring to the provisional dictionary 4 and a dictionary 3. A priority order by learning is attached on a taken out word, however, at this time, a high priority order is attached on the word taken out of the provisional dictionary 4. A compound word generating part 5 assembles the compound word from each word delivered from the word retrieval part 2 when necessary, and after that, delivers it to a user selection part 7 with the word delivered from the word retrieval part 2. When the compound word is selected, it is registered if it is not registered on the provisional dictionary 4, and the highest priority order is attached on the word.

Description

【発明の詳細な説明】 (発明の技術分野〕 本発明は合成語の学習を効率良(行う漢字変換方式に関
する。
DETAILED DESCRIPTION OF THE INVENTION (Technical Field of the Invention) The present invention relates to a kanji conversion method for efficiently learning compound words.

〔従来技術およびその問題点〕[Prior art and its problems]

かな等の読みから漢字あるいは漢字かな混じり文への変
換(以下、漢字変換と総称する)を行う場合、同音異字
語があれば、複数の漢字変換候補ができる。このような
場合、一般に変換候補に順序を付けて使用者に見せて選
択を行わせるようにしている。この表示順序は各単語が
記憶されている辞書内に書かれた同音異字の優先順位に
従い、その優先順位は使用者が最近選択したものが高い
優先順位となるような学習が行われている。これにより
使用者が一度選択した同音異字語は次には第1候補等の
高優先順位として表示されるようになる。同一文章内で
は同音異字語のうちの特定の1つの単語が多く使われる
という事実を考え合わせると、このような学習により漢
字入力の効率が大幅に向上する。これについては例えば
1983年12月12日発行の日経エレクトロニクスブ
ック「日本語処理」の第70ページに説明されている。
When converting readings such as kana to kanji or sentences containing kanji and kana (hereinafter collectively referred to as kanji conversion), if there are homophones, multiple kanji conversion candidates can be created. In such cases, conversion candidates are generally presented in an order to the user for selection. This display order follows the priority order of homophones written in the dictionary in which each word is stored, and the priority order is learned so that the one selected most recently by the user has a higher priority. As a result, the homophone and allograph word once selected by the user is then displayed as a high priority, such as the first candidate. Considering the fact that one particular word among homophones is often used in the same sentence, this type of learning greatly improves the efficiency of kanji input. This is explained, for example, on page 70 of the Nikkei Electronics Book "Japanese Processing" published December 12, 1983.

辞書内に持つことができる単語の数は、辞書サイズと辞
書へのアクセス速度の面から限度がある。
The number of words that can be held in a dictionary is limited by the dictionary size and the speed of access to the dictionary.

そこで辞書に格納できない単語は辞書に格納されている
単語からアルゴリズムにより合成する。すなわち入力さ
れた読みのうちの辞書中の単語の読みと部分的に一致す
る部分を切り出すことにより入力された読みを構成要素
に分解し夫々の要素に対応する変換結果を所定の規則に
則って組み合わせる等のやりかたが取られている。これ
自体は当業者には周知の事項であるため、本明細書では
これ以上の説明は省略する。
Therefore, words that cannot be stored in the dictionary are synthesized using an algorithm from words stored in the dictionary. In other words, by cutting out the part of the input pronunciation that partially matches the pronunciation of the word in the dictionary, the input pronunciation is broken down into constituent elements, and the conversion result corresponding to each element is converted according to a predetermined rule. Some methods are being used, such as combining them. Since this itself is well known to those skilled in the art, further explanation will be omitted herein.

この合成語を他の同音異字語の中から選択した場合には
対応する単語が辞書中にないため、上述の学習はそのま
までは適用できない。そこでその合成語の要素となった
各単語についての学習を行いこれらの優先順位を上げる
ことにより、次回に同じ合成語が現れた場合の変換効率
を向上させようとしていた。
When this compound word is selected from among other homophones and allographs, there is no corresponding word in the dictionary, so the above-mentioned learning cannot be applied as is. Therefore, by learning each word that was an element of the compound word and raising the priority of these words, we tried to improve the conversion efficiency when the same compound word appeared next time.

しかしながらこの従来方式では、合成語全体の学習は本
質的には行われていないことによる不都合が現れ、使い
勝手が充分に良好とは言えなかった。
However, this conventional method suffers from the disadvantage that learning of the entire compound word is essentially not performed, and the usability cannot be said to be sufficiently good.

この不都合の例として例えば「報告会」と「最上階」と
いう語を「報告」と「会」、「最上」と「階」の合成語
として発生させる場合を考えよう。
As an example of this inconvenience, consider the case where the words "report meeting" and "top floor" are generated as compound words of "report" and "kai" and "mogami" and "floor."

「報告会」を漢字に変換した後には[かいJという読み
に対応する同音異字語の内「会」という漢字の優先順位
が上がり、「最上階」を漢字に変換した後では「階」な
る漢字の優先順位が上がる。
After converting ``report meeting'' into kanji, the priority of the kanji ``kai'' among the homophones corresponding to the reading kaiJ increases, and after converting ``the top floor'' into kanji, it becomes ``floor.'' Kanji will have higher priority.

従って、「報告会」と「最上階」という語が両方とも多
数出現する文書をこのような漢字変換方式に基づく装置
で入力すると、「かい」の読みの学習効果により、「報
告階」や「最上会」なる変換候補が第1順位に頻繁に現
れ、学習を行うことが逆に変換効率を低下させる結果と
なる。
Therefore, if a document in which the words "report meeting" and "top floor" both appear many times is input using a device based on such a kanji conversion method, the learning effect of the reading of "kai" will result in the words "reporting floor" and " A conversion candidate named ``Mogamikai'' frequently appears in the first rank, and learning results in a decrease in conversion efficiency.

〔発明の課題〕[Problem of invention]

本発明の課題は、上述した従来技術の問題点を解消し、
合成語について充分な学習を行うことができる漢字変換
方式を提供することである。
The object of the present invention is to solve the problems of the prior art described above,
An object of the present invention is to provide a kanji conversion method that allows sufficient learning of compound words.

〔発明の概要〕[Summary of the invention]

本発明の一実施例によれば、合成語が選択された場合は
、その合成語を暫定辞書に登録し、その後の学習はこの
暫定辞書の上で行うことにより、合成語の学習効果を高
める漢字変換方式が提供される。
According to an embodiment of the present invention, when a compound word is selected, the compound word is registered in a provisional dictionary, and subsequent learning is performed on this provisional dictionary, thereby increasing the learning effect of compound words. A Kanji conversion method is provided.

〔発明の実施例〕[Embodiments of the invention]

第1図は本発明の漢字変換方式の一実施例を適用して構
成したかな漢字変換システムの構成を示すブロック図で
ある。
FIG. 1 is a block diagram showing the configuration of a kana-kanji conversion system constructed by applying an embodiment of the kanji conversion method of the present invention.

同図において、入力部1から入力されたかな文字列は語
検索部2へ渡される。語検索部2では暫定辞書4と辞書
3を参照してこのかな文字列から単語や暫定辞書に既に
登録済の合成語(以下、これらを総称して語という)を
可能な限り取り出す。
In the figure, a kana character string input from an input section 1 is passed to a word search section 2. The word search unit 2 refers to the provisional dictionary 4 and the dictionary 3 and extracts as many words and compound words (hereinafter collectively referred to as words) already registered in the provisional dictionary from this kana character string as much as possible.

ここで辞書3には、このかな漢字変換システムの作成者
が始めから登録したかな漢字変換用データやその後この
システムの使用者等が追加登録したかな漢字変換用デー
タが入っており、また同音異字の単語の間で予め設定さ
れた優先順位も一緒に登録されている。暫定辞書4につ
いては以下で詳細に説明するが、使用者が漢字変換中に
選択した合成語や単語が、学習による優先順位を付して
自動的にここに登録される。
Here, Dictionary 3 contains Kana-Kanji conversion data that was registered from the beginning by the creator of this Kana-Kanji conversion system, as well as Kana-Kanji conversion data that has been additionally registered by users of this system, and also contains words with homophones and allographs. Priority orders set in advance are also registered. The provisional dictionary 4 will be described in detail below, but compound words and words selected by the user during kanji conversion are automatically registered here with priorities determined by learning.

語検索部2によって取り出された語は合成語生成部5へ
渡される。語検索部2による取り出しの結果同音異字語
があった場合は、優先順位を付けて渡される。その際先
ず暫定辞書4から取り出された語に高い優先順位を付け
る。暫定辞書4からのものが出尽くした後、辞書3から
の語を暫定辞書4からのものよりも低い順位として辞書
3に登録されている順位に従って優先順位を割りつけて
渡す。
The words retrieved by the word search section 2 are passed to the compound word generation section 5. If there are homophones and allographs as a result of retrieval by the word search unit 2, they are given in priority order. At this time, words taken out from the temporary dictionary 4 are first given a high priority. After the words from the provisional dictionary 4 are exhausted, the words from the dictionary 3 are assigned a priority order according to the order registered in the dictionary 3 as a lower order than the words from the provisional dictionary 4 and handed over.

合成語生成部5はもし必要なら語検索部2から渡された
各語から゛合成語を組立てた上で、語検索部2から渡さ
れた語とともに使用者選択部7へ渡す。この合成語の組
立が行われたときには、その合成語の優先順位は語検索
部2からのどの語よりも低い優先順位とする。また合成
語生成部5で複数の合成語が生成された場合のこれら相
互の優先順位の決め方は、その合成語の各要素の優先順
位、合成語を構成する要素の数、各要素間の結合度等の
文法的な法則その他各種の要因に基づいて行うことがで
きる。この決定法自体は本発明の要旨とは直接関係しな
いので、ここではこれ以上説明しない。
The compound word generation section 5 assembles a compound word from each word passed from the word search section 2, if necessary, and passes it to the user selection section 7 together with the word passed from the word search section 2. When this compound word is assembled, the compound word has a lower priority than any word from the word search unit 2. Furthermore, when a plurality of compound words are generated by the compound word generation unit 5, how to determine the mutual priority among them is the priority of each element of the compound word, the number of elements making up the compound word, the connection between each element. This can be done based on grammatical rules such as degrees and various other factors. Since this determination method itself is not directly related to the gist of the present invention, it will not be further explained here.

使用者選択部7では合成語生成部5から与えられた語(
元々は語検索部2によって辞書3、暫定辞書4から検索
されたもの)および合成語(もしあれば)の同音異字語
を、これらに付随した優先順位に従って使用者に提示す
ることにより、図示されていない手段を用いて使用者に
その意図するものを選択せしめる。ここにおける提示法
や選択法の具体的な実現手法自体は周知事項なのでこれ
以上説明しない。
The user selection unit 7 selects the word (
(originally retrieved from the dictionary 3, provisional dictionary 4 by the word search unit 2) and compound words (if any) by presenting them to the user according to their associated priority order. The user is forced to choose what he or she intends to do by using means that are not available. The specific implementation methods of the presentation method and selection method used here are well known, so they will not be explained further.

このようにして使用者により選択された同音異字語は出
力部8へ渡される。この同音異字語が第1優先順位でな
かった場合にはそれと同時に暫定辞書登録部6へも渡さ
れる。暫定辞書登録部6は暫定辞書4に対してこの同音
異字語の登録処理を行う。この処理においては、渡され
た同音異字語と同一のものが既に暫定辞書4に登録され
ていた場合にはその優先順位を第1優先順位に上げる。
The homonyms selected by the user in this manner are passed to the output section 8. If this homonym is not the first priority, it is also passed to the provisional dictionary registration unit 6 at the same time. The provisional dictionary registration unit 6 performs registration processing of this homophone and allograph word in the provisional dictionary 4. In this process, if the same homophone and allograph that has been passed is already registered in the provisional dictionary 4, its priority is raised to the first priority.

まだ登録されていなかった場合には、その同音異字語を
暫定辞書4に登録し、同じ読みの他の綴りの同音異字語
が既に登録されていたのなら今登録した同音異字語の優
先順位を最上位にする。
If it has not been registered yet, register that homophone in the provisional dictionary 4, and if a homophone with the same pronunciation and other spellings has already been registered, change the priority of the newly registered homophone. Make it the top.

このような登録処理をすることにより、辞書3には存在
しない合成語であっても、合成された形で暫定辞書4に
登録されまたそこで学習が通常の語と同様に行われる。
By performing such a registration process, even a compound word that does not exist in the dictionary 3 is registered in the temporary dictionary 4 in a synthesized form, and is studied there in the same way as a normal word.

辞書3中の語もそれが使用されれば暫定辞書4に登録さ
れる。従ってそれと同じ読みが与えられると、同一の語
が辞書3と暫定辞書4の双方から取り出されることにな
り、使用者に混乱を与える可能性がある。これを回避す
るためには、例えば語検索部2や合成語生成部5がその
ような重複を検出し2回目のものを抑止すればよい。
Words in the dictionary 3 are also registered in the temporary dictionary 4 if they are used. Therefore, if the same reading is given, the same word will be retrieved from both the dictionary 3 and the provisional dictionary 4, which may confuse the user. In order to avoid this, for example, the word search section 2 or the compound word generation section 5 should detect such duplication and suppress the second duplication.

なお、暫定辞書4に登録された学習結果や新たな合成語
は後に辞書3に追加登録してもよい。また、複数の使用
者が入れ代わりでこのシステムを使用したり、あるいは
マルチユーザシステムで、複数の使用者が同時に使用す
る可能性がある場合には、辞書3を共通辞書、暫定辞書
4を各使用者別の辞書として構成することもできる。ま
た、入力しようとしている文書の種類や分野等に応じて
暫定辞書4を複数用意してもよい。
Note that the learning results and new compound words registered in the provisional dictionary 4 may be additionally registered in the dictionary 3 later. In addition, if multiple users take turns using this system, or if there is a possibility that multiple users will use the system at the same time, Dictionary 3 can be used as a common dictionary, and Temporary Dictionary 4 can be used for each. It can also be configured as a dictionary for each person. Further, a plurality of provisional dictionaries 4 may be prepared depending on the type of document to be inputted, field, etc.

付言すれば、第1図に示したブロック図は本願発明の本
質を明確にするため、従来技術に属する部分については
構成要素およびこれら構成要素間のデータや制御の流れ
について簡略化して示しているが、当業者にとってはこ
れを参照して本発明を実施することは極めて容易である
ことは言うまでもない。
In addition, in order to clarify the essence of the present invention, in the block diagram shown in FIG. 1, components that belong to the prior art and the flow of data and control between these components are shown in a simplified manner. However, it goes without saying that it is extremely easy for those skilled in the art to refer to this and implement the present invention.

なお本発明は上で説明した実施例以外にも多様な実現形
態が可能である。
Note that the present invention can be realized in various forms other than the embodiments described above.

例えばある程度長い読みを区切りなしで入力できるかな
漢字変換において頻繁に出現する合成語のパターンとし
て、例えば 「だい12かいJ というように、数字が途中に入るものがある。このよう
な合成語の場合でも、始めに説明したような理由で、合
成語を構成する各単語だけの学習では不都合が起こるの
で、本発明を適用するのは有効である。ただしこの場合
には、 「だい100かい」 のように、数字の部分を別の数に取り替えたものに対し
ても学習の効果が同様に及ぶことが望ましい。そこで、
この場合には、数字の部分をそのまま暫定辞書に登録す
るのではなく、例えば「だい*かいJ というように、数字から成る任意の文字列と一致すると
いう記号(ここでは*がそれを表す記号であるとしてい
る)の形で登録を行う。数字以外でもこのような「ワイ
ルドカード」規則を適用した方が好都合な局面にはこの
方式を適用できることは言うまでもない。
For example, is it possible to enter a fairly long reading without any breaks?As a compound word pattern that frequently appears in kanji conversion, there are cases where a number is inserted in the middle, such as ``dai 12 kai J''.Even in the case of compound words like this, , for the reason explained at the beginning, it is inconvenient to learn only each word that makes up a compound word, so it is effective to apply the present invention.However, in this case, it is effective to apply the present invention. Furthermore, it is desirable that the learning effect also be applied to items in which numbers are replaced with other numbers. Therefore,
In this case, instead of registering the numeric part as is in the provisional dictionary, for example, ``Dai*kaiJ'', a symbol that indicates a match with any character string consisting of digits (here * is the symbol that represents it) is used. It goes without saying that this method can be applied to situations other than numbers where it would be more convenient to apply such a "wildcard" rule.

また上に示した実施例では学習のアルゴリズムとして、
直前に使用された語の優先順位を最上位に上げ、同じ読
みの他の語については優先順位を皆−股下げる、と言う
ものを用いているが、本発明は他のアルゴリズムととも
に使用することができる。
In addition, in the example shown above, as a learning algorithm,
The method uses a method that raises the priority of the word that was used immediately before, and lowers the priority of other words with the same reading, but the present invention can be used in conjunction with other algorithms. Can be done.

また、暫定辞書4には合成語およびその学習の結果だけ
を登録し、辞書3に既に登録されている単語の学習の結
果は辞書3等、暫定辞書4とは別の箇所に書き込んでも
よい。
Further, only compound words and their learning results may be registered in the provisional dictionary 4, and the results of learning words already registered in the dictionary 3 may be written in a location other than the provisional dictionary 4, such as the dictionary 3.

また上に示した実施例では入力部1には読みとしてかな
文字列が与えられたが、ローマ字などのかな以外で読み
を表現する任意の入力を与えて構わない。更に、ローマ
字→かな→漢字(漢字かな混じり)というように、与え
られた読みを別の表現形式に変換した上で辞書を検索す
るようにしてもよい。
Further, in the embodiment shown above, a kana character string is given to the input unit 1 as the reading, but any input expressing the reading other than kana, such as Roman characters, may be given. Furthermore, the given pronunciation may be converted into another expression format, such as Romaji → Kana → Kanji (a mixture of Kanji and Kana), and then the dictionary may be searched.

〔発明の効果〕〔Effect of the invention〕

以上詳細に説明したように、本発明によれば合成語につ
いても、始めから辞書に登録されている単語と同様な学
習効果が得られるので、使い込んでいくにつれて変換効
率が大幅に向上する漢字変換システムを実現することが
できる。
As explained in detail above, according to the present invention, the same learning effect can be obtained for compound words as for words that are registered in the dictionary from the beginning, so the conversion efficiency can be greatly improved as the words are used more effectively. system can be realized.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の漢字変換方式の一実施例を通用して構
成したかな漢字変換システムの構成を示すブロック図で
ある。 1:入力部、 2:語検索部、 3:辞書、4:暫定辞
書、 5:合成語生成部、 6:暫定辞書登録部、 7:使用者選択部、8:出力部
。 出1頭人
FIG. 1 is a block diagram showing the configuration of a kana-kanji conversion system constructed using an embodiment of the kanji conversion method of the present invention. 1: Input section, 2: Word search section, 3: Dictionary, 4: Temporary dictionary, 5: Composite word generation section, 6: Temporary dictionary registration section, 7: User selection section, 8: Output section. 1 person out

Claims (2)

【特許請求の範囲】[Claims] (1)入力された読みから漢字あるいは漢字かな混じり
文へ変換するための変換情報を記憶する辞書手段を有し
、前記辞書手段に記憶されていない語を前記辞書手段に
記憶されている語の合成語として生成する漢字変換方式
において、 前記辞書手段は第1辞書手段と第2辞書手段とを有し、 少なくとも前記生成された合成語であって変換結果とし
て採用されたものを前記第2辞書手段へ登録する ことを特徴とする漢字変換方式。
(1) It has a dictionary means for storing conversion information for converting input pronunciations into kanji or kanji-kana mixed sentences, and converts words not stored in the dictionary means into words stored in the dictionary means. In a kanji conversion method that generates a compound word, the dictionary means has a first dictionary means and a second dictionary means, and at least the generated compound word adopted as a conversion result is stored in the second dictionary. A kanji conversion method that is characterized by registering into means.
(2)請求項1記載の漢字変換方式において、 前記第2辞書手段への登録に当たって合成語中の所定の
種類の文字列部分を当該種類の文字列の任意のものを指
示する形態で記述して登録を行うことを特徴とする漢字
変換方式。
(2) In the kanji conversion method according to claim 1, when registering in the second dictionary means, a character string portion of a predetermined type in a compound word is written in a form indicating an arbitrary character string of the type. A kanji conversion method characterized by registration.
JP63064950A 1988-03-18 1988-03-18 Kanji conversion system Pending JPH01237877A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63064950A JPH01237877A (en) 1988-03-18 1988-03-18 Kanji conversion system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63064950A JPH01237877A (en) 1988-03-18 1988-03-18 Kanji conversion system

Publications (1)

Publication Number Publication Date
JPH01237877A true JPH01237877A (en) 1989-09-22

Family

ID=13272824

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63064950A Pending JPH01237877A (en) 1988-03-18 1988-03-18 Kanji conversion system

Country Status (1)

Country Link
JP (1) JPH01237877A (en)

Similar Documents

Publication Publication Date Title
JPS60235271A (en) Kana-kanji converting device
JPS60176169A (en) Sentence processor
JPH05113964A (en) Electronic dictionary
JP3079844B2 (en) Full-text database system
JPH01237877A (en) Kanji conversion system
JPS59100941A (en) Kana (japanese syllabary)-kanji (chinese character) converter
JPH0452500B2 (en)
JPH0346857B2 (en)
JPH01214963A (en) Device for consulting dictionary
JPH01307865A (en) Character string retrieving system
JP3022080B2 (en) Full-text database system
JPS6068425A (en) Kana/kanji converter having learning function
JPS62263570A (en) Document forming device
JP2633025B2 (en) Sentence processing equipment
JPS60112175A (en) Abbreviation conversion system of kana (japanese syllabary)/kanji (chinese character) convertor
JPS59116835A (en) Japanese input device with input abbreviating function
JPH09282316A (en) Kanji-to-kana conversion device
JPH0756944A (en) Whole sentence data base system
JPS59167737A (en) Kana-kanji converting device
JPS61180360A (en) Document editing device
JPH07225757A (en) Document input device
JPH05189414A (en) Word processor and its system
JPS60140460A (en) Abbreviated converting system in kana (japanese syllabary) kanji (chinese character) converter
JPS61169961A (en) Character processor provided with user dictionary
JPH08147282A (en) Device and method for kana/kanji conversion