[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2012247948A - 辞書管理装置、辞書管理方法、辞書管理プログラム - Google Patents

辞書管理装置、辞書管理方法、辞書管理プログラム Download PDF

Info

Publication number
JP2012247948A
JP2012247948A JP2011118449A JP2011118449A JP2012247948A JP 2012247948 A JP2012247948 A JP 2012247948A JP 2011118449 A JP2011118449 A JP 2011118449A JP 2011118449 A JP2011118449 A JP 2011118449A JP 2012247948 A JP2012247948 A JP 2012247948A
Authority
JP
Japan
Prior art keywords
notation
main part
dictionary
similar
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011118449A
Other languages
English (en)
Inventor
Hideaki Iwamoto
秀明 岩本
Tomohiro Tanaka
智博 田中
Masayuki Sugizaki
正之 杉崎
Masashi Uchiyama
匡 内山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2011118449A priority Critical patent/JP2012247948A/ja
Publication of JP2012247948A publication Critical patent/JP2012247948A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】オンライン辞書について辞書管理の負担を軽減させた高品質な類似検索機能を提供する。
【解決手段】類似検索部3は、辞書管理者の入力表記に基づき全体辞書を検索し、入力表記に類似する表記を特定する。主要部特定部4は、類似検索手段で特定された類似表記と入力表記との共通部分を特定し、特定された共通部分が主要部辞書に存在すれば、該共通部分を主要部候補と判定する。この主要部候補を類似表記から除外した付加部候補が付加部辞書に存在するか否かを判定し、判定結果に応じて主要部候補を主要部と確定する。距離算出部5は、確定された各類似表記の主要部と入力表記の主要部との編集距離を算出する。更新確認部6は、算出された編集距離順に類似表記・主要部・付加部を辞書管理者に提示する。
【選択図】図2

Description

本発明は、例えば店舗名、会社名、商品名あるいはブランド名などの固有名称のオンライン辞書(Web辞書、Web辞典)を構築運用・管理するための技術に関する。
インターネット上には、非特許文献1.2に示すように、ユーザに言葉の意味の解説などを提供するオンライン辞書(以下、辞書とする。)が存在している。このような辞書、特に固有名称に関する辞書を構築する際には異なる名称表記であっても同一の固有実体を示している場合が少なくない。これをブランド名の固有名称に関する辞書の構築例に基づき説明する。ここではブランド名として次の表記A〜Fが存在するものとする。
A:ディオール(登録商標)
B:デイオール(登録商標)
C:クリスチャンデイオール(登録商標)
D:ディオールオム
E:ベビーディオール
F:フィオール
辞書管理者は、表記A〜Fのそれぞれが同一のブランドを示すか否かを判断しなければならない。そのため、固有名称の表記からなる辞書を構築運用あるいは管理するためには類似した表記を辞書管理者へ提示する類似検索機能が必要となる。
一般的に、このような類似検索には編集距離(レーベンシュタイン距離:Levenshtein Distance)が用いられている。この編集距離は、対比される表記(文字列)間の類似度(異なり具合)を定量化するための尺度を示す数値であり、文字の挿入/削除/置換で一方の表記を他方の表記に変形するための最小の編集手順回数とする。例えば対比される表記間で編集回数が多ければ、該表記間の編集距離は大きく、逆に該編集回数が小さければ、該表記間の編集距離は小さいと考えられる。
Figure 2012247948
表1は、ブランド名「ディオール」に対する表記A〜Fの編集距離および編集内容を示している。ここでは表記Aの「ディオール」は、対比されるブランド名そのものであるから編集距離「0」・編集内容「なし」と示されている。表記Bの「デイオール」は、編集距離「1」が示され、編集内容に「ィ」から「イ」の置換が示されている。表記Cの「クリスチャンデイオール」は、編集距離「7」が示され、編集内容に「クリスチャン」の挿入と「ィ」から「イ」の置換とが示されている。表記Dの「ディオールオム」は、編集距離「2」が示され、編集内容に「オム」の挿入が示されている。表記Eの「ベビーディオール」は、編集距離「3」が示され、編集内容に「ベビー」の挿入が示されている。表記Fの「フィオール」は、編集距離「1」が示され、編集内容に「デ」から「フ」の置換が示されている。
もっとも、辞書管理者などの感覚によれば、表記Fの「フィオール」よりも表記Cの「クリスチャンデイオール」が対比される「ディオール」と同じブランド名を示すと考えられる。そこで、特許文献1に示すように、形態素解析技術や固有表現抽出技術を用いて、表記から不要部分を削除して類似検索を行う方法が提案されている。この特許文献1では、Webページ等のテキスト中の表現と辞書等のデータベースの項目とを同定するために、例えば「クリスチャン」や「オム」や「ベビー」などの一般語あるいは人名等を不用語として除去したうえで類似検索を行っている。
特開2010−182082
"goo辞書",「online」 「平成23年5月11日検索」,インターネット<URL:http://dictionary.goo.ne.jp> "YAHOO!辞書",「online」 「平成23年5月11日検索」,インターネット<URL:http://dic.yahoo.co.jp>
しかしながら、特許文献1の方法によれば、一般語の辞書や人名や地名等固有名称の辞書など、さらに別の辞書を構築運用・管理しなければならず、却って辞書管理の負担を増大させるおそれがある。
本発明は、上述のような従来技術の問題点を解決するためになされたものであり、辞書管理の負担を軽減させた高品質な類似検索機能を提供することを解決課題としている。
そこで、本発明は、辞書表記を主要部と付加部とに分けて主要部の表記の相違(編集距離)を算出する。この算出順に辞書管理者に類似検索結果を提示することで辞書管理者に辞書の更新を確認する。
本発明の辞書管理装置としての一態様は、辞書管理者の入力表記に基づきオンライン辞書を検索し、該入力表記に類似する類似表記を特定する類似検索手段と、類似検索手段で特定された類似表記と入力表記とに対して、それぞれの表記の主要部を特定する主要部特定手段と、主要部特定手段で特定された各類似表記の主要部と入力表記の主要部との編集距離を算出する距離算出手段と、距離算出手段で算出された編集距離順に類似表記を辞書管理者に提示する更新確認手段と、を備える。
本発明の辞書管理装置としての他の態様は、オンライン辞書の各表記を主要部と付加部とに区別し、オンライン辞書を前記各表記に基づく全体辞書・前記各表記の主要部に基づく主要部辞書・前記各表記の付加部に基づく付加部辞書として構築運用・管理する。この装置は、辞書管理者の入力表記に基づき全体辞書を検索し、該入力表記に類似する表記を特定する類似検索手段と、類似検索手段で特定された類似表記と入力表記との共通部分を特定する共通部特定手段と、共通部特定手段で特定された共通部分が主要部辞書に存在すれば、該共通部分を類似表記・入力表記の主要部候補と判定する主要部判定手段と、主要部判定手段で判定された主要部候補を類似表記・入力表記から除外した付加部候補が付加部辞書すれば、類似表記の付加部と判定する付加部判定手段と、付加部判定手段の判定結果に応じて主要部候補を主要部と確定する主要部確定手段と、主要部確定手段で確定された各類似表記の主要部と入力表記の主要部との編集距離を算出する距離算出手段と、距離算出手段で算出された編集距離順に類似表記・類似表記の主要部・類似表記の付加部を辞書管理者に提示する更新確認手段と、を備える。
本発明の辞書管理方法としての一態様は、辞書管理者の入力表記に基づきオンライン辞書を検索し、該入力表記に類似する類似表記を特定する類似検索ステップと、類似検索ステップで特定された類似表記と入力表記とに対して、それぞれの表記の主要部を特定する主要部特定ステップと、主要部特定ステップで特定された各類似表記の主要部と入力表記の主要部との編集距離を算出する距離算出ステップと、距離算出ステップで算出された編集距離順に類似表記を辞書管理者に提示する更新確認ステップと、を有する。
本発明の辞書管理方法としての他の態様は、オンライン辞書の各表記を主要部と付加部とに区別し、オンライン辞書を前記各表記に基づく全体辞書・前記各表記の主要部に基づく主要部辞書・前記各表記の付加部に基づく付加部辞書として構築運用・管理する。この方法は、辞書管理者の入力表記に基づき全体辞書を検索し、該入力表記に類似する表記を特定する類似検索ステップと、類似検索ステップで特定された類似表記と入力表記との共通部分を特定する共通部特定ステップと、共通部特定ステップで特定された共通部分が主要部辞書に存在すれば、該共通部分を類似表記・入力表記の主要部候補と判定する主要部判定ステップと、主要部判定ステップで判定された主要部候補を類似表記・入力表記から除外した付加部候補が付加部辞書に存在するか否かを判定する付加部判定ステップと、付加部判定ステップの判定結果に応じて主要部候補を主要部と確定する主要部確定ステップと、主要部確定ステップで確定された各類似表記の主要部と入力表記の主要部との編集距離を算出する距離算出ステップと、距離算出ステップで算出された編集距離順に類似表記・類似表記の主要部・類似表記の付加部を辞書管理者に提示する更新確認ステップと、を有する。
前記主要部確定手段と前記主要部確定ステップの一態様は、前記判定結果が付加部辞書に存在することを示していれば主要部候補を主要部として確定する。一方、前記判定結果が付加部辞書に存在しないことを示していれば全体辞書の項目中、主要部候補に付加部候補を加えた表記の件数と主要部候補のみの件数とを計数し、件数が一致していれば、主要部候補に付加部候補を加えた表記を類似表記の主要部と確定する。この件数が一致していなければ主要部候補が類似表記として存在するか否かを確認し、類似表記として存在していれば主要部候補を主要部として確定する
なお、本発明は、前記装置としてコンピュータを機能させるプログラムの態様としてもよい。このプログラムは、ネットワークや記録媒体などを通じて提供することができる。
本発明によれば、辞書管理の負担を軽減させた高品質な類似検索機能が提供できる。
本発明の実施形態に係る辞書管理装置の機能ブロック図。 同 全体処理フロー図。 図2の辞書管理の詳細を示すフロー図。 図3の主要部特定ステップの詳細を示すフロー図。
以下、本発明の実施形態に係る辞書管理装置を説明する。この装置1は、図1に示すように、辞書管理者から入力された表記(以下、入力表記とする。)に基づき辞書2を類似検索する機能を果たし、該類似検索の検索結果を辞書管理者に提示することで辞書の更新を確認している。
すなわち、前記装置1は、Webサイトにおける辞書2の構築運用・管理に使用されている。ここでは前記装置1は、前記Webサイトのサーバにより構成され、通常のコンピュータのハードウェアリソース、例えば中央演算装置(CPUなど)や記憶装置(メモリやハードディスクドライブ装置など)などを備える。
このハードウェアリソースとソフトウェアリソース(OS.アプリケーションなど)との協働の結果、前記装置1は、図2に示すように、辞書管理者の入力表記に従って辞書2を類似検索する類似検索部3と、該類似検索部3により検索された類似表記および入力表記の主要部を特定する主要部特定部4と、主要部特定部4により特定された各類似表記の主要部と入力表記との編集距離を算出する距離算出部5と、距離算出部5により算出された編集距離順に類似表記を辞書管理者に提示して更新確認をする更新確認部6とを実装する。以下、前記装置1の辞書管理の処理内容を説明する。
≪辞書管理の内容≫
前記装置1は、図3に示すように、辞書2の表記を主要部と付加部とに分割し、辞書2を全体辞書2a・主要部辞書2b・付加部辞書2cの3つの辞書に分けて管理する。この辞書管理では、類似表記を辞書管理者に提示するにあたって編集距離に基づいて入力表記・類似表記間の距離を評価すると同時に該各表記を主要部と付加部とに分割する。
この主要部の編集距離が小さい順に辞書管理者に提示し、類似表記が同一実体を指し示すか否かを辞書管理者に確認し、確認の事実を記録する。このとき類似表記中の主要部と付加部も同様に確認・記録され、それらの確認結果を前記各辞書2a.2b.2cに反映させることで、次回の類似検索および主要部・付加部の分割精度を向上させている。以下、前記装置1の具体的な辞書管理(S01〜S04)を説明する。
S01:辞書管理者が、ある表記に関連する辞書項目を整備するために、その表記を入力し、かかる入力により前記装置1の辞書管理が開始される。この入力は、図示省略の端末でログインした後に入力してもよく、キーボード操作による入力でもよく、音声入力でもよいものとする。
ここでは辞書管理者は「クリスチャンディオールオム」という表記の関連項目整備のために該表記を入力したこととする。このとき類似検索部3は、入力表記「クリスチャンディオールオム」をキーに編集距離に基づく類似検索を行って全体辞書2aから入力表記に類似する辞書項目の表記を取得する。ここでは編集距離が閾値内の表記を類似表記として特定して全体辞書2aから取得するものとする。
Figure 2012247948
表2は、前記類似検索の検索結果を示している。ここでは入力表記「クリスチャンディオールオム」の類似表記毎に編集距離が示され、類似表記「クリスチャンデイオール」は編集距離「3」と示され、類似表記「ディオールオム」は編集距離「7」と示され、類似表記「ディオール」は編集距離「8」と示され、類似表記「デイオール」は編集距離「9」と示され、類似表記「ベビーディオール」は編集距離「3」と示され、類似表記「フィオール」は編集距離「9」と示されている。
S02:主要部特定部4は、S01で取得した類似検索結果の表記と入力表記とに対して、それぞれの表記の主要部を特定する。この主要部特定の詳細を図4に基づき説明する。まず処理が開始されるとS01の類似検索で取得した辞書項目の表記、即ち表2の類似表記と入力表記とが一致する共通項目(共通部)を特定する(S11)。
Figure 2012247948
Figure 2012247948
表3は、表2の類似表記毎に入力表記と一致する共通部を示し、類似表記「クリスチャンデイオール」は共通部「デ.オール」が示され、類似表記「ディオールオム」は共通部「ディオール」が示され、類似表記「ディオール」は共通部「ディオール」が示され、類似表記「デイオール」は共通部「デ.オール」が示され、類似表記「ベビーディオール」は共通部「ディオール」が示され、類似表記「フィオール」は共通部「ィオール」が示されている。ここで「.」は任意の1文字を表しているものとする。
表4は、入力表記の共通部を示している。この共通部としては、表3で示した各類似表記との共通部分中、最大の文字長の共通部分が選択される。ここでは表3中、「ディオールオム」・「ディオール」・「ベビーディオール」の共通部分「ディオール」が4文字で最も文字長が大きいため、入力表記の共通部として選択されている。
つぎに主要部特定部4は、S11で特定された表3.4の各共通部が主要部候補に該当するか否かを判定する(S12)。ここでは表3.4の各共通部に対して、主要部辞書2bに項目が存在するか否かを検査する。この検査結果が適正、即ち共通部が主要部辞書2bの項目として存在していれば、これを類似表記の主要部候補と判定する。
もっとも、検査結果が不適、即ち共通部が主要部辞書2bの項目として存在してなくとも同一の共通部が複数あれば、これを主要部候補と判定する。このとき共通部の構成中に「.」があれば、類似表記中の共通部に対応する文字列(「.」に対応する文字も含む。)を主要部候補と判定する。一方、検索結果が不適で、共通部分が複数ない場合には類似表記全体を主要部候補と判定する。ここでは主要部辞書2bには表5の項目が存在しているものとして主要部候補を判定する。
Figure 2012247948
Figure 2012247948
Figure 2012247948
表6は表3の共通部に対する検査結果を示し、表7は入力表記の共通部に対する検査結果を示している。この表6.7中、検査結果「○」は適正を示し、検査結果「×」は不適を示している。
表6中、類似表記「ディオールオム」、「ディオール」、「ベビーディオール」は、共通部「ディオール」が表5の主要部辞書2bに存在しているため、検査結果に「○」が示され、該共通部が主要部候補と判定されている。表7中の入力表記「クリスチャンディオールオム」も、同様に検査結果に「○」が示され、表4の共通部「ディオール」が主要部候補と判定されている。
類似表記「クリスチャンデイオール」および「デイオール」は、共通部「デ.オール」が表5の主要部辞書2bに存在しないため、検査結果に「×」が示されている。このとき共通部「デ.オール」は、構成中に「.」を含むため、それぞれ類似表記の対応文字列、即ち「デイオール」が主要部候補と判定されている。
類似表記「フィオール」は、共通部「ィオール」が表5の主要部辞書2bに存在しないため、検査結果に「×」が示されている。この共通部は複数個が存在しないため、「フィオール」の表記全体が主要部と判定されている。
そして、主要部特定部4は、S12の主要部判定結果に基づき付加部候補を定めて付加部候補が付加部辞書2cに項目として存在するか否かを検査し、付加部として適切か否かを判定する(S13)。この付加部候補は、各類似表記の文字列から主要部候補の文字列を除去した後の文字列とする。このとき類似表記と主要部候補とが同一の文字列のときには付加部候補が定められないため、S13の処理は省略される。ここでは付加部辞書2cには表8の項目が存在するとして付加部候補を検査する事例を説明する。
Figure 2012247948
Figure 2012247948
Figure 2012247948
表9は表3の類似表記に対する付加部候補の検査結果を示し、表10は表4の入力表記に対する付加部候補の検査結果を示している。この表9.10中、検査結果「○」は付加部として適正の判定を示し、検査結果「×」は付加部として不適の判定を示している。
ここで表9中、類似表記「ディオール」、「デイオール」、「フィオール」は、その文字列と主要部候補の文字列とが同一なため、S13の処理は省略され、表9には検査結果は示されていない。
類似表記「クリスチャンデイオール」の付加部候補「クリスチャン」と、類似表記「ベビーディオール」の付加部候補「ベビー」とは、それぞれ表8の付加部辞書2cの項目に存在しないため、検査結果に「×」が示されている。類似表記「ディオールオム」の付加部候補「オム」は、表8の付加部辞書2cの項目に存在するため、検査結果に「○」が示されている。
表10の入力表記「クリスチャンディオールオム」は、主要部候補「ディオール」の文字列を除くと「クリスチャン」および「オム」の付加部候補が抽出される。この付加部候補「クリスチャン」は付加部辞書2cの項目に存在しないため、検査結果に「×」が示されている一方、付加部候補「オム」は付加部辞書2cの項目に存在するため、検査結果に「○」が示されている。
最後に主要部特定部4は、S13の処理後に類似表記および入力表記の主要部を確定する。ここでS13の処理が省略された表記、即ち付加部候補が定められない類似表記および入力表記は主要部候補をそのまま主要部に確定する。一方、付加部候補が定められる類似表記および入力表記に対しては、S13の付加部判定の結果に応じて主要部を確定する(S14)。
すなわち、S13の付加部候補の判定結果が適正であれば主要部候補を主要部として確定する一方、該判定結果が不適であれば主要部候補に付加部候補を付加した表記と主要部候補の表記のそれぞれが全体辞書2aに項目として存在する件数を計数する。計数された件数が一致すれば主要部候補に付加部候補を付加した表記を主要部として確定する。
計数された件数が一致しなければ主要部候補が類似表記として存在するか否かを確認する。確認の結果、類似表記として存在していれば、主要部候補を主要部として確定し、確定された主要部を表記の文字列から除去して付加部を確定する。例えば類似表記「クリスチャンデイオール」の主要部候補「デイオール」は、他の類似表記「デイオール」として存在するため、類似表記「クリスチャンデイオール」の主要部に確定される。
また、類似表記「ベビーディオール」および入力表記「クリスチャンディオールオム」の主要部候補「ディオール」は、他の類似表記「ディオール」として存在するため、類似表記「ベビーディオール」の主要部に確定される。
確定された主要部をそれぞれの類似表記の文字列から除去した付加部候補を付加部に確定し、処理を終了する。このとき入力表記の前後の付加部候補「クリスチャン」と「オム」はそれぞれ付加部と確定される。この付加部の位置情報(主要部の前後)も求めておくものとする。なお、表11.12は、S02(S11〜S14)の処理で特定された各類似表記および入力表記の主要部を示している。
Figure 2012247948
Figure 2012247948
S03:距離算出部5は、S02で特定された各類似表記の主要部と入力表記の主要部との編集距離を算出する。表13は、表2の各類似表記の主要部と入力表記「クリスチャンディオールオム」の主要部との編集距離を示している。ここでは類似表記「クリスチャンデイオール」および「デイオール」の主要部「デイオール」は編集距離「1」と示されている。類似表記「ディオールオム」、「ディオール」、「ベビーディオール」の主要部「ディオール」は編集距離「0」と示されている。類似表記「フィオール」の主要部「フィオール」は編集距離「1」と示されている。
Figure 2012247948
S04:更新確認部6は、S03で算出した編集距離の小さい順に類似表記の主要部と付加部とを区別したデータを作成し、作成したデータを最終的な類似検索結果として辞書管理者に提示する(辞書管理者の端末に送信して表示させてもよい。)。
Figure 2012247948
表14は、辞書管理者に提示される類似検索結果を示している。この類似検索結果は表2の検索結果に基づき作成され、類似表記毎に主要部、付加部(主要部の前後)、編集距離が示されている。
したがって、辞書管理者は、提示された類似検索結果が入力表記と同じ実体を示すか否か、あるいは付加部「オム」、「ベビー」、「クリスチャン」が適正か否か、主要部「ディオール」、「デイオール」、「フィオール」が適正か否かを判断することができる。
この判断結果に応じて辞書管理者は、全体辞書2a、主要部辞書2b、付加部辞書2cの内容を更新することできる。すなわち、辞書管理者は表記の同定とともに主要部と付加部とを区別して辞書更新できるため、辞書管理を進めるに従って辞書の品質が向上し、辞書管理者の負担を軽減することができる。
このとき辞書管理者に提示される類似検索結果は、各類似表記における主要部の編集距離に応じて作成されているため、付記的な語が付加された類似表記であっても、辞書管理者に優先的に提示され、この点でも辞書品質の向上に貢献できる。
≪プログラムなど≫
本発明は、前記装置1の各部3〜6の一部もしくは全部として、コンピュータを機能させる辞書管理プログラムとして構成することもできる。この辞書管理プログラムによれば、S01〜S04.S11〜S14の一部あるいは全部をコンピュータに実行させることが可能となる。
この辞書管理プログラムは、Webサイトや電子メールなどネットワークを通じて提供することができる。また、この辞書管理プログラムは、CD−ROM,DVD−ROM,CD−R,CD−RW,DVD−R,DVD−RW,MO,HDD,BD−ROM,BD−R,BD−REなどの記録媒体に記録して、保存・配布することも可能である。この記録媒体は、記録媒体駆動装置を利用して読み出され、そのプログラムコード自体が前記実施形態の処理を実現するので、該記録媒体も本発明を構成する。
1…辞書管理装置
2…辞書(オンライン辞書)
2a…全体辞書
2b…主要部辞書
2c…付加部辞書
3…類似検索部(類似検索手段)
4…主要部特定部(主要部特定手段、共通部特定手段、主要部判定手段、付加部判定手段、主要部確定手段)
5…距離算出部(距離算出手段)
6…更新確認部(更新確認手段)

Claims (7)

  1. オンライン辞書を構築運用・管理するための辞書管理装置であって、
    辞書管理者の入力表記に基づきオンライン辞書を検索し、入力表記に類似する類似表記を特定する類似検索手段と、
    類似検索手段で特定された類似表記と入力表記とに対して、それぞれの表記の主要部を特定する主要部特定手段と、
    主要部特定手段で特定された各類似表記の主要部と入力表記の主要部との編集距離を算出する距離算出手段と、
    距離算出手段で算出された編集距離順に類似表記を辞書管理者に提示する更新確認手段と、
    を備えることを特徴とする辞書管理装置。
  2. オンライン辞書の各表記を主要部と付加部とに区別し、オンライン辞書を前記各表記に基づく全体辞書・前記各表記の主要部に基づく主要部辞書・前記各表記の付加部に基づく付加部辞書として構築運用・管理する辞書管理装置であって、
    辞書管理者の入力表記に基づき全体辞書を検索し、入力表記に類似する表記を特定する類似検索手段と、
    類似検索手段で特定された類似表記と入力表記との共通部分を特定する共通部特定手段と、
    共通部特定手段で特定された共通部分が主要部辞書に存在すれば、該共通部分を類似表記・入力表記の主要部候補と判定する主要部判定手段と、
    主要部判定手段で判定された主要部候補を類似表記・入力表記から除外した付加部候補が付加部辞書に存在するか否かを判定する付加部判定手段と、
    付加部判定手段の判定結果に応じて主要部候補を主要部と確定する主要部確定手段と、
    主要部確定手段で確定された各類似表記の主要部と入力表記の主要部との編集距離を算出する距離算出手段と、
    距離算出手段で算出された編集距離順に類似表記・類似表記の主要部・類似表記の付加部を辞書管理者に提示する更新確認手段と、
    を備えることを特徴とする辞書管理装置。
  3. 主要部確定手段は、付加部判定手段の判定結果が付加部辞書に存在することを示していれば主要部候補を主要部として確定する一方、
    前記判定結果が付加部辞書に存在しないことを示していれば全体辞書の項目中、主要部候補に付加部候補を加えた表記の件数と主要部候補のみの件数とを計数し、件数が一致していれば、主要部候補に付加部候補を加えた表記を類似表記の主要部と確定し、
    前記件数が一致していなければ主要部候補が類似表記として存在するか否かを確認し、類似表記として存在していれば主要部候補を主要部として確定する
    ことを特徴とする請求項2記載の辞書管理装置。
  4. オンライン辞書を構築運用・管理する装置の実行する辞書管理方法であって、
    辞書管理者の入力表記に基づきオンライン辞書を検索し、入力表記に類似する類似表記を特定する類似検索ステップと、
    類似検索ステップで特定された類似表記と入力表記とに対して、それぞれの表記の主要部を特定する主要部特定ステップと、
    主要部特定ステップで特定された各類似表記の主要部と入力表記の主要部との編集距離を算出する距離算出ステップと、
    距離算出ステップで算出された編集距離順に類似表記を辞書管理者に提示する更新確認ステップと、
    を有することを特徴とする辞書管理方法。
  5. オンライン辞書の各表記を主要部と付加部とに区別し、オンライン辞書を前記各表記に基づく全体辞書・前記各表記の主要部に基づく主要部辞書・前記各表記の付加部に基づく付加部辞書として構築運用・管理する装置の辞書管理方法であって、
    辞書管理者の入力表記に基づき全体辞書を検索し、入力表記に類似する表記を特定する類似検索ステップと、
    類似検索ステップで特定された類似表記と入力表記との共通部分を特定する共通部特定ステップと、
    共通部特定ステップで特定された共通部分が主要部辞書に存在すれば、該共通部分を類似表記・入力表記の主要部候補と判定する主要部判定ステップと、
    主要部判定ステップで判定された主要部候補を類似表記・入力表記から除外した付加部候補が付加部辞書に存在するか否かを判定する付加部判定ステップと、
    付加部判定ステップの判定結果に応じて主要部候補を主要部と確定する主要部確定ステップと、
    主要部確定ステップで確定された各類似表記の主要部と入力表記の主要部との編集距離を算出する距離算出ステップと、
    距離算出ステップで算出された編集距離順に類似表記・類似表記の主要部・類似表記の付加部を辞書管理者に提示する更新確認ステップと、
    を有することを特徴とする辞書管理方法。
  6. 主要部確定ステップは、付加部判定ステップの判定結果が付加部辞書に存在することを示していれば主要部候補を主要部として確定するステップと、
    前記判定結果が付加部辞書に存在しないことを示していれば全体辞書の項目中、主要部候補に付加部候補を加えた表記の件数と主要部候補のみの件数とを計数し、件数が一致していれば、主要部候補に付加部候補を加えた表記を類似表記の主要部と確定するステップと、
    前記件数が一致していなければ主要部候補が類似表記として存在するか否かを確認し、類似表記として存在していれば主要部候補を主要部として確定するステップと、
    を有することを特徴とする請求項5記載の辞書管理方法。
  7. 請求項1〜3のいずれか1項に記載の辞書管理装置の各手段としてコンピュータを機能させる辞書管理プログラム。
JP2011118449A 2011-05-26 2011-05-26 辞書管理装置、辞書管理方法、辞書管理プログラム Pending JP2012247948A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011118449A JP2012247948A (ja) 2011-05-26 2011-05-26 辞書管理装置、辞書管理方法、辞書管理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011118449A JP2012247948A (ja) 2011-05-26 2011-05-26 辞書管理装置、辞書管理方法、辞書管理プログラム

Publications (1)

Publication Number Publication Date
JP2012247948A true JP2012247948A (ja) 2012-12-13

Family

ID=47468344

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011118449A Pending JP2012247948A (ja) 2011-05-26 2011-05-26 辞書管理装置、辞書管理方法、辞書管理プログラム

Country Status (1)

Country Link
JP (1) JP2012247948A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017033434A (ja) * 2015-08-05 2017-02-09 大日本印刷株式会社 候補語評価装置、候補語評価システム、プログラム及び候補語評価方法
US10490189B2 (en) 2017-11-15 2019-11-26 Kabushiki Kaisha Toshiba Support system, support method, and memory medium
JP2020035126A (ja) * 2018-08-29 2020-03-05 Zホールディングス株式会社 ブランド辞書作成装置、商品等評価装置、ブランド辞書作成方法及びプログラム。
JPWO2020071286A1 (ja) * 2018-10-03 2021-09-02 パナソニックIpマネジメント株式会社 入力装置、入力方法および入力システム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017033434A (ja) * 2015-08-05 2017-02-09 大日本印刷株式会社 候補語評価装置、候補語評価システム、プログラム及び候補語評価方法
US10490189B2 (en) 2017-11-15 2019-11-26 Kabushiki Kaisha Toshiba Support system, support method, and memory medium
JP2020035126A (ja) * 2018-08-29 2020-03-05 Zホールディングス株式会社 ブランド辞書作成装置、商品等評価装置、ブランド辞書作成方法及びプログラム。
JPWO2020071286A1 (ja) * 2018-10-03 2021-09-02 パナソニックIpマネジメント株式会社 入力装置、入力方法および入力システム
JP7178576B2 (ja) 2018-10-03 2022-11-28 パナソニックIpマネジメント株式会社 入力装置、入力方法および入力システム

Similar Documents

Publication Publication Date Title
US10169337B2 (en) Converting data into natural language form
US8832126B2 (en) Custodian suggestion for efficient legal e-discovery
KR101511656B1 (ko) 퍼스널 아이덴티티를 기술하는 데이터에 대한 액셔너블 속성의 애스클라이빙
JP6008693B2 (ja) 情報処理装置及びその制御方法、プログラム
JP2012208547A (ja) 契約チェック支援装置及び契約チェック支援プログラム
JP2016099741A (ja) 情報抽出支援装置、方法およびプログラム
JP5836893B2 (ja) ファイル管理装置、ファイル管理方法、及びプログラム
JP2012247948A (ja) 辞書管理装置、辞書管理方法、辞書管理プログラム
Lachapelle COVID-19 preprints and their publishing rate: an improved method
JP2021060800A (ja) データ抽出方法、及びデータ抽出装置
JP2010061587A (ja) 類似文書判定装置、類似判定方法およびそのプログラム
JP4747752B2 (ja) 専門用語抽出装置、専門用語抽出方法および専門用語抽出プログラム
JP2012113459A (ja) 用例翻訳システム、用例翻訳方法及び用例翻訳プログラム
JP2011100191A (ja) 文書検索装置、文書検索方法、及び文書検索プログラム
US20090249197A1 (en) Document proofreading support method and document proofreading support apparatus
JP6191277B2 (ja) 情報処理装置、情報処理方法、プログラム
WO2021107006A1 (ja) 情報処理装置、情報処理方法及びプログラム
JP5393392B2 (ja) 時間表現抽出装置、時間表現抽出方法および時間表現抽出プログラム
CN114118078A (zh) 制作辅助装置、制作辅助方法及记录介质
JP2011100302A (ja) ランキング関数生成装置、ランキング関数生成方法、ランキング関数生成プログラム
JP2011086156A (ja) 漏洩情報追跡システムおよび漏洩情報追跡プログラム
JP6334803B1 (ja) 臨床検査結果編集装置
JP5379416B2 (ja) 言語処理装置および言語処理方法
JP6753190B2 (ja) 文書検索装置及びプログラム
JP2015162170A (ja) 情報処理装置、及び制御方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130830

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140304

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140701