JP3254642B2 - 索引の表示方法 - Google Patents
索引の表示方法Info
- Publication number
- JP3254642B2 JP3254642B2 JP00302296A JP302296A JP3254642B2 JP 3254642 B2 JP3254642 B2 JP 3254642B2 JP 00302296 A JP00302296 A JP 00302296A JP 302296 A JP302296 A JP 302296A JP 3254642 B2 JP3254642 B2 JP 3254642B2
- Authority
- JP
- Japan
- Prior art keywords
- index
- document
- file
- word
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
- G06F16/319—Inverted lists
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Description
物、文書ファイル全般を対象とした索引の表示方法に関
する。
文中にある各索引候補の語句を索引作成者が指定して、
索引候補辞書に登録する際に、索引場所を抽出し索引化
を行うか、または、辞書の単語について再検索を行い、
位置抽出によって索引化を行っていた。この種の索引作
成方法に関しては、例えば、特開昭62-154025号 公報に
開示された技術が知られている。この技術では、文書作
成時の「変換を行う時点」で、その単語に関する索引登録
指示を行っていた。また、特開昭61-75952号公報に開示
された技術では、文章の入力中に、文章中のキーワード
を自動的に抽出し、文章と関連づけてファイルへの格納
を行っている。この方法では、抽出したすべての語句を
文書に関連づけて、ファイルに格納している。
前者では、索引登録指示は人間の操作により行われてい
たため、単語の登録数が多い場合には索引作成者の作業
量が膨大なものとなるという問題があった。また、後者
では、索引化候補となる語句が膨大な数となるため、実
際に索引化する語句を選択する作業量が大きくなってし
まうという問題点があった。すなわち、上記いずれの技
術においても、索引作成者の作業量が大きくなってしま
うという問題、および、キーワードの自動抽出は、文章
の入力時に限られてしまうという問題があった。また、
従来の技術では、電子化された文書ファイルへの索引付
けは行われていたが、これを用いる文書の出力方法、す
なわち、生成した索引の利用方法については配慮されて
いなかった。本発明は上記事情に鑑みてなされたもの
で、その目的とするところは、従来の技術における上述
の如き問題を解消し、ユーザが設定した索引化抽出条件
に基づいて索引の見出しに用いる単語を選び出し、複数
ファイルを自由に組み合わせて、独自の索引を作成・利
用することが可能な索引の表示方法を提供することにあ
る。
索引語句と、文書に付された文書名と、前記索引語句の
文書中のページ番号とが対応付けて格納された索引ファ
イルから抽出された文書名とページ番号とを表示する索
引の表示方法であって、指定された複数の索引ファイル
名が付された索引ファイルから、指定された複数の索引
語句と対応付けられた文書名とページ番号とを抽出し、
抽出されたそれぞれの前記文書名と前記ページ番号と
を、指定された前記索引語句ごとに表示する索引の表示
方法、索引語句をソートする順序を受け付け、前記抽
出されたそれぞれの前記文書名と前記ページ番号とを、
受け付けた前記索引語句ごとに表示する際に、受け付け
た前記ソートする順序に従って表示することを特徴とす
る索引の表示方法、および前記ソートする順序とは、
登録順、文字コード順、文字種別毎の読み方順、文字種
別の区別なしの読み方順のいずれかであることを特徴と
する索引の表示方法、および、前記抽出されたそれぞ
れの前記文書名と前記ページ番号とを、受け付けた前記
索引語句ごとに表示する際に、抽出されたそれぞれの前
記文書名毎にウィンドウに表示することを特徴とする索
引の表示方法、によりそれぞれ達成される。
おいては、初めに、既に存在している電子化ファイルに
ついてトークン化する。ここで、「トークン」とは、字句
解析,構文解析等により文中から切り出される語句を指
しており、「トークン化」とは、この手順を指している。
すなわち、上述のトークン化では、文章を読み込んで文
節毎に区切り、その文節を単語毎に分解することによ
り、単語の自動切り出しを行う。次に、その単語の中か
らユーザが設定した索引化抽出条件に基づいて索引の見
出しに用いる単語を選び出す。そして、この索引の見出
しに用いる単語中から、ユーザが指定・入力する索引化
抽出条件に基づいて索引化候補単語を選び出すことによ
って、抽出の際の作業量は、従来よりも少なくなる。こ
れにより、候補単語から索引となる単語を抽出する際、
迅速に作業を進めることができる。また、ユーザが索引
化抽出条件を指定することによって、個々のユーザの必
要性に応じた索引の作成が可能となる。更に、再度索引
を作成し直すことも容易に実現できる。本発明に係る索
引自動生成方法を複数文書を対象に適用することによ
り、広範囲にわたる索引を作成が可能となる。更に、既
存の索引を参照することにより、新出単語のみの索引あ
るいは新出単語を強調した索引作りが可能となり、ユー
ザは新たに加えられた語句を素早く検索することができ
る。以下、本発明の実施例を図面に基づいてより詳細に
説明する。
図1および図2は、本発明の一実施例に係る索引自動作
成システムの全体構成を示すものである。両図に示す如
く、本発明に係る索引自動作成システムは、文書ファイ
ル1の内容を読み込んで語句を切り出してトークン化2
し、辞書3aと照合した後に索引化候補ファイル4に登
録する単語登録部10、および、ユーザが入力した索引
化抽出条件を設定し、その条件に基づいて選択した語句
を索引ファイル5に登録する索引作成部20、そして、
複数の索引ファイル5から表示条件に合わせて表示を行
う索引表示部30から構成される。すなわち、本実施例
に係る索引自動作成システムにおいては、単語登録部1
0により電子化された文書ファイル1から索引化候補フ
ァイル4を作成し、更に、索引作成部20により索引化
抽出条件に基づいて索引ファイル5を作成し、索引表示
部30により生成した表示出力する。
て、単語登録部10において候補単語の登録を行う。電
子化された文書ファイル1は、語句の切り出し機能11
を持つ字句パーサ(解析機能)によって自動的に単語とし
て切り出され、トークン化される。ここで、抽出の際に
比較条件として必要となる文書別情報,語句別情報,位
置情報を単語毎に設定する。これをトークン化語句ファ
イル2に格納し、辞書3aと照合する。照合された語句
は、候補単語の登録機能12によってこれらの情報と共
に候補ファイル4へ格納される。次に、索引作成部20
では、まず、索引化抽出条件の設定機能21によってユ
ーザが入力した条件を設定する。そして、候補単語の抽
出機能22によってこの候補ファイル4内の語句を取り
出し、語句の各情報を設定条件と比較して、索引化する
単語を抽出する。抽出された単語およびその情報を索引
ファイル5へ登録する。
において、まず、複数の索引ファイル5をマージし、マ
ージ済み索引ファイル6を作成する。それからユーザの
出力指定条件に合わせて索引出力リストを作り、索引の
表示・出力を行う。以下、本実施例に係る索引自動作成
システムを構成する各部分について、詳細に説明する。
まず、電子化されたファイル1から、語句切り出し用辞
書,翻訳用辞書等3bを用いて単語を切り出し、候補単
語の登録を行う単語登録部10の処理に関するフローチ
ャートを、図3に示す。初めに、文書ファイル1からフ
ァイルの内容を読み込む(ステップ111)。その内容を
字句パーサによってトークン化する(ステップ112)。
トークン化した語句が持つことのできる各情報のフォー
マットを、図7に示した。図7に示す如く、トークン化
した語句は、単語の読み方,文書別情報(複数項目可),
位置情報(複数項目可)および語句別情報等を単語毎に持
つことができる。
マットに従って、文書の登録時期,文書名あるいは文書
ID/文書ファイル名,文書の作者名,文書の発行者ま
たは発行社,文書の最終利用時期といった文書別情報を
持っている。そして、前述の単語の切り出しと同時に、
文書から文書別情報を取得し、図7に示したフォーマッ
トに従ってその内容をセットする(ステップ113)。な
お、このステップ113と上述のステップ112は、順
序を入れ替えてもよい。また、それぞれの語句に関し
て、電子化された文書ファイル1中での位置情報を抽出
する(ステップ114)。位置情報は、図7に示した如
く、語句が抽出された位置に関する情報であり、文書中
のページ,ページ中の行数および行の中で何番めの語で
あるかを示す語数から成る。そして、語句については、
どの国で使われている言語かを示す国別言語,単語を構
成する文字が漢字かな混じり,英数字,特殊文字および
それらの混合の内のどれであるかを示す文字種別、単語
の品詞といった語句別情報を字句パーサにおいて取得す
る(ステップ115)。このステップ115と上述のステ
ップ114の順序も、入れ替えてもよい。
ォーマットに従って、これらの情報を単語と共にトーク
ン化語句ファイル2に格納する(ステップ116)。文書
ファイル1内にまだ語句が残っているか否かを判断し
(ステップ117)、残っていれば、ステップ112〜1
16を繰り返し行う。次に、トークン化語句ファイル2
内の語句を取り出して(ステップ121)、語句と品詞を
キーとして、辞書3aとの照合を行う。辞書3aの単語
は、図9に示したフォーマットに従って、単語毎に単語
の読み方,単語の品詞を持っている。図7に示したトー
クン化語句の各情報のうち、語句名と品詞について、辞
書3a中のそれぞれの語句と比較する。この辞書3との
照合(ステップ122)により、語句の読み方を取得し
(ステップ123)、同一語句の出現回数のカウントを行
う(ステップ124)。そして、各情報と共に、図10の
フォーマットに従って候補ファイル4へ格納する(ステ
ップ125)。
トは、図7に示したトークン化語句ファイルのフォーマ
ットと同じであり、格納されている単語毎に単語の読み
方,文書別情報,位置情報および語句別情報を持ってい
る。ここで、トークン化語句ファイル2のフォーマット
との相違点は、位置情報が1つの単語に対して複数の情
報を持つことが可能であるという点である。その後、ト
ークン化語句ファイル2内にまだ語句が残っている否か
かを判断し(ステップ126)、まだ語句が残っていれ
ば、ステップ121〜125の処理を繰り返し行う。な
お、文書ファイル1が複数ある場合には、同様にして各
々の文書ファイル1に対応した候補ファイル4を作成
し、次の索引作成部20においてマージして、1つの索
引ファイル5を作成する。
成する索引作成部20の処理に関するフローチャート
を、図4に示す。索引候補として抽出された語句を、索
引ファイル5に格納するか否かは、ユーザが指定する索
引化抽出条件によって決定する。ここで、指定された索
引化抽出条件(ステップ211)は、図11に示したフォ
ーマットに従って、索引作成部20に与えられる(ステ
ップ212)。なお、この索引化抽出条件は、ユーザが
直接入力する方式、または、予め用意した組み合わせの
中からユーザが選択する方式のいずれでもよい。索引化
抽出条件は、例えば、次の12種類とする。一例を挙げ
れば、条件(9)国別単語において、日本語を選択した場
合には、条件(9)は「言語が日本語である単語」となる。
また、条件(3)対象文書,条件(4)対象文書ID/ファ
イル名の指定は、複数文書あるいは複数ファイルの指定
も可能である。
る単語,・・・・) (2) 登録期間別(指定年月日以降,指定年月日以前) (3) 対象文書名(文書1,文書2,・・・・) (4) 対象文書ID/ファイル名(ファイル1,ファイ
ル2,・・・・) (5) 作者別 (6) 部門別(専門分野毎) (7) 発行社・者別 (8) 最終利用時期(指定年月日以前・以降に利用した
もの) (9) 国別言語(日本語,英語,その他の言語) (10) 文字種別(英数字,漢字かな混じり,記号,混合) (11) 品詞(動詞,名詞,形容詞,・・・・) (12) 出現頻度(指定したしきい値の回数以上出現した
単語を可とする)
イル4がまだ残っているか否かを確認する(ステップ2
21)。まだ残っていたら、その候補ファイル4中にま
だ読み込んでいない語句があるか否かを確認する(ステ
ップ222)。残っていたら、語句の取得(ステップ22
3)を行う。ここで、候補ファイル4から抽出した語句
に関する項目の内容と、設定された索引化抽出条件の項
目内容とを比較して(ステップ224)、語句の選択を行
う。条件の比較は、索引化抽出条件の各項目のうち、ユ
ーザが指定した項目のみを比較対象とする。比較する条
件についてすべて一致した語句が、ここで索引に掲載す
る語句として選択され、図12に示したフォーマットに
従って、索引ファイル5に登録される(ステップ22
5)。一つでも条件が不一致となった語句は、索引ファ
イル5へ登録しない。
定(ステップ225)したら、次の語句の有無の確認(ス
テップ222)からの手順を繰り返す。ここで、単語に
関する情報が指定される索引ファイル5は、図12に示
した如く、図7のトークン化語句ファイル2,図10の
候補ファイル4と同じフォーマットを持つ。これら前出
のフォーマットとの相違点は、索引対象とする文書を示
す文書別情報のうち、文書名あるいは文書ID/ファイ
ル名は複数指定できることである。語句の有無の確認
(ステップ222)において、候補ファイル4中に読み込
むべき語句がなくなったら、候補ファイル4の有無の確
認(ステップ221)へ戻り、以上の手順を繰り返す。な
お、候補ファイル4の有無の確認(ステップ221)にお
いて、読み込むべき候補ファイル4が既になければ、索
引ファイル5の作成が完了する。
て、索引ファイル5に登録された単語の一覧を各情報と
共に表示できる索引表示部30について、図5および図
6に示したフローチャートを用いて説明する。まず、索
引ファイル5の内容を表示する(ステップ311)。この
とき、語句に関する情報のうち、ユーザが訂正したい箇
所があるか否かを、ユーザに確認する(ステップ31
2)。訂正の必要があれば、訂正する(ステップ31
3)。次に、ユーザが指定する表示・出力したい索引フ
ァイルの名称またはIDを、図13に示したフォーマッ
トに従って設定する(ステップ314)。この出力指定に
おいて複数のファイルを指定した際には、それらのファ
イルの内容をマージする必要があるか否かについても設
定する。そして、このマージ指定の欄を参照して、既存
の索引ファイルをマージさせる必要性の有無を判断する
(ステップ315)。もし、マージさせる必要がある場合
は、その指定に従って各文書の索引ファイル5をマージ
し、新たなマージ済み索引ファイル6を作成する(ステ
ップ316)。
4に示したフォーマットに従って設定する(ステップ3
17)。表示条件によって指定できる出力形式は、図1
4に示す如く、表示項目,文書別表示形式,ソート順,
表示出力形式の4種類である。表示項目では、各単語が
持っている情報のうち、単語名と共に出力する項目を選
択する。表示項目は、複数指定可とする。文書別表示形
式とは、複数文書それぞれの単独文書索引、または、複
数文書の情報をマージさせて混在している文書混合索引
のどちらかを選択する。2つの文書から索引を作成する
際の出力として、図15に単独文書索引、図16に文書
混合索引の表示形式の一例を示した。ソート順では、登
録順にファイルに格納されている各情報をソートする際
のキーとなる項目を示す。
別毎の読み方順,文字種別の区別なしの読み方順のいず
れかを選択する。表示出力形式とは、出力先をファイル
にするのか、ディスプレイ上に画面出力するのかを選択
する。指定された索引ファイル5あるいはマージ済み索
引ファイル6の内容をソートして出力リスト7を作成
し、ユーザの指定条件のとおりに出力・表示する(ステ
ップ318)。更に、索引語句指定による本文出力機能
32では、表示された索引語句を指定(同時複数指定も
可とする)し、これに該当する本文(文書ファイルの該当
ページ)を、出力表示する(ステップ319)。前述の
如く、従来は、対象文書の語句の中から索引化するため
の語句を個々に指定していたため作業量が大きかった
が、上記実施例によれば、索引対象語句を条件付きで抽
出するために、索引作成の工数が大幅に低減するという
効果が得られる。なお、上記実施例は本発明の一例を示
したものであり、本発明はこれに限定されるべきもので
はないことは言うまでもないことである。以上、詳細に
説明した如く、本発明によれば、ユーザが設定した索引
化抽出条件に基づいて索引の見出しに用いる単語を選び
出すことを可能にする索引生成方法、該索引生成方法に
より生成された索引の効果的な利用方法、および索引生
成装置を実現できるという顕著な効果を奏するものであ
る。 より具体的には、従来の索引が文書,出版物の作成
側により作成されていたのに対して、本発明では、ユー
ザ側が個々に利用目的に合わせて、見たい単語だけを容
易に索引化することが可能となる。ユーザは、今まで、
文書毎にばらばらな索引を引きながら複数文書を取り扱
ってきたが、本発明によって、複数ファイルを自由に組
み合わせて、独自の索引を作成・利用することが可能に
なる。
れば、ユーザが複数の索引ファイルと索引語句とを指定
し、文書名と検索語句の位置情報とを対応付けた情報
を、索引語句ごとに表示する索引の表示方法により、生
成された索引の効果的な利用方法を実現できるという顕
著な効果を奏するものである。より具体的では、従来の
索引が文書,出版物の作成側により作成されていたのに
対して、本発明では、ユーザ側が個々の利用目的に合わ
せて、見たい単語を容易に索引化することが可能とな
る。ユーザは、今まで、文書毎にばらばらな索引を引き
ながら複数文書を取り扱ってきたが、本発明によって、
複数ファイルを自由に組み合わせて、独自の索引を作成
・利用することが可能になる。
の構成の概略を示すブロック図(その1)である。
の構成の概略を示すブロック図(その2)である。
トである。
トである。
ト(その1)である。
ト(その2)である。
マット例を示す図である。
示す図である。
ある。
を示す図である。
例を示す図である。
を示す図である。
す図である。
す図である。
す図である。
す図である。
Claims (4)
- 【請求項1】 索引語句と、文書に付された文書名と、
前記索引語句の文書中のページ番号とが対応付けて格納
された索引ファイルから抽出された文書名とページ番号
とを表示する索引の表示方法であって、指定された複数の 索引ファイル名が付された索引ファイ
ルから、指定された複数の索引語句と対応付けられた文
書名とページ番号とを抽出し、 抽出されたそれぞれの前記文書名と前記ページ番号と
を、指定された前記索引語句ごとに表示する索引の表示
方法。 - 【請求項2】 索引語句をソートする順序を受け付け、 前記抽出されたそれぞれの前記文書名と前記ページ番号
とを、受け付けた前記索引語句ごとに表示する際に、 受け付けた前記ソートする順序に従って表示することを
特徴とする請求項1記載の索引の表示方法。 - 【請求項3】 前記ソートする順序とは、登録順、文字
コード順、文字種別毎の読み方順、文字種別の区別なし
の読み方順のいずれかであることを特徴とする請求項2
記載の索引の表示方法。 - 【請求項4】 前記抽出されたそれぞれの前記文書名と
前記ページ番号とを、受け付けた前記索引語句ごとに表
示する際に、 抽出されたそれぞれの前記文書名毎にウィンドウに表示
することを特徴とする請求項1記載の索引の表示方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP00302296A JP3254642B2 (ja) | 1996-01-11 | 1996-01-11 | 索引の表示方法 |
US08/778,096 US5983171A (en) | 1996-01-11 | 1997-01-02 | Auto-index method for electronic document files and recording medium utilizing a word/phrase analytical program |
EP02020636A EP1271355A3 (en) | 1996-01-11 | 1997-01-07 | Auto-index method |
EP97300042A EP0784280A3 (en) | 1996-01-11 | 1997-01-07 | Auto-index method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP00302296A JP3254642B2 (ja) | 1996-01-11 | 1996-01-11 | 索引の表示方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09190449A JPH09190449A (ja) | 1997-07-22 |
JP3254642B2 true JP3254642B2 (ja) | 2002-02-12 |
Family
ID=11545712
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP00302296A Expired - Fee Related JP3254642B2 (ja) | 1996-01-11 | 1996-01-11 | 索引の表示方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US5983171A (ja) |
EP (2) | EP1271355A3 (ja) |
JP (1) | JP3254642B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210042024A (ko) | 2019-10-08 | 2021-04-16 | 아즈빌주식회사 | 오류 판정 장치 및 방법 |
JP7126971B2 (ja) | 2019-03-13 | 2022-08-29 | 日産合成工業株式会社 | バイパスペレット飼料の製造方法及びバイパスペレット飼料 |
Families Citing this family (82)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8352400B2 (en) | 1991-12-23 | 2013-01-08 | Hoffberg Steven M | Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore |
US5822720A (en) | 1994-02-16 | 1998-10-13 | Sentius Corporation | System amd method for linking streams of multimedia data for reference material for display |
JP3143079B2 (ja) | 1997-05-30 | 2001-03-07 | 松下電器産業株式会社 | 辞書索引作成装置と文書検索装置 |
JPH11224263A (ja) * | 1998-02-09 | 1999-08-17 | Fuji Xerox Co Ltd | キーワード検索装置及びキーワード検索プログラムを記録したコンピュータ読み取り可能な記録媒体 |
US6092074A (en) | 1998-02-10 | 2000-07-18 | Connect Innovations, Inc. | Dynamic insertion and updating of hypertext links for internet servers |
JP3696731B2 (ja) | 1998-04-30 | 2005-09-21 | 株式会社日立製作所 | 構造化文書の検索方法および装置および構造化文書検索プログラムを記録したコンピュータ読み取り可能な記録媒体 |
US7770123B1 (en) * | 1998-05-08 | 2010-08-03 | Apple Inc. | Method for dynamically generating a “table of contents” view of a HTML-based information system |
GB2338089A (en) * | 1998-06-02 | 1999-12-08 | Sharp Kk | Indexing method |
US6466901B1 (en) | 1998-11-30 | 2002-10-15 | Apple Computer, Inc. | Multi-language document search and retrieval system |
US7904187B2 (en) | 1999-02-01 | 2011-03-08 | Hoffberg Steven M | Internet appliance system and method |
US6473729B1 (en) * | 1999-12-20 | 2002-10-29 | Xerox Corporation | Word phrase translation using a phrase index |
US8205237B2 (en) | 2000-09-14 | 2012-06-19 | Cox Ingemar J | Identifying works, using a sub-linear time search, such as an approximate nearest neighbor search, for initiating a work-based action, such as an action on the internet |
US6708161B2 (en) * | 2000-09-26 | 2004-03-16 | I2 Technologies Us, Inc. | System and method for selective database indexing |
JP2003006216A (ja) * | 2001-06-26 | 2003-01-10 | Sony Corp | 情報処理装置および情報処理方法、記録媒体、プログラム、並びに電子出版用データ提供システム |
US7130861B2 (en) | 2001-08-16 | 2006-10-31 | Sentius International Corporation | Automated creation and delivery of database content |
US6678699B2 (en) | 2001-10-09 | 2004-01-13 | International Business Machines Corporation | Visual indexing of displayable digital documents |
US20030105622A1 (en) * | 2001-12-03 | 2003-06-05 | Netbytel, Inc. | Retrieval of records using phrase chunking |
NZ518744A (en) * | 2002-05-03 | 2004-08-27 | Hyperbolex Ltd | Electronic document indexing using word use nodes, node objects and link objects |
US20040006459A1 (en) * | 2002-07-05 | 2004-01-08 | Dehlinger Peter J. | Text-searching system and method |
US7181451B2 (en) * | 2002-07-03 | 2007-02-20 | Word Data Corp. | Processing input text to generate the selectivity value of a word or word group in a library of texts in a field is related to the frequency of occurrence of that word or word group in library |
US7003516B2 (en) * | 2002-07-03 | 2006-02-21 | Word Data Corp. | Text representation and method |
US7386442B2 (en) * | 2002-07-03 | 2008-06-10 | Word Data Corp. | Code, system and method for representing a natural-language text in a form suitable for text manipulation |
US20040006547A1 (en) * | 2002-07-03 | 2004-01-08 | Dehlinger Peter J. | Text-processing database |
US7024408B2 (en) | 2002-07-03 | 2006-04-04 | Word Data Corp. | Text-classification code, system and method |
US7016895B2 (en) | 2002-07-05 | 2006-03-21 | Word Data Corp. | Text-classification system and method |
US20040054520A1 (en) * | 2002-07-05 | 2004-03-18 | Dehlinger Peter J. | Text-searching code, system and method |
US8255417B2 (en) * | 2003-05-20 | 2012-08-28 | Google Inc. | System and method for providing definitions |
US7707039B2 (en) * | 2004-02-15 | 2010-04-27 | Exbiblio B.V. | Automatic modification of web pages |
US8442331B2 (en) | 2004-02-15 | 2013-05-14 | Google Inc. | Capturing text from rendered documents using supplemental information |
US10635723B2 (en) | 2004-02-15 | 2020-04-28 | Google Llc | Search engines and systems with handheld document data capture devices |
US20060041484A1 (en) * | 2004-04-01 | 2006-02-23 | King Martin T | Methods and systems for initiating application processes by data capture from rendered documents |
US8799303B2 (en) | 2004-02-15 | 2014-08-05 | Google Inc. | Establishing an interactive environment for rendered documents |
US7812860B2 (en) | 2004-04-01 | 2010-10-12 | Exbiblio B.V. | Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device |
US9116890B2 (en) | 2004-04-01 | 2015-08-25 | Google Inc. | Triggering actions in response to optically or acoustically capturing keywords from a rendered document |
US7894670B2 (en) | 2004-04-01 | 2011-02-22 | Exbiblio B.V. | Triggering actions in response to optically or acoustically capturing keywords from a rendered document |
US7990556B2 (en) | 2004-12-03 | 2011-08-02 | Google Inc. | Association of a portable scanner with input/output and storage devices |
US8793162B2 (en) | 2004-04-01 | 2014-07-29 | Google Inc. | Adding information or functionality to a rendered document via association with an electronic counterpart |
US20060098900A1 (en) * | 2004-09-27 | 2006-05-11 | King Martin T | Secure data gathering from rendered documents |
US9143638B2 (en) | 2004-04-01 | 2015-09-22 | Google Inc. | Data capture from rendered documents using handheld device |
US20070300142A1 (en) | 2005-04-01 | 2007-12-27 | King Martin T | Contextual dynamic advertising based upon captured rendered text |
US8146156B2 (en) | 2004-04-01 | 2012-03-27 | Google Inc. | Archive of text captures from rendered documents |
US8621349B2 (en) | 2004-04-01 | 2013-12-31 | Google Inc. | Publishing techniques for adding value to a rendered document |
US20080313172A1 (en) | 2004-12-03 | 2008-12-18 | King Martin T | Determining actions involving captured information and electronic content associated with rendered documents |
US9008447B2 (en) | 2004-04-01 | 2015-04-14 | Google Inc. | Method and system for character recognition |
US20060081714A1 (en) | 2004-08-23 | 2006-04-20 | King Martin T | Portable scanning device |
US8713418B2 (en) | 2004-04-12 | 2014-04-29 | Google Inc. | Adding value to a rendered document |
US8489624B2 (en) | 2004-05-17 | 2013-07-16 | Google, Inc. | Processing techniques for text capture from a rendered document |
US9460346B2 (en) | 2004-04-19 | 2016-10-04 | Google Inc. | Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device |
US8620083B2 (en) | 2004-12-03 | 2013-12-31 | Google Inc. | Method and system for character recognition |
US20050289182A1 (en) * | 2004-06-15 | 2005-12-29 | Sand Hill Systems Inc. | Document management system with enhanced intelligent document recognition capabilities |
US8346620B2 (en) | 2004-07-19 | 2013-01-01 | Google Inc. | Automatic modification of web pages |
US20060036649A1 (en) * | 2004-08-12 | 2006-02-16 | Simske Steven J | Index extraction from documents |
US8805803B2 (en) * | 2004-08-12 | 2014-08-12 | Hewlett-Packard Development Company, L.P. | Index extraction from documents |
US20060047656A1 (en) * | 2004-09-01 | 2006-03-02 | Dehlinger Peter J | Code, system, and method for retrieving text material from a library of documents |
US20110029504A1 (en) * | 2004-12-03 | 2011-02-03 | King Martin T | Searching and accessing documents on private networks for use with captures from rendered documents |
WO2006094151A2 (en) * | 2005-03-01 | 2006-09-08 | Adapt Technologies Inc., | Query-less searching |
US8051045B2 (en) * | 2005-08-31 | 2011-11-01 | Sap Ag | Archive indexing engine |
KR100664311B1 (ko) | 2005-11-18 | 2007-01-04 | 삼성전자주식회사 | 자동 인덱스 생성이 가능한 화상형성장치 및 그 자동인덱스 생성방법 |
US20110096174A1 (en) * | 2006-02-28 | 2011-04-28 | King Martin T | Accessing resources based on capturing information from a rendered document |
US7660787B2 (en) * | 2006-07-19 | 2010-02-09 | International Business Machines Corporation | Customized, personalized, integrated client-side search indexing of the web |
WO2008029881A1 (fr) * | 2006-09-07 | 2008-03-13 | Nec Corporation | Système de traitement du langage naturel et système d'enregistrement de dictionnaire |
EP2067119A2 (en) | 2006-09-08 | 2009-06-10 | Exbiblio B.V. | Optical scanners, such as hand-held optical scanners |
US20110035662A1 (en) | 2009-02-18 | 2011-02-10 | King Martin T | Interacting with rendered documents using a multi-function mobile device, such as a mobile phone |
US20090132406A1 (en) * | 2007-11-21 | 2009-05-21 | Paperless Office Solutions, Inc. D/B/A Docvelocity | System and method for paperless loan applications |
US8447066B2 (en) * | 2009-03-12 | 2013-05-21 | Google Inc. | Performing actions based on capturing information from rendered documents, such as documents under copyright |
CN102349087B (zh) | 2009-03-12 | 2015-05-06 | 谷歌公司 | 自动提供与捕获的信息例如实时捕获的信息关联的内容 |
US9081799B2 (en) | 2009-12-04 | 2015-07-14 | Google Inc. | Using gestalt information to identify locations in printed information |
US9323784B2 (en) | 2009-12-09 | 2016-04-26 | Google Inc. | Image search using text-based elements within the contents of images |
TW201211798A (en) * | 2010-09-13 | 2012-03-16 | jun-da Li | Establishment method and use method of dictionary index |
US10339173B2 (en) * | 2010-09-27 | 2019-07-02 | Adobe Inc. | Content aggregation |
US9824091B2 (en) | 2010-12-03 | 2017-11-21 | Microsoft Technology Licensing, Llc | File system backup using change journal |
US8620894B2 (en) | 2010-12-21 | 2013-12-31 | Microsoft Corporation | Searching files |
US20120284276A1 (en) * | 2011-05-02 | 2012-11-08 | Barry Fernando | Access to Annotated Digital File Via a Network |
US20130024459A1 (en) * | 2011-07-20 | 2013-01-24 | Microsoft Corporation | Combining Full-Text Search and Queryable Fields in the Same Data Structure |
US9218411B2 (en) | 2012-08-07 | 2015-12-22 | International Business Machines Corporation | Incremental dynamic document index generation |
TWI459223B (zh) * | 2012-08-15 | 2014-11-01 | Hon Hai Prec Ind Co Ltd | 海量資料索引建立系統及方法 |
US9588971B2 (en) | 2014-02-03 | 2017-03-07 | Bluebeam Software, Inc. | Generating unique document page identifiers from content within a selected page region |
WO2017139793A1 (en) | 2016-02-12 | 2017-08-17 | Bluebeam Software, Inc. | Method of computerized presentation of a document set view for auditing information and managing sets of multiple documents and pages |
US20180089241A1 (en) * | 2016-09-29 | 2018-03-29 | Intel Corporation | Context enhanced indexing |
US11151108B2 (en) * | 2016-11-21 | 2021-10-19 | International Business Machines Corporation | Indexing and archiving multiple statements using a single statement dictionary |
CN106649597B (zh) * | 2016-11-22 | 2019-10-01 | 浙江大学 | 一种基于图书内容的图书书后索引自动构建方法 |
US11144579B2 (en) * | 2019-02-11 | 2021-10-12 | International Business Machines Corporation | Use of machine learning to characterize reference relationship applied over a citation graph |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6175952A (ja) * | 1984-09-21 | 1986-04-18 | Nec Corp | 文書入力処理方式 |
JPS62154025A (ja) * | 1985-12-26 | 1987-07-09 | Casio Comput Co Ltd | ワ−ドプロセツサにおける索引語登録装置 |
JPS6370372A (ja) * | 1986-09-12 | 1988-03-30 | Canon Inc | 文書処理装置 |
US4965763A (en) * | 1987-03-03 | 1990-10-23 | International Business Machines Corporation | Computer method for automatic extraction of commonly specified information from business correspondence |
JP2840745B2 (ja) * | 1988-04-17 | 1998-12-24 | 明宏 藤村 | 文字選択システム及び辞典検索システム |
JPH01304574A (ja) * | 1988-06-02 | 1989-12-08 | Nippon Telegr & Teleph Corp <Ntt> | 目次索引作成装置 |
JPH025175A (ja) * | 1988-06-24 | 1990-01-10 | Canon Inc | 文字処理装置 |
JPH0251766A (ja) * | 1988-08-15 | 1990-02-21 | Fujitsu Ltd | 索引項目自動抽出方式 |
JPH0259861A (ja) * | 1988-08-25 | 1990-02-28 | Nec Corp | 索引付文書作成・保管・検索装置 |
JP2783558B2 (ja) * | 1988-09-30 | 1998-08-06 | 株式会社東芝 | 要約生成方法および要約生成装置 |
US5201048A (en) * | 1988-12-01 | 1993-04-06 | Axxess Technologies, Inc. | High speed computer system for search and retrieval of data within text and record oriented files |
JPH02165379A (ja) * | 1988-12-20 | 1990-06-26 | Matsushita Electric Ind Co Ltd | 文書処理装置 |
EP0380239A3 (en) * | 1989-01-18 | 1992-04-15 | Lotus Development Corporation | Search and retrieval system |
JPH03102565A (ja) * | 1989-09-18 | 1991-04-26 | Toshiba Corp | 文書作成装置 |
US5276616A (en) * | 1989-10-16 | 1994-01-04 | Sharp Kabushiki Kaisha | Apparatus for automatically generating index |
JPH03132872A (ja) * | 1989-10-19 | 1991-06-06 | Nippon Telegr & Teleph Corp <Ntt> | 索引情報生成装置 |
JP3691844B2 (ja) * | 1990-05-21 | 2005-09-07 | 株式会社東芝 | 文書処理方法 |
JPH06348695A (ja) * | 1993-06-07 | 1994-12-22 | Nec Corp | ワードプロセッサ索引生成方式 |
JP3220885B2 (ja) * | 1993-06-18 | 2001-10-22 | 株式会社日立製作所 | キーワード付与システム |
US5384703A (en) * | 1993-07-02 | 1995-01-24 | Xerox Corporation | Method and apparatus for summarizing documents according to theme |
JPH07262207A (ja) * | 1994-03-25 | 1995-10-13 | Kengo Konishi | イメージデータファイリング方法,イメージデータ登録方法,イメージデータ検索方法及びその装置 |
US5752051A (en) * | 1994-07-19 | 1998-05-12 | The United States Of America As Represented By The Secretary Of Nsa | Language-independent method of generating index terms |
-
1996
- 1996-01-11 JP JP00302296A patent/JP3254642B2/ja not_active Expired - Fee Related
-
1997
- 1997-01-02 US US08/778,096 patent/US5983171A/en not_active Expired - Fee Related
- 1997-01-07 EP EP02020636A patent/EP1271355A3/en not_active Withdrawn
- 1997-01-07 EP EP97300042A patent/EP0784280A3/en not_active Withdrawn
Non-Patent Citations (1)
Title |
---|
木谷強,「文書推敲処理と目次、・索引作成処理を利用した文書作成支援システム」,画像電子学会誌Vol.1.17,No.5(昭和63年10月25日),pp.337−345 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7126971B2 (ja) | 2019-03-13 | 2022-08-29 | 日産合成工業株式会社 | バイパスペレット飼料の製造方法及びバイパスペレット飼料 |
KR20210042024A (ko) | 2019-10-08 | 2021-04-16 | 아즈빌주식회사 | 오류 판정 장치 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
JPH09190449A (ja) | 1997-07-22 |
EP1271355A3 (en) | 2004-08-25 |
EP0784280A3 (en) | 1998-09-02 |
EP1271355A2 (en) | 2003-01-02 |
US5983171A (en) | 1999-11-09 |
EP0784280A2 (en) | 1997-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3254642B2 (ja) | 索引の表示方法 | |
JP3691844B2 (ja) | 文書処理方法 | |
US5303150A (en) | Wild-card word replacement system using a word dictionary | |
EP0645720B1 (en) | Dictionary creation supporting system | |
JPH0823864B2 (ja) | 見出し判定方法 | |
JPH05158401A (ja) | 文書速読支援表示方式並びに文書処理装置及び文書検索装置 | |
JP3230606B2 (ja) | 固有名詞特定方法 | |
JP2002157241A (ja) | 辞書作成装置 | |
JP2536633B2 (ja) | 複合語抽出装置 | |
JPS61248160A (ja) | 文書情報登録方式 | |
JP3253657B2 (ja) | 文書検索方法 | |
JPH07230468A (ja) | キーワード自動抽出装置およびキーワード自動抽出方法 | |
JP4023371B2 (ja) | 固有名認識装置および方法 | |
JP3136973B2 (ja) | 言語解析システムおよび方法 | |
JPH01205265A (ja) | 文書整形装置 | |
JPH03150668A (ja) | 検索システムの入力文字列正規化方式 | |
JPH03271962A (ja) | 複合語抽出装置 | |
JP2520195B2 (ja) | 日本文固有用語抽出装置 | |
JPH0612453A (ja) | 未知語抽出登録装置 | |
JPH06149881A (ja) | 辞書引き装置及び文書処理装置並びにディジタル複写装置 | |
JPS6395573A (ja) | 日本語文形態素解析における未知語処理方法 | |
Myskiv et al. | Peculiarities of medical slang translation into Ukrainian: corpus-based approach (on the material of Adam Kay's book" This is Going to Hurt: Secret Diaries of a Junior Doctor") | |
JP2795754B2 (ja) | データ検索処理方式 | |
JPH0785040A (ja) | 表記不統一検出方法およびかな漢字変換方法 | |
JPH0944496A (ja) | 自然語解析方法及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R370 | Written measure of declining of transfer procedure |
Free format text: JAPANESE INTERMEDIATE CODE: R370 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071130 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081130 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081130 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091130 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101130 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |