JP5085584B2 - Article feature word extraction device, article feature word extraction method, and program - Google Patents
Article feature word extraction device, article feature word extraction method, and program Download PDFInfo
- Publication number
- JP5085584B2 JP5085584B2 JP2009037684A JP2009037684A JP5085584B2 JP 5085584 B2 JP5085584 B2 JP 5085584B2 JP 2009037684 A JP2009037684 A JP 2009037684A JP 2009037684 A JP2009037684 A JP 2009037684A JP 5085584 B2 JP5085584 B2 JP 5085584B2
- Authority
- JP
- Japan
- Prior art keywords
- article
- input
- specific expression
- title
- feature word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000605 extraction Methods 0.000 title claims description 93
- 230000014509 gene expression Effects 0.000 claims description 139
- 239000000284 extract Substances 0.000 claims description 23
- 150000001875 compounds Chemical class 0.000 claims description 12
- 238000010801 machine learning Methods 0.000 claims description 2
- 238000000034 method Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 101100110009 Caenorhabditis elegans asd-2 gene Proteins 0.000 description 4
- 230000000877 morphologic effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000010792 warming Methods 0.000 description 2
- 239000003086 colorant Substances 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、入力記事に対応するタイトル用の特徴語を抽出する記事特徴語抽出装置、記事特徴語抽出方法及びプログラムに関する。 The present invention relates to an article feature word extraction device, an article feature word extraction method, and a program for extracting feature words for a title corresponding to an input article.
従来、ユーザは、ネットワーク上でインターネットから様々な情報を得ることを行っている。インターネット上には大量の情報として、例えば、ニュース記事が蓄積されている。記事は、一般的に、カテゴリに分類され、また、その記事の内容が分かるようなタイトルに代表される比較的短い文書が付されている。記事に、カテゴリやタイトルが付されることで、ユーザは、欲する記事を効率よく得ることができる。しかし、日々発信されるニュース記事のタイトルを作成する作業は、煩雑である。そのため、これらの作業を補助する装置が開示されている(例えば、特許文献1)。 Conventionally, users obtain various information from the Internet on a network. For example, news articles are accumulated as a large amount of information on the Internet. Articles are generally classified into categories, and a relatively short document represented by a title is provided so that the contents of the article can be understood. By attaching categories and titles to the articles, the user can efficiently obtain the desired articles. However, the work of creating the title of a news article that is sent out every day is complicated. Therefore, an apparatus for assisting these operations is disclosed (for example, Patent Document 1).
特許文献1に記載の装置は、例えば、対象文書及び同分野の文書を言語解析して、その結果を基に重要語や例示語等を判断して要約文を作成する。このようなプロセスで示された重要語は、同一分野の文書のうち、出現頻度の高いものである。よって、記事において、一般に、その内容の特徴を示す地名や人名等の固有表現は、出現頻度が低いので、固有表現は、重要語にはなりにくい。
For example, the device described in
本発明は、固有表現に基づいて、入力記事に対応するタイトル用の特徴語を抽出する記事特徴語抽出装置、記事特徴語抽出方法及びプログラムを提供することを目的とする。 An object of the present invention is to provide an article feature word extraction device, an article feature word extraction method, and a program that extract feature words for a title corresponding to an input article based on a specific expression.
本発明者は、固有表現を汎化することで、類似記事のタイトルに一致する特徴語として固有表現を抽出する方法を見出し、本発明を完成するに至った。本発明は、具体的には次のようなものを提供する。 The present inventor has found a method of extracting a specific expression as a feature word that matches a similar article title by generalizing the specific expression, and has completed the present invention. Specifically, the present invention provides the following.
(1) 入力記事に対応するタイトル用の特徴語を抽出する記事特徴語抽出装置において、
カテゴリが付された入力記事を受け付ける記事入力手段と、
前記カテゴリに分類された過去の記事にそのタイトルを対応付けて記憶した過去記事記憶部から、前記記事入力手段が受け付けた前記入力記事にカテゴリが一致し、前記入力記事に類似する類似記事を抽出する類似記事抽出手段と、
固有表現を記憶する固有表現記憶部を用いて、前記入力記事と、前記類似記事の前記タイトルとから、各々前記固有表現を抽出する固有表現抽出手段と、
前記固有表現抽出手段により抽出した前記固有表現を汎化して、前記入力記事及び前記類似記事の前記タイトルに汎化固有表現を適用する固有表現汎化手段と、
前記固有表現汎化手段による前記汎化固有表現を適用後の前記入力記事及び前記類似記事の前記タイトルから、特徴語を抽出する特徴語抽出手段と、
を備える記事特徴語抽出装置。
(1) In an article feature word extraction device that extracts feature words for a title corresponding to an input article,
An article input means for receiving an input article with a category;
A similar article similar to the input article whose category matches the input article received by the article input unit is extracted from the past article storage unit that stores the title in association with the past article. Similar article extraction means,
Using a specific expression storage unit for storing a specific expression, specific expression extraction means for extracting the specific expression from the input article and the title of the similar article;
A specific expression generalizing means for generalizing the specific expression extracted by the specific expression extracting means and applying a generalized specific expression to the title of the input article and the similar article;
Feature word extraction means for extracting a feature word from the title of the input article and the similar article after application of the generalized specific expression by the specific expression generalization means;
Article feature word extraction device.
本発明のこのような構成によれば、入力記事と同じカテゴリの過去の記事である類似記事のタイトルとに含む各々の固有表現を汎化して特徴語を抽出することで、記事の内容の特徴を示す地名や人名等の固有表現が抽出できる。ここで、汎化とは、例えば、タグ付けやキーワードによる置換等をいう。このように、記事により異なる固有表現を汎化することで、上位概念で同一に捉えることができ、より精緻な類似の抽出を行うことができる。なお、本明細書では以降、「タイトル」とは、サブタイトル、要約を含むものとする。 According to such a configuration of the present invention, the feature word is extracted by generalizing each unique expression included in the title of a similar article that is a past article in the same category as the input article, thereby extracting the feature word. It is possible to extract a unique expression such as a place name or a person name indicating. Here, generalization refers to, for example, tagging or keyword replacement. In this way, by generalizing different unique expressions depending on articles, it is possible to grasp the same in the superordinate concept and to extract more precise similarities. In the following description of the present specification, the “title” includes a subtitle and a summary.
(2) 前記特徴語抽出手段により抽出した前記類似記事の前記タイトルの特徴語を、対応する前記入力記事の特徴語に置き換えて、前記入力記事に関する仮タイトルを作成して出力する仮タイトル出力手段を備える、
(1)に記載の記事特徴語抽出装置。
(2) Temporary title output means for creating and outputting a provisional title related to the input article by replacing the feature word of the title of the similar article extracted by the feature word extraction means with the feature word of the corresponding input article Comprising
The article feature word extraction device according to (1).
本発明のこのような構成によれば、類似記事のタイトルの特徴語を、それに対応する入力記事の特徴語に置き換えた入力記事の仮タイトルを作成して、作成した仮タイトルを出力するので、入力記事のタイトルの作成を半自動化でき、仮タイトルを出力できる。よって、ユーザによるタイトル作成の効率を向上することができる。 According to such a configuration of the present invention, the provisional title of the input article is created by replacing the feature word of the title of the similar article with the feature word of the corresponding input article, and the created temporary title is output. Creation of input article titles can be semi-automated, and temporary titles can be output. Therefore, the efficiency of title creation by the user can be improved.
(3) 前記特徴語抽出手段は、前記入力記事と、前記類似記事の前記タイトルとに一致する単語、複合語及び文節を、前記特徴語として抽出する、
(1)又は(2)に記載の記事特徴語抽出装置。
(3) The feature word extraction unit extracts, as the feature word, a word, a compound word, and a phrase that match the input article and the title of the similar article.
The article feature word extraction device according to (1) or (2).
本発明のこのような構成によれば、入力記事と、類似記事のタイトルとに一致する単語、複合語や文節を抽出するので、記事に共通の単語、複合語や文節を抽出できる。 According to such a configuration of the present invention, words, compound words, and phrases that match the input article and the titles of similar articles are extracted, so that words, compound words, and phrases common to articles can be extracted.
(4) 前記固有表現記憶部は、機械学習を用いて抽出した前記固有表現のパターンを記憶し、
前記固有表現抽出手段は、前記固有表現のパターンに基づいて、前記入力記事と前記類似記事の前記タイトルとから各々前記固有表現を抽出する、
(1)から(3)までのいずれか1項に記載の記事特徴語抽出装置。
(4) The specific expression storage unit stores a pattern of the specific expression extracted using machine learning.
The specific expression extraction unit extracts the specific expressions from the input article and the title of the similar article based on the specific expression pattern,
The article feature word extraction device according to any one of (1) to (3).
本発明のこのような構成によれば、固有表現のパターンを予め記憶しておき、それを用いることで、固有表現か否かを簡単に判断でき、固有表現を抽出できる。 According to such a configuration of the present invention, a pattern of a specific expression is stored in advance, and by using it, it can be easily determined whether or not it is a specific expression, and a specific expression can be extracted.
(5) 前記類似記事抽出手段は、抽出対象の数を可変して複数の前記類似記事を抽出する、
(1)から(4)までのいずれか1項に記載の記事特徴語抽出装置。
(5) The similar article extracting means extracts a plurality of the similar articles by changing the number of extraction targets.
The article feature word extraction device according to any one of (1) to (4).
本発明のこのような構成によれば、類似記事として抽出する記事数を、任意の数に変更することができる。よって、類似記事の対象の数を増減させて、比較対象になる類似記事の数を変化させることで、抽出する特徴語に変化を与えることができる。 According to such a configuration of the present invention, the number of articles extracted as similar articles can be changed to an arbitrary number. Therefore, the feature word to be extracted can be changed by increasing or decreasing the number of similar articles and changing the number of similar articles to be compared.
(6) 前記特徴語抽出手段により抽出した特徴語を識別可能にした前記入力記事を出力する記事出力手段を備える、
(1)から(5)までのいずれか1項に記載の記事特徴語抽出装置。
(6) comprising an article output means for outputting the input article in which the feature words extracted by the feature word extraction means can be identified;
The article feature word extraction device according to any one of (1) to (5).
本発明のこのような構成によれば、入力記事を、特徴語を識別可能にして出力するので、入力記事の中の特徴語に、例えば、下線を付したり、太字にしたりすることで、特徴語をユーザに分かりやすい態様で出力することができる。 According to such a configuration of the present invention, since the input article is output with the feature word being identifiable, the feature word in the input article is underlined or bolded, for example, Feature words can be output in a manner that is easy for the user to understand.
(7) 前記特徴語抽出手段は、前記入力記事と、前記類似記事の前記タイトルとに一致する前記汎化固有表現を、前記特徴語として抽出し、
前記記事出力手段は、前記特徴語として抽出した前記汎化固有表現を前記固有表現に特化して前記入力記事を出力する、
(6)に記載の記事特徴語抽出装置。
(7) The feature word extraction unit extracts, as the feature word, the generalized specific expression that matches the input article and the title of the similar article,
The article output means outputs the input article by specializing the generalized specific expression extracted as the feature word into the specific expression;
The article feature word extraction device according to (6).
本発明のこのような構成によれば、入力記事と、類似記事のタイトルとに一致する汎化した固有表現を抽出して、固有表現を識別可能にして出力するので、入力記事と、類似記事のタイトルとを比較することで、タイトルとして馴染みの多い単語、複合語や文節を、特徴語として抽出できる。また、抽出した汎化固有表現は、元の固有表現に戻して識別可能に出力するので、分かりやすく固有表現を出力できる。 According to such a configuration of the present invention, a generalized specific expression that matches the input article and the title of the similar article is extracted, and the specific expression can be identified and output. By comparing with the titles, words, compound words, and phrases that are familiar to the titles can be extracted as feature words. Further, since the extracted generalized specific expression is returned to the original specific expression and output so as to be identifiable, the specific expression can be output in an easily understandable manner.
(8) ユーザが作成した前記入力記事に関するタイトルの入力を受け付けるタイトル入力手段と、
前記タイトルと前記入力記事とを対応付けて前記過去記事記憶部に記憶する記事蓄積手段と、
を備える、
(1)から(7)までのいずれか1項に記載の記事特徴語抽出装置。
(8) Title input means for receiving input of a title related to the input article created by the user;
Article storage means for storing the title and the input article in association with each other in the past article storage unit;
Comprising
The article feature word extraction device according to any one of (1) to (7).
本発明のこのような構成によれば、過去の記事に、本装置の出力により作成されたタイトル付きの記事を含めることができる。ユーザが付したタイトルに対応付けて、過去の記事を蓄積するので、出力した入力記事を、他の入力記事において特徴語を抽出する対象になる類似記事にすることができる。 According to such a configuration of the present invention, an article with a title created by the output of the apparatus can be included in a past article. Since past articles are stored in association with titles given by the user, the output input article can be a similar article from which feature words are extracted in other input articles.
(9) コンピュータによって、入力記事に対応するタイトル用の特徴語を抽出する記事特徴語抽出方法であって、
カテゴリに分類された過去の記事とそのタイトルとを対応付けて記憶する過去記事記憶ステップと、
固有表現を記憶する固有表現記憶ステップと、
前記カテゴリが付された入力記事を受け付ける記事入力ステップと、
前記過去記事記憶ステップにより記憶された前記過去の記事から、前記記事入力ステップが受け付けた前記入力記事にカテゴリが一致し、前記入力記事に類似する類似記事を抽出する類似記事抽出ステップと、
前記入力記事と、前記類似記事の前記タイトルとから、前記固有表現記憶ステップにより記憶された前記固有表現を各々抽出する固有表現抽出ステップと、
前記固有表現抽出ステップにより抽出した前記固有表現を汎化して、前記入力記事及び前記類似記事の前記タイトルに汎化固有表現を適用する固有表現汎化ステップと、
前記固有表現汎化ステップによる前記汎化固有表現を適用後の前記入力記事及び前記類似記事の前記タイトルから、特徴語を抽出する特徴語抽出ステップと、
を含む記事特徴語抽出方法。
(9) An article feature word extraction method for extracting feature words for a title corresponding to an input article by a computer,
A past article storing step of storing past articles classified into categories and their titles in association with each other;
A proper expression storage step for storing the specific expression;
An article input step for accepting an input article with the category;
A similar article extraction step for extracting a similar article similar in category to the input article received in the article input step from the past article stored in the past article storage step;
A specific expression extraction step for extracting each of the specific expressions stored in the specific expression storage step from the input article and the title of the similar article;
A specific expression generalizing step of generalizing the specific expression extracted by the specific expression extracting step, and applying a generalized specific expression to the title of the input article and the similar article;
A feature word extraction step of extracting a feature word from the title of the input article and the similar article after applying the generalized specific expression by the specific expression generalization step;
Article feature word extraction method including
(10) (9)に記載の記事特徴語抽出方法のステップをコンピュータに実行させるためのプログラム。 (10) A program for causing a computer to execute the steps of the article feature word extraction method according to (9).
本発明によれば、入力記事と同じカテゴリの過去の記事である類似記事に基づいて、タイトル用の特徴語を効率的に抽出することができる。特に、固有表現を汎化することで、類似記事のタイトルに一致する特徴語として固有表現を抽出するので、タイトルで重要である固有表現を特徴語として抽出することができる。 According to the present invention, feature words for titles can be efficiently extracted based on similar articles that are past articles in the same category as the input article. In particular, by generalizing the specific expressions, the specific expressions are extracted as feature words that match the titles of similar articles, so that specific expressions that are important in the title can be extracted as feature words.
以下、本発明を実施するための形態について図を参照しながら説明する。なお、これはあくまでも一例であって、本発明の技術的範囲はこれに限られるものではない。 Hereinafter, embodiments for carrying out the present invention will be described with reference to the drawings. This is merely an example, and the technical scope of the present invention is not limited to this.
(実施形態)
[記事特徴語抽出装置1の機能構成]
図1は、本実施形態に係る記事特徴語抽出装置1の機能構成を示す図である。記事特徴語抽出装置1は、入力記事に関するタイトル用の特徴語を抽出して、識別可能にされた特徴語を出力する装置である。入力記事には、予め分類されたカテゴリのうちの1つが対応付けられている。タイトル用とは、入力記事の内容を端的に表す、例えば、タイトル、サブタイトル、要約の作成で用いることができることをいう。また、特徴語とは、入力記事に関する特徴が表れた単語、複合語や文節をいう。
(Embodiment)
[Functional configuration of article feature word extraction device 1]
FIG. 1 is a diagram illustrating a functional configuration of an article feature
記事特徴語抽出装置1は、入力部3、出力部5、制御部10、記憶部20を備える。入力部3は、例えば、キーボードやマウス等であり、記事特徴語抽出装置1の処理対象になる入力記事を入力する装置である。入力部3は、通信回線(図示せず)を介して接続された端末(図示せず)や文書サーバ等から入力された記事を受信する通信部であってもよい。出力部5は、例えば、ディスプレイ等であり、タイトル用の特徴語を抽出した後の入力記事を出力する装置である。出力部5は、通信回線を介して接続された端末等に処理後の入力記事を送信する通信部であってもよい。
The article feature
制御部10は、記事入力手段11、類似記事抽出手段12、固有表現抽出手段13、固有表現汎化手段14、特徴語抽出手段15、記事出力手段16、仮タイトル出力手段17、タイトル入力手段18、記事蓄積手段19を備える。記憶部20は、過去の記事を記憶する過去記事記憶部22、固有表現のパターンを記憶する固有表現記憶部24を備える。固有表現(Named Entity)とは、例えば、地名、人名、組織名等の固有名詞や日付、時間表現、金額表現、数量表現等をいう。各機能の詳細は、後述する。
The
記事特徴語抽出装置1は、ハードウェアの数に制限はなく、必要に応じて一又は複数のハードウェアで構成してよい。また、記事特徴語抽出装置1は、複数のハードウェアで構成する場合には、例えば、通信回線を介して各ハードウェアを接続してもよい。上述した各機能毎に別サーバとし、各サーバ間での信号の送受信により、各サーバを連携させることで、本実施形態の機能を実現してもよい。
The article feature
[記事特徴語抽出装置1のハードウェア構成図]
図2は、本実施形態に係る記事特徴語抽出装置1のハードウェア構成を示す図である。本発明が実施される処理装置は標準的なものでよく、以下に、構成の一例を示す。
[Hardware configuration diagram of article feature word extraction device 1]
FIG. 2 is a diagram illustrating a hardware configuration of the article feature
記事特徴語抽出装置1は、制御部10を構成するCPU(Central Processing Unit)1010(マルチプロセッサ構成ではCPU1012等複数のCPUが追加されてもよい)、バスライン1005、通信I/F(I/F:インタフェース)1040、メインメモリ1050、BIOS(Basic Input Output System)1060、表示装置1022、I/Oコントローラ1070、キーボード及びマウス等の入力装置1100、ハードディスク1074、光ディスクドライブ1076、並びに半導体メモリ1078を備える。なお、ハードディスク1074、光ディスクドライブ1076、及び半導体メモリ1078はまとめて記憶部20と呼ぶ。
The article feature
制御部10は、記事特徴語抽出装置1を統括的に制御する部分であり、ハードディスク1074に記憶された各種プログラムを適宜読み出して実行することにより、上述したハードウェアと協働し、本発明に係る各種機能を実現している。
The
通信I/F1040は、記事特徴語抽出装置1が、通信回線を介して他の装置と情報を送受信する場合のネットワーク・アダプタである。通信I/F1040は、モデム、ケーブル・モデム及びイーサネット(登録商標)・アダプタを含んでよい。
The communication I /
BIOS1060は、記事特徴語抽出装置1の起動時にCPU1010が実行するブートプログラムや、記事特徴語抽出装置1のハードウェアに依存するプログラム等を記録する。
The
表示装置1022は、ブラウン管表示装置(CRT)、液晶表示装置(LCD)等のディスプレイ装置を含む。
The
I/Oコントローラ1070には、ハードディスク1074、光ディスクドライブ1076、及び半導体メモリ1078等の記憶装置である記憶部20を接続することができる。
The I /
入力装置1100は、記事特徴語抽出装置1の管理者による入力の受け付けを行うものである。
The
ハードディスク1074は、本ハードウェアを記事特徴語抽出装置1として機能させるための各種プログラム、本発明の機能を実行するプログラム及び上述した過去記事記憶部22及び固有表現記憶部24等を記憶する。なお、記事特徴語抽出装置1は、外部に別途設けたハードディスク(図示せず)を外部記憶装置として利用することもできる。
The
光ディスクドライブ1076としては、例えば、DVD−ROMドライブ、CD−ROMドライブ、DVD−RAMドライブ、BD(Blu−ray(登録商標) Disc)ドライブを使用することができる。この場合は各ドライブに対応した光ディスク1077を使用する。光ディスク1077から光ディスクドライブ1076によりプログラム又はデータを読み取り、I/Oコントローラ1070を介してメインメモリ1050又はハードディスク1074に提供することもできる。
As the
なお、本発明でいうコンピュータとは、記憶装置、制御部等を備えた情報処理装置をいい、記事特徴語抽出装置1は、記憶部20、制御部10等を備えた情報処理装置により構成され、この情報処理装置は、本発明のコンピュータの概念に含まれる。
The computer referred to in the present invention refers to an information processing device including a storage device, a control unit, and the like, and the article feature
[具体例1]
図3は、本実施形態に係る記事特徴語抽出装置1による処理の例を示す図である。図3(1)は、入力記事の本文30を示す。本文30のカテゴリである「温暖化」は、予めユーザにより指定されている。カテゴリは、記事を分類するためのトピックであり、例えば、政治、社会、経済、スポーツ、・・・等であり、入力記事は、カテゴリで分類される。カテゴリは、大項目、中項目、小項目等の階層形式になっていてもよく、その場合は、入力記事に指定するカテゴリは、小項目等の最小の単位のものを指定するのが望ましい。
[Specific Example 1]
FIG. 3 is a diagram illustrating an example of processing by the article feature
次に、制御部10は、本文30に類似する類似記事のタイトルと本文とを、過去記事記憶部22から抽出する。過去記事記憶部22は、記憶部20に有する。図3(2)に示すように、過去記事記憶部22は、カテゴリ22aと、タイトル22bと、本文22cとの項目を有し、1つのレコード(行)は、1つの記事を表す。
Next, the
図3(2)は、過去記事記憶部22から抽出された類似記事を示す。類似記事は、過去記事記憶部22のカテゴリ22aに記憶された入力記事と同一のカテゴリのデータの中から抽出する。この例では、入力記事と同じ「温暖化」のカテゴリのものが抽出されている。類似記事は、入力記事に対して、特徴語を抽出するのに比較対象にする記事である。抽出した類似記事は、タイトル31と本文32とからなる。タイトル31は、過去記事記憶部22のタイトル22bから、本文32は、過去記事記憶部22の本文22cから、それぞれ取得する。
FIG. 3 (2) shows similar articles extracted from the past
次に、制御部10は、入力記事の本文30と、類似記事のタイトル31とから、各々固有表現を抽出して汎化する。図3(3)は、本文30とタイトル31とに含む固有表現と、固有表現に対応する汎化固有表現とを示す。入力記事の本文30から抽出された固有表現は、「フランス」という地名や、「23日」という日付であり、固有表現部33に格納される。汎化部34は、固有表現部33に格納された固有表現を汎化した汎化固有表現を格納する。固有表現の汎化は、固有表現記憶部24に基づいて行われる。同様に、類似記事のタイトル31から抽出された固有表現は、固有表現部35に格納される。汎化部36は、固有表現部35に格納された固有表現を汎化した汎化固有表現を格納する。これらの固有表現部33,35、汎化部34,36は、一時的に記憶部20に記憶してよい。
Next, the
次に、固有表現が汎化された状態で、特徴語を抽出する。特徴語は、類似記事のタイトル31に含む汎化固有表現に一致する、入力記事の本文30の汎化固有表現を含む。汎化固有表現である特徴語は、この例では、「地名」、「日付」である。また、特徴語は、類似記事のタイトル31の汎化固有表現を除いた単語、複合語や文節であって、本文30に有するものを含む。特徴語は、この例では、「北極海」、「海氷面積」、「減少」、「発表」である。ここで、「海氷面積」は、単語「氷」を含む複合語である。
Next, feature words are extracted in a state where the specific expressions are generalized. The feature word includes the generalized specific expression of the
図3(4)は、特徴語を識別可能にした入力記事の本文37と、入力記事の仮タイトル38とを示す。ここで、汎化固有表現によって抽出した特徴語は、特徴語リストとして出力してもよいが、図示するように、入力記事の本文37に含めた状態で、識別可能に出力するようにしてもよい。入力記事の本文37は、この例のように特徴語に下線を付してもよいし、あるいは、色付けしたり、強調文字にしたりして、ユーザに一見して識別可能な状態で出力することが望ましい。また、図中の仮タイトル38は、図3(2)の類似記事のタイトル31うち特徴語として抽出した箇所を、入力記事の特徴語として抽出したものに置き換えたものである。ここで、仮タイトル38は、置き換えが複数ある場合は、複数のタイトル候補として表示してもよい。この置き換えは、入力記事と類似記事のタイトルとの対応付け(特に固有表現の種別が同じものの対応付け)により行うことができる。このとき、ユーザには、類似記事のタイトル31と仮タイトル38とを並べて表示するようにしてもよい。また、このようにして作成された仮タイトル38を、ユーザは必要に応じて編集できるようにすることが望ましい。
FIG. 3 (4) shows the
[フローチャート]
次に、図3で説明した処理の流れを説明する。図4は、本実施形態に係るメイン処理のフローチャートである。図5は、本実施形態に係る類似記事抽出処理のフローチャートである。図6は、本実施形態に係る固有表現の抽出及び汎化方法を示す図である。以降、図4から図6を参照しながら説明する。
[flowchart]
Next, the flow of processing described in FIG. 3 will be described. FIG. 4 is a flowchart of the main process according to the present embodiment. FIG. 5 is a flowchart of similar article extraction processing according to the present embodiment. FIG. 6 is a diagram showing a method for extracting and generalizing a specific expression according to the present embodiment. Hereinafter, a description will be given with reference to FIGS.
図4において、S1:制御部10(記事入力手段11)は、入力部3からカテゴリ付きの入力記事を受け付ける。記事特徴語抽出装置1の入力部3から入力された入力記事は、記憶部20に一時的に記憶してよい。
In FIG. 4, S <b> 1: the control unit 10 (article input unit 11) receives an input article with a category from the
S2:制御部10(類似記事抽出手段12)は、入力記事に類似する記事(類似記事)を、過去記事記憶部22から抽出する類似記事抽出処理を行う。
S2: The control unit 10 (similar article extraction means 12) performs a similar article extraction process for extracting an article (similar article) similar to the input article from the past
ここで、類似記事抽出処理について、図5に基づき説明する。 Here, the similar article extraction processing will be described with reference to FIG.
図5において、S11:類似記事抽出手段12は、入力記事のカテゴリと同一のカテゴリの記事を、過去記事記憶部22から抽出する。
In FIG. 5, S11: the similar
S12:類似記事抽出手段12は、入力記事と、抽出した同一のカテゴリの記事の本文及びそのタイトルとに対して形態素解析を行う。 S12: The similar article extraction means 12 performs morphological analysis on the input article, and the extracted body text and title of the same category.
S13:類似記事抽出手段12は、形態素解析によって各記事の本文に含まれる各単語に対して、単語の出現頻度に基づく指標であるTF(Term Frequency)・IDF(Inverse Document Frequency)を用いて単語の重み付けを行う。これにより、他の記事にはあまり出現しないが、その記事の中で高頻度で用いられている単語の重み付けは大きくなる。 S13: The similar article extracting means 12 uses TF (Term Frequency) / IDF (Inverse Document Frequency), which is an index based on the appearance frequency of words, for each word included in the body of each article by morphological analysis. Weighting is performed. Thereby, although it does not appear so much in other articles, weighting of words frequently used in the article increases.
S14:類似記事抽出手段12は、入力記事に含む単語であって、重み付けの上位のものを特徴語として抽出する。なお、特徴語は、複数個を抽出してよい。 S14: The similar article extracting means 12 extracts words included in the input article and having higher weights as feature words. A plurality of feature words may be extracted.
S15:類似記事抽出手段12は、抽出した特徴語を抽出した同一カテゴリの類似記事に対してOR検索して、スコアの高いものから順番にn件分の記事を抽出する。抽出する記事の件数(n)は、予め定めておいてもよいし、ユーザが入力部3から入力してもよい。また、制御部10がランダムに件数を決定してもよい。
S15: The similar article extraction means 12 performs an OR search on similar articles of the same category from which the extracted feature words are extracted, and extracts n articles in order from the highest score. The number (n) of articles to be extracted may be determined in advance, or may be input from the
このように、類似記事として使用する上位n件を可変にすることで、抽出される特徴語を変化させることができる。 In this way, the feature words to be extracted can be changed by changing the top n items used as similar articles.
図4に戻って、S3:制御部10(固有表現抽出手段13)は、入力記事と、抽出した類似記事のタイトルとから、固有表現を抽出する。 Returning to FIG. 4, S3: The control unit 10 (the specific expression extraction unit 13) extracts the specific expression from the input article and the title of the extracted similar article.
S4:制御部10(固有表現汎化手段14)は、固有表現記憶部24の学習データに基づき、入力記事と類似記事のタイトルとに含む各々の固有表現を汎化する。なお、ここで、タイトルとは、その内容部分が所定の最大文字数に制限された見出しをいい、最大文字数は、例えば、13文字である。
S4: The control unit 10 (specific expression generalization means 14) generalizes each specific expression included in the input article and the title of the similar article based on the learning data in the specific
ここで、固有表現の抽出及び汎化について、図6の例に基づき説明する。 Here, extraction and generalization of specific expressions will be described based on the example of FIG.
図6(1)は、固有表現記憶部24に記憶された学習元データ40の一例である。学習元データ40は、文書を形態素解析をして、表記41、品詞42、活用43を付し、タグ44に正解のタグを付したものである。タグ44の「ORG」は、組織を、「PER」は、人名を表す汎化固有表現である。また、タグ44の「I−」は、「B−」に続くものであることを意味する記号である。タグ44の「O」は、固有表現ではないotherを示す記号である。
FIG. 6A is an example of learning
また、固有表現記憶部24には、固有表現を判定するための素性50を用意する。素性50は、1つの例示であり、複数用意されてよい。そして、素性50を、学習元データ40の行45に示す「直弘」に用いたのものが、学習データ51である。素性50を、各形態素の全て、つまり、学習元データ40の全ての行について行っておく。そして、これらを学習データとして、パターンを固有表現記憶部24に記憶しておく。そうすることで、未知の文書が入力された場合に、どの単語等が固有表現であるのかの判断に用いることができる。
In addition, the specific
図6(2)に示す文書の対象データ60が入力された場合に、行61の「哲」について素性50を用いた結果データ62である。結果データ62から、学習データ51の前後2単語の「氏」と「は」とが共通するので、「哲」は、人名のタグである「PER」が付されるのではないかと推測できる。そこで、行61の「哲」については、人名タグ「PER」を付すことで、固有表現にすることができる。
When the
図4に戻って、S5:制御部10(特徴語抽出手段15)は、入力記事と、類似記事のタイトルとの両者に含む特徴語を抽出する。具体的には、制御部10は、入力記事と、類似記事のタイトルとに含む汎化固有表現を抽出し、入力記事と、類似記事のタイトルとに一致する単語、複合語及び文節を抽出する。
Returning to FIG. 4, S5: The control unit 10 (feature word extraction means 15) extracts feature words included in both the input article and the title of the similar article. Specifically, the
S6:制御部10(記事出力手段16)は、特徴語を識別可能にした入力記事を出力部5に出力する。その際、制御部10は、汎化固有表現を汎化する前の固有表現に戻して(特化して)、特徴語に下線を付す。このようにすることで、ユーザは、出力された入力記事から特徴語を識別できるので、例えば、記事の斜め読みに有効である。
S6: The control unit 10 (article output means 16) outputs the input article in which the feature word can be identified to the
S7:制御部10(仮タイトル出力手段17)は、類似記事のタイトルの特徴語を入力記事の特徴語に置き換えて、入力記事に関する仮タイトルを作成して出力部5に出力する。その際、制御部10は、汎化固有表現を汎化する前の固有表現に戻して(特化して)、特徴語に下線を付してもよい。このように、制御部10によって、入力記事のタイトルの作成を半自動化できるので、ユーザによるタイトル作成の効率を向上することができる。
S7: The control unit 10 (temporary title output means 17) replaces the feature word of the title of the similar article with the feature word of the input article, creates a temporary title related to the input article, and outputs it to the
S8:制御部10(タイトル入力手段18)は、ユーザにより作成された入力記事のタイトルを、入力部3から受け付ける。
S8: The control unit 10 (title input means 18) receives the title of the input article created by the user from the
S9:制御部10(記事蓄積手段19)は、入力記事と、そのタイトルとを対応付けて過去記事記憶部22に記憶する。
S9: The control unit 10 (article accumulation means 19) stores the input article and its title in the past
このように、記事特徴語抽出装置1は、入力記事と同じカテゴリの過去の記事である類似記事のタイトルに基づいて、タイトル用の特徴語を効率的に抽出することができる。特に、固有表現を汎化することで、記事特徴語抽出装置1は、類似記事のタイトルに一致する特徴語として固有表現を抽出するので、タイトルで重要である固有表現を特徴語として抽出することができる。
As described above, the article feature
[具体例2]
次に、実際の記事に基づく具体例を示す。図7は、本実施形態に係る具体例を示す図である。
[Specific Example 2]
Next, a specific example based on an actual article is shown. FIG. 7 is a diagram illustrating a specific example according to the present embodiment.
図7(1)は、入力記事の本文70を示す。入力記事のカテゴリは、「芸能」である。なお、最初に入力記事が与えられた状態では、本文70は、下線等は付されていない。
FIG. 7A shows the
図7(2)は、過去記事記憶部22に記憶され、カテゴリが「芸能」である記事の中から、入力記事に類似する記事とそのタイトルとを3つ抽出したものである。類似記事は、例えば、図5に示した方法で抽出することができる。ここでは、本文71とタイトル72とのペア、本文73とタイトル74とのペア、本文75とタイトル76とのペアの3つである。本文71,73,75は、いずれも本文70に類似している。
FIG. 7B shows three articles extracted from the articles stored in the past
図7(3)は、タイトルの固有表現を汎化したものである。タイトル72,74,76には、共通してタレント名が入っており、これを人名を表すタグ<PER>で汎化している。また、図7(4)は、入力記事の本文70の固有表現を汎化したものである。本文70に含むタレント名を、人名を表すタグ<PER>で汎化している。これらは、図6で示した学習データとして記憶されたパターンから、人名を表すものと判断できる。
FIG. 7 (3) is a generalization of the unique expression of the title. The
図7(5)は、本文70と、タイトル72,74,76との特徴語を抽出して、本文70に反映したものである。固有表現を汎化した状態で比較して特徴語を抽出することで、タイトルに相応しい固有表現を拾うことができる。
In FIG. 7 (5), characteristic words of the
本文70は、特徴語をユーザが識別しやすいような状態に変更されて、出力部5に表示されるので、ユーザは、本文70から特徴語を抜き出して、例えば、「イジ○○岡田氏、ろっ骨を骨折」という、記事の内容を端的に示すタイトルを、簡単に付すことができる。
Since the
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施例に記載されたものに限定されるものではない。 As mentioned above, although embodiment of this invention was described, this invention is not restricted to embodiment mentioned above. The effects described in the embodiments of the present invention are only the most preferable effects resulting from the present invention, and the effects of the present invention are limited to those described in the embodiments of the present invention. is not.
(変形形態)
本実施形態では、特徴語に下線を付して入力記事を出力していたが、ユーザに識別可能なものであれば、例えば、特徴語を他の単語、複合語や文節とは異なる表示態様にして出力してもよい。表示態様としては、色やフォントを異なるものにすることが考えられる。このように、特徴語を他の単語、複合語や文節とは異なる表示態様で出力することで、ユーザが識別可能に特徴語を把握できるので、例えば、記事の斜め読みに有効である。また、類似記事として使用する上位n件を可変にすることで、抽出させる特徴語も変化させることができるので、適切な件数(n)を選ぶことで、複数の斜め読み用の特徴語を表示させることが可能である。
(Deformation)
In the present embodiment, the feature article is underlined and the input article is output. However, if the user can identify the feature article, for example, the feature word is displayed differently from other words, compound words, and phrases. May be output. As a display mode, it is conceivable to use different colors and fonts. In this way, by outputting the feature word in a display mode different from other words, compound words, and phrases, the user can grasp the feature word so that it can be identified, which is effective for, for example, oblique reading of articles. Also, by changing the top n items used as similar articles, the feature words to be extracted can also be changed, so by selecting the appropriate number (n), multiple feature words for oblique reading are displayed. It is possible to make it.
なお、本実施形態では、類似記事を抽出するのに、記事の本文を形態素解析をして、TF・IDFを用いて重み付けをすることで抽出したが、入力記事に類似する記事を出力できれば、他の方法であってもよい。 In this embodiment, in order to extract similar articles, the body of the article is extracted by performing morphological analysis and weighting using TF / IDF. However, if an article similar to the input article can be output, Other methods may be used.
また、本実施形態では、特徴語を強調した入力記事と共に、類似記事のタイトルの特徴語を入力記事の特徴語に置き換えた仮タイトルを作成して出力する例を示したが、これに限定されない。例えば、入力記事と、類似記事のタイトルとを出力して、識別可能にした入力記事の特徴語と、同じく識別可能にした類似記事のタイトルの特徴語とを線で結ぶことで、各々の対応する場所が示されるようにしてもよい。 In the present embodiment, an example is shown in which a temporary title in which the feature word of the similar article title is replaced with the feature word of the input article is generated and output together with the input article in which the feature word is emphasized, but is not limited thereto. . For example, by outputting the input article and the title of a similar article and connecting the feature word of the input article that can be identified with the feature word of the title of the similar article that is also identifiable by a line, each correspondence You may make it show the place to do.
1 記事特徴語抽出装置
10 制御部
11 記事入力手段
12 類似記事抽出手段
13 固有表現抽出手段
14 固有表現汎化手段
15 特徴語抽出手段
16 記事出力手段
17 仮タイトル出力手段
18 タイトル入力手段
19 記事蓄積手段
20 記憶部
22 過去記事記憶部
24 固有表現記憶部
DESCRIPTION OF
Claims (9)
カテゴリが付された入力記事を受け付ける記事入力手段と、
前記カテゴリに分類された過去の記事にそのタイトルを対応付けて記憶した過去記事記憶部から、前記記事入力手段が受け付けた前記入力記事にカテゴリが一致し、前記入力記事に類似する類似記事を抽出する類似記事抽出手段と、
固有表現を記憶する固有表現記憶部を用いて、前記入力記事と、前記類似記事の前記タイトルとから、各々前記固有表現を抽出する固有表現抽出手段と、
前記固有表現抽出手段により抽出した前記固有表現を汎化して、前記入力記事及び前記類似記事の前記タイトルに汎化固有表現を適用する固有表現汎化手段と、
前記固有表現汎化手段による前記汎化固有表現を適用後の前記入力記事及び前記類似記事の前記タイトルにおいて、前記入力記事と、前記類似記事の前記タイトルとに一致する単語、複合語及び文節を特徴語として抽出するとともに、前記入力記事と、前記類似記事の前記タイトルとに一致する前記汎化固有表現を特徴語として抽出する特徴語抽出手段と、
を備える記事特徴語抽出装置。 In an article feature word extraction device that extracts feature words for a title corresponding to an input article,
An article input means for receiving an input article with a category;
A similar article similar to the input article whose category matches the input article received by the article input unit is extracted from the past article storage unit that stores the title in association with the past article. Similar article extraction means,
Using a specific expression storage unit for storing a specific expression, specific expression extraction means for extracting the specific expression from the input article and the title of the similar article;
A specific expression generalizing means for generalizing the specific expression extracted by the specific expression extracting means and applying a generalized specific expression to the title of the input article and the similar article;
In the title of the input article and the similar article after the application of the generalized specific expression by the specific expression generalization means , a word, a compound word, and a phrase that match the input article and the title of the similar article A feature word extracting unit that extracts the generalized specific expression that matches the input article and the title of the similar article as a feature word, as a feature word;
Article feature word extraction device.
請求項1に記載の記事特徴語抽出装置。 Replacing the feature word of the title of the similar article extracted by the feature word extraction means with the corresponding feature word of the input article, and provisional title output means for creating and outputting a temporary title related to the input article,
The article feature word extraction device according to claim 1.
前記固有表現抽出手段は、前記固有表現のパターンに基づいて、前記入力記事と前記類似記事の前記タイトルとから各々前記固有表現を抽出する、
請求項1又は請求項2に記載の記事特徴語抽出装置。 The specific expression storage unit stores the pattern of the specific expression extracted using machine learning,
The specific expression extraction unit extracts the specific expressions from the input article and the title of the similar article based on the specific expression pattern,
The article feature word extraction device according to claim 1 or 2 .
請求項1から請求項3までのいずれか1項に記載の記事特徴語抽出装置。 The similar article extraction means extracts a plurality of the similar articles by changing the number of extraction targets.
The article feature word extraction device according to any one of claims 1 to 3 .
請求項1から請求項4までのいずれか1項に記載の記事特徴語抽出装置。 Comprising an article output means for outputting the input article in which the feature words extracted by the feature word extraction means can be identified;
The article feature word extraction device according to any one of claims 1 to 4 .
請求項5に記載の記事特徴語抽出装置。 Before SL Article output unit outputs the input article is specialized in the named entities the generalization named entities extracted as the feature words,
The article feature word extraction device according to claim 5 .
前記タイトルと前記入力記事とを対応付けて前記過去記事記憶部に記憶する記事蓄積手段と、
を備える、
請求項1から請求項6までのいずれか1項に記載の記事特徴語抽出装置。 Title input means for receiving input of a title related to the input article created by the user;
Article storage means for storing the title and the input article in association with each other in the past article storage unit;
Comprising
The article feature word extraction device according to any one of claims 1 to 6 .
カテゴリに分類された過去の記事とそのタイトルとを対応付けて記憶する過去記事記憶ステップと、
固有表現を記憶する固有表現記憶ステップと、
前記カテゴリが付された入力記事を受け付ける記事入力ステップと、
前記過去記事記憶ステップにより記憶された前記過去の記事から、前記記事入力ステップが受け付けた前記入力記事にカテゴリが一致し、前記入力記事に類似する類似記事を抽出する類似記事抽出ステップと、
前記入力記事と、前記類似記事の前記タイトルとから、前記固有表現記憶ステップにより記憶された前記固有表現を各々抽出する固有表現抽出ステップと、
前記固有表現抽出ステップにより抽出した前記固有表現を汎化して、前記入力記事及び前記類似記事の前記タイトルに汎化固有表現を適用する固有表現汎化ステップと、
前記固有表現汎化ステップによる前記汎化固有表現を適用後の前記入力記事及び前記類似記事の前記タイトルにおいて、前記入力記事と、前記類似記事の前記タイトルとに一致する単語、複合語及び文節を特徴語として抽出するとともに、前記入力記事と、前記類似記事の前記タイトルとに一致する前記汎化固有表現を特徴語として抽出する特徴語抽出ステップと、
を含む記事特徴語抽出方法。 An article feature word extraction method for extracting feature words for a title corresponding to an input article by a computer,
A past article storing step of storing past articles classified into categories and their titles in association with each other;
A proper expression storage step for storing the specific expression;
An article input step for accepting an input article with the category;
A similar article extraction step for extracting a similar article similar in category to the input article received in the article input step from the past article stored in the past article storage step;
A specific expression extraction step for extracting each of the specific expressions stored in the specific expression storage step from the input article and the title of the similar article;
A specific expression generalizing step of generalizing the specific expression extracted by the specific expression extracting step, and applying a generalized specific expression to the title of the input article and the similar article;
In the title of the input article and the similar article after the application of the generalized specific expression in the specific expression generalization step , a word, a compound word, and a phrase that match the input article and the title of the similar article A feature word extracting step of extracting the generalized specific expression that matches the input article and the title of the similar article as a feature word , and extracting it as a feature word;
Article feature word extraction method including
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009037684A JP5085584B2 (en) | 2009-02-20 | 2009-02-20 | Article feature word extraction device, article feature word extraction method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009037684A JP5085584B2 (en) | 2009-02-20 | 2009-02-20 | Article feature word extraction device, article feature word extraction method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010191851A JP2010191851A (en) | 2010-09-02 |
JP5085584B2 true JP5085584B2 (en) | 2012-11-28 |
Family
ID=42817805
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009037684A Active JP5085584B2 (en) | 2009-02-20 | 2009-02-20 | Article feature word extraction device, article feature word extraction method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5085584B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118551752A (en) | 2017-08-01 | 2024-08-27 | 三星电子株式会社 | Apparatus and method for providing summary information using artificial intelligence model |
JP6592574B1 (en) * | 2018-09-21 | 2019-10-16 | 株式会社 日立産業制御ソリューションズ | Article analysis apparatus and article analysis method |
CN110060317A (en) * | 2019-03-16 | 2019-07-26 | 平安城市建设科技(深圳)有限公司 | Poster method of automatic configuration, equipment, storage medium and device |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4030624B2 (en) * | 1997-07-29 | 2008-01-09 | 株式会社ジャストシステム | Document processing apparatus, storage medium storing document processing program, and document processing method |
JP2000029882A (en) * | 1998-07-08 | 2000-01-28 | Dainippon Screen Mfg Co Ltd | Summary preparing device |
-
2009
- 2009-02-20 JP JP2009037684A patent/JP5085584B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2010191851A (en) | 2010-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7680778B2 (en) | Support for reverse and stemmed hit-highlighting | |
US9639522B2 (en) | Methods and apparatus related to determining edit rules for rewriting phrases | |
CN106934069B (en) | Data retrieval method and system | |
US20110153595A1 (en) | System And Method For Identifying Topics For Short Text Communications | |
KR20100038378A (en) | A method, system and computer program for intelligent text annotation | |
CA2807494C (en) | Method and system for integrating web-based systems with local document processing applications | |
EP2019361A1 (en) | A method and apparatus for extraction of textual content from hypertext web documents | |
JP5273735B2 (en) | Text summarization method, apparatus and program | |
JP6505421B2 (en) | Information extraction support device, method and program | |
JPH1173417A (en) | Method for identifying text category | |
JP5315368B2 (en) | Document processing device | |
WO2019224891A1 (en) | Classification device, classification method, generation method, classification program, and generation program | |
US20190303437A1 (en) | Status reporting with natural language processing risk assessment | |
JP5331023B2 (en) | Important word extraction device, important word extraction method, and important word extraction program | |
WO2016067396A1 (en) | Sentence sorting method and computer | |
JP5085584B2 (en) | Article feature word extraction device, article feature word extraction method, and program | |
Pouliquen et al. | Automatic construction of multilingual name dictionaries | |
JP2006004399A (en) | Information extraction program, its recording medium, information extraction device and information extraction rule creation method | |
Teich et al. | Scientific registers and disciplinary diversification: a comparable corpus approach | |
JP2009086903A (en) | Retrieval service device | |
JP2009187048A (en) | Evaluation expression extraction method, evaluation expression extraction device and evaluation expression extraction program | |
WO2010103916A1 (en) | Device for presentation of characteristic words in document and program giving priority of characteristic words | |
JPH11259524A (en) | Information retrieval system, information processing method in information retrieval system and record medium | |
Reddy et al. | Text Summarization of Telugu Scripts | |
JP2010250389A (en) | Information retrieval system, method and program, and index generation system, method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20120312 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120514 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120522 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20120618 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120723 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120807 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120905 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5085584 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150914 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |