[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2013206434A - Time condition presentation method and device and program - Google Patents

Time condition presentation method and device and program Download PDF

Info

Publication number
JP2013206434A
JP2013206434A JP2012078337A JP2012078337A JP2013206434A JP 2013206434 A JP2013206434 A JP 2013206434A JP 2012078337 A JP2012078337 A JP 2012078337A JP 2012078337 A JP2012078337 A JP 2012078337A JP 2013206434 A JP2013206434 A JP 2013206434A
Authority
JP
Japan
Prior art keywords
time
document
condition
width
time condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012078337A
Other languages
Japanese (ja)
Other versions
JP5583163B2 (en
Inventor
Daisuke Sato
大祐 佐藤
Yoshihito Yasuda
宜仁 安田
Sho Kawanaka
翔 川中
Kyota Tsutsumida
恭太 堤田
Ryoji Kataoka
良治 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012078337A priority Critical patent/JP5583163B2/en
Publication of JP2013206434A publication Critical patent/JP2013206434A/en
Application granted granted Critical
Publication of JP5583163B2 publication Critical patent/JP5583163B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To suggest a time consideration in consideration of an appropriate time suggestion width different for each keyword (topic).SOLUTION: In the present invention, when determining a time condition on the basis of time information of a document retrieved on the basis of a retrieval condition, a time width of the document is obtained from the time information of the document, the most frequent time width of the document is turned to the width of the time condition to be suggested, and a score to be higher for the document for which the time width of the document is closer to the width of the time condition to be suggested is imparted to each time unit in a time range of the document. The scores are summed up for the respective time units, and the time range of the highest score in the time range having the width of the time condition to be suggested is extracted as the time condition.

Description

本発明は、時間条件提示方法及び装置及びプログラムに係り、特に、検索範囲における時間条件の入力を補助するための検索条件サジェスト技術に関する。   The present invention relates to a time condition presentation method, apparatus, and program, and more particularly, to a search condition suggestion technique for assisting input of a time condition in a search range.

まず、従来の時間を範囲として扱う検索技術について説明する。   First, a conventional search technique that handles time as a range will be described.

時間を検索条件として文書の検索を行う日時指定検索技術が考えられてきた。通常、ユーザは時間条件の指定に加えキーワードによる検索も行い、検索システムは、指定した時間条件と指定したキーワードとの両方の条件を満たす文書を提示する。このとき、キーワードの一致による検索と異なり、検索条件である時間は範囲を持つ条件として扱われる。例えば、「20010年8月〜9月」のように検索範囲外の時間を指定した場合、文書中に含まれる日時表現や、文書を収集した日付などを利用し、「2010年8月〜9月」に含まれる文書を検索することができる(例えば、非特許文献1参照)。   There has been considered a date and time designation search technique for searching for documents using time as a search condition. Usually, in addition to specifying the time condition, the user also performs a search using a keyword, and the search system presents a document that satisfies both the specified time condition and the specified keyword. At this time, unlike the search based on keyword matching, the search condition time is treated as a condition having a range. For example, when a time outside the search range is specified, such as “August to September 20010”, the date and time expression included in the document, the date when the document was collected, etc. are used. Documents included in “month” can be searched (for example, see Non-Patent Document 1).

次に、情報検索における時間条件を提示する技術について説明する。   Next, a technique for presenting time conditions in information retrieval will be described.

一般的なWeb情報検索システムでは、ユーザが調べたい情報をキーワードとして入力すると、システムにより入力キーワードと関連の深い文書がユーザに提示される。このようなシステムにおいて、「2010年の情報」というように、時間条件を用いて検索結果を絞り込みたい場合、「2010年」というキーワードを検索条件に入力することにより実現されてきた。時間条件で絞り込みたいものの、どのような時間を指定して絞り込めば目的とする情報にたどり着けるか把握していないユーザを補助するために、システムがユーザに時間条件を提示するという方法がある。本稿ではこれを時間条件サジェスト機能と呼ぶ。   In a general Web information retrieval system, when information that a user wants to search is input as a keyword, the system presents a document closely related to the input keyword to the user. In such a system, when it is desired to narrow down search results using time conditions such as “2010 information”, it has been realized by inputting the keyword “2010” into the search conditions. There is a method in which the system presents the time condition to the user in order to assist the user who wants to narrow down by the time condition but does not know what time is specified and the target information can be reached. In this paper, this is called the time condition suggest function.

当業者においては、時間条件をサジェストする際に、図1に示すように、時間条件の候補を設定し、各時間条件に対して何らかの方法でスコアリングを行い、順位づけをして提示することが素朴な方法あろう。単純に行うならば、システムで扱う単位時間をそれぞれ時間条件候補とし(例えば、1日を単位時間として扱うシステムにおいては、時間条件候補は「2011年8月11日」、「2011年8月12日」などとなる)、検索対象となる文書群の中に現れた日時表現の頻度を、日時表現の該当する時間条件候補のスコアとして付与するといった方法が考えられる。   In the case of suggesting time conditions, those skilled in the art set candidate time conditions as shown in FIG. 1, perform scoring on each time condition in some way, rank them, and present them. There will be a naive way. If it is simply performed, each unit time handled by the system is set as a time condition candidate (for example, in a system that handles one day as a unit time, the time condition candidates are “August 11, 2011”, “August 12, 2011 The frequency of the date and time expression that appears in the document group to be searched can be given as the score of the candidate time condition corresponding to the date and time expression.

廣嶋伸章, 別所克人, 小池義昌, 片岡良治, "記述された日時の有効範囲を考慮した日時指定検索",WebDB Forum2010, 2010.Nobuaki Makishima, Katsuto Bessho, Yoshimasa Koike, Ryoji Kataoka, "Specified date and time search considering the valid range of written date and time", WebDB Forum2010, 2010.

しかしながら、サジェストする時間条件として、キーワードが話題となった旬な時間を提示することがある。話題となった旬な時間の幅は必ずしも一定ではなく、キーワード毎に異なる。従来技術のように、サジェストする時間の幅を予め固定して扱うと、キーワード毎に異なる時間幅に対応ができない。   However, as a time condition for suggesting, a seasonal time when a keyword has become a topic may be presented. The range of seasonal time that has become a hot topic is not necessarily constant, and varies from keyword to keyword. If the duration of the suggestion is fixed in advance as in the prior art, it is not possible to cope with a different duration for each keyword.

本発明は、上記の点に鑑みなされたもので、キーワード(話題)毎に異なる適切な時間サジェスト幅を考慮に入れた時間条件をサジェストすることが可能な時間条件提示方法及び装置及びプログラムを提供することを目的とする。   The present invention has been made in view of the above points, and provides a time condition presentation method, apparatus, and program capable of suggesting a time condition that takes into consideration an appropriate time suggestion width that differs for each keyword (topic) The purpose is to do.

上記の課題を解決するため、本発明は、範囲検索における時間条件を提示するための時間条件提示方法であって、
検索手段が、入力された検索条件に基づいて、文書毎のキーワードと、文書中に含まれる時間表現をシステムで扱う最小単位に変換した時間情報とを保持する文書記憶手段を参照し、文書の時間情報を検索する検索ステップと、
時間条件決定手段が、前記文書の時間情報に基づいて時間条件を決定する時間条件決定ステップと、
時間条件出力手段が、前記時間条件を出力する時間条件出力ステップと、
を行い、
前記時間条件決定ステップにおいて、
前記文書の時間情報から文書の時間幅を求め、最も頻度の高い文書の時間幅をサジェストする時間条件の幅とするサジェスト時間幅決定ステップと、
前記文書の時間幅が前記サジェストする時間条件の幅に近い文書ほど高くなるスコアを、文書の時間範囲における各時間単位に付与する文書スコアリングステップと、
時間単位毎にスコアを集計し、前記サジェストする時間条件の幅を持つ時間範囲のうち、最も高いスコアの時間範囲を時間条件として抽出する時間条件抽出ステップと、
を含むことを特徴とする。
In order to solve the above problem, the present invention is a time condition presenting method for presenting a time condition in a range search,
Based on the input search condition, the search means refers to a document storage means that holds a keyword for each document and time information obtained by converting the time expression included in the document into the minimum unit handled by the system. A search step for retrieving time information;
A time condition determining step for determining a time condition based on the time information of the document;
A time condition output means for outputting the time condition;
And
In the time condition determining step,
Determining a document time width from the time information of the document, and a suggestion time width determination step as a time condition width for suggesting a time width of the most frequent document;
A document scoring step of assigning to each time unit in the time range of the document a score that increases as the time width of the document approaches the width of the time condition to suggest;
A time condition extracting step of summarizing scores for each time unit, and extracting a time range having the highest score as a time condition among time ranges having a range of time conditions to be suggested,
It is characterized by including.

また、本発明は、前記サジェスト時間幅決定ステップにおいて、
前記時間情報の最小時刻と最大時刻の差を前記文書の時間幅とする。
Further, the present invention provides the suggestion time width determination step,
The difference between the minimum time and the maximum time of the time information is set as the time width of the document.

また、上記の文書の時間幅の求め方以外に、前記時間情報のうち、最も頻度が高い時間幅を前記文書の時間幅とすることも可能である。   In addition to the method for obtaining the time width of the document, the time width having the highest frequency among the time information can be set as the time width of the document.

上記のように、本発明では、時間を範囲として扱った検索において、従来法のようにサジェストする時間条件の幅を固定するのではなく、キーワードに応じた時間幅を求め、その時間幅と各文書との適合度を用いることにより、時間条件範囲を可変なものとすることにより、検索条件毎に異なる話題となった旬な期間の幅に対応した時間条件をサジェストすることが可能となる。   As described above, in the present invention, in the search that treats time as a range, instead of fixing the range of time conditions to suggest as in the conventional method, the time width corresponding to the keyword is obtained, and the time width and each By making the time condition range variable by using the degree of matching with the document, it is possible to suggest a time condition corresponding to the width of the seasonal period that has become a different topic for each search condition.

従来の方法でのサジェスト候補の例である。It is an example of the suggestion candidate by the conventional method. 本発明の一実施の形態における時間条件提示装置の構成図である。It is a block diagram of the time condition presentation apparatus in one embodiment of this invention. 本発明の一実施の形態における文書データベースの例である。It is an example of the document database in one embodiment of this invention. 本発明の一実施の形態における時間条件提示装置のフローチャートである。It is a flowchart of the time condition presentation apparatus in one embodiment of this invention. 本発明の一実施の形態における時間条件サジェスト部の詳細処理のフローチャートである。It is a flowchart of the detailed process of the time condition suggestion part in one embodiment of this invention. 本発明の一実施の形態における文書の時間幅を求める例である。It is an example which calculates | requires the time width of the document in one embodiment of this invention. 本発明の一実施の形態におけるサジェストする時間範囲の例である。It is an example of the time range to suggest in one embodiment of this invention.

以下、図面と共に本発明の実施の形態を説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

図2は、本発明の一実施の形態における時間条件提示装置の構成を示す。   FIG. 2 shows the configuration of the time condition presentation device in one embodiment of the present invention.

同図に示す時間条件提示装置100は、クエリ入力部110、検索部120、時間条件サジェスト部130、時間条件サジェスト出力部140、文書DB150から構成される。   The time condition presentation device 100 shown in FIG. 1 includes a query input unit 110, a search unit 120, a time condition suggestion unit 130, a time condition suggestion output unit 140, and a document DB 150.

文書DB150は、検索条件で絞り込むための情報と、検索対象となる文書群から抽出された時間情報を保持するハードディスク装置等の記憶媒体である。ここで、時間情報とは、文書中に含まれる時間表現(2011年8月など)を、システムで扱う最小単位に揃えた、ユリウス日などに変換したものを指す。時間情報は最小時刻から最大時刻までの範囲を持ち、時刻はシステムで扱う最小単位で扱う。例えばシステムで扱う時間の最小単位が1日であれば、『2011年8月』という時間情報は,2011年8月1日〜2011年8月31日として扱う。図3に文書データベースの例を示す。同図の例では1つの文書から抽出されたキーワード及び時間情報が1レコードに収められており、時間情報は1日を最小単位としてユリウス日の範囲となっている。時間情報はそれぞれ1レコード中に複数存在する場合もある。なお、時間情報を含む文書データベース150は、従来技術によって実現可能である。   The document DB 150 is a storage medium such as a hard disk device that holds information for narrowing down by a search condition and time information extracted from a document group to be searched. Here, the time information refers to a time expression (such as August 2011) included in a document converted to a Julian date or the like that is aligned with the minimum unit handled by the system. The time information has a range from the minimum time to the maximum time, and the time is handled in the minimum unit handled by the system. For example, if the minimum unit of time handled by the system is one day, the time information “August 2011” is handled as August 1, 2011 to August 31, 2011. FIG. 3 shows an example of a document database. In the example shown in the figure, keywords and time information extracted from one document are stored in one record, and the time information is in the Julian date range with one day as the minimum unit. There may be a plurality of pieces of time information in one record. Note that the document database 150 including time information can be realized by a conventional technique.

以下に、上記の構成における動作を説明する。   The operation in the above configuration will be described below.

図4は、本発明の一実施の形態における時間条件提示装置のフローチャートである。   FIG. 4 is a flowchart of the time condition presenting apparatus in one embodiment of the present invention.

ステップ110) 検索条件入力部110が、ユーザからの検索条件(クエリ)を入力として受け付け、検索部120に渡す。   Step 110) The search condition input unit 110 receives a search condition (query) from the user as an input and passes it to the search unit 120.

ステップ120) 検索部120は、検索条件入力部110から受け取った検索条件に適合するレコードを、文書DB150より取得する。取得したレコードのうち、時間情報カラムをサジェスト時間条件サジェスト部130に渡す。当該検索部120の処理は既存技術により実現可能である。   Step 120) The search unit 120 acquires a record that matches the search condition received from the search condition input unit 110 from the document DB 150. Among the acquired records, the time information column is passed to the suggestion time condition suggestion unit 130. The processing of the search unit 120 can be realized by existing technology.

ステップ130) 時間条件サジェスト部130は、検索部120より時間条件を受け取り、サジェストする時間条件を決定し、時間条件サジェスト出力部140に渡す。当該時間条件サジェスト部130の詳細な処理を図5に示す。   Step 130) The time condition suggestion unit 130 receives the time condition from the search unit 120, determines the time condition to be suggested, and passes it to the time condition suggestion output unit 140. Detailed processing of the time condition suggestion unit 130 is shown in FIG.

以下、時間条件サジェスト部130の処理を、サジェスト時間幅の決定、文書スコアリング、時間条件抽出の、3つの処理に分けて説明する。なお、以下の各処理の算出結果は時間条件サジェスト部130内のメモリ(図示せず)に格納されるものとする。   Hereinafter, the process of the time condition suggestion unit 130 will be described by dividing it into three processes of determination of a suggestion time width, document scoring, and time condition extraction. Note that the calculation results of the following processes are stored in a memory (not shown) in the time condition suggestion unit 130.

1)サジェスト時間幅決定処理
検索部120より時間情報を受け取り(ステップ131)、受け取った時間情報から、サジェストする時間条件の幅を決定する。各文書の扱う時間の幅を求め、最もよく扱われている時間幅をサジェストする時間条件の幅とする(ステップ132)。当該処理を全ての文書について行う(ステップ133)。
1) Suggestion time width determination process The time information is received from the search unit 120 (step 131), and the width of the time condition for suggestion is determined from the received time information. The width of the time handled by each document is obtained, and the time width that is most often handled is set as the width of the time condition to suggest (step 132). This process is performed for all documents (step 133).

各文書の時間幅は、検索部120より受け取った時間情報より求める。1文書中に1つの時間情報しか含まれていない場合、その時間情報のもつ最小時刻と最大時刻の差を文書の時間幅とする。ここで、図6の例において、1920年(最小時刻)から1945年(最大時刻)が文書の時間範囲であり、その差の26年間が文書の時間幅である。1文書中に複数の時間情報が含まれる場合、複数の時間情報の最小時刻の中で最小の時刻と、複数時間情報の最大時間の中で最大の時刻の差を文書の時間幅とする。なお、文書の時間幅の求め方は他にも、頻度の最も高い時間情報の時間幅を用いるといった方法や、最も幅の広い時間幅を用いるといった方法が考えられる。   The time width of each document is obtained from the time information received from the search unit 120. When only one time information is included in one document, the difference between the minimum time and the maximum time of the time information is set as the document time width. Here, in the example of FIG. 6, 1920 (minimum time) to 1945 (maximum time) is the document time range, and the difference of 26 years is the document time width. When a plurality of pieces of time information are included in one document, the difference between the minimum time among the minimum times of the plurality of time information and the maximum time among the maximum times of the plurality of time information is set as the document time width. In addition, there are other methods for obtaining the time width of the document, such as a method using the time width of the time information having the highest frequency or a method using the widest time width.

上記で求めた文書の時間幅より、サジェストする時間条件の幅を求める。サジェストをする時間条件の幅は、最も頻度の高い時間幅とする(ステップ134)。   Based on the time width of the document obtained above, the width of the time condition to suggest is obtained. The width of the time condition for suggesting is the most frequent time width (step 134).

2)文書スコアリング
各文書の時間幅が、サジェストをする時間条件の幅と近いかどうかという基準で、各文書の時間幅適合スコアを求める(ステップ135)。上記で求めた、サジェストする時間条件の幅に近い文書ほど高い時間幅適合スコアを与える。スコアリングの一例として、以下のような式が考えられる。
2) Document scoring A time width conformance score of each document is obtained on the basis of whether or not the time width of each document is close to the width of the time condition for suggestion (step 135). A document closer to the suggested time condition range obtained above gives a higher time width conformance score. As an example of scoring, the following formula can be considered.

Figure 2013206434
ここで、score(d)は文書dの時間幅適合スコア、Rはサジェストする時間条件の幅、range(d)は文書dの時間幅を表す。
Figure 2013206434
Here, score (d) represents the time width conformance score of the document d, R represents the width of the time condition to suggest, and range (d) represents the time width of the document d.

3)時間条件抽出
上記の手順で求めた時間幅Rをもつ時間条件をサジェストする。
3) Extraction of time condition Suggest a time condition having the time width R obtained in the above procedure.

まず、文書の時間適合スコアを、文書の時間範囲に含まれる各単位時間に対して付与する(ステップ136)。ここで、文書の時間範囲とは、文書の時間幅を求める際に用いた、最小時刻から最大時刻までの範囲とする。各単位時間は、システムの扱う時間の最小単位である。例えば、システムで扱う時間の最小単位が1日のとき、時間範囲が2011年10月1日から2011年10月7日、時間幅適合スコアが10の文書のスコアは、2011年10月1日から2011年10月7日までの各1日に対してスコアが10付与される。   First, a document time fitness score is assigned to each unit time included in the document time range (step 136). Here, the document time range is a range from the minimum time to the maximum time used when the time width of the document is obtained. Each unit time is the minimum unit of time handled by the system. For example, when the minimum unit of time handled by the system is one day, the score for a document with a time range of October 1, 2011 to October 7, 2011 and a time range conformance score of 10 is October 1, 2011. To 10 October 2011, a score of 10 will be awarded for each day.

単位時間毎に文書スコアを付与し(ステップ137)、ステップ134で求められた時間幅Rをもつ時間範囲のうち、図7に示すように、最もスコアが高くなる時間範囲を抽出する(ステップ138)。この抽出した時間範囲をサジェストする時間条件とし、時間条件サジェスト出力部140に出力する(ステップ139)。   A document score is assigned for each unit time (step 137), and a time range having the highest score is extracted from the time range having the time width R obtained in step 134 as shown in FIG. 7 (step 138). ). The extracted time range is set as a time condition for suggestion, and is output to the time condition suggestion output unit 140 (step 139).

ステップ140) 時間条件サジェスト出力部140は、時間条件サジェスト部130から受け取った順位付けされたサジェスト候補を出力して、ユーザに提示する。   Step 140) The time condition suggestion output unit 140 outputs the ranked suggestion candidates received from the time condition suggestion unit 130 and presents them to the user.

上記の処理により、検索条件(クエリ)毎にことなる話題となった旬な期間の幅に対応した時間条件をユーザにサジェストすることが可能となる。   With the above processing, it is possible to suggest to the user a time condition corresponding to the width of the seasonal period that has become a topic for each search condition (query).

上記の図2に示す時間条件提示装置100の各構成要素の動作をプログラムとして構築し、時間条件提示装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。   The operation of each component of the time condition presenting apparatus 100 shown in FIG. 2 can be constructed as a program and installed in a computer used as the time condition presenting apparatus to be executed or distributed via a network. It is.

本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。   The present invention is not limited to the above-described embodiments, and various modifications and applications are possible within the scope of the claims.

100 時間条件提示装置
110 クエリ入力部
120 検索部
130 時間条件サジェスト部
140 時間条件サジェスト出力部
150 文書DB(データベース)
100 time condition presentation device 110 query input unit 120 search unit 130 time condition suggestion unit 140 time condition suggestion output unit 150 document DB (database)

Claims (7)

範囲検索における時間条件を提示するための時間条件提示方法であって、
検索手段が、入力された検索条件に基づいて、文書毎のキーワードと、文書中に含まれる時間表現をシステムで扱う最小単位に変換した時間情報とを保持する文書記憶手段を参照し、文書の時間情報を検索する検索ステップと、
時間条件決定手段が、前記文書の時間情報に基づいて時間条件を決定する時間条件決定ステップと、
時間条件出力手段が、前記時間条件を出力する時間条件出力ステップと、
を行い、
前記時間条件決定ステップにおいて、
前記文書の時間情報から文書の時間幅を求め、最も頻度の高い文書の時間幅をサジェストする時間条件の幅とするサジェスト時間幅決定ステップと、
前記文書の時間幅が前記サジェストする時間条件の幅に近い文書ほど高くなるスコアを、文書の時間範囲における各時間単位に付与する文書スコアリングステップと、
時間単位毎にスコアを集計し、前記サジェストする時間条件の幅を持つ時間範囲のうち、最も高いスコアの時間範囲を時間条件として抽出する時間条件抽出ステップと、
を含むことを特徴とする時間条件提示方法。
A time condition presenting method for presenting a time condition in a range search,
Based on the input search condition, the search means refers to a document storage means that holds a keyword for each document and time information obtained by converting the time expression included in the document into the minimum unit handled by the system. A search step for retrieving time information;
A time condition determining step for determining a time condition based on the time information of the document;
A time condition output means for outputting the time condition;
And
In the time condition determining step,
Determining a document time width from the time information of the document, and a suggestion time width determination step as a time condition width for suggesting a time width of the most frequent document;
A document scoring step of assigning to each time unit in the time range of the document a score that increases as the time width of the document approaches the width of the time condition to suggest;
A time condition extracting step of summarizing scores for each time unit, and extracting a time range having the highest score as a time condition among time ranges having a range of time conditions to be suggested,
A time condition presenting method characterized by comprising:
前記サジェスト時間幅決定ステップにおいて、
前記時間情報の最小時刻と最大時刻の差を前記文書の時間幅とする
請求項1記載の時間条件提示方法。
In the suggestion time width determination step,
2. The time condition presenting method according to claim 1, wherein a difference between the minimum time and the maximum time of the time information is a time width of the document.
前記サジェスト時間幅決定ステップにおいて、
前記時間情報のうち、最も頻度が高い時間幅を前記文書の時間幅とする
請求項1記載の時間条件提示方法。
In the suggestion time width determination step,
2. The time condition presenting method according to claim 1, wherein a time width having the highest frequency among the time information is set as a time width of the document.
範囲検索における時間条件を提示するための時間条件提示装置であって、
文書毎のキーワードと、文書中に含まれる時間表現をシステムで扱う最小単位に変換した時間情報とを保持する文書記憶手段と、
入力された検索条件に基づいて前記文書記憶手段を参照し、文書の時間情報を検索する検索手段と、
前記文書の時間情報に基づいて時間条件を決定する時間条件決定手段と、
前記時間条件を出力する時間条件出力手段と、
を有し、
前記時間条件決定手段は、
前記文書の時間情報から文書の時間幅を求め、最も頻度の高い文書の時間幅をサジェストする時間条件の幅とするサジェスト時間幅決定手段と、
前記文書の時間幅が前記サジェストする時間条件の幅に近い文書ほど高くなるスコアを、文書の時間範囲における各時間単位に付与する文書スコアリング手段と、
時間単位毎にスコアを集計し、前記サジェストする時間条件の幅を持つ時間範囲のうち、最も高いスコアの時間範囲を時間条件として抽出する時間条件抽出手段と、
を含むことを特徴とする時間条件提示装置。
A time condition presentation device for presenting a time condition in a range search,
A document storage means for holding a keyword for each document and time information obtained by converting a time expression included in the document into a minimum unit handled by the system;
Search means for searching for time information of a document by referring to the document storage means based on an input search condition;
Time condition determining means for determining a time condition based on time information of the document;
Time condition output means for outputting the time condition;
Have
The time condition determining means includes
A time width of the document is determined from the time information of the document, and a time width determination unit that determines the time width of the most frequent document as a width of a time condition for suggesting;
A document scoring means for assigning a score that is higher for a document whose time width of the document is closer to the width of the time condition to suggest to each time unit in the time range of the document;
A time condition extracting unit that counts the score for each time unit and extracts the time range having the highest score as the time condition among the time ranges having the time condition range to be suggested,
A time condition presentation device comprising:
前記サジェスト時間幅決定手段は、
前記時間情報の最小時刻と最大時刻の差を前記文書の時間幅とする
請求項4記載の時間条件提示装置。
The suggestion time width determining means includes:
The time condition presenting apparatus according to claim 4, wherein the time width of the document is a difference between the minimum time and the maximum time of the time information.
前記サジェスト時間幅決定手段は、
前記時間情報のうち、最も頻度が高い時間幅を前記文書の時間幅とする
請求項4記載の時間条件提示装置。
The suggestion time width determining means includes:
The time condition presenting apparatus according to claim 4, wherein a time width having the highest frequency among the time information is set as a time width of the document.
コンピュータを、
請求項4乃至6のいずれか1項に記載の時間条件提示装置の各手段として機能させるための時間条件提示プログラム。
Computer
The time condition presentation program for functioning as each means of the time condition presentation apparatus of any one of Claims 4 thru | or 6.
JP2012078337A 2012-03-29 2012-03-29 Time condition presentation method, apparatus, and program Active JP5583163B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012078337A JP5583163B2 (en) 2012-03-29 2012-03-29 Time condition presentation method, apparatus, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012078337A JP5583163B2 (en) 2012-03-29 2012-03-29 Time condition presentation method, apparatus, and program

Publications (2)

Publication Number Publication Date
JP2013206434A true JP2013206434A (en) 2013-10-07
JP5583163B2 JP5583163B2 (en) 2014-09-03

Family

ID=49525387

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012078337A Active JP5583163B2 (en) 2012-03-29 2012-03-29 Time condition presentation method, apparatus, and program

Country Status (1)

Country Link
JP (1) JP5583163B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150076297A (en) * 2013-12-26 2015-07-07 주식회사 케이티 Contents Analysis Method and Apparatus for Increment of Clicks through Report of Optimal Upload Time

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05307569A (en) * 1992-05-01 1993-11-19 Nippon Telegr & Teleph Corp <Ntt> Method for storing and retrieving information corresponding to information varied with time
US5732260A (en) * 1994-09-01 1998-03-24 International Business Machines Corporation Information retrieval system and method
JP2000242652A (en) * 1999-02-18 2000-09-08 Nippon Telegr & Teleph Corp <Ntt> Information stream retrieval method and device and storage medium recorded with information stream retrieval program
JP2011086152A (en) * 2009-10-16 2011-04-28 Nippon Telegr & Teleph Corp <Ntt> Device, method and program for extracting time expression
WO2011077957A1 (en) * 2009-12-21 2011-06-30 日本電気株式会社 Information estimation device

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05307569A (en) * 1992-05-01 1993-11-19 Nippon Telegr & Teleph Corp <Ntt> Method for storing and retrieving information corresponding to information varied with time
US5732260A (en) * 1994-09-01 1998-03-24 International Business Machines Corporation Information retrieval system and method
JP2000242652A (en) * 1999-02-18 2000-09-08 Nippon Telegr & Teleph Corp <Ntt> Information stream retrieval method and device and storage medium recorded with information stream retrieval program
JP2011086152A (en) * 2009-10-16 2011-04-28 Nippon Telegr & Teleph Corp <Ntt> Device, method and program for extracting time expression
WO2011077957A1 (en) * 2009-12-21 2011-06-30 日本電気株式会社 Information estimation device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150076297A (en) * 2013-12-26 2015-07-07 주식회사 케이티 Contents Analysis Method and Apparatus for Increment of Clicks through Report of Optimal Upload Time
KR102200557B1 (en) 2013-12-26 2021-01-12 주식회사 케이티 Contents Analysis Method and Apparatus for Increment of Clicks through Report of Optimal Upload Time

Also Published As

Publication number Publication date
JP5583163B2 (en) 2014-09-03

Similar Documents

Publication Publication Date Title
Kofod-Petersen How to do a structured literature review in computer science
US9448992B2 (en) Natural language search results for intent queries
JP4856238B2 (en) SYSTEM AND METHOD FOR PROVIDING ADAPTIVE RECOMMENDED WORDS BY USER AND COMPUTER-READABLE RECORDING MEDIUM CONTAINING PROGRAM FOR EXECUTING THE METHOD
US20160196342A1 (en) Plagiarism Document Detection System Based on Synonym Dictionary and Automatic Reference Citation Mark Attaching System
WO2021082123A1 (en) Information recommendation method and apparatus, and electronic device
KR101651780B1 (en) Method and system for extracting association words exploiting big data processing technologies
CN104484380A (en) Personalized search method and personalized search device
Mahdabi et al. The effect of citation analysis on query expansion for patent retrieval
US11693900B2 (en) Method and system for providing resegmented audio content
JP5341847B2 (en) Search query recommendation method, search query recommendation device, search query recommendation program
Perea-Ortega et al. Application of text summarization techniques to the geographical information retrieval task
WO2015131528A1 (en) Method and apparatus for determining topic distribution of given text
WO2017215244A1 (en) Method and device for providing relevant words
JP6640519B2 (en) Information analysis device and information analysis method
JP5486667B2 (en) Method and apparatus for diversifying query results
JP5583163B2 (en) Time condition presentation method, apparatus, and program
KR20230057114A (en) Method and apparatus for deriving keywords based on technical document database
JP2010123036A (en) Document retrieval device, document retrieval method and document retrieval program
JP2019200582A (en) Search device, search method, and search program
JP2019133367A (en) Apparatus and method for business support
JP5544003B2 (en) Information search device, information search system, and information search method
JP2012027525A (en) File storage auxiliary system, method and program
JP2018055224A (en) Data generating device, method, and program
KR102341563B1 (en) Method for extracting professional text data using mediating text data topics
JP2011100302A (en) Ranking function generating device, ranking function generating method, and ranking function generation program

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20131001

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140204

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140618

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140708

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140715

R150 Certificate of patent or registration of utility model

Ref document number: 5583163

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150