JP5355949B2 - 次検索キーワード提示装置、次検索キーワード提示方法、及び次検索キーワード提示プログラム - Google Patents
次検索キーワード提示装置、次検索キーワード提示方法、及び次検索キーワード提示プログラム Download PDFInfo
- Publication number
- JP5355949B2 JP5355949B2 JP2008184896A JP2008184896A JP5355949B2 JP 5355949 B2 JP5355949 B2 JP 5355949B2 JP 2008184896 A JP2008184896 A JP 2008184896A JP 2008184896 A JP2008184896 A JP 2008184896A JP 5355949 B2 JP5355949 B2 JP 5355949B2
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- search keyword
- documents
- search
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3325—Reformulation based on results of preceding query
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3322—Query formulation using system suggestions
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
Yahoo!(R)検索ヘルプ−「関連検索ワード」とは−〈URL:http://help.yahoo.co.jp/help/jp/search/web/web−17.html〉
図6は文書特徴ベクトルの生成を説明する図である。文書に含まれる文書特徴キーワードを抽出し、キーワードの意味属性に対してユーザ嗜好ベクトルの確信度を付与して、リストを作る。作ったリストはユーザ嗜好ベクトルと比較することで、文書特徴ベクトルを生成する。
12 履歴情報格納部
13 キーワード入力部
14 検索制御部
15 検索システム
16 本文抽出部
17 意味属性解析部
18 特徴ベクトル生成部
19 クラスタ代表キーワード抽出部
20 表示部
Claims (15)
- 検索キーワードを入力する入力部と、
前記検索キーワードを検索システムに送信し、この検索システムが求めた前記検索キーワードを含む複数の文書を受信する検索制御部と、
前記複数の文書を表示する表示部と、
前記複数の文書それぞれから本文を抽出する本文抽出部と、
前記本文の単語毎に意味属性を解析する解析部と、
利用者毎に前記検索キーワードを履歴情報として格納する格納部と、
前記意味属性と前記履歴情報に基づいて前記複数の文書それぞれから文書特徴情報を生成する生成部と、
前記複数の文書それぞれの文書特徴情報をクラスタにし、各クラスタに含まれる複数の文書からクラスタ代表キーワードを抽出するクラスタ代表キーワード抽出部とを具備し、
前記表示部は、前記複数の文書毎に前記クラスタ代表キーワードを前記検索キーワードの次に検索すべき次検索キーワードの候補として表示することを特徴とする次検索キーワード提示装置。 - 前記格納部は、前記次検索キーワードの候補に対する操作を履歴情報としてさらに格納することを特徴とする請求項1記載の次検索キーワード提示装置。
- 前記検索システムは、外部に設けられ、前記検索制御部から入力した前記検索キーワードを受信し、前記検索キーワードを含む複数の文書を前記検索制御部に送信することを特徴とする請求項1記載の次検索キーワード提示装置。
- 前記解析部は、単語とその意味属性を列挙した辞書、あるいは語頭又は語尾の表現とその属性のルールを用いて前記本文の単語毎の意味属性を解析することを特徴とする請求項1記載の次検索キーワード提示装置。
- 前記生成部は、前記履歴情報に含まれる前記検索キーワードの意味属性解析を行ない、文書特徴キーワードを抽出し、前記文書特徴キーワードの意味属性毎に前記辞書または前記ルールから確信度を集計することで文書特徴情報を生成することを特徴とする請求項4記載の次検索キーワード提示装置。
- 前記クラスタ代表キーワード抽出部は、前記クラスタからクラスタを代表するキーワードと、クラスタ内で文書を代表するキーワードの抽出を行なうことを特徴とする請求項1記載の次検索キーワード提示装置。
- 前記表示部は、表示した前記複数の文書の周辺に次検索キーワードの候補を表示することを特徴とする請求項1記載の次検索キーワード提示装置。
- 前記表示部は、カーソルが前記複数の文書に移動すると、前記複数の文書に対して次検索キーワードの候補を別のポップアップウインドウに表示することを特徴とする請求項1記載の次検索キーワード提示装置。
- 前記生成部は、前記確信度と前記文書特徴キーワードが前記文書に出現する頻度とを掛けて、前記文書特徴情報を生成することを特徴とする請求項5記載の次検索キーワード提示装置。
- 前記クラスタ代表キーワード抽出部は、前記検索キーワードに対して前記クラスタが複数ある場合、前記クラスタ代表キーワードの集合に対して前記クラスタ代表キーワード同士の距離を計算し、前記クラスタ代表キーワードと前記クラスタ代表キーワードの距離がクラスタ間で最大となる組合せを採用することで抽出されることを特徴とする請求項1記載の次検索キーワード提示装置。
- 前記検索キーワードに対して前記クラスタが複数ある場合、複数の前記クラスタ代表キーワードが前記表示部に表示されることを特徴とする請求項1記載の次検索キーワード提示装置。
- 前記クラスタ代表キーワード抽出部は、前記クラスタに含まれる複数の文書から複数の文書代表キーワードを抽出し、複数の前記文書代表キーワードから前記クラスタ代表キーワードを抽出することを特徴とする請求項1記載の次検索キーワード提示装置。
- 前記検索キーワードに対して前記クラスタが一つの場合、複数の前記文書代表キーワードが前記表示部にさらに表示されることを特徴とする請求項11記載の次検索キーワード提示装置。
- 入力部が、入力した検索キーワードを受け取り、
検索制御部が、前記検索キーワードを検索システムに送信し、この検索システムが求めた前記検索キーワードを含む複数の文書を受信し、
表示部が、前記複数の文書を表示し、
本文抽出部が、前記複数の文書それぞれから本文を抽出し、
解析部が、前記本文の単語毎に意味属性を解析し、
格納部が、利用者毎に前記検索キーワードを履歴情報として格納し、
生成部が、前記意味属性と前記履歴情報に基づいて前記複数の文書それぞれから文書特徴情報を生成し、
クラスタ代表キーワード抽出部が、前記複数の文書それぞれの文書特徴情報をクラスタにし、各クラスタに含まれる複数の文書からクラスタ代表キーワードを抽出し、
前記表示部は、前記複数の文書毎に前記クラスタ代表キーワードを前記検索キーワードの次に検索すべき次検索キーワードの候補として表示することを特徴とする次検索キーワード提示方法。 - 入力部が、入力した検索キーワードを受け取るステップと、
検索制御部が、前記検索キーワードを検索システムに送信し、この検索システムが求めた前記検索キーワードを含む複数の文書を受信するステップと、
表示部が、前記複数の文書を表示するステップと、
本文抽出部が、前記複数の文書それぞれから本文を抽出するステップと、
解析部が、前記本文の単語毎に意味属性を解析するステップと、
格納部が、利用者毎に前記検索キーワードを履歴情報として格納するステップと、
生成部が、前記意味属性と前記履歴情報に基づいて前記複数の文書それぞれから文書特徴情報を生成するステップと、
クラスタ代表キーワード抽出部が、前記複数の文書それぞれの文書特徴情報をクラスタにし、各クラスタに含まれる複数の文書からクラスタ代表キーワードを抽出するステップと、
前記表示部は、前記複数の文書毎に前記クラスタ代表キーワードを前記検索キーワードの次に検索すべき次検索キーワードの候補として表示するステップとを実行するように制御することを特徴とする次検索キーワード提示プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008184896A JP5355949B2 (ja) | 2008-07-16 | 2008-07-16 | 次検索キーワード提示装置、次検索キーワード提示方法、及び次検索キーワード提示プログラム |
US12/437,584 US8229949B2 (en) | 2008-07-16 | 2009-05-08 | Apparatus, method and program product for presenting next search keyword |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008184896A JP5355949B2 (ja) | 2008-07-16 | 2008-07-16 | 次検索キーワード提示装置、次検索キーワード提示方法、及び次検索キーワード提示プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010026640A JP2010026640A (ja) | 2010-02-04 |
JP5355949B2 true JP5355949B2 (ja) | 2013-11-27 |
Family
ID=41531181
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008184896A Expired - Fee Related JP5355949B2 (ja) | 2008-07-16 | 2008-07-16 | 次検索キーワード提示装置、次検索キーワード提示方法、及び次検索キーワード提示プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8229949B2 (ja) |
JP (1) | JP5355949B2 (ja) |
Families Citing this family (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8290958B2 (en) * | 2003-05-30 | 2012-10-16 | Dictaphone Corporation | Method, system, and apparatus for data reuse |
US8229942B1 (en) * | 2007-04-17 | 2012-07-24 | Google Inc. | Identifying negative keywords associated with advertisements |
US8086624B1 (en) | 2007-04-17 | 2011-12-27 | Google Inc. | Determining proximity to topics of advertisements |
JP4735726B2 (ja) * | 2009-02-18 | 2011-07-27 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
CN101887436B (zh) * | 2009-05-12 | 2013-08-21 | 阿里巴巴集团控股有限公司 | 一种检索方法和装置 |
US20120066261A1 (en) * | 2009-05-12 | 2012-03-15 | Pioneer Corporation | Content search apparatus, content search method, content search program, and recording medium |
WO2011013191A1 (ja) | 2009-07-27 | 2011-02-03 | 株式会社 東芝 | 関連性提示装置、方法およびプログラム |
US20130124531A1 (en) * | 2010-09-08 | 2013-05-16 | Walter Bachtiger | Systems for extracting relevant and frequent key words from texts and their presentation in an auto-complete function of a search service |
KR101196935B1 (ko) * | 2010-07-05 | 2012-11-05 | 엔에이치엔(주) | 실시간 인기 키워드에 대한 대표 문구를 제공하는 방법 및 시스템 |
JP5639417B2 (ja) * | 2010-08-31 | 2014-12-10 | キヤノン株式会社 | 情報処理装置、情報処理方法、及びプログラム |
KR101172487B1 (ko) * | 2010-11-29 | 2012-08-14 | 엔에이치엔(주) | 검색 결과 내에 첨부된 정보 데이터베이스에 기초한 검색 리스트 및 검색어 순위 제공 방법 및 시스템 |
JP2012138027A (ja) * | 2010-12-27 | 2012-07-19 | Toshiba Corp | 情報検索システム、検索キーワード提示方法、およびプログラム |
JP2012212191A (ja) * | 2011-02-28 | 2012-11-01 | Toshiba Corp | 情報処理装置及び情報処理方法 |
CN102654868B (zh) * | 2011-03-02 | 2015-11-25 | 联想(北京)有限公司 | 一种基于关键字的搜索方法、搜索装置及服务器 |
JP5417471B2 (ja) * | 2012-03-14 | 2014-02-12 | 株式会社東芝 | 構造化文書管理装置、構造化文書検索方法 |
JP5067591B1 (ja) * | 2012-04-19 | 2012-11-07 | 邦和 田中 | インターネット広告検索支援プログラム |
US9753909B2 (en) | 2012-09-07 | 2017-09-05 | Splunk, Inc. | Advanced field extractor with multiple positive examples |
US20140208217A1 (en) | 2013-01-22 | 2014-07-24 | Splunk Inc. | Interface for managing splittable timestamps across event records |
US8682906B1 (en) | 2013-01-23 | 2014-03-25 | Splunk Inc. | Real time display of data field values based on manual editing of regular expressions |
US8751963B1 (en) | 2013-01-23 | 2014-06-10 | Splunk Inc. | Real time indication of previously extracted data fields for regular expressions |
US8751499B1 (en) | 2013-01-22 | 2014-06-10 | Splunk Inc. | Variable representative sampling under resource constraints |
US10394946B2 (en) | 2012-09-07 | 2019-08-27 | Splunk Inc. | Refining extraction rules based on selected text within events |
US9594814B2 (en) | 2012-09-07 | 2017-03-14 | Splunk Inc. | Advanced field extractor with modification of an extracted field |
CN103838756A (zh) * | 2012-11-23 | 2014-06-04 | 阿里巴巴集团控股有限公司 | 一种确定推送信息的方法及装置 |
US9152929B2 (en) | 2013-01-23 | 2015-10-06 | Splunk Inc. | Real time display of statistics and values for selected regular expressions |
CN104077011B (zh) * | 2013-03-26 | 2017-08-11 | 北京三星通信技术研究有限公司 | 一种同类型文档间的关联方法和终端设备 |
JP6135331B2 (ja) * | 2013-06-27 | 2017-05-31 | カシオ計算機株式会社 | 電子機器、プログラム、および、検索システム、検索方法 |
JP5805151B2 (ja) * | 2013-07-29 | 2015-11-04 | Necパーソナルコンピュータ株式会社 | 検索装置、検索システムおよびプログラム |
US9875218B2 (en) | 2014-01-28 | 2018-01-23 | International Business Machines Corporation | Document summarization |
CN104598630A (zh) * | 2015-02-05 | 2015-05-06 | 北京航空航天大学 | 一种事件索引与检索的方法及装置 |
JP2017161976A (ja) * | 2016-03-07 | 2017-09-14 | 日本放送協会 | 興味情報処理装置およびプログラム |
CN106202057B (zh) * | 2016-08-30 | 2019-07-12 | 东软集团股份有限公司 | 相似新闻信息的识别方法和装置 |
US10459981B2 (en) * | 2017-01-10 | 2019-10-29 | Oath Inc. | Computerized system and method for automatically generating and providing interactive query suggestions within an electronic mail system |
CN107291697A (zh) * | 2017-06-29 | 2017-10-24 | 浙江图讯科技股份有限公司 | 一种语义分析方法、电子设备、存储介质及其诊断系统 |
US10467343B2 (en) * | 2017-08-03 | 2019-11-05 | International Business Machines Corporation | Detecting problematic language in inclusion and exclusion criteria |
CN110825475A (zh) * | 2019-10-31 | 2020-02-21 | 维沃移动通信有限公司 | 一种输入方法及电子设备 |
KR102425770B1 (ko) * | 2020-04-13 | 2022-07-28 | 네이버 주식회사 | 급상승 검색어 제공 방법 및 시스템 |
CN113987161A (zh) * | 2021-10-27 | 2022-01-28 | 建信金融科技有限责任公司 | 一种文本排序方法及装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6182068B1 (en) * | 1997-08-01 | 2001-01-30 | Ask Jeeves, Inc. | Personalized search methods |
JP2004220226A (ja) * | 2003-01-14 | 2004-08-05 | Oki Electric Ind Co Ltd | 検索文書のための文書分類方法及び装置 |
JP5060020B2 (ja) * | 2004-10-29 | 2012-10-31 | 株式会社エヌ・ティ・ティ・ドコモ | コンテンツ発見装置 |
US7693912B2 (en) * | 2005-10-31 | 2010-04-06 | Yahoo! Inc. | Methods for navigating collections of information in varying levels of detail |
JP2006228255A (ja) * | 2006-05-12 | 2006-08-31 | Denso Corp | 適応的情報検索システム |
JP4234740B2 (ja) | 2006-08-03 | 2009-03-04 | 株式会社東芝 | キーワード提示装置、プログラムおよびキーワード提示方法 |
JP4819628B2 (ja) * | 2006-09-19 | 2011-11-24 | ヤフー株式会社 | ドキュメントデータを検索する方法、サーバ、およびプログラム |
US8280886B2 (en) * | 2008-02-13 | 2012-10-02 | Fujitsu Limited | Determining candidate terms related to terms of a query |
-
2008
- 2008-07-16 JP JP2008184896A patent/JP5355949B2/ja not_active Expired - Fee Related
-
2009
- 2009-05-08 US US12/437,584 patent/US8229949B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20100017390A1 (en) | 2010-01-21 |
US8229949B2 (en) | 2012-07-24 |
JP2010026640A (ja) | 2010-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5355949B2 (ja) | 次検索キーワード提示装置、次検索キーワード提示方法、及び次検索キーワード提示プログラム | |
JP5257071B2 (ja) | 類似度計算装置及び情報検索装置 | |
JP4471737B2 (ja) | グループ化条件決定装置と方法およびそれを用いたキーワード拡張装置と方法ならびにコンテンツ検索システムおよびコンテンツ情報提供システムと方法ならびにプログラム | |
US9122680B2 (en) | Information processing apparatus, information processing method, and program | |
CN103562919B (zh) | 利用网络的信息检索方法及相应的语音对话方法 | |
US8874590B2 (en) | Apparatus and method for supporting keyword input | |
US20130173610A1 (en) | Extracting Search-Focused Key N-Grams and/or Phrases for Relevance Rankings in Searches | |
JP6361351B2 (ja) | 発話ワードをランク付けする方法、プログラム及び計算処理システム | |
CN111046225B (zh) | 音频资源处理方法、装置、设备及存储介质 | |
US10949452B2 (en) | Constructing content based on multi-sentence compression of source content | |
EP3996373A2 (en) | Method and apparatus of generating bullet comment, device, and storage medium | |
JP2009043156A (ja) | 番組検索装置および番組検索方法 | |
JP2015525929A (ja) | 検索品質を改善するための重みベースのステミング | |
JP2005250980A (ja) | 文書検索システム、検索条件入力装置、検索実行装置、文書検索方法、および文書検索プログラム | |
CN114663164A (zh) | 电商站点推广配置方法及其装置、设备、介质、产品 | |
JP2009223749A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP5345987B2 (ja) | 文書検索装置、文書検索方法および文書検索プログラム | |
JP2020021489A (ja) | 地域に基づくアイテム推薦装置及び方法 | |
JP4883644B2 (ja) | リコメンド装置、リコメンドシステム、リコメンド装置の制御方法、およびリコメンドシステムの制御方法 | |
JP6676699B2 (ja) | 予約語及び属性言語間の関連度を用いた情報提供方法及び装置 | |
JP2008077252A (ja) | 文書ランキング方法、文書検索方法、文書ランキング装置、文書検索装置、及び記録媒体 | |
JP2004362121A (ja) | 情報検索装置、携帯情報端末装置、情報検索方法、情報検索プログラム及び記録媒体 | |
KR100832859B1 (ko) | 모바일 웹 콘텐츠 서비스 시스템 및 그 방법 | |
KR100933269B1 (ko) | 색상 키워드를 이용한 검색 방법 및 시스템 | |
CN110555202A (zh) | 文摘播报的生成方法和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110318 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20111125 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20111205 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121026 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121109 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130802 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130828 |
|
LAPS | Cancellation because of no payment of annual fees |