[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP7548912B2 - リランキング装置 - Google Patents

リランキング装置 Download PDF

Info

Publication number
JP7548912B2
JP7548912B2 JP2021542705A JP2021542705A JP7548912B2 JP 7548912 B2 JP7548912 B2 JP 7548912B2 JP 2021542705 A JP2021542705 A JP 2021542705A JP 2021542705 A JP2021542705 A JP 2021542705A JP 7548912 B2 JP7548912 B2 JP 7548912B2
Authority
JP
Japan
Prior art keywords
reranking
search
user
information
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021542705A
Other languages
English (en)
Other versions
JPWO2021039372A1 (ja
Inventor
杏菜 大西
仁嗣 川崎
佑介 深澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Publication of JPWO2021039372A1 publication Critical patent/JPWO2021039372A1/ja
Application granted granted Critical
Publication of JP7548912B2 publication Critical patent/JP7548912B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報検索におけるランキング処理を行うリランキング装置に関するものである。
特許文献1に記載されているように、パーソナル化された検索および情報アクセスを提供するシステム、方法、およびインターフェースが知られている。
特開2012-53922号公報
上記従来技術にかかるパーソナル化された検索および情報アクセスを提供するシステム、方法、およびインターフェース装置は、以下に示すような問題点があった。ユーザ毎に異なった検索モデルまたはリランキングモデルを作成するには、大量のデータかつ、ユーザの実際のログを利用した多くの特徴量が必要である。しかし、実際の検索ログでは、個人特有のモデルを作成するためにはデータ量が少なく、また、特徴量に利用するためのログの項目がスパースになる。すなわち、上記特許文献1に記載のパーソナル化された検索および情報アクセスを提供するシステム、方法、およびインターフェース装置では、よりユーザの求めるパーソナライズした結果を表示するためのデータが不足するといった問題があり、そのためパーソナライズした結果を得ることが困難であった。
そこで本発明は、上記問題点を解決するために、データ不足による検索精度低減のおそれの少ないリランキング処理を可能とするリランキング装置を提供することを目的とする。
上記課題を解決するために、本発明のリランキング装置は、一のユーザから検索クエリを受け付ける入力部と、複数のユーザの共通情報に応じて用意された複数のリランキングモデルと、前記検索クエリに基づいて検索して検索結果を得る検索部と、前記一のユーザの共通情報に基づいて一のリランキングモデルを選択し、当該一のリランキングモデルを用いて、前記検索結果に対してリランキング処理をするリランキング処理部と、を備える。
この発明によれば、リランキングモデルは、複数のユーザの共通情報に応じて用意されていることから、ユーザ一人ごとにリランキングモデルを用意することと比較して、そのリランキングモデル生成時においてデータが不足するといった問題を解消でき、精度のよいリランキング処理を可能にする。
この発明によれば、データ不足することのないリランキングモデルを利用して、精度のよいリランキング処理を可能にする。
本実施形態にかかる施設情報検索におけるリランキング装置100の構成図である。 ログデータベース109に記憶されるログ情報の具体例を示す図である。 本実施形態にかかるリランキングモデル生成時におけるリランキング装置100の動作を示すフローチャートである。 リランキングモデル生成を示す模式図である。 本実施形態にかかるリランキング処理を行うときにおけるリランキング装置100の動作を示すフローチャートである。 特徴量追加処理を示す模式図である。 ログ情報に対するクラスタリング処理するときの模式図である。 本開示の一実施の形態に係るリランキング装置100のハードウェア構成の一例を示す図である。
添付図面を参照しながら本発明の実施形態を説明する。可能な場合には、同一の部分には同一の符号を付して、重複する説明を省略する。
本実施形態にかかる施設情報検索におけるリランキング装置100の構成について説明する。図1は、本実施形態にかかる施設情報検索におけるリランキング装置100の構成図である。本実施形態にかかる施設情報検索におけるリランキング装置100は、入力部101、検索部102、インデックス部103、クラスタリング部104、リランキングモデル生成部105、リランキングモデル記憶部106、リランキング処理部107、出力部108、およびログデータベース109を含んで構成されている。なお、以降の説明において、施設情報検索、いわゆるPOI(、Point of Interest)検索を例に説明しているが、一般的な検索にも適用することができる。
入力部101は、ユーザ端末200から入力された文字列を、通信網等を介して受けるける部分である。また、入力部101は、出力部108からユーザ端末200に出力された検索結果リストに対してユーザがクリックしたPOIをログデータベース109に記憶する。
検索部102は、受け付けられた文字列を受け取り、検索システムで保持するPOIのデータベースを持つインデックス部103と突合することで、関連するPOIを含んだ検索結果リストを取得する部分である。検索部102は、取得した検索結果リストをログデータベース109にログ情報として記憶し、またリランキング処理部107に出力してリランキング処理をさせる。
インデックス部103は、POIのデータベースを有し、検索部102からの問合せ(文字列)に基づいて対応するPOIを含んだ検索結果リストを検索部102に出力する。
クラスタリング部104は、ログデータベース109のログ情報をクラスタリング処理して、所定数のクラスタに分類(クラスタリング)する部分である。このクラスタリング処理には、k-meansなどがある。クラスタリングするにあたって、クラスタリング部104は、ログ情報から特徴量を抽出する。この特徴量は、検索傾向を示す情報であり、例えば、検索クエリに、ひらがな、伸ばし棒を使うか否か(またはその含有率など)、単語数(n単語別)、無駄な文字列の多さ、などである。無駄な文字列の多さとは、例えば「・・・してください」との検索クエリがあった場合、その「してください」という部分の文字列数またはその含有率である。これは形態素解析など利用することで、把握可能な情報である。
また、検索クエリとそのクリックログ(POIのタイトルなど)と間の文字列の一致度若しくは、文字列差分を特徴量として抽出する。一致度とは、文字の一致の割合または一致数である。差分は、クロックログの文字列>検索クエリである場合、その文字数の差分である。
そのほか、入力方法として、音声を利用するか否か、使っている端末の種別は何か、などを特徴量としてもよい。なお、上述の特徴量は検索傾向を示す情報であるが、ユーザ属性(年齢、性別等)に基づいてクラスタリングしてもよいし、またその両方を用いてクラスタリングしてもよい。本実施形態においては、検索しようとするユーザに共通する事項で、クラスタリングすることでデータ不足を解消することができる。
リランキングモデル生成部105は、クラスタリング部104によりクラスタリング処理されたログ情報から導出された特徴量に基づいて、リランキングモデルを生成する部分である。各特徴量に基づいてクラスタリングされたログ情報における検索クエリおよび検索結果リストを説明変数とし、クリックされたPOIを目的変数として、公知の機械学習処理(例えば、rankSVM)を行う。これにより、検索傾向ごとにリランキングモデルを構築することができる。
リランキング処理部107は、検索結果リストにおける上位のPOI(例えば上位k番目までのPOI)に対して、リランキング処理を行う部分である。リランキング処理部107は、リランキングモデル生成部105により生成されたリランキングモデルを用いてリランキング処理を行う。このリランキングモデルは、ユーザの検索傾向毎に複数用意されている。ログデータベース109に記憶されているユーザの検索に関するログ情報が、クラスタリング部104により検索傾向を示すクラスタ別に分類され、そのクラスタ単位に分類されたログ情報に基づいて各リランキングモデルは学習され、生成される。
出力部108は、リランキング処理部107によりリランキング処理された検索結果リストを、文字列を入力したユーザ端末200に出力する。
ログデータベース109は、ユーザ端末200により入力された文字列およびその検索結果を含むログ情報を、ユーザごとに記憶する部分である。図2は、ログデータベース109に記憶されるログ情報の具体例を示す図である。図に示されるとおり、ログデータベース109は、検索対象となる文字列である検索クエリ、検索クエリにより検索された検索結果リスト、検索結果リストからユーザが選択したPOI(URLまたはコンテンツ)、ユーザの属性情報(年齢、住所、および職業)を対応付けて記憶している。
続いて、本実施形態にかかるリランキングモデル生成時におけるリランキング装置100の動作について説明する。図3は、本実施形態にかかるリランキング装置100の動作を示すフローチャートである。本実施形態にかかるリランキングモデル生成部105は、ログデータベース109に記憶されているログ情報を読み出し(S101)、特徴量化する(S102)。特徴量化は、例えば、ユーザの検索クエリ、そのときのクリックログ、当該検索クエリとそのクリックログ(POIのタイトルなど)と間の文字列の一致度若しくは文字列差分、無駄な文字列の多さ、ひらがな含有率、単語数、使っている通信端末の種別、または音声検索利用フラグを求めることである。なお、これら全ての特徴量を必須とするものではない。また、これ以外においても、ユーザの検索傾向を示す情報であればよい。
クラスタリング部104は、ログ情報を特徴量化した検索傾向を示す情報を用いて、k-means法などを用いた教師なしクラスタリングを行う(S103)。図7(a)は、その模式図である。図7において、黒丸がユーザの検索傾向を示す特徴量を示す。この各特徴量に基づいていくつかのクラスタに分類する。図7では、クラスタ1および2に分類していることを示す。
そして、リランキングモデル生成部105は、クラスタごとのログ情報を取得する(S104)。リランキングモデル生成部105は、各クラスタに属するログ情報(検索クエリ、クリックログ(クリックされたPOI)、および検索結果リスト)をrankSVMに適用することでリランキングモデルを生成する(S105)。リランキングモデル生成部105は、生成したリランキングモデルをリランキングモデル記憶部106に記憶する。その際、どのクラスタに基づくリランキングモデルであるか、分かるようにラベル付けをしておく。これにより、検索時において、推定したクラスタに対応するリランキングモデルを選択することが可能となる。
図4は、リランキングモデル生成処理を模式的に示した図である。図4(a)は、ログ情報から抽出した特徴量を示す図ある。ここでは、説明の便宜上、一致度および差分を示す特徴量、および平仮名含有率を示す特徴量を扱うことにする。図4(b)は、これら特徴量に基づいて、クラスタリングされた各クラスタの特徴量を示す。図4(c)および図4(d)は、クラスタリングされた各クラスタのログ情報に基づいてリランキングモデルを生成することを模式的に示す。それぞれのログ情報に含まれる検索クエリ、クリックログ、検索結果リストに基づいてリランキングモデルが生成される。図では、ユーザ属性も含んでいるが、これは必須ではない。
このようにして、ユーザの検索傾向に基づいたリランキングモデルを生成することができる。
つぎに、ユーザの検索傾向に基づいて生成されたリランキングモデルを利用したリランキング検索実施動作について説明する。図5は、本実施形態にかかるリランキング処理を行うときにおけるリランキング装置100の動作を示すフローチャートである。リランキング装置100において、入力部101は、ユーザからの検索クエリを受け付け(S201)、検索部102は、POI検索を行い、検索結果リストを取得する(S202)。そして、リランキング処理部107は、検索クエリから特徴量を取得するとともに、リランキングモデル生成時において利用した特徴量の残りはどの項目であるか把握し、その特徴量を追加する(S203)。この追加処理は、リランキングモデル生成時におけるクラスタリング処理で使用された特徴量と、検索時におけるクラスタ推定のための特徴量とのそれぞれの次元を合わせるためである。例えば、リランキングモデル生成時において、検索クエリとクリックしたコンテンツとの文字列の一致度とその文字列差分とを特徴量として用いてクラスタリングした場合、検索時においても、その一致度および文字列差分を特徴量として追加することで、クラスタ推定に際して、どのクラスタにそのユーザの検索傾向が属するのか、クラスタ推定に際してその次元をあわせることができる。
本実施形態においては、ユーザごとに検索クエリとクリックしたコンテンツとがログデータベース109に記憶されており、これを利用して、検索クエリから得られる特徴量以外の特徴量を追加する。例えば、ログデータベース109から、当該ユーザの過去の検索における、検索クエリとクリックPOIとの間の文字列一致度および文字列差分を取得し、これを統計的処理(平均値を求めるなど)した値を、特徴量として追加する。その他の特徴量についても同様にログ情報から生成して、追加する。
そして、リランキング処理部107は、ユーザのクラスタ推定を行う(S204)。この推定処理は、図7(b)に示されるように、すでにクラスタリングされたログ情報に基づいて、どのクラスタに属するか判断することにより行われる。図7(b)では、検索クエリ等に基づく検索傾向を示す特徴量x(上述特徴量が追加されたものを含む)が、クラスタ1に含まれることを示している。
ここで、特徴量追加およびユーザのクラスタ推定について図を用いて説明する。図6は、特徴量追加を模式的に示した図である。ここでは、リランキングモデル生成時において、検索クエリとクリックログの一致度およびその差分を特徴量として利用したものとする。なお、当然ながら他の特徴量を利用した場合には、その特徴量も、検索クエリまたはそのユーザの検索ログから取得する。
図6に示されるとおり、ユーザID:1のユーザ(以下ユーザ1とする)は、検索クエリとして「でずにー」を入力する。このままでは、ユーザ1の検索傾向が分からないが、ユーザ1の過去の検索履歴から、検索クエリとクリックログの一致度及びその差分を取得する。ユーザ1は、複数の検索をしている場合が通常であることから、その場合、統計的に処理(平均値算出など)をして一致度及び差分を取得する。なお、当然にそれに限るものではなく、直近の検索における、一致度および差分を用いてもよい。
検索クエリに、検索履歴から取り出した過去の検索クエリとクリックログとの一致度及びその差分を合成して、ユーザ1の検索傾向を示す特徴量を抽出する。これを利用して、リランキング処理部107は、そのユーザのクラスタを推定することができる。
リランキング処理部107は、推定したクラスタに対応するリランキングモデルを選択し(S205)、検索部102が取得した検索結果リストに対してリランキング処理を行う(S206)。出力部108は、リランキング処理された検索結果リストをユーザ端末200に出力する(S207)。
つぎに、本実施形態のリランキング装置100の作用効果について説明する。リランキング装置100は、一のユーザ端末200から検索クエリを受け付ける入力部101と、複数のユーザの共通情報に応じて用意された複数のリランキングモデルを記憶するリランキングモデル記憶部106と、検索クエリに基づいて検索して検索結果を得る検索部102と、一のユーザの共通情報に基づいて一のリランキングモデルを選択し、当該一のリランキングモデルを用いて、検索結果に対してリランキング処理をするリランキング処理部107と、を備える。この共通情報は、上述実施形態においては、ユーザの検索傾向またはユーザ属性である。
これにより、リランキング処理部107は、複数のユーザの共通情報(ユーザ属性または検索傾向)に応じてリランキングモデルを選択し、これに基づいたリランキング処理を行うことができる。リランキングモデルは、複数のユーザの共通情報(ユーザ属性または検索傾向)に応じて用意されており、ユーザに応じたリランキング処理を可能にする。また、リランキングモデルは、複数のユーザの共通情報(ユーザ属性または検索傾向)に応じて用意されていることから、ユーザ一人ごとに用意することと比較して、そのモデル生成時においてデータが不足するといった問題を解消できる。
また、本実施形態のリランキング装置100は、検索クエリ、当該検索クエリによる検索結果リスト、およびユーザにより選択されたクリックログを含むログ情報を記憶するログデータベース109と、ログ情報を、複数のユーザの共通情報(ユーザ属性または検索傾向)に基づいて分類するクラスタリング部104と、共通情報(ユーザ属性または検索傾向)に基づいて分類されたログ情報に基づいて複数のリランキングモデルを生成するリランキングモデル生成部105と、備える。そして、リランキング処理部107は、リランキングモデル生成部105により生成された複数のリランキングモデルから、一のリランキングモデルを選択して、リランキング処理を行う。
これにより、共通情報に基づいてリランキングモデルを生成することができる。共通情報としてユーザ属性または検索傾向が考えられ、このような共通情報に基づいてログ情報をクラスタリングし、そのクラスタごとにリランキングモデルを生成することで、データ不足が生ずることなく、リランキングモデルの生成が可能となる。
本実施形態におけるリランキング装置100において、リランキング処理部107は、入力部101により受け付けられた検索クエリおよび一のユーザの検索履歴から検索傾向を導出する。すなわち、リランキング処理部107は、検索クエリから特徴量を抽出し、さらに、一のユーザの検索履歴から、検索クエリから抽出した特徴量以外の他の特徴量を抽出することで、一のユーザの検索傾向を導出する。検索クエリからの特徴及び他の特徴量は、ランキングモデルを生成した際におけるクラスタリングに利用した特徴量と同じにするのがよい。検索履歴は、例えば、ログデータベース109から取得されてもよいし、別途リランキングモデルを生成したときの情報を利用してもよい。
これにより、検索クエリから特徴量を抽出し、さらに、その一のユーザの検索傾向を把握できるよう検索履歴から補完するための特徴量を抽出することで、検索時における一のユーザの検索傾向を推定し、そしてそれに応じてリランキングモデルを選択することができる。
本実施形態において、検索傾向は、検索クエリとクリックログとの関連性に基づく。また、関連性とは、検索クエリおよびクリックログにおけるそれぞれの文字列の数、当該それぞれの文字列の一致度、当該それぞれの文字列の差分の少なくとも一つである。また、検索傾向は、検索クエリを構成する文字種別、文字列、検索に利用されない文字列の文字数の少なくともいずれか一つに基づく。
また、検索傾向は、検索クエリの入力手法に基づく。例えば、キーボードによるテキスト入力であってもよいし、音声入力であってもよい。音声入力の場合、リランキング装置100において、検索クエリの形式にするために、文字列に変換する必要がある。また、ユーザ端末側で音声入力されて変換された場合には、その旨のフラグ情報をもらうようにしてもよい。
上述実施形態では、共通情報として、ユーザの検索傾向を例に説明したが、共通情報として、これ以外に、ユーザ属性を示す情報もある。ユーザ属性を示す情報として、性別、年齢・年代、住所、職業等が考えられる。また、共通情報は、検索傾向とユーザ属性との両方を含むとしてもよい。
上記実施形態の説明に用いたブロック図は、機能単位のブロックを示している。これらの機能ブロック(構成部)は、ハードウェア及びソフトウェアの少なくとも一方の任意の組み合わせによって実現される。また、各機能ブロックの実現方法は特に限定されない。すなわち、各機能ブロックは、物理的又は論理的に結合した1つの装置を用いて実現されてもよいし、物理的又は論理的に分離した2つ以上の装置を直接的又は間接的に(例えば、有線、無線などを用いて)接続し、これら複数の装置を用いて実現されてもよい。機能ブロックは、上記1つの装置又は上記複数の装置にソフトウェアを組み合わせて実現されてもよい。
機能には、判断、決定、判定、計算、算出、処理、導出、調査、探索、確認、受信、送信、出力、アクセス、解決、選択、選定、確立、比較、想定、期待、見做し、報知(broadcasting)、通知(notifying)、通信(communicating)、転送(forwarding)、構成(configuring)、再構成(reconfiguring)、割り当て(allocating、mapping)、割り振り(assigning)などがあるが、これらに限られない。たとえば、送信を機能させる機能ブロック(構成部)は、送信部(transmitting unit)や送信機(transmitter)と呼称される。いずれも、上述したとおり、実現方法は特に限定されない。
例えば、本開示の一実施の形態におけるリランキング装置100は、本開示のリランキング処理方法の処理を行うコンピュータとして機能してもよい。図8は、本開示の一実施の形態に係るリランキング装置100のハードウェア構成の一例を示す図である。上述のリランキング装置100は、物理的には、プロセッサ1001、メモリ1002、ストレージ1003、通信装置1004、入力装置1005、出力装置1006、バス1007などを含むコンピュータ装置として構成されてもよい。
なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニットなどに読み替えることができる。リランキング装置100のハードウェア構成は、図に示した各装置を1つ又は複数含むように構成されてもよいし、一部の装置を含まずに構成されてもよい。
リランキング装置100における各機能は、プロセッサ1001、メモリ1002などのハードウェア上に所定のソフトウェア(プログラム)を読み込ませることによって、プロセッサ1001が演算を行い、通信装置1004による通信を制御したり、メモリ1002及びストレージ1003におけるデータの読み出し及び書き込みの少なくとも一方を制御したりすることによって実現される。
プロセッサ1001は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ1001は、周辺装置とのインターフェース、制御装置、演算装置、レジスタなどを含む中央処理装置(CPU:Central Processing Unit)によって構成されてもよい。例えば、上述の検索部102、リランキング処理部107,リランキングモデル生成部105,クラスタリング部104などは、プロセッサ1001によって実現されてもよい。
また、プロセッサ1001は、プログラム(プログラムコード)、ソフトウェアモジュール、データなどを、ストレージ1003及び通信装置1004の少なくとも一方からメモリ1002に読み出し、これらに従って各種の処理を実行する。プログラムとしては、上述の実施の形態において説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、検索部102は、メモリ1002に格納され、プロセッサ1001において動作する制御プログラムによって実現されてもよく、他の機能ブロックについても同様に実現されてもよい。上述の各種処理は、1つのプロセッサ1001によって実行される旨を説明してきたが、2以上のプロセッサ1001により同時又は逐次に実行されてもよい。プロセッサ1001は、1以上のチップによって実装されてもよい。なお、プログラムは、電気通信回線を介してネットワークから送信されても良い。
メモリ1002は、コンピュータ読み取り可能な記録媒体であり、例えば、ROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、RAM(Random Access Memory)などの少なくとも1つによって構成されてもよい。メモリ1002は、レジスタ、キャッシュ、メインメモリ(主記憶装置)などと呼ばれてもよい。メモリ1002は、本開示の一実施の形態に係るリランキング処理方法を実施するために実行可能なプログラム(プログラムコード)、ソフトウェアモジュールなどを保存することができる。
ストレージ1003は、コンピュータ読み取り可能な記録媒体であり、例えば、CD-ROM(Compact Disc ROM)などの光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Blu-ray(登録商標)ディスク)、スマートカード、フラッシュメモリ(例えば、カード、スティック、キードライブ)、フロッピー(登録商標)ディスク、磁気ストリップなどの少なくとも1つによって構成されてもよい。ストレージ1003は、補助記憶装置と呼ばれてもよい。上述の記憶媒体は、例えば、メモリ1002及びストレージ1003の少なくとも一方を含むデータベース、サーバその他の適切な媒体であってもよい。
通信装置1004は、有線ネットワーク及び無線ネットワークの少なくとも一方を介してコンピュータ間の通信を行うためのハードウェア(送受信デバイス)であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュールなどともいう。通信装置1004は、例えば周波数分割複信(FDD:Frequency Division Duplex)及び時分割複信(TDD:Time Division Duplex)の少なくとも一方を実現するために、高周波スイッチ、デュプレクサ、フィルタ、周波数シンセサイザなどを含んで構成されてもよい。例えば、上述の入力部101および出力部108などは、通信装置1004によって実現されてもよい。入力部101と出力部108とは、物理的に、または論理的に分離された実装がなされてもよいし、物理的に共通した実装がなされてもよい。
入力装置1005は、外部からの入力を受け付ける入力デバイス(例えば、キーボード、マウス、マイクロフォン、スイッチ、ボタン、センサなど)である。出力装置1006は、外部への出力を実施する出力デバイス(例えば、ディスプレイ、スピーカー、LEDランプなど)である。なお、入力装置1005及び出力装置1006は、一体となった構成(例えば、タッチパネル)であってもよい。
また、プロセッサ1001、メモリ1002などの各装置は、情報を通信するためのバス1007によって接続される。バス1007は、単一のバスを用いて構成されてもよいし、装置間ごとに異なるバスを用いて構成されてもよい。
また、リランキング装置100は、マイクロプロセッサ、デジタル信号プロセッサ(DSP:Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)、FPGA(Field Programmable Gate Array)などのハードウェアを含んで構成されてもよく、当該ハードウェアにより、各機能ブロックの一部又は全てが実現されてもよい。例えば、プロセッサ1001は、これらのハードウェアの少なくとも1つを用いて実装されてもよい。
情報の通知は、本開示において説明した態様/実施形態に限られず、他の方法を用いて行われてもよい。例えば、情報の通知は、物理レイヤシグナリング(例えば、DCI(Downlink Control Information)、UCI(Uplink Control Information))、上位レイヤシグナリング(例えば、RRC(Radio Resource Control)シグナリング、MAC(Medium Access Control)シグナリング、報知情報(MIB(Master Information Block)、SIB(System Information Block)))、その他の信号又はこれらの組み合わせによって実施されてもよい。また、RRCシグナリングは、RRCメッセージと呼ばれてもよく、例えば、RRC接続セットアップ(RRC Connection Setup)メッセージ、RRC接続再構成(RRC Connection Reconfiguration)メッセージなどであってもよい。
本開示において説明した各態様/実施形態は、LTE(Long Term Evolution)、LTE-A(LTE-Advanced)、SUPER 3G、IMT-Advanced、4G(4th generation mobile communication system)、5G(5th generation mobile communication system)、FRA(Future Radio Access)、NR(new Radio)、W-CDMA(登録商標)、GSM(登録商標)、CDMA2000、UMB(Ultra Mobile Broadband)、IEEE 802.11(Wi-Fi(登録商標))、IEEE 802.16(WiMAX(登録商標))、IEEE 802.20、UWB(Ultra-WideBand)、Bluetooth(登録商標)、その他の適切なシステムを利用するシステム及びこれらに基づいて拡張された次世代システムの少なくとも一つに適用されてもよい。また、複数のシステムが組み合わされて(例えば、LTE及びLTE-Aの少なくとも一方と5Gとの組み合わせ等)適用されてもよい。
本開示において説明した各態様/実施形態の処理手順、シーケンス、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本開示において説明した方法については、例示的な順序を用いて様々なステップの要素を提示しており、提示した特定の順序に限定されない。
情報等は、上位レイヤ(又は下位レイヤ)から下位レイヤ(又は上位レイヤ)へ出力され得る。複数のネットワークノードを介して入出力されてもよい。
入出力された情報等は特定の場所(例えば、メモリ)に保存されてもよいし、管理テーブルを用いて管理してもよい。入出力される情報等は、上書き、更新、又は追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。
判定は、1ビットで表される値(0か1か)によって行われてもよいし、真偽値(Boolean:true又はfalse)によって行われてもよいし、数値の比較(例えば、所定の値との比較)によって行われてもよい。
本開示において説明した各態様/実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、所定の情報の通知(例えば、「Xであること」の通知)は、明示的に行うものに限られず、暗黙的(例えば、当該所定の情報の通知を行わない)ことによって行われてもよい。
以上、本開示について詳細に説明したが、当業者にとっては、本開示が本開示中に説明した実施形態に限定されるものではないということは明らかである。本開示は、請求の範囲の記載により定まる本開示の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。したがって、本開示の記載は、例示説明を目的とするものであり、本開示に対して何ら制限的な意味を有するものではない。
ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能などを意味するよう広く解釈されるべきである。
また、ソフトウェア、命令、情報などは、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、有線技術(同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線(DSL:Digital Subscriber Line)など)及び無線技術(赤外線、マイクロ波など)の少なくとも一方を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び無線技術の少なくとも一方は、伝送媒体の定義内に含まれる。
本開示において説明した情報、信号などは、様々な異なる技術のいずれかを使用して表されてもよい。例えば、上記の説明全体に渡って言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、チップなどは、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、又はこれらの任意の組み合わせによって表されてもよい。
なお、本開示において説明した用語及び本開示の理解に必要な用語については、同一の又は類似する意味を有する用語と置き換えてもよい。
また、本開示において説明した情報、パラメータなどは、絶対値を用いて表されてもよいし、所定の値からの相対値を用いて表されてもよいし、対応する別の情報を用いて表されてもよい。例えば、無線リソースはインデックスによって指示されるものであってもよい。
上述したパラメータに使用する名称はいかなる点においても限定的な名称ではない。さらに、これらのパラメータを使用する数式等は、本開示で明示的に開示したものと異なる場合もある。様々なチャネル(例えば、PUCCH、PDCCHなど)及び情報要素は、あらゆる好適な名称によって識別できるので、これらの様々なチャネル及び情報要素に割り当てている様々な名称は、いかなる点においても限定的な名称ではない。
本開示においては、「移動局(MS:Mobile Station)」、「ユーザ端末(user terminal)」、「ユーザ装置(UE:User Equipment)」、「端末」などの用語は、互換的に使用され得る。
移動局は、当業者によって、加入者局、モバイルユニット、加入者ユニット、ワイヤレスユニット、リモートユニット、モバイルデバイス、ワイヤレスデバイス、ワイヤレス通信デバイス、リモートデバイス、モバイル加入者局、アクセス端末、モバイル端末、ワイヤレス端末、リモート端末、ハンドセット、ユーザエージェント、モバイルクライアント、クライアント、又はいくつかの他の適切な用語で呼ばれる場合もある。
本開示で使用する「判断(determining)」、「決定(determining)」という用語は、多種多様な動作を包含する場合がある。「判断」、「決定」は、例えば、判定(judging)、計算(calculating)、算出(computing)、処理(processing)、導出(deriving)、調査(investigating)、探索(looking up、search、inquiry)(例えば、テーブル、データベース又は別のデータ構造での探索)、確認(ascertaining)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、受信(receiving)(例えば、情報を受信すること)、送信(transmitting)(例えば、情報を送信すること)、入力(input)、出力(output)、アクセス(accessing)(例えば、メモリ中のデータにアクセスすること)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、解決(resolving)、選択(selecting)、選定(choosing)、確立(establishing)、比較(comparing)などした事を「判断」「決定」したとみなす事を含み得る。つまり、「判断」「決定」は、何らかの動作を「判断」「決定」したとみなす事を含み得る。また、「判断(決定)」は、「想定する(assuming)」、「期待する(expecting)」、「みなす(considering)」などで読み替えられてもよい。
「接続された(connected)」、「結合された(coupled)」という用語、又はこれらのあらゆる変形は、2又はそれ以上の要素間の直接的又は間接的なあらゆる接続又は結合を意味し、互いに「接続」又は「結合」された2つの要素間に1又はそれ以上の中間要素が存在することを含むことができる。要素間の結合又は接続は、物理的なものであっても、論理的なものであっても、或いはこれらの組み合わせであってもよい。例えば、「接続」は「アクセス」で読み替えられてもよい。本開示で使用する場合、2つの要素は、1又はそれ以上の電線、ケーブル及びプリント電気接続の少なくとも一つを用いて、並びにいくつかの非限定的かつ非包括的な例として、無線周波数領域、マイクロ波領域及び光(可視及び不可視の両方)領域の波長を有する電磁エネルギーなどを用いて、互いに「接続」又は「結合」されると考えることができる。
本開示において使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。
本開示において、「含む(include)」、「含んでいる(including)」及びそれらの変形が使用されている場合、これらの用語は、用語「備える(comprising)」と同様に、包括的であることが意図される。さらに、本開示において使用されている用語「又は(or)」は、排他的論理和ではないことが意図される。
本開示において、例えば、英語でのa, an及びtheのように、翻訳により冠詞が追加された場合、本開示は、これらの冠詞の後に続く名詞が複数形であることを含んでもよい。
本開示において、「AとBが異なる」という用語は、「AとBが互いに異なる」ことを意味してもよい。なお、当該用語は、「AとBがそれぞれCと異なる」ことを意味してもよい。「離れる」、「結合される」などの用語も、「異なる」と同様に解釈されてもよい。
100…リランキング装置、101…入力部、102…検索部、103…インデックス部、104…クラスタリング部、105…リランキングモデル生成部、106…リランキングモデル記憶部、107…リランキング処理部、108…出力部、109…ログデータベース、200…ユーザ端末。

Claims (5)

  1. 一のユーザから検索クエリを受け付ける入力部と、
    複数のユーザの共通情報に応じて用意された複数のリランキングモデルと、
    前記検索クエリに基づいて検索して検索結果を得る検索部と、
    前記一のユーザの共通情報に基づいて一のリランキングモデルを選択し、当該一のリランキングモデルを用いて、前記検索結果に対してリランキング処理をするリランキング処理部と、
    を備え
    前記共通情報は、ユーザによる検索傾向を示す情報であり、
    前記検索傾向は、検索クエリとクリックログとの関連性を含み、
    前記関連性は、検索クエリおよびクリックログにおけるそれぞれの文字列の数、当該それぞれの文字列の一致度、当該それぞれの文字列の差分の少なくとも一つであり、
    前記リランキング処理部は、
    前記入力部により受け付けられた検索クエリおよび前記一のユーザの検索履歴から検索傾向を導出し、
    前記関連性を前記一のユーザの検索履歴から導出することで、検索傾向を導出する
    リランキング装置。
  2. 検索クエリ、当該検索クエリによる検索結果リスト、およびユーザにより選択されたクリックログを含むログ情報を記憶するログデータベースと、
    前記ログ情報を、複数のユーザの共通情報に基づいて分類するクラスタリング部と、
    前記共通情報に基づいて分類されたログ情報に基づいて複数のリランキングモデルを生成するリランキングモデル生成部と、備え、
    前記リランキング処理部は、前記リランキングモデル生成部により生成された複数のリランキングモデルから、一のリランキングモデルを選択して、リランキング処理を行う、
    請求項1に記載のリランキング装置。
  3. 前記検索傾向は、検索クエリを構成する文字種別、文字列、検索に利用されない文字列の文字数の少なくともいずれか一つに基づく、
    請求項1または2に記載のリランキング装置。
  4. 前記検索傾向は、前記検索クエリの入力手法に基づく、
    請求項1または2に記載のリランキング装置。
  5. 一のユーザから検索クエリを受け付ける入力部と、
    複数のユーザの共通情報に応じて用意された複数のリランキングモデルと、
    前記検索クエリに基づいて検索して検索結果を得る検索部と、
    前記一のユーザの共通情報に基づいて一のリランキングモデルを選択し、当該一のリランキングモデルを用いて、前記検索結果に対してリランキング処理をするリランキング処理部と、
    を備え、
    前記共通情報は、ユーザによる検索傾向を示す情報であり、
    前記検索傾向は、前記検索クエリの入力手法に基づき、
    前記リランキング処理部は、前記入力部により受け付けられた検索クエリおよび前記一のユーザの検索履歴から検索傾向を導出する、
    リランキング装置。

JP2021542705A 2019-08-29 2020-08-07 リランキング装置 Active JP7548912B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2019157215 2019-08-29
JP2019157215 2019-08-29
PCT/JP2020/030475 WO2021039372A1 (ja) 2019-08-29 2020-08-07 リランキング装置

Publications (2)

Publication Number Publication Date
JPWO2021039372A1 JPWO2021039372A1 (ja) 2021-03-04
JP7548912B2 true JP7548912B2 (ja) 2024-09-10

Family

ID=74684613

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021542705A Active JP7548912B2 (ja) 2019-08-29 2020-08-07 リランキング装置

Country Status (3)

Country Link
US (1) US11914601B2 (ja)
JP (1) JP7548912B2 (ja)
WO (1) WO2021039372A1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010061420A (ja) 2008-09-04 2010-03-18 Yahoo Japan Corp 商品情報検索装置、方法及びシステム
JP2011227922A (ja) 2004-07-13 2011-11-10 Google Inc 検索結果内におけるプレーストコンテンツの順序付けのパーソナライズ
US20150293976A1 (en) 2014-04-14 2015-10-15 Microsoft Corporation Context-Sensitive Search Using a Deep Learning Model
US20170091189A1 (en) 2015-09-28 2017-03-30 Yahoo! Inc. Location-sensitive ranking for search and related techniques

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8078607B2 (en) * 2006-03-30 2011-12-13 Google Inc. Generating website profiles based on queries from webistes and user activities on the search results
US8620915B1 (en) * 2007-03-13 2013-12-31 Google Inc. Systems and methods for promoting personalized search results based on personal information
US20060064411A1 (en) * 2004-09-22 2006-03-23 William Gross Search engine using user intent
US20060074883A1 (en) 2004-10-05 2006-04-06 Microsoft Corporation Systems, methods, and interfaces for providing personalized search and information access
EP1866806A1 (en) * 2005-03-09 2007-12-19 Medio Systems, Inc. Method and system for active ranking of browser search engine results
JP5632124B2 (ja) * 2005-03-18 2014-11-26 サーチ エンジン テクノロジーズ リミテッド ライアビリティ カンパニー 格付け方法、検索結果並び替え方法、格付けシステム及び検索結果並び替えシステム
US7818315B2 (en) * 2006-03-13 2010-10-19 Microsoft Corporation Re-ranking search results based on query log
US9092510B1 (en) * 2007-04-30 2015-07-28 Google Inc. Modifying search result ranking based on a temporal element of user feedback
US20110208730A1 (en) * 2010-02-23 2011-08-25 Microsoft Corporation Context-aware searching
JP2012058941A (ja) * 2010-09-08 2012-03-22 Seiko Epson Corp 情報検索装置、情報検索方法およびコンピュータープログラム
US20120158685A1 (en) * 2010-12-16 2012-06-21 Microsoft Corporation Modeling Intent and Ranking Search Results Using Activity-based Context
US8706725B2 (en) * 2011-03-14 2014-04-22 Microsoft Corporation Ranking contextual signals for search personalization
US9064016B2 (en) * 2012-03-14 2015-06-23 Microsoft Corporation Ranking search results using result repetition
US9489461B2 (en) * 2014-03-03 2016-11-08 Ebay Inc. Search ranking diversity based on aspect affinity
CN105446972B (zh) * 2014-06-17 2022-06-10 阿里巴巴集团控股有限公司 基于及融合用户关系数据的搜索方法、装置和系统
US11210301B2 (en) * 2016-06-10 2021-12-28 Apple Inc. Client-side search result re-ranking
US10558687B2 (en) * 2016-10-27 2020-02-11 International Business Machines Corporation Returning search results utilizing topical user click data when search queries are dissimilar
US10409852B2 (en) * 2016-12-30 2019-09-10 Atlassian Pty Ltd Method, apparatus, and computer program product for user-specific contextual integration for a searchable enterprise platform
US20180232449A1 (en) * 2017-02-15 2018-08-16 International Business Machines Corporation Dynamic faceted search
US10726072B2 (en) * 2017-11-15 2020-07-28 Sap Se Internet of things search and discovery graph engine construction
US10929218B2 (en) * 2018-05-16 2021-02-23 Nec Corporation Joint semantic and format similarity for large scale log retrieval
US11868355B2 (en) * 2019-03-28 2024-01-09 Indiavidual Learning Private Limited System and method for personalized retrieval of academic content in a hierarchical manner
US11907401B2 (en) * 2019-07-01 2024-02-20 Warner Bros. Entertainment Inc. Systems and methods to maintain user privacy whtle providing recommendations
US20210004420A1 (en) * 2019-07-02 2021-01-07 Microsoft Technology Licensing, Llc Post-ranker for search results

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011227922A (ja) 2004-07-13 2011-11-10 Google Inc 検索結果内におけるプレーストコンテンツの順序付けのパーソナライズ
JP2010061420A (ja) 2008-09-04 2010-03-18 Yahoo Japan Corp 商品情報検索装置、方法及びシステム
US20150293976A1 (en) 2014-04-14 2015-10-15 Microsoft Corporation Context-Sensitive Search Using a Deep Learning Model
US20170091189A1 (en) 2015-09-28 2017-03-30 Yahoo! Inc. Location-sensitive ranking for search and related techniques

Also Published As

Publication number Publication date
WO2021039372A1 (ja) 2021-03-04
US11914601B2 (en) 2024-02-27
JPWO2021039372A1 (ja) 2021-03-04
US20220300519A1 (en) 2022-09-22

Similar Documents

Publication Publication Date Title
JP7542540B2 (ja) 需要予測装置
JP7166350B2 (ja) 対話装置
US11868734B2 (en) Dialogue system
JP7323370B2 (ja) 審査装置
JP7054731B2 (ja) 対話システム
US12001793B2 (en) Interaction server
JP7438191B2 (ja) 情報処理装置
JP7548912B2 (ja) リランキング装置
JP7087095B2 (ja) 対話情報生成装置
WO2019216054A1 (ja) 対話サーバ
JP7216199B2 (ja) 対話システム
JP2019139629A (ja) 機械翻訳装置、翻訳学習済みモデル及び判定学習済みモデル
WO2019187463A1 (ja) 対話サーバ
JP6745402B2 (ja) 質問推定装置
WO2020070943A1 (ja) パターン認識装置及び学習済みモデル
JP6705038B1 (ja) 行動支援装置
WO2024089954A1 (ja) 情報処理装置
JP7576178B2 (ja) 時系列データ処理装置
WO2024166512A1 (ja) 同行判別装置
WO2021251188A1 (ja) 推奨情報提供装置
WO2024190038A1 (ja) データ処理システム
WO2023007922A1 (ja) 情報処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230609

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240611

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240807

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240820

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240829

R150 Certificate of patent or registration of utility model

Ref document number: 7548912

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150