JP7001380B2 - Information processing systems, information processing methods, and programs - Google Patents
Information processing systems, information processing methods, and programs Download PDFInfo
- Publication number
- JP7001380B2 JP7001380B2 JP2017137663A JP2017137663A JP7001380B2 JP 7001380 B2 JP7001380 B2 JP 7001380B2 JP 2017137663 A JP2017137663 A JP 2017137663A JP 2017137663 A JP2017137663 A JP 2017137663A JP 7001380 B2 JP7001380 B2 JP 7001380B2
- Authority
- JP
- Japan
- Prior art keywords
- category
- similarity
- session
- user
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 22
- 238000003672 processing method Methods 0.000 title claims description 5
- 230000006399 behavior Effects 0.000 claims description 86
- 230000009471 action Effects 0.000 claims description 58
- 238000009795 derivation Methods 0.000 claims description 47
- 238000006243 chemical reaction Methods 0.000 description 41
- 238000004364 calculation method Methods 0.000 description 27
- 238000000034 method Methods 0.000 description 19
- 230000008569 process Effects 0.000 description 15
- 238000004458 analytical method Methods 0.000 description 13
- 230000010354 integration Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 11
- 238000010411 cooking Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 235000013305 food Nutrition 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 235000014510 cooky Nutrition 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は、情報処理システム、情報処理方法、およびプログラムに関する。 The present invention relates to information processing systems, information processing methods, and programs.
ユーザの行動履歴を取得する取得部と、前記取得部によって取得された行動履歴のうち所定の行動よりも前の行動履歴を用いて、当該所定の行動をすることが予測される対象のユーザを抽出する抽出部と、を備えた抽出装置が提案されている(特許文献1参照)。 A target user who is predicted to perform the predetermined action by using the acquisition unit for acquiring the user's action history and the action history obtained by the acquisition unit before the predetermined action. An extraction device including an extraction unit for extraction has been proposed (see Patent Document 1).
ところで、ユーザの検索行動に関連するより有用な情報を提供することができると好ましい場合がある。 By the way, it may be preferable to be able to provide more useful information related to the user's search behavior.
本発明は、このような事情を考慮してなされたものであり、ユーザの検索行動に関連するより有用な情報を提供することができる情報処理システム、情報処理方法、およびプログラムを提供することを目的の一つとする。 The present invention has been made in consideration of such circumstances, and provides an information processing system, an information processing method, and a program capable of providing more useful information related to a user's search behavior. It is one of the purposes.
本発明の一態様は、ユーザの複数の検索行動の内容に基づき、前記複数の検索行動の間の類似度を導出する第1導出部と、前記第1導出部により導出された前記類似度に基づき、前記複数の検索行動の間でセッションを分割するセッション分割部と、を備えた情報処理システムである。 One aspect of the present invention is a first derivation unit for deriving the similarity between the plurality of search behaviors based on the contents of the plurality of search behaviors of the user, and the similarity degree derived by the first derivation unit. Based on this, it is an information processing system including a session dividing unit that divides a session among the plurality of search actions.
本発明の一態様によれば、ユーザの検索行動に関連するより有用な情報を提供することができる。 According to one aspect of the present invention, it is possible to provide more useful information related to the user's search behavior.
以下、図面を参照して、情報処理システム、情報処理方法、およびプログラムの実施形態について説明する。本実施形態では、情報処理システムが販売サイトを提供するサーバ装置に適用されたものとして説明する。販売サイトは、ブラウザによって再生されるものに限らず、アプリケーションプログラムによって再生されるものも含むものとする。サーバ装置は、インターネットなどのネットワークを介してユーザ端末装置と通信可能に接続され、販売サイトに対するユーザの検索行動を示す情報を取得する。サーバ装置は、ユーザから入力された複数のクエリの間の類似度を導出し、導出した類似度に基づきセッションを分割する。また、サーバ装置は、分割したセッションに関する情報に基づき、ユーザのコンバージョンの予測値(ユーザが所定の行動をとる確率)を導出する。以下、実施形態について説明する。 Hereinafter, an information processing system, an information processing method, and an embodiment of a program will be described with reference to the drawings. In the present embodiment, it is assumed that the information processing system is applied to the server device that provides the sales site. The sales site is not limited to those played by the browser, but also includes those played by the application program. The server device is communicably connected to the user terminal device via a network such as the Internet, and acquires information indicating the user's search behavior for the sales site. The server device derives the similarity between multiple queries entered by the user and divides the session based on the derived similarity. Further, the server device derives a predicted value of conversion of the user (probability that the user takes a predetermined action) based on the information about the divided session. Hereinafter, embodiments will be described.
図1は、実施形態のサーバ装置(情報処理システム)10の使用環境を示す図である。サーバ装置10は、ネットワークNWを介してユーザ端末装置UDおよびクライアント端末装置CDと通信可能に接続される。ネットワークNWは、インターネットやWAN(Wide Area Network)、LAN(Local Area Network)などを含む。また、サーバ装置10と通信可能に接続されるユーザ端末装置UDおよびクライアント端末装置CDの数は、例えばそれぞれ複数である。
FIG. 1 is a diagram showing a usage environment of the server device (information processing system) 10 of the embodiment. The
ユーザ端末装置UDは、ユーザによって使用される情報処理装置である。ユーザ端末装置UDは、例えば、商品またはサービス(以下、「商品等」と称する)を販売するための、サーバ装置10が提供する販売サイトを閲覧するためのブラウザやアプリケーションプログラムを有する。ユーザ端末装置UDは、販売サイトで紹介されている商品等を、ユーザが検索したり、購入または契約(予約を含む)(以下、単に「購入」と称する)したりするために利用される。商品等は、「対象物」の一例である。
The user terminal device UD is an information processing device used by the user. The user terminal device UD has, for example, a browser or an application program for browsing a sales site provided by the
クライアント端末装置CDは、クライアントによって使用される情報処理装置である。クライアント端末装置CDは、例えば、販売対象の商品等の情報(以下、「商品情報」と称する)をサーバ装置10に登録するためにクライアントによって利用される。
The client terminal device CD is an information processing device used by the client. The client terminal device CD is used by the client, for example, to register information such as a product to be sold (hereinafter referred to as "product information") in the
サーバ装置10は、商品等の販売サイトを提供する。サーバ装置10は、クライアント端末装置CDによって登録された商品情報を記憶し、ユーザ端末装置UDを通じてユーザの検索行動の入力を受け付けると、ユーザの検索行動に応じて絞り込まれた商品情報を掲載した販売サイトをユーザ端末装置UDに対して配信する。
The
本実施形態のサーバ装置10は、例えば、商品情報取得部100と、行動情報取得部200と、類似度分析部300と、セッション分割部400と、計算モデル学習部500と、CV予測部600と、情報出力部700と、記憶部800とを備える。
The
商品情報取得部100、行動情報取得部200、類似度分析部300、セッション分割部400、計算モデル学習部500、CV予測部600、および情報出力部700の全部または一部は、例えば、CPU(Central Processing Unit)などのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。また、これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)などのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。
All or part of the product
記憶部800は、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、HDD(Hard Disk Drive)、フラッシュメモリ、またはこれらのうち複数が組み合わされたハイブリッド型記憶装置などにより実現される。なお、記憶部800の全部または一部は、NAS(Network Attached Storage)や外部のストレージサーバなど、サーバ装置10のプロセッサがアクセス可能な外部装置により実現されてもよい。記憶部800には、商品情報データベースDB1、行動情報データベース(過去ログ)DB2、カテゴリツリー情報データベースDB3、計算モデル情報データベースDB4、およびCV予測値情報データベースDB5が格納される。
The
次に、サーバ装置10の各機能部について詳しく説明する。
Next, each functional unit of the
まず、商品情報取得部100について説明する。商品情報取得部100は、ネットワークNWを通じてクライアント端末装置CDから入力される商品情報を取得する。「商品情報」とは、販売サイトにて紹介される商品等に関する情報であり、例えば、商品等の名前、内容、生産者(提供者)、価格、送料、在庫数、配達予定日などである。「商品情報」は、商品等のカテゴリを示すカテゴリ情報を含む。カテゴリ情報は、商品等が属する階層状のカテゴリを特定するとともに、以下に示す「カテゴリパスP」を含む。
First, the product
図2は、カテゴリパスPを説明するための図である。図2に示すように、階層状のカテゴリは、広い概念から順に、第1階層、第2階層、…、第N階層(Nは3以上の自然数)を含む。ここでは説明の便宜上、4階層の階層状のカテゴリについて説明するが、カテゴリの階層は、3階層以下でもよく、5階層以上でもよい。 FIG. 2 is a diagram for explaining the category path P. As shown in FIG. 2, the hierarchical category includes a first layer, a second layer, ..., And an Nth layer (N is a natural number of 3 or more) in order from a broad concept. Here, for convenience of explanation, a four-layered hierarchical category will be described, but the category layer may be three or less layers or five or more layers.
「カテゴリパスP」とは、階層状のカテゴリにおいて、最上位層のカテゴリから中位層のカテゴリを経由して最下位層の1つのカテゴリに向かう1本の仮想的なパスを意味する。例えば、図2に示す例では、最下位層(第4階層)のカテゴリ「洋食」に属するある商品のカテゴリパスPは、「本(第1階層)>育児(第2階層)>料理(第3階層)>洋食(第4階層)」となる。カテゴリパスPは、個々の階層状のカテゴリにおいて、最下位層のカテゴリの数だけ存在する。このようなカテゴリパスPは、クライアント端末装置CDを通じて商品情報がサーバ装置10に登録されるときに、個々の商品等に対して付与される。例えば、販売サイトが有する階層状のカテゴリにおいて、新たに登録される商品等が属する最下位層のカテゴリが指定されることで、その登録される商品等に対してカテゴリパスPが付与される。
The "category path P" means one virtual path from the category of the highest layer to one category of the lowest layer via the category of the middle layer in the hierarchical category. For example, in the example shown in FIG. 2, the category path P of a certain product belonging to the category "Western food" of the lowest layer (fourth layer) is "book (first layer)> childcare (second layer)> cooking (first layer). 3rd floor)> Western food (4th floor) ". There are as many category paths P as there are categories in the lowest layer in each hierarchical category. Such a category path P is given to each product or the like when the product information is registered in the
図3は、本実施形態の商品情報の内容の一例を示す図である。図3に示すように、例えば、商品等に対して登録された商品情報は、複数の階層の各カテゴリにおいて、その商品等がいずれのカテゴリに属するかを示す情報を含む。このように、複数の階層の各々においてその商品等がいずれのカテゴリに属するかを示す情報が登録されていることは、「商品等にカテゴリパスPが付与されている」の一例に該当する。またこれに代えて、商品等に対してその商品等が最下位層のどのカテゴリに属するかを示す情報が登録されており、最下位層の各カテゴリとそれよりも上位のカテゴリとの対応関係を示す情報が参照可能である場合も、「商品等にカテゴリパスPが付与されている」の一例に該当する。 FIG. 3 is a diagram showing an example of the contents of the product information of the present embodiment. As shown in FIG. 3, for example, the product information registered for a product or the like includes information indicating which category the product or the like belongs to in each category of a plurality of layers. As described above, the fact that the information indicating which category the product or the like belongs to is registered in each of the plurality of layers corresponds to an example of "the category pass P is given to the product or the like". Instead of this, information indicating which category of the lowest layer the product belongs to is registered for the product, etc., and the correspondence between each category of the lowest layer and the category higher than that is registered. Even if the information indicating the above can be referred to, it corresponds to an example of "a category pass P is given to a product or the like".
次に、行動情報取得部200について説明する。行動情報取得部200は、販売サイトに対するユーザ端末装置UDを通じたユーザの行動情報を取得する。行動情報取得部200は、ユーザの新しい行動を受け付ける度に、ユーザの行動情報を取得する。行動情報取得部200は、取得したユーザの行動情報を、行動情報データベースDB2に登録するとともに、類似度分析部300およびCV予測部600に出力する。ユーザの行動情報は、ユーザの検索行動に関する情報、およびユーザの特定行動(後述)に関する情報を含む。
Next, the behavior
「検索行動」とは、例えば、商品等を探すまたは絞り込むための行動である。例えば、「検索行動」とは、クエリ(検索クエリ)の入力、販売サイトで設定されている商品等を絞り込むためのボタンなどに対するクリック、および販売サイトで設定されている商品等の表示順を変更するためのボタンなどに対するクリックなどを含む。「検索行動に関する情報」とは、ユーザによる検索行動の内容、およびその検索行動が行われた時刻などを含む。また本願でいう「ボタン」とは、画面に表示された仮想的なものでもよく、ラジオボックスのようなボタンと同視できるものも含む。 The "search action" is, for example, an action for searching for or narrowing down a product or the like. For example, "search behavior" means inputting a query (search query), clicking on a button for narrowing down the products set on the sales site, and changing the display order of the products set on the sales site. Includes clicks on buttons etc. to do. The "information about the search behavior" includes the content of the search behavior by the user, the time when the search behavior is performed, and the like. Further, the "button" referred to in the present application may be a virtual one displayed on the screen, and includes a button that can be equated with a button such as a radio box.
「特定行動」とは、例えば、検索行動によって絞り込まれた個々の商品等に対する行動である。例えば、「特定行動」とは、販売サイトに表示された複数の商品等のなかから、1以上の商品等を選択する行動である。例えば、「特定行動」とは、商品等の詳細な紹介ページへのハイパーリンクに対するクリックや、商品等を購入するための購入ボタンに対するクリックなどを含む。「特定行動に関する情報」とは、ユーザによる特定行動の内容、およびその特定行動が行われた時刻などを含む。 The "specific action" is, for example, an action for an individual product or the like narrowed down by a search action. For example, the "specific action" is an action of selecting one or more products or the like from a plurality of products or the like displayed on the sales site. For example, the "specific action" includes a click on a hyperlink to a detailed introduction page of a product or the like, a click on a purchase button for purchasing a product or the like, and the like. The "information about the specific action" includes the content of the specific action by the user, the time when the specific action is performed, and the like.
図4は、本実施形態のユーザ行動情報の内容の一例を示す図である。図4に示すように、ユーザ行動情報では、ユーザの各行動(例えば、検索行動および特定行動)と、その行動が販売サイトに対して行われた時刻とが対応付けられて管理されている。また、ユーザ行動情報は、ユーザ毎に管理されている。 FIG. 4 is a diagram showing an example of the content of the user behavior information of the present embodiment. As shown in FIG. 4, in the user behavior information, each behavior of the user (for example, a search behavior and a specific behavior) is managed in association with the time when the behavior is performed on the sales site. In addition, user behavior information is managed for each user.
次に、類似度分析部300について説明する。類似度分析部300は、販売サイトに対するユーザの複数の検索行動の内容に基づき、その複数の検索行動の間の類似度を導出する。本実施形態では、販売サイトに対してユーザから入力された複数のクリエの内容に基づき、その複数のクエリ間の類似度を前記複数の検索行動の間の類似度として導出する。
Next, the
ここで、本願で言う「クエリ」について定義する。クエリとは、ウェブサイトに対する要求を所定の形式の文字で表現したものである。クエリは、例えば、ウェブサイトに対して直接に入力された文字である。ただし、本実施形態では、類似度分析部300は、直接に入力されたクエリだけに限らず、直接に入力されたクエリと同視できる検索行動がなされた場合も、前記直接に入力されたクエリと同視できる検索行動をクエリの入力として取り扱う。「直接に入力されたクエリと同視できる検索行動」とは、ある項目(例えば、ある商品等)に関連するページへのハイパーリンクに対するクリックなどである。
Here, the "query" referred to in the present application is defined. A query is a written representation of a request for a website in a given format. A query is, for example, a character entered directly into a website. However, in the present embodiment, the
また、本実施形態では、1つの検索ボックスに複数のターム(キーワード)が1度に入力された場合、その入力された複数のタームを纏めて1つのクエリとして取り扱う。例えば、検索ボックスに「本 小説」のような入力がされた場合、「本 小説」で1つのクエリとなる。言い換えると、「本」と入力されたクエリと、「本 小説」と入力されたクエリとは、互いに異なるクエリとして取り扱われる。 Further, in the present embodiment, when a plurality of terms (keywords) are input at one time in one search box, the input plurality of terms are collectively treated as one query. For example, if an input such as "this novel" is entered in the search box, "this novel" becomes one query. In other words, the query entered as "book" and the query entered as "book novel" are treated as different queries.
図5は、本実施形態の類似度分析部300の構成を示すブロック図である。本実施形態の類似度分析部300は、同一のクエリを入力したユーザ群毎に、そのユーザ群が選択した複数の商品等のそれぞれに付与されているカテゴリパスを収集する。そして、類似度分析部300は、収集した複数のカテゴリパスに基づいてクエリ毎のカテゴリツリーを生成し、生成したクエリ毎のカテゴリツリーに基づいて複数のクエリ間の類似度を導出する。以下、この内容について詳しく説明する。図5に示すように、類似度分析部300は、例えば、カテゴリパス収集部310と、カテゴリツリー生成部320と、類似度導出部330とを有する。
FIG. 5 is a block diagram showing the configuration of the
カテゴリパス収集部310は、同一のクエリを入力したユーザ群毎に、そのユーザ群が販売サイトで選択した複数の商品等のそれぞれに付与されているカテゴリパスPを収集する。詳しく述べると、カテゴリパス収集部310は、販売サイトに対して検索行動を行った複数のユーザのなかで、同一のクエリ(以下、「特定クエリ」と称する)を入力したユーザを特定する。例えば、カテゴリパス収集部310は、行動情報データベースDB2に登録されたユーザ行動情報を参照することで、特定クエリを入力したユーザを抽出する。
The category
また、カテゴリパス収集部310は、特定クエリを入力したユーザがその特定クエリを入力した直後に選択した商品等を特定する。なお、「特定クエリを入力した直後」とは、特定クエリの入力と、商品等の選択との間に、別のクエリの入力が存在しないことを意味する。「特定クエリを入力した直後」とは、特定クエリの入力と、商品等の選択との間に、商品等の表示順の変更などの別の行動が存在してもよい。また、「(商品等を)選択した」とは、例えば、その商品等に対して上記特定行動が行われたことを意味する。例えば、本実施形態では、カテゴリパス収集部310は、個々の商品等に関連するボタンまたはハイパーリンクがクリックされたこと(アクセスされたこと)を、「商品等が選択された」と見做す。なおこれに代えて、カテゴリパス収集部310は、商品等が実際に購入されたことに限定して「商品等が選択された」と見做してもよい。カテゴリパス収集部310は、行動情報データベースDB2に登録されたユーザ行動情報を参照し、ユーザ行動情報に含まれる時刻情報に基づくことで、ユーザが特定クエリを入力した直後に選択した商品等を特定する。カテゴリパス収集部310は、上記処理を、同一のクエリを入力した全てのユーザに対して実行する。
Further, the category
また、カテゴリパス収集部310は、商品情報データベースDB1に登録された商品情報を参照し、特定クエリを入力したユーザがその特定クエリを入力した直後に選択した商品等に付与されているカテゴリパスPを収集する。ここで、同一クエリを入力した複数のユーザが別々の商品等を選択している場合には、それら複数の商品等のそれぞれに対応する複数のカテゴリパスPが収集される。カテゴリパス収集部310は、上記処理を、同一のクエリを入力したユーザ群によって選択された全ての商品等に対して実行する。
Further, the category
図6は、あるクエリを入力したユーザ群に対してカテゴリパス収集部310により収集されたカテゴリパスPの集まりの一例を示す図である。図6は、特定クエリとして「本」を入力したユーザが、特定クエリを入力した直後に選択した(例えばハイパーリンクをクリックした)商品等のカテゴリパスPの集まりを示す。
FIG. 6 is a diagram showing an example of a collection of category paths P collected by the category
以上のように、カテゴリパス収集部310は、同一のクエリを入力したユーザ群毎に、そのユーザ群が販売サイトで選択した複数の商品等のそれぞれに付与されたカテゴリパスPを収集する。カテゴリパス収集部310は、ユーザ群毎に収集したカテゴリパスPの集まりを、カテゴリツリー生成部320に出力する。カテゴリパス収集部310は、所定期間の間に販売サイトに入力された全てのクエリの各々に対して上記処理を行う。
As described above, the category
図5に戻り説明すると、カテゴリツリー生成部320は、カテゴリパス収集部310により収集されたユーザ群毎に収集された複数のカテゴリパスPに基づき、その複数のカテゴリパスPに含まれる同一のカテゴリを統合することで、クエリ毎のカテゴリツリーTを生成する。カテゴリツリー生成部320は、例えば、カテゴリパス統合部321と、重み付与部322とを有する。
Returning to FIG. 5, the category
カテゴリパス統合部321は、カテゴリパス収集部310により収集されたユーザ群毎に収集された複数のカテゴリパスPに含まれる同一のカテゴリを統合する。すなわち、カテゴリパス統合部321は、複数のカテゴリパスPのなかで、例えば同一階層に同一のカテゴリを持つ2つ以上のカテゴリパスPが存在しないか判定する。そして、カテゴリパス統合部321は、同一階層に同一カテゴリを持つ2つ以上のカテゴリパスPが存在する場合、そのカテゴリおよびそのカテゴリよりも上位のカテゴリを統合することで、前記2つ以上のカテゴリパスPを1つのカテゴリツリーTに変換する。カテゴリパス統合部321は、上記のようなカテゴリの統合を、階層状のカテゴリの各階層で行う。
The category
図7は、カテゴリパス統合部321により生成されたカテゴリツリーTの一例を示す図である。図7に示されたカテゴリツリーTは、図6に示されたカテゴリパスPの集まりに基づいて生成されたカテゴリツリーである。図7に示すように、同一階層に同一カテゴリを持つ2つ以上のカテゴリパスPが存在する場合、そのカテゴリおよびそのカテゴリよりも上位のカテゴリが統合されて、1つのカテゴリツリーTが生成されている。
FIG. 7 is a diagram showing an example of the category tree T generated by the category
また、カテゴリパス統合部321は、生成したカテゴリツリーTにおいて、第1階層のカテゴリのさらに上位に、ルートノードRNを設定する。ルートノードRNは、第1階層のさらに上位の階層(第0階層)に設定された仮想的なカテゴリとして取り扱われる。ルートノードRNは、全てのクエリのカテゴリツリーTで同一の内容である。なお、ルートノードRNの役割については後述する。
Further, the category
重み付与部322は、カテゴリパス統合部321により生成されたカテゴリツリーTに含まれる各カテゴリに重みを付与する。詳しく述べると、重み付与部322は、カテゴリツリーTの生成過程で統合されたカテゴリに対して重みを付与する。例えば、重み付与部322は、カテゴリツリーTの生成過程で統合された同一のカテゴリの数に応じてそのカテゴリに付与する重みの大きさを導出する。
The
本実施形態では、重み付与部322は、まず、カテゴリツリーTの生成過程で統合された同一のカテゴリの数に応じてそのカテゴリにスコアを付与する。例えば、図6に示された複数のカテゴリパスPに基づいて図7に示されたカテゴリツリーTが生成される例では、カテゴリ「本」に対して「3」、カテゴリ「育児」に対して「2」、カテゴリ「料理」に対して「2」、その他のカテゴリに対して「1」のスコアが付与される。
In the present embodiment, the
そして、重み付与部322は、1つのカテゴリツリーTに含まれる全てのカテゴリに付与されたスコアをカテゴリツリーT単位で正規化することで、各カテゴリに付与される重みの値を導出する。図7に示す例では、各カテゴリに付与されたスコアを、全てのカテゴリに付与されたスコアの合計値である「12」で除算することで、各カテゴリに付与される重みの値が導出される。例えば、カテゴリ「本」に対して「0.25」、カテゴリ「育児」に対して「0.167」、カテゴリ「料理」に対して「0.167」、その他のカテゴリに対して「0.083」の重みが付与される。
Then, the
カテゴリツリー生成部320は、前記所定期間の間に販売サイトに入力された全てのクエリに対して上記処理を行い、クエリ毎の重み付きカテゴリツリーTを生成する。カテゴリツリー生成部320により生成されたクエリ毎の重み付きカテゴリツリーTは、カテゴリツリー情報データベースDB3に登録される。
The category
次に、図8を参照して、カテゴリパス統合部321により生成されたカテゴリツリーTの別の例について説明する。図8に示す例では、あるクエリが複数の意味を持つ場合の例である。例えば、1つのクエリに含まれるタームが、ある「水産物の産地」と、その水産物の産地とは全く関係のない「ファッションブランド」とをそれぞれ指す場合である。この場合、そのクエリを入力したユーザがクエリの入力の直後にクリックした商品等は、上記水産物の産地に関連するカテゴリに属する商品等である場合と、上記ファッションブランドに関連するカテゴリに属する商品等である場合がある。この場合、2つの異なる階層状のカテゴリが存在することになるので、それぞれの商品等のカテゴリパスPをそのままでは1つのカテゴリツリーTに統合することができない。そこで本実施形態では、図8に示すように、第1階層のカテゴリのさらに上位にルートノードRNを設定している。そして、2つの異なる階層状のカテゴリから抽出された2つのカテゴリパスPは、ルートノードRNで結合される。これにより、1つのクエリが複数の意味を持つ場合であっても、そのクエリに対応する1つのカテゴリツリーTを生成することができる。
Next, another example of the category tree T generated by the category
次に、図5に戻り、類似度導出部330について説明する。類似度導出部330は、ユーザの複数の検索行動の内容に基づき、前記複数の検索行動の間の類似度を導出する。本実施形態では、ユーザが入力したクエリの内容に基づき、複数のクエリ間の類似度を前記複数の検索行動の間の類似度として導出する。類似度導出部330は、比較対象の複数のクエリ間の類似度を、前記複数のクエリのそれぞれに対してカテゴリツリー生成部320により生成されたカテゴリツリーT同士の類似度に基づき導出する。本実施形態では、類似度導出部330は、木間編集距離を用いて2つの重み付きカテゴリツリーT同士の類似度を求める。類似度導出部330は、「第1導出部」の一例である。
Next, returning to FIG. 5, the
図9は、2つの重み付きカテゴリツリーT同士の類似度の求め方の一例を示す図である。図9に示すように、類似度導出部330は、複数のクエリのそれぞれに対応するカテゴリツリーTに含まれる複数のカテゴリ同士の一致度に基づき、前記複数のクエリ間の類似度を導出する。例えば、類似度導出部330は、複数のクエリのそれぞれに対応するカテゴリツリーTに含まれるカテゴリ同士が一致するか否かを最上位のカテゴリ(例えばルートノードRN)から順に判定し、前記最上位のカテゴリから連続してどれだけ多くのカテゴリが一致するかに基づき、複数のクエリ間の類似度を導出する。ここでは、最上位のカテゴリから連続して一致するカテゴリの数が多いほど、高い類似度が導出される。
FIG. 9 is a diagram showing an example of how to obtain the similarity between two weighted category trees T. As shown in FIG. 9, the
図9に示す例では、図9中の左側のカテゴリツリーTがクエリ「本」に対応するカテゴリツリーであり、図9中の右側のカテゴリツリーTが「本」とは異なるクエリに対応するカテゴリツリーである。図9に示す例では、最上位のカテゴリ(ルートノードRN)から見て、カテゴリ「本」、カテゴリ「育児」、カテゴリ「料理」が2つのカテゴリツリーTで一致するカテゴリになる。 In the example shown in FIG. 9, the category tree T on the left side in FIG. 9 is a category tree corresponding to the query "book", and the category tree T on the right side in FIG. 9 corresponds to a query different from the "book". It is a tree. In the example shown in FIG. 9, the category "book", the category "childcare", and the category "cooking" are the same categories in the two category trees T when viewed from the highest category (root node RN).
本実施形態では、類似度導出部330は、複数のクエリのそれぞれに対応するカテゴリツリーTに含まれる複数のカテゴリ同士の一致度と、一致するカテゴリに付与された前記重みとに基づき、複数のクエリ間の類似度を導出する。例えば、類似度導出部330は、複数のクエリのそれぞれに対応するカテゴリツリーTに含まれるカテゴリ同士が一致するか否かを最上位のカテゴリから順に判定し、一致するカテゴリに付与された前記重みの値を加算していくことで、複数のクエリ間の類似度を導出する。一致するカテゴリに付与された前記重みは、例えば、2つのカテゴリツリーTにおいて小さい方の重みの値が採用される。
In the present embodiment, the
図9に示す例では、最上位のカテゴリから見て、カテゴリ「本」、カテゴリ「育児」、カテゴリ「料理」が2つのカテゴリツリーTで一致するカテゴリである。そして、左側のカテゴリツリーTのカテゴリ「本」に対して付与された重みは、「0.25」であり、右側のカテゴリツリーTのテゴリ「本」に対して付与された重みは、「0.20」である。この場合、「0.25」と「0.20」とのうち小さい方である「0.20」が加算対象の重みの値となる。同様に、2つのカテゴリツリーTでカテゴリ「育児」に対して付与された重みの小さい方である「0.15」、および2つのカテゴリツリーTでカテゴリ「料理」に対して付与された重みの小さい方である「0.15」が順に加算される。そして、これら「0.20」、「0.15」、および「0.15」を加算した合計値である「0.5」が2つのカテゴリツリーTの類似度を示す値として導出される。この導出される類似度の値が大きい程、2つのクエリ間の類似度が高いと見做される。 In the example shown in FIG. 9, the category "book", the category "childcare", and the category "cooking" are the same categories in the two category trees T when viewed from the top category. The weight given to the category "book" of the category tree T on the left side is "0.25", and the weight given to the tegori "book" of the category tree T on the right side is "0". .20 ". In this case, "0.20", which is the smaller of "0.25" and "0.20", is the value of the weight to be added. Similarly, the smaller weight "0.15" given to the category "childcare" in the two category trees T, and the weight given to the category "cooking" in the two category tree Ts. The smaller "0.15" is added in order. Then, "0.5", which is the total value obtained by adding these "0.20", "0.15", and "0.15", is derived as a value indicating the similarity between the two category trees T. The larger the derived similarity value, the higher the similarity between the two queries.
また、類似度導出部330は、後述するコンバージョン予測値を導出する段階において、販売サイトに対して入力されるクエリ(すなわち、行動情報取得部200により受け付けられるクエリ)を監視する。そして、類似度導出部330は、ユーザからクエリが新しく入力される毎に、新しく入力されたクエリに対応するカテゴリツリーTをカテゴリツリー情報データベースDB3から取得する。そして、類似度導出部330は、新しく入力されたクエリに対応するカテゴリツリーTと、1つ前に入力されたクエリに対応するカテゴリツリーTとを比較することで、新しく入力されたクエリと1つ前に入力されたクエリとの間の類似度を導出する。類似度導出部330は、新しく入力されたクエリと1つ前に入力されたクエリとの類似度が閾値以下の場合、新しく入力されたクエリと1つ前に入力されたクエリとの類似度が閾値以下であることを示す信号をセッション分割部400に出力する。
Further, the
次に、図1に戻り、セッション分割部400について説明する。セッション分割部400は、類似度導出部330により導出された複数の検索行動の間の類似度に基づき、前記複数の検索行動の間でセッションを分割する。本実施形態では、セッション分割部400は、ユーザから入力された複数のクエリに対して類似度導出部330により導出された複数のクエリ間の類似度に基づき、複数のクエリをそれぞれ受け付けた時刻の間でセッションを分割する。「セッション」とは、例えば、クッキー等の状態管理機能の有効期間である。例えば、ウェブサイト内のあるウェブページにアクセスしてから所定時間経過(タイムアウト)するまでの期間が一つのセッションとして扱われる。また、セッションとは、ウェブサイト内のあるウェブページにアクセスしてから、当該ウェブサイト内の他のウェブページ、または他のウェブサイト内のウェブページに切り替わるまでの期間であってもよい。また、セッションとは、ウェブサイト内のあるウェブページにアクセスしてから、当該ウェブページを表示するウェブブラウザを閉じるまでの期間であってもよい。
Next, returning to FIG. 1, the
図10は、セッション分割部400によるセッションの分割の一例を示す図である。本実施形態では、セッション分割部400は、新しく入力されたクエリと1つ前に入力されたクエリとの類似度が閾値以下であることを示す信号を類似度分析部300から受け取る場合、新しく入力されたクエリを受け付けた時刻と1つ前に入力されたクエリを受け付けた時刻との間でセッションを分割する。
FIG. 10 is a diagram showing an example of session division by the
図10に示す例では、クエリ「本 小説」を受け付けた時刻と、クエリ「服」を受け付けた時刻との間でセッションが分割される。本実施形態のセッション分割部400によれば、クエリ「本 小説」を受け付けた時刻から、クエリ「服」を受け付けた時刻までの経過時間が短い場合でも、2つのクエリの類似度が閾値以下の場合、2つのクエリが受け付けられた時刻の間でセッションが分割される。なお、2つのクエリの入力の間にユーザの別の行動(例えば、商品等を絞り込むボタンに対するクリックなど)がある場合は、セッションは、新しく入力されたクエリを受け付けた時刻の直前で分割される。セッション分割部400は、セッションを分割した場合、セッションを分割したこと、およびセッションを分割することで新しく始まるセッション(以下、「分割セッション」と称する)の開始時刻を、計算モデル学習部500およびCV予測部600に出力する。
In the example shown in FIG. 10, the session is divided between the time when the query "this novel" is received and the time when the query "clothes" is received. According to the
次に、図1に戻り、計算モデル学習部500について説明する。計算モデル学習部500は、ユーザの検索行動に基づきユーザのコンバージョン予測値を導出する計算モデルを学習させる。本実施形態では、計算モデル学習部500により学習される計算モデルは、分割セッションにおけるユーザの検索行動に基づき、分割セッションの間にユーザに対して提示されている商品等に対するユーザのコンバージョン予測値を導出する計算モデルである。
Next, returning to FIG. 1, the calculation
詳しく述べると、上記計算モデルに対する入力は、リクエスト素性情報と、セッション素性情報とを含む。一方で、上記計算モデルからの出力は、ユーザのコンバージョン予測値である。 More specifically, the input to the above calculation model includes request feature information and session feature information. On the other hand, the output from the above calculation model is the conversion prediction value of the user.
リクエスト素性情報は、例えば、ユーザの検索行動の内容と、その検索行動を行った時刻を示す情報である。検索行動の内容は、例えば、ユーザにより入力されたクエリの内容、販売サイトでの商品等の表示順(並び順)の変更に関するユーザのリクエストの内容、販売サイトでの商品等の絞り込み条件に関するユーザのリクエストの内容などである。ユーザにより入力されたクエリの内容は、例えばベクトル表現に変換されて上記計算モデルに入力される。ベクトル表現は、例えばクエリの内容を分散表現で表した密ベクトルであるが、クエリの内容を局所表現で表した疎ベクトルでもよい。販売サイトでの商品等の表示順は、商品等を人気順で表示するか、または価格順で表示するか、などである。販売サイトでの商品等の絞り込み条件は、商品等の在庫の有無、商品等の配達予定日が所定日数以内であること、送料が無料であること、などである。リクエスト素性情報は、行動情報取得部200により取得されたユーザ行動情報に基づいて得ることができる。
The request feature information is, for example, information indicating the content of the user's search action and the time when the search action was performed. The content of the search behavior is, for example, the content of the query input by the user, the content of the user's request for changing the display order (order) of the products etc. on the sales site, and the user regarding the narrowing conditions of the products etc. on the sales site. The content of the request. The content of the query input by the user is converted into, for example, a vector representation and input to the above calculation model. The vector representation is, for example, a dense vector in which the content of the query is represented by a distributed representation, but may be a sparse vector in which the content of the query is represented by a local representation. The display order of the products and the like on the sales site is whether to display the products or the like in the order of popularity or the order of price. The conditions for narrowing down the products on the sales site are whether or not the products are in stock, the scheduled delivery date of the products is within a predetermined number of days, and the shipping fee is free. The request feature information can be obtained based on the user behavior information acquired by the behavior
セッション素性情報は、分割セッションに関する時刻情報、および分割セッションにおけるリクエスト素性の平均値などである。分割セッションに関する時刻情報は、例えば、分割セッション開始からの経過時間である。「分割セッション開始からの経過時間」とは、例えば、分割セッション開始からユーザによる検索行動(クエリの入力、商品等の表示順変更や絞り込みのリクエスト等)を受け付けた時点までの経過時間である。例えば、1つの分割セッションにおいてユーザが複数の検索行動を行った場合、「分割セッション開始からの経過時間」とは、例えば、分割セッション開始からユーザによる各検索行動を受け付けた各時点までの各経過時間である。「リクエスト素性の平均値」とは、例えば、分割セッションをユーザのリクエスト(例えばクエリの入力)の集合とみなしたとき、リクエスト毎に得た「リクエスト素性情報」のベクトル(上述したクエリの内容を分散表現または局所表現で表したベクトル)の平均値である。セッション素性情報は、セッション分割部400および行動情報取得部200により導出または取得された情報に基づいて得られる。
The session feature information includes time information related to the split session and the average value of request features in the split session. The time information regarding the split session is, for example, the elapsed time from the start of the split session. The "elapsed time from the start of the split session" is, for example, the elapsed time from the start of the split session to the time when the user receives a search action (query input, change of display order of products, request for narrowing down, etc.). For example, when a user performs a plurality of search actions in one divided session, the "elapsed time from the start of the divided session" means, for example, each elapsed time from the start of the divided session to each time point when each search action by the user is accepted. It's time. The "average value of request features" is, for example, a vector of "request feature information" obtained for each request when a split session is regarded as a set of user requests (for example, query input) (contents of the above-mentioned query). It is the average value of a vector expressed in a distributed representation or a local representation). The session feature information is obtained based on the information derived or acquired by the
コンバージョン予測値は、分割セッションの間にユーザに対して提示されている商品等に対してユーザが所定の行動をとる確率である。コンバージョン予測値は、種々の目的に応じて異なる定義が可能である。コンバージョン予測値の一例は、分割セッションの間にユーザに対して提示されている商品等をユーザが購入する確率である。ただし、コンバージョン予測値は、上記例に限らず、分割セッションの間にユーザに対して提示されている商品等のハイパーリンクをユーザがクリックする確率でもよいし、別の定義によるものでもよい。 The conversion prediction value is the probability that the user takes a predetermined action for the product or the like presented to the user during the divided session. Predicted conversion values can be defined differently for different purposes. An example of the conversion prediction value is the probability that the user purchases a product or the like presented to the user during the split session. However, the conversion prediction value is not limited to the above example, and may be the probability that the user clicks a hyperlink such as a product presented to the user during the split session, or may be based on another definition.
本実施形態では、計算モデル学習部500は、過去の一定期間において行動情報取得部200およびセッション分割部400により取得または導出されたユーザの行動情報およびセッション情報を教師データとして上記学習モデルを学習させる。行動情報取得部200により取得されたユーザの行動情報は、上記リクエスト素性情報と、ユーザが実際に上記所定の行動(例えば、商品等の購入)を行った否かを示す情報を含む。複数のユーザについて上記所定の行動が実際に行われた否かを示す情報(例えば、コンバージョン率)は、コンバージョン予測値に対する正解データである。セッション分割部400により取得されたセッション情報は、複数のクエリ間の類似度に基づいて分割された分割セッションに関する時刻情報(例えば、分割セッション開始からコンバージョン予測値を導出する時点までの経過時間)を含む。
In the present embodiment, the calculation
計算モデル学習部500は、上記のような情報を教師データとした機械学習により、ユーザの行動情報およびセッション情報と、コンバージョン予測値との関係を示す計算モデルを学習する。機械学習の手法は、例えば、サポートベクターマシン(SVM:Support Vector Machine)やディープランニングであるが、これらに限定されない。計算モデル学習部500は、学習した計算モデルを、計算モデル情報データベースDB4に登録する。
The calculation
CV予測部600は、コンバージョン予測値を求めたいユーザ(以下、「対象ユーザ」と称する)の検索行動に基づき、対象ユーザのコンバージョン予測値を導出する。CV予測部600は、クエリ間類似度を用いて分割された分割セッションにおける対象ユーザの検索行動に基づき、前記分割セッションの間に提示されている商品等に対する対象ユーザのコンバージョン予測値を導出する。CV予測部600は、分割セッションにおける対象ユーザの検索行動の内容と、分割セッションに関する時刻情報とに基づき、対象ユーザのコンバージョン予測値を導出する。例えば、CV予測部600は、分割セッションにおける対象ユーザの検索行動の内容と、分割セッション開始からの経過時間とに基づき、対象ユーザのコンバージョン予測値を導出する。CV予測部600は、「第2導出部」の一例である。
The
詳しく述べると、CV予測部600は、行動情報取得部200により取得されたユーザの行動情報を受け取る。また、CV予測部600は、セッション分割部400により導出されたセッション情報(例えば、分割セッション開始からの経過時間)を受け取る。また、CV予測部600は、計算モデル情報データベースDB4を参照することで、計算モデル学習部500により学習された計算モデルを読み出す。そして、CV予測部600は、例えば、ユーザの各検索行動の内容と、分割セッション開始からの経過時間と、上記計算モデルとに基づき、コンバージョン予測値を導出する。CV予測部600は、導出したコンバージョン予測値を示す情報を、CV予測値情報データベースDB5に登録する。
More specifically, the
なお上記に代えて、CV予測部600は、行動情報取得部200により取得されたユーザの行動情報と、セッション分割部400により導出されたセッション情報とに基づき、分割セッション開始からのユーザの各検索行動が行われた各時点までの各経過時間を導出してもよい。そして、CV予測部600は、ユーザの各検索行動の内容と、分割セッション開始からのユーザの各検索行動が行われた各時点までの各経過時間と、上記計算モデルとに基づき、コンバージョン予測値を導出してもよい。
Instead of the above, the
最後に、情報出力部700について説明する。情報出力部700は、所定の周期に応じて、または外部からの要求を受け付けた場合に、CV予測値情報データベースDB5に登録されたコンバージョン予測値を読み出し、外部に出力する。
Finally, the
次に、サーバ装置10による処理の流れの一例について説明する。サーバ装置10による処理の流れは、(1)カテゴリツリーの導出段階と、(2)クエリ間の類似度を用いたセッション分割およびコンバージョン予測値の導出段階と、に大きく分かれる。以下、これらの内容について説明する。
Next, an example of the processing flow by the
図11は、カテゴリツリーの導出段階の処理の流れの一例を示すフローチャートである。図11に示すように、まず、カテゴリパス収集部310は、同一のクエリを入力したユーザ群毎に、前記ユーザ群が選択した商品群に予め付与されているカテゴリパスPを取得する(S101)。
FIG. 11 is a flowchart showing an example of the processing flow at the derivation stage of the category tree. As shown in FIG. 11, first, the category
次に、カテゴリツリー生成部320は、カテゴリパス収集部310により収集されたユーザ群毎のカテゴリパスPの集まりに対して、その集まりの複数のカテゴリパスに含まれる同一のカテゴリを統合することで、カテゴリツリーTを生成する(S102)。次に、カテゴリツリー生成部320は、カテゴリツリーの生成過程で統合された同一カテゴリに対して重みを付与する(S103)。
Next, the category
サーバ装置10は、クエリ毎に、上記S101からS103の処理を行い、クエリ毎のカテゴリツリーTを生成する。これにより、カテゴリツリーTの導出段階が終了する。これにより、カテゴリツリーTを用いたクエリ間類似度の導出と、クエリ間類似度を用いたセッションの分割が可能になる。この後、過去の一定期間におけるユーザの行動情報と、前記一定期間に関して求められた、クエリ間類似度によりセッション分割されたセッション情報)とを教師データとして、コンバージョン予測値を導出するための計算モデルが学習される。
The
図12は、クエリ間の類似度を用いたセッション分割およびコンバージョン予測値の導出段階の処理の流れの一例を示すフローチャートである。図12に示すように、まず、行動情報取得部200は、ユーザが新しいクエリを入力する毎に、ユーザが入力した新しいクエリを受け付ける(S201)。次に、類似度導出部330は、ユーザからクエリが新しく入力される毎に、新しく入力されたクエリに対応するカテゴリツリーTをカテゴリツリー情報データベースDB3から読み出す。そして、類似度導出部330は、新しく入力されたクエリに対応するカテゴリツリーTと、1つ前に入力されたクエリに対応するカテゴリツリーTとを比較する(S202)。これにより、類似度導出部330は、新しく入力されたクエリと1つ前に入力されたクエリとの間の類似度を導出する(S203)。なお、1つ前に入力されたクエリに対応するカテゴリツリーTは、新しく入力されたクエリに対応するカテゴリツリーTと同様にカテゴリツリー情報データベースDB3から読み出されてもよいし、RAMのような揮発性メモリ上で保持されていてもよい。
FIG. 12 is a flowchart showing an example of the processing flow of the session division using the similarity between queries and the derivation stage of the conversion prediction value. As shown in FIG. 12, first, the behavior
次に、類似度導出部330は、新しく入力されたクエリと1つ前に入力されたクエリとの間の類似度が閾値以下であるか否かを判定する(S204)。前記類似度が閾値よりも高い場合(S204:NO)、セッション分割部400は、セッションを分割しない。この場合、S206の処理に進む。
Next, the
一方で、前記類似度が閾値以下である場合(S204:YES)、セッション分割部400は、新しく入力されたクエリが受け付けられた時刻と1つ前に入力されたクエリが受け付けられた時刻との間でセッションを分割する(S205)。セッション分割部400は、セッションが分割されたこと、および新しく始まる分割セッションの開始時刻を示す情報をCV予測部600に出力する。
On the other hand, when the similarity is equal to or less than the threshold value (S204: YES), the
CV予測部600は、行動情報取得部200により取得されたユーザの検索行動の内容と、セッション分割部400により導出されたセッション情報と、上記計算モデルとに基づき、コンバージョン予測値を導出する(S206)。情報出力部700は、CV予測部600により導出されたコンバージョン予測値を示す情報を出力する。サーバ装置10は、例えばユーザにより新しいクエリが入力される毎に、S201からS206の処理を繰り返す。
The
図13は、本実施形態のサーバ装置10を用いたコンバージョン予測値のシミュレーションによる実験結果を示す図である。図13中のセッション分割方法による「ユーザ」とは、ユーザ毎にセッションを分割したモデルを示し、「時間(30分)」とは、1つ前のクエリの入力から新しいクエリの入力までの経過時間が30分以上の場合にセッションを分割したモデルを示し、「w2v」は、word2vecを用いたモデルを示し、「カテゴリツリー」は上記実施形態で説明したモデルを示す。図13に示すように、本実施形態のようなカテゴリツリーTを用いたセッション分割によれば、他の手法に比べて、コンバージョン予測値の導出精度が向上することが確認された。特に、本実施形態のようなカテゴリツリーTを用いたクエリ間類似度の導出方法によれば、「商品券」と「図書券」、または商品名のカタカナ表記と英文表記との間の類似度を、他の手法に比べて高く導出することができることも確認された。
FIG. 13 is a diagram showing experimental results by simulation of conversion prediction values using the
以上説明したサーバ装置10によれば、ユーザの検索行動に関連するより有用な情報を提供することができる。すなわち、本実施形態では、サーバ装置10は、カテゴリパス収集部310と、カテゴリツリー生成部320と、類似度導出部330とを有する。カテゴリパス収集部310は、同一のクエリを入力したユーザ群毎に、そのユーザ群が販売サイトで選択した複数の商品等のそれぞれに付与されているカテゴリパスPを収集する。カテゴリツリー生成部320は、カテゴリパス収集部310により収集されたユーザ群毎の複数のカテゴリパスPに含まれる同一のカテゴリを統合することで、クエリ毎のカテゴリツリーTを生成する。類似度導出部330は、複数のクエリ間の類似度を、前記複数のクエリのそれぞれに対してカテゴリツリー生成部320により生成されたカテゴリツリーT同士の類似度に基づき導出する。このような構成によれば、複数のクエリ間の類似度を、容易に、且つ精度よく、導出することができる。これにより、ユーザの検索行動に関連するより有用な情報を提供することができる。
According to the
本実施形態では、類似度導出部330は、複数のクエリのそれぞれに対応するカテゴリツリーTに含まれる複数のカテゴリ同士の一致度に基づき、複数のクエリ間の類似度を導出する。このような構成によれば、複数のクエリ間の類似度を、比較的簡単な処理で導出することができる。
In the present embodiment, the
本実施形態では、類似度導出部330は、複数のクエリのそれぞれに対応するカテゴリツリーTに含まれるカテゴリ同士が一致するか否かを最上位のカテゴリから順に判定し、最上位のカテゴリから連続してどれだけ多くのカテゴリが一致するかに基づき、複数のクエリ間の類似度を導出する。このような構成によれば、複数のクエリ間の類似度を、比較的簡単な処理で導出することができる。
In the present embodiment, the
本実施形態では、カテゴリツリー生成部320は、カテゴリツリーTの生成過程で統合されたカテゴリに重みを付与する。類似度導出部330は、複数のクエリのそれぞれに対応するカテゴリツリーTに含まれる複数のカテゴリ同士の一致度と、一致するカテゴリに付与された前記重みとに基づき、複数のクエリ間の類似度を導出する。このような構成によれば、統合されたカテゴリに重みが付与されることで、複数のカテゴリツリーTの類似度をさらに精度良く判定することができる。これにより、複数のクエリ間の類似度の導出精度を高めることができる。
In the present embodiment, the category
本実施形態では、カテゴリツリー生成部320は、カテゴリツリーTの生成過程で統合された同一のカテゴリの数に応じてそのカテゴリに付与する前記重みを導出する。このような構成によれば、カテゴリの統合の度合いを反映させることができ、複数のカテゴリツリーTの類似度をさらに精度良く導出することができる。
In the present embodiment, the category
本実施形態では、カテゴリツリー生成部320は、カテゴリツリーTの生成過程で統合された同一のカテゴリの数に応じてそのカテゴリにスコアを付与し、1つのカテゴリツリーに含まれる全てのカテゴリに付与されたスコアを前記カテゴリツリー単位で正規化することで前記重みを導出する。このような構成によれば、クエリ毎にカテゴリツリーTの規模が大きく異なる場合でも、複数のカテゴリツリーTの類似度を精度良く判定することができる。
In the present embodiment, the category
本実施形態では、類似度導出部330は、複数のクエリのそれぞれに対応するカテゴリツリーTに含まれるカテゴリ同士が一致するか否かを最上位のカテゴリから順に判定し、一致するカテゴリに付与された前記重みの値を加算することで、複数のクエリ間の類似度を導出する。このような構成によれば、複数のクエリ間の類似度の導出精度をさらに高めることができる。
In the present embodiment, the
本実施形態では、サーバ装置10は、類似度導出部330と、セッション分割部400とを有する。類似度導出部330は、販売サイトに対するユーザの複数の検索行動の内容に基づき、複数の検索行動の間の類似度を導出する。セッション分割部400は、類似度導出部330により導出された前記類似度に基づき、複数の検索行動の間でセッションを分割する。このような構成によれば、ユーザの意図を考慮したセッション分割が可能になる。これにより、ユーザの検索行動に関連するより有用な情報を提供することができる。
In the present embodiment, the
本実施形態では、類似度導出部330は、販売サイトに対してユーザが入力した複数のクエリの内容に基づき、複数のクエリ間の類似度を複数の検索行動の間の類似度として導出する。セッション分割部400は、複数のクエリ間の類似度に基づき、複数のクエリがそれぞれ入力された時刻の間でセッションを分割する。このような構成によれば、クエリの内容に基づき、セッションを分割することができる。これにより、ユーザの検索行動に関連するより有用な情報を提供することができる。
In the present embodiment, the
本実施形態では、類似度導出部330は、直接入力されたクエリだけでなく、直接入力されたクエリと同視できる検索行動がなされた場合も、前記直接入力されたクエリと同視できる検索行動をクエリの入力として取り扱う。このような構成によれば、クエリのみに用いてセッションが分割される場合に比べて、より精度の高いセッションの分割が可能になる場合がある。
In the present embodiment, the
本実施形態では、サーバ装置10は、セッションを分割することで得られる分割セッションにおけるユーザの検索行動に基づき、分割セッションの間に提示されている商品等に対するユーザのコンバージョン予測値を導出するCV予測部600を備える。このような構成によれば、ユーザの意図を考慮したセッション分割を反映させたコンバージョン予測値の導出が可能になる。このため、コンバージョン予測値の導出精度を高めることができる。
In the present embodiment, the
本実施形態では、CV予測部600は、分割セッションに関する時刻情報に基づき、ユーザのコンバージョン予測値を導出する。このような構成によれば、ユーザの意図が考慮されて分割された分割セッションの時刻情報に基づいてコンバージョン予測値が導出されるため、コンバージョン予測値の導出精度を高めることができる。
In the present embodiment, the
本実施形態では、CV予測部600は、分割セッションの開始からの経過時間に基づき、ユーザのコンバージョン予測値を導出する。このような構成によれば、ユーザの意図が考慮されて分割された分割セッションの開始時刻からの経過時間に基づいてコンバージョン予測値が導出されるため、コンバージョン予測値の導出精度を高めることができる。
In the present embodiment, the
以上、実施形態のサーバ装置10について説明したが、実施形態は上記例に限定されない。また本願において「XXに基づく」とは、「少なくともXXに基づく」ことを意味し、XXに加えて別の要素に基づく場合も含む。また「XXに基づく」とは、XXを直接に用いる場合に限定されず、XXに対して演算や加工が行われたものに基づく場合も含む。「XX」は、任意の要素である。
Although the
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。 Although the embodiments for carrying out the present invention have been described above using the embodiments, the present invention is not limited to these embodiments, and various modifications and substitutions are made without departing from the gist of the present invention. Can be added.
10…サーバ装置(情報処理システム)、300…類似度分析部、310…カテゴリパス収集部、320…カテゴリツリー生成部、330…類似度導出部、400…セッション分割部、600…CV予測部。 10 ... Server device (information processing system), 300 ... Similarity analysis unit, 310 ... Category path collection unit, 320 ... Category tree generation unit, 330 ... Similarity derivation unit, 400 ... Session division unit, 600 ... CV prediction unit.
Claims (9)
前記第1導出部により導出された前記類似度に基づき、前記複数の検索行動の間でセッションを分割するセッション分割部と、を備え、
前記第1導出部は、前記検索された商品に付与されているカテゴリパスに基づいて生成された、前記複数の検索行動ごとのカテゴリツリーに基づいて、前記複数の検索行動の間の類似度を導出する、
情報処理システム。 A first derivation unit that derives the degree of similarity between the plurality of search behaviors based on the contents of the plurality of search behaviors of the user who searches for products on the product sales site by the user.
A session dividing unit that divides a session among the plurality of search actions based on the similarity derived by the first derivation unit is provided.
The first derivation unit determines the degree of similarity between the plurality of search actions based on the category tree for each of the plurality of search actions generated based on the category path given to the searched product. Derived,
Information processing system.
前記セッション分割部は、前記複数のクエリ間の類似度に基づき、前記複数のクエリがそれぞれ入力された時刻の間で前記セッションを分割する、
請求項1に記載の情報処理システム。 The first derivation unit derives the similarity between the plurality of queries as the similarity between the plurality of search actions based on the contents of the plurality of queries input by the user.
The session division unit divides the session between the times when the plurality of queries are input, based on the degree of similarity between the plurality of queries.
The information processing system according to claim 1.
請求項2に記載の情報処理システム。 The first derivation unit handles not only the directly input query but also the search behavior that can be equated with the directly input query as the query input even when the search behavior that can be equated with the directly input query is performed.
The information processing system according to claim 2.
請求項1から請求項3のうちいずれか1項に記載の情報処理システム。 A second derivation that derives the probability that the user will take a predetermined action with respect to the object presented during the divided session based on the search behavior of the user in the divided session obtained by dividing the session. With more parts,
The information processing system according to any one of claims 1 to 3.
請求項4に記載の情報処理システム。 The second derivation unit derives the probability that the user will take the predetermined action based on the time information regarding the split session.
The information processing system according to claim 4.
請求項4または請求項5に記載の情報処理システム。 The second derivation unit derives the probability that the user will take the predetermined action based on the elapsed time from the start of the split session.
The information processing system according to claim 4 or 5.
前記第1導出部により導出された前記類似度に基づき、前記複数の検索行動の間でセッションを分割するセッション分割部と、
同一のクエリを入力したユーザ群毎に、前記ユーザ群により選択された複数の対象物そぞれに付与されているカテゴリパスを収集する収集部と、
前記収集部により収集された前記ユーザ群毎の複数のカテゴリパスに含まれる同一のカテゴリを統合することで、クエリ毎のカテゴリツリーを生成する生成部と、
を備え、
前記第1導出部は、複数のクエリ間の類似度を、前記生成部により生成された前記複数のクエリのそれぞれに対応するカテゴリツリー同士の類似度に基づき導出し、
前記セッション分割部は、前記複数のクエリ間の類似度に基づき、前記複数のクエリがそれぞれ入力された時刻の間で前記セッションを分割する、
情報処理システム。 A first derivation unit that derives the degree of similarity between the plurality of search actions based on the contents of the plurality of search actions of the user, and
A session division unit that divides a session among the plurality of search actions based on the similarity derived by the first derivation unit, and a session division unit.
A collection unit that collects category paths assigned to each of a plurality of objects selected by the user group for each user group that inputs the same query.
A generation unit that generates a category tree for each query by integrating the same categories included in a plurality of category paths for each user group collected by the collection unit.
Equipped with
The first derivation unit derives the similarity between the plurality of queries based on the similarity between the category trees corresponding to each of the plurality of queries generated by the generation unit.
The session division unit divides the session between the times when the plurality of queries are input, based on the degree of similarity between the plurality of queries.
Information processing system.
ユーザによる、商品販売サイトにおける商品を検索するユーザの複数の検索行動の内容に基づき、前記複数の検索行動の間の類似度を導出し、
導出された前記類似度に基づき、前記複数の検索行動の間でセッションを分割し、
前記検索された商品に付与されているカテゴリパスに基づいて生成された、前記複数の検索行動ごとのカテゴリツリーに基づいて、前記複数の検索行動の間の類似度を導出する、
情報処理方法。 The computer
Based on the content of a plurality of search behaviors of a user who searches for a product on a product sales site by the user, the similarity between the plurality of search behaviors is derived.
Based on the derived similarity , the session is divided among the plurality of search behaviors.
Based on the category tree for each of the plurality of search actions generated based on the category path given to the searched product, the similarity between the plurality of search actions is derived.
Information processing method.
ユーザによる、商品販売サイトにおける商品を検索するユーザの複数の検索行動の内容に基づき、前記複数の検索行動の間の類似度を導出させ、
導出された前記類似度に基づき、前記複数の検索行動の間でセッションを分割させ、
前記検索された商品に付与されているカテゴリパスに基づいて生成された、前記複数の検索行動ごとのカテゴリツリーに基づいて、前記複数の検索行動の間の類似度を導出させる、
プログラム。 On the computer
Based on the content of a plurality of search behaviors of a user who searches for a product on a product sales site by the user, the similarity between the plurality of search behaviors is derived.
Based on the derived similarity , the session is divided among the plurality of search behaviors.
Based on the category tree for each of the plurality of search actions generated based on the category path given to the searched product, the similarity between the plurality of search actions is derived.
program.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017137663A JP7001380B2 (en) | 2017-07-14 | 2017-07-14 | Information processing systems, information processing methods, and programs |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017137663A JP7001380B2 (en) | 2017-07-14 | 2017-07-14 | Information processing systems, information processing methods, and programs |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019020939A JP2019020939A (en) | 2019-02-07 |
JP7001380B2 true JP7001380B2 (en) | 2022-01-19 |
Family
ID=65355737
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017137663A Active JP7001380B2 (en) | 2017-07-14 | 2017-07-14 | Information processing systems, information processing methods, and programs |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7001380B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020127558A (en) * | 2019-02-07 | 2020-08-27 | 京楽産業.株式会社 | Game machine |
JP7224392B2 (en) * | 2021-04-09 | 2023-02-17 | 楽天グループ株式会社 | Information processing device, information processing method and program |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010091050A2 (en) | 2009-02-05 | 2010-08-12 | Google Inc. | Determining conversion probability using session metrics |
JP2011154467A (en) | 2010-01-26 | 2011-08-11 | Ntt Docomo Inc | Retrieval result ranking method and system |
JP2017045196A (en) | 2015-08-25 | 2017-03-02 | ヤフー株式会社 | Ambiguity evaluation device, ambiguity evaluation method, and ambiguity evaluation program |
-
2017
- 2017-07-14 JP JP2017137663A patent/JP7001380B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010091050A2 (en) | 2009-02-05 | 2010-08-12 | Google Inc. | Determining conversion probability using session metrics |
JP2012517065A (en) | 2009-02-05 | 2012-07-26 | グーグル・インコーポレーテッド | Determining conversion probabilities using session metrics |
JP2011154467A (en) | 2010-01-26 | 2011-08-11 | Ntt Docomo Inc | Retrieval result ranking method and system |
JP2017045196A (en) | 2015-08-25 | 2017-03-02 | ヤフー株式会社 | Ambiguity evaluation device, ambiguity evaluation method, and ambiguity evaluation program |
Non-Patent Citations (1)
Title |
---|
関口 裕一郎 外4名,検索クエリログを用いたクエリ変更意図の自動推定,第3回データ工学と情報マネジメントに関するフォーラム 論文集 [online],日本,電子情報通信学会データ工学専門委員会,2011年07月21日,pp. 1-6 |
Also Published As
Publication number | Publication date |
---|---|
JP2019020939A (en) | 2019-02-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ni et al. | Perceive your users in depth: Learning universal user representations from multiple e-commerce tasks | |
CN105247507B (en) | Method, system and storage medium for the influence power score for determining brand | |
US8694362B2 (en) | Taxonomy based targeted search advertising | |
CN105912669B (en) | Method and device for complementing search terms and establishing individual interest model | |
US11403532B2 (en) | Method and system for finding a solution to a provided problem by selecting a winner in evolutionary optimization of a genetic algorithm | |
CN111242310B (en) | Feature validity evaluation method and device, electronic equipment and storage medium | |
CA3010803A1 (en) | Machine learning based webinterface generation and testing system | |
US20210118024A1 (en) | Multi-label product categorization | |
US20100185623A1 (en) | Topical ranking in information retrieval | |
US20140280112A1 (en) | Search result ranking by department | |
Layton | Learning data mining with python | |
CN104067273A (en) | Grouping search results into a profile page | |
JP6235443B2 (en) | Extraction apparatus, extraction method and extraction program | |
US10474670B1 (en) | Category predictions with browse node probabilities | |
Dong et al. | Improving sequential recommendation with attribute-augmented graph neural networks | |
JP7001380B2 (en) | Information processing systems, information processing methods, and programs | |
US7444313B2 (en) | Systems and methods for optimizing decision graph collaborative filtering | |
KR20220001616A (en) | Method, Apparatus and System for Constructing Bigdata Based on Generating United Identifier of Customer | |
KR20220001617A (en) | Method, Apparatus and System for Item Recommendation Using Consumer Bigdata | |
KR20220001618A (en) | Method, Apparatus and System for Recommendation in Groups Using Bigdata | |
JP5138621B2 (en) | Information processing apparatus, dissatisfied product discovery method and program | |
Behera et al. | A rule-based automated machine learning approach in the evaluation of recommender engine | |
CN116823410B (en) | Data processing method, object processing method, recommending method and computing device | |
JP6856466B2 (en) | Information processing systems, information processing methods, and programs | |
KR101818716B1 (en) | Method, apparatus and computer readable recording medium for generating exetension data-set of concept keywords |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200305 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210122 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210302 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210427 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211005 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211122 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211130 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211224 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7001380 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |