JP6894875B2 - Brand dictionary creation device, product evaluation device, brand dictionary creation method and program. - Google Patents
Brand dictionary creation device, product evaluation device, brand dictionary creation method and program. Download PDFInfo
- Publication number
- JP6894875B2 JP6894875B2 JP2018160217A JP2018160217A JP6894875B2 JP 6894875 B2 JP6894875 B2 JP 6894875B2 JP 2018160217 A JP2018160217 A JP 2018160217A JP 2018160217 A JP2018160217 A JP 2018160217A JP 6894875 B2 JP6894875 B2 JP 6894875B2
- Authority
- JP
- Japan
- Prior art keywords
- query
- brand
- target text
- product
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011156 evaluation Methods 0.000 title claims description 11
- 238000000034 method Methods 0.000 title description 32
- 238000012545 processing Methods 0.000 claims description 20
- 238000013480 data collection Methods 0.000 claims description 17
- 238000000605 extraction Methods 0.000 claims description 17
- 239000000284 extract Substances 0.000 claims description 8
- 238000012544 monitoring process Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 description 24
- 238000010586 diagram Methods 0.000 description 8
- 230000000877 morphologic effect Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 241000406668 Loxodonta cyclotis Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、ブランド辞書作成装置、商品等評価装置、ブランド辞書作成方法及びプログラムに関する。 The present invention relates to a brand dictionary creation device, a product evaluation device, a brand dictionary creation method, and a program.
所定の検索クエリと、コンテンツのカテゴリ毎の所定の検索クエリに対する対応度合いとを関連付けた情報が格納されるクエリカテゴリ辞書と、ユーザ端末から送信された過去の検索クエリを示す検索クエリ履歴を取得する検索履歴取得手段と、検索クエリ履歴を用いて、クエリカテゴリ辞書から、コンテンツのカテゴリ毎の過去の検索クエリに対する対応度合いを関連付けた情報を抽出し、抽出された情報に基づき、コンテンツのカテゴリに対するユーザ毎の嗜好性の対応度合いを示すユーザ特徴量を算出するユーザ特徴量算出手段と、ユーザ端末から送信された検索要求時の検索クエリに対応すると共にカテゴリに対応付けられたコンテンツを示す情報を含むコンテンツの検索結果を取得する検索結果取得手段と、ユーザ特徴量に基づき、コンテンツの検索結果を出力する出力手段とを備えるコンテンツ検索結果提供システムが知られている(特許文献1参照)。 Acquires a query category dictionary that stores information that associates a predetermined search query with the degree of correspondence to a predetermined search query for each content category, and a search query history that indicates past search queries sent from the user terminal. Using the search history acquisition method and the search query history, information related to the degree of correspondence to the past search query for each content category is extracted from the query category dictionary, and based on the extracted information, the user for the content category. Includes a user feature amount calculation means that calculates a user feature amount that indicates the degree of correspondence of each preference, and information that indicates content that corresponds to a search query at the time of a search request sent from a user terminal and is associated with a category. A content search result providing system including a search result acquisition means for acquiring a content search result and an output means for outputting a content search result based on a user feature amount is known (see Patent Document 1).
ショッピングサイトなどで商品やサービス(以下、商品等)を検索するためにクエリが入力されることがある。検索ヒット数は、ショッピングサイトにおける商品等のランキングに影響する場合があるため、検索ヒット数を高くする目的で、タイトルや商品紹介欄に、その商品とは無関係な複数のブランド名を掲載することが行われている。このような行為は、過剰なSEO(Search Engine Optimization)あるいはブラックハットSEOと称される。過剰なSEOは、商品等の適正なランキング形成を妨げるものであるため、過剰なSEOの目的で販売画面が構成された商品等を発見したいというニーズが存在する。過剰なSEOが行われている商品等を発見するためには、ブランド名を集めた適切な辞書(ブランド辞書)を作成しておくことが望ましい。しかしながら、従来の技術では、精度が不十分であり、適切なブランド辞書を作成することができない場合があった。 A query may be entered to search for a product or service (hereinafter referred to as a product, etc.) on a shopping site or the like. Since the number of search hits may affect the ranking of products on shopping sites, list multiple brand names unrelated to the product in the title or product introduction column for the purpose of increasing the number of search hits. Is being done. Such an act is called excessive SEO (Search Engine Optimization) or black hat SEO. Since excessive SEO hinders the formation of an appropriate ranking of products and the like, there is a need to discover products and the like whose sales screen is configured for the purpose of excessive SEO. In order to discover products with excessive SEO, it is desirable to create an appropriate dictionary (brand dictionary) that collects brand names. However, the conventional technique has insufficient accuracy, and there are cases where an appropriate brand dictionary cannot be created.
本発明は、このような事情を考慮してなされたものであり、より適切なブランド辞書を作成することができるブランド辞書作成装置、商品等評価装置、ブランド辞書作成方法及びプログラムを提供することを目的の一つとする。 The present invention has been made in consideration of such circumstances, and provides a brand dictionary creation device, a product evaluation device, a brand dictionary creation method and a program capable of creating a more appropriate brand dictionary. It is one of the purposes.
本発明の一態様は、ネットワークを介して商品またはサービス(以下、商品等)を販売するための販売画面に対して入力されたクエリを取得するクエリ取得部と、前記取得されたクエリに含まれる対象テキスト毎に、前記対象テキストがクエリの先頭に出現した先頭出現数と、クエリの中における位置を問わず前記対象テキストがクエリの中に出現した出現数とをカウントする出現数カウント部と、前記対象テキスト毎に、前記先頭出現数を前記出現数によって除した指標値を導出し、導出した指標値に基づいて、前記対象テキストをブランド辞書に含めるか否かを判定する判定部と、を備えるブランド辞書作成装置である。 One aspect of the present invention includes a query acquisition unit that acquires a query input to a sales screen for selling a product or service (hereinafter, product, etc.) via a network, and the acquired query. For each target text, an appearance count unit that counts the number of occurrences of the target text appearing at the beginning of the query and the number of appearances of the target text appearing in the query regardless of the position in the query. For each target text, an index value obtained by dividing the number of first appearances by the number of appearances is derived, and a determination unit for determining whether or not to include the target text in the brand dictionary based on the derived index value. It is a brand dictionary creation device equipped.
本発明の一態様によれば、より適切なブランド辞書を作成することができる。 According to one aspect of the present invention, a more suitable brand dictionary can be created.
以下、図面を参照し、本発明のブランド辞書作成装置、商品等評価装置、ブランド辞書作成方法及びプログラムの実施形態について説明する。 Hereinafter, with reference to the drawings, the brand dictionary creation device, the product evaluation device, the brand dictionary creation method, and the embodiment of the program of the present invention will be described.
[全体構成]
図1は、商品等評価装置を利用した販売仲介サーバ200と、ブランド辞書作成装置300との構成および使用環境の一例を示す図である。販売仲介サーバ200は、端末装置100によってアクセスされ、商品またはサービス(以下、商品等)の販売を仲介するための装置であり、いわゆるショッピングサイトやオークションサイトを提供する装置である。ここで、「サイト」とは、ブラウザによって再生されるウェブサイトの他、アプリケーションプログラムによって表示されるアプリ画面の元データを含むものとする。販売仲介サーバ200の運営者には、商品等の出品者により出品される商品等に関する商品等データが提供される。商品等データは、商品等のタイトルや詳細説明などを含む。
[overall structure]
FIG. 1 is a diagram showing an example of a configuration and a usage environment of a
端末装置100では、ブラウザやアプリケーションプログラムなどのUA(User Agent)110が起動する。UA110は、販売仲介サーバ200から提供された販売画面を表示すると共に、端末装置100の利用者によってなされた入力操作に応じたリクエストを販売仲介サーバ200に送信する。販売仲介サーバ200は、UA110からのリクエストに応じて商品等の販売を決定する。
In the
また、販売仲介サーバ200には、ブランド辞書作成装置300により作成されたブランド辞書が提供される。ブランド辞書とは、ある商品等の紹介画面について原則的に一つのみ掲載される筈のブランド名であって、ブランドの名称である確からしさが高い単語を集めた電子的な辞書である。図では、販売仲介サーバ200とブランド辞書作成装置300が別体であるように示しているが、これらは統合されて一つのハードウェアにより実現されてもよい。
Further, the
端末装置100、販売仲介サーバ200、およびブランド辞書作成装置300は、ネットワークNWを介して互いに通信する。これらの構成要素は、ネットワークNWに接続するためのネットワークカード、無線通信モジュールなどを備える。ネットワークNWは、例えば、インターネット、WAN(Wide Area Network)、LAN(Local Area Network)、無線基地局、プロバイダ端末、専用回線などを含む。
The
[販売仲介サーバ]
販売仲介サーバ200は、例えば、販売画面提供部210と、ランキング処理部212と、ログ収集部214と、対象語句取得部230と、ブランド名抽出部232と、注意対象商品等特定部234とを備える。これらの構成要素は、例えば、CPU(Central Processing Unit)などのプロセッサがプログラム(ソフトウェア)を実行することにより実現される。また、これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)などのハードウェアによって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。
[Sales brokerage server]
The
また、販売仲介サーバ200は、RAM(Random Access Memory)やHDD(Hard Disk Drive)、フラッシュメモリ、ROM(Read Only Memory)などの記憶装置に、商品等データ220、ランキングデータ222、ログ情報224、ブランド辞書240などのデータを格納している。なお、これらのデータは、販売仲介サーバ200がネットワークNWを介してアクセス可能なNAS(Network Attached Storage)などに格納されてもよい。
Further, the
販売画面提供部210は、商品等データ220およびランキングデータ222を参照し、商品等の販売画面を端末装置100に提供する。図2は、商品等の販売画面IM1の一例を示す図である。販売画面IM1には、商品等を検索するためのクエリを入力するためのクエリ入力欄A1、および、入力されたクエリで検索を実行させるための検索ボタンB1が設けられている。クエリ入力欄A1にクエリが入力され、検索ボタンB1が操作されると、検索結果表示画面IM2に遷移する。なお、クエリは一語だけのクエリもあるし、複数の子クエリがスペースなどで結合された複数語を含むクエリもある。
The sales
図3は、検索結果表示画面IM2の一例を示す図である。検索結果表示画面IM2には、検索結果表示欄A2が含まれる。検索結果表示欄A2には、ランキング処理部212によって決定されたクエリ毎のランキング順に、商品等の画像や説明が並べて表示される。検索結果表示画面IM2において一つの商品等の画像や説明が操作されると、商品等表示画面IM3に遷移する。
FIG. 3 is a diagram showing an example of the search result display screen IM2. The search result display screen IM2 includes a search result display field A2. In the search result display field A2, images and explanations of products and the like are displayed side by side in the ranking order for each query determined by the
図4は、商品等表示画面IM3の一例を示す図である。商品等表示画面IM3には、商品等画像表示欄A3−1、タイトル欄A3−2、商品等説明欄A3−3などが含まれる。タイトル欄A3−2や商品等説明欄A3−3には、製造元、商品の素材、使用、その他の内容が掲載される。このような内容が通常の商品等表示画面IM3であるが、過剰なSEOがなされた商品等表示画面は、異なる態様を示すものとなる。 FIG. 4 is a diagram showing an example of a product or the like display screen IM3. The product or the like display screen IM3 includes a product or the like image display column A3-1, a title column A3-2, a product or the like explanation column A3-3, and the like. In the title column A3-2 and the product description column A3-3, the manufacturer, the material of the product, the use, and other contents are posted. Such a content is a normal product or the like display screen IM3, but the product or the like display screen in which excessive SEO is performed shows a different mode.
図5は、過剰なSEOがなされた商品等表示画面IM4の一例である。商品等表示画面IM4では、製造元が「○○社」であるにも関わらず、商品等説明欄A4−3に、無関係なA社、B社、C社(いずれも○○社と同じカテゴリのブランド名)が掲載されている。この結果、クエリとして「A社」、「B社」、または「C社」のいずれかを指定して検索が行われた結果、それらの商品等でないにも関わらず、この商品等が検索にヒットする場合がある。このような商品等の掲載を回避あるいは抑制するために、販売仲介サーバ200は、ブランド辞書240を用いた注意対象商品等の特定処理を実行する。これについては、後述する。
FIG. 5 is an example of the product display screen IM4 in which excessive SEO is performed. On the product display screen IM4, although the manufacturer is "○○ company", the product explanation column A4-3 shows unrelated companies A, B, and C (all of the same category as company XX). Brand name) is posted. As a result, as a result of performing a search by designating any of "Company A", "Company B", or "Company C" as a query, this product, etc. is searched even though it is not such a product, etc. May hit. In order to avoid or suppress the listing of such products, the
話を戻し、販売画面提供部210は、図2〜5に例示した各種表示画面を、商品等データ220に基づいて生成する。図6は、商品等データ220の内容の一例を示す図である。商品等データ220は、商品等の識別情報である商品等IDに対して、商品カテゴリ、商品等画像、タイトル、商品等説明、価格(オークションであれば基準価格または入札価格)、発送条件、その他のデータが対応付けられたものである。
Returning to the story, the sales
ランキング処理部212は、過去に入力されたクエリのそれぞれに対して、種々の基準によりランキング処理を行い、ランキングデータ222を生成する。図7は、ランキングデータ222の内容の一例を示す図である。ランキングデータ222は、例えば、クエリに対して、商品等IDのランキングが対応付けられたものである。ランキングデータ222は、例えば、ログ収集部214により収集されたログ情報に基づいて、クリック数が多い順、購入数が多い順、CVR(Conversion Ratio)が高い順、お気に入り登録数が多い順、または価格が安い順、或いはこれらを組み合わせたスコア順に、高いランキングとする。また、ランキング処理は、ランダムに商品等をランキングに含めることを含んでもよい。
The
ログ収集部214は、端末装置100において入力されたクエリを含む情報であって、端末装置100からリクエストのあったページを時系列で並べた行動履歴などの情報を、ログ情報224として蓄積する。
The
対象語句取得部230は、商品等データ220に含まれるデータのうち、商品等IDで示される商品等毎の対象語句を取得する。対象語句は任意に定めてよいが、例えば、タイトルおよび商品等説明に含まれる語句が対象語句に設定される。
The target word /
ブランド名抽出部232は、ブランド辞書240を参照し、対象語句取得部230により取得された対象語句の中に含まれるブランド名を抽出する。より具体的に、ブランド名抽出部232は、対象語句が取得された元の商品等のカテゴリに合致するブランド名を抽出する。図8は、ブランド辞書240の内容の一例を示す図である。ブランド辞書240は、例えば、商品等のカテゴリ毎にブランド名を列挙したものである。
The brand
ブランド名抽出部232は、例えば、既に行った検索結果を活かすため、AhoCorasick法などの共通接頭辞検索(Common Prefix Search)を行うことで、辞書中からパターンマッチングを行うオートマトンを構築し、入力テキストに対して線形な計算時間を実現する。
The brand
注意対象商品等特定部234は、ブランド名抽出部232により抽出されたブランド名の数に基づいて、注意対象商品等を特定する。例えば、注意対象商品等特定部234は、所定数k以上のブランド名が対象語句に含まれている商品等を、注意対象商品等として特定する。例えばk=2である。
The attention target product etc. specifying
そして、注意対象商品等特定部234は、特定した注意対象商品等について、(1)出品者に対する注意を行うため、表示装置に商品等IDを表示させ、あるいは出品者に対して注意する電子メールを生成して送信する、(2)ランキングデータ222における当該商品等のランキングを下げる、(3)商品等データ220から削除する(出品を取り消す)などの処理を行う。
Then, the attention target
注意対象商品等特定部234は、ブランド名抽出部232により特定されたブランド名の数に応じて、上記(1)〜(3)の処理を段階的に行ってもよい。例えば、2つのブランド名が対象語句に含まれている商品等について(1)の処理を、3つのブランド名が対象語句に含まれている商品等について(2)の処理を、4つ以上のブランド名が対象語句に含まれている商品等について(3)の処理を行ってもよい。
Attention The target
また、注意対象商品等特定部234は、出品者毎に、注意対象商品等に該当した商品等の数をカウントし、注意対象商品等に該当した商品等の数に応じて上記(1)〜(3)の処理を段階的に行ってもよい。例えば、注意対象商品等に該当した商品等の数が第1閾値C1以上、第2閾値C2未満の出品者に対して(1)の処理を、注意対象商品等に該当した商品等の数が第2閾値C2以上、第3閾値C3未満の出品者の注意対象商品等に対して(2)の処理を、注意対象商品等に該当した商品等の数が第3閾値C3以上の出品者の注意対象商品等(或いは全ての商品等)に対して(3)の処理を行ってもよい(C1<C2<C3)。
In addition, the caution target
図9は、販売仲介サーバ200の対象語句取得部230、ブランド名抽出部232、および注意対象商品等特定部234により実行される処理の流れの一例を示すフローチャートである。本フローチャートの処理は、任意のタイミングで開始される。
FIG. 9 is a flowchart showing an example of the flow of processing executed by the target
まず、対象語句取得部230が、商品等データ220から一つの商品等を選択し(S100)、対象語句を取得する(S102)。次に、ブランド名抽出部232が、S102で取得された対象語句からブランド名を抽出する(S104)。
First, the target word /
次に、注意対象商品等特定部234が、S104で抽出されたブランド名が所定数k以上であるか否かを判定する(S106)。S104で抽出されたブランド名が所定数k以上である場合、注意対象商品等特定部234は、S100で選択した商品等を注意対象商品として特定する(S108)。
Next, the
次に、対象語句取得部230が、商品等データ220から今回の処理対象である全ての商品等を選択したか否かを判定する(S110)。全ての商品等を選択していない場合はS100に処理が戻され、全ての商品等を選択した場合は本フローチャートの処理が終了する。なお、図9に例示したループ処理は、並列コンピューティングによって同時並行的に実行されてもよい。
Next, the target word /
このように、販売仲介サーバ200(商品等評価装置)によれば、ネットワークNWを介して販売される商品等の紹介画面に含まれる対象語句を取得する対象語句取得部230と、ブランド名を記述したブランド辞書240を参照し、対象語句の中に含まれるブランド名を抽出するブランド名抽出部232と、ブランド名抽出部232により抽出されたブランド名の数に基づいて、注意対象の商品等を特定する注意対象商品等特定部234と、を備えることにより、注意対象の商品等を、効率よく発見することができる。なお、対象語句取得部230、ブランド名抽出部232、および注意対象商品等特定部234を合わせたものが「商品等評価装置」の一例である。また、注意対象商品等特定部234は、「監視部」の一例である。
In this way, according to the sales brokerage server 200 (product evaluation device), the target
なお、上記の説明では、商品等のカテゴリに応じたブランド辞書240を用いて注意対象商品等を特定するものとしたが、カテゴリを特定せずに全てのブランド辞書240を用いて注意対象商品等を特定してもよい。
In the above explanation, the
[ブランド辞書作成装置]
以下、ブランド辞書240を作成するブランド辞書作成装置300について説明する。ブランド辞書作成装置300は、例えば、クエリ取得部310と、出現数カウント部312と、判定部314と、作成部316とを備える。これらの構成要素は、例えば、CPUなどのプロセッサがプログラム(ソフトウェア)を実行することにより実現される。また、これらの構成要素のうち一部または全部は、LSIやASIC、FPGA、GPUなどのハードウェアによって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。
[Brand dictionary creation device]
Hereinafter, the brand
また、ブランド辞書作成装置300は、RAMやHDD、フラッシュメモリ、ROMなどの記憶装置に、クエリログ320、作成中のブランド辞書322などのデータを格納している。なお、これらのデータは、ブランド辞書作成装置300がネットワークNWを介してアクセス可能なNASなどに格納されてもよい。
Further, the brand
クエリ取得部310は、販売仲介サーバ200が蓄積するログ情報224のうち、クエリに関する情報を取得し、クエリログ320として記憶装置に格納させる。クエリログ320に含まれる各クエリには、そのクエリを用いて検索した結果として表示された商品等およびそのカテゴリが付随している。なお、商品等のカテゴリは階層的に付与されている場合があるが、ここではブランド辞書のカテゴリに対応する階層のカテゴリに着目して説明する。
The
出現数カウント部312は、クエリログ320に含まれる各クエリに基づいて、クエリに含まれるテキストであり、ブランド辞書に含めるか否かを判定される判定対象のテキスト(以下、対象テキスト)の出現回数をカウントする。対象テキストは、例えば、形態素解析などの所定のロジックにより、意味的にひとまとまりであると解釈されるものである。また、対象テキストは、スペース等で区切られた子クエリのそれぞれであってもよく、子クエリを複数結合したものであってもよい。出現数カウント部312は、カテゴリによっては、対象テキストを3文字以上のカタカナに限定するなど、対象テキストを構成する要素に限定を追加してもよい。
The
まず、出現数カウント部312は、あるカテゴリ(以下、対象カテゴリ)のブランド辞書を作成する際に、クエリログ320から対象カテゴリに対応しているクエリ(以下、対象クエリ)を抽出する。クエリログ320には、クエリと、クエリの検索結果画面においてクリックされた商品等を示す情報とが、互いに対応付けられて記憶される(クリックログ)。出現数カウント部312は、例えば、クリックログにおいて、対象カテゴリに対応する商品等が最も多く対応付けられているクエリを、対象クエリとして抽出する。例えば、クエリログ320に含まれるクエリAに対応付けられる商品等のカテゴリが、ファッション40%、食品20%、アウトドア10%、美容10、その他20%である場合、出現数カウント部312は、最も比率の高い対象カテゴリである「ファッション」のブランド辞書の作成に用いる対象クエリとして、クエリAを抽出する。
First, the appearance
なお、出現数カウント部312は、クエリに対応付けられる商品等のカテゴリのうち、最も比率が高いカテゴリのブランド辞書を作成する際に、当該クエリを用いてもよい。また、出現数カウント部312は、クエリに対応付けられる商品等のカテゴリのうち、高い比率のカテゴリが複数存在する場合、当該クエリが多様な意味のクエリとして用いられている可能性が高い(つまり、意味の特定がしづらいクエリである)と推定し、複数の対象カテゴリに関するブランド辞書について当該クエリを処理対象としてもよいし、そもそも、そのような傾向を示すクエリを処理対象から除外してもよい。
The appearance
次に、出現数カウント部312は、抽出された対象クエリを構成する対象テキストの出現回数をカウントする。図10は、出現数カウント部312による処理の内容を説明するための図である。出現数カウント部312は、対象クエリに含まれる各対象テキストについて、単独でクエリとして入力された回数をs0、複数の対象テキストを含むクエリの中で、一番目に出現した回数をs1、二番目に出現した回数をs2、三番目以降に出現した回数をs3としてカウントする。
Next, the appearance
また、出現数カウント部312は、対象クエリに含まれる各対象テキストが、データ収集期間に出現した回数(つまり、s0〜s3の総和)である総出現数ntをカウントする。データ収集期間とは、ブランド辞書作成装置300が一回の処理の対象とする期間(対象期間)である。ブランド辞書作成装置300は、その期間において収集されたクエリログ320に基づいて、ブランド辞書の作成処理を行う。データ収集期間は、例えば、1年程度の期間である。
Also, the
また、出現数カウント部312は、対象クエリに含まれる各対象テキストが、データ収集期間において出現した(観測された)日数である出現日数ctを併せてカウントする。図10の例では、対象テキスト「aaa」に関して、一番目に1回出現し、単独で1回出現しているため、s0とs1にそれぞれ1が与えられている。
Also, the
判定部314は、出現数カウント部312によって、データ収集期間を対象として上記各種指標がカウントされた対象クエリについて、以下の条件のうち一部または全部に基づいて、ブランド辞書に含めるか否かを判定する。
The
(条件1)
判定部314は、条件式(1)で示すように、対象テキストの先頭出現数(つまり、s1)を、対象テキストの総出現数ntによって除した指標値rを導出する。判定部314は、導出した指標値rが、第1閾値thrよりも大きい場合、その他の条件を満たすのであれば、対象テキストをブランド辞書に含めると判定する。式中、rは、指標値rであり、thrは、第1閾値thrである(0<thr<1、より好ましくは、thrは0.5程度)。
r>thr …(1)
(Condition 1)
r> th r ... (1)
指標値rは、複数の対象テキストを含むクエリの一番目に出現した頻度に着目しているが、これは、ファッションのカテゴリに適した規則である。ファッションのカテゴリにおいてクエリ検索を行う場合、一番目にブランド名を入力することが多いという傾向が予め分かっているからである。これによって、判定部314は、ブランド名である可能性が高い対象テキストを、より適切にブランド辞書に含めることができる。
The index value r focuses on the frequency of occurrence of the first occurrence of a query containing a plurality of target texts, which is a rule suitable for a fashion category. This is because it is known in advance that when performing a query search in a fashion category, the brand name is often entered first. As a result, the
(条件2)
判定部314は、条件式(2)で示すように、対象テキストの総出現数ntが、所定の閾値(例えば、第2閾値thnとデータ収集期間の日数とを乗じた値)よりも大きい場合、その他の条件を満たすのであれば、対象テキストをブランド辞書に含めると判定する。式中、ntは、総出現数ntであり。Dは、データ収集期間の日数であり、thnは、第2閾値thnである(1<thn、好ましくは、10〜100程度)。
nt>thn×D…(2)
(Condition 2)
As shown in the conditional expression (2), the
n t > th n × D ... (2)
総出現数ntが所定の閾値に達していない対象テキストは、例えば、クエリとしてあまり検索されないマイナーな単語である可能性が高い。これによって、判定部314は、マイナーな単語以外の対象テキストであり、ブランド名である可能性が高い対象テキストを、ブランド辞書に含めることができる。ここで、対象区間の日数は、「単位期間」の一例であり、第2閾値thnとデータ収集期間の日数とを乗じた値は、「単位期間の数の長さに対する比率」の一例である。
Target text the total number of occurrences n t has not reached the predetermined threshold value, for example, is likely to be a minor words that are not much search as a query. As a result, the
(条件3)
判定部314は、条件式(3)で示すように、データ収集期間の中で対象テキストを含むクエリが観測された出現日数ctが、所定の閾値(例えば、第3閾値thcと出現日数とを乗じた値)よりも大きい場合、その他の条件を満たすのであれば、対象テキストをブランド辞書に含めると判定する。式中、ctは、出現日数ctであり、Dは、データ収集期間の日数であり、thcは、第3閾値thcである(0<thc<1、より好ましくは、thcは0.5〜0.9程度)。
nt>thn×D…(2)
(Condition 3)
n t > th n × D ... (2)
出現日数ctが所定の閾値に達していない対象テキストは、例えば、流行語に関連して多数検索されたテキスト(バズワード)である可能性が高い。これによって、判定部314は、恒常的に用いられているブランド名である可能性が高い対象テキストを、ブランド辞書に含めることができる。
Target text the appearance days c t has not reached the predetermined threshold value, for example, is likely to be a large number retrieved text in connection with the buzzword (buzzwords). As a result, the
作成部316は、判定部314による判定の結果、ブランド辞書に含めると判定された対象テキストを集めて、ブランド辞書を作成する。ブランド辞書は、例えば販売仲介サーバ200に提供される。
The
以下、ブランド辞書作成装置300により実行される処理の流れについて、フローチャートを用いて説明する。図11は、ブランド辞書作成装置300により実行される処理の流れの一例を示すフローチャートである。
Hereinafter, the flow of processing executed by the brand
まず、ブランド辞書作成装置300は、対象カテゴリを決定する(S200)。対象カテゴリは、例えば外部(オペレータを含む)からの指示に基づいて決定される。次に、判定部314が、対象カテゴリに対応するクエリをクエリログ320から抽出する(S202)。
First, the brand
次に、判定部314は、S202で抽出したクエリを一つ選び(S204)、クエリを対象テキストに分割する(S206)。次に、判定部314は、対象テキスト毎に、出現位置毎の出現数、総出現数ntおよび出現日数ctをカウントアップする(S208)。
Next, the
そして、判定部314は、S204で全てのクエリを選択したか否かを判定する(S210)。全てのクエリを選択していない場合、S204に処理が戻される。
Then, the
全てのクエリを選択した場合、判定部314は、前述した各種条件に基づいて、対象テキストをブランド辞書に含めるか否かを判定する(S212)。S212の処理の細は、後述する。作成部316は、判定部314による判定の結果、ブランド辞書に含めると判定された対象テキストをブランド名として対象カテゴリの辞書に含める(S214)。なお、図11に例示したS204〜S210のループ処理は、並列コンピューティングによって同時並行的に実行されてもよい。
When all the queries are selected, the
図12は、S212の処理の一例を示すフローチャートである。S212において、判定部314は、対象テキストが3文字以上のカタカナで構成されているか否かを判定する(S300)。判定部314は、対象テキストが3文字のカタカナで構成されていない場合、対象テキストをブランド辞書に含めないと判定し、処理を終了する。
FIG. 12 is a flowchart showing an example of the processing of S212. In S212, the
判定部314は、対象テキストのが3文字以上のカタカナである場合、対象テキストの指標値rが、第1閾値thrよりも大きいか否かを判定する(条件1)(S302)。判定部314は、対象テキストの指標値rが、第1閾値thr以下である場合、対象テキストをブランド辞書に含めないと判定し、処理を終了する。
判定部314は、対象テキストの指標値rが、第1閾値thrよりも大きい場合、対象テキストの総出現数ntが、第2閾値thnとデータ収集期間の日数とを乗じた値よりも大きいか否かを判定する(条件2)(S304)。判定部314は、対象テキストの総出現数ntが、第2閾値thnとデータ収集期間の日数とを乗じた値よりも大きくない場合、対象テキストをブランド辞書に含めないと判定し、処理を終了する。判定部314は、対象テキストの総出現数ntが、第2閾値thnとデータ収集期間の日数とを乗じた値よりも大きい場合、データ収集期間の中で対象テキストを含むクエリが観測された出現日数ctが、第3閾値thcと出現日数とを乗じた値よりも大きいか否かを判定する(S306)。
When the index value r of the target text is larger than the first threshold value th r , the
判定部314は、データ収集期間の中で対象テキストを含むクエリが観測された出現日数ctが、第3閾値thcと出現日数とを乗じた値よりも大きくない場合、対象テキストをブランド辞書に含めないと判定し、処理を終了する。判定部314は、象期間の中で対象テキストを含むクエリが観測された出現日数ctが、第3閾値thcと出現日数とを乗じた値よりも大きい場合(つまり、条件1〜3を満たす場合)、対象テキストをブランド辞書に含めると判定し、S214に処理を進める。
Judging
なお、クエリから対象テキストに分割する手法は、上記の手法に限られない。例えば、「aaa bbb ccc」なるクエリの中に含まれる「aaa bbb」が、ブランド名として世に広まっているような場合も考えられる。これに対し、ブランド辞書作成装置300は、「aaa bbb ccc」から「aaa」、「bbb」、「ccc」、「aaa bbb」、「bbb ccc」のように、単純に形態素解析などを行った場合には二つ以上の対象テキストとなるようなワードも含めて、一つの対象テキストとして扱ってよい。この場合において、例えば「aaa」と「aaa bbb」の双方が絞り込みを通過して残った場合、条件式(3)の左辺の値が大きい方を採用し、小さい方を除外してもよい。「aaa」よりも「aaa bbb」の方が世間の認知度が高い場合、むしろ「aaa bbb」を登録した方が適切に過剰なSEOを検出できるからである。
The method of dividing the query into the target text is not limited to the above method. For example, there may be a case where "aaa bbb" included in the query "aaa bbb ccc" is widely used as a brand name. On the other hand, the brand
また、作成部316のブランド辞書の作成処理は、既に存在するブランド辞書(例えば、ブランド辞書240)を更新する処理であってもよい。作成部316は、例えば、判定部314によってブランド辞書に含めないと判定された対象テキストが、ブランド辞書240に含まれる場合、当該対象テキストをブランド辞書240から除外し、判定部314によってブランド辞書に含めると判定された対象テキストが、ブランド辞書240に含まれていない場合、当該対象テキストをブランド辞書240に含めることにより、ブランド辞書240を更新するようにしてもよい。
Further, the brand dictionary creation process of the
以上説明したブランド辞書作成装置300によれば、ネットワークNWを介して商品等を販売するための販売画面に対して入力されたクエリを取得するクエリ取得部310と、取得されたクエリに含まれる対象テキスト毎に、対象テキストがクエリの先頭に出現した先頭出現数と、クエリの中における位置を問わず対象テキストがクエリの中に出現した出現数とをカウントする出現数カウント部312と、対象テキスト毎に先頭出現数を総出現数ntによって除した指標値rを導出し、導出した指標値rに基づいて、対象テキストをブランド辞書に含めるか否かを判定する判定部314とを備えることにより、より適切なブランド辞書を作成することができる。
According to the brand
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。 Although the embodiments for carrying out the present invention have been described above using the embodiments, the present invention is not limited to these embodiments, and various modifications and substitutions are made without departing from the gist of the present invention. Can be added.
1…100…端末装置、200…販売仲介サーバ、210…販売画面提供部、212…ランキング処理部、214…ログ収集部、220…商品等データ、222…ランキングデータ、224…ログ情報、230…対象語句取得部、232…ブランド名抽出部、234…注意対象商品等特定部、240…ブランド辞書、300…ブランド辞書作成装置、310…クエリ取得部、312…出現数カウント部、314…判定部、316…作成部、320…クエリログ、322…ブランド辞書、C1、thr…第1閾値、C2、thn…第2閾値、C3、thc…第3閾値、ct…出現日数、k…所定数、nt…総出現数、r…指標値 1 ... 100 ... terminal device, 200 ... sales brokerage server, 210 ... sales screen providing unit, 212 ... ranking processing unit, 214 ... log collecting unit, 220 ... product data, 222 ... ranking data, 224 ... log information, 230 ... Target phrase acquisition unit, 232 ... Brand name extraction unit, 234 ... Caution Target product identification unit, 240 ... Brand dictionary, 300 ... Brand dictionary creation device, 310 ... Query acquisition unit, 312 ... Appearance count unit, 314 ... Judgment unit , 316 ... creating unit, 320 ... query logs 322 ... brand dictionary, C1, th r ... first threshold value, C2, th n ... second threshold, C3, th c ... third threshold, c t ... occurrence days, k ... Predetermined number, nt ... total number of appearances, r ... index value
Claims (10)
前記取得されたクエリに含まれる対象テキスト毎に、前記対象テキストがクエリの先頭に出現した先頭出現数と、クエリの中における位置を問わず前記対象テキストがクエリの中に出現した出現数とをカウントする出現数カウント部と、
前記対象テキスト毎に、前記先頭出現数を前記出現数によって除した指標値を導出し、導出した指標値に基づいて、前記対象テキストをブランド辞書に含めるか否かを判定する判定部と、
を備えるブランド辞書作成装置。 A query acquisition unit that acquires a query entered for a sales screen for selling a product or service (hereinafter, product, etc.) via a network, and a query acquisition unit.
For each target text included in the acquired query, the number of occurrences of the target text appearing at the beginning of the query and the number of occurrences of the target text appearing in the query regardless of the position in the query are calculated. The number of appearances to be counted
For each target text, an index value obtained by dividing the number of first appearances by the number of appearances is derived, and a determination unit for determining whether or not to include the target text in the brand dictionary based on the derived index value.
A brand dictionary creation device equipped with.
請求項1に記載のブランド辞書作成装置。 When the index value is larger than the first threshold value, the determination unit determines that the target text is included in the brand dictionary.
The brand dictionary creating device according to claim 1.
請求項1又は請求項2に記載のブランド辞書作成装置。 The determination unit further determines whether or not to include the target text in the brand dictionary based on the ratio of the number of occurrences to the data collection period during the observed period.
The brand dictionary creating device according to claim 1 or 2.
請求項1から3のうちいずれか一項に記載のブランド辞書作成装置。 The determination unit further puts the target text into the brand dictionary based on the ratio of the number of unit periods in which the query containing the target text was observed during the data collection period to the length of the data collection period. Determine whether to include,
The brand dictionary creating device according to any one of claims 1 to 3.
請求項1から4のうちいずれか一項に記載のブランド辞書作成装置。 The determination unit determines that the target text is not included in the brand dictionary when the target text is not composed of three or more characters of katakana.
The brand dictionary creating device according to any one of claims 1 to 4.
ネットワークを介して販売される商品またはサービス(以下、商品等)の紹介画面に含まれる対象語句を取得する対象語句取得部と、
前記ブランド辞書を参照し、前記対象語句の中に含まれるブランド名を抽出するブランド名抽出部と、
前記ブランド名抽出部により抽出されたブランド名の数に基づいて、注意対象の商品等を特定する監視部と、
を備える商品等評価装置。 The brand dictionary creating device according to any one of claims 1 to 5.
The target phrase acquisition unit that acquires the target phrase included in the introduction screen of the product or service (hereinafter, product, etc.) sold via the network,
A brand name extraction unit that extracts the brand name included in the target phrase by referring to the brand dictionary, and
A monitoring unit that identifies products to be noted based on the number of brand names extracted by the brand name extraction unit, and
Product evaluation device equipped with.
請求項6に記載の商品等評価装置。 When the number of brand names extracted by the brand name extraction unit is equal to or greater than a predetermined number, the monitoring unit identifies the acquisition source product or the like from which the target phrase has been acquired as the caution target product or the like.
The product evaluation device according to claim 6.
請求項6又は請求項7に記載の商品等評価装置。 Based on the number of brand names extracted by the brand name extraction unit, the monitoring unit performs stepwise processing on the seller who has put up the product or the like to be noted.
The product evaluation device according to claim 6 or 7.
ネットワークを介して商品またはサービス(以下、商品等)を販売するための販売画面に対して入力されたクエリを取得し、
前記取得されたクエリに含まれる対象テキスト毎に、対象テキストがクエリの先頭に出現した先頭出現数と、クエリの中における位置を問わず前記対象テキストがクエリの中に出現した出現数とをカウントし、
前記対象テキスト毎に、前記先頭出現数を前記出現数によって除した指標値を導出し、導出した指標値に基づいて、対象テキストをブランド辞書に含めるか否かを判定する、
ブランド辞書作成方法。 The computer
Get the query entered for the sales screen to sell a product or service (hereinafter, product, etc.) via the network.
For each target text included in the acquired query, the number of occurrences of the target text appearing at the beginning of the query and the number of occurrences of the target text appearing in the query regardless of the position in the query are counted. And
For each target text, an index value obtained by dividing the number of first appearances by the number of appearances is derived, and based on the derived index value, it is determined whether or not the target text is included in the brand dictionary.
How to create a brand dictionary.
ネットワークを介して商品またはサービス(以下、商品等)を販売するための販売画面に対して入力されたクエリを取得させ、
前記取得されたクエリに含まれる対象テキスト毎に、対象テキストがクエリの先頭に出現した先頭出現数と、クエリの中における位置を問わず前記対象テキストがクエリの中に出現した出現数とをカウントさせ、
前記対象テキスト毎に、前記先頭出現数を前記出現数によって除した指標値を導出し、導出した指標値に基づいて、対象テキストをブランド辞書に含めるか否かを判定させる、
プログラム。 On the computer
Get the query entered for the sales screen for selling products or services (hereinafter, products, etc.) via the network.
For each target text included in the acquired query, the number of occurrences of the target text appearing at the beginning of the query and the number of occurrences of the target text appearing in the query regardless of the position in the query are counted. Let me
For each target text, an index value obtained by dividing the number of first appearances by the number of appearances is derived, and based on the derived index value, it is determined whether or not the target text is included in the brand dictionary.
program.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018160217A JP6894875B2 (en) | 2018-08-29 | 2018-08-29 | Brand dictionary creation device, product evaluation device, brand dictionary creation method and program. |
JP2021093596A JP6960553B2 (en) | 2018-08-29 | 2021-06-03 | Brand dictionary creation device, product evaluation device, brand dictionary creation method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018160217A JP6894875B2 (en) | 2018-08-29 | 2018-08-29 | Brand dictionary creation device, product evaluation device, brand dictionary creation method and program. |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021093596A Division JP6960553B2 (en) | 2018-08-29 | 2021-06-03 | Brand dictionary creation device, product evaluation device, brand dictionary creation method and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020035126A JP2020035126A (en) | 2020-03-05 |
JP6894875B2 true JP6894875B2 (en) | 2021-06-30 |
Family
ID=69668173
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018160217A Active JP6894875B2 (en) | 2018-08-29 | 2018-08-29 | Brand dictionary creation device, product evaluation device, brand dictionary creation method and program. |
JP2021093596A Active JP6960553B2 (en) | 2018-08-29 | 2021-06-03 | Brand dictionary creation device, product evaluation device, brand dictionary creation method and program |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021093596A Active JP6960553B2 (en) | 2018-08-29 | 2021-06-03 | Brand dictionary creation device, product evaluation device, brand dictionary creation method and program |
Country Status (1)
Country | Link |
---|---|
JP (2) | JP6894875B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113313187B (en) * | 2021-06-09 | 2024-09-06 | 有米科技股份有限公司 | Brand identification method and device based on text information |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004070405A (en) * | 2002-08-01 | 2004-03-04 | Mitsubishi Electric Corp | Rumor information extraction device for web page |
US20110113063A1 (en) * | 2009-11-09 | 2011-05-12 | Bob Schulman | Method and system for brand name identification |
JP2011175453A (en) * | 2010-02-24 | 2011-09-08 | Kansai Electric Power Co Inc:The | Keyword retrieval system |
JP5138025B2 (en) * | 2010-12-28 | 2013-02-06 | ヤフー株式会社 | Spam candidate extraction apparatus and method |
JP2012247948A (en) * | 2011-05-26 | 2012-12-13 | Nippon Telegr & Teleph Corp <Ntt> | Dictionary management apparatus, dictionary management method and dictionary management program |
JP5113936B1 (en) * | 2011-11-24 | 2013-01-09 | 楽天株式会社 | Information processing apparatus, information processing method, information processing apparatus program, and recording medium |
US8751478B1 (en) * | 2011-12-28 | 2014-06-10 | Symantec Corporation | Systems and methods for associating brands with search queries that produce search results with malicious websites |
ES2791697T3 (en) * | 2012-06-27 | 2020-11-05 | Rakuten Inc | Information processing device, information processing method, and information processing program |
US9659259B2 (en) * | 2014-12-20 | 2017-05-23 | Microsoft Corporation | Latency-efficient multi-stage tagging mechanism |
WO2016103383A1 (en) * | 2014-12-25 | 2016-06-30 | 楽天株式会社 | Information processing device, information processing method, program, and storage medium |
US20160188660A1 (en) * | 2014-12-31 | 2016-06-30 | Ebay Inc. | Determining search results using session based refinements |
CN107330752B (en) * | 2017-05-31 | 2020-09-29 | 北京京东尚科信息技术有限公司 | Method and device for identifying brand words |
-
2018
- 2018-08-29 JP JP2018160217A patent/JP6894875B2/en active Active
-
2021
- 2021-06-03 JP JP2021093596A patent/JP6960553B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP6960553B2 (en) | 2021-11-05 |
JP2021176085A (en) | 2021-11-04 |
JP2020035126A (en) | 2020-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5238437B2 (en) | Web browsing purpose classification device, web browsing purpose classification method, and web browsing purpose classification program | |
US10360605B2 (en) | Server apparatus, information providing method, information providing program, recording medium recording the information providing program, and information providing system | |
JP4962967B2 (en) | Web page search server and query recommendation method | |
CN102859518B (en) | Information processor, information processing method | |
US8812505B2 (en) | Method for recommending best information in real time by appropriately obtaining gist of web page and user's preference | |
JP5083669B2 (en) | Information extraction system, information extraction method, information extraction program, and information service system | |
JP6018338B1 (en) | Information processing apparatus, information processing method, and information processing program | |
CN103608832A (en) | Information processing device, information processing method, information processing program, and storage medium having information processing program stored thereon | |
JP5483269B2 (en) | Information search device and information search method | |
US20170287041A1 (en) | Information processing apparatus, information processing method, and information processing program | |
JP6960253B2 (en) | Product evaluation device, product evaluation method, and program | |
JP6479239B1 (en) | Information processing apparatus, information processing system, information processing method, and program | |
CN103069419A (en) | Information provision device, information provision method, programme, and information recording medium | |
JP6960553B2 (en) | Brand dictionary creation device, product evaluation device, brand dictionary creation method and program | |
JP2007018285A (en) | Information providing system, information providing method, information providing apparatus, and information providing program | |
KR101655368B1 (en) | Method and system to search and provide shopping postscript | |
JP6982546B2 (en) | Information providing equipment, information providing method, and program | |
JP6964445B2 (en) | Brand dictionary creation device, brand dictionary creation method, and program | |
JP6993955B2 (en) | Information processing equipment, information processing methods, and programs | |
TW201407515A (en) | Method and system for processing shopping information over internet, and a readable storage medium | |
JP2001229171A (en) | Article retrieval system | |
JP7140561B2 (en) | Information processing device, information processing method, and program | |
WO2016189594A1 (en) | Device and system for processing dissatisfaction information | |
KR20110003454A (en) | Opinion search and advertisement service system using internet | |
JP3474803B2 (en) | Search system, search server, search method, and recording medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200313 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210311 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210511 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210604 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6894875 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |