JP6446851B2 - レコメンドシステム、レコメンド方法及びプログラム - Google Patents
レコメンドシステム、レコメンド方法及びプログラム Download PDFInfo
- Publication number
- JP6446851B2 JP6446851B2 JP2014126352A JP2014126352A JP6446851B2 JP 6446851 B2 JP6446851 B2 JP 6446851B2 JP 2014126352 A JP2014126352 A JP 2014126352A JP 2014126352 A JP2014126352 A JP 2014126352A JP 6446851 B2 JP6446851 B2 JP 6446851B2
- Authority
- JP
- Japan
- Prior art keywords
- recommendation
- word
- ranking
- processing unit
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title description 38
- 238000012545 processing Methods 0.000 claims description 104
- 238000004458 analytical method Methods 0.000 claims description 46
- 230000000877 morphologic effect Effects 0.000 claims description 6
- 238000004220 aggregation Methods 0.000 claims description 5
- 230000002776 aggregation Effects 0.000 claims description 5
- 238000009826 distribution Methods 0.000 claims description 5
- 239000000047 product Substances 0.000 description 91
- 238000006243 chemical reaction Methods 0.000 description 25
- 230000008569 process Effects 0.000 description 19
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 12
- 240000003768 Solanum lycopersicum Species 0.000 description 12
- 238000012937 correction Methods 0.000 description 9
- 239000000284 extract Substances 0.000 description 9
- 230000002354 daily effect Effects 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 6
- 238000003860 storage Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 4
- 230000003442 weekly effect Effects 0.000 description 4
- 241000208822 Lactuca Species 0.000 description 3
- 235000003228 Lactuca sativa Nutrition 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 235000015277 pork Nutrition 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 235000008452 baby food Nutrition 0.000 description 1
- 238000010923 batch production Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 239000013065 commercial product Substances 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
<実施の形態1>
まず、図1を用いて、本発明の実施の形態1にかかるレコメンドシステム100の構成について説明する。
S1:単語DB0041、同義語DB0042の作成
はじめに、事前準備として、単語DB0041に単語リストを格納しておく。図6に、単語リストの一例を示す。図6の単語リストは、カラム「単語ID」「単語名」「商材ID」を含むレコードを1以上含む。「単語ID」はレコードの識別子である。また単語リストの「商材ID」は、商材DB008(後述)の「商材ID」と共通である。
ランキング生成処理(S2乃至S6)は、典型的にはバッチ処理として実行される。すなわち、レコメンドシステム100は、例えば一定の間隔でS2乃至S6を実行することができる。
収集処理部002は、ニュースサイト200を参照し、記事001のテキストデータを取得する。記事001は、典型的にはウェブサイト上で配信されるニュース、SNS、ブログ等のテキストコンテンツであるが、商材のレコメンドに有用と思われるあらゆるソースが提供するテキストコンテンツであって良い。
分析処理部005は、収集DB003のレコードの「テキスト内容」カラムよりテキストデータを取得する。分析処理部005は、取得したテキストデータを対象に形態素解析を行い、テキストデータを単語レベルに分解する。形態素解析により、例えば「Tomato体にいいらしい」というテキストデータは、「Tomato」「体」「に」「いい」「らしい」という複数の単語に分解される。なお、形態素解析の具体的なアルゴリズムについては公知であるため、ここでは詳細な説明を省略する。
分析処理部005は、収集DB003の全てのレコードについて上記処理を行う。
分析処理部005は、S3で得た単語を、同義語DB0042に従って置換する。すなわち、同義語DB0042は、S3で得た単語夫々について、同義語リストの「置換前」カラムと照合し、一致する場合は当該単語を「置換後」カラムの内容で置換する。例えば、同義語リストが図7のように定義されている場合、S3で抽出された単語「Tomato」は、同義語リストのレコード「DG001」に従って、「トマト」に置換される。この場合、分析処理部005は、S4にかかる処理の結果として、単語群「トマト」「体」「に」「いい」「らしい」を得る。分析処理部005は、これらの単語群を、テキストデータの取得元である収集DB003のレコードの「取得時刻」カラムの内容と対応付けて保持する。
分析処理部005は、収集DB003の全てのレコードについて上記処理を行う。
分析処理部005は、S4にかかる処理結果を分析し、ランキングDB006に反映させる。
なお、図8に示すように、ランキングDB006はカラム「変換後カウント値」を含んでも良い。「変換後カウント値」の意義は後述する。
分析処理部005は、カウントされた全ての単語について同様のレコードを生成する。
図8は、上述の4種類の集計期間全てについてカウントを行った後のランキングDB006の状態を示している。
商材DB008が「変換後カウント値」カラムを有する場合、分析処理部005は「変換後カウント値」を算出し、商材DB008に格納する処理を行う。「変換後カウント値」、「トレンドランキング」を生成するために用いられるデータである。
計算式:ある集計期間における「変換後カウント値」=ある集計期間における「カウント数」−直前の集計期間における「カウント数」
計算式:「変換後カウント値」=(「カウント数」−平均値μ)/標準偏差σ
ここで平均値μ、標準偏差σは、以下のように定義される。
平均値μ=(X1+X2+X3+・・・+Xn)/n
標準偏差σ=√[{(X1−μ)2+(X2−μ)2+・・・+(Xn−μ)2}/(n−1)]
ここでn=1,2,3・・・は集計期間、Xiはその集計期間における「カウント数」である。
μ=(10+20+30)/3=60/3=20
σ=√[{(10−20)2+(20−20)2+(30−20)2}/(3−1))]
=√[(100+0+100)/2]
=10
したがって、今週計算される「変換後カウント値」は以下のようになる。なお、今週の「カウント数」はX1=「10」である。
「変換後カウント値」=(10−20)/10=−1.0
レコメンド生成処理(S11乃至S13)は、典型的にはリアルタイム処理として実行される。すなわち、レコメンドシステム100は、例えばECサイト300からのリクエストをトリガとして、S11乃至S13を実行することができる。
レコメンド処理部007は、ECサイト300のECシステム009から、適切なレコメンドを生成するのに必要な情報、より具体的にはレコメンドに必要な単語を取捨選択するための条件を取得する。典型的には、ECシステム009が、ECサイト300のユーザに対し何らかの商材をレコメンドしたいときに、以下に示すような情報をレコメンドシステム100のレコメンド処理部007に対して送信する。
例えば「日本」、「イスラム教」、「男性」など。属性名としては、後述の属性DB010のカラム「属性名」と共通の名称を用いる。
ロ)ランキング基準
「カウント数」又は「変換後カウント値」。あるいは「人気ランキング」又は「トレンドランキング」でも良い。
ハ)期間
「Daily」、「Weekly」、「Monthly」、又は「ALL」のいずれか。
ニ)カウント日
「直近」、又は日付指定(YYYY/MM/DD)
ホ)レコメンド個数
N(Nは数字)
レコメンド処理部007は、属性情報サイト400の属性DB010を参照し、S11において取得したイ)属性名と、カラム「属性名」とが一致するレコードを抽出する。
レコメンド処理部007は、ランキングDB006を参照し、S11で取得した条件ハ)及びニ)に合致するレコードを取得する。例えば、ハ)期間が「Daily」、ニ)カウント日が「直近」であった場合、レコメンド処理部007は、図7のランキングDB006から、ランキングID「RK001」「RK002」を含むレコード群を抽出する。
実施の形態2では、収集データの地域やメディアに着目して、ユーザに対しより適切なレコメンドを行う手法を提案する。
分析処理部005は、収集DB003のレコードの「テキスト内容」カラムよりテキストデータを取得し、形態素解析を行って得た単語を、同義語DB0042に従って置換する。その後、分析処理部005は、置換後の単語群を、テキストデータの取得元である収集DB003のレコードの「取得時刻」及び「地域」「メディア」カラムの内容と対応付けて保持する。
レコメンド処理部007は、ECサイト300のECシステム009から、イ)〜ホ)に加えて、以下の条件ヘ)、ト)を取得する。
例えば「日本」、「日本,アメリカ」、「日本以外」、「ALL」等
ト)メディア別条件
例えば「Twitter」、「Twitter,Facebook」、「Twitter以外」、「ALL」等
レコメンド処理部007は、ランキングDB006を参照し、S11で取得した条件ハ)、ニ)、ヘ)及びト)に合致するレコードを取得する。例えば、ハ)期間が「Daily」、ニ)カウント日が「直近」、へ)地域別条件が「日本」、ト)メディア別条件が「Twitter」であった場合、レコメンド処理部007は、図7のランキングDB006から、ランキングID「RK001」「RK002」を含むレコード群を抽出する。ここで、レコメンド処理部007は、ランキングDB006において「地域」又は「メディア」カラムに「All」が定義されている場合、当該レコードは全てのへ)地域別条件又はト)メディア別条件に合致するものとして扱う。また、ランキングDB006において「地域」又は「メディア」カラムに複数の値が定義されている場合、そこにへ)地域別条件又はト)メディア別条件において指定された値が含まれている場合は、合致するものとして扱う。
実施の形態3では、テキストデータの提供元の評価等に応じて、収集したテキストデータの重み付け行う手法を提案する。
分析処理部005は、収集DB003のレコードの「テキスト内容」カラムよりテキストデータを取得し、形態素解析を行って得た単語を、同義語DB0042に従って置換する。その後、分析処理部005は、置換後の単語群を、テキストデータの取得元である収集DB003のレコードの「取得時刻」及び「地域」「メディア」カラムの内容と対応付けて保持する。
なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。例えば、上述の実施の形態では、本発明を主にハードウェアの構成として説明したが、これに限定されるものではなく、任意の処理を、CPU(Central Processing Unit)にコンピュータプログラムを実行させることにより実現することも可能である。この場合、コンピュータプログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non−transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD−ROM(Read Only Memory)、CD−R、CD−R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(random access memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
200 ニュースサイト
300 ECサイト
400 属性情報サイト
001 記事
002 収集処理部
003 収集DB
0041 単語DB
0042 同義語DB
005 分析処理部
006 ランキングDB
007 レコメンド処理部
008 商材DB
009 ECシステム
010 属性DB
Claims (9)
- テキストデータを収集する収集処理部と、
前記テキストデータに含まれる単語のランキングを作成する分析処理部と、
レコメンド対象のユーザにかかる属性を取得し、前記ランキング及び前記属性に応じて前記単語を取捨選択し、取捨選択された前記単語に関連付けられた商材を提示するレコメンド処理部と、を含み、
前記レコメンド処理部はさらに、前記属性に基づいてレコメンドを禁止すべき商材を特定し、前記禁止すべき商材を提示させない又は提示を抑制する制御を行う
レコメンドシステム。 - 前記レコメンド処理部はさらに、前記属性に基づいてレコメンドを許可すべき商材を特定し、前記許可すべき商材を提示させ又は提示を促進する制御を行う
請求項1記載のレコメンドシステム。 - 前記レコメンド処理部は、前記テキストデータが収集された地域又はメディア、前記ランキング及び前記属性に応じて前記単語を取捨選択し、取捨選択された前記単語に関連付けられた商材を提示する
請求項1又は2記載のレコメンドシステム。 - 前記分析処理部は、前記テキストデータを形態素解析して得られた単語群に含まれる各単語に、前記テキストデータが収集された地域又はメディアを対応付け、
前記レコメンド処理部は、
前記レコメンド対象の地域又はメディアをさらに取得し、
前記単語を取捨選択する際に、前記取得した地域又はメディアに対応付けられたものを取捨選択する
請求項1乃至3いずれか1項記載のレコメンドシステム。 - 前記分析処理部は、前記単語群に含まれる各単語の出現数をカウントすることにより、前記ランキングを作成する
請求項4記載のレコメンドシステム。 - 前記分析処理部は、複数の集計期間夫々における前記単語の出現数の変動に基づいて、前記ランキングを作成する
請求項5記載のレコメンドシステム。 - 前記分析処理部は、複数の集計期間夫々における前記単語の出現数の変動を所定の分布に従って変換することにより、前記ランキングを作成する
請求項6記載のレコメンドシステム。 - コンピュータが備える制御装置が、
テキストデータを収集する収集処理ステップと、
前記テキストデータに含まれる単語のランキングを作成する分析処理ステップと、
レコメンド対象のユーザにかかる属性を取得し、前記ランキング及び前記属性に応じて前記単語を取捨選択し、取捨選択された前記単語に関連付けられた商材を提示するレコメンド処理ステップと、を実行し、
前記レコメンド処理ステップは、さらに、前記属性に基づいてレコメンドを禁止すべき商材を特定し、前記禁止すべき商材を提示させない又は提示を抑制する制御を行うことを含む
レコメンド方法。 - テキストデータを収集する収集処理ステップと、
前記テキストデータに含まれる単語のランキングを作成する分析処理ステップと、
レコメンド対象のユーザにかかる属性を取得し、前記ランキング及び前記属性に応じて前記単語を取捨選択し、取捨選択された前記単語に関連付けられた商材を提示するレコメンド処理ステップと、を
コンピュータに、実行させ、
前記レコメンド処理ステップは、さらに、前記属性に基づいてレコメンドを禁止すべき商材を特定し、前記禁止すべき商材を提示させない又は提示を抑制する制御を行うことを含む、プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014126352A JP6446851B2 (ja) | 2014-06-19 | 2014-06-19 | レコメンドシステム、レコメンド方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014126352A JP6446851B2 (ja) | 2014-06-19 | 2014-06-19 | レコメンドシステム、レコメンド方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016004529A JP2016004529A (ja) | 2016-01-12 |
JP6446851B2 true JP6446851B2 (ja) | 2019-01-09 |
Family
ID=55223731
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014126352A Active JP6446851B2 (ja) | 2014-06-19 | 2014-06-19 | レコメンドシステム、レコメンド方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6446851B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102207929B1 (ko) * | 2018-05-04 | 2021-01-25 | 이청종 | 공급자와 판매자간 전자 상거래 중계 시스템 |
KR102173527B1 (ko) * | 2018-12-04 | 2020-11-03 | 네이버 주식회사 | 급상승 음원 차트를 제공하는 방법 및 시스템 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003281443A (ja) * | 2002-03-26 | 2003-10-03 | Fujitsu Ltd | コンテンツ送信方法 |
JP2008293211A (ja) * | 2007-05-23 | 2008-12-04 | Hitachi Ltd | アイテム推薦システム |
JP4859892B2 (ja) * | 2008-08-12 | 2012-01-25 | ヤフー株式会社 | 商品広告配信装置、商品広告配信方法、及び商品広告配信制御プログラム |
-
2014
- 2014-06-19 JP JP2014126352A patent/JP6446851B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016004529A (ja) | 2016-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9400831B2 (en) | Providing information recommendations based on determined user groups | |
US8935713B1 (en) | Determining audience members associated with a set of videos | |
US10529031B2 (en) | Method and systems of implementing a ranked health-content article feed | |
KR20160083017A (ko) | 소셜 데이터 네트워크에서 인플루언서들 및 그들의 커뮤니티를 식별하기 위한 시스템 및 방법 | |
JP6405704B2 (ja) | 情報処理装置、情報処理方法、及び、プログラム | |
WO2014180196A1 (zh) | 信息推荐处理方法及装置 | |
CN111899047A (zh) | 资源推荐方法、装置、计算机设备及计算机可读存储介质 | |
JP6018338B1 (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
JP2018045553A (ja) | 選択装置、選択方法および選択プログラム | |
JP6859621B2 (ja) | サーバ装置、表示システム、制御方法及びプログラム | |
JP2013077056A (ja) | アプリケーション推薦装置及びアプリケーション推薦方法 | |
JP6698730B2 (ja) | 抽出装置、抽出方法及び抽出プログラム | |
JP5813052B2 (ja) | 情報処理装置、方法及びプログラム | |
JP5882262B2 (ja) | 端末装置およびプログラム | |
US10331713B1 (en) | User activity analysis using word clouds | |
JP6446851B2 (ja) | レコメンドシステム、レコメンド方法及びプログラム | |
JP6414192B2 (ja) | 情報処理装置、情報処理方法、情報処理プログラム | |
JP5824601B1 (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
JP6060833B2 (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
JP6311052B1 (ja) | 抽出装置、抽出方法及び抽出プログラム | |
JP5846033B2 (ja) | 情報処理装置、端末装置、情報処理方法、表示方法、情報処理プログラム、及び表示プログラム | |
JP5370351B2 (ja) | 情報処理方法、情報処理装置、及び情報処理プログラム | |
JP6373767B2 (ja) | 話題語ランキング装置、話題語ランキング方法、およびプログラム | |
JP6362577B2 (ja) | 情報処理装置及び表示記事選択システム | |
JP2015187887A (ja) | 情報処理装置、端末装置、情報処理方法、表示方法、情報処理プログラム、及び表示プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170512 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180309 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180508 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180704 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181106 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181119 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6446851 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |