[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP6178480B1 - データ分析システム、その制御方法、プログラム、及び、記録媒体 - Google Patents

データ分析システム、その制御方法、プログラム、及び、記録媒体 Download PDF

Info

Publication number
JP6178480B1
JP6178480B1 JP2016206390A JP2016206390A JP6178480B1 JP 6178480 B1 JP6178480 B1 JP 6178480B1 JP 2016206390 A JP2016206390 A JP 2016206390A JP 2016206390 A JP2016206390 A JP 2016206390A JP 6178480 B1 JP6178480 B1 JP 6178480B1
Authority
JP
Japan
Prior art keywords
data
information
evaluation
evaluation target
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016206390A
Other languages
English (en)
Other versions
JP2018067215A (ja
Inventor
和巳 蓮子
和巳 蓮子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fronteo Inc
Original Assignee
Fronteo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fronteo Inc filed Critical Fronteo Inc
Priority to JP2016206390A priority Critical patent/JP6178480B1/ja
Application granted granted Critical
Publication of JP6178480B1 publication Critical patent/JP6178480B1/ja
Priority to US15/787,157 priority patent/US11232325B2/en
Publication of JP2018067215A publication Critical patent/JP2018067215A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • G06V10/763Non-hierarchical techniques, e.g. based on statistics of modelling distributions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/772Determining representative reference patterns, e.g. averaging or distorting patterns; Generating dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/226Character recognition characterised by the type of writing of cursive writing
    • G06V30/2268Character recognition characterised by the type of writing of cursive writing using stroke segmentation
    • G06V30/2276Character recognition characterised by the type of writing of cursive writing using stroke segmentation with probabilistic networks, e.g. hidden Markov models

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Algebra (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】商品・サービスの購入に関するユーザの動向を左右する効果的情報を生成するデータ分析システム等を提供する。【解決手段】データを分析してユーザの動向に関与する情報を生成するデータ分析システムであって、分析の対象となる複数の評価対象データを少なくとも一時的に記憶するメモリと、複数の評価対象データの夫々を学習用データに基づいて評価するコントローラと、を備え、コントローラは、複数の評価対象データの評価の結果に基づいて、複数の評価対象データから第1の情報を抽出し、第1の情報に含まれる特徴パターンに基づいて、学習用データから第2の情報を抽出し、ユーザの動向に関与する情報を第1の情報と第2の情報とから生成する。【選択図】図5

Description

本発明は、データ分析システムに関するものであり、例えば、ビックデータを分析する人工知能を備えたシステムに適用可能なものである。
コンピュータの発展により社会の情報化が進んだ結果、企業・個人の経済活動には、データ分析し、その結果を活用することが重要になってきている。例えば、インターネットを利用して商品の売買が行われるウェブサイトでは、消費者の消費行動のデータ分析が行われ、その分析結果が消費者の消費行動を促進することに活用されている。特開2010−272015号公報には、ネットショッピング管理装置が検索要求に対する検索結果をユーザに返すだけでなく、ユーザの商品購入履歴をユーザに提示することによって、ユーザの新たな消費を喚起させようとするシステムが開示されている(特開2010−272015号公報)。
特開2010−272015号公報
消費者の商品の購入動機は、個人の嗜好の違いから複数の消費者夫々で異なるため、特開2010−272015号公報に記載されたシステムのように、商品購入履歴を提示するといった単純な形態では、消費者の消費行動を、現実として刺激することはできない。そもそも、消費者の消費行動に関連する大容量の蓄積データがある中で、消費者の商品の購入意欲を実質的に喚起できるようなデータを分別することは容易ではなく、実際のところ、この種のシステムは実現されてはいない。
そこで、本発明は、商品・サービスの購入に関するユーザの動向を左右する効果的情報を生成するデータ分析システム等を提供することを目的とする。
上記目的は、複数の評価対象データの評価の結果に基づいて、複数の評価対象データから第1の情報を抽出し、第1の情報に含まれる特徴パターンに基づいて、学習用データから第2の情報を抽出し、ユーザの動向に関与する情報を第1の情報と第2の情報とから生成することによって達成される。
既述の開示によって、商品・サービスの購入に関するユーザの動向を左右する効果的情報を生成するデータ分析システム等が提供される。
データ分析システムのハードウェア構成の一例を示すブロック図である。 サーバ装置が評価対象データを評価する際に実行するフローチャートの一例を示す図である。 第1理由データにおける構成要素の配置を説明するための図である。 複数の構成要素夫々の評価値と学習用データにおける出現位置との分布を示す特性図である。 サーバ装置が理由データを抽出して出力するフローチャートの一例を示す図である。 理由データの出力例を示す図である。
〔データ分析システムの構成〕
図1は、本実施の形態に係るデータ分析システム1(以下、単に「システム」と略記することがある)のハードウェア構成の一例を示すブロック図である。当該システムは、例えば、データ(デジタルデータ、及び/又は、アナログデータを含む)を格納可能な任意の記録媒体(例えば、メモリ、ハードディスク等)と、当該記録媒体に格納された制御プログラムを実行可能なコントローラ(CPU;Central Processing Unit)とを備え、当該記録媒体に少なくとも一時的に格納されたデータを分析するコンピュータまたはコンピュータシステム(複数のコンピュータが統合的に動作することによってデータ分析を実現するシステム)として実現され得る。
本実施の形態において、「学習用データ」(training data)は、例えば、参照データとしてユーザに提示され、分類情報が対応付けられたデータ(分類済みの参照データ、参照データと分類情報との組み合わせ)であってよい。学習用データを、「教師データ」または「トレーニングデータ」といってもよい。また、「評価対象データ」(evaluation data)は、当該分類情報が対応付けられていないデータ(参照データとしてユーザに提示されておらず、ユーザにとっては分類されていない未分類のデータ、「未知データ」といってもよい)であってよい。ここで、上記「分類情報」は、参照データを任意に分類するために用いる識別ラベルであってよく、例えば、参照データと所定事案(上記システムがデータとの関連性を評価する対象を広く含み、その範囲は制限されない)とが関係することを示す「Related」ラベルと、両者が関係しないことを示す「Non-Related」ラベルとのように、当該参照データを任意の数(例えば、2つ)のグループに分類する情報であってよい。
図1に例示されるように、上記システムは、例えば、データ分析の主要処理を実行可能なサーバ装置(サーバ計算機)2と、当該データ分析の関連処理を実行可能な一つ、又は、複数のクライアント装置(クライアント計算機)3と、データおよび当該データに対する評価結果を記録するデータベース4を備えるストレージシステム5と、クライアント装置3およびサーバ装置2に対して、データ分析のための管理機能を提供する管理計算機6とを備えてよい。それぞれの装置は、ハードウェア資源として、例えば、メモリ、コントローラ、バス、入出力インターフェース(例えば、キーボード、ディスプレイ、スピーカなど)、通信インターフェース(所定のネットワークを用いた通信手段によって、各装置を通信可能に接続する)などを備えてよい(これらの例に限定されない)。サーバ装置2は、データ分析に必要なプログラムやデータを記録した(非一時的)記憶媒体、例えば、ハードディスク、フラッシュメモリ、DVD、CD、BD等を備えている。
クライアント装置3は、データの一部を参照データとしてユーザに提示する。これにより、当該ユーザは、評価者(又は、レビュア)として、クライアント装置3を介して参照データに対する評価・分類のための入力を行う(分類情報を与える)ことができる。サーバ装置2は、参照データと分類情報との組み合わせ(学習用データ)に基づいて、当該データからパターン(例えば、データに含まれる抽象的な規則、意味、概念、様式、分布、サンプルなどを広く指し、いわゆる「特定のパターン」に限定されない)を学習し、当該学習したパターンに基づいて、評価対象データと所定事案との関連性を評価する。
管理計算機6は、クライアント装置3、サーバ装置2、及び、ストレージシステム5に対して、所定の管理処理を実行する。ストレージシステム5は、例えば、ディスクアレイシステムから構成され、データと当該データに対する評価・分類の結果とを記録するデータベース4を備えてよい。サーバ装置2とストレージシステム5とは、DAS(Direct Attached Storage)方式、又は、SAN(Storage Area Network)によって通信可能に接続されている。
なお、図1に示されるハードウェア構成はあくまで例示に過ぎず、上記システムは、他のハードウェア構成によっても代替等されてもよい。例えば、サーバ装置2において実行される処理の一部、又は、全部がクライアント装置3において実行される構成であってもよいし、当該処理の一部または全部がサーバ装置2において実行される構成であってもよいし、ストレージシステム5がサーバ装置2に内蔵される構成であってもよい。また、ユーザは、クライアント装置3を介してサンプルデータに対する評価・分類のための入力を行う(分類情報を与える)だけでなく、サーバ装置2に直接接続された入力機器を介して上記入力を行うこともできる。当該システムを実現可能なハードウェア構成が多様に存在し得ることは、当業者に理解されるところであり、特定の1つの構成(例えば、図1に例示されるような構成)に限定されない。
〔データ評価機能〕
上記システムは、データ評価機能を備えることができる。当該データ評価機能は、人手で分類された少数のデータ(学習用データ)に基づいて、多数の評価対象データ(ビッグデータ)を評価するものである。当該データ評価機能を備えることにより、上記システムは、例えば、評価対象データと所定事案との関連性の高低を示す指標(例えば、評価対象データを序列化可能にする数値(例えば、スコア)、文字(例えば、「高」、「中」、「低」など)、及び/又は、記号(例えば、「◎」、「○」、「△」、「×」など)、を導出することによって、上記評価を実現することができる。データ評価機能は、サーバ装置2のコントローラによって実現される。
上記システムが上記評価のための指標としてスコアを導出する場合、当該システムは、当該スコアを任意の方法で算出することができる。例えば、機械学習、又は、自然言語処理の分野で用いられる各種の手法(例えば、K近傍法、サポートベクターマシンを用いた手法、ニューラルネットワークを用いた手法、データに対して統計モデルを仮定する手法(例えば、ガウス過程を用いた手法など)、及び/又は、これらを組み合わせた手法など)に基づいて当該スコアを算出してもよいし、統計学の分野で用いられる各種の手法に基づいて(例えば、構成要素がデータに現れる頻度に基づいて)算出してもよい。
「構成要素」(データ要素と呼んでもよい)は、データの少なくとも一部を構成する部分データであってよく、例えば、文書を構成する形態素、キーワード、文、段落、及び/又は、メタデータ(例えば、電子メールのヘッダ情報)であったり、音声を構成する部分音声、ボリューム(ゲイン)情報、及び/又は、音色情報であったり、画像を構成する部分画像、部分画素、及び/又は、輝度情報であったり、映像を構成するフレーム画像、モーション情報、及び/又は、3次元情報であったりしてよい。
構成要素がデータに現れる頻度に基づいて上記システムが上記スコアを算出する場合、例えば、次のような算出方法が考えられる。先ず、上記システムは、学習用データから、当該学習用データを構成する構成要素を抽出し、当該構成要素を評価する。このとき、上記システムは、例えば、学習用データの少なくとも一部を構成する複数の構成要素が、データと分類情報との組み合わせに寄与する度合い(言い換えれば、当該構成要素が分類情報に応じて出現する頻度)をそれぞれ評価する。度合いを重みと言い換えてもよい。より具体的な一例として、上記システムは、伝達情報量(例えば、構成要素の出現確率と分類情報の出現確率とを用いて、所定の式から算出される情報量)を用いて構成要素を評価することによって、当該構成要素の評価情報としての評価値を、下記の数1に従い算出する。
ここで、wgtは、評価前のi番目の構成要素の評価値の初期値を示す。また、wgtは、L回目の評価後のi番目の構成要素の評価値を示す。γはL回目の評価における評価パラメータを意味し、θは評価の際の閾値を意味する。これにより、上記システムは、例えば、算出した伝達情報量の値が大きいほど、構成要素が所定の分類情報の特徴を表すものとして評価することができる。
次に、上記システムは、上記構成要素と評価値とを対応付け、両者を任意のメモリ(例えば、ストレージシステム5)に格納する。そして、上記システムは、評価対象データから構成要素を抽出し、当該構成要素が上記メモリに格納されているか否かを照会し、格納されている場合は、当該構成要素に対応付けられた評価値を当該メモリから読み出し、当該評価値に基づいて評価対象データを評価する。より具体的な一例として、上記システムは、評価対象データの少なくとも一部を構成する構成要素に対応付けられた評価値を用いて以下の式を計算することによって、上記スコアを算出することができる。
:i番目の構成要素の出現頻度、wgt:i番目の構成要素の評価値
サーバ装置2は、再現率が所定の目標値になるまで、構成要素の抽出、及び、評価を継続する(繰り返す)ことができるようにしてもよい。再現率とは、所定数のデータに対して発見すべきデータが占める割合(網羅性)を示す指標であり、例えば、全データの30%に対して再現率が80%である場合、所定事案に関係するとして、発見されるべきデータの80%が、指標(スコア)上位30%のデータの中に含まれていることを示す。データ分析システムを用いず、人がデータに総当たり(リニアレビュー)した場合、発見すべきデータの量は人がレビューした量に比例するため、この比例からの乖離が大きいほどシステムのデータ分析性能が良いことになる。
前述したデータ評価機能の実現例は、あくまでも一例に過ぎない。すなわち、当該データ評価機能は、「学習用データに基づいて評価対象データを評価する」という機能でありさえすれば、その具体的な態様は特定の1つの構成(例えば、前述したスコアの算出方法)に限定されない。
〔サーバ装置2による評価対象データの評価〕
サーバ装置2による評価対象データの評価動作を説明する。図2は、サーバ装置2(詳しくはサーバ装置2のコントローラ)のフローチャートである。なお、以下の各ステップを、モジュール又は手段と言い換えることもできる。
サーバ装置2は、ストレージシステム5に少なくとも一時的に記録された評価対象データの中から一つ又は複数のデータを参照データとして取得する(ステップS300:参照データ取得モジュール)。例えば、サーバ装置2は、クライアント装置3を介して検索されたキーワード(例えば、「赤ワイン 健康」など)に適した商品をインターネット上(システム内であってもよい。)で検索し、該当商品(推薦商品:例えば「ワインA」)の情報と、推薦商品に関する複数のレビューコメントとを取得してストレージシステム5に記憶する。また、サーバ装置2は、参照データとして、記憶した複数のレビューコメントから、キーワードに適したレビューコメントを一又は複数取得する。
ここで、検索対象は、商品に限られるものではく、サービス、人物、対処法、治療法等であってもよい。また、評価対象データは、商品のレビューコメントに限られるものではなく、検索対象に係る内容、例えばサービス内容、人事評価、クレーム内容、医師の所見(カルテ)、書籍内容等であってもよい。加えて、参照データとしては、質問を介してタグ付けを行うための情報(例えば、商品「ワイン」を10点ほどユーザに提示すると共に、「今までに飲んだことはありますか。」、「気に入ったものはありますか。」)等、他のデータ群も幅広く採用し得る。
次に、サーバ装置2は、ユーザが参照データを実際にレビューして分類を決定し、ユーザによって参照データに対して入力された分類情報を、任意の入力装置から取得する(ステップS302:分類情報取得モジュール)。例えば、サーバ装置2は、クライアント装置3を介して、レビューコメントに対するアクション(「参考になった」、「いいね!」等のタグ付け、お気に入りに登録、評価しない等)を得る。また、例えば、サーバ装置2は、上記質問に対する回答を得てもよいし、その他のアクションを得てもよい。
サーバ装置2は、参照データと分類情報とを組み合わせることによって学習用データを構成し、学習用データから構成要素を抽出する(ステップS304:構成要素抽出モジュール)。そして、コントローラは、当該構成要素を評価し(ステップS306:構成要素評価モジュール)、当該構成要素と評価値とを対応付け、両者をストレージシステム5に格納する(ステップS308:構成要素格納モジュール)。
上記S300〜S308の処理は、「学習フェーズ」(人工知能がパターンを学習するフェーズ)に対応する。なお、学習用データを、参照データから作成する代わりに、予め用意しておいてもよい。例えば、ある特許権に係る特許を無効にするための公知文献を見つける場合、学習用データは、特許請求の範囲の記載と「Related」ラベルとの組み合わせであってよい。
次に、サーバ装置2は、ストレージシステム5から評価対象データを取得する(ステップS310:評価対象データ取得モジュール)。サーバ装置2は、さらに、ストレージシステム5から構成要素とその評価値とを読み出し、当該構成要素を評価対象データから抽出する(ステップS312:構成要素抽出モジュール)。サーバ装置2は、当該構成要素に対応付けられた評価値に基づいて評価対象データを評価して(ステップS314:評価対象データ評価モジュール)、複数の評価対象データの序列化情報(ランキング)を作成する。上位の評価対象データであるほど所定事案との関連性が高いことを示す。ステップS308以降の処理が、既述の学習フェーズに対して、評価フェーズになる。なお、既述のフローチャートに含まれる各処理は、一例であって、限定される態様を示したものでないことに留意すべきである。また、例えば、学習フェーズおよび評価フェーズの一方または両方は、本システムとは異なる他システムで行われ、本システムは、他システムの結果を使用するものであってもよい。
〔理由データの抽出および出力〕
従来のデータ分析システムは、商品を推薦するが、その理由が示されていなかったり、自分または他のユーザの購入履歴に紐づいていることが理由であったりして、その商品を購入するか否かの判断要素として十分なものとはなっていない。これは、個々人の嗜好に左右する判断要素を特定することが技術的に困難であることに起因する。この点、本実施の形態のデータ分析システム1によれば、複数の評価対象データの評価の結果(例えばランキング、後述の文データごとのスコア等)に基づいて、複数の評価対象データから第1の情報(例えば第1理由データ)を抽出し、第1の情報に含まれる特徴パターン(例えば後述のデータパターン等)に基づいて、一または複数の学習用データから第2の情報(例えば第2理由データ)を抽出し、ユーザの動向(所定の商品の購入、所定のサービスの利用、人事評価等)に関与する情報(例えば情報提供の理由を示す理由データ)を第1の情報と第2の情報から迅速かつ適切に生成することができる。また、ユーザの動向に関与する情報の出力に当たって、評価対象データのどの要素を根拠としているかを示すことは勿論のこと、学習用データのどの要素に係るものであるかを示すことは、ユーザの動向を実質的に左右する重要な要素となる。
図5は、本データ分析システム1を実現するためのフローチャートであり、サーバ装置2(詳しくはサーバ装置2のコントローラ)は、理由データ処理プログラムに従って、既述のステップS314に続いて、このフローチャートを実行することができる。以下詳細に説明する。なお、本実施の形態において「情報提供」とは、情報を提供することを意味し、特定の情報を提供することに限られない。例えば、ユーザに商品を推薦することであってもよい。また、例えば、人事評価に関して助言することであってもよい。また、例えば、クレーム対応に関して注意喚起することであってもよい。また、本実施の形態では、情報提供の理由を示す理由データを例に挙げて説明するが、理由に限られるものではなく、情報提供の根拠、裏付け、由来、証拠、理屈、道理、事情などを示すためのデータに広く適用できる。
図5に示すように、データ分析システム1では、複数の評価対象データのうちの所定の評価対象データから、ユーザに情報提供する理由を示す第1理由データを抽出する(S500)。
例えば、サーバ装置2は、複数の評価対象データにおける評価の中で相対的に評価の高い評価対象データ(例えばランキングが上位10の評価対象データ)を選択し、選択した評価対象データについて自然言語処理を行って文(文データ)を抽出し、文データごとにスコアを算出(例えば文データの構成要素の評価値を加算)し、抽出した文データにおけるスコアの中で相対的にスコアが高い任意の文データを第1理由データとして抽出してもよいし、最も高いスコアの文データを第1理由データとして抽出してもよい。
また、例えば、サーバ装置2は、複数の評価対象データの中で最も評価の高い評価対象データについて自然言語処理を行って文データを抽出し、文データごとにスコアを算出(例えば文データの構成要素の評価値を加算)し、最もスコアが高い文データを第1理由データとして抽出してもよい。
また、例えば、サーバ装置2は、各評価対象データについて自然言語処理を行って文データを抽出し、文データごとにスコアを算出(例えば文データの構成要素の評価値を加算)し、抽出した文データにおけるスコアの中で相対的にスコアが高い任意の文データを第1理由データとして抽出してもよいし、全ての評価対象データにおいて最もスコアが高い文データを第1理由データとして抽出してもよい。
つまり、サーバ装置2は、複数の評価対象データにおける評価の中で相対的に高評価の評価対象データを複数の評価対象データから選択し、評価対象データを構成する複数の部分(例えば複数の文データ)から、評価対象データの評価に寄与する割合(例えばスコア)に基づいて特定部分(例えば文データ)を抽出して第1の情報としてもよいし、複数の評価対象データのうち最高評価の評価対象データを選択し、評価対象データの評価に寄与する割合が最大の部分を特定部分として抽出して第1の情報としてもよいし、学習用データに基づいて、複数の評価対象データの夫々を構成する複数の部分を夫々評価(例えば文データ毎にスコアを算出)し、評価の結果に基づいて第1の情報としてもよい。
第1理由データから、第1理由データの文脈を示すデータパターンを抽出する(S502)。
サーバ装置2は、第1理由データから、第1理由データの文脈を示すデータパターンを抽出するための一例として、第1理由データにおける分布の態様を利用することができる(特願2015−238978)。特願2015−238978の明細書、図面に記載された事項を、本願に引用する。なお、データパターンの態様は、特定のものに限定されなくてもよい。データパターンは、より広義には第1理由データとの関係性を示すものである。また、データパターンは、後述するように、所定の関係を有するまとまりを識別可能な複数の形態素であってもよい。
図3は、第1理由データの一例を示すものであり、a,b,c等のアルファベット一つ一つが形態素に相当し、“・”が形態素として抽出されない、助詞、副詞等の語句である。図4は、複数の形態素夫々の評価値と複数の形態素夫々の第1理由データにおける出現位置との分布を示す。縦軸は形態素の評価値であり、横軸は形態素の第1理由データにおける出現位置である。棒グラフの一つ一つが形態素の評価値である。そして、複数の形態素の評価値に、例えば、ガウシアンフィルターを用いて平滑化処理を行うと符号100に示す特性が得られる。
この特性100によれば、第1理由データに含まれる形態素の優劣(例えば、評価値の高低)を可視化することができ、データパターンをサーバ装置2が抽出、決定、又は、判定する上で有利である。ピーク(102A〜102I)に位置する形態素は、データと分類情報との組み合わせを特徴付ける要素(例えば、所定事案に対する関連性が高い要素)であることを示している。このとき、ピークに位置する形態素に対して所定の位置関係を有する他の形態素、例えば、ピークの形態素の近傍(例えば、隣)に位置する形態素は、ピークの位置する構成要素(特定構成要素)の影響を受けて、換言すれば、ピークの形態素に関連する意味、或いは、意義を有することになって、所定事案に対する関連性が高いといえる。
そこで、サーバ装置2は、第1理由データにおける形態素と評価値との分布において、評価値のピークを中心にして形態素を選択する。例えば、サーバ装置2は、ピークに対応する形態素とその前後に出現する形態素とを“形態素グループ”として選択する。ここで、形態素グループは、例えば、第1理由データにおいて隣接して出現している複数の形態素を1つのグループとしてまとめたものをいう。図4においては、〔〕で囲まれた領域が形態素グループを示す。例えば、第1理由データにおいて、a,b,cが、“a・・b・・c”の順に出現しており、bに評価値のピークがあるとすると、形態素グループは、“a,b,c”によって定義されてよい。形態素同士の間にある意味を持たない語句(既述の“・”)を形態素グループに考慮しなくてよい。
そして、サーバ装置2は、選択された複数の形態素グループの中から一の形態素グループをデータパターンとして決定する。例えば、ピークの最も高い形態素を含む形態素グループをデータパターンとしてよい。また、例えば、形態素グループを構成する複数の形態素の評価値の平均値が最も高い形態素グループをデータパターンとしてよい。また、例えば、形態素グループの両端の形態素を区間として特性100についての定積分を各形態素グループに対して行い、全ての形態素グループの積分値のうちで最も大きい積分値の形態素グループをデータパターンとしてよい。
学習用データから、データパターンを含むデータ(所定の関係を有するまとまり)を第2理由データとして抽出する(S504)。
ここで、データパターンは、第1理由データの文脈を示す複数の形態素であるため、学習用データからデータパターンが含まれるデータを見つけることは、第1理由データの文脈と近い第2理由データを見つけることになる。
以下に、具体的に説明する。第1理由データから抽出されたデータパターンが(M,M,M)となった場合、Mがピークの形態素を示し、M以外のM,MがMに隣接する形態素を示す。
サーバ装置2は、図3に示す第1理由データと同様に、各学習用データから形態素を抽出し、データパターン(M,M,M)と一致する形態素グループがあるか否かを判定する。サーバ装置2は、一致する形態素グループがあると判定した場合、当該形態素グループが含まれる文(文データ)を第2理由データとして抽出する。なお、サーバ装置2は、学習用データのうち、ユーザの動向に関連性があるという分類情報が付されなかった学習用データ(ユーザにより評価が行われなかった学習用データ)をS504の処理の対象から除外してもよい。
ここで、第2理由データは、複数抽出されてもよいし、複数抽出される場合は1つに絞ってもよい。1つに絞る方法として、例えば、ピークの形態素Mに隣接する形態素M,Mに更に隣接する形態素M,Mを含むものを新たなデータパターン(M,M,M,M,M)とし、新たなデータパターンに一致する形態素グループがあるか否かを判定してもよい。また、例えば、ピークの形態素Mに隣接する形態素M,Mに更に隣接する形態素M,Mのうち評価値が高い方の形態素(例えばM)を含むものを新たなデータパターン(M,M,M,M)とし、新たなデータパターンに一致する形態素グループがあるか否かを判定してもよい。このように、当初のデータパターンを第1理由データに即して限定し得る新たなデータパターンを用いて絞り込むことにより、第1理由データの文脈により近い第2理由データを見つけるができるようになる。
また、第2理由データが抽出されない場合、データパターンを変更してもよい。例えば、ピークの形態素Mに隣接する形態素M,Mのうち評価値が小さい方の形態素(例えばM)を取り除いた新たなデータパターン(M,M)とし、新たなデータパターンに一致する形態素グループがあるか否かを判定してもよい。また、例えば、ピークの形態素Mに隣接する形態素M,Mのうち評価値が小さい方の形態素(例えばM)に替えて、大きい方の形態素(例えばM)に隣接する形態素Mを加えた新たなデータパターン(M,M,M)とし、新たなデータパターンに一致する形態素グループがあるか否かを判定してもよい。このように、当初のデータパターンでは第2理由データが抽出されない場合であっても、当初のデータパターンの一部とするまたは当初のデータパターンに隣接する新たなデータパターン、換言するならば当初のデータパターンを第1理由データに即して拡張し得る新たなデータパターンに変更することで、第2理由データを見つけるができるようになる。
第1理由データおよび第2理由データを出力する(S506)。
サーバ装置2は、第1理由データおよび第2理由データを、出力装置(クライアント装置3、クライアント装置3に接続される機器等)に出力させる。
「出力」とは、人の五感(視覚、聴覚、触覚、味覚、嗅覚)により感知できるあらゆる態様を意味する。例えば、クライアント装置3に接続されたディスプレイに表示するものであってもよい。また、例えば、クライアント装置3に接続された投影装置で投影するものであってもよい。また、例えば、クライアント装置3に接続されたスピーカから音、音声などを出すものであってもよい。また、例えば、クライアント装置3に接続された印刷装置で印刷や点字印刷するものであってもよい。
図6を参照して出力態様の一例を説明する。サーバ装置2は、予め規定したフォーマット(本例では、これをオススメするのは、「第2理由データ」と思ったからだよ。特に「第1理由データ」が理由だよ。)をストレージシステム5から読み出し、フォーマットに第1理由データおよび第2理由データを当てはめて理由データ(理由文)を生成し、推奨商品「ワインA」と理由文とを含む画面600を生成し、クライアント装置3のディスプレイに画面600として表示する。
ここで、理由文の態様は、様々であり、第1理由データおよび第2理由データを合体、結合、加工、融合などしてもよい。例えば、上述したように、第1理由データおよび第2理由データをフォーマットに当てはめて理由文にしてもよい。また、例えば、第1理由データおよび第2理由データを箇条書きとして理由文にしてもよい。また、例えば、第2理由データを提示した後、第2理由データに替えて第1理由データを提示するような理由文にしてもよい。また、例えば、一文が長いときは、自然言語処理を行って修飾語を省略する等して第1理由データおよび第2理由データを簡略化する理由文にしてもよい。
更に、例えば、本システムによる評価の重要性に鑑みて、評価対象データから抽出される第1理由データを第2理由データより優位にして理由文を生成してもよい。この場合、第1理由データを商品を推奨する主理由情報とし、第2理由データを商品を推奨する副理由情報とする。また、例えば、ユーザが関与する学習の重要性に鑑みて、学習用データから抽出される第2理由データを第1理由データより優位にして理由文を生成してもよい。この場合、第2理由データを商品を推奨する主理由情報とし、第1理由データを商品を推奨する副理由情報とする。ここで、優位とは、例えば、出力の順序、大きさ、時間、位置、範囲などが勝っていることをいってよい。
上記システムによれば、第1理由データおよび第2理由データを表示することで、ユーザは、第1理由データから、実際のレビューコメントのどの部分を推薦の根拠としているかを把握することができ、更に、第2理由データから、どのような入力内容(学習内容)を推薦の根拠としているかを把握することができる。このように、自身の嗜好に合った商品が推薦されていることが把握でき、当該商品の推薦を納得するようになるので、商品の推薦に基づく購入を後押しできるようになる。また、例えば、ユーザは、第1理由データおよび第2理由データの少なくとも一方を見て推薦理由が自分に合っていないと感じた場合、学習用データ(入力内容)を変更(調整)することで、より自分に合った推薦を受けることができるようになる。また、上記システムでは、第1理由データおよび第2理由データが、理由を示す文(意味のあるまとまり)として表示されることにも重要な意味を持ち、これにより、ユーザは、自身の嗜好に合った商品が推薦されていることが容易かつ正確に把握できるようになる。
本実施の形態では、文(文データ)を例に挙げて説明したが、文(文データ)、段落(段落データ)、文章(文章データ)など、意味、趣旨、主旨、概念、意義、要旨などの所定の関係を有するまとまり(ブロックデータ)に広く適用することができる。
〔データ分析システムが処理するデータ形式〕
本実施の形態において、「データ」は、コンピュータによって処理可能となる形式で表現された任意のデータであってよい。上記データは、例えば、少なくとも一部において構造定義が不完全な非構造化データであってよく、自然言語によって記述された文章を少なくとも一部に含む文書データ(例えば、電子メール(添付ファイル・ヘッダ情報を含む)、技術文書(例えば、学術論文、特許公報、製品仕様書、設計図など、技術的事項を説明する文書を広く含む)、プレゼンテーション資料、表計算資料、決算報告書、打ち合わせ資料、報告書、営業資料、契約書、組織図、事業計画書、企業分析情報、電子カルテ、ウェブページ、ブログ、ソーシャルネットワークサービスに投稿されたコメントなど)、音声データ(例えば、会話・音楽などを録音したデータ)、画像データ(例えば、複数の画素またはベクター情報から構成されるデータ)、映像データ(例えば、複数のフレーム画像から構成されるデータ)などを広く含む(これらの例に限定されない)。
例えば、文書データを分析する場合、上記システムは、学習用データとしての文書データに含まれる形態素を構成要素として抽出し、当該構成要素をそれぞれ評価し、評価対象データとしての文書データから抽出した構成要素に基づいて、当該文書データと所定事案との関連性を評価することができる。また、音声データを分析する場合、上記システムは、当該音声データ自体を分析の対象としてもよいし、音声認識により当該音声データを文書データに変換し、変換後の文書データを分析の対象としてもよい。前者の場合、上記システムは、例えば、音声データを所定の長さの部分音声に分割して構成要素とし、任意の音声分析手法(例えば、隠れマルコフモデル、カルマンフィルタなど)を用いて当該部分音声を識別することによって、当該音声データを分析できる。後者の場合、任意の音声認識アルゴリズム(例えば、隠れマルコフモデルを用いた認識方法など)を用いて音声を認識し、認識後のデータ(文書データ)に対して、前述した手順と同様の手順で分析できる。また、画像データを分析する場合、上記システムは、例えば、画像データを所定の大きさの部分画像に分割して構成要素とし、任意の画像認識手法(例えば、パターンマッチング、サポートベクターマシン、ニューラルネットワークなど)を用いて当該部分画像を識別することによって、当該画像データを分析できる。さらに、映像データを分析する場合、上記システムは、例えば、映像データに含まれる複数のフレーム画像を所定の大きさの部分画像にそれぞれ分割して構成要素とし、任意の画像認識手法(例えば、パターンマッチング、サポートベクターマシン、ニューラルネットワークなど)を用いて当該部分画像を識別することによって、当該映像データを分析できる。
〔ソフトウェア・ハードウェアによる実現例〕
上記システムの制御ブロックは、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、CPUを用いてソフトウェアによって実現してもよい。後者の場合、上記システムは、各機能を実現するソフトウェアであるプログラム(データ分析システムの制御プログラム)を実行するCPU、当該プログラムおよび各種データがコンピュータ(またはCPU)で読み取り可能に記録されたROM(Read Only Memory)または記憶装置(これらを「記録媒体」と称する。一時的記録媒体であってもよいし、非一時的記録媒体であってもよい。)、当該プログラムを展開するRAM(Random Access Memory)などを備えている。そして、コンピュータ(またはCPU)が上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記記録媒体としては、「一時的でない有形の媒体」、例えば、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムは、当該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。本発明は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。なお、上記プログラムは、任意のプログラミング言語によって実装可能である。また、上記プログラムを記録した任意の記録媒体も、本発明の範疇に入る。
〔アプリケーション例〕
上記システムは、例えば、ディスカバリー支援システム、フォレンジックシステム、電子メール監視システム、医療応用システム(例えば、ファーマコビジランス支援システム、治験効率化システム、医療リスクヘッジシステム、転倒予測(転倒防止)システム、予後予測システム、診断支援システムなど)、インターネット応用システム(例えば、スマートメールシステム、情報アグリゲーション(キュレーション)システム、ユーザ監視システム、ソーシャルメディア運営システムなど)、情報漏洩検知システム、プロジェクト評価システム、マーケティング支援システム、知財評価システム、不正取引監視システム、コールセンターエスカレーションシステム、信用調査システムなど、ビッグデータを分析する人工知能システム(データと所定事案との関連性を評価可能な任意のシステム)として実現され得る。なお、本発明のデータ分析システムが応用される分野によっては、当該分野に特有の事情を考慮して、例えば、データに前処理(例えば、当該データから重要箇所を抜き出し、当該重要箇所のみをデータ分析の対象とするなど)を施したり、データ分析の結果を表示する態様を変化させたりしてよい。こうした変形例が多様に存在し得ることは、当業者に理解されるところであり、すべての変形例が本発明の範疇に入る。
本発明は上述したそれぞれの実施の形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施の形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施の形態についても、本発明の技術的範囲に含まれる。さらに、各実施の形態にそれぞれ開示された技術的手段を組み合わせることにより、新しい技術的特徴を形成できる。
1……データ分析システム、2……サーバ装置、3……クライアント装置、4……データベース、5……ストレージシステム、6……管理計算機

Claims (12)

  1. 複数の学習用データおよび複数の評価対象データを、少なくとも一時的に記憶するメモリと、前記複数の学習用データに基づいて、前記複数の評価対象データをそれぞれ評価するコントローラとを備えたデータ分析システムであって、
    前記評価対象データは、分類情報が対応付けられていない未分類のデータであり、
    前記分類情報は、参照データとユーザの嗜好とが関係するか否かに基づいて、当該参照データを任意に分類する識別ラベルであり、
    前記学習用データは、前記ユーザによって前記分類情報が対応付けられた分類済みのデータであり、当該分類情報が対応付けられたことによって当該ユーザの嗜好に関する情報を含み、
    前記コントローラは、
    前記学習用データに基づいて、前記複数の評価対象データをそれぞれ評価し、
    前記複数の評価対象データを評価した結果に基づいて、前記複数の評価対象データから第1の情報を抽出し、
    前記第1の情報に含まれる特徴パターンに基づいて、前記学習用データから第2の情報を抽出し、
    前記ユーザの動向に関与する情報を前記第1の情報と前記第2の情報とから生成する
    データ分析システム。
  2. 前記コントローラは
    記参照データと前記分類情報との組み合わせを前記学習用データとし、
    前記学習用データから複数の構成要素を抽出し、前記複数の構成要素の夫々は、前記学習用データの少なくとも一部を構成するものであり、
    前記複数の構成要素の夫々が、前記組み合わせに寄与する度合いに基づいて、前記複数の構成要素の夫々に評価情報を設定し、
    前記設定された評価情報に基づいて、前記複数の評価対象データの夫々を評価する
    請求項1記載のデータ分析システム。
  3. 前記コントローラは、
    前記複数の評価対象データにおける評価の中で相対的に高評価の評価対象データを前記複数の評価対象データから選択し、
    前記選択した評価対象データを構成する複数の部分から、前記高評価に寄与する割合に基づいて特定部分を抽出し、前記特定部分を前記第1の情報とする
    請求項1又は2記載のデータ分析システム。
  4. 前記コントローラは、
    前記複数の評価対象データのうち最高評価の評価対象データを選択し、
    前記選択した評価対象データを構成する複数の部分から、前記最高評価に寄与する割合が最大の部分を前記特定部分とする
    請求項3記載のデータ分析システム。
  5. 前記コントローラは、
    前記学習用データに基づいて、前記複数の評価対象データの夫々を構成する複数の部分を夫々評価し、前記評価した部分の中で相対的に高評価の部分を前記第1の情報とする
    請求項1又は2記載のデータ分析システム。
  6. 前記コントローラは、
    前記評価した部分の中で最高評価の部分を前記第1の情報とする
    請求項5記載のデータ分析システム。
  7. 前記コントローラは、
    前記学習用データを構成する複数の部分のうち、前記特徴パターンを有する部分を前記第2の情報とする
    請求項1乃至6の何れか1項記載のデータ分析システム。
  8. 前記コントローラは、
    前記第1の情報から複数の構成要素を抽出し、
    前記抽出した複数の構成要素が前記第1の情報に分布する態様に基づいて、前記特徴パターンを判別する
    請求項1乃至7の何れか1項記載のデータ分析システム。
  9. 前記ユーザの動向は、所定の商品またはサービスの購入に関する動向であり、
    前記コントローラは、
    前記所定の商品またはサービスに関連するレビューコメントを前記学習用データとし、
    前記第1の情報を抽出した評価対象データに関連する商品をユーザに推奨し、
    前記第1の情報を前記商品を推奨する主理由情報とし、前記第2の情報を前記商品を推奨する副理由情報とし、前記主理由情報と前記副理由情報とを組み合わせて前記ユーザの動向に関与する情報として、前記ユーザに提示する
    請求項1乃至8の何れか1項記載のデータ分析システム。
  10. 複数の学習用データおよび複数の評価対象データを、少なくとも一時的に記憶するメモリと、前記複数の学習用データに基づいて、前記複数の評価対象データをそれぞれ評価するコントローラとを備えたデータ分析システムの制御方法であって、
    前記評価対象データは、分類情報が対応付けられていない未分類のデータであり、
    前記分類情報は、参照データとユーザの嗜好とが関係するか否かに基づいて、当該参照データを任意に分類する識別ラベルであり、
    前記学習用データは、前記ユーザによって前記分類情報が対応付けられた分類済みのデータであり、当該分類情報が対応付けられたことによって当該ユーザの嗜好に関する情報を含み、
    記コントローラが、
    前記学習用データに基づいて、前記複数の評価対象データをそれぞれ評価し、
    前記複数の評価対象データを評価した結果に基づいて、前記複数の評価対象データから第1の情報を抽出し、
    前記第1の情報に含まれる特徴パターンに基づいて、学習用データから第2の情報を抽出し、
    前記ユーザの動向に関与する情報を前記第1の情報と前記第2の情報とから生成する
    データ分析システムの制御方法。
  11. 複数の学習用データおよび複数の評価対象データを、少なくとも一時的に記憶するメモリと、前記複数の学習用データに基づいて、前記複数の評価対象データをそれぞれ評価するコントローラとを備えたコンピュータに実現させるプログラムであって、
    前記評価対象データは、分類情報が対応付けられていない未分類のデータであり、
    前記分類情報は、参照データとユーザの嗜好とが関係するか否かに基づいて、当該参照データを任意に分類する識別ラベルであり、
    前記学習用データは、前記ユーザによって前記分類情報が対応付けられた分類済みのデータであり、当該分類情報が対応付けられたことによって当該ユーザの嗜好に関する情報を含み、
    前記学習用データに基づいて、前記複数の評価対象データをそれぞれ評価し、
    前記複数の評価対象データを評価した結果に基づいて、前記複数の評価対象データから第1の情報を抽出し、
    前記第1の情報に含まれる特徴パターンに基づいて、学習用データから第2の情報を抽出し、
    前記ユーザの動向に関与する情報を前記第1の情報と前記第2の情報とから生成する
    ことを前記コンピュータに実現させるためのプログラム。
  12. 請求項11記載のプログラムを記録したコンピュータ読み取り可能な非一時的記録媒体。
JP2016206390A 2016-10-20 2016-10-20 データ分析システム、その制御方法、プログラム、及び、記録媒体 Active JP6178480B1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2016206390A JP6178480B1 (ja) 2016-10-20 2016-10-20 データ分析システム、その制御方法、プログラム、及び、記録媒体
US15/787,157 US11232325B2 (en) 2016-10-20 2017-10-18 Data analysis system, method for controlling data analysis system, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016206390A JP6178480B1 (ja) 2016-10-20 2016-10-20 データ分析システム、その制御方法、プログラム、及び、記録媒体

Publications (2)

Publication Number Publication Date
JP6178480B1 true JP6178480B1 (ja) 2017-08-09
JP2018067215A JP2018067215A (ja) 2018-04-26

Family

ID=59559151

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016206390A Active JP6178480B1 (ja) 2016-10-20 2016-10-20 データ分析システム、その制御方法、プログラム、及び、記録媒体

Country Status (2)

Country Link
US (1) US11232325B2 (ja)
JP (1) JP6178480B1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7172612B2 (ja) * 2019-01-11 2022-11-16 富士通株式会社 データ拡張プログラム、データ拡張方法およびデータ拡張装置
CN110135690A (zh) * 2019-04-12 2019-08-16 深圳壹账通智能科技有限公司 产品评论数据分析方法、装置、计算机设备和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010118086A (ja) * 2010-03-04 2010-05-27 Sony Corp 情報処理装置および方法、プログラム、並びに記録媒体
JP2014032532A (ja) * 2012-08-03 2014-02-20 Advanced Media Inc オペレータ支援システム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5854923A (en) * 1994-06-21 1998-12-29 International Business Machines Corp. Facility for the intelligent selection of information objects (persona)
US20060106670A1 (en) * 2004-11-15 2006-05-18 Simin Cai System and method for interactively and progressively determining customer satisfaction within a networked community
US8560398B1 (en) * 2007-03-29 2013-10-15 Amazon Technologies, Inc. Method and system for providing item recommendations
JP5096411B2 (ja) 2009-05-22 2012-12-12 ヤフー株式会社 ネットショッピング管理装置
US20110295612A1 (en) * 2010-05-28 2011-12-01 Thierry Donneau-Golencer Method and apparatus for user modelization
US8671098B2 (en) * 2011-09-14 2014-03-11 Microsoft Corporation Automatic generation of digital composite product reviews
US10096043B2 (en) * 2012-01-23 2018-10-09 Visa International Service Association Systems and methods to formulate offers via mobile devices and transaction data
JP5955286B2 (ja) * 2013-08-28 2016-07-20 ヤフー株式会社 評価算出装置、評価算出方法及び評価算出プログラム
US10346881B2 (en) * 2014-09-19 2019-07-09 International Business Machines Corporation Advertising within social networks
US9710456B1 (en) * 2014-11-07 2017-07-18 Google Inc. Analyzing user reviews to determine entity attributes
US10453099B2 (en) * 2015-12-11 2019-10-22 Fuji Xerox Co., Ltd. Behavior prediction on social media using neural networks

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010118086A (ja) * 2010-03-04 2010-05-27 Sony Corp 情報処理装置および方法、プログラム、並びに記録媒体
JP2014032532A (ja) * 2012-08-03 2014-02-20 Advanced Media Inc オペレータ支援システム

Also Published As

Publication number Publication date
JP2018067215A (ja) 2018-04-26
US11232325B2 (en) 2022-01-25
US20180114093A1 (en) 2018-04-26

Similar Documents

Publication Publication Date Title
JP6182279B2 (ja) データ分析システム、データ分析方法、データ分析プログラム、および、記録媒体
US10496752B1 (en) Consumer insights analysis using word embeddings
JP5885875B1 (ja) データ分析システム、データ分析方法、プログラム、および、記録媒体
US10685183B1 (en) Consumer insights analysis using word embeddings
US11182806B1 (en) Consumer insights analysis by identifying a similarity in public sentiments for a pair of entities
US11803872B2 (en) Creating meta-descriptors of marketing messages to facilitate in delivery performance analysis, delivery performance prediction and offer selection
CN114648392B (zh) 基于用户画像的产品推荐方法、装置、电子设备及介质
Syed Applying sentiment and emotion analysis on brand tweets for digital marketing
JP7280705B2 (ja) 機械学習装置、プログラム及び機械学習方法
JP5933863B1 (ja) データ分析システム、制御方法、制御プログラム、および記録媒体
WO2016189605A1 (ja) データ分析に係るシステム、制御方法、制御プログラム、および、その記録媒体
Morley Image Processing Computational Algorithms, Movement and Behavior Tracking Tools, and Virtual Retail Algorithms in a Real-Time Interoperable Decentralized Metaverse.
JP6178480B1 (ja) データ分析システム、その制御方法、プログラム、及び、記録媒体
JP5942052B1 (ja) データ分析システム、データ分析方法、およびデータ分析プログラム
JP2017201543A (ja) データ分析システム、データ分析方法、データ分析プログラム、および、記録媒体
JP6026036B1 (ja) データ分析システム、その制御方法、プログラム、及び、記録媒体
JP6509391B1 (ja) 計算機システム
JP5946949B1 (ja) データ分析システム、その制御方法、プログラム、および、記録媒体
JP7555274B2 (ja) 提案装置、提案方法及びプログラム
WO2023218697A1 (ja) 倫理性診断装置、及び倫理性診断方法
Kumar et al. Framework On Text And Predictive Analytics
Morley Movement and Behavior Tracking Tools, and Virtual Retail Algorithms in a Real-Time Interoperable Decentralized Metaverse
Ganga et al. Sentimental Analysis on Cosmetics using Machine Learning
Sharifpour et al. Fake Review Detection Using Rating-Sentiment Inconsistency
Jabeen Decoding Consumer Sentiments: Advanced NLP Techniques for Analyzing Smartphone Reviews

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170711

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170713

R150 Certificate of patent or registration of utility model

Ref document number: 6178480

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250