[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP5695966B2 - 興味推定装置、方法及びプログラム - Google Patents

興味推定装置、方法及びプログラム Download PDF

Info

Publication number
JP5695966B2
JP5695966B2 JP2011105602A JP2011105602A JP5695966B2 JP 5695966 B2 JP5695966 B2 JP 5695966B2 JP 2011105602 A JP2011105602 A JP 2011105602A JP 2011105602 A JP2011105602 A JP 2011105602A JP 5695966 B2 JP5695966 B2 JP 5695966B2
Authority
JP
Japan
Prior art keywords
document
browsing
interest
time
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011105602A
Other languages
English (en)
Other versions
JP2012238114A (ja
Inventor
妙 佐藤
妙 佐藤
峰樹 市森
峰樹 市森
武藤 伸洋
伸洋 武藤
手塚 博久
博久 手塚
伊藤 浩二
浩二 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2011105602A priority Critical patent/JP5695966B2/ja
Publication of JP2012238114A publication Critical patent/JP2012238114A/ja
Application granted granted Critical
Publication of JP5695966B2 publication Critical patent/JP5695966B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

この発明は、例えばWeb上に掲載された文書をユーザが閲覧したときの操作履歴をもとに当該ユーザの文書に対する興味を推定する興味推定装置、方法及びプログラムに関する。
近年、パーソナル・コンピュータやスマートホン、電子書籍端末等の端末を用いて、Web上に掲載された文書を閲覧することが頻繁に行われるようになっている。そして、このような文書の閲覧操作をもとに文書閲覧者の興味を推定して、この推定した興味に基づいて文書を推薦する、文書推薦サービスが提案されている(例えば非特許文献1を参照)。
梅村祥之他、「文章閲覧における読者の操作行動からの興味の推定」、ヒューマンインターフェース学会論文誌、Vol.8, No.3, 2006, p115-124
ところが、非特許文献1に記載された文書推薦サービスを実現するシステムには以下のような解決すべき課題があった。
すなわち、非特許文献1に記載されたシステムでは、文書閲覧操作から文書閲覧者の興味を推定する手法として、当該文書に対する閲覧時間を考慮して興味の有無を推定する手法を提案している。この手法は、文書閲覧者が当該文書を閲覧するために必要な標準閲覧時間を全文書閲覧者に対し共通に予め定めておき、文書閲覧者による文書の閲覧時間の実測値を上記標準閲覧時間と比較して、標準閲覧時間より実測閲覧時間が長い場合に文書閲覧者は当該文書に対して興味を持つと推定するものとなっている。このため、閲覧文書に対する文書閲覧者の興味が、“あり”、“なし”の2値で判定される。
しかしながら、閲覧文書に対し興味“あり”と推定した場合でも、その推定結果にはより興味があるものとわずかに興味があるものとが混在していると考えられる。興味の度合が異なる文書について、同等の興味度合としてしか推定されないと、文書閲覧者の閲覧した複数の文書の興味推定結果を使用して文書推薦サービスを行う場合に、正確な推薦を行うことが困難となる。
また、標準閲覧時間は全文書閲覧者に共通の時間として設定される。ところが、若年者と高齢者が同じ文書を読む場合、一般に若年者の方が高齢者よりも文書を読解する速度が速いと考えられ、また同じ年齢層の文書閲覧者を比較した場合であっても、文書を読解する速度が異なることが考えられる。このため、全ての文書閲覧者に対し共通に設定した標準閲覧時間を用いて文書に対する興味を推定すると、文書閲覧者の文書読解速度の違いによって誤った推定結果が得られてしまうことがある。例えば、閲覧者がある文書を長時間かけて閲覧した場合に、その理由が当該文書に特に興味があったからではなく単に読解速度が遅かったからであっても、誤って興味があると推定されてしまう。
この発明は上記事情に着目してなされたもので、その目的とするところは、各文書に対する興味の度合いを多段階に推定できるようにすると共に、各文書閲覧者の読解速度を反映した興味推定を可能にし、これにより興味推定精度の向上を図った興味推定装置、方法及びプログラムを提供することにある。
上記目的を達成するためにこの発明の一つの観点は、閲覧者が文書データベースに記憶された文書を閲覧するごとに、先ずその閲覧履歴を表す情報をもとに当該文書の単位情報量当たりの閲覧時間を算出して、この算出された閲覧時間を前記文書の識別情報と関連付けて蓄積し、この蓄積された情報をもとに、閲覧時間と当該閲覧時間に該当する文書数との関係を統計的に表す第1の情報を生成する。そして、この生成された第1の情報の文書数を時間で積分し、その積分値をその最大値により正規化し、この正規化された積分値と前記閲覧時間との関係を表す情報を興味スコアと閲覧時間との関係を表す第2の情報として第2の記憶部に記憶させ、この記憶された第2の情報をもとに、上記閲覧された文書の閲覧時間に対応する興味スコアを特定し、この特定された興味スコアをもとに上記文書データベースに記憶されている文書の見出しを上記閲覧者が興味を持つ度合いが高い順に並び替え、この並び替えられた見出しを上記閲覧者に提示するようにしたものである。
したがって、1個の閾値を用いて単に興味の有無を判定する場合に比べ、各文書に対する閲覧者の興味の度合を多段階に推定することが可能となる。また、閲覧者ごとに閲覧時間と興味スコアとの関係を表す情報を生成するようにしているので、閲覧者ごとにその読解速度を反映した興味推定を行うことが可能となり、これにより興味推定精度を高めることができる。さらに、閲覧文書の単位情報量当たりの閲覧時間を算出し、その値を正規化された閲覧時間として興味推定処理に用いるようにしている。このため、文書の長短による閲覧時間の違いを補正して、正確なパラメータにより興味推定を行うことができる。
また、文書数を時間で積分した値がその最大値により正規化され、この正規化された積分値により興味スコアが表される。このため、閲覧文書数が増加した場合でも、興味の度合いに反した興味スコアの上昇を回避することができる。
さらに、特定された興味スコアをもとに文書データベースに記憶されている文書の見出しが閲覧者が興味を持つ度合いが高い順に並び替えられ、この並び替えられた見出しが閲覧者に提示される。このため、閲覧者は自身が興味を持つ文書群を短時間に効率良く選択して閲覧することが可能となる。
すなわちこの発明によれば、各文書に対する興味の度合いを多段階に推定できるようにすると共に、各文書閲覧者の読解速度を反映した興味推定を可能にし、これにより興味推定精度の向上を図った興味推定装置、方法及びプログラムを提供することができる。
この発明の一実施形態に係る興味推定装置を備えたシステムの概略構成図。 図1に示したシステムのクライアント端末の機能構成を示すブロック図。 図1に示したシステムにおいて興味推定装置として使用される推定サーバの機能構成を示すブロック図。 図2に示したクライアント端末及び図3に示した推定サーバによる処理手順と処理内容を示すフローチャート。 図4に示した推定サーバの処理手順のうち興味推定処理の手順と処理内容を示すフローチャート。 興味推定対象文書データベースに記憶された情報の一例を示す図。 閲覧時間と該当文書数との関係の一例を示す図。 閲覧時間と興味スコアとの関係の一例を示す図。 興味推定対象文書データベースに記憶された情報の他の例を示す図。 閲覧時間と該当文書数との関係の他の例を示す図。 閲覧時間と興味スコアとの関係の他の例を示す図。
以下、図面を参照してこの発明に係わる実施形態を説明する。
(構成)
図1は、この発明の一実施形態に係る興味推定装置を備えたシステムの概略構成図である。このシステムは、各々ユーザが使用する複数のクライアント端末MT1〜MTnを通信ネットワークNWを介して興味推定装置としての推定サーバSV1に接続可能とすると共に、推定サーバSV1に対し上記通信ネットワークNWを介してレコメンドサーバSV2を接続可能としたものである。
通信ネットワークNWは、アナログ電話網や光ファイバ、CATV(Cable Television)、有線LAN(Local Area Network)等の有線網、携帯電話やホットスポット(登録商標)、WiMAX(登録商標)、無線LAN等の無線網により構成される。
クライアント端末MT1〜MTnは、例えば携帯電話機やスマートホン、PDA(Personal Digital Assistant)、タブレット型端末、ノート型のパーソナル・コンピュータ等の携帯端末からなり、以下のように構成される。図2はその機能構成を示すブロック図である。
すなわち、クライアント端末MT1〜MTnは、入出力ユニット1と、制御ユニット2と、無線通信ユニット3を備える。入出力ユニット1は、入力デバイス11と、表示デバイス12を有する。入力デバイス11は、キーボードやマウス、タッチパネル式の入力デバイスを用いたもので、閲覧文書の選択操作及び閲覧終了操作を行うために使用される。表示デバイス12は、例えば液晶又は有機ELを用いたもので、閲覧対象の文書を選択するためのメニュー画面やユーザが選択した文書ファイルを表示するために使用される。無線通信ユニット3は、制御ユニット2の制御の下で推定サーバSV1との間で無線通信を行うもので、各種要求情報や文書ファイルの送受信を行うために使用される。
制御ユニット2は、中央処理ユニット(CPU)、プログラムメモリ及びデータメモリ備えるもので、この実施形態を実施するために必要な制御機能として、閲覧要求送信制御部21、文書受信制御部22と、文書表示制御部23と、表示終了要求送信制御部24と、表示終了情報受信制御部25と、表示終了制御部26を有している。なお、これらの制御部は何れもプログラムメモリに格納されたアプリケーション・プログラムを上記CPUに実行させることにより実現される。
閲覧要求送信制御部21は、入力デバイス11においてユーザが閲覧対象の文書を選択してその閲覧要求操作を行った場合に、当該選択された文書の閲覧要求を生成してこの閲覧要求を無線通信ユニット3から推定サーバSV1へ送信する処理を行う。文書閲覧要求には、閲覧者のユーザIDと、選択された文書のIDが含まれる。文書受信制御部22は、上記文書閲覧要求の送信に対し推定サーバSV1から該当する文書データが送られた場合に、この文書データを無線通信ユニット3を介して受信する処理を行う。文書表示制御部23は、上記受信された文書データを図示しないデータメモリに保存した後、表示デバイス12に表示させる処理を行う。
表示終了要求送信制御部24は、上記受信された文書データの表示中に、入力デバイス11においてユーザが閲覧終了操作を行うか又は次の文書の閲覧を要求する操作を行った場合に、表示終了要求を生成してこの要求を無線通信ユニット3から推定サーバSV1へ送信する処理を行う。表示終了情報受信制御部25は、上記表示終了要求の送信に対し推定サーバSV1から表示終了画面を含む表示終了情報が送られた場合に、この表示終了情報を無線通信ユニット3を介して受信する処理を行う。表示終了制御部26は、上記受信された表示終了情報に応じて文書データの表示動作を終了させると共に、表示デバイス12に表示終了画面を表示させる処理を行う。
推定サーバSV1は、例えば通信事業者や新聞社等のサービス事業者が運用するサーバコンピュータからなり、以下のように構成される。図3はその機能構成を示すブロック図である。
すなわち推定サーバSV1は、通信ユニット4と、制御ユニット5と、記憶ユニット6を備えている。通信ユニット4は、制御ユニット5の制御の下で、通信ネットワークNWを介してクライアント端末MT1〜MTn及びレコメンドサーバSV2との間で情報の送受信を行う。
記憶ユニット6は、記憶媒体としてハードディスク又はフラッシュメモリを用いたもので、この実施形態を実施するために必要な記憶部として、文書データベース61と、文書閲覧履歴データベース62と、興味推定対象文書データベース63と、興味スコアデータベース64を備えている。
文書データベース61には、ニュースや論文、小説、エッセイ等の文書情報が予め記憶されている。文書閲覧履歴データベース62は、ユーザごとに、当該ユーザが閲覧した文書の識別情報(文書ID)と、当該文書の文字数を表す情報と、閲覧開始時刻を表す情報を含む文書閲覧履歴情報を作成し、この作成した文書閲覧履歴情報をユーザの識別情報(ユーザID)に関連付けて記憶するために用いられる。
興味推定対象文書データベース63は、ユーザごとに、当該ユーザが閲覧した文書の文書IDと、当該文書の閲覧時間を正規化した情報を、ユーザIDに関連付けて記憶するために使用される。興味スコアデータベース64は、ユーザごとに、正規化された閲覧時間と興味スコアとの関係を表す情報を記憶するために用いられる。
制御ユニット5は、中央処理ユニット(CPU)、プログラムメモリ及びデータメモリ備えるもので、この実施形態を実施するために必要な制御機能として、文書閲覧要求受信制御部50と、文書送信制御部51と、文書閲覧情報記憶制御部52と、表示終了要求受信制御部53と、表示終了情報送信制御部54と、閲覧時間計算部55と、ノイズ除去部56と、興味推定対象情報記憶制御部57と、興味スコア更新制御部58と、興味スコア出力制御部59を備えている。なお、これらの制御機能50〜59は何れも、プログラムメモリに格納されたアプリケーション・プログラムをCPUに実行させることにより実現される。
文書閲覧要求受信制御部50は、クライアント端末MT1〜MTnから送信された文書閲覧要求が通信ユニット4で受信された場合に、この受信された文書閲覧要求に含まれる選択文書のIDをもとに記憶ユニット61の文書データベース61を検索する処理を行う。文書送信制御部51は、上記検索処理により文書データベース61から読み出された文書データを、上記受信された文書閲覧要求に含まれるユーザIDに基づいて要求元のクライアント端末へ通信ユニット4から送信する処理を行う。
文書閲覧情報記憶制御部52は、上記文書送信制御部51により送信された文書のID及び文字数を表す情報と、当該文書データの送信時刻(閲覧開始時刻)を表す情報を、文書閲覧履歴情報として上記閲覧要求元のユーザIDに対応付けて文書閲覧履歴データベース62に記憶させる処理を行う。
表示終了要求受信制御部53は、クライアント端末MT1〜MTnから送信された閲覧(表示)終了要求を通信ユニット4を介して受信し、この受信された終了要求に応じて閲覧(表示)終了画面を含む文書表示終了情報を生成する。表示終了情報送信制御部54は、生成された文書表示終了情報を要求元のクライアント端末へ送信する処理を行う。
閲覧時間計算部55は以下の処理を行う。
(1) 上記表示終了情報送信制御部54から上記送信された文書表示終了情報に含まれる送り先のユーザID及び文書IDを受け取り、これらのIDをもとに文書閲覧履歴データベース62から該当するユーザの文書閲覧履歴、つまり当該閲覧文書の閲覧範囲に含まれる文字数を表す情報と閲覧開始時刻を表す情報を読込む処理。
(2) 上記表示終了情報送信制御部54から、上記文書表示終了情報の送信時刻を当該ユーザによる文書の閲覧終了時刻として受け取る処理。
(3) 上記(1) により文書閲覧履歴データベース62から読込んだ閲覧文書の文字数及び閲覧開始時刻と、(2) により受け取った閲覧終了時刻とをもとに、1文字当たりの閲覧時間を計算し、その計算結果を正規化された閲覧時間とする処理。
ノイズ除去部56は、電車の乗り換えや人との会話等の影響により閲覧時間が極端に長くなったり、また途中で閲覧が中止されることで閲覧時間が極端に短くなった場合に、このときの文書を興味推定対象から除外するもので、全文書閲覧者共通の閾値TH1,TH2を設定し、上記閲覧時間計算部55により算出された正規化閲覧時間を閾値TH1,TH2と比較する。そして、正規化閲覧時間が閾値TH1より小さいか或いは閾値TH2より大きい場合に、当該文書を興味推定対象外として除外する処理を行う。
興味推定対象情報記憶制御部57は、上記ノイズ除去部56により除外されずに興味推定対象として残った文書について、その文書IDと上記閲覧時間計算部55により算出された正規化閲覧時間情報を、閲覧者のユーザIDと関連付けて記憶ユニット6内の興味推定対象文書データベース63に記憶させる処理を行う。
興味スコア更新制御部58は以下の処理を行う。
(1) 上記興味推定対象文書データベース63から、ユーザごとに当該ユーザが閲覧したすべての文書の文書IDとその正規化閲覧時間情報を読込み、この読込んだ正規化済閲覧時間と閲覧文書数との関係を表す値を、横軸を時間、縦軸を文書数として表記する処理。
(2) そして、上記正規化閲覧時間と閲覧文書数との関係を表す値を時間で積分し、その積分結果の最大値を1として正規化する処理。
(3) 上記正規化されたデータを最新の閲覧時間と興味スコアとの関係を表す情報として、記憶ユニット6内の興味スコアデータベース64に上書き保存させる処理。
興味スコア出力制御部59は、上記興味スコア更新制御部58からユーザがいま閲覧した文書の正規化閲覧時間情報を受け取り、この受け取った当該閲覧文書の正規化閲覧時間情報をもとに、当該正規化閲覧時間に対応する興味スコアの値を興味スコアデータベース64から読込む。そして、この読込んだ興味スコアの値を、送信先として予め登録されているレコメンドサーバSV2へ通信ユニット4から送信させる処理を行う。
(動作)
ここでは、クライアント端末MT1において、文書閲覧者であるユーザが、ニュースの見出しが並ぶトップ画面の中から読みたい記事を選択し閲覧する場合を例にとって説明する。図4はこのときのクライアント端末MT1及び推定サーバSV1による処理手順と処理内容を示すフローチャートである。
(1)文書の閲覧
クライアント端末MT1の制御ユニット2は、例えばブラウザ機能により表示デバイス12にトップ画面の一覧見出しが表示された状態で、ステップS11により文書閲覧のための入力操作を監視している。この状態で、ユーザが入力デバイス11をタッチ操作することにより、上記表示された見出しの中から読みたい記事、例えば文書Aを選択したとする。そうすると制御ユニット2は、閲覧要求送信制御部21の制御の下、ステップS12において上記タッチ操作により選択された記事本文の閲覧を要求するための文書閲覧要求を生成し、この生成された文書閲覧要求を無線通信ユニット3から推定サーバSV1へ送信する。このとき文書閲覧要求には、ユーザID及び上記選択された文書のIDが挿入される。
これに対し推定サーバSV1では、制御ユニット5がステップS13により文書閲覧要求の受信を監視している。この状態で、クライアント端末MT1から送信された文書閲覧要求が通信ユニット4で受信されると、制御ユニット5は文書閲覧要求受信制御部50の制御の下で、ステップS14により、上記受信された文書閲覧要求に含まれる選択文書のIDをもとに記憶ユニット6の文書データベース61を検索する。続いて文書送信制御部51の制御の下、上記検索により文書データベース61から読み出された該当する記事本文のデータを、ステップS15により通信ユニット4から要求元のクライアント端末MT1に向け送信する。
クライアント端末MT1では、制御ユニット2が文書受信制御部22の制御の下で、ステップS16により上記推定サーバSV1から送られた記事本文のデータを無線通信ユニット3により受信する。そして、文書表示制御部23の制御の下で、上記受信された記事本文のデータをステップS17により表示デバイス12に表示させる。なお、記事本文が長く、クライアント端末MT1の画面に全文が一覧表示されない場合には、ユーザの縦スクロール操作によって上記記事本文はスクロール表示される。
上記記事本文の閲覧を終了し、ユーザが入力デバイス11においてニュースの見出し一覧画面に戻るための操作を行ったとする。この場合制御ユニット2は、当該操作をステップS18で検出する。そして、表示終了要求送信制御部24の制御の下で、ステップS19により表示終了要求を生成し、この表示終了要求を無線通信ユニット3から推定サーバSV1へ送信する。
これに対し推定サーバSV1では、制御ユニット5がステップS20で表示終了要求の受信を監視している。この状態で、通信ユニット4で表示終了要求が受信されると、表示終了要求受信制御部53の制御の下で、この受信された終了要求に含まれるユーザID及び文書IDをもとに文書表示終了情報を生成する。そして、この生成した文書表示終了情報を通信ユニット4から要求元のクライアント端末MT1へ返送する。
クライアント端末MT1では、制御ユニット1が表示終了情報受信制御部25の制御の下で上記文書表示終了情報を受信する。そして、表示終了制御部26の制御の下で、ステップS22により、上記受信された表示終了情報に応じて表示デバイス12に表示終了画面を表示させる。
かくして、クライアント端末MT1のユーザは、任意に選択したニュース記事Aを閲覧することができる。
(2)文書閲覧履歴の管理
以上述べた文書の閲覧対応処理中に推定サーバSV1では、制御ユニット5がステップS10により文書閲覧情報記憶制御部52を起動し、その制御の下で、上記文書送信制御部51により送信された文書データを識別する文書ID及び文字数を表す情報を文書データベース61から読み出す。また、図示しない時計回路から、上記文書データの送信時刻を閲覧開始時刻として取得する。そして、上記読み出された文書ID及び閲覧範囲に含まれる文字数を表す情報と、上記取得された閲覧開始時刻を表す情報を含む文書閲覧履歴情報を生成し、この文書閲覧履歴情報を上記閲覧要求元のユーザIDに対応付けて文書閲覧履歴データベース62に記憶させる。
したがって、文書閲覧履歴データベース62では、各ユーザの文書閲覧履歴がユーザごとに管理される。
(3)ユーザごとの文書に対する興味の推定
ユーザによる1個の文書の閲覧が終了すると、推定サーバSV1では制御ユニット5が閲覧時間計算部55、ノイズ除去部56、興味推定対象情報記憶制御部57及び興味スコア更新制御部58の制御の下で、以下のようにユーザごとの文書に対する興味を推定する処理を実行する。図5はその処理手順と処理内容を示すフローチャートである。
(3−1)正規化閲覧時間の計算
制御ユニット5は、先ず閲覧時間計算部55の制御の下で、ステップS23により文書閲覧里履歴データベース62から、いま閲覧が終了した文書Aの文書閲覧履歴情報を読込む。この文書閲覧履歴情報には、文書のIDと、文字数を表す情報と、当該文書データの閲覧開始時刻を表す情報が含まれている。またそれと共に、上記表示終了情報送信制御部54から、上記文書表示終了情報の送信時刻を当該ユーザによる文書の閲覧終了時刻として取得する。
続いて、図5のステップS31において、上記文書閲覧履歴データベース62から読込んだ閲覧文書Aのうち閲覧範囲に含まれる文字数及び閲覧開始時刻と、上記取得した閲覧終了時刻とをもとに、ユーザが閲覧した文書Aの1文字当たりの閲覧時間を計算し、この計算された値を正規化された閲覧時間とする。この正規化閲覧時間の計算は下式により行われる。
正規化閲覧時間=(閲覧終了時刻−閲覧開始時刻)/閲覧範囲に含まれる文字数
(3−2)ノイズの除去
制御ユニット5は、次にノイズ除去部56の制御の下で、上記閲覧時間計算部55により算出された正規化閲覧時間を予め設定しておいた閾値TH1,TH2とステップS32で比較する。そして、正規化閲覧時間が閾値TH1以下か或いは閾値TH2以上の場合には、当該文書を興味推定対象外として除外する。これに対し、上記条件を満たす場合には当該文書Aを興味推定対象文書とし、ステップS33により興味推定対象情報記憶制御部57を起動して、上記文書Aの文書IDと正規化閲覧時間をユーザIDと関連付けて興味推定対象文書データベース63に格納する。
例えば、いま閾値がTH1=0.2秒、TH2=12秒に設定され、上記算出された正規化済閲覧時間が3.0秒だったとする。この場合には、TH1=0.2≦ 3.0≦ 12=TH2であるので当該文書Aは興味推定対象と判定され、当該文書Aの文書IDと正規化閲覧時間がユーザIDに関連付けられて興味推定対象文書データベース63に格納される。図6はこのときの格納結果を示すものである。
これに対し、正規化閲覧時間が12秒以上だった場合には、当該文書Aの閲覧時間には電車の乗り換えや人との会話等による中断時間が含まれている可能性があるため、このときの文書Aは興味推定対象外として除外される。また、正規化閲覧時間が0.2秒以下だった場合にも、何らかの事情によりユーザが記事を最後まで読まずに途中で終了した可能性があるため、このときの文書Aは興味推定対象外として除外される。
(3−3)興味スコアの計算
制御ユニット5は、続いて興味スコア更新制御部58を起動し、この興味スコア更新制御部58の制御の下で以下のように文書に対する興味スコアの更新処理を行う。
すなわち、興味スコア更新制御部58は、先ずステップS34において上記文書閲覧管理データベース63から“文書Aの正規化閲覧時間=3.0秒”を読込み、この読込まれた正規化閲覧時間と該当文書数との関係を表すデータを生成する。図7はこの正規化閲覧時間と該当する文書数との関係を表記した図である。
興味スコア更新制御部58は、次にステップS35において、上記生成された正規化閲覧時間と該当する文書数との関係を表すデータを時間で積分し、その積分結果に対し最大値が“1”となるようにステップS36により正規化する。そしてステップS37において、上記正規化された積分データを、ユーザの正規化閲覧時間と興味スコアとの関係を示す情報として興味スコアデータベース64に格納する。
図8は、この興味スコアデータベース64に格納された正規化閲覧時間と興味スコアとの関係を示す情報の一例を示すものである。図8に示すように、1個の文書Aの閲覧を終了した段階でのクライアント端末MT1のユーザの文書に対する興味スコアは、正規化閲覧時間が“3秒”未満では“興味スコア=0”、正規化閲覧時間が“3秒”以上では“興味スコア=1”となる。
制御ユニット5は、最後にステップS38により興味スコア出力制御部59を起動する。そして、この興味スコア出力制御部59の制御の下で、出力先として予め記憶されたレコメンドサーバSV2に向けて、上記算出された興味スコアを通信ユニット4から送信する。例えば、上記したように文書Aの閲覧が終了した段階では、正規化閲覧時間は“3.0”であるため、クライアント端末MT1のユーザの文書に対する興味スコアの計算結果として、“興味スコア=1”がレコメンドサーバSV2に送られる。
(3−4)興味スコアの更新
クライアント端末MT1のユーザが、上記文書Aの閲覧を終了した後、新たに文書Bを閲覧したとする。この場合、推定サーバSV1の制御ユニット5は、先に述べた文書Aの場合と同様に、閲覧時間計算部55により、文書閲覧履歴データベース62から読込んだ閲覧文書Aの閲覧範囲に含まれる文字数及び閲覧開始時刻と、上記取得した閲覧終了時刻とをもとに、ユーザが閲覧した文書Bの1文字当たりの閲覧時間を計算する。計算された正規化閲覧時間をここでは例えば5.8秒とする。
またそれと共に制御ユニット5は、ノイズ除去部56の制御の下で、上記閲覧時間計算部55により算出された正規化閲覧時間=5.8秒を閾値TH1,TH2と比較する。そして、当該条件を満たす場合には当該文書Bを興味推定対象文書とし、興味推定対象情報記憶制御部57の制御の下で上記新たな閲覧文書Bの文書IDと正規化閲覧時間=5.8秒をユーザIDと関連付けて文書閲覧管理データベース63に追加する。図9はこのときの格納結果を示すものである。
制御ユニット5は、続いて興味スコア更新制御部58の制御の下で、先ず上記文書閲覧管理データベース63から“文書Aの正規化閲覧時間=3.0秒”と、“文書Bの正規化閲覧時間=5.8秒”を読込み、この読込まれた正規化閲覧時間と該当文書数との関係を表すデータを更新する。図10はこの更新後の正規化閲覧時間と該当する文書数との関係を表記した図である。
興味スコア更新制御部58は、次に上記生成された正規化閲覧時間と該当する文書数との関係を表すデータを時間で積分し、その積分結果に対し最大値が“1”となるように正規化する。そして、上記正規化された積分データを、ユーザの正規化閲覧時間と興味スコアとの関係を示す新たな情報として興味スコアデータベース64に上書き保存する。
図11は、この興味スコアデータベース64に格納された更新後の正規化閲覧時間と興味スコアとの関係を示す情報を示すものである。すなわち、この場合には、正規化閲覧時間が3秒未満では興味スコアは“0”、正規化閲覧時間が3秒以上5.8秒未満では興味スコアは“0.5”、正規化閲覧時間が5.8秒以上の場合には興味スコアは“1”となる。
制御ユニット5は、興味スコア出力制御部59の制御の下で、上記興味スコアデータベース64に格納された情報を参照して、上記新たに閲覧された文書Bの興味スコアを取得する。この結果、いま新たに閲覧された文書Bの正規化閲覧時間は“5.8秒であるため、クライアント端末MT1のユーザの文書に対する興味スコアの計算結果として、“興味スコア=1”が取得され、レコメンドサーバSV2に送られる。
以後同様に、ユーザが新たな文書を閲覧するごとに、その正規化閲覧時間をもとに当該ユーザの正規化閲覧時間と該当文書数との関係を表すデータを更新され、さらにこのデータをもとに正規化閲覧時間と興味スコアとの関係を示す情報が更新される。そして、この更新後の関係を示す情報を参照して、ユーザが新たに閲覧した文書の興味スコアが取得され、この興味スコアがレコメンドサーバSV2に送られる。
したがって、レコメンドサーバSV2は、上記推定サーバSV1から送られた興味スコアに基づいて、クライアント端末MT1のユーザに提供すべき文書を判断する。この判断処理は、例えば既存の協調フィルタリング等の情報推薦技術を使用することにより行える。そして、この判断結果に基づいて、クライアント端末MT1のユーザに対し当該ユーザが興味を持つ文書を配信することが可能となる。
なお、以上の説明では興味スコアの情報をレコメンドサーバSV2へ送信してレコメンドサービスに利用するようにしたが、上記興味スコアの情報をもとに既存技術を使用して、文書データベース61に蓄積されている文書の見出しを当該ユーザが興味を持つ度合いが高い順に並び替え、この並び替えられた見出しをクライアント端末MT1に送るようにしてもよい。このようにすると、ユーザは自身が興味を持つ文書群を短時間に効率良く選択して閲覧することが可能となる。
以上詳述したようにこの実施形態では、ユーザが文書を閲覧するごとに、当該閲覧文書の1文字当たりの閲覧時間を正規化閲覧時間として計算してこの正規化閲覧時間と該当する閲覧文書数との関係を表すデータを作成し、この関係データを時間で積分したのち正規化することにより、ユーザごとの正規化閲覧時間と興味スコアとの関係を表す情報を更新する。この更新された正規化閲覧時間と興味スコアとの関係を表す情報を参照することで、ユーザが閲覧した文書に対するユーザの興味の度合いを示すスコアを推定し、出力するようにしている。
したがって、1個の閾値を用いて興味の有無を判定する場合に比べ、各文書に対する興味の度合を多段階に推定することが可能となり、正規化閲覧時間と興味スコアとの関係の学習が進めばほぼ無段階に推定することが可能となる。また、ユーザごとに正規化閲覧時間と興味スコアとの関係を求めるようにしているので、ユーザごとにその読解速度を反映した興味推定を行うことが可能となり、これにより興味推定精度を高めることができる。
しかも、この実施形態では閲覧時間計算部55において、閲覧文書の1文字当たりの閲覧時間を算出し、その値を正規化された閲覧時間として推定処理に用いるようにしている。このため、文書の長短に影響を受けることなく正確なパラメータにより興味推定を行うことができる。
さらに、この実施形態ではノイズ除去部56において、閲覧時間計算部55により算出された正規化閲覧時間を予め設定した閾値TH1,TH2と比較する。そして、正規化閲覧時間が閾値TH1より小さいか或いは閾値TH2より大きい場合に、当該文書を興味推定対象外として除外するようにしている。このため、例えば電車の乗り換えや人との会話により閲覧が途中で中断したことで閲覧時間が極端に長くなった場合には、このときの文書を興味推定対象外として除外することができる。また、何らかの事情によりユーザが文書の閲覧を途中で終了したために閲覧時間が極端に短くなった場合にも、このときの文書を興味推定対象外として除外することができる。
なお、この発明は上記実施形態に限定されるものではない。例えば、前記実施形態では閲覧時間の計算から興味スコアの出力までの一連の処理を推定サーバSV2において実行するようにした。しかし、これに限らずこれらの処理を、クライアント端末MT1〜MTnにおいてそれぞれ実行するようにしてもよい。
また、前記実施形態ではクライアント端末として無線通信ユニットを備えた携帯端末を用いた場合を例にとって説明したが、有線LAN等の有線ネットワークに接続される固定設置型のパーソナル・コンピュータ等の有線端末を使用してもよい。さらに、前記実施形態では推定サーバSV1とレコメンドサーバSV2を別々に設けたが、推定サーバSV1にレコメンドサーバSV2の機能を設けてもよい。
また、上記では、推定サーバSV1で閲覧開始時刻、閲覧終了時刻を計測して経過時間を算出し、ノイズ除去していたが、クライアント端末内で閲覧開始時刻、閲覧終了時刻を計測して経過時間を算出し、ノイズ除去し、興味推定対象文書情報のみを推定サーバSV1へ送信するという方法でも実施可能である。
その他、興味推定装置の種類やその構成、興味推定処理の手順と処理内容、文書の種類等についても、この発明の要旨を逸脱しない範囲で種々変形して実施可能である。
要するにこの発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
MT1〜MTn…クライアント端末、SV1…推定サーバ、SV2…レコメンドサーバ、NW…通信ネットワーク、1…クライアント端末の制御ユニット、2…入出力ユニット、3…無線通信ユニット、4…通信ユニット、5…制御ユニット、6…記憶ユニット、11…入力デバイス、12…表示デバイス、21…閲覧要求送信制御部、22…文書受信制御部、23…文書表示制御部、24…表示終了要求送信制御部、25…表示終了情報受信制御部、26…表示終了制御部、50…文書閲覧要求受信制御部、51…文書送信制御部、52…文書閲覧情報記憶制御部、53…表示終了要求受信制御部、54…表示終了情報送信制御部、55…閲覧時間計算部、56…ノイズ除去部、57…興味推定対象情報記憶制御部、58…興味スコア更新制御部、59…興味スコア出力制御部、61…文書データベース、62…文書閲覧履歴データベース、63…興味推定対象文書データベース、64…興味スコアデータベース。

Claims (3)

  1. 閲覧者が文書データベースに記憶された文書を閲覧するごとに、その閲覧履歴を表す情報をもとに当該文書の単位情報量当たりの閲覧時間を算出する手段と、
    前記算出された閲覧時間を前記文書の識別情報と関連付けて蓄積し、この蓄積された情報をもとに、閲覧時間と当該閲覧時間に該当する文書数との関係を統計的に表す第1の情報を生成する第1の生成手段と、
    前記生成された第1の情報の文書数を時間で積分し、その積分値をその最大値により正規化し、この正規化された積分値と前記閲覧時間との関係を表す情報を興味スコアと閲覧時間との関係を表す第2の情報として第2の記憶部に記憶させる第2の生成手段と、
    前記閲覧された文書の閲覧時間に対応する興味スコアを、前記第2の記憶部に記憶された第2の情報をもとに特定する手段と
    前記特定された興味スコアをもとに前記文書データベースに記憶されている文書の見出しを前記閲覧者が興味を持つ度合いが高い順に並び替え、この並び替えられた見出しを前記閲覧者に提示する手段と
    を具備したことを特徴とする興味推定装置。
  2. コンピュータ及び記憶手段を備えた興味推定装置が実行する興味推定方法であって、
    前記コンピュータが、閲覧者が文書データベースに記憶された文書を閲覧するごとに、その閲覧履歴を表す情報をもとに当該文書の単位情報量当たりの閲覧時間を算出する過程と、
    前記コンピュータが、前記算出された閲覧時間を前記文書の識別情報と関連付けて蓄積し、この蓄積された情報をもとに、閲覧時間と当該閲覧時間に該当する文書数との関係を統計的に表す第1の情報を生成する第1の生成過程と、
    前記コンピュータが、前記生成された第1の情報の文書数を時間で積分し、その積分値をその最大値により正規化し、この正規化された積分値と前記閲覧時間との関係を表す情報を興味スコアと閲覧時間との関係を表す第2の情報として第2の記憶部に記憶させる第2の生成過程と、
    前記コンピュータが、前記閲覧された文書の閲覧時間に対応する興味スコアを、前記第2の記憶部に記憶された第2の情報をもとに特定する過程と
    前記コンピュータが、前記特定された興味スコアをもとに前記文書データベースに記憶されている文書の見出しを前記閲覧者が興味を持つ度合いが高い順に並び替え、この並び替えられた見出しを前記閲覧者に提示する過程と
    を具備したことを特徴とする興味推定方法。
  3. 請求項1記載の興味推定装置が具備する各手段による処理を、前記興味推定装置が備えるコンピュータに実行させるプログラム。
JP2011105602A 2011-05-10 2011-05-10 興味推定装置、方法及びプログラム Active JP5695966B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011105602A JP5695966B2 (ja) 2011-05-10 2011-05-10 興味推定装置、方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011105602A JP5695966B2 (ja) 2011-05-10 2011-05-10 興味推定装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2012238114A JP2012238114A (ja) 2012-12-06
JP5695966B2 true JP5695966B2 (ja) 2015-04-08

Family

ID=47460976

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011105602A Active JP5695966B2 (ja) 2011-05-10 2011-05-10 興味推定装置、方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5695966B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106867431B (zh) * 2017-02-25 2019-01-01 苏州大乘环保新材有限公司 水性环保塑胶跑道胶粘剂及其制备方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018060241A (ja) 2016-09-30 2018-04-12 富士通株式会社 関心度評価プログラム、対話プログラム、表示プログラム、装置、及び方法
JP6566981B2 (ja) * 2017-03-01 2019-08-28 ヤフー株式会社 提供装置、提供方法、及び提供プログラム
JP7037815B2 (ja) * 2018-04-04 2022-03-17 株式会社発明通信社 サーバー装置
CN111291268B (zh) * 2020-02-18 2023-11-07 北京小米松果电子有限公司 信息处理方法、信息处理装置及存储介质
CN111984689B (zh) 2020-08-21 2023-07-25 北京百度网讯科技有限公司 信息检索的方法、装置、设备以及存储介质
CN114265979B (zh) 2021-12-17 2022-11-18 北京百度网讯科技有限公司 确定融合参数的方法、信息推荐方法和模型训练方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001195506A (ja) * 1999-10-28 2001-07-19 Fujitsu Ltd 参照状況出力システム、参照状況出力方法及び参照状況出力プログラムを記録した記録媒体
JP2005322172A (ja) * 2004-05-11 2005-11-17 Nippon Telegr & Teleph Corp <Ntt> コンテンツ閲覧評価装置およびコンテンツ閲覧評価プログラム
JP4498979B2 (ja) * 2004-05-28 2010-07-07 モルガン・スタンレー 証券調査部門の顧客にサービスするための該部門のコストを判断するため、および他の目的のためのコンピュータ・ベースのシステム
JP2007316934A (ja) * 2006-05-25 2007-12-06 Fujitsu Ltd 情報処理装置、情報処理方法及びプログラム
CN102333574A (zh) * 2009-01-29 2012-01-25 耐克国际有限公司 一种运动能力评级系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106867431B (zh) * 2017-02-25 2019-01-01 苏州大乘环保新材有限公司 水性环保塑胶跑道胶粘剂及其制备方法

Also Published As

Publication number Publication date
JP2012238114A (ja) 2012-12-06

Similar Documents

Publication Publication Date Title
JP5695966B2 (ja) 興味推定装置、方法及びプログラム
US10878044B2 (en) System and method for providing content recommendation service
CN107577807B (zh) 用于推送信息的方法和装置
US20150220499A1 (en) Generating preview data for online content
KR101855147B1 (ko) 사용자 선호도 분석 방법 및 그를 위한 디바이스
JP2018504727A (ja) 参考文書の推薦方法及び装置
CN108228906B (zh) 用于生成信息的方法和装置
KR20090111826A (ko) 문서 내 링크들을 표시하기 위한 방법 및 시스템
CN105138698B (zh) 网页的动态布局方法和装置
US20130278625A1 (en) Information terminal and display controlling method
US10061806B2 (en) Presenting previously selected search results
WO2016138349A1 (en) Systems and methods of structuring reviews with auto-generated tags
US20130204864A1 (en) Information provision device, information provision method, program, and information recording medium
JP6055912B2 (ja) 端末装置および装置のプログラム
JP6295577B2 (ja) サーバ装置、プログラム、及び、情報提供方法
CN108572980B (zh) 一种网页分屏显示方法和装置
CN108509442B (zh) 搜索方法和装置、服务器以及计算机可读存储介质
US20140108619A1 (en) Information providing system and method for providing information
JP6224682B2 (ja) 情報表示プログラム、情報表示装置、情報表示方法及び配信装置
JP6158903B2 (ja) 情報表示プログラム、情報表示装置、情報表示方法及び配信装置
JP2014157542A (ja) 端末装置および装置のプログラム
CN108897774B (zh) 一种获取新闻热点的方法、设备及存储介质
JP2013196141A (ja) 端末装置、情報表示システムおよび情報表示方法
CN113760388A (zh) 一种信息处理方法、装置、电子设备和存储介质
US11061554B2 (en) Touch operation for displaying content in place of other content

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20130515

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130723

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140311

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140428

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141007

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150209

R150 Certificate of patent or registration of utility model

Ref document number: 5695966

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150