[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2007141059A - 読書支援システム及びプログラム - Google Patents

読書支援システム及びプログラム Download PDF

Info

Publication number
JP2007141059A
JP2007141059A JP2005335781A JP2005335781A JP2007141059A JP 2007141059 A JP2007141059 A JP 2007141059A JP 2005335781 A JP2005335781 A JP 2005335781A JP 2005335781 A JP2005335781 A JP 2005335781A JP 2007141059 A JP2007141059 A JP 2007141059A
Authority
JP
Japan
Prior art keywords
word
user
sight
sentence
line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005335781A
Other languages
English (en)
Inventor
Maki Murata
真樹 村田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Information and Communications Technology
Original Assignee
National Institute of Information and Communications Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute of Information and Communications Technology filed Critical National Institute of Information and Communications Technology
Priority to JP2005335781A priority Critical patent/JP2007141059A/ja
Publication of JP2007141059A publication Critical patent/JP2007141059A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ユーザの視線を利用して人間と計算機の効率のよい連係プレーで、効率のよい読書、及び、発想支援を実現できるようにすること。
【解決手段】電子書物を表示する表示装置1と、ユーザの視線が電子書物のどこにあるかを特定する視線認識部2と、ユーザの視線が送られた周辺範囲を取り出し、その範囲にあった単語を抽出し、単語ごとにユーザの視線が送られた回数又は合計時間を計測する回数または時間計測部4と、前記単語ごとのユーザの視線が送られた回数又は合計時間によりユーザの読書を支援する処理手段5とを備える。
【選択図】図1

Description

本発明は、計算機インターフェース上で電子的な書物の読書をする状況において、その読書をするユーザの視線又はつぶやきを検知し、そのユーザが何に興味を持っているかを認識し、その認識結果を利用してユーザの読書を支援するシステム及びプログラムに関する。
従来、個人環境での読み書きの入力データとして、表示画面上に何分か以上連続して表示されたもの(読み入力データ)、及び、キーボードで入力された文字列(書きの入力データ)を認識する。
そして、この個人環境での読み書きの入力データから個人の良く知っている文字列(単語)を認定し、なるべく個人の良く知っている文字列(単語)を使って入力された文書を表示するようにする個人環境言語変換装置、及び、個人環境での読み書きの入力データから文字列の出現頻度により入力された文書の文字列を強調表示する個人環境差分強調装置があった(特許文献1参照)。
特開2004−265014号公報
上記従来の個人環境言語変換装置及び個人環境差分強調装置は、表示画面上に何分か以上連続して表示されたものを読み入力されたデータとして認識するため、画面の文字列を読ま(注視し)なくても、画面上に表示されたものを読み入力されたデータとしてしまう課題があった。
本発明は上記問題点の解決を図り、ユーザの視線(又はつぶやき)を利用して人間と計算機の効率のよい連係プレーで、効率のよい読書、及び、発想支援を実現できるようにすることを目的とする。
図1は本発明の原理説明図である。図1中、1は表示装置、2は視線認識部、3は電子書物記憶部、4は回数または時間計測部、5は処理手段である。
本発明は、前記従来の課題を解決するため次のような手段を有する。
(1):電子化された文章を表示する表示装置1と、ユーザの視線が電子化された文章のどこにあるかを特定する視線認識部2と、ユーザの視線が送られた周辺範囲を取り出し、その範囲にあった単語を抽出し、単語ごとにユーザの視線が送られた回数又は合計時間を計測する回数または時間計測部4と、前記単語ごとのユーザの視線が送られた回数又は合計時間によりユーザの読書を支援する処理手段5とを備える。このため、ユーザの視線を利用して人間と計算機の効率のよい連係プレーで、効率のよい読書、及び、発想支援を実現することができる。
(2):前記(1)の読書支援システムにおいて、前記処理手段5は、前記ユーザの視線が送られた回数又は時間が所定の値よりも、大きい単語を前記電子化された文章において強調表示するキーワード強調部を備える。このため、ユーザが興味を持っている単語を特定し、その単語をより多く含む文章の範囲を強調表示し、その部分を読むとよいことをユーザに知らせることができる。
(3):前記(1)の読書支援システムにおいて、前記処理手段5は、前記表示装置1の画面上で、電子化された文章とは別の箇所に、前記ユーザの視線が送られた単語とその回数又は合計時間を付けて表示する抽出単語群表示部を備える。このため、ユーザが興味を持っている単語を特定し、それらの単語群を表示し、ユーザがどの単語に興味をもっていたかをユーザ自身に再認識させることができる。
(4):前記(1)の読書支援システムにおいて、前記処理手段5は、前記ユーザの視線が送られた回数又は合計時間が所定の値よりも大きい単語について、その単語を情報検索システムのキーワードとして利用して検索し、その検索結果を、前記表示装置1の画面の電子化された文章とは別の箇所に表示する情報検索装置を備える。このため、ユーザが興味を持っている単語を特定し、その単語に関連する記事を検索して提示することができる。
(5):前記(1)の読書支援システムにおいて、前記処理手段5は、前記ユーザの視線が送られた回数又は合計時間が所定の値よりも大きい単語について、その単語と、あらかじめ用意した質問応答用テンプレートを利用して、質問文を生成し、生成した質問文を質問応答システムに入力しその検索結果を、前記表示装置1の画面の電子化された文章とは別の箇所に表示する質問応答装置を備える。このため、ユーザが興味を持っている単語を特定し、それに関する情報を、自動質問応答技術を利用して自動獲得し、ユーザに提示することができる。
(6):前記(1)の読書支援システムにおいて、前記処理手段5は、前記ユーザの視線が送られた回数又は合計時間が所定の値よりも大きい単語とよく共起する単語を、電子化された文章とは異なる場所に前記表示装置1の画面上で表示する連想単語抽出装置を備える。このため、ユーザが興味を持っている単語を特定し、それに関するもの、または、連想されるものを提示し、ユーザの発想支援を行うことができる。
(7):前記(1)の読書支援システムにおいて、前記処理手段5は、前記ユーザの視線が送られた回数又は合計時間が所定の値よりも大きい単語とよく共起する単語を、電子化された文章で強調表示する連想単語抽出装置を備える。このため、ユーザが興味を持っている単語を特定し、それに関するもの、または、連想されるものを電子化された文章で提示し、ユーザの発想支援を行うことができる。
(8):前記(2)又は(3)又は(6)又は(7)の読書支援システムにおいて、前記処理手段5は、前記単語を表示する場合、前記ユーザが視線を送った期間ごとにわけて表示する。このため、時間ごとによる色分けや右に時間軸をとって並べる等の期間ごとにわけた単語表示により列的効果を出すことができ、最近又は過去に興味のあった単語を認識させることができる。
(9):前記(3)又は(6)の読書支援システムにおいて、前記処理手段5は、前記単語を表示する場合、前記単語の類似度を求めて、よく似た単語を近くに配置する。このため、良く似た単語を容易に見つけることができる。
(10):前記(1)の読書支援システムにおいて、前記処理手段5は、前記ユーザの視線が一定時間内に送られた回数又は合計時間が所定の値よりも大きい単語とよく共起する単語を抽出し、該抽出した単語を情報検索システムのキーワードとして利用して検索し、その検索結果を、前記表示装置1の画面の電子化された文章とは別の箇所に表示する情報検索装置を備える。このため、ユーザが現在興味を持っている単語から連想される単語を特定し、その単語に関連する記事を検索して提示することができる。
(11):前記(1)の読書支援システムにおいて、前記処理手段5は、前記ユーザの視線が一定時間内に送られた回数又は合計時間が所定の値よりも大きい単語とよく共起する単語を抽出し、該抽出した単語と、あらかじめ用意した質問応答用テンプレートを利用して、質問文を生成し、生成した質問文を質問応答システムに入力しその検索結果を、前記表示装置の画面の電子化された文章とは別の箇所に表示する質問応答装置を備える。このため、ユーザが現在興味を持っている単語から連想される単語を特定し、その単語に関する情報を、自動質問応答技術を利用して自動獲得し、ユーザに提示することができる。
(12):前記(1)の読書支援システムにおいて、前記処理手段5は、前記ユーザの視線が送られた回数又は合計時間が所定の値よりも大きい単語を認識し、そこから、重要な文章、概念を抽出し、ユーザに読んだ箇所においてどのような重要な文章や概念が出ていたかを前記表示装置1の画面上で表示する文抽出装置を備える。このため、ユーザが視線を送った箇所を認識し、そこから、重要な文章、概念を抽出し、ユーザに読んだ箇所においてどのような重要な文章や概念が出ていたかを知らせることができる。
(13):前記(12)の読書支援システムにおいて、前記処理手段5は、前記ユーザの視線が送られた回数又は合計時間が所定の値よりも大きい単語を認識し、該認識した単語が多く現れる文を重要な文として抽出し、該抽出した文を強調表示する文抽出装置とを備える。このため、ユーザが興味を持っている重要な文(段落)を強調表示して、ユーザに提示することができる。
(14):前記(12)の読書支援システムにおいて、前記処理手段5は、前記ユーザの視線が送られた回数又は合計時間が所定の値よりも大きい単語を認識し、該認識した単語が多く現れる文を重要な文として抽出し、該抽出した文を前記表示装置の画面の電子化された文章とは別の箇所に表示する文抽出装置とを備える。このため、ユーザが興味を持っている重要な文(段落)を別のウインドウで、ユーザに提示することができる。
(15):前記(12)の読書支援システムにおいて、前記処理手段5は、前記ユーザの視線が送られた回数又は合計時間が所定の値よりも大きい単語とよく共起する単語を抽出し、該抽出した単語を多く含む文を重要な文として抽出し、該抽出した文を強調表示する文抽出装置とを備える。このため、ユーザが興味を持っている単語を特定し、それに関するもの、または、連想される重要な文(段落)を強調表示して、ユーザに提示することができる。
(16):前記(12)の読書支援システムにおいて、前記処理手段5は、前記ユーザの視線が送られた回数又は合計時間が所定の値よりも大きい単語とよく共起する単語を抽出し、該抽出した単語を多く含む文を重要な文として抽出し、該抽出した文を前記表示装置の画面の電子化された文章とは別の箇所に表示する文抽出装置とを備える。このため、ユーザが興味を持っている単語を特定し、それに関するもの、または、連想される重要な文(段落)を別のウインドウで、ユーザに提示することができる。
(17):前記(1)〜(16)の読書支援システムにおいて、前記処理手段5は、前記計測した単語ごとにユーザの視線が送られた回数又は合計時間から、前記ユーザの視線が送られた回数又は合計時間が所定の値よりも小さい単語を抽出し、該抽出した単語を用いる。このため、ユーザが視線を送っていない箇所を特定して、そこから、重要な単語や文章、概念などが出ていたかを知らせることができる。
(18):前記(1)の読書支援システムにおいて、前記処理手段5は、前記計測した単語ごとにユーザの視線が送られた回数又は合計時間から、前記ユーザの視線が送られた回数又は合計時間が所定の値よりも小さい単語を抽出し、そこから、重要な文章、概念を抽出し、ユーザにあまり見ていない箇所においてどのような重要な文章や概念が出ていたかを前記表示装置1の画面上に表示する文抽出装置を備える。このため、ユーザが視線を送っていない箇所を特定して、そこから、重要な文章、概念を抽出し、ユーザにあまり見ていない箇所において、どのような重要な文章や概念が出ていたかを知らせることができる。
(19):前記(1)〜(18)の読書支援システムにおいて、前記回数または時間計測部4は、ユーザの視線がだいぶ前に送られた箇所については小さくなるような重みを付けて、前記回数又は合計時間を計測する。このため、ユーザの現時点での興味のある単語をより大きな値として計測することができる。
(20):前記(1)〜(19)の読書支援システムにおいて、前記視線認識部2の代わりに音声認識部を使用し、前記音声認識部でユーザのつぶやいた単語を特定し、前記回数または時間計測部4で前記ユーザのつぶやいた単語を、該単語ごとの回数として計測する。このため、ユーザのつぶやきを利用して人間と計算機の効率のよい連係プレーで、効率のよい読書、及び、発想支援を実現することができる。
(21):電子化された文章を表示する表示装置1と、ユーザの視線が電子化された文章のどこにあるかを特定する視線認識部2と、ユーザの視線が送られた周辺範囲を取り出し、その範囲にあった単語を抽出し、単語ごとにユーザの視線が送られた回数又は合計時間を計測する回数または時間計測部4と、前記単語ごとのユーザの視線が送られた回数又は合計時間によりユーザの読書を支援する処理手段5として、コンピュータを機能させるためのプログラムとする。このため、このプログラムをコンピュータにインストールすることで、ユーザの視線を利用して人間と計算機の効率のよい連係プレーで、効率のよい読書、及び、発想支援を実現することができる読書支援システムを容易に提供することができる。
本発明によれば次のような効果がある。
(1):処理手段で単語ごとのユーザの視線が送られた回数又は合計時間によりユーザの読書を支援するため、ユーザの視線を利用して人間と計算機の効率のよい連係プレーで、効率のよい読書、及び、発想支援を実現することができる。
(2):キーワード強調部で、ユーザの視線が送られた回数又は時間が所定の値よりも、大きな単語を電子化された文章において強調表示するため、ユーザが興味を持っている単語を特定し、その単語をより多く含む文章の範囲を強調表示し、その部分を読むとよいことをユーザに知らせることができる。
(3):抽出単語群表示部で、表示装置の画面上で、電子化された文章とは別の箇所に、ユーザの視線が送られた単語とその回数又は合計時間を付けて表示するため、ユーザが興味を持っている単語を特定し、それらの単語群を表示し、ユーザがどの単語に興味をもっていたかをユーザ自身に再認識させることができる。
(4):情報検索装置で、ユーザの視線が送られた回数又は合計時間が所定の値よりも大きい単語について、その単語を情報検索システムのキーワードとして利用して検索し、その検索結果を、表示装置の画面の電子化された文章とは別の箇所に表示するため、ユーザが興味を持っている単語を特定し、その単語に関連する記事を検索して提示することができる。
(5):質問応答装置で、ユーザの視線が送られた回数又は合計時間が所定の値よりも大きい単語について、その単語と、あらかじめ用意した質問応答用テンプレートを利用して、質問文を生成し、生成した質問文を質問応答システムに入力しその検索結果を、表示装置の画面の電子化された文章とは別の箇所に表示するため、ユーザが興味を持っている単語を特定し、それに関する情報を、自動質問応答技術を利用して自動獲得し、ユーザに提示することができる。
(6):連想単語抽出装置で、ユーザの視線が送られた回数又は合計時間が所定の値よりも大きい単語とよく共起する単語を、電子化された文章とは異なる場所に表示装置の画面上で表示するため、ユーザが興味を持っている単語を特定し、それに関するもの、または、連想されるものを提示し、ユーザの発想支援を行うことができる。
(7):連想単語抽出装置で、ユーザの視線が送られた回数又は合計時間が所定の値よりも大きい単語とよく共起する単語を、電子化された文章で強調表示する、ユーザが興味を持っている単語を特定し、それに関するもの、または、連想されるものを電子化された文章上で提示し、ユーザの発想支援を行うことができる。
(8):単語を表示する場合、ユーザが視線を送った期間ごとにわけて表示するため、時間ごとによる色分けや右に時間軸をとって並べる等の期間ごとにわけた単語表示により列的効果を出すことができ、最近又は過去に興味のあった単語を認識させることができる。
(9):単語を表示する場合、前記単語の類似度を求めて、よく似た単語を近くに配置するため、良く似た単語を容易に見つけることができる。
(10):連想単語抽出装置で、ユーザの視線が一定時間内に送られた回数又は合計時間が所定の値よりも大きい単語とよく共起する単語を抽出し、該抽出した単語を情報検索システムのキーワードとして利用して検索し、その検索結果を、前記表示装置の画面の電子化された文章とは別の箇所に表示するため、ユーザが現在興味を持っている単語から連想される単語を特定し、その単語に関連する記事を検索して提示することができる。
(11):質問応答装置で、ユーザの視線が一定時間内に送られた回数又は合計時間が所定の値よりも大きい単語とよく共起する単語を抽出し、該抽出した単語と、あらかじめ用意した質問応答用テンプレートを利用して、質問文を生成し、生成した質問文を質問応答システムに入力しその検索結果を、表示装置の画面の電子化された文章とは別の箇所に表示するため、ユーザが現在興味を持っている単語から連想される単語を特定し、その単語に関する情報を、自動質問応答技術を利用して自動獲得し、ユーザに提示することができる。
(12):文抽出装置で、ユーザの視線が送られた回数又は合計時間が所定の値よりも大きい単語を認識し、そこから、重要な文章、概念を抽出し、ユーザに読んだ箇所においてどのような重要な文章や概念が出ていたかを表示装置の画面上で表示するため、ユーザが視線を送った箇所を認識し、そこから、重要な文章、概念を抽出し、ユーザに読んだ箇所においてどのような重要な文章や概念が出ていたかを知らせることができる。
(13):ユーザの視線が送られた回数又は合計時間が所定の値よりも大きい単語を認識し、該認識した単語が多く現れる文を重要な文として抽出し、該抽出した文を強調表示する文抽出装置とを備えるため、ユーザが興味を持っている重要な文(段落)を強調表示して、ユーザに提示することができる。
(14):ユーザの視線が送られた回数又は合計時間が所定の値よりも大きい単語を認識し、該認識した単語が多く現れる文を重要な文として抽出し、該抽出した文を表示装置の画面の電子化された文章とは別の箇所に表示する文抽出装置とを備えるため、ユーザが興味を持っている重要な文(段落)を別のウインドウで、ユーザに提示することができる。
(15):ユーザの視線が送られた回数又は合計時間が所定の値よりも大きい単語とよく共起する単語を抽出し、該抽出した単語を多く含む文を重要な文として抽出し、該抽出した文を強調表示する文抽出装置とを備えるため、ユーザが興味を持っている単語を特定し、それに関するもの、または、連想される重要な文(段落)を強調表示して、ユーザに提示することができる。
(16):ユーザの視線が送られた回数又は合計時間が所定の値よりも大きい単語とよく共起する単語を抽出し、該抽出した単語を多く含む文を重要な文として抽出し、該抽出した文を表示装置の画面の電子化された文章とは別の箇所に表示する文抽出装置とを備えるため、ユーザが興味を持っている単語を特定し、それに関するもの、または、連想される重要な文(段落)を別のウインドウで、ユーザに提示することができる。
(17):計測した単語ごとにユーザの視線が送られた回数又は合計時間から、ユーザの視線が送られた回数又は合計時間が所定の値よりも小さい単語を抽出し、該抽出した単語を用いるため、ユーザが視線を送っていない箇所を特定して、そこから、重要な単語や文章、概念などが出ていたかを知らせることができる。
(18):文抽出装置で、計測した単語ごとにユーザの視線が送られた回数又は合計時間から逆に、ユーザの視線が送られた回数又は合計時間が所定の値よりも小さい単語を抽出し、そこから、重要な文章、概念を抽出し、ユーザにあまり見ていない箇所においてどのような重要な文章や概念が出ていたかを表示装置の画面上に表示するため、ユーザが視線を送っていない箇所を特定して、そこから、重要な文章、概念を抽出し、ユーザにあまり見ていない箇所において、どのような重要な文章や概念が出ていたかを知らせることができる。
(19):回数または時間計測部で、ユーザの視線がだいぶ前に送られた箇所については小さくなるような重みを付けて、回数又は合計時間を計測するため、ユーザの現時点での興味のある単語をより大きな値として計測することができる。
(20):音声認識部でユーザのつぶやいた単語を特定し、回数または時間計測部で前記ユーザのつぶやいた単語を、該単語ごとの回数として計測するため、ユーザのつぶやきを利用して人間と計算機の効率のよい連係プレーで、効率のよい読書、及び、発想支援を実現することができる。
本発明のユーザの視線を利用してユーザの読書を支援するシステムは、計算機インターフェース上で電子的な書物の読書をする状況において、その読書をするユーザの視線又はつぶやきを検知し、そのユーザが何に興味を持っているかを認識し、その認識結果を利用してユーザの読書を支援するものである。これにより、ユーザの興味を視線により認識し、その認識結果を機械的知能(計算機)により高度に活用することで、ユーザと機械的知能の協働を促進させることになり、人間の能力と計算機の能力の融合につながるものである。
(1):キーワード強調部を使用する読書支援の説明
キーワード強調部を使用する読書支援は、ユーザが興味を持っている単語を特定し、その単語をより多く含む文章の範囲を強調表示し、その部分を読むとよいことをユーザに知らせるものである。
図2はキーワード強調部を使用する読書支援システムの説明図である。図2において、キーワード強調部を使用する読書支援システム(装置)には、表示装置1、視線認識部2、電子書物記憶部3、回数または時間計測部4、キーワード強調部6が設けてある。表示装置1は、情報を表示するディスプレイである。視線認識部2は、撮影した画像より検出された人の顔における目の部分の画像を切り出し、黒目の位置を抽出し、視線の方向を検出する視線検出装置である。視線を検知する技術は誤り誤差が0.5 度程度になってきており、性能も向上してきており、本発明を遂行することができる。電子書物記憶部3は、ユーザが読書する電子書物(電子化された文章、電子化されたテキスト)を記憶する格納手段である。回数または時間計測部4は、単語を見ている時間、回数を計測する計測手段である。キーワード強調部6は、所定の値よりも、回数、または、時間が多かった単語を電子書物において強調表示する処理手段である(この強調表示は、色を変えたり、太字にしたり、網掛けにしたりなど) 。
(フローチャートによる説明)
図3はキーワード強調部を使用する処理フローチャート(1)である。以下、図3のキーワード強調部を使用する読書支援システムの処理をS1〜S5に従って説明する。
S1:表示装置1は、ユーザの指示により、ディスプレイ画面に、電子書物記憶部3から読み出した電子書物を表示する。
S2:視線検出装置2で、ユーザの視線が電子書物のどこにあるかを特定する。
S3:回数または時間計測部4は、ユーザの視線が送られた周辺範囲を取り出し、その範囲にあった単語を抽出する。
S4:回数または時間計測部4は、単語ごとにユーザの視線が送られた回数、または、合計時間を計測する。
S5:キーワード強調部6は、所定の値よりも、回数、または、時間が多かった単語を電子書物において強調表示する(回数、時間の程度により、赤、オレンジ、黄等の複数の色付けで強調表示することもできる)。
このように、ユーザが興味を持っている単語を特定し、その単語をより多く含む文章の範囲(例えば、段落単位、又は単語自体でもよい)を強調表示し、その部分を読むとよいことをユーザに知らせることができる。
(2):抽出単語群表示部を使用する読書支援の説明
抽出単語群表示部を使用する読書支援は、ユーザが興味を持っている単語を特定し、それらの単語群を表示し、ユーザがどの単語に興味をもっていたかをユーザ自身に再認識させるものである。
図4は抽出単語群表示部を使用する読書支援システムの説明図である。図4において、抽出単語群表示部を使用する読書支援システム(装置)には、表示装置1、視線認識部2、電子書物記憶部3、回数または時間計測部4、抽出単語群表示部7が設けてある。表示装置1は、情報を表示するディスプレイである。視線認識部2は、人の顔における目の部分の画像を切り出し、黒目の位置を抽出し、視線の方向を検出する視線検出装置である。電子書物記憶部3は、ユーザが読書する電子書物を記憶する格納手段である。回数または時間計測部4は、単語を見ている時間、回数を計測する計測手段である。抽出単語群表示部7は、抽出された単語を、ディスプレイ上で、電子書物とは別の箇所に、単語とその回数、または、合計時間を付けて表示する処理手段である(このとき、単語だけを表示することもできる。また、所定の値よりも大きい、回数、または、合計時間のものだけを表示するのでもよい。) 。
(フローチャートによる説明)
図5は抽出単語群表示部を使用する処理フローチャートである。以下、図5の抽出単語群表示部を使用する読書支援システムの処理をS11〜S15に従って説明する。
S11:表示装置1は、ユーザの指示により、ディスプレイ画面に、電子書物記憶部3から読み出した電子書物を表示する。
S12:視線検出装置2で、ユーザの視線が電子書物のどこにあるかを特定する。
S13:回数または時間計測部4は、ユーザの視線が送られた周辺範囲を取り出し、その範囲にあった単語を抽出する。
S14:回数または時間計測部4は、単語ごとにユーザの視線が送られた回数、または、合計時間を計測する。
S15:抽出単語群表示部7は、抽出された単語を、ディスプレイ上で、電子書物とは別の箇所に、単語とその回数、または、合計時間を付けて表示する。
このように、ユーザが興味を持っている単語を特定し、それらの単語群を表示し、ユーザがどの単語に興味をもっていたかをユーザ自身に再認識させることができる。
(3):キーワード強調部を使用する読書支援(2) の説明
このキーワード強調部を使用する読書支援(2) は、ユーザが視線を送って過去に見た単語を記憶し、見た回数に応じて単語を、色を変えて表示し、ユーザがあまり見たことのない単語を強調表示し、自分があまり見たことのない単語を認識させるものである。
このキーワード強調部を使用する読書支援システムの構成は図2と同じである。図2において、キーワード強調部を使用する読書支援システム(装置)には、表示装置1、視線認識部2、電子書物記憶部3、回数または時間計測部4、キーワード強調部6が設けてある。表示装置1は、情報を表示するディスプレイである。視線認識部2は、人の顔における目の部分の画像を切り出し、黒目の位置を抽出し、視線の方向を検出する視線検出装置である。電子書物記憶部3は、ユーザが読書する電子書物を記憶する格納手段である。回数または時間計測部4は、単語を見ている時間、回数を計測する計測手段である。キーワード強調部6は、ユーザが見た回数、または、合計時間が所定の値よりも小さい単語を電子書物で強調表示する処理手段である。
(フローチャートによる説明)
図6はキーワード強調部を使用する処理フローチャート(2)である。以下、図6の処理をS21〜S25に従って説明する。
S21:表示装置1は、ユーザの指示により、ディスプレイ画面に、電子書物記憶部3から読み出した電子書物を表示する。
S22:視線検出装置2で、ユーザの視線が電子書物のどこにあるかを特定する。
S23:回数または時間計測部4は、ユーザの視線が送られた周辺範囲を取り出し、その範囲にあった単語を抽出する。
S24:回数または時間計測部4は、単語ごとにユーザの視線が送られた回数、または、合計時間を計測する。
S25:キーワード強調部6は、ユーザの視線が送られた回数、または、合計時間が所定の値よりも小さい単語を電子書物で強調表示する。
このように、ユーザが視線を送って過去に見た単語を記憶し、見た回数に応じて単語を、色を変えて表示し、ユーザがあまり見たことのない単語を強調表示し、自分があまり見たことのない単語を認識させることができる。
(4):情報検索装置を使用する読書支援の説明
情報検索装置を使用する読書支援は、ユーザが興味を持っている単語を特定し、その単語に関連する記事を検索して提示するものである。
図7は情報検索装置を使用する読書支援システムの説明図である。図7において、情報検索装置を使用する読書支援システム(装置)には、表示装置1、視線認識部2、電子書物記憶部3、回数または時間計測部4、情報検索装置8が設けてある。表示装置1は、情報を表示するディスプレイである。視線認識部2は、人の顔における目の部分の画像を切り出し、黒目の位置を抽出し、視線の方向を検出する視線検出装置である。電子書物記憶部3は、ユーザが読書する電子書物を記憶する格納手段である。回数または時間計測部4は、単語を見ている時間、回数を計測する計測手段である。情報検索装置8は、ユーザが見た回数、または、合計時間が所定の値よりも大きい単語について、その単語を情報検索システムのキーワードとして利用して検索し、その検索結果を、ディスプレイの電子書物とは別の箇所に表示(例えば、別ウインドウで表示)する処理手段である。
(フローチャートによる説明)
図8は情報検索装置を使用する処理フローチャートである。以下、図8の処理をS31〜S35に従って説明する。
S31:表示装置1は、ユーザの指示により、ディスプレイ画面に、電子書物記憶部3から読み出した電子書物を表示する。
S32:視線検出装置2で、ユーザの視線が電子書物のどこにあるかを特定する。
S33:回数または時間計測部4は、ユーザの視線が送られた周辺範囲を取り出し、その範囲にあった単語を抽出する。
S34:回数または時間計測部4は、単語ごとにユーザの視線が送られた回数、または、合計時間を計測する。
S35:情報検索装置8は、ユーザの視線が送られた回数、または、合計時間が所定の値よりも大きい単語について、その単語を情報検索システムのキーワードとして利用して、検索し、その検索結果を、ディスプレイの電子書物とは別の箇所に表示する。
このように、ユーザが興味を持っている単語を特定し、その単語に関連する記事を検索して提示することができる。
例えば、上記処理S35の情報検索装置8で、回数、または、合計時間が所定の値よりも大きい単語として、「日本」が得られた場合、google(登録商標)などの文書検索システムで「日本」を検索し、その検索結果を提示するものである。
(情報検索システムについての説明)
情報検索システムとしての参考資料として、例えば、“位置情報と分野情報を用いた情報検索”村田真樹,馬青,内元清貴,小作浩美,内山将夫,井佐原均、自然言語処理(言語処理学会誌) 2000 年 4月,7 巻,2 号, p.141 〜 p.160がある。
上記情報検索システムにおいて、日本で開催された情報検索コンテストIREX(Sckine and Isahara 1999) において、二年分の新聞記事データを検索する。この記事のSECTION には経済面などの新聞の紙面情報が、HEADLINEには記事のタイトルが、TEXTには記事の本文がある。IREXでは、各設問に対し 300個の記事に順位つきで提出することになっており、各設問おおよそ50個程度の正解を上位にたくさん含むような結果を提出すれば、よりよい精度が得られるようになっている。情報検索の精度の評価には、TRCEのtrec-eval というツール(trec-eval 1992)を利用し、コンテストの評価ではtrec-eval で得られる評価値のうちR-Precision という評価値(正解記事数分だけ検索したときに正解の記事が含まれている割合)が用いられる。
この情報検索の方法では基本的に、確率型手法の一つのRobertson の2-ポアソンモデル(Robertson and Walker 1994) を用いる。Robertson らの方法とは、各記事毎にScore を算出し、Score の上位のものを検索結果として出力する方法である。
Score の算出には、記事長が長ければ長いほど値を大きくする。また、記事中でキーワードの位置で重みを変更する。例えば、タイトルであれば大きい値とし、記事中の位置が最初のものを加点し、後ろのものを減点する。さらに、詳細な項でキーワードが固有名詞ならば加点したり、キーワードが「事」「認定」「記事」「言及」などの不要な単語の場合は減点したりすることができる。
(5):質問応答装置を使用する読書支援の説明
質問応答装置を使用する読書支援は、ユーザが興味を持っている単語を特定し、それに関する情報を、自動質問応答技術を利用して自動獲得し、ユーザに提示するものである。
図9は質問応答装置を使用する読書支援システムの説明図である。図9において、質問応答装置を使用する読書支援システム(装置)には、表示装置1、視線認識部2、電子書物記憶部3、回数または時間計測部4、質問応答装置9が設けてある。表示装置1は、情報を表示するディスプレイである。視線認識部2は、人の顔における目の部分の画像を切り出し、黒目の位置を抽出し、視線の方向を検出する視線検出装置である。電子書物記憶部3は、ユーザが読書する電子書物を記憶する格納手段である。回数または時間計測部4は、単語を見ている時間、回数を計測する計測手段である。質問応答装置9は、回数、または、合計時間が所定の値よりも大きい単語について、その単語と、あらかじめ用意した質問応答用テンプレートを利用して、質問文を生成し、生成した質問文を質問応答システムに入力しその検索結果を、ディスプレイの電子書物とは別の箇所に表示(例えば、別ウインドウで表示)する処理手段である。
(フローチャートによる説明)
図10は質問応答装置を使用する処理フローチャートである。以下、図10の処理をS41〜S45に従って説明する。
S41:表示装置1は、ユーザの指示により、ディスプレイ画面に、電子書物記憶部3から読み出した電子書物を表示する。
S42:視線検出装置2で、ユーザの視線が電子書物のどこにあるかを特定する。
S43:回数または時間計測部4は、ユーザの視線が送られた周辺範囲を取り出し、その範囲にあった単語を抽出する。
S44:回数または時間計測部4は、単語ごとにユーザの視線が送られた回数、または、合計時間を計測する。
S45:質問応答装置9は、ユーザの視線が送られた回数、または、合計時間が所定の値よりも大きい単語について、その単語と、あらかじめ用意した質問応答用テンプレートを利用して、質問文を生成し、生成した質問文を質問応答システムに入力しその検索結果を、ディスプレイの電子書物とは別の箇所に表示する。
このように、ユーザが興味を持っている単語を特定し、それに関する情報を、自動質問応答技術を利用して自動獲得し、ユーザに提示することができる。
(質問応答用テンプレートの説明)
質問応答用テンプレートとは、
は何ですか。
はいつですか。
はどこですか。
は誰ですか。
などで、例えば、
回数、または、合計時間が所定の値よりも大きい単語として、「日本」が得られた場合、
日本は何ですか。
日本はいつですか。
日本はどこですか。
日本は誰ですか。
などを質問応答システムに入力する。質問応答システムでは、
日本は何ですか。に対しては、国です。と答える。
日本はいつですか。に対しては、1945年。など間違った答えをおそらく答える。
日本はどこですか。に対しては、アジアです。と答える。
など。
(質問応答システムについての説明)
この質問文と解答を表示する質問応答システムについて、次のものがある。
“質問応答システムの現状と展望”村田真樹 電子情報通信学会 2003 年 12 月,86巻,12号,p.959-963
“質問応答システムにおける逓減加点法に基づく複数記事情報の利用”村田真樹,井佐原均 情報処理学会自然言語処理研究会 2004-NL-160 2004 年.九州大学.
上記の質問応答システムとは、与えられた質問に対してその答えを出力するシステムのことで、例えば、「日本の首都はどこですか」という質問文が与えられると「東京は日本の首都で、その国の最も大きく重要な都市であり、東京は日本の47都道府県のうちの一つである。」という文をウェブや新聞記事などの電子テキストから探し出し、「東京」と答える。質問応答システムは情報検索の代りとして重要になるだろうし、また将来の人工知能システムの基本要素にもなるであろう重要なものである。
“質問応答システムにおける逓減加点法に基づく複数記事情報の利用”の論文では、質問応答システムの精度向上のために、得点を減らしながら複数の記事(文書)の得点を利用する新しい方法を提案する。本稿ではこの方法を逓減加点法と呼ぶ。質問の答えが複数の記事で見つかることは多く、そのような場合は、複数の記事を使って答えを推定した方が一つの記事を使って推定するよりも良い答えを得ることができるだろう。我々の方法では、複数の記事から得た解の候補の得点を加算することで、複数の記事の情報を利用する。
本研究の実験で用いる質問応答システムについて述べると、以下の三つの基本要素(1) 〜(3) からなる。
(1) 解表現の推定
システムは疑問代名詞の表現などに基づいて解表現(解がどのような言語表現か)を推定する。例えば、入力の質問文が「日本の面積はどのくらいですか」だとすると「どのくらい」という表現から解表現は数値表現であろうと推測する。
(2) 文書検索
システムは質問文からキーワードを取り出し、これらのキーワードを用いて文書を検索する。この検索により、解が書いてありそうな文書群を集めることになる。例えば、入力の質問文が「日本の面積はどのくらいですか」だとすると、「日本」「面積」がキーワードとして抽出され、これらを含む文書を検索することになる。
(3) 解の抽出
システムは解が書いてありそうな文書群から、推定した解表現に適合する言語表現を抽出し、それを解として出力する。例えば、入力の質問文が「日本の面積はどのくらいですか」だとすると、文書検索で検索した「日本」「面積」を含む文書群から、解表現として推定した数値表現にあたる言語表現を解として抽出する。
解表現の推定は、次のようなルールを使って行う。例えば、質問文に「誰」という表現がある場合、解表現は人名である。質問文に「いつ」という表現がある場合、解表現は時間表現である。質問文に「どのくらいの」という表現がある場合、解表現は数値表現である等。
(6):連想単語抽出装置を使用する読書支援の説明
連想単語抽出装置を使用する読書支援は、ユーザが興味を持っている単語を特定し、それに関するもの、または、連想されるものを提示し、ユーザの発想支援をするものである。
図11は連想単語抽出装置を使用する読書支援システムの説明図である。図11において、連想単語抽出装置を使用する読書支援システム(装置)には、表示装置1、視線認識部2、電子書物記憶部3、回数または時間計測部4、連想単語抽出装置10が設けてある。表示装置1は、情報を表示するディスプレイである。視線認識部2は、人の顔における目の部分の画像を切り出し、黒目の位置を抽出し、視線の方向を検出する視線検出装置である。電子書物記憶部3は、ユーザが読書する電子書物を記憶する格納手段である。回数または時間計測部4は、単語を見ている時間、回数を計測する計測手段である。連想単語抽出装置10は、回数、または、合計時間が所定の値よりも大きい単語とよく共起する単語を、電子書物とは異なる場所にディスプレイ上で表示する処理手段である。
(フローチャートによる説明)
図12は連想単語抽出装置を使用する処理フローチャートである。以下、図12の処理をS51〜S55に従って説明する。
S51:表示装置1は、ユーザの指示により、ディスプレイ画面に、電子書物記憶部3から読み出した電子書物を表示する。
S52:視線検出装置2で、ユーザの視線が電子書物のどこにあるかを特定する。
S53:回数または時間計測部4は、ユーザの視線が送られた周辺範囲を取り出し、その範囲にあった単語を抽出する。
S54:回数または時間計測部4は、単語ごとにユーザの視線が送られた回数、または、合計時間を計測する。
S55:連想単語抽出装置10は、回数、または、合計時間が所定の値よりも大きい単語とよく共起する単語を、電子書物とは異なる場所にディスプレイ上で表示する。あるいは、この電子書物とは異なる場所にする表示は、電子書物上で強調表示することもできる。この場合、この強調表示は、元の単語とは異なる様態(例えば、色を変えるなど)で強調表示するものである。
このように、ユーザが興味を持っている単語を特定し、それに関するもの、または、連想されるものを提示し、ユーザの発想支援をすることができる。
(単語W1とよく共起する単語W2の説明)
単語W1とよく共起する単語W2の特定は、あるコーパス(言語テキストのデータ、数年分の新聞記事や、ウェブデータなど)で、単語W1と同一文、または、あらかじめ定めた値だけの文字数以内の距離にある単語を取り出し、その単語の中で、単語W1と同一文、または、あらかじめ定めた値だけの文字数以内の距離に現れた回数が、所定の値よりも多いものを取り出し、それらをよく共起する単語W2とする。
または、
単語W1と同一文、または、あらかじめ定めた値だけの文字数以内の距離に現れた回数が大きいものから順に所定の値の個数まで大きいものを取り出し、それらをよく共起する単語W2とする。
(7):文抽出装置を使用する読書支援の説明
文抽出装置を使用する読書支援は、ユーザが視線を送った箇所を認識し、逆に電子書物においてユーザが視線を送っていない箇所を特定して、そこから、重要な文章、概念を抽出し、ユーザにあまり見ていない箇所においてどのような重要な文章や概念が出ていたかを知らせるものである。
図13は文抽出装置を使用する読書支援システムの説明図である。図13において、文抽出装置を使用する読書支援システム(装置)には、表示装置1、視線認識部2、電子書物記憶部3、回数または時間計測部4、文抽出装置11が設けてある。表示装置1は、情報を表示するディスプレイである。視線認識部2は、人の顔における目の部分の画像を切り出し、黒目の位置を抽出し、視線の方向を検出する視線検出装置である。電子書物記憶部3は、ユーザが読書する電子書物を記憶する格納手段である。回数または時間計測部4は、単語を見ている時間、回数を計測する計測手段である。文抽出装置11は、回数、または、合計時間が所定の値よりも小さい単語を抽出し、ユーザがあまり見ていない箇所において、重要な文章や概念を抽出してディスプレイ上で表示する処理手段である。
(フローチャートによる説明)
(1) 図14は文抽出装置を使用する処理フローチャート(1) である。以下、図14の文抽出装置を使用する読書支援システム(1) の処理をS61〜S65に従って説明する。
S61:表示装置1は、ユーザの指示により、ディスプレイ画面に、電子書物記憶部3から読み出した電子書物を表示する。
S62:視線検出装置2で、ユーザの視線が電子書物のどこにあるかを特定する。
S63:回数または時間計測部4は、ユーザの視線が送られた周辺範囲を取り出し、その範囲にあった単語を抽出する。
S64:回数または時間計測部4は、単語ごとにユーザの視線が送られた回数、または、合計時間を計測する。
S65:文抽出装置11は、回数、または、合計時間が所定の値よりも小さい単語を抽出し、抽出された単語を、ディスプレイ上で、電子書物とは別の箇所に、単語とその回数、または、合計時間を付けて表示する。
これにより、ユーザがあまり見たことのない単語を認識させることができる。
(2) 図15は文抽出装置を使用する処理フローチャート(2) である。以下、図15の文抽出装置を使用する読書支援システム(2) の処理をS71〜S75に従って説明する。
S71:表示装置1は、ユーザの指示により、ディスプレイ画面に、電子書物記憶部3から読み出した電子書物を表示する。
S72:視線検出装置2で、ユーザの視線が電子書物のどこにあるかを特定する。
S73:回数または時間計測部4は、ユーザの視線が送られた周辺範囲を取り出し、その範囲にあった単語を抽出する。
S74:回数または時間計測部4は、単語ごとにユーザの視線が送られた回数、または、合計時間を計測する。
S75:文抽出装置11は、回数、または、合計時間が所定の値よりも小さい単語を抽出し、抽出された単語を、ディスプレイ上で、電子書物とは別の箇所に、単語とその単語のその電子書物中の出現回数を表示する。
これにより、ユーザがあまり見たことのない電子書物中の出現回数の多い単語を認識させることができる。
(3) 図16は文抽出装置を使用する処理フローチャート(3) である。以下、図16の文抽出装置を使用する読書支援システム(3) の処理をS81〜S85に従って説明する。
S81:表示装置1は、ユーザの指示により、ディスプレイ画面に、電子書物記憶部3から読み出した電子書物を表示する。
S82:視線検出装置2で、ユーザの視線が電子書物のどこにあるかを特定する。
S83:回数または時間計測部4は、ユーザの視線が送られた周辺範囲を取り出し、その範囲にあった単語を抽出する。
S84:回数または時間計測部4は、単語ごとにユーザの視線が送られた回数、または、合計時間を計測する。
S85:文抽出装置11は、回数、または、合計時間が所定の値よりも小さい単語を抽出する。そして、この単語群を所定の個数以上含む文を取り出して表示する。
これにより、ユーザがあまり見たことのない電子書物中の文を認識させることができる。
(4) 図17は文抽出装置を使用する処理フローチャート(4) である。以下、図17の文抽出装置を使用する読書支援システム(4) の処理をS91〜S95に従って説明する。
S91:表示装置1は、ユーザの指示により、ディスプレイ画面に、電子書物記憶部3から読み出した電子書物を表示する。
S92:視線検出装置2で、ユーザの視線が電子書物のどこにあるかを特定する。
S93:回数または時間計測部4は、ユーザの視線が送られた周辺範囲を取り出し、その範囲にあった単語を抽出する。
S94:回数または時間計測部4は、単語ごとにユーザの視線が送られた回数、または、合計時間を計測する。
S95:文抽出装置11は、回数、または、合計時間が所定の値よりも小さい単語を抽出する。そして、この単語群を多く含む文を多い順に所定の数の文だけ、取り出して表示する。
これにより、ユーザがあまり見たことのない電子書物中の重要な文を認識させることができる。
(5) 図18は文抽出装置を使用する処理フローチャート(5) である。以下、図18の文抽出装置を使用する読書支援システム(5) の処理をS101〜S105に従って説明する。
S101:表示装置1は、ユーザの指示により、ディスプレイ画面に、電子書物記憶部3から読み出した電子書物を表示する。
S102:視線検出装置2で、ユーザの視線が電子書物のどこにあるかを特定する。
S103:回数または時間計測部4は、ユーザの視線が送られた周辺範囲を取り出し、その範囲にあった単語を抽出する。
S104:回数または時間計測部4は、単語ごとにユーザの視線が送られた回数、または、合計時間を計測する。
S105:文抽出装置11は、回数、または、合計時間が所定の値よりも小さい単語を抽出する。そして、この単語群を異なりで所定の個数以上含む文を、取り出して表示する。ここで「異なり」は単語の種類を意味するものである。
これにより、ユーザがあまり見たことのない単語の種類を多く含む電子書物中の文を認識させることができる。
(6) 図19は文抽出装置を使用する処理フローチャート(6) である。以下、図19の文抽出装置を使用する読書支援システム(6) の処理をS111〜S115に従って説明する。
S111:表示装置1は、ユーザの指示により、ディスプレイ画面に、電子書物記憶部3から読み出した電子書物を表示する。
S112:視線検出装置2で、ユーザの視線が電子書物のどこにあるかを特定する。
S113:回数または時間計測部4は、ユーザの視線が送られた周辺範囲を取り出し、その範囲にあった単語を抽出する。
S114:回数または時間計測部4は、単語ごとにユーザの視線が送られた回数、または、合計時間を計測する。
S115:文抽出装置11は、回数、または、合計時間が所定の値よりも小さい単語を抽出する。そして、この単語群を異なりで多く含む文を多い順に所定の数の文だけ、取り出して表示する。
これにより、ユーザがあまり見たことのない単語の種類を多く含む電子書物中の文を、重要な順に認識させることができる。
(7) 図20は文抽出装置を使用する処理フローチャート(7) である。以下、図20の文抽出装置を使用する読書支援システム(7) の処理をS121〜S125に従って説明する。
S121:表示装置1は、ユーザの指示により、ディスプレイ画面に、電子書物記憶部3から読み出した電子書物を表示する。
S122:視線検出装置2で、ユーザの視線が電子書物のどこにあるかを特定する。
S123:回数または時間計測部4は、ユーザの視線が送られた周辺範囲を取り出し、その範囲にあった単語を抽出する。
S124:回数または時間計測部4は、単語ごとにユーザの視線が送られた回数、または、合計時間を計測する。
S125:文抽出装置11は、回数、または、合計時間が所定の値よりも小さい単語を抽出する。そして、この単語群を含む文で、その文に含まれる単語群のtfidf の値の和が所定の値よりも大きい文を取り出して表示する。
これにより、ユーザがあまり見たことのない重要な単語を多く含む電子書物中の文を、認識させることができる。
(8) 図21は文抽出装置を使用する処理フローチャート(8) である。以下、図21の文抽出装置を使用する読書支援システム(8) の処理をS131〜S135に従って説明する。
S131:表示装置1は、ユーザの指示により、ディスプレイ画面に、電子書物記憶部3から読み出した電子書物を表示する。
S132:視線検出装置2で、ユーザの視線が電子書物のどこにあるかを特定する。
S133:回数または時間計測部4は、ユーザの視線が送られた周辺範囲を取り出し、その範囲にあった単語を抽出する。
S134:回数または時間計測部4は、単語ごとにユーザの視線が送られた回数、または、合計時間を計測する。
S135:文抽出装置11は、回数、または、合計時間が所定の値よりも小さい単語を抽出する。そして、この単語群を含む文で、その文に含まれる単語群のtfidf の値の和が大きいものを大きい順に所定の値の個数取り出して表示する。
これにより、ユーザがあまり見たことのない重要な単語を多く含む電子書物中の文を、重要な順に認識させることができる。
(8):文抽出装置で、ユーザに読んだ箇所においてどのような重要な文章や概念が出ていたかを知らせる説明
前記(7)の文抽出装置11の各処理において、(回数、または、合計時間が所定の値よりも小さい単語を抽出するに変えて)ユーザが視線を送った回数、または、合計時間が所定の値よりも大きい単語を抽出するようにできる。
これにより、ユーザが視線を送った箇所を認識し、そこから、重要な文章、概念を抽出し、ユーザに読んだ箇所においてどのような重要な文章や概念が出ていたかを知らせることができる。
なお、前記(1)〜(8)の「回数、または、合計時間が所定の値よりも大きい単語を抽出する」は、「回数、または、合計時間が大きいものから順に所定の個数まで単語を抽出する」というように置き換えることもできる。
(1) 重要文強調の説明
図22は重要文強調を行う処理フローチャートである。以下、図22の処理をS141〜S146に従って説明する。
S141:表示装置1は、ユーザの指示により、ディスプレイ画面に、電子書物記憶部3から読み出した電子書物を表示する。
S142:視線検出装置2で、ユーザの視線が電子書物のどこにあるかを特定する。
S143:回数または時間計測部4は、ユーザの視線が送られた周辺範囲を取り出し、その範囲にあった単語を抽出する。
S144:回数または時間計測部4は、単語ごとにユーザの視線が送られた回数、または、合計時間を計測する。
S145:文抽出装置11は、回数、または、合計時間が所定の値よりも多かった単語を抽出する。
S146:文抽出装置11は、抽出した単語を多く含む文を(重要文として)抽出し、その文を強調表示する。
(重要文の取り出しの詳細説明)
文ごとにスコアをもとめる。
このスコアは、抽出した単語をその文で含む個数とする。
または、スコアは、抽出した単語の種類をその文で含む個数とする。
または、スコアは、抽出した単語ごとにスコアを求めてそのスコアをその文に含まれる単語分だけ加算するものとする。などの方法でスコアを求めて、このスコアが、所定の値よりも大きい文を重要文とする。
または、このスコアの大きいものから順に所定の個数の文を重要文とすることもできる。
単語ごとのスコアには、視線の送られた回数、視線の送られた時間、tfidf の値などを利用することが考えられる。
(2) 重要文抽出の説明
図23は重要文を別ウィンドウで表示する処理フローチャートである。以下、図23の処理をS151〜S156に従って説明する。
S151:表示装置1は、ユーザの指示により、ディスプレイ画面に、電子書物記憶部3から読み出した電子書物を表示する。
S152:視線検出装置2で、ユーザの視線が電子書物のどこにあるかを特定する。
S153:回数または時間計測部4は、ユーザの視線が送られた周辺範囲を取り出し、その範囲にあった単語を抽出する。
S154:回数または時間計測部4は、単語ごとにユーザの視線が送られた回数、または、合計時間を計測する。
S155:文抽出装置11は、回数、または、合計時間が所定の値よりも多かった単語を抽出する。
S156:文抽出装置11は、抽出した単語を多く含む文を(重要文として)抽出し、その文を別のウィンドウで表示する。
(3) 連想単語から重要文強調する説明
図24は連想単語から重要文強調を行う処理フローチャートである。以下、図24の処理をS161〜S166に従って説明する。
S161:表示装置1は、ユーザの指示により、ディスプレイ画面に、電子書物記憶部3から読み出した電子書物を表示する。
S162:視線検出装置2で、ユーザの視線が電子書物のどこにあるかを特定する。
S163:回数または時間計測部4は、ユーザの視線が送られた周辺範囲を取り出し、その範囲にあった単語を抽出する。
S164:回数または時間計測部4は、単語ごとにユーザの視線が送られた回数、または、合計時間を計測する。
S165:文抽出装置11は、回数、または、合計時間が所定の値よりも大きい単語とよく共起する単語を抽出する。
S166:文抽出装置11は、抽出した単語を多く含む文を(重要文として)抽出し、その文を強調表示する。
(4) 連想単語から重要文を別ウィンドウで表示する説明
図25は連想単語から重要文を別ウィンドウで表示する処理フローチャートである。以下、図25の処理をS171〜S176に従って説明する。
S171:表示装置1は、ユーザの指示により、ディスプレイ画面に、電子書物記憶部3から読み出した電子書物を表示する。
S172:視線検出装置2で、ユーザの視線が電子書物のどこにあるかを特定する。
S173:回数または時間計測部4は、ユーザの視線が送られた周辺範囲を取り出し、その範囲にあった単語を抽出する。
S174:回数または時間計測部4は、単語ごとにユーザの視線が送られた回数、または、合計時間を計測する。
S175:文抽出装置11は、回数、または、合計時間が所定の値よりも大きい単語とよく共起する単語を抽出する。
S176:文抽出装置11は、抽出した単語を多く含む文を(重要文として)抽出し、その文を別のウィンドウで表示する。
このようにして、自動的に重要な文を抽出するため、自動的に要約を作成することになる。なお、上記では重要な文を抽出する説明をしたが、重要な段落を抽出することもできる。
(9):形態素解析システムの説明
形態素解析システムについて、ここでは ChaSen について説明する。奈良先端大で開発されている形態素解析システム茶筌 http://chasen.aist-nara.ac.jp/index.html.jaで公開されている。
日本語文を分割し、さらに、各単語の品詞も推定してくれる。
例えば、「学校へ行く」を入力すると以下の結果をえる。
学校 ガッコウ 学校 名詞- 一般
へ ヘ へ 助詞- 格助詞- 一般
行く イク 行く 動詞- 自立 五段・カ行促音便 基本形
EOS
このように、各行に一個の単語が入るように分割され、各単語に読みや品詞の情報が付与される。
(英語の品詞タグつけの説明)
英語の品詞タグつけシステムとしては Brillのものが有名である。
Eric Brill,
Transformation-Based Error-Driven Learning and
Natural Language Processing: A Case Study in Part-of-Speech Tagging,
Computational Linguistics, Vol. 21, No. 4, p.543-565, 1995.
これは、英語文の各単語の品詞を推定してくれるものである。
(10): tfidf法の説明
重要キーワードの自動抽出には TF/IDF 法が主に用いられる。ここで、
TF --- その文書でのその語の出現回数。
IDF --- その語があらかじめ持っている多数の文書のうち,何個の文書に
出現するかのその個数の逆数。
一般に TF と IDFの積が大きい語ほどキーフレーズとして妥当なものとなる。
例えば、複数の本を持ってきて、その一つひとつを文書と思ってIDF を求める方法が考えられる。また、IDF は本のデータ以外のデータで求めて、それを今回の本のデータに使う手もある。すなわち、本に限らず文書データを集めて、それぞれの文書を一つ一つの文書と考えてIDF を求める。そこで求めた IDFを今回の IDFに使うということである。
TFについては、その文書での出現回数であるので、今回は、電子文書全体での出現回数となる。
なお、前記実施の形態では、「所定の値よりも、回数、または、時間が多かった単語を、強調表示する」ことになっているが、これだと重要単語以外も強調表示される可能性がある。このため、「所定の値よりも、回数、または、時間と、tfidf の値の積が多きかった単語を、電子書物において強調表示する」又は「所定の値よりも、回数、または、時間が多かった単語のうち、所定の値よりも、tfidf の値が多きかった単語を電子書物において強調表示する」とすることもできる。これにより、より確実に重要単語を強調表示することができる。
さらに、これら重要単語の強調表示だけでなく、これらの単語群を別ウィンドウで表示したり、情報検索結果や質問応答結果を出力する場合にも利用することができる。
また、強調表示としては、名詞を強調表示する、又は、名詞と動詞と形容詞だけを強調表示する等、強調表示や抽出する単語の品詞を限定することもできる。
(11):視線の先の単語の認識の説明
前記実施の形態では、ユーザの視線が送られた周辺範囲を取り出し、その範囲にあった単語を抽出している。この視線の先の単語の認識の詳細については、
視線があるとされた部分を頻度1とするとき、
その視線のあったところから、離れるにつれて、小さくなるような重みを頻度につけて、視線の送られた回数、時間を計測する。
また、重みの付け方としては、
1/r, 1/r^2, .., 1/r^n や C^(-r)
などの式が一般的であるがこれに限らない。
r は視線から単語までの距離。
^は指数を意味する記号(例:2 ^2 は、2 の二乗)
C は定数
(12):音声認識部を使用する読書支援の説明
音声認識部を使用する読書支援は、ユーザがつぶやいた単語を音声認識装置で認識し、その単語をユーザの興味を持っている単語と特定し、その単語をより多く含む文章の範囲を強調表示し、その部分を読むとよいことをユーザに知らせるものである。
図26は音声認識部を使用する読書支援システムの説明図である。図26において、音声認識部を使用する読書支援システム(装置)には、表示装置1、電子書物記憶部3、回数または時間計測部4、キーワード強調部6、音声認識部12が設けてある。表示装置1は、情報を表示するディスプレイである。電子書物記憶部3は、ユーザが読書する電子書物を記憶する格納手段である。回数または時間計測部4は、単語をつぶやいた回数を計測する計測手段である。キーワード強調部6は、所定の値よりも、回数が多かった単語を電子書物において強調表示するものである。音声認識部12は、ユーザがつぶやいた単語を認識する音声認識装置である。
(フローチャートによる説明)
図27はキーワード強調部を使用する処理フローチャートである。以下、図27のキーワード強調部を使用する読書支援システムの処理をS181〜S184に従って説明する。
S181:表示装置1は、ユーザの指示により、ディスプレイ画面に、電子書物記憶部3から読み出した電子書物を表示する。
S182:音声認識部12で、ユーザがつぶやいた単語を特定する。
S183:回数または時間計測部4は、単語ごとにユーザがつぶやいた回数を計測する。
S184:キーワード強調部6は、ユーザがつぶやいた単語の回数が、所定の値よりも多かった単語を電子書物において強調表示する。
(13):その他の音声認識部を使用する読書支援の説明
前記実施の形態の(2)〜(8)において、「視線認識部2」の代わりに「音声認識部12」を使用することにより、回数または時間計測部4でユーザが単語をつぶやいた回数を計測することにより、音声認識部を使用する読書支援システムを構成することができる。
(a)抽出単語群表示部を使用する読書支援の説明
この抽出単語群表示部を使用する読書支援は、ユーザが興味を持っている単語を特定し、それらの単語群を表示し、ユーザがどの単語に興味をもっていたかをユーザ自身に再認識させるものである。
この抽出単語群表示部を使用する読書支援システムの構成は図4の「視線認識部2」の代わりに「音声認識部12」を使用するものである。この読書支援システムにおいて、抽出単語群表示部を使用する読書支援システム(装置)には、表示装置1、電子書物記憶部3、回数または時間計測部4、抽出単語群表示部7、音声認識部12が設けてある。表示装置1は、情報を表示するディスプレイである。電子書物記憶部3は、ユーザが読書する電子書物を記憶する格納手段である。回数または時間計測部4は、単語をつぶやいた回数を計測する計測手段である。音声認識部12は、ユーザがつぶやいた単語を認識する音声認識装置でる(このとき、単語だけを表示することもできる。また、所定の値よりも大きい回数のものだけを表示するのでもよい。) 。
(フローチャートによる説明)
図28は抽出単語群表示部を使用する処理フローチャートである。以下、図28の抽出単語群表示部を使用する読書支援システムの処理をS191〜S194に従って説明する。
S191:表示装置1は、ユーザの指示により、ディスプレイ画面に、電子書物記憶部3から読み出した電子書物を表示する。
S192:音声認識部12で、ユーザがつぶやいた単語を特定する。
S193:回数または時間計測部4は、単語ごとにユーザがつぶやいた単語の回数を計測する。
S194:抽出単語群表示部7は、抽出された単語を、ディスプレイ上で、電子書物とは別の箇所に、単語とその回数を付けて表示する。
このように、ユーザが興味を持っている単語を特定し、それらの単語群を表示し、ユーザがどの単語に興味をもっていたかをユーザ自身に再認識させることができる。
(b):キーワード強調部を使用する読書支援(2) の説明
このキーワード強調部を使用する読書支援(2) は、ユーザが過去につぶやいた単語を記憶し、つぶやいた回数に応じて単語の色を変えて表示し、ユーザがあまりつぶやいたことのない単語を強調表示し、自分があまりつぶやいたことのない単語を認識させるものである。
このキーワード強調部を使用する読書支援(2) システムの構成は図26と同じである。図26において、キーワード強調部を使用する読書支援システム(装置)には、音声認識部を使用する読書支援システム(装置)には、表示装置1、電子書物記憶部3、回数または時間計測部4、キーワード強調部6、音声認識部12が設けてある。表示装置1は、情報を表示するディスプレイである。電子書物記憶部3は、ユーザが読書する電子書物を記憶する格納手段である。回数または時間計測部4は、単語をつぶやいた回数を計測する計測手段である。キーワード強調部6は、ユーザが見た回数、または、合計時間が所定の値よりも小さい単語を電子書物で強調表示するものである。音声認識部12は、ユーザがつぶやいた単語を認識する音声認識装置である。
(フローチャートによる説明)
図29はキーワード強調部を使用する処理フローチャート(2) である。以下、図29のキーワード強調部を使用する読書支援(2) システムの処理をS201〜S204に従って説明する。
S201:表示装置1は、ユーザの指示により、ディスプレイ画面に、電子書物記憶部3から読み出した電子書物を表示する。
S202:音声認識部12で、ユーザがつぶやいた単語を特定する。
S203:回数または時間計測部4は、単語ごとにユーザがつぶやいた単語の回数を計測する。
S204:キーワード強調部6は、ユーザのつぶやいた単語の回数が所定の値よりも小さい単語を電子書物で強調表示する。
このように、ユーザが視線を送って過去につぶやいた単語を記憶し、つぶやいた回数に応じて単語を、色を変えて表示し、ユーザがあまりつぶやいたことのない単語を強調表示し、自分があまりつぶやいたことのない単語を認識させることができる。
(c):情報検索装置を使用する読書支援の説明
情報検索装置を使用する読書支援は、ユーザが興味を持っている単語を特定し、その単語に関連する記事を検索して提示するものである。
この情報検索装置を使用する読書支援システムの構成は図7の「視線認識部2」の代わりに「音声認識部12」を使用するものである。この読書支援システムにおいて、情報検索装置を使用する読書支援システム(装置)には、表示装置1、電子書物記憶部3、回数または時間計測部4、情報検索装置8、音声認識部12が設けてある。表示装置1は、情報を表示するディスプレイである。電子書物記憶部3は、ユーザが読書する電子書物を記憶する格納手段である。回数または時間計測部4は、単語をつぶやいた回数を計測する計測手段である。情報検索装置8は、ユーザがつぶやいた回数が所定の値よりも大きい単語について、その単語を情報検索システムのキーワードとして利用して検索し、その検索結果を、ディスプレイの電子書物とは別の箇所に表示するものである。音声認識部12は、ユーザがつぶやいた単語を認識する音声認識装置である。
(フローチャートによる説明)
図30は情報検索装置を使用する処理フローチャートである。以下、図30の情報検索装置を使用する読書支援システムの処理をS211〜S214に従って説明する。
S211:表示装置1は、ユーザの指示により、ディスプレイ画面に、電子書物記憶部3から読み出した電子書物を表示する。
S212:音声認識部12で、ユーザがつぶやいた単語を特定する。
S213:回数または時間計測部4は、単語ごとにユーザのつぶやいた回数を計測する。
S214:情報検索装置8は、ユーザのつぶやいた回数が所定の値よりも大きい単語について、その単語を情報検索システムのキーワードとして利用して、検索し、その検索結果(記事)を、ディスプレイの電子書物とは別の箇所に表示する。
このように、ユーザが興味を持っている単語を特定し、その単語に関連する記事を検索して提示することができる。
(d):質問応答装置を使用する読書支援の説明
質問応答装置を使用する読書支援は、ユーザが興味を持っている単語を特定し、それに関する情報を、自動質問応答技術を利用して自動獲得し、ユーザに提示するものである。
この質問応答装置を使用する読書支援システムの構成は図9の「視線認識部2」の代わりに「音声認識部12」を使用するものである。この読書支援システムにおいて、質問応答装置を使用する読書支援システム(装置)には、表示装置1、電子書物記憶部3、回数または時間計測部4、質問応答装置9、音声認識部12が設けてある。表示装置1は、情報を表示するディスプレイである。電子書物記憶部3は、ユーザが読書する電子書物を記憶する格納手段である。回数または時間計測部4は、単語をつぶやいた回数を計測する計測手段である。質問応答装置9は、つぶやいた回数が所定の値よりも大きい単語について、その単語と、あらかじめ用意した質問応答用テンプレートを利用して、質問文を生成し、生成した質問文を質問応答システムに入力しその検索結果を、ディスプレイの電子書物とは別の箇所に表示するものである。音声認識部12は、ユーザがつぶやいた単語を認識する音声認識装置である。
(フローチャートによる説明)
図31は質問応答装置を使用する処理フローチャートである。以下、図31の質問応答装置を使用する読書支援システムの処理をS221〜S224に従って説明する。
S221:表示装置1は、ユーザの指示により、ディスプレイ画面に、電子書物記憶部3から読み出した電子書物を表示する。
S222:音声認識部12で、ユーザがつぶやいた単語を特定する。
S223:回数または時間計測部4は、単語ごとにユーザのつぶやいた回数を計測する。
S224:質問応答装置9は、ユーザのつぶやいた回数が所定の値よりも大きい単語について、その単語と、あらかじめ用意した質問応答用テンプレートを利用して、質問文を生成し、生成した質問文を質問応答システムに入力しその検索結果を、ディスプレイの電子書物とは別の箇所に表示する。
このように、ユーザが興味を持っている単語を特定し、それに関する情報を、自動質問応答技術を利用して自動獲得し、ユーザに提示することができる。
(e):連想単語抽出装置を使用する読書支援の説明
連想単語抽出装置を使用する読書支援は、ユーザが興味を持っている単語を特定し、それに関するもの、または、連想されるものを提示し、ユーザの発想支援をするものである。
この連想単語抽出装置を使用する読書支援システムの構成は図11の「視線認識部2」の代わりに「音声認識部12」を使用するものである。この読書支援システムにおいて、連想単語抽出装置を使用する読書支援システム(装置)には、表示装置1、電子書物記憶部3、回数または時間計測部4、連想単語抽出装置10、音声認識部12が設けてある。表示装置1は、情報を表示するディスプレイである。電子書物記憶部3は、ユーザが読書する電子書物を記憶する格納手段である。回数または時間計測部4は、単語をつぶやいた回数を計測する計測手段である。連想単語抽出装置10は、つぶやいた回数が所定の値よりも大きい単語とよく共起する単語を、電子書物とは異なる場所にディスプレイ上で表示するものである。音声認識部12は、ユーザがつぶやいた単語を認識する音声認識装置でる。
(フローチャートによる説明)
図32は連想単語抽出装置を使用する処理フローチャートである。以下、図32の連想単語抽出装置を使用する読書支援システムの処理をS231〜S234に従って説明する。
S231:表示装置1は、ユーザの指示により、ディスプレイ画面に、電子書物記憶部3から読み出した電子書物を表示する。
S232:音声認識部12で、ユーザがつぶやいた単語を特定する。
S233:回数または時間計測部4は、単語ごとにユーザのつぶやいた回数を計測する。
S234:連想単語抽出装置10は、つぶやいた回数が所定の値よりも大きい単語とよく共起する単語を、電子書物とは異なる場所にディスプレイ上で表示する。
このように、ユーザが興味を持っている単語を特定し、それに関するもの、または、連想されるものを提示し、ユーザの発想支援をすることができる。
(f):文抽出装置を使用する読書支援の説明
文抽出装置を使用する読書支援は、ユーザがつぶやいた箇所を認識し、逆に電子書物においてユーザがつぶやいていない、すなわち読んでいない(視線を送っていない)箇所を特定して、そこから、重要な文章、概念を抽出し、ユーザにあまり見ていない箇所においてどのような重要な文章や概念が出ていたかを知らせるものである。
この文抽出装置を使用する読書支援システムの構成は図13の「視線認識部2」の代わりに「音声認識部12」を使用するものである。この読書支援システムにおいて、文抽出装置を使用する読書支援システム(装置)には、表示装置1、電子書物記憶部3、回数または時間計測部4、文抽出装置11、音声認識部12が設けてある。表示装置1は、情報を表示するディスプレイである。電子書物記憶部3は、ユーザが読書する電子書物を記憶する格納手段である。回数または時間計測部4は、単語をつぶやいた回数を計測する計測手段である。文抽出装置11は、つぶやいた回数が所定の値よりも小さい単語を抽出し、ユーザがあまり見ていない箇所において、重要な文章や概念を抽出してディスプレイ上で表示するものである。音声認識部12は、ユーザがつぶやいた単語を認識する音声認識装置でる。
(フローチャートによる説明)
(1) 図33は文抽出装置を使用する処理フローチャート(1) である。以下、図33の文抽出装置を使用する読書支援システム(1) の処理をS241〜S244に従って説明する。
S241:表示装置1は、ユーザの指示により、ディスプレイ画面に、電子書物記憶部3から読み出した電子書物を表示する。
S242:音声認識部12で、ユーザがつぶやいた単語を特定する。
S243:回数または時間計測部4は、単語ごとにユーザのつぶやいた回数を計測する。
S244:文抽出装置11は、つぶやいた回数が所定の値よりも小さい単語を抽出し、抽出された単語を、ディスプレイ上で、電子書物とは別の箇所に、単語とその回数を付けて表示する。
これにより、ユーザがあまりつぶやいたことのない単語を認識させることができる。
(2) 図34は文抽出装置を使用する処理フローチャート(2) である。以下、図34の文抽出装置を使用する読書支援システム(2) の処理をS251〜S254に従って説明する。
S251:表示装置1は、ユーザの指示により、ディスプレイ画面に、電子書物記憶部3から読み出した電子書物を表示する。
S252:音声認識部12で、ユーザがつぶやいた単語を特定する。
S253:回数または時間計測部4は、単語ごとにユーザのつぶやいた回数を計測する。
S254:文抽出装置11は、ユーザのつぶやいた回数が所定の値よりも小さい単語を抽出し、抽出された単語を、ディスプレイ上で、電子書物とは別の箇所に、単語とその単語のその電子書物中の出現回数を表示する。
これにより、ユーザがあまりつぶやいたことのない電子書物中の出現回数の多い単語を認識させることができる。
(3) 図35は文抽出装置を使用する処理フローチャート(3) である。以下、図35の文抽出装置を使用する読書支援システム(3) の処理をS261〜S264に従って説明する。
S261:表示装置1は、ユーザの指示により、ディスプレイ画面に、電子書物記憶部3から読み出した電子書物を表示する。
S262:音声認識部12で、ユーザがつぶやいた単語を特定する。
S263:回数または時間計測部4は、単語ごとにユーザがつぶやいた回数を計測する。
S264:文抽出装置11は、ユーザがつぶやいた回数が所定の値よりも小さい単語を抽出する。そして、この単語群を所定の個数以上含む文を、取り出して表示する。
これにより、ユーザがあまりつぶやいたことのない電子書物中の文を認識させることができる。
(4) 図36は文抽出装置を使用する処理フローチャート(4) である。以下、図36の文抽出装置を使用する読書支援システム(4) の処理をS271〜S274に従って説明する。
S271:表示装置1は、ユーザの指示により、ディスプレイ画面に、電子書物記憶部3から読み出した電子書物を表示する。
S272:音声認識部12で、ユーザがつぶやいた単語を特定する。
S273:回数または時間計測部4は、単語ごとにユーザがつぶやいた回数を計測する。
S274:文抽出装置11は、ユーザがつぶやいた回数が所定の値よりも小さい単語を抽出する。そして、この単語群を多く含む文を多い順に所定の数の文だけ、取り出して表示する。
これにより、ユーザがあまりつぶやいたことのない電子書物中の重要な文を認識させることができる。
(5) 図37は文抽出装置を使用する処理フローチャート(5) である。以下、図37の文抽出装置を使用する読書支援システム(5) の処理をS281〜S284に従って説明する。
S281:表示装置1は、ユーザの指示により、ディスプレイ画面に、電子書物記憶部3から読み出した電子書物を表示する。
S282:音声認識部12で、ユーザがつぶやいた単語を特定する。
S283:回数または時間計測部4は、単語ごとにユーザがつぶやいた回数を計測する。
S284:文抽出装置11は、ユーザがつぶやいた回数が所定の値よりも小さい単語を抽出する。そして、この単語群を異なりで所定の個数以上含む文を、取り出して表示する。ここで「異なり」は単語の種類を意味するものである。
これにより、ユーザがあまりつぶやいたことのない単語の種類を多く含む電子書物中の文を認識させることができる。
(6) 図38は文抽出装置を使用する処理フローチャート(6) である。以下、図38の文抽出装置を使用する読書支援システム(6) の処理をS291〜S294に従って説明する。
S291:表示装置1は、ユーザの指示により、ディスプレイ画面に、電子書物記憶部3から読み出した電子書物を表示する。
S292:音声認識部12で、ユーザがつぶやいた単語を特定する。
S293:回数または時間計測部4は、単語ごとにユーザがつぶやいた回数を計測する。
S294:文抽出装置11は、ユーザがつぶやいた回数が所定の値よりも小さい単語を抽出する。そして、この単語群を異なりで多く含む文を多い順に所定の数の文だけ、取り出して表示する。
これにより、ユーザがあまりつぶやいたことのない単語の種類を多く含む電子書物中の文を、重要な順に認識させることができる。
(7) 図39は文抽出装置を使用する処理フローチャート(7) である。以下、図39の文抽出装置を使用する読書支援システム(7) の処理をS301〜S304に従って説明する。
S301:表示装置1は、ユーザの指示により、ディスプレイ画面に、電子書物記憶部3から読み出した電子書物を表示する。
S302:音声認識部12で、ユーザがつぶやいた単語を特定する。
S303:回数または時間計測部4は、単語ごとにユーザがつぶやいた回数を計測する。
S304:文抽出装置11は、ユーザがつぶやいた回数が所定の値よりも小さい単語を抽出する。そして、この単語群を含む文で、その文に含まれる単語群のtfidf の値の和が所定の値よりも大きい文を取り出して表示する。
これにより、ユーザがあまりつぶやいたことのない重要な単語を多く含む電子書物中の文を、認識させることができる。
(8) 図40は文抽出装置を使用する処理フローチャート(8) である。以下、図40の文抽出装置を使用する読書支援システム(8) の処理をS311〜S314に従って説明する。
S311:表示装置1は、ユーザの指示により、ディスプレイ画面に、電子書物記憶部3から読み出した電子書物を表示する。
S312:音声認識部12で、ユーザがつぶやいた単語を特定する。
S313:回数または時間計測部4は、単語ごとにユーザがつぶやいた回数を計測する。
S314:文抽出装置11は、ユーザがつぶやいた回数が所定の値よりも小さい単語を抽出する。そして、この単語群を含む文で、その文に含まれる単語群のtfidf の値の和が大きいものを大きい順に所定の値の個数取り出して表示する。
これにより、ユーザがあまりつぶやいたことのない重要な単語を多く含む電子書物中の文を、重要な順に認識させることができる。
(14):時系列的効果を出す説明
だいぶ前に視線を送った箇所については小さくなるような重みをつけて回数や時間を計算することができる。または、だいぶ前に視線を送った箇所については計測しないなどとすることもできる。
時系列的効果を出すには、一定時間ごとに色付けすることにして、例えば、
最近 10 分以内は赤
最近 60 分以内は黄
最近 1日以内は 緑
最近 1月以内は 青
と決めておき、その期間だけで、上述のアルゴリズムを実行し、強調表示する際に、それぞれの期間だけで実行した結果については、それぞれの期間に対応する色で表示することができる。複数の色を出せる場合は、期間の短い方の色を選択するようにできる。また、キーワード強調でなく、単語群を示す場合は、右軸に時間軸をとって単語群を示す。例えば、
10分以内 60分以内 1日以内 1月以内
単語1 単語1 単語1 単語1
単語2 ... ... ...
...
などの表示にする。
また、期間ごとにわけて、よく見ていた単語を表示するようにもできる。そして、連想単語も上記のように期間ごとにわけて表示することもできる。
さらに、時系列的に得られた単語群を時間ごとにわけて表示し、その単語に関連する情報検索や質問応答の結果も表示するとができる。また、情報検索、質問応答の結果は常に表示するのではなく、隠しておいて、該当単語をクリックすると表示されるような構成にすることもできる。また、古いものは上記のように隠しておいて、新しいものだけを表示しておくなどとしてもよい。
(15):単語の頻度の求め方の説明
単語の頻度は、異なる場所に出現した単語を見た回数、時間であり、例えば、次のように単純に加算する他にもいろいろな方法がある。
(1) 単純に加算
単語Aが 3箇所に出現
一つ目の単語Aを 3秒
二つ目の単語Aを 30 秒
三つ目の単語Aを 20 秒
それぞれ見た場合、単語Aの見た時間は 53 秒とする。
(2) MAX だけを利用
単語Aが 3箇所に出現
一つ目の単語Aを 3秒
二つ目の単語Aを 30 秒
三つ目の単語Aを 20 秒
それぞれ見た場合、単語Aの見た時間は 30 秒として扱う。
(3) MIN だけを利用
単語Aが 3箇所に出現
一つ目の単語Aを 3秒
二つ目の単語Aを 30 秒
三つ目の単語Aを 20 秒
それぞれ見た場合、単語Aの見た時間は 3秒として扱う。
(4) 平均を利用
単語Aが 3箇所に出現
一つ目の単語Aを 3秒
二つ目の単語Aを 30 秒
三つ目の単語Aを 20 秒
それぞれ見た場合、単語Aの見た時間は 53/3 = 17.7秒として扱う。
(5) 重みをつけて加算
単語Aが 3箇所に出現
一つ目の単語Aを 3秒
二つ目の単語Aを 30 秒
三つ目の単語Aを 20 秒
それぞれ見た場合、まず時間の大きい順に並べかえて
二つ目の単語Aを 30 秒
三つ目の単語Aを 20 秒
一つ目の単語Aを 3秒
そして、二個目を k倍 (k は1 より小さい) して加算、三個目を k^2 倍 (k は1 より小さい) して加算、n 個目を k^(n-1) 倍 (k は1 より小さい) して加算する。
例えば、k = 0.3 とすると、単語Aの見た時間は、次のものとして扱う。
30 + 20×0.3 + 3 ×0.3 ×0.3 = 36.27 秒
このように、単語の頻度は、単純に加算する他にもいろいろな方法をとることができる。
(16):発想支援装置の説明
ある一定時間内に、視線のいった、回数、時間が多い単語をまず数個取り出し、表示する。次にそれら単語から連想される単語を表示する。
また、ある一定時間内に、視線のいった、回数、時間が多い単語をまず数個取り出し、表示する。次にそれら単語から連想される単語を表示する。
これを繰り返すようにする。
表示位置は、例えば、時間的に古いものが左の方、新しいものが右に来るようにならべてもよい。また、視線により取り出した単語と、連想により抽出した単語を色を変えて表示することもできる。
また、上下二段表示にし、上段に、視線により取り出した単語群を、下段に、連想により抽出した単語群を表示してもよい。
また、これらの視線により取り出した単語と連想により抽出した単語は、単語自体の類似性の情報を利用して、上下方向は、良く似た単語が近くに来るように配置してもよい。さらに、これらの良く似た単語を上下方向に配置する代わりに、色分けして表示することもできる。
(類似性の情報の説明)
単語の類似性の情報としては、分類語彙表が便利である。例えば、分類語彙表だと単語に10桁の数字が振られ、この数字の一致の割合で類似度を求められる。
例えば、
日本 12590 01 012
ソ連 12590 04 192
最初の5 桁が一致するので、類似度5
母校 12630 13 015
学校 12630 10 012
最初の5 桁が一致するので、類似度5
学校 12630 10 012
学園 12630 10 015
最初の5 桁が一致するので、類似度7
学校 12630 10 012
ソ連 12590 04 192
最初の2 桁が一致するので、類似度2
になる。分類語彙表は 6,7桁、 8,9,10 桁をくっつけて考えることになるため、上記のようになる。
分類語彙表を使った論文には次のものがある。
“意味ソートmsort --- 意味的並べかえ手法による辞書の構築例とタグつきコーパスの作成例と情報提示システム例 ---”村田真樹,神崎享子,内元清貴,馬青,井佐原均、自然言語処理( 言語処理学会誌) 、 2000 年 1月,7 巻,1 号,p.51〜 p.66
これで類似度を求めて類似しているものを近くに配置するようにしてもよい。例えば、分類語彙表の分類番号の数字の順に並べるなど。
(SOMを使用する場合の説明)
自己組織化型神経回路網モデルである自己組織化マップ(Self-Organizing Map,略してSOM)がある。SOMは高次元入力を持つ2次元配列のノードで構成され、自己組織化によって、高次元データをその特徴を反映するように2次元空間にマッピングすることができる。ここで用語(ノード)間の意味的に近い単語どうしは近いところに、意味的に遠い単語どうしは離れたところに配置されるような、単言語の意味マップの自動構築手法がある。そして、可視化の方法として、次の発表論文がある。
村田真樹,馬青,白土保,井佐原均“用語抽出用評価データの作成とその利用”言語処理学会第10回年次大会併設ワークショップ「固有表現と専門用語」2004年.東京工業大学.
この論文の可視化の方法で上下方向に配置するという手があり、SOMの次元を上下だけ大きな値にして、左右を次元1にすれば縦方向にならべるということができる。
また、視線により抽出された単語と、その単語から連想された単語は、表示において線で結んでおくこともできる。
(17):プログラムインストールの説明
表示装置1、視線認識部2、回数または時間計測部4、処理手段5、キーワード強調部6、抽出単語群表示部7、情報検索装置8、質問応答装置9、連想単語抽出装置10、文抽出装置11、音声認識部12等は、プログラムで構成でき、主制御部(CPU)が実行するものであり、主記憶に格納されているものである。このプログラムは、一般的な、コンピュータで処理されるものである。このコンピュータは、主制御部、主記憶、ファイル装置、表示装置、キーボード等の入力手段である入力装置などのハードウェアで構成されている。
このコンピュータに、本発明のプログラムをインストールする。このインストールは、フロッピィ、光磁気ディスク等の可搬型の記録(記憶)媒体に、これらのプログラムを記憶させておき、コンピュータが備えている記録媒体に対して、アクセスするためのドライブ装置を介して、或いは、LAN等のネットワークを介して、コンピュータに設けられたファイル装置にインストールされる。そして、このファイル装置から処理に必要なプログラムステップを主記憶に読み出し、主制御部が実行するものである。
本発明の原理説明図である。 本発明のキーワード強調部を使用する読書支援システムの説明図である。 本発明のキーワード強調部を使用する処理フローチャート(1)である。 本発明の抽出単語群表示部を使用する読書支援システムの説明図である。 本発明の抽出単語群表示部を使用する処理フローチャートである。 本発明のキーワード強調部を使用する処理フローチャート(2)である。 本発明の情報検索装置を使用する読書支援システムの説明図である。 本発明の情報検索装置を使用する処理フローチャートである。 本発明の質問応答装置を使用する読書支援システムの説明図である。 本発明の質問応答装置を使用する処理フローチャートである。 本発明の連想単語抽出装置を使用する読書支援システムの説明図である。 本発明の連想単語抽出装置を使用する処理フローチャートである。 本発明の文抽出装置を使用する読書支援システムの説明図である。 本発明の文抽出装置を使用する処理フローチャート(1) である。 本発明の文抽出装置を使用する処理フローチャート(2) である。 本発明の文抽出装置を使用する処理フローチャート(3) である。 本発明の文抽出装置を使用する処理フローチャート(4) である。 本発明の文抽出装置を使用する処理フローチャート(5) である。 本発明の文抽出装置を使用する処理フローチャート(6) である。 本発明の文抽出装置を使用する処理フローチャート(7) である。 本発明の文抽出装置を使用する処理フローチャート(8) である。 本発明の重要文強調を行う処理フローチャートである。 本発明の重要文を別ウィンドウで表示する処理フローチャートである。 本発明の連想単語から重要文強調を行う処理フローチャートである。 本発明の連想単語から重要文を別ウィンドウで表示する処理フローチャートである。 本発明の音声認識部を使用する読書支援システムの説明図である。 本発明のキーワード強調部を使用する処理フローチャートである。 本発明の抽出単語群表示部を使用する処理フローチャートである。 本発明のキーワード強調部を使用する処理フローチャート(2) である。 本発明の情報検索装置を使用する処理フローチャートである。 本発明の質問応答装置を使用する処理フローチャートである。 本発明の連想単語抽出装置を使用する処理フローチャートである。 本発明の文抽出装置を使用する処理フローチャート(1) である。 本発明の文抽出装置を使用する処理フローチャート(2) である。 本発明の文抽出装置を使用する処理フローチャート(3) である。 本発明の文抽出装置を使用する処理フローチャート(4) である。 本発明の文抽出装置を使用する処理フローチャート(5) である。 本発明の文抽出装置を使用する処理フローチャート(6) である。 本発明の文抽出装置を使用する処理フローチャート(7) である。 本発明の文抽出装置を使用する処理フローチャート(8) である。
符号の説明
1 表示装置
2 視線認識部
3 電子書物記憶部
4 回数または時間計測部
5 処理手段

Claims (21)

  1. 電子化された文章を表示する表示装置と、
    ユーザの視線が電子化された文章のどこにあるかを特定する視線認識部と、
    ユーザの視線が送られた周辺範囲を取り出し、その範囲にあった単語を抽出し、単語ごとにユーザの視線が送られた回数又は合計時間を計測する回数または時間計測部と、
    前記単語ごとのユーザの視線が送られた回数又は合計時間によりユーザの読書を支援する処理手段とを備えることを特徴とした読書支援システム。
  2. 前記処理手段は、前記ユーザの視線が送られた回数又は時間が所定の値よりも、大きい単語を前記電子化された文章において強調表示するキーワード強調部を備えることを特徴とした請求項1記載の読書支援システム。
  3. 前記処理手段は、前記表示装置の画面上で、電子化された文章とは別の箇所に、前記ユーザの視線が送られた単語とその回数又は合計時間を付けて表示する抽出単語群表示部を備えることを特徴とした請求項1記載の読書支援システム。
  4. 前記処理手段は、前記ユーザの視線が送られた回数又は合計時間が所定の値よりも大きい単語について、その単語を情報検索システムのキーワードとして利用して検索し、その検索結果を、前記表示装置の画面の電子化された文章とは別の箇所に表示する情報検索装置を備えることを特徴とした請求項1記載の読書支援システム。
  5. 前記処理手段は、前記ユーザの視線が送られた回数又は合計時間が所定の値よりも大きい単語について、その単語と、あらかじめ用意した質問応答用テンプレートを利用して、質問文を生成し、生成した質問文を質問応答システムに入力しその検索結果を、前記表示装置の画面の電子化された文章とは別の箇所に表示する質問応答装置を備えることを特徴とした請求項1記載の読書支援システム。
  6. 前記処理手段は、前記ユーザの視線が送られた回数又は合計時間が所定の値よりも大きい単語とよく共起する単語を、電子化された文章とは異なる場所に前記表示装置の画面上で表示する連想単語抽出装置を備えることを特徴とした請求項1記載の読書支援システム。
  7. 前記処理手段は、前記ユーザの視線が送られた回数又は合計時間が所定の値よりも大きい単語とよく共起する単語を、電子化された文章で強調表示する連想単語抽出装置を備えることを特徴とした請求項1記載の読書支援システム。
  8. 前記処理手段は、前記単語を表示する場合、前記ユーザが視線を送った期間ごとにわけて表示することを特徴とした請求項2又は3又は6又は7記載の読書支援システム。
  9. 前記処理手段は、前記単語を表示する場合、前記単語の類似度を求めて、良く似た単語を近くに配置することを特徴とした請求項3又は6記載の読書支援システム。
  10. 前記処理手段は、前記ユーザの視線が一定時間内に送られた回数又は合計時間が所定の値よりも大きい単語とよく共起する単語を抽出し、該抽出した単語を情報検索システムのキーワードとして利用して検索し、その検索結果を、前記表示装置の画面の電子化された文章とは別の箇所に表示する情報検索装置を備えることを特徴とした請求項1記載の読書支援システム。
  11. 前記処理手段は、前記ユーザの視線が一定時間内に送られた回数又は合計時間が所定の値よりも大きい単語とよく共起する単語を抽出し、該抽出した単語と、あらかじめ用意した質問応答用テンプレートを利用して、質問文を生成し、生成した質問文を質問応答システムに入力しその検索結果を、前記表示装置の画面の電子化された文章とは別の箇所に表示する質問応答装置を備えることを特徴とした請求項1記載の読書支援システム。
  12. 前記処理手段は、前記ユーザの視線が送られた回数又は合計時間が所定の値よりも大きい単語を認識し、そこから、重要な文章、概念を抽出し、ユーザに読んだ箇所においてどのような重要な文章や概念が出ていたかを前記表示装置の画面上で表示する文抽出装置を備えることを特徴とした請求項1記載の読書支援システム。
  13. 前記処理手段は、前記ユーザの視線が送られた回数又は合計時間が所定の値よりも大きい単語を認識し、該認識した単語が多く現れる文を重要な文として抽出し、該抽出した文を強調表示する文抽出装置とを備えることを特徴とした請求項12記載の読書支援システム。
  14. 前記処理手段は、前記ユーザの視線が送られた回数又は合計時間が所定の値よりも大きい単語を認識し、該認識した単語が多く現れる文を重要な文として抽出し、該抽出した文を前記表示装置の画面の電子化された文章とは別の箇所に表示する文抽出装置とを備えることを特徴とした請求項12記載の読書支援システム。
  15. 前記処理手段は、前記ユーザの視線が送られた回数又は合計時間が所定の値よりも大きい単語とよく共起する単語を抽出し、該抽出した単語を多く含む文を重要な文として抽出し、該抽出した文を強調表示する文抽出装置とを備えることを特徴とした請求項12記載の読書支援システム。
  16. 前記処理手段は、前記ユーザの視線が送られた回数又は合計時間が所定の値よりも大きい単語とよく共起する単語を抽出し、該抽出した単語を多く含む文を重要な文として抽出し、該抽出した文を前記表示装置の画面の電子化された文章とは別の箇所に表示する文抽出装置とを備えることを特徴とした請求項12記載の読書支援システム。
  17. 前記処理手段は、前記計測した単語ごとにユーザの視線が送られた回数又は合計時間から、前記ユーザの視線が送られた回数又は合計時間が所定の値よりも小さい単語を抽出し、該抽出した単語を用いることを特徴とした請求項1〜16記載の読書支援システム。
  18. 前記処理手段は、前記計測した単語ごとにユーザの視線が送られた回数又は合計時間から、前記ユーザの視線が送られた回数又は合計時間が所定の値よりも小さい単語を抽出し、そこから、重要な文章、概念を抽出し、ユーザにあまり見ていない箇所においてどのような重要な文章や概念が出ていたかを前記表示装置の画面上に表示する文抽出装置を備えることを特徴とした請求項1記載の読書支援システム。
  19. 前記回数または時間計測部は、ユーザの視線がだいぶ前に送られた箇所については小さくなるような重みを付けて、前記回数又は合計時間を計測することを特徴とした請求項1〜18のいずれかに記載の読書支援システム。
  20. 前記視線認識部の代わりに音声認識部を使用し、
    前記音声認識部でユーザのつぶやいた単語を特定し、
    前記回数または時間計測部で前記ユーザのつぶやいた単語を、該単語ごとの回数として計測することを特徴とした請求項1〜19のいずれかに記載の読書支援システム。
  21. 電子化された文章を表示する表示装置と、
    ユーザの視線が電子化された文章のどこにあるかを特定する視線認識部と、
    ユーザの視線が送られた周辺範囲を取り出し、その範囲にあった単語を抽出し、単語ごとにユーザの視線が送られた回数又は合計時間を計測する回数または時間計測部と、
    前記単語ごとのユーザの視線が送られた回数又は合計時間によりユーザの読書を支援する処理手段として、
    コンピュータを機能させるためのプログラム。
JP2005335781A 2005-11-21 2005-11-21 読書支援システム及びプログラム Pending JP2007141059A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005335781A JP2007141059A (ja) 2005-11-21 2005-11-21 読書支援システム及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005335781A JP2007141059A (ja) 2005-11-21 2005-11-21 読書支援システム及びプログラム

Publications (1)

Publication Number Publication Date
JP2007141059A true JP2007141059A (ja) 2007-06-07

Family

ID=38203821

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005335781A Pending JP2007141059A (ja) 2005-11-21 2005-11-21 読書支援システム及びプログラム

Country Status (1)

Country Link
JP (1) JP2007141059A (ja)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011227855A (ja) * 2010-04-20 2011-11-10 Tomohiro Tsuta 読解状態マッピング装置、読解状態マッピング装置作動方法、読解状態マッピングプログラム、及びコンピュータ読み取り可能な記録媒体
JP2013037590A (ja) * 2011-08-09 2013-02-21 Fujitsu Ltd 目視対象物判定装置、目視対象物判定方法および目視対象物判定プログラム
WO2013046942A1 (ja) * 2011-09-26 2013-04-04 Necカシオモバイルコミュニケーションズ株式会社 表示装置
JP2013210907A (ja) * 2012-03-30 2013-10-10 Dainippon Printing Co Ltd 視点誘導装置および電子書籍端末
JP2013225226A (ja) * 2012-04-23 2013-10-31 Kyocera Corp 情報端末、表示制御プログラムおよび表示制御方法
JP2014048689A (ja) * 2012-08-29 2014-03-17 Konica Minolta Inc 検索支援システム、検索支援方法、およびコンピュータプログラム
JP2014048888A (ja) * 2012-08-31 2014-03-17 Konica Minolta Inc 単語重要度算出装置、単語重要度算出方法、およびコンピュータプログラム
JP2014178358A (ja) * 2013-03-13 2014-09-25 Casio Comput Co Ltd 学習支援装置、学習支援方法、学習支援プログラム、学習支援システム、およびサーバ装置、端末装置
JP2015032274A (ja) * 2013-08-06 2015-02-16 富士通株式会社 精読判断装置、精読判断方法及び精読判断プログラム
JP2015084221A (ja) * 2013-10-25 2015-04-30 由田新技股▲ふん▼有限公司 電子文書にマーキングするための方法および装置
KR20160097689A (ko) * 2015-02-09 2016-08-18 네이버 주식회사 통계 데이터 제공 방법 및 통계 데이터 제공 장치
US9483109B2 (en) 2012-07-12 2016-11-01 Spritz Technology, Inc. Methods and systems for displaying text using RSVP
JP2017004366A (ja) * 2015-06-12 2017-01-05 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 表示制御方法、表示制御装置及び制御プログラム
JP2017004466A (ja) * 2015-06-16 2017-01-05 富士通株式会社 注目値算出装置、コンピュータプログラム及び注目値算出方法
US9552596B2 (en) 2012-07-12 2017-01-24 Spritz Technology, Inc. Tracking content through serial presentation
US9632661B2 (en) 2012-12-28 2017-04-25 Spritz Holding Llc Methods and systems for displaying text using RSVP
KR101796221B1 (ko) * 2016-11-24 2017-11-10 네이버 주식회사 통계 데이터 제공 방법 및 통계 데이터 제공 장치
JP2018189726A (ja) * 2017-04-28 2018-11-29 日本電信電話株式会社 情報処理装置、情報処理方法および情報処理プログラム
JP2022012765A (ja) * 2020-07-02 2022-01-17 トヨタ自動車株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
JP2023125592A (ja) * 2022-02-28 2023-09-07 キヤノンマーケティングジャパン株式会社 情報処理システム、情報処理方法、プログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002169637A (ja) * 2000-12-04 2002-06-14 Fuji Xerox Co Ltd ドキュメント表示態様変換装置、ドキュメント表示態様変換方法、記録媒体

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002169637A (ja) * 2000-12-04 2002-06-14 Fuji Xerox Co Ltd ドキュメント表示態様変換装置、ドキュメント表示態様変換方法、記録媒体

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011227855A (ja) * 2010-04-20 2011-11-10 Tomohiro Tsuta 読解状態マッピング装置、読解状態マッピング装置作動方法、読解状態マッピングプログラム、及びコンピュータ読み取り可能な記録媒体
JP2013037590A (ja) * 2011-08-09 2013-02-21 Fujitsu Ltd 目視対象物判定装置、目視対象物判定方法および目視対象物判定プログラム
WO2013046942A1 (ja) * 2011-09-26 2013-04-04 Necカシオモバイルコミュニケーションズ株式会社 表示装置
JP2013069211A (ja) * 2011-09-26 2013-04-18 Nec Casio Mobile Communications Ltd 表示装置、表示方法およびプログラム
US9395814B2 (en) 2011-09-26 2016-07-19 Nec Corporation Display device
JP2013210907A (ja) * 2012-03-30 2013-10-10 Dainippon Printing Co Ltd 視点誘導装置および電子書籍端末
US9317936B2 (en) 2012-04-23 2016-04-19 Kyocera Corporation Information terminal and display controlling method
JP2013225226A (ja) * 2012-04-23 2013-10-31 Kyocera Corp 情報端末、表示制御プログラムおよび表示制御方法
US9483109B2 (en) 2012-07-12 2016-11-01 Spritz Technology, Inc. Methods and systems for displaying text using RSVP
US10332313B2 (en) 2012-07-12 2019-06-25 Spritz Holding Llc Methods and systems for displaying text using RSVP
US9552596B2 (en) 2012-07-12 2017-01-24 Spritz Technology, Inc. Tracking content through serial presentation
JP2014048689A (ja) * 2012-08-29 2014-03-17 Konica Minolta Inc 検索支援システム、検索支援方法、およびコンピュータプログラム
JP2014048888A (ja) * 2012-08-31 2014-03-17 Konica Minolta Inc 単語重要度算出装置、単語重要度算出方法、およびコンピュータプログラム
US11644944B2 (en) 2012-12-28 2023-05-09 Spritz Holding Llc Methods and systems for displaying text using RSVP
US10983667B2 (en) 2012-12-28 2021-04-20 Spritz Holding Llc Methods and systems for displaying text using RSVP
US9632661B2 (en) 2012-12-28 2017-04-25 Spritz Holding Llc Methods and systems for displaying text using RSVP
US10712916B2 (en) 2012-12-28 2020-07-14 Spritz Holding Llc Methods and systems for displaying text using RSVP
JP2014178358A (ja) * 2013-03-13 2014-09-25 Casio Comput Co Ltd 学習支援装置、学習支援方法、学習支援プログラム、学習支援システム、およびサーバ装置、端末装置
JP2015032274A (ja) * 2013-08-06 2015-02-16 富士通株式会社 精読判断装置、精読判断方法及び精読判断プログラム
JP2015084221A (ja) * 2013-10-25 2015-04-30 由田新技股▲ふん▼有限公司 電子文書にマーキングするための方法および装置
KR101685106B1 (ko) * 2015-02-09 2016-12-09 네이버 주식회사 통계 데이터 제공 방법 및 통계 데이터 제공 장치
CN107209774A (zh) * 2015-02-09 2017-09-26 纳宝株式会社 统计数据提供方法及统计数据提供装置
JP2018509721A (ja) * 2015-02-09 2018-04-05 ネイバー コーポレーションNAVER Corporation 統計データ提供方法及び統計データ提供装置
WO2016129787A1 (ko) * 2015-02-09 2016-08-18 네이버 주식회사 통계 데이터 제공 방법 및 통계 데이터 제공 장치
US11106277B2 (en) 2015-02-09 2021-08-31 Naver Corporation Cartoon statistical reading data method and apparatus
KR20160097689A (ko) * 2015-02-09 2016-08-18 네이버 주식회사 통계 데이터 제공 방법 및 통계 데이터 제공 장치
JP2017004366A (ja) * 2015-06-12 2017-01-05 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 表示制御方法、表示制御装置及び制御プログラム
JP2017004466A (ja) * 2015-06-16 2017-01-05 富士通株式会社 注目値算出装置、コンピュータプログラム及び注目値算出方法
KR101796221B1 (ko) * 2016-11-24 2017-11-10 네이버 주식회사 통계 데이터 제공 방법 및 통계 데이터 제공 장치
JP2018189726A (ja) * 2017-04-28 2018-11-29 日本電信電話株式会社 情報処理装置、情報処理方法および情報処理プログラム
JP2022012765A (ja) * 2020-07-02 2022-01-17 トヨタ自動車株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
JP2023125592A (ja) * 2022-02-28 2023-09-07 キヤノンマーケティングジャパン株式会社 情報処理システム、情報処理方法、プログラム
JP7545061B2 (ja) 2022-02-28 2024-09-04 キヤノンマーケティングジャパン株式会社 情報処理システム、情報処理方法、プログラム

Similar Documents

Publication Publication Date Title
Arora et al. Character level embedding with deep convolutional neural network for text normalization of unstructured data for Twitter sentiment analysis
JP3981734B2 (ja) 質問応答システムおよび質問応答処理方法
JP2007141059A (ja) 読書支援システム及びプログラム
Moens Automatic indexing and abstracting of document texts
US7234942B2 (en) Summarisation representation apparatus
JP5008024B2 (ja) 風評情報抽出装置及び風評情報抽出方法
Alqaisi et al. Extractive multi-document Arabic text summarization using evolutionary multi-objective optimization with K-medoid clustering
US20150081277A1 (en) System and Method for Automatically Classifying Text using Discourse Analysis
KR101136007B1 (ko) 문서 감성 분석 시스템 및 그 방법
Sarkar et al. Machine learning based keyphrase extraction: comparing decision trees, naïve Bayes, and artificial neural networks
JP2008287517A (ja) 強調表示装置及びプログラム
Arumugam et al. Hands-On Natural Language Processing with Python: A practical guide to applying deep learning architectures to your NLP applications
Lloret Text summarization: an overview
Dunn Natural language processing for corpus linguistics
Villalon et al. Concept extraction from student essays, towards concept map mining
Bhatia et al. Topic intrusion for automatic topic model evaluation
JP2019121139A (ja) 要約装置、要約方法、及び要約プログラム
Yun Ying et al. Opinion mining on Viet Thanh Nguyen’s the sympathizer using topic modelling and sentiment analysis
Potthast Technologies for reusing text from the web
Sarmah et al. Survey on word sense disambiguation: an initiative towards an Indo-Aryan language
JP5213098B2 (ja) 質問応答方法及びシステム
Kaur et al. Natural language processing interface for synonym
JP2006139484A (ja) 情報検索方法及びそのシステム並びにコンピュータプログラム
Tian et al. Period classification in Chinese historical texts
JP2004220226A (ja) 検索文書のための文書分類方法及び装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081015

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110404

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111122

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120403