JP4634461B2 - Document text-to-speech processing program and document browsing device - Google Patents
Document text-to-speech processing program and document browsing device Download PDFInfo
- Publication number
- JP4634461B2 JP4634461B2 JP2007537485A JP2007537485A JP4634461B2 JP 4634461 B2 JP4634461 B2 JP 4634461B2 JP 2007537485 A JP2007537485 A JP 2007537485A JP 2007537485 A JP2007537485 A JP 2007537485A JP 4634461 B2 JP4634461 B2 JP 4634461B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- configuration information
- page configuration
- processing
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 claims description 125
- 238000007726 management method Methods 0.000 claims description 50
- 230000006870 function Effects 0.000 claims description 26
- 238000013523 data management Methods 0.000 claims description 14
- 230000010365 information processing Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 16
- 230000015572 biosynthetic process Effects 0.000 description 11
- 238000003786 synthesis reaction Methods 0.000 description 11
- 238000004886 process control Methods 0.000 description 8
- 230000006854 communication Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 239000000284 extract Substances 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/14—Tree-structured documents
- G06F40/143—Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は,HTML(HyperText Markup Language)などのマークアップ言語で記述された構造化ドキュメントを表示処理してユーザに閲覧させ,かつ,表示したドキュメントのテキスト要素を音声合成処理して出力するドキュメント内テキスト読み上げ処理を,コンピュータに実行させるためのドキュメント内テキスト読み上げ処理プログラム,および前記ドキュメント内テキスト読み上げ処理を実行する処理手段を備えたドキュメント閲覧装置に関する。 In the present invention, a structured document described in a markup language such as HTML (HyperText Markup Language) is displayed and processed by a user, and a text element of the displayed document is processed by speech synthesis and output. The present invention relates to an in-document text-to-speech processing program for causing a computer to execute text-to-speech processing, and a document browsing apparatus having processing means for executing the in-document text to-speech processing.
コンピュータのデータ処理機能のひとつとして,テキストデータを音声合成処理して出力するというテキスト読み上げ処理機能がある。このテキスト読み上げ処理機能によって,ユーザは,表示装置や印刷装置によって出力された文書を閲覧する代わりに,スピーカから出力される音声データを聞くことによって,その内容を把握することができる。 As one of the data processing functions of a computer, there is a text-to-speech processing function that outputs text data after speech synthesis processing. With this text-to-speech processing function, the user can grasp the contents by listening to the audio data output from the speaker instead of browsing the document output by the display device or the printing device.
例えば,インターネット上の情報であるウェブページ(Webページ)を表示処理するHTMLドキュメント閲覧プログラムのなかには,表示装置に表示させたウェブページ内のテキストデータ部分を音声合成処理して生成した音声データを出力するテキスト読み上げ処理機能を備えたものがある。 For example, in an HTML document browsing program for displaying a web page (Web page) that is information on the Internet, speech data generated by speech synthesis processing of a text data portion in the web page displayed on the display device is output. Some have a text-to-speech processing function.
しかし,HTMLで記述されたウェブページは,表示装置に表示されてユーザに閲覧させることを想定して作成されているため,閲覧操作のナビゲーション・メニュー,広告バナーなどの要素や,アンカータグによって指定されたリンク情報などが組み込まれている。このようなナビゲーション・メニュー,広告バナーには文字列が含まれる場合もあるため,HTMLドキュメント内のすべての文字列を読み上げ処理の対象として扱うと,様々な情報が混在して出力されることになり,ユーザは不要な情報までも聞かされることになる。 However, web pages written in HTML are created on the assumption that they are displayed on the display device and allowed to be viewed by the user, so they are specified by elements such as navigation menus for viewing operations, advertisement banners, and anchor tags. The link information etc. which were done are incorporated. Since such navigation menus and advertisement banners may contain character strings, if all character strings in an HTML document are treated as the target of reading-out processing, various information is mixedly output. Thus, the user is also asked about unnecessary information.
そして,これらの閲覧操作用の情報を読み上げ処理の対象から除外するために,ウェブページ表示処理用に生成されるDOM(Document Object Model)ツリー情報を用いて,ウェブページ内のナビゲーション・メニュー部分を判別し,これらの部分のテキストデータを読み上げ処理の対象から除外して読み上げ処理を実行するような方法が知られている(例えば,特許文献1参照)。
インターネットのウェブページの中には,ユーザが閲覧しやすいように一連のページが所定の形式にしたがって構成されているものがある。例えば,ニュースサーバで提供されるニュースサイトのウェブページには,ページにヘッダ部,メイン部,フッタ部を設けた構成を各ページで共通して使用しているものがある。各ページは,ヘッダ部にナビゲーション用の関連ページへのリンク情報を,フッタ部にページやサービスについての補足的説明や著作権などを表示させ,メイン部に本来の提供目的であるニュースなどを表示させるようにしている。 Some Internet web pages have a series of pages configured according to a predetermined format so that the user can easily browse. For example, some web pages of news sites provided by a news server commonly use a configuration in which a header part, a main part, and a footer part are provided on each page. Each page displays the link information to the related page for navigation in the header, the supplementary explanation and copyright of the page and service in the footer, and the news that is the original provision purpose in the main part I try to let them.
このような統一した形式によって構成されている複数ページについて読み上げ処理を行う場合に,ヘッダ部やフッタ部に同じ内容が表示されているため,通常どおりにページの先頭から読み上げ処理をすると,同じ内容がページごとに重複して読み上げられ,ユーザにとって煩わしい。 When reading out multiple pages configured in such a unified format, the same contents are displayed in the header and footer sections. Is duplicated for each page, which is troublesome for the user.
さらに,読み上げているテキストデータ中にリンク情報がある場合に,リンク先の情報が既に読み上げたものであれば,再度自動ジャンプ処理して情報を読み上げる必要はない。 Furthermore, when there is link information in the text data being read out, if the link destination information has already been read out, there is no need to read the information again by automatic jump processing.
本発明の目的は,ウェブページ間で繰り返し表示される情報や一度読み上げられた情報を,読み上げ処理の対象から外して読み上げ処理を行うことによって,ユーザが必要とする情報を効率的に読み上げることができるテキスト読み上げ処理を,コンピュータに実行させるためのプログラムを提供することである。 An object of the present invention is to efficiently read out information required by a user by removing information that is repeatedly displayed between web pages or information that has been read out from the target of the reading process and performing the reading process. It is to provide a program for causing a computer to execute a text-to-speech process that can be performed.
また,本発明の別の目的は,前記テキスト読み上げ処理を実行する処理手段を備えるドキュメント閲覧装置を提供することである。 Another object of the present invention is to provide a document browsing apparatus provided with processing means for executing the text reading process.
本発明は,コンピュータに,マークアップ言語で記述され構造化されたドキュメント内のテキストの読み上げ処理として,1)テキスト要素が読み上げ処理されたドキュメントのページ構成情報をページ構成情報記憶手段に格納するページ構成情報格納処理と,2)現在の表示対象とされているドキュメントのページ構成情報を取得するページ構成情報取得処理と,3)表示対象のドキュメントのページ構成情報とページ構成情報記憶手段に記憶されているページ構成情報とを比較し,表示対象のドキュメントのページ構成情報から,記憶されたページ構成情報のテキスト要素と一致しないテキスト要素を取り出し,取り出したテキスト要素を読み上げ処理対象として設定する読み上げ範囲設定処理と,4)表示処理対象のドキュメントにおいて読み上げ処理対象に設定されたテキスト要素を音声データに変換処理して出力する読み上げ処理とを,実行させるためのプログラムである。 According to the present invention, as a text-to-speech process in a document described and structured in a markup language on a computer, 1) a page for storing page configuration information of a document whose text elements have been read-out in page configuration information storage means Configuration information storage processing, 2) page configuration information acquisition processing for acquiring page configuration information of the document currently displayed, and 3) page configuration information and page configuration information storage means for the display target document A reading range in which the text elements that do not match the text elements of the stored page structure information are extracted from the page structure information of the document to be displayed, and the extracted text elements are set as the reading target. Setting process, and 4) display processing target document And reading processing and outputs the conversion process to the audio data set text elements processed speech Te, a program for executing.
本発明は,以下のように作用する。 The present invention operates as follows.
本発明がインストールされたコンピュータでは,例えば,テキスト要素が読み上げ処理されたHTMLドキュメントのDOMツリー情報など,HTMLドキュメント表示処理用のページ構成について,各要素および前記各要素の階層構造を解析したドキュメントのページ構成情報をページ構成情報記憶手段に格納しておく。そして,表示処理対象とされているドキュメントのページ構成情報と,ページ構成情報記憶手段に記憶しておいた過去に読み上げ処理をしたドキュメントのページ構成情報とを比較し,表示処理対象のドキュメントのページ構成情報と記憶してあるページ構成情報とにおいて重複するテキスト要素以外のテキスト要素を取り出し,取り出したテキスト要素を読み上げ処理対象に設定する。そして,現在表示処理しているドキュメント内の読み上げ処理対象に設定されたテキスト要素を音声データに変換処理して出力する読み上げ処理が実行される。 In the computer in which the present invention is installed, for example, a page structure for HTML document display processing such as DOM tree information of an HTML document in which a text element is read out, a document that is analyzed for each element and the hierarchical structure of each element. The page configuration information is stored in the page configuration information storage means. Then, the page configuration information of the document to be displayed is compared with the page configuration information of the previously read-out document stored in the page configuration information storage means, and the page of the document to be displayed is compared. Text elements other than text elements that overlap in the configuration information and the stored page configuration information are extracted, and the extracted text elements are set as a reading process target. Then, a reading process is performed in which the text element set as the reading process target in the document currently being displayed is converted into voice data and output.
コンピュータは,ページのレイアウトが揃えられている複数のページについて読み上げ処理をする場合に,複数のページに共通して表示されるテキスト要素を読み上げ処理対象から除外してHTMLドキュメントの読み上げ処理を行うことができる。よって,ユーザは,同じ内容が繰り返して読み上げられるという煩わしさから解放され,必要な情報を効率的に聞くことができる。 When a computer reads out a plurality of pages with the same page layout, the computer reads out the HTML document by excluding the text elements that are displayed in common on the plurality of pages from the target of the reading processing. Can do. Thus, the user is freed from the trouble of repeatedly reading out the same content, and can efficiently listen to necessary information.
さらに,本発明は,前記コンピュータに,5)読み上げ処理において,テキスト要素からリンク情報が検出された場合に,リンク情報に設定されたリンク先のドキュメントのページ構成情報を取得し,リンク先のページ構成情報とページ構成情報記憶手段に記憶されたページ構成情報とを比較し,リンク先のページ構成情報が読み上げ処理済みのページ構成情報と完全に一致するときは,リンク情報での自動ジャンプ処理を抑止する自動ジャンプ処理を実行させるためのプログラムである。 Further, according to the present invention, when link information is detected from a text element in 5) reading processing, the present invention acquires page configuration information of a linked document set in the linked information, and links to the linked page. Comparing the configuration information with the page configuration information stored in the page configuration information storage means, and if the page configuration information at the link destination completely matches the page configuration information that has been read out, automatic jump processing with the link information is performed. A program for executing automatic jump processing to be suppressed.
または,本発明は,前記コンピュータに,6)ドキュメントのページ構成情報から所定のハッシュ関数を用いてハッシュ関数値を演算し,読み上げ処理されたドキュメントのページ構成情報から演算したハッシュ関数値をハッシュ情報記憶手段に格納するハッシュデータ管理処理と,7)読み上げ処理において,テキスト要素からリンク情報が検出された場合に,リンク情報に設定されたリンク先のドキュメントのページ構成情報のハッシュ関数値を取得し,リンク先のドキュメントのハッシュ関数値とハッシュ情報記憶手段に記憶されたハッシュ関数値とを比較し,リンク先のドキュメントのハッシュ関数値がハッシュ情報記憶手段に記憶されたハッシュ関数値と完全に一致するときは,リンク情報での自動ジャンプ処理を抑止する自動ジャンプ処理とを,実行させるためのプログラムである。 Alternatively, according to the present invention, 6) the hash function value is calculated from the page configuration information of the document using a predetermined hash function, and the hash function value calculated from the page configuration information of the read-out document is stored in the computer. When the link information is detected from the text element in the hash data management process stored in the storage means and 7) the reading process, the hash function value of the page configuration information of the linked document set in the link information is acquired. Compare the hash function value of the linked document with the hash function value stored in the hash information storage means, and the hash function value of the linked document is exactly the same as the hash function value stored in the hash information storage means When doing this, an automatic job that suppresses automatic jump processing in link information A pump process, a program for executing.
または,本発明は,前記コンピュータに,8)表示処理されたドキュメントをドキュメント一時記憶手段に一時的に格納するドキュメント一時保管処理と,9)ドキュメント一時記憶手段に格納されたドキュメントが読み上げ処理されている場合に,読み上げ処理されたドキュメントに読み上げフラグを設定する読み上げフラグ管理処理と,10)読み上げ処理において,テキスト要素からリンク情報が検出された場合に,リンク情報に設定されたリンク先のドキュメントがドキュメント一時記憶手段に格納され,かつ,ドキュメント一時記憶手段に格納されたドキュメントに読み上げフラグが設定されているときに,リンク情報での自動ジャンプ処理を抑止する自動ジャンプ処理とを,実行させるためのプログラムである。 Alternatively, according to the present invention, 8) a document temporary storage process for temporarily storing a display-processed document in the document temporary storage means, and 9) a document stored in the document temporary storage means is read out to the computer. And a reading flag management process for setting a reading flag in the read-out document, and 10) in the reading-out process, when link information is detected from the text element, the link destination document set in the link information is To execute automatic jump processing that suppresses automatic jump processing with link information when a reading flag is set for a document stored in the document temporary storage means and stored in the document temporary storage means It is a program.
これにより,本発明は,読み上げ処理中のテキスト要素にリンク情報が設定されている場合でも,リンク先のドキュメントが既に読み上げ処理の対象となったか否かを判定し,既に読み上げ処理の対象となっていれば,そのリンク情報での自動ジャンプ処理を行わないようにする。よって,ユーザは,既に読み上げられた内容が繰り返して読み上げられるという煩わしさから解放され,必要な情報を効率的に聞くことができる。 Accordingly, the present invention determines whether or not the linked document has already been the target of the reading process even if the link information is set in the text element being read out, and has already been the target of the reading process. If so, automatic jump processing is not performed with the link information. Therefore, the user is freed from the annoyance that the content that has already been read out is repeatedly read out, and can listen to necessary information efficiently.
また,本発明は,前記ドキュメント内テキスト読み上げ処理プログラムによって実現される処理をそれぞれ実行する処理手段を備えるドキュメント内テキスト読み上げ処理機能を備えたドキュメント閲覧装置である。 In addition, the present invention is a document browsing apparatus having an in-document text reading processing function including processing means for executing processes realized by the in-document text reading processing program.
本発明によれば,ニュースサイトなどによって提供されるような同一レイアウトを多用したウェブページを閲覧し,その内容を読み上げ処理させる場合に,各ページのヘッダ部やフッタ部に共通して表示される内容を読み上げ処理の対象から排除させることができる。よって,ユーザは,同じ情報が重複して読み上げられる煩わしさから解放されるため,必要な情報だけを効率的かつ快適に入手することができる。 According to the present invention, when a web page that uses the same layout as provided by a news site or the like is browsed and the content is read out, it is displayed in common in the header part and footer part of each page. The contents can be excluded from the target of the reading process. Therefore, the user is freed from the trouble of reading the same information repeatedly, so that only necessary information can be obtained efficiently and comfortably.
また,本発明によれば,読み上げ処理中のテキストにリンク情報が含まれている場合でも,既に読み上げたリンク先であれば自動ジャンプ処理を抑止することができる。よって,ユーザは,同じページが再度読み上げられることなく,無駄な時間を要さずに効率的に必要な情報を入手することができる。 Further, according to the present invention, even when link information is included in the text being read out, automatic jump processing can be suppressed if the link destination has already been read out. Thus, the user can efficiently obtain necessary information without reading the same page again and without wasting time.
1 ドキュメント閲覧装置
110 ブラウジング処理制御部
111 通信処理部
112 HTML解析処理部
113 レイアウト処理部
114 画面表示処理部
115 一時保管ドキュメント管理部
116 読み上げフラグ管理部
117 ドキュメント一時記憶部
120 読み上げ処理制御部
121 DOMツリー退避処理部
122 DOMツリー記憶部
123 読み上げ処理部
124 読み上げ範囲判定部
125 自動ジャンプ処理部
126 ハッシュデータ管理部
141 音声合成処理部
143 音声出力処理部
2 表示装置
3 スピーカDESCRIPTION OF
図1に,本発明の最良の実施形態における構成例を示す。本実施形態では,マークアップ言語で記述され構造化されたドキュメント例として,インターネット上で提供されるウェブページ(HTMLドキュメント)の場合を例に説明する。 FIG. 1 shows a configuration example in the best embodiment of the present invention. In the present embodiment, an example of a web page (HTML document) provided on the Internet will be described as an example of a document described and structured in a markup language.
ドキュメント閲覧装置1は,ドキュメント内テキストの読み上げ処理機能を備えたドキュメント閲覧のためのコンピュータである。本例において,本発明のドキュメント内テキスト読み上げ処理プログラムは,ドキュメント閲覧装置1内のメモリにインストールされ,所定の契機によって実行される。
The
ドキュメント閲覧装置1は,表示装置2,スピーカ3,ブラウジング処理制御部110,通信処理部111,HTML解析処理部112,レイアウト処理部113,画面表示処理部114,一時保管ドキュメント管理部115,読み上げフラグ管理部116,ドキュメント一時記憶部117,読み上げ処理制御部120,DOMツリー退避処理部121,DOMツリー記憶部122,読み上げ処理部123,読み上げ範囲判定部124,自動ジャンプ処理部125,ハッシュデータ管理部126,音声合成処理部141,および音声出力処理部143を備える。
The
ブラウジング処理制御部110は、ウェブページを取得して,表示装置2に表示させるブラウジング処理に関する一連の処理を制御する処理手段である。また,ブラウジング処理制御部110は,ユーザが,読み上げ処理を要求した場合に,読み上げ処理制御部120へ読み上げ処理要求を通知する。
The browsing
通信処理部111は,HTTPプロトコルにしたがって,ウェブサイトのサーバからウェブページを取得する処理手段である。
The
HTML解析処理部112は,ウェブページのHTMLタグを解析処理し,DOMツリーと呼ばれる形式に変換したページ構成情報を生成する処理手段である。
The HTML
レイアウト処理部113は,ページ構成情報(以下,DOMツリー情報という)にもとづいて,ウェブページの要素をレイアウトする処理手段である。
The
画面表示処理部114は,レイアウト処理されたウェブページの個々の要素を表示装置2に表示する処理手段である。
The screen
一時保管ドキュメント管理部115は,ブラウジング処理制御部110によって表示装置2に表示されたウェブページ(HTMLドキュメント)を一時的にドキュメント一時記憶部117に格納する処理手段である。
The temporary storage
読み上げフラグ管理部116は,ドキュメント一時記憶部117に格納されたウェブページが読み上げ処理部123によって読み上げられている場合に,そのウェブページに読み上げフラグを設定した読み上げ情報を管理する処理手段である。
When the web page stored in the document
ドキュメント一時記憶部117は,ブラウジング処理制御部110によって表示装置2に表示されたウェブページを一時的に記憶する手段である。
The document
読み上げ処理制御部120は,ユーザから処理要求を受けて,表示装置2に表示されたウェブページの所定のテキスト要素を音声合成処理して出力する読み上げ処理に関する一連の処理を制御する処理手段である。
The reading
DOMツリー退避処理部121は,読み上げ処理の対象となったウェブページのDOMツリー情報をDOMツリー記憶部122に格納する処理手段である。
The DOM tree save processing
読み上げ処理部123は,読み上げ範囲判定部124によって処理対象とされたウェブページのテキスト要素を先頭から順番に取得し,音声合成処理部141,音声出力処理部143によって読み上げ処理を実行する処理手段である。
The
読み上げ範囲判定部124は,表示処理対象のウェブページのDOMツリー情報と,DOMツリー記憶部122に格納されている既に読み上げ処理されたウェブページのDOMツリー情報とを比較し,表示対象のDOMツリー情報のテキスト要素のうち,記憶されたDOMツリー情報のテキスト要素と一致しないテキスト要素を取り出し,取り出したテキスト要素を読み上げ処理部123の処理対象(読み上げ処理対象)として設定する処理手段である。
The reading
自動ジャンプ処理部125は,読み上げ処理対象と設定されたテキスト要素からリンク情報を検出した場合に,リンク情報のリンク先に設定されたウェブページのDOMツリー情報を取得し,リンク先のDOMツリー情報とDOMツリー記憶部122に退避処理によって記憶されたDOMツリー情報とを比較し,リンク先のDOMツリー情報がDOMツリー記憶部122のDOMツリー情報と完全に一致するときは,リンク情報での自動ジャンプ処理を抑止(無効化)し,リンク先のDOMツリー情報がDOMツリー記憶部122のDOMツリー情報と完全に一致しないときは,そのリンク情報をもとに自動ジャンプ処理を行ってリンク先のウェブページ(HTMLドキュメント)を取得する処理手段である。
When the automatic
また,自動ジャンプ処理部125は,読み上げ処理部123の処理対象であるテキスト要素からリンク情報が検出された場合に,リンク情報に設定されたリンク先のウェブページから生成されたハッシュ関数値(ハッシュデータ)と,ハッシュデータ管理部126に退避処理された読み上げ処理済みのウェブページから生成されたハッシュデータとを比較し,リンク先のウェブページのハッシュデータがハッシュデータ管理部126に退避させたウェブページのハッシュデータと完全に一致するときは,そのリンク情報での自動ジャンプ処理を抑止する。
Further, when link information is detected from the text element that is the processing target of the
また,自動ジャンプ処理部125は,読み上げ処理部123の処理対象であるテキスト要素からリンク情報が検出された場合に,リンク情報に設定されたリンク先のウェブページがドキュメント一時記憶部117にキャッシングされているか否かを調べ,さらに,読み上げフラグ管理部116が管理する読み上げ情報をもとに,ドキュメント一時記憶部117にキャッシュされたリンク先のウェブページの読み上げフラグに読み上げ済みを示す値が設定されているときは,前記リンク情報での自動ジャンプ処理を抑止する。
Further, when link information is detected from the text element that is the processing target of the
ハッシュデータ管理部126は,読み上げ処理済みのウェブページをもとに所定のハッシュ関数を用いてハッシュデータを作成し,このウェブページの格納場所情報(URLなど)およびウェブページのハッシュデータとの対応を示すキャッシュ管理リストを生成・管理する処理手段である。
The hash
また,ハッシュデータ管理部126は,自動ジャンプ処理部125から渡されたリンク先のウェブページをもとにハッシュデータを生成し,生成したリンク先のウェブページのハッシュデータを自動ジャンプ処理部125へ返却する。
In addition, the hash
音声合成処理部141は,読み上げ処理部123から取得した処理対象のテキスト要素を表音文字列に変換し,表音文字列を波形データに変換する処理手段である。音声出力処理部143は,波形データを音声としてスピーカ3から出力する処理手段である。
The speech
次に,本発明の具体的な処理例を説明する。 Next, a specific processing example of the present invention will be described.
ドキュメント閲覧装置1は,図2に示すようなニュースサイトから提供されるウェブページをユーザに閲覧させるために表示装置2に表示し,また,ユーザの要求によってウェブページ内のテキスト要素(テキストデータ)を変換処理した音声データをスピーカ3から出力する。ここで,ニュースサイトで提供されるウェブページは,すべて,ユーザが閲覧しやすいように,特定のレイアウトに従って作成されているものとする。
The
図2(A)は,ニュース見出しを内容(以下,コンテンツAという)とするウェブページAの例を示す図,図2(B)は,あるニュース見出しに対応するニュース本文を内容(以下,コンテンツBという)とするウェブページBの例を示す図である。 FIG. 2A is a diagram showing an example of a web page A having a news headline as content (hereinafter referred to as content A), and FIG. 2B is a content of a news body corresponding to a news headline (hereinafter referred to as content). It is a figure which shows the example of the web page B set to B).
ウェブページAおよびウェブページBは,共通するレイアウトによって,ヘッダ部H,フッタ部F,メイン部Mainの3つから構成され,ヘッダ部Hおよびフッタ部Fには同一の内容が表示される。また,ウェブページAのメイン部A_Mainに表示されたニュース見出し(例えば,ニュース見出しHL1)に設定された一つのリンク先として,ウェブページBが設定されている。ウェブページBのメイン部B_Mainには,リンク元のニュース見出しHL1に対応するニュース本文NEWS1が表示される。 The web page A and the web page B are composed of a header part H, a footer part F, and a main part Main according to a common layout, and the same contents are displayed on the header part H and the footer part F. Moreover, the web page B is set as one link destination set to the news headline (for example, news headline HL1) displayed on the main part A_Main of the web page A. In the main part B_Main of the web page B, a news body NEWS1 corresponding to the news headline HL1 of the link source is displayed.
〔第1の実施例〕
第1の実施例において,ドキュメント閲覧装置1は,読み上げ処理の対象とするテキスト要素の範囲およびリンク情報における自動ジャンプ処理の要否を,ウェブページのDOMツリー情報を用いて判定する。[First Example]
In the first embodiment, the
また,本例のドキュメント閲覧装置1において,図1の構成例に示すハッシュデータ管理部126,一時保管ドキュメント管理部115,読み上げフラグ管理部116,およびドキュメント一時記憶部117は,必須の構成要素ではない。
In the
ドキュメント閲覧装置1において,通信処理部111が,ニュースサイトからウェブページAをダウンロードすると,HTML解析処理部112は,ダウンロードされたウェブページAのHTMLタグを解析処理し,DOMツリー情報Aを生成する。そして,レイアウト処理部113は,DOMツリー情報Aにもとづいて,ウェブページAの各要素をレイアウトし,画面表示処理部114は,レイアウト処理されたウェブページAを表示装置2に表示する。
In the
また,読み上げ処理部123は,読み上げ処理制御部120を通じてウェブページAのDOMツリー情報Aを取得する。読み上げ範囲判定部124は,DOMツリー管理リストをもとに,ウェブページAと同じドメインに属するウェブページのDOMツリー情報をDOMツリー記憶部122から一つずつ取り出し,DOMツリー情報Aと取り出したDOMツリー情報とを先頭および最後から比較し,両者に同じテキスト要素があるか否かを判定する。
Further, the
DOMツリー管理リストは,DOMツリー記憶部122に退避格納される読み上げ処理済みのウェブページのDOMツリー情報を管理するリストである。図3に,DOMツリー管理リストの例を示す。DOMツリー管理リストは,ウェブページの格納場所情報(URL),DOMツリー記憶部122のDOMツリー情報へのポインタ情報であるDOMツリーアドレスで構成される。
The DOM tree management list is a list for managing DOM tree information of web pages that have been read out and saved in the DOM
ここで,ウェブページAがニュースサイトからダウンロードした最初のウェブページであって,DOMツリー記憶部122に退避されている読み上げ済みのウェブページのDOMツリー情報に一致するテキスト要素がなく,ウェブページAのすべてのテキスト要素は未だ読み上げ処理されていないとする。
Here, the web page A is the first web page downloaded from the news site, there is no text element that matches the DOM tree information of the web page that has been read out and saved in the DOM
読み上げ範囲判定部124は,DOMツリー情報Aのすべてのテキスト要素を読み上げ処理の範囲と判定し,DOMツリー情報Aの最初のテキスト要素から最後のテキスト要素までを読み上げ処理対象とする。例えば,図2(A)のウェブページAの「タイトル,最新ニュース,政治,経済,社会,海外,ニュース見出しHL1…」が読み上げ処理対象となる。
The reading
読み上げ処理部123は,ウェブページAのDOMツリー情報Aのテキスト要素を順に音声合成処理部141へ渡す。音声合成処理部141は,読み上げ処理の対象となったテキスト要素を表音文字列に変換し,さらに表音文字列を波形データに変換し,音声出力処理部143は,波形データを音声としてスピーカ3から出力する。
The
そして,DOMツリー退避処理部121は,読み上げ処理されたウェブページAのDOMツリー情報AをDOMツリー記憶部122へ格納し,DOMツリー管理リストに,ウェブページAのURLとDOMツリー情報Aへのポインタ情報(DOMツリーアドレス)を追加する。
Then, the DOM tree save processing
さらに,読み上げ処理対象のウェブページAのテキスト要素「ニュース見出しHL1」にウェブページBをリンク先とするリンク情報が設定されているとする。 Furthermore, it is assumed that link information that links the web page B to the text element “news headline HL1” of the web page A to be read out is set.
自動ジャンプ処理部125は,リンク情報「ニュース見出しHL1」のリンク先であるウェブページBのDOMツリー情報Bを読み上げ処理制御部120を介して取得する。そして,取得したDOMツリー情報BとDOMツリー記憶部122に格納されたDOMツリー情報とを比較し,完全に一致するDOMツリー情報があるかどうか判定する。
The automatic
ここで,ウェブページBは未だ読み上げ処理の対象となっていないので,DOMツリー記憶部122にDOMツリー情報Bと完全に一致するものは格納されていない。
Here, since the web page B has not yet been subjected to the reading process, the DOM
自動ジャンプ処理部125は,完全に一致するDOMツリー情報を検出していないので,リンク情報「ニュース見出しHL1」において自動ジャンプ処理を実行する。この自動ジャンプ処理によって,図2(B)のウェブページBが表示処理対象としてダウンロードされる。
Since the automatic
読み上げ範囲判定部124は,ウェブページBのDOMツリー情報Bと,DOMツリー記憶部122に格納されている読み上げ済みのウェブページのDOMツリー情報を一つずつ取り出して比較し,一致するテキスト要素があるかどうか判定する。
The reading
図4に,DOMツリー情報の例を示す。図4(A)は,DOMツリー記憶部122に格納されたDOMツリー情報の一つであるウェブページA(コンテンツA)のDOMツリー情報Aの例を示し,図4(B)は,表示処理の対象となっているウェブページB(コンテンツB)のDOMツリー情報Bの例を示す図である。
FIG. 4 shows an example of DOM tree information. 4A shows an example of the DOM tree information A of the web page A (content A), which is one of the DOM tree information stored in the DOM
読み上げ範囲判定部124は,DOMツリー情報BとDOMツリー記憶部122に格納されたDOMツリー情報Aのテキスト要素を,先頭および最後から順に比較する。比較処理において,DOMツリー情報Bの先頭からいくつかのテキスト要素「最新ニュース,政治,経済,社会,海外」と,最後からいくつかのテキスト要素「補足説明,Copyright(C)…」とが,DOMツリー情報Aのテキスト要素と重複していることを検出する。また,DOMツリー情報Bのテキスト要素「ニュース本文」は,DOMツリー情報Aおよび他のDOMツリー情報のテキスト要素と一致しなかったとする。
The reading
読み上げ範囲判定部124は,ウェブページBのDOMツリー情報Bから,重複するテキスト要素以外のテキスト要素「ニュース本文」(例えば,ニュース本文NEWS1)を読み上げ処理対象とする。読み上げ処理部123は,ウェブページAの場合と同様に,読み上げ処理対象のテキスト要素を音声合成処理部141へ渡して読み上げ処理を行う。
The reading
これにより,ウェブページBの読み上げ処理において,既にウェブページAの読み上げ処理において読み上げられた部分は読み上げ処理されず,ユーザは同じ内容が読み上げられるという状況を回避することができる。 Thereby, in the reading process of the web page B, the part that has already been read out in the reading process of the web page A is not read out, and the user can avoid the situation that the same content is read out.
その後,ウェブページAのテキスト要素から別のリンク情報を検出した場合には,自動ジャンプ処理部125は,前記処理と同様に,そのリンク情報のリンク先のDOMツリー情報によって自動ジャンプ処理を行うか否かを判定する。
Thereafter, when another link information is detected from the text element of the web page A, the automatic
また,読み上げ範囲判定部124は,次に表示処理対象とされた別のウェブページCのDOMツリー情報Cを取得した場合には,前記処理と同様に,読み上げ処理の対象とするテキスト要素の範囲を判定する。
When the reading
図5〜7に,第1の実施例における読み上げ処理の処理フローを示す。 5 to 7 show a processing flow of the reading process in the first embodiment.
図5の処理フローにおいて,読み上げ処理部123は,読み上げ処理を実行するか否かの状態を示す読み上げ処理フラグ(以下,処理フラグとする)の初期値をOFFにする(ステップS10)。読み上げ範囲判定部124は,読み上げ範囲判定処理を実行する(ステップS11)。
In the processing flow of FIG. 5, the
図6および図7に,読み上げ範囲判定処理の処理フローを示す。 6 and 7 show a processing flow of the reading range determination process.
読み上げ範囲判定部124は,NODE_S,WORK_Sに,現在の表示処理対象のウェブページXについて,そのDOMツリー情報Xの先頭のテキスト要素の要素番号を格納し,NODE_E,WORK_Eに,同じDOMツリー情報Xの最後のテキスト要素の要素番号を格納する(ステップS110)。ここで,NODE_Sは,読み上げ処理を開始するテキスト要素の要素番号,NODE_Eは,読み上げ処理を終了するテキスト要素の要素番号を格納する記憶域である。
The reading
次に,DOMツリー記憶部122から同一ドメインに属するウェブページのDOMツリー情報を取得するために,DOMツリー管理リストからのURLリスト取得処理を実行する(ステップS111)。URLリスト取得処理の詳細は後述する。
Next, in order to acquire the DOM tree information of the web page belonging to the same domain from the DOM
そして,URLリスト取得処理によって抽出したURLリストに判定処理が未処理のURLが残っている間は(ステップS112のYES),ステップS113以降の処理を行い,未処理で残されたURLがなくなれば(ステップS112のNO),読み上げ範囲判定処理を終了する。 Then, while URLs that have not been subjected to the determination process remain in the URL list extracted by the URL list acquisition process (YES in step S112), the processes in and after step S113 are performed, and if there is no URL left unprocessed. (NO in step S112), the reading range determination process is terminated.
まず,URLリストに判定処理が未処理のURLが残っている場合は(ステップS112のYES),現在の表示処理対象のDOMツリー情報Xの先頭から順にテキスト要素を取り出す(ステップS113)。さらに,DOMツリー記憶部122に退避させていた同一ドメイン下のDOMツリー情報から抽出された一つのDOMツリー情報Yの先頭から順にテキスト要素を取り出す(ステップS114)。ステップS113で取り出したテキスト要素とステップS114で取り出したテキスト要素とが同じテキスト要素であれば(ステップS115のYES),WORK_Sに,DOMツリー情報Xの現在取り出しているテキスト要素の要素番号を格納する(ステップS116)。 First, when a URL that has not been subjected to determination processing remains in the URL list (YES in step S112), text elements are extracted in order from the top of the DOM tree information X that is the current display processing target (step S113). Further, text elements are extracted in order from the top of one DOM tree information Y extracted from the DOM tree information under the same domain saved in the DOM tree storage unit 122 (step S114). If the text element extracted in step S113 and the text element extracted in step S114 are the same text element (YES in step S115), the element number of the text element currently extracted in DOM tree information X is stored in WORK_S. (Step S116).
また,取り出したテキスト要素が同じでなければ(ステップS115のNO),現在の表示対象のDOMツリー情報Xの最後から順にテキスト要素を取り出す(ステップS117)。さらに,退避させていた同一ドメイン下のDOMツリー情報Yの最後から順にテキスト要素を取り出す(ステップS118)。ステップS117で取り出したテキスト要素とステップS118で取り出したテキスト要素とが同じテキスト要素であれば(ステップS119のYES),WORK_Eに,DOMツリー情報Xの現在取り出しているテキスト要素の要素番号を格納する(ステップS120)。 If the extracted text elements are not the same (NO in step S115), the text elements are extracted in order from the end of the currently displayed DOM tree information X (step S117). Further, the text elements are extracted in order from the end of the saved DOM tree information Y under the same domain (step S118). If the text element extracted in step S117 and the text element extracted in step S118 are the same text element (YES in step S119), the element number of the text element currently extracted in DOM tree information X is stored in WORK_E. (Step S120).
そして,取り出したテキスト要素が同じでない場合には(ステップS119のNO),「WORK_Sに,現在のDOMツリー情報Xの最後のテキスト要素の要素番号が格納され,かつ,WORK_Eに,現在のDOMツリー情報Xの先頭のテキスト要素の要素番号が格納されている」ときは(図7:ステップS121のYES),すべてのテキスト要素が重複していることになるので,WORK_S,WORK_Eの値をクリア,すなわち,値なしの状態にする(ステップS122)。 If the extracted text elements are not the same (NO in step S119), “the element number of the last text element of the current DOM tree information X is stored in WORK_S, and the current DOM tree is stored in WORK_E. When the element number of the first text element of information X is stored "(FIG. 7: YES in step S121), all text elements are duplicated, so the values of WORK_S and WORK_E are cleared. That is, a state without a value is set (step S122).
また,「WORK_Sに,現在のDOMツリー情報Xの最後のテキスト要素の要素番号が格納され,かつ,WORK_Eに,現在のDOMツリー情報Xの先頭のテキスト要素の要素番号が格納されている」のでなければ(ステップS121のNO),WORK_Sの要素番号からWORK_Eの要素番号までの範囲とNODE_Sの要素番号からNODE_Eの要素番号までの範囲とを比較(ステップS123)する。 Also, “the element number of the last text element of the current DOM tree information X is stored in WORK_S, and the element number of the first text element of the current DOM tree information X is stored in WORK_E”. If not (NO in step S121), the range from the element number of WORK_S to the element number of WORK_E is compared with the range from the element number of NODE_S to the element number of NODE_E (step S123).
WORK_Sの要素番号からWORK_Eの要素番号までの範囲が,NODE_Sの要素番号からNODE_Eの要素番号までの範囲内であれば(ステップS123のYES),WORK_Sの要素番号+1をNODE_Sへ格納し,WORK_Eの要素番号−1をNODE_Eへ格納する(ステップS124)。 If the range from the element number of WORK_S to the element number of WORK_E is within the range from the element number of NODE_S to the element number of NODE_E (YES in step S123), the element number +1 of WORK_S is stored in NODE_S, and WORK_E Element number-1 is stored in NODE_E (step S124).
そして,読み上げ範囲判定処理が終わると,読み上げ処理部123は,読み上げ範囲判定処理において設定された現在のDOMツリー情報Xから順にテキスト要素を取り出し(図5:ステップS12),処理フラグ=ONであれば(ステップS13のYES),取り出したテキスト要素のテキストを読み上げる(ステップS14)。一方,処理フラグ=ONでなければ(ステップS13のNO),取り出したテキスト要素が,読み上げ処理開始のテキスト要素であるか否かを判定する(ステップS15)。すなわち,取り出したテキスト要素の要素番号がNODE_Sの番号であれば,取り出したテキスト要素が読み上げ処理開始のテキスト要素であると判定して(ステップS15のYES),処理フラグをONに設定して(ステップS16),そのテキスト要素の読み上げ処理を実行する(ステップS14)。また,取り出したテキスト要素の要素番号がNODE_Sの要素番号でなければ,取り出したテキスト要素は読み上げ処理開始のテキスト要素ではないと判定して(ステップS15のNO),ステップS12の処理へ戻る。
When the reading range determination process is completed, the
その後,読み上げ処理しているテキスト要素からリンク情報を検出した場合に(ステップS17のYES),自動ジャンプ処理部125は,自動ジャンプ処理を実行する(ステップS18)。自動ジャンプ処理は後述する。
Thereafter, when link information is detected from the text element being read out (YES in step S17), the automatic
また,読み上げ処理しているテキスト要素からリンク情報を検出しなければ(ステップS17のNO),読み上げ処理しているテキスト要素が読み上げ処理終了のテキスト要素であるか否かを判定する(ステップS19)。すなわち,取り出したテキスト要素の要素番号がNODE_Eの要素番号であれば,取り出したテキスト要素は読み上げ処理終了のテキスト要素であると判定して(ステップS19のYES),読み上げ処理を終了する。 If link information is not detected from the text element being read out (NO in step S17), it is determined whether the text element being read out is a text element that has been read out (step S19). . That is, if the element number of the extracted text element is an element number of NODE_E, it is determined that the extracted text element is a text element at the end of the reading process (YES in step S19), and the reading process is terminated.
また,取り出したテキスト要素の要素番号がNODE_Eの要素番号でなければ,取り出したテキスト要素は読み上げ処理終了のテキスト要素ではないと判定して(ステップS19のNO),ステップS12の処理へ戻る。 If the element number of the extracted text element is not the element number of NODE_E, it is determined that the extracted text element is not a text element for which the reading process has been completed (NO in step S19), and the process returns to step S12.
図8に,図6のステップS111のURLリスト取得処理の処理フローを示す。 FIG. 8 shows a process flow of the URL list acquisition process in step S111 of FIG.
読み上げ範囲判定部124は,現在の表示処理の対象となっているウェブページのURLをURL_Aに格納し(ステップS1110),URL_Aの”http://”から次の”/”までの部分文字列をDOMAIN_Aに格納する(ステップS1111)。
The reading
そして,DOM管理リストに比較処理が未処理のDOMツリー情報が残っている間(ステップS1112のYES),ステップS1113〜S1116のループ処理を行う(ステップS1117)。 Then, while DOM tree information that has not been subjected to comparison processing remains in the DOM management list (YES in step S1112), the loop processing of steps S1113 to S1116 is performed (step S1117).
まず,DOMツリー記憶部122に退避させたDOMツリー情報のURLをDOMツリー管理リストから順に取得して,URL_Bに格納する(ステップS1113)。そして,URL_Bの”http://”から次の”/”までの部分文字列をDOMAIN_Bに格納する(ステップS1114)。DOMAIN_AとDOMAIN_Bとを比較し(ステップS1115),DOMAIN_AとDOMAIN_Bとが完全一致した場合には(ステップS1115のYES),URL_Bに格納しているURLをURLリストに格納する(ステップS1116)。
First, URLs of DOM tree information saved in the DOM
前記のループ処理によってDOM管理リストに比較処理を行うDOMツリー情報がなくなれば(ステップS1117),処理を終了する。 If there is no DOM tree information to be compared in the DOM management list by the loop process (step S1117), the process ends.
図9に,図5のステップS18の自動ジャンプ処理の処理フローを示す。 FIG. 9 shows a process flow of the automatic jump process in step S18 of FIG.
自動ジャンプ処理部125は,現在の表示処理対象のウェブページのURLとDOMツリー情報を一時的記憶域に退避させて(ステップS180),ブラウジング処理制御部110によって,リンク先に設定されたウェブページが取得されると(ステップS181),読み上げ処理制御部120を通じて,取得したリンク先のウェブページのDOMツリー情報を取得する(ステップS182)。そして,読み上げ範囲判定処理を行う(ステップS183)。この読み上げ範囲判定処理では,ステップS11(図5)の読み上げ範囲判定処理と同様の処理を行う。
The automatic
そして,読み上げ範囲判定処理において,リンク先のウェブページのDOMツリー情報から読み上げ処理の範囲とするテキスト要素が抽出できたかどうかを判定する(ステップS184)。リンク先のウェブページのDOMツリー情報から読み上げ処理の範囲とするテキスト要素が抽出できた場合には(ステップS184のYES),ブラウジング処理制御部110によってリンク先のウェブページを表示処理させ(ステップS185),読み上げ処理部123は,読み上げ範囲として判定されたテキスト要素の読み上げ処理を行う(ステップS186)。この読み上げ処理は,図5に示す読み上げ処理と同様の処理である。
Then, in the reading range determination process, it is determined whether or not the text element as the range of the reading process has been extracted from the DOM tree information of the linked web page (step S184). If the text element that is the range of the reading process can be extracted from the DOM tree information of the linked web page (YES in step S184), the browsing
一方,リンク先のウェブページのDOMツリー情報と同一のDOMツリー情報がDOMツリー記憶部122に格納されていて,リンク先のウェブページのDOMツリー情報から読み上げ処理の範囲とするテキスト要素が抽出できなかった場合には(ステップS184のNO),処理を終了する。
On the other hand, the same DOM tree information as the DOM tree information of the linked web page is stored in the DOM
〔第2の実施例〕
第2の実施例におけるドキュメント閲覧装置1は,読み上げ処理の対象とするテキスト要素の範囲をウェブページのDOMツリー情報を用いて特定し,リンク情報における自動ジャンプ処理の要否をウェブページのDOMツリー情報から生成したハッシュデータを用いて判定する。[Second Embodiment]
The
本例のドキュメント閲覧装置1において,図1の構成例に示す一時保管ドキュメント管理部115,読み上げフラグ管理部116,およびドキュメント一時記憶部117は,必須の構成要素ではない。
In the
ドキュメント閲覧装置1の読み上げ範囲判定部124は,第1の実施例と同様の処理によって,読み上げ処理の範囲を特定する。そして,DOMツリー退避処理部121は,読み上げ処理部123によって読み上げ処理されたウェブページのDOMツリー情報をハッシュデータ管理部126に渡す。
The reading
ハッシュデータ管理部126は,DOMツリー情報から所定のハッシュ関数を用いてハッシュデータ(ハッシュ文字列)を生成し,ハッシュ管理リストによって管理する。
The hash
ハッシュ管理リストは,ウェブページのDOMツリー情報から生成されたハッシュデータとの対応を管理するリストである。図10に,ハッシュ管理リストの例を示す。ハッシュ管理リストには,ウェブページの格納場所情報(URL),およびそのウェブページのDOMツリー情報から生成されたハッシュデータ(ハッシュ関数値)とが格納される。 The hash management list is a list for managing correspondence with hash data generated from DOM tree information of a web page. FIG. 10 shows an example of the hash management list. The hash management list stores web page storage location information (URL) and hash data (hash function value) generated from the DOM tree information of the web page.
そして,読み上げ処理対象からリンク情報が検出された場合には,自動ジャンプ処理部125は,リンク先として設定されたウェブページのDOMツリー情報を取得して,ハッシュデータ管理部126に渡し,リンク先のウェブページのDOMツリー情報から生成されたハッシュデータを取得する。さらに,リンク先のウェブページのハッシュデータとハッシュ管理リストのハッシュデータとを比較し,リンク先のハッシュデータと完全に一致するハッシュデータをハッシュ管理リストから検索したときは,このリンク情報での自動ジャンプ処理を無効化する。
When link information is detected from the reading process target, the automatic
このように,リンク先のウェブページが,既に読み上げ処理の対象となっているか否かの判定をハッシュデータを用いることによって,自動ジャンプ処理の要否を判定する処理がより高速に行えるようになる。 In this way, by using hash data to determine whether or not the linked web page is already subject to read-out processing, it becomes possible to perform processing for determining the necessity of automatic jump processing at a higher speed. .
図11に,第2の実施例における読み上げ処理の処理フローを示す。 FIG. 11 shows a processing flow of the reading process in the second embodiment.
図11に示す処理フローにおいて,図5に示す第1の実施例の読み上げ処理フローの処理ステップと同一の番号が付与された処理ステップは,図5の処理フローの各処理ステップと同様の処理を行うことを意味する。 In the processing flow shown in FIG. 11, the processing steps to which the same numbers as the processing steps of the reading processing flow of the first embodiment shown in FIG. 5 are assigned the same processing as the processing steps of the processing flow of FIG. Means to do.
図11の処理フローにおいて,自動ジャンプ処理部125は,図5に示すステップS18の処理の代りに,別の自動ジャンプ処理を行う(ステップS20)。
In the processing flow of FIG. 11, the automatic
また,ステップS19の処理後に,ハッシュデータ管理部126は,読み上げ処理したDOMツリー情報からハッシュデータを生成し,対応するウェブページのURLおよびそのウェブページのDOMツリー情報から生成したハッシュデータとをハッシュ管理リストに格納する(ステップS21)。
Further, after the processing of step S19, the hash
図12に,図11のステップS20の自動ジャンプ処理の処理フローを示す。 FIG. 12 shows a process flow of the automatic jump process in step S20 of FIG.
自動ジャンプ処理部125は,現在の表示処理対象のウェブページのURLとDOMツリー情報を一時的記憶域に退避させて(ステップS200),リンク先に設定されたウェブページのDOMツリー情報を取得し(ステップS201),取得したDOMツリー情報からハッシュデータを生成し(ステップS202),生成したハッシュデータをHASH_Aに格納する(ステップS203)。
The automatic
そして,ハッシュ管理リストに比較処理を行うハッシュデータが残っている間(ステップS204のYES),ステップS205〜S206のループ処理を行う(ステップS207)。 Then, while the hash data to be compared remains in the hash management list (YES in step S204), the loop processing in steps S205 to S206 is performed (step S207).
まず,ハッシュ管理リストからハッシュデータを順に取り出して,HASH_Bに格納する(ステップS205)。HASH_AとHASH_Bとに格納したハッシュデータ(ハッシュ文字列)を比較し(ステップS206),HASH_AとHASH_Bとが完全に一致せず,ハッシュ管理リストにも残りがない場合には(ステップS206のNO,S207),ブラウジング処理制御部110によってリンク先のウェブページを表示処理し(ステップS208),そのウェブページのテキストについて読み上げ処理を行う(ステップS209)。この読み上げ処理は,図11に示す読み上げ処理と同様の処理を行う。
First, hash data is sequentially extracted from the hash management list and stored in HASH_B (step S205). The hash data (hash character strings) stored in HASH_A and HASH_B are compared (step S206). If HASH_A and HASH_B do not completely match and there is no remaining in the hash management list (NO in step S206, In step S207, the browsing
また,HASH_AとHASH_Bとが完全に一致した場合には(ステップS206のYES),リンク先のウェブページが既に読み上げ処理されているので,処理を終了する。 If HASH_A and HASH_B are completely matched (YES in step S206), the linked web page has already been read out, and the process is terminated.
〔第3の実施例〕
第3の実施例におけるドキュメント閲覧装置1は,読み上げ処理の対象とするテキスト要素の範囲およびリンク情報における自動ジャンプ処理の要否を,ウェブページのDOMツリー情報を用いて判定する。[Third embodiment]
The
本例のドキュメント閲覧装置1では,図1の構成例に示すハッシュデータ管理部126は,必須の構成要素ではない。
In the
ドキュメント閲覧装置1の一時保管ドキュメント管理部115は,ブラウジング処理部110によるドキュメント表示処理中に,通信処理部111が表示処理の対象となるウェブページを取得すると,そのウェブページをドキュメント一時記憶部117へ一時的に格納する。
When the
そして,読み上げフラグ管理部116は,ドキュメント一時記憶部117に格納されたウェブページのテキストが読み上げ処理の対象となっている場合に,そのウェブページの読み上げフラグに読み上げ処理済みを示す値を設定し,ドキュメント一時記憶部117にキャッシュされたウェブページのURLおよび読み上げフラグをキャッシュ管理リストを用いて管理する。
Then, when the text of the web page stored in the document
図13に,キャッシュ管理リストの例を示す。キャッシュ管理リストは,ウェブページの格納場所情報(URL),そのウェブページのドキュメント一時記憶部117におけるキャッシュファイル名,読み上げフラグなどを管理するリストである。
FIG. 13 shows an example of the cache management list. The cache management list is a list for managing web page storage location information (URL), a cache file name in the document
読み上げフラグは,読み上げ処理されたウェブページにONが,読み上げ処理されていないウェブページにOFFが設定される。 The reading flag is set to ON for a web page that has been read out, and OFF for a web page that has not been read out.
そして,読み上げ処理の範囲からリンク情報を検出した場合には,自動ジャンプ処理部125は,リンク情報のリンク先として設定されたURLを取得し,キャッシュ管理リストを参照して,リンク先のURLと完全に一致するURLであって,かつ,読み上げフラグがONであるウェブページを検索できたときに,このリンク情報での自動ジャンプ処理を無効化する。
When link information is detected from the range of the reading process, the automatic
このように,リンク先のウェブページが,既に読み上げ処理の対象となっているか否かの判定を,表示処理のために一時的に保管するウェブページに付与する読み上げフラグを用いることによって,自動ジャンプ処理の要否を判定する処理がより高速に行えるようになる。 In this way, the automatic jump is performed by using the reading flag that is given to the web page temporarily stored for display processing to determine whether or not the linked web page is already subject to reading processing. Processing for determining whether processing is necessary can be performed at higher speed.
図14に,第3の実施例における読み上げ処理の処理フローを示す。 FIG. 14 shows a processing flow of the reading process in the third embodiment.
図14に示す処理フローにおいて,図5に示す第1の実施例の読み上げ処理フローの処理ステップと同一の番号が付与された処理ステップは,図5の処理フローの各処理ステップと同様の処理を行うことを意味する。 In the processing flow shown in FIG. 14, the processing steps to which the same numbers as the processing steps of the reading processing flow of the first embodiment shown in FIG. 5 are assigned the same processing as the processing steps of the processing flow of FIG. Means to do.
図14の処理フローにおいて,自動ジャンプ処理部125は,図5に示すステップS18の処理の代りに,別の自動ジャンプ処理を行う(ステップS30)。
In the processing flow of FIG. 14, the automatic
また,ステップS19の処理後に,読み上げフラグ管理部116は,表示処理されたウェブページが読み上げ処理された場合に,ドキュメント一時記憶部117にキャッシングされるウェブページのURLをキャッシュ管理リストに追加し,読み上げフラグにONを設定する(ステップS31)。
Further, after the processing in step S19, the reading
図15に,図14のステップS30の自動ジャンプ処理の処理フローを示す。 FIG. 15 shows a process flow of the automatic jump process in step S30 of FIG.
自動ジャンプ処理部125は,現在の表示処理対象のウェブページのURLとDOMツリー情報を一時的記憶域に退避させて(ステップS300),キャッシュ管理リストからリンク先に設定されたウェブページのURLを取得し(ステップS301),キャッシュ管理リストにリンク先のURLがあるか否かを判定する(ステップS302)。キャッシュ管理リストにリンク先のURLと完全に一致するURLがなければ(ステップS302のNO),さらにキャッシュ管理リストの該当するURLの読み上げフラグがONであるか否かを判定する(ステップS303)。そして,リンク先のURLの読み上げフラグがONでなければ(ステップS303のNO),取得したリンク先のウェブページのDOMツリー情報を取得し(ステップS304),ブラウジング処理制御部110によってリンク先のウェブページを表示処理し(ステップS305),そのウェブページのテキストについて読み上げ処理を行う(ステップS306)。この読み上げ処理は,図14に示す読み上げ処理と同様の処理を行う。また,キャッシュ管理リストにリンク先のURLと完全に一致するURLがある場合(ステップS302のYES),もしくは,キャッシュ管理リストの該当するURLの読み上げフラグがONである場合(ステップS303のYES)には,処理を終了する。
The automatic
以上,本発明をその実施の形態により説明したが,本発明はその主旨の範囲において種々の変形が可能であることは当然である。また,本発明は,コンピュータにより読み取られ実行される処理プログラムとして実施することができる。本発明を実現するプログラムは,コンピュータが読み取り可能な,可搬媒体メモリ,半導体メモリ,ハードディスクなどの適当な記録媒体に格納することができ,これらの記録媒体に記録して提供され,または,通信インタフェースを介して種々の通信網を利用した送受信により提供されるものである。 Although the present invention has been described above with reference to the embodiment, it is obvious that the present invention can be variously modified within the scope of the gist thereof. Further, the present invention can be implemented as a processing program that is read and executed by a computer. The program for realizing the present invention can be stored in an appropriate recording medium such as a portable medium memory, a semiconductor memory, and a hard disk, which can be read by a computer, provided by being recorded on these recording media, or communication. It is provided by transmission / reception using various communication networks via an interface.
Claims (5)
テキスト要素が読み上げ処理されたドキュメントのページ構成情報をページ構成情報記憶手段に格納するページ構成情報格納処理と,
現在の表示対象とされているドキュメントのページ構成情報を取得するページ構成情報取得処理と,
前記表示対象のドキュメントのページ構成情報と前記ページ構成情報記憶手段に記憶されているページ構成情報とを比較し,前記表示対象のドキュメントのページ構成情報から,前記記憶されたページ構成情報のテキスト要素と一致しないテキスト要素を取り出し,前記取り出したテキスト要素を前記読み上げ処理対象として設定する読み上げ範囲設定処理と,
前記表示処理対象のドキュメントにおいて前記読み上げ処理対象に設定されたテキスト要素を音声データに変換処理して出力する読み上げ処理とを,
実行させるためのドキュメント内テキスト読み上げ処理プログラム。As a text-to-speech process in a document written and structured in markup language on a computer
Page configuration information storage processing for storing page configuration information of a document whose text element has been read out in the page configuration information storage means;
A page configuration information acquisition process for acquiring the page configuration information of the document currently displayed;
The page configuration information of the document to be displayed is compared with the page configuration information stored in the page configuration information storage means, and from the page configuration information of the document to be displayed, the text element of the stored page configuration information A text range that does not match the text element, and sets the read text element as a target for the reading process;
Read-out processing for converting the text element set as the read-out processing target into speech data in the display-processing target document and outputting the voice data,
Text-to-speech processing program for document to be executed.
前記読み上げ処理において,前記テキスト要素からリンク情報が検出された場合に,前記リンク情報に設定されたリンク先のドキュメントのページ構成情報を取得し,前記リンク先のページ構成情報と前記ページ構成情報記憶手段に記憶されたページ構成情報とを比較し,前記リンク先のページ構成情報が前記読み上げ処理済みのページ構成情報と完全に一致するときは,前記リンク情報での自動ジャンプ処理を抑止する自動ジャンプ処理を,
実行させるための請求項1記載のドキュメント内テキスト読み上げ処理プログラム。In the computer,
When link information is detected from the text element in the reading process, the page configuration information of the link destination document set in the link information is acquired, and the link destination page configuration information and the page configuration information storage are acquired. The page configuration information stored in the means is compared, and when the page configuration information at the link destination completely matches the page configuration information that has been read out, automatic jump processing that suppresses automatic jump processing with the link information Processing
The in-document text-to-speech processing program according to claim 1 for execution.
ドキュメントのページ構成情報から所定のハッシュ関数を用いてハッシュ関数値を演算し,前記読み上げ処理されたドキュメントのページ構成情報から演算したハッシュ関数値をハッシュ情報記憶手段に格納するハッシュデータ管理処理と,
前記読み上げ処理において,前記テキスト要素からリンク情報が検出された場合に,前記リンク情報に設定されたリンク先のドキュメントのページ構成情報のハッシュ関数値を取得し,前記リンク先のドキュメントのハッシュ関数値と前記ハッシュ情報記憶手段に記憶されたハッシュ関数値とを比較し,前記リンク先のドキュメントのハッシュ関数値が前記ハッシュ情報記憶手段に記憶されたハッシュ関数値と完全に一致するときは,前記リンク情報での自動ジャンプ処理を抑止する自動ジャンプ処理とを,
実行させるための請求項1記載のドキュメント内テキスト読み上げ処理プログラム。In the computer,
A hash data management process for calculating a hash function value using a predetermined hash function from the page configuration information of the document and storing the hash function value calculated from the page configuration information of the read-out document in a hash information storage unit;
When link information is detected from the text element in the reading process, a hash function value of the page configuration information of the link destination document set in the link information is acquired, and a hash function value of the link destination document And the hash function value stored in the hash information storage means, and when the hash function value of the linked document completely matches the hash function value stored in the hash information storage means, the link Automatic jump processing that suppresses automatic jump processing with information,
The in-document text-to-speech processing program according to claim 1 for execution.
表示処理されたドキュメントをドキュメント一時記憶手段に一時的に格納するドキュメント一時保管処理と,
前記ドキュメント一時記憶手段に格納されたドキュメントが読み上げ処理されている場合に,前記読み上げ処理されたドキュメントに読み上げフラグを設定する読み上げフラグ管理処理と,
前記読み上げ処理において,前記テキスト要素からリンク情報が検出された場合に,前記リンク情報に設定されたリンク先のドキュメントが前記ドキュメント一時記憶手段に格納され,かつ,前記ドキュメント一時記憶手段に記憶されたドキュメントに読み上げフラグが設定されているときに,前記リンク情報での自動ジャンプ処理を抑止する自動ジャンプ処理とを,
実行させるための請求項1記載のドキュメント内テキスト読み上げ処理プログラム。In the computer,
A temporary document storage process for temporarily storing the displayed document in the temporary document storage means;
A reading flag management process for setting a reading flag for the read-out document when the document stored in the document temporary storage means is read-out;
In the reading process, when link information is detected from the text element, the link destination document set in the link information is stored in the document temporary storage means and stored in the document temporary storage means. Automatic jump processing for suppressing automatic jump processing in the link information when a reading flag is set in the document,
The in-document text-to-speech processing program according to claim 1 for execution.
テキスト要素が読み上げ処理されたドキュメントのページ構成情報を記憶するページ構成情報記憶手段と,
表示処理かつ読み上げ処理されたドキュメントのページ構成情報を前記ページ構成情報記憶手段に格納するページ構成情報格納手段と,
現在の表示対象とされているドキュメントのページ構成情報を取得するページ構成情報取得手段と,
前記表示対象のドキュメントのページ構成情報と前記ページ構成情報記憶手段に記憶されているページ構成情報とを比較し,前記表示対象のドキュメントのページ構成情報から,前記記憶されたページ構成情報のテキスト要素と一致しないテキスト要素を取り出し,前記取り出したテキスト要素を前記読み上げ処理対象として設定する読み上げ範囲設定手段と,
前記表示処理対象のドキュメントにおいて前記読み上げ処理対象に設定されたテキスト要素を音声データに変換処理して出力する読み上げ処理手段とを備える
ドキュメント閲覧装置。In a document browsing apparatus that displays and processes a structured document described in a markup language,
Page configuration information storage means for storing page configuration information of a document whose text element has been read out;
Page configuration information storage means for storing page configuration information of the display-processed and read-out document in the page configuration information storage means;
A page configuration information acquisition means for acquiring page configuration information of a document currently displayed;
The page configuration information of the document to be displayed is compared with the page configuration information stored in the page configuration information storage means, and from the page configuration information of the document to be displayed, the text element of the stored page configuration information A text range that does not match the text element, and sets the read text element as the text processing target,
A document browsing apparatus comprising: a reading processing unit that converts a text element set as the reading processing target in the display processing target document into voice data and outputs the voice data.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2005/017751 WO2007036984A1 (en) | 2005-09-27 | 2005-09-27 | Program for intra-document text-to-speech processing, document reader, and method for intra-document text-to-speech processing |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2007036984A1 JPWO2007036984A1 (en) | 2009-04-02 |
JP4634461B2 true JP4634461B2 (en) | 2011-02-16 |
Family
ID=37899424
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007537485A Expired - Fee Related JP4634461B2 (en) | 2005-09-27 | 2005-09-27 | Document text-to-speech processing program and document browsing device |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP4634461B2 (en) |
WO (1) | WO2007036984A1 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5338298B2 (en) * | 2008-12-19 | 2013-11-13 | カシオ計算機株式会社 | Page browsing device and program |
JP7098390B2 (en) * | 2018-04-12 | 2022-07-11 | 株式会社Nttドコモ | Information processing equipment |
CN114461171B (en) * | 2022-01-27 | 2023-11-28 | 山东省城市商业银行合作联盟有限公司 | Method and system for reading online banking page |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003029958A (en) * | 2001-07-13 | 2003-01-31 | Sony Corp | Information processor, information processing method, recording medium and program |
JP2003085099A (en) * | 2001-09-12 | 2003-03-20 | Sony Corp | Information processing device and method, recording medium, and program |
JP2003202881A (en) * | 2002-01-08 | 2003-07-18 | Nippon Telegr & Teleph Corp <Ntt> | Method and apparatus for mark-up language document conversion processing, program thereof, and recording medium for the program |
JP2004171111A (en) * | 2002-11-18 | 2004-06-17 | Oki Electric Ind Co Ltd | Web browser control method and device |
-
2005
- 2005-09-27 WO PCT/JP2005/017751 patent/WO2007036984A1/en active Application Filing
- 2005-09-27 JP JP2007537485A patent/JP4634461B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003029958A (en) * | 2001-07-13 | 2003-01-31 | Sony Corp | Information processor, information processing method, recording medium and program |
JP2003085099A (en) * | 2001-09-12 | 2003-03-20 | Sony Corp | Information processing device and method, recording medium, and program |
JP2003202881A (en) * | 2002-01-08 | 2003-07-18 | Nippon Telegr & Teleph Corp <Ntt> | Method and apparatus for mark-up language document conversion processing, program thereof, and recording medium for the program |
JP2004171111A (en) * | 2002-11-18 | 2004-06-17 | Oki Electric Ind Co Ltd | Web browser control method and device |
Also Published As
Publication number | Publication date |
---|---|
WO2007036984A1 (en) | 2007-04-05 |
JPWO2007036984A1 (en) | 2009-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2007264792A (en) | Voice browser program | |
KR100355853B1 (en) | Asynchronous printing of web documents | |
JP4438448B2 (en) | Structured document display processing device, structured document display method, structured document display program | |
JP5676167B2 (en) | System and method for generating search results | |
JP2003150542A (en) | Method for sharing annotation information to be added to digital content, program and computer system | |
JP2006164269A (en) | System and method for customization of search result | |
JP2005234837A (en) | Structured document processing method, structured document processing system and program thereof | |
JP2008129434A (en) | Voice synthesis server system | |
JP4634461B2 (en) | Document text-to-speech processing program and document browsing device | |
KR100850021B1 (en) | System and Method for Changing Web Document Style | |
JP4768375B2 (en) | Jump processing suppression program | |
JP5338298B2 (en) | Page browsing device and program | |
JP2009251655A (en) | Filtering device, filtering method, program, and recording medium | |
JP4477931B2 (en) | Search request device, search request method, search request program, and computer-readable recording medium storing search request program | |
JP4014361B2 (en) | Speech synthesis apparatus, speech synthesis method, and computer-readable recording medium recording speech synthesis program | |
JP2002082936A (en) | Content data display device and content data display system | |
CN113918790A (en) | Method, device, device and storage medium for automatically generating news channel information | |
JP4289080B2 (en) | Audio data providing apparatus, audio data providing method, and audio data providing program | |
US20070143666A1 (en) | Architecture for arbitrary extensible markup language processing engine | |
JP2005339379A (en) | System and method for information display | |
JP2007310766A (en) | Voice file generation support program | |
CN118260467A (en) | A method, device, equipment and medium for collecting entry information | |
JP2005339356A (en) | Method, device, and program for bookmark management | |
JP3926721B2 (en) | Program and information processing apparatus for dynamically generating linked file | |
JP5288569B2 (en) | Electronic publication processing apparatus, electronic publication processing method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101116 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101118 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131126 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |