JP2011150705A - Video display device with built in voice recognition function - Google Patents
Video display device with built in voice recognition function Download PDFInfo
- Publication number
- JP2011150705A JP2011150705A JP2011026929A JP2011026929A JP2011150705A JP 2011150705 A JP2011150705 A JP 2011150705A JP 2011026929 A JP2011026929 A JP 2011026929A JP 2011026929 A JP2011026929 A JP 2011026929A JP 2011150705 A JP2011150705 A JP 2011150705A
- Authority
- JP
- Japan
- Prior art keywords
- character
- display
- video
- voice
- display signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Digital Computer Display Output (AREA)
Abstract
Description
本発明は映像表示装置に関し、特に電子プレゼンテーションなどに用いられ、音声認識機能を内蔵した映像表示装置に関する。 The present invention relates to a video display device, and more particularly to a video display device that is used for electronic presentations and that incorporates a voice recognition function.
従来、プロジェクタ装置に代表される映像表示装置は、電子プレゼンテーションなどに用いられている。かかる電子プレゼンテーションにおいては、映像表示装置とコンピュータなどを接続し、目的の電子資料を順次表示しながら、オペレータ(話者)が説明を行っている。また、大人数を対象とした電子プレゼンテーションなどの場合は、その状況に応じて、オペレータ(話者)は拡声装置などを使用することもある。 2. Description of the Related Art Conventionally, video display devices typified by projector devices are used for electronic presentations and the like. In such an electronic presentation, an operator (speaker) provides an explanation while connecting a video display device and a computer or the like and sequentially displaying target electronic materials. In the case of an electronic presentation for a large number of people, an operator (speaker) may use a loudspeaker or the like depending on the situation.
図7は従来の一例を説明する映像表示装置を用いたシステム構成図である。図7に示すように、従来の電子プレゼンテーションのシステムは、プロジェクタと称される映像表示装置1aにコンピュータ3およびビデオ(VIDEO)機器4を接続し、視聴者7に対し所定の距離を隔てて配置されるスクリーン2に画面表示するものが一般的である。しかも、これと同時に、オペレータ(話者)5の近傍にはマイクロフォン6が配置され、スピーカなどの拡声装置8を用いて視聴者7に音声を伝達するシステムが採用されている。
FIG. 7 is a system configuration diagram using a video display device for explaining an example of the prior art. As shown in FIG. 7, in the conventional electronic presentation system, a
また、最近の技術では、音声認識装置を利用して情報提示装置に音声内容を表示するもの、あるいは音声データ・文字コード変換手段を用いてプリンタなどの印字手段に表示するものも知られている。例えば、特許文献1に記載されているように、車載用の音声メモ装置などに用いるために、人の発した音声を音声認識技術を用いて単純な文字列に変換し、情報提示装置としての液晶ディスプレイ等に表示するものである。
Also, in recent technologies, there are known ones that display voice content on an information presentation device using a voice recognition device, or display on a printing means such as a printer using voice data / character code conversion means. . For example, as described in
さらに、特許文献2に記載されているように、カラオケ装置やレクチャー装置のディスプレイにマイクからの音声入力の内容を合成して表示させる装置も提案されているもの、あるいは特許文献3に記載されているように、プロジェクタを用いて遠隔講義を行う際、音声入力を用いて各種のマルチメディア機器入力を切替えるようにしたものが知られている。
Furthermore, as described in
上述した図7の映像表示装置においては、オペレータ(話者)の発声を伝達する手段が外的要因の影響を受けやすいので、周囲の騒音環境の変化やオペレータ(話者)の発声方法(発音、スピード)によっては、オペレータ(話者)の説明が聞き取り難い状況が発生するという欠点がある。また、かかる映像表示装置は、スピーカなどの必要器材が多いため、その運搬や設置作業が面倒であるという欠点がある。すなわち、電子プレゼンテーションに必要な器材については、実際にプレゼンテーションを行う場所に運搬して接続作業を実施する場合が多く、この作業が負担になる。さらに、従来の映像表示装置においては、オペレータ(話者)の発声を伝達する手段が聴覚にうったえるものであるため、聴覚障害者に対しては、電子プレゼンテーションを行うことが難しいという欠点がある。 In the video display apparatus of FIG. 7 described above, since the means for transmitting the utterance of the operator (speaker) is easily affected by external factors, changes in the surrounding noise environment and the utterance method of the operator (speaker) (pronunciation) Depending on the speed, there is a drawback in that it is difficult to hear the explanation of the operator (speaker). In addition, since such a video display device has many necessary equipment such as a speaker, there is a disadvantage that its transportation and installation work is troublesome. In other words, equipment necessary for electronic presentation is often transported to a place where the presentation is actually performed and connected, and this work is a burden. Furthermore, in the conventional video display apparatus, since the means for transmitting the utterance of the operator (speaker) is audible, there is a drawback that it is difficult to perform an electronic presentation for a hearing impaired person.
また、特許文献1の音声メモ装置は、プロジェクタとしての機能もなく、単に音声入力された内容を液晶ディスプレイなどに文字表示するものである。これは、自動車などで移動中に、メモを取る場合には有効であるが、静止中の多くの視聴者を対象にスクリーンを用いて映像表示するようなことはできない。
Further, the voice memo device of
また、特許文献2のカラオケ装置やレクチャー装置として用いられる音声情報表示装置においても、プロジェクタ装置としての機能がなく、しかもリモコン装置やタイマを必要とし、操作が面倒である。
In addition, the voice information display device used as a karaoke device or a lecture device of
一方、特許文献3の遠隔講義装置においては、プロジェクタとしての機能を有しているが、プロジェクタ装置の他にインターネット回線や各種のメディア機器を必要とし、それらの機器の持ち運びに不便なだけでなく、使用場所が限定されるという問題がある。
On the other hand, although the distance learning apparatus of
本発明の目的は、上述した問題点を解決すること、すなわち周囲の騒音環境の変化やオペレータ(話者)の発声方法(発音、スピードなど)による外的要因に影響されることのない電子プレゼンテーションに適する音声認識機能を内蔵した映像表示装置(プロジェクタ)を提供することにある。 An object of the present invention is to solve the above-described problems, that is, an electronic presentation that is not affected by external factors due to changes in the surrounding noise environment and the operator's (speaker) utterance method (pronunciation, speed, etc.). Another object of the present invention is to provide a video display device (projector) incorporating a voice recognition function suitable for the above.
また、本発明の他の目的は、電子プレゼンテーションを行うために使用する機材を少なく且つ持ち運びの負担も減少させ、コードの接続などの設置作業も軽減できる音声認識機能を内蔵した映像表示装置を提供することにある。 Another object of the present invention is to provide a video display device with a built-in voice recognition function that reduces the equipment used for electronic presentations, reduces the burden of carrying, and reduces installation work such as cord connection. There is to do.
さらに、本発明の他の目的は、聴覚障害者に対しても、電子プレゼンテーションを行うことができ、より多くの人を対象とする電子プレゼンテーションを実現するとともに、より表現に優れた電子プレゼンテーションを実現できる音声認識機能を内蔵した映像表示装置を提供することにある。 Furthermore, another object of the present invention is to provide electronic presentations to persons with hearing impairments, to realize electronic presentations for more people, and to realize electronic presentations with better expression. An object of the present invention is to provide a video display device having a built-in voice recognition function.
本発明の音声認識機能を内蔵した映像表示装置は、マイクロフォンからの音声が入力され、入力された音声を認識して文字データに変換し、変換された文字データを文字表示メモリに格納し、格納された文字データを読出し、文字表示信号を生成する音声表示信号生成部と、複数の映像信号が入力され、入力された複数の映像信号を切り替えてディジタル映像信号として出力することのできる入力映像信号処理回路と、入力映像信号処理回路から出力されたディジタル映像信号を格納する映像表示メモリと、映像表示メモリに格納されたディジタル映像信号を読出し、映像表示信号を生成する映像表示信号生成部と、音声表示信号生成部から供給される文字表示信号と映像表示信号生成部から供給される映像表示信号を合成した表示信号を生成する表示信号合成回路と、各回路をプログラムに基づいて制御せるCPU部と、CPU部の制御により映像表示メモリおよび音声表示信号生成部を制御するメモリ制御回路と、表示信号合成回路で生成された表示信号を表示する表示部とを有し、CPU部から映像切替の指示を受けたとき、文字表示メモリの格納内容が無くなったことを識別してから映像切替を行うように構成される。 The video display device incorporating the voice recognition function of the present invention receives voice from a microphone, recognizes the inputted voice and converts it into character data, and stores the converted character data in a character display memory. An audio display signal generation unit that reads out the read character data and generates a character display signal, and an input video signal that can be output as a digital video signal by switching between the plurality of video signals that are input. A processing circuit; a video display memory for storing a digital video signal output from the input video signal processing circuit; a video display signal generator for reading the digital video signal stored in the video display memory and generating a video display signal; A display signal is generated by combining the character display signal supplied from the audio display signal generator and the video display signal supplied from the video display signal generator. Display signal synthesizing circuit, a CPU unit for controlling each circuit based on a program, a memory control circuit for controlling the video display memory and the audio display signal generating unit under the control of the CPU unit, and a display signal synthesizing circuit And a display unit for displaying a display signal. When receiving a video switching instruction from the CPU unit, it is configured to perform video switching after identifying that the content stored in the character display memory is lost.
この映像表示装置における音声表示信号生成部は、マイクロフォンに接続される音声入力端子と、音声入力端子に入力された音声信号を認識し、1文字毎の文字コードデータに変換する音声認識回路と、1文字毎の文字コードデータを文字列として格納する文字列バッファ回路と、文字フォントを記憶した文字フォントROMと、文字コードデータを文字表示データに変換して格納する文字表示メモリと、文字表示メモリの文字表示データを読出し、文字表示信号を作成する文字表示信号生成回路とを備え、各回路をバス接続することによりCPU部およびメモリ制御回路から制御されるように形成することができる。 The voice display signal generation unit in the video display device includes a voice input terminal connected to the microphone, a voice recognition circuit that recognizes a voice signal input to the voice input terminal, and converts the voice signal into character code data for each character; A character string buffer circuit that stores character code data for each character as a character string, a character font ROM that stores character fonts, a character display memory that converts character code data into character display data, and a character display memory, and a character display memory And a character display signal generation circuit for generating a character display signal. By connecting each circuit with a bus, it can be controlled by the CPU unit and the memory control circuit.
また、本発明におけるCPU部は、文字列バッファ回路に文字コードデータが格納されると、文字フォントROMをアクセスし、文字コードデータを文字パターンデータに変換して文字表示メモリに格納するように形成される。 In addition, the CPU unit according to the present invention is configured to access the character font ROM when character code data is stored in the character string buffer circuit, convert the character code data into character pattern data, and store it in the character display memory. Is done.
また、本発明におけるメモリ制御回路は、映像表示メモリと文字表示メモリを制御し、映像画面と音声文との同期がとれるように形成される。 The memory control circuit according to the present invention is formed so as to control the video display memory and the character display memory and to synchronize the video screen and the voice sentence.
また、本発明における音声表示信号生成部は、複数の音声入力端子を備え、複数の話者による音声をそれぞれ表示部に独立して文字表示するように形成することができる。 In addition, the voice display signal generation unit according to the present invention includes a plurality of voice input terminals, and can be formed so that voices from a plurality of speakers are individually displayed on the display unit as characters.
さらに、本発明における音声表示信号生成部は、複数の音声入力端子に対応した複数の音声認識回路と複数の文字列バッファ回路とを備え、複数の話者による対話形式の表示を行うことができる。 Furthermore, the voice display signal generation unit according to the present invention includes a plurality of voice recognition circuits and a plurality of character string buffer circuits corresponding to a plurality of voice input terminals, and can perform interactive display by a plurality of speakers. .
以上説明したように、本発明の音声認識機能を内蔵した映像表示装置は、オペレータ(話者)の声を伝達する補助手段として、音声信号を文字表示できる手段を設けているので、電子プレゼンテーション中にオペレータ(話者)の声が聞き取り難い状況が発生しても、その内容を視聴者へ確実に伝えることができるという効果がある。すなわち、周囲の騒音環境の変化やオペレータ(話者)の発声方法(発音、スピードなど)による外的要因に影響されることなく、一定の伝達性を保証することができる。 As described above, the video display apparatus with a built-in voice recognition function of the present invention is provided with means capable of displaying voice signals as characters as auxiliary means for transmitting the voice of the operator (speaker). Even if it is difficult to hear the voice of the operator (speaker), the content can be reliably transmitted to the viewer. In other words, it is possible to guarantee a certain level of transmission without being affected by external factors such as changes in the surrounding noise environment and the operator (speaker) utterance method (sounding, speed, etc.).
また、本発明の映像表示装置は、拡声装置にかわる伝達手段として、音声信号を文字表示できる手段を設けているので、スピーカなどの拡声装置を使用せずに、電子プレゼンテーションを行うことができ、このため使用する機材を少なく且つ持ち運びの負担も減少させることができる上、コードの接続などの設置作業も軽減できるという効果がある。 In addition, the video display device of the present invention is provided with means capable of displaying a voice signal as a transmission means in place of the loudspeaker, so that an electronic presentation can be performed without using a loudspeaker such as a speaker, For this reason, there is an effect that less equipment is used and the carrying burden can be reduced, and installation work such as cord connection can be reduced.
また、本発明の映像表示装置は、音声信号を視覚情報へ変換する手段を設けているので、聴覚障害者の人に対しても、電子プレゼンテーションを行うことができ、より多くの人を対象とした電子プレゼンテーションを実現できるという効果がある。 In addition, since the video display device of the present invention is provided with means for converting an audio signal into visual information, an electronic presentation can be made to a person with hearing impairment, and more people are targeted. The effect is that the electronic presentation can be realized.
さらに、本発明の映像表示装置は、音声信号を聴覚のみならず、視覚へも同時に伝達することにより、電子プレゼンテーション中に音声による視覚的効果を演出でき、より表現に優れた電子プレゼンテーションを行うことができるという効果がある。 Furthermore, the video display device of the present invention can produce a visual effect by voice during an electronic presentation by simultaneously transmitting an audio signal not only to the auditory sense but also to the visual presentation, and to perform an electronic presentation with better expression. There is an effect that can be.
本発明は、コンピュータなどを使用し、電子化された資料を操作しながらプレゼンテーションなどを行う場合(以下、電子プレゼンテーション)において、それに要する伝達性および設置性を向上させることを意図したものである。かかる電子プレゼンテーションは、コンピュータと映像表示装置を接続し、コンピュータを操作することで電子化された資料を映像表示装置に順次表示しながら説明を行うのが一般的である。また、大人数を対象とした電子プレゼンテーションの場合は、大画面の映像表示装置と共に、オペレータ(話者)の声を増幅する拡声装置なども状況に応じて用いられる。特に、本発明では、映像表示装置に音声を認識して文字表示できる音声表示信号生成部を内蔵することにより、電子プレゼンテーションの伝達性および設置性を向上させている。 The present invention is intended to improve the transferability and installation required for a presentation or the like (hereinafter referred to as an electronic presentation) while operating a digitized material using a computer or the like. Such an electronic presentation is generally explained by connecting a computer and a video display device and sequentially displaying the digitized material on the video display device by operating the computer. In addition, in the case of an electronic presentation for a large number of people, a loudspeaker that amplifies the voice of an operator (speaker) and the like are used depending on the situation together with a large-screen video display device. In particular, according to the present invention, the audio display signal generation unit capable of recognizing sound and displaying characters is incorporated in the video display device, thereby improving the transferability and installability of the electronic presentation.
以下、本発明の実施の形態について図面を参照して説明する。図1(a),(b)はそれぞれ本発明の第1の実施の形態を説明する映像表示装置を用いたシステム構成図およびスクリーンの正面図である。図1(a),(b)に示すように、本実施の形態は、コンピュータ3およびビデオ(VIDEO)機器4を接続した映像表示装置1を用い、多くの視聴者7が見ることのできるスクリーン2に映像表示させる電子プレゼンテーションのシステムを示しており、この映像表示装置1にマイクロフォン6を接続したものである。視聴者7の近くにいるオペレータ(話者)5はマイクロフォン6を通して音声情報、例えば「おはようございます」という挨拶、を映像表示装置1に与えると、音声認識機能により文字データに変換し、スクリーン2の一部(ここでは下側)に、すなわち図1(b)に示すとおり、スクリーン2の右下側から左下側に、「おはようございます。」という文字を映像表示させる。
Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIGS. 1A and 1B are a system configuration diagram and a front view of a screen, respectively, using a video display device for explaining a first embodiment of the present invention. As shown in FIGS. 1A and 1B, the present embodiment uses a
このために、電子プレゼンテーションにあたっては、使用する器材が少なくなり、持ち運びや接続作業などが軽減される。また、周囲の騒音環境の変化や、オペレータ(話者)5の発声方法(発音、スピードなど)による外的要因によって、聞き取り難い状況が発生した場合の補助的な伝達手段として、一定の伝達性を保証することや、オペレータ(話者)5の音声に対して、視覚的効果を簡単に演出することもできる。 For this reason, in the electronic presentation, less equipment is used, and carrying and connection work are reduced. In addition, as a supplementary means of transmission in situations where it is difficult to hear due to changes in the surrounding noise environment and external factors due to the utterance method (pronunciation, speed, etc.) of the operator (speaker) 5, a certain level of transmission is provided. And a visual effect can be easily produced for the voice of the operator (speaker) 5.
図2は図1に示す映像表示装置の回路構成図である。図2に示すように、この映像表示装置(プロジェクタ装置)1は、映像をスクリーン2に拡大投写する大画面の映像表示を可能とする投写型映像表示装置である。
FIG. 2 is a circuit configuration diagram of the video display apparatus shown in FIG. As shown in FIG. 2, the video display device (projector device) 1 is a projection video display device that enables a large-screen video display in which video is enlarged and projected onto a
このプロジェクタ装置1は、コンピュータなどの映像信号が供給される複数の映像入力端子101と、これら複数の映像入力端子101から供給される映像信号をA/D変換処理する入力映像信号処理回路102と、この入力映像信号処理回路102でデジタル化された映像信号を表示出力すべき映像表示データとして格納する映像メモリ103と、映像メモリ103から表示データを逐次読み出し、表示出力する映像として映像表示信号を生成する映像表示信号生成回路104と、音声信号を文字表示信号に変換するために、点線枠で囲まれた音声表示信号生成部105と、映像表示信号生成回路104から供給される映像表示信号と音声表示信号生成部105から供給される文字表示信号を合成して最終的な表示信号を生成する表示信号合成回路106と、表示信号合成回路106から供給される表示信号を投写表示する表示部107と、プログラムデータが組み込まれ、制御バス110とデータバス111によってプロジェクタ装置1内の全回路の制御を行うCPU部108と、プロジェクタ装置1内のメモリの制御を行うメモリ制御回路109とを備えている。特に、このメモリ制御回路109は、CPU部108の制御のもとに、映像表示メモリ103と、音声表示信号生成部105とを制御し、所定の映像画面に、確実に音声文すべてが表示できるように同期をとっている。なお、表示部107は表示デバイス,光学レンズ,光源ランプなどから構成され、その表示デバイスは一般に液晶やDLPなどのデバイスが使用されることが多い。この表示デバイスの画像は拡大投写され、スクリーン2に表示される。
The
さらに、音声表示信号生成部105は、マイクロフォン6からの音声信号を供給される音声入力端子1050と、音声入力端子1050を介して供給される音声信号を音声認識し、逐次文字コードに変換する音声認識回路1051と、音声認識回路1051から供給される文字コードを格納する文字列バッファ回路1052と、文字列バッファ回路1052の文字コードデータを表示出力すべき文字表示データとして格納する文字表示メモリ1053と、文字表示メモリ1053から格納データを逐次読み出し、表示出力すべき文字表示信号を生成する文字表示信号生成回路1054と、文字列バッファ回路1052に格納される文字コードデータに対応する文字パターンデータを格納する文字フォントROM1055とを備えている。これらの各回路は、上述した制御バス110とデータバス111により接続される。しかも、文字フォントを記憶した文字フォントROM1055や文字パターンデータを格納する文字表示メモリ1053は、映像表示メモリ103を制御するメモリ制御回路109によって制御され、映像画面と音声文との同期がとれるようにする。また、このメモリ制御回路109は、CPU部108から映像切替の指示を受けたとき、文字表示メモリ1053の格納内容が無くなったことを識別してから映像切替を行うようにしている。
Furthermore, the voice display signal generation unit 105 recognizes a voice input terminal 1050 to which a voice signal from the
かかるプロジェクタ装置1は、通常、映像入力端子101から供給されるコンピュータなどの外部映像機器の映像信号をスクリーン2に拡大投写して映像表示される。その映像信号の処理動作の概略は、次のとおりである。まず、映像入力端子101から外部映像機器の映像信号を入力映像信号処理回路102に供給すると、その映像信号を入力映像信号処理回路102においてA/D変換する。このように、映像信号はアナログ信号からディジタル信号へ逐次変換される。ついで、ディジタル信号化された映像信号は、逐次映像表示メモリ103に映像表示データとして格納される。このため、映像表示メモリ103の格納データは、映像入力端子101から入力される映像信号がデジタル化された映像表示データで逐次更新されることになる。更に、映像表示信号生成回路104では、映像表示メモリ103に格納される映像表示データを逐次読み出し、映像表示出力する映像表示信号を生成し、表示信号合成回路106へ供給する。
The
次に、音声表示信号生成部105の動作について説明する。オペレータ(話者)5が使用するマイクロフォン6などの音声信号を音声入力端子1050から音声認識回路1051へ供給されると、その音声信号が音声認識回路1051において文字認識処理され、音声信号から一文字ごとの文字コードデータへ逐次変換される。その文字コード化された音声信号は、逐次文字列バッファ回路1052に格納される。文字列バッファ回路1052に文字コードデータが格納されると、CPU部108は文字フォントROM1055を使用して、文字コードデータから文字パターンデータに変換する。ついで、その変換された文字パターンデータは、文字表示メモリ1053に文字表示データとして逐次格納する。さらに、文字表示メモリ1053に格納された文字表示データは、文字表示信号生成回路1054から逐次読み出される。文字表示信号生成回路1054では、読み出した文字表示データから文字表示出力する文字表示信号を生成し、表示信号合成回路106へ出力する。また、文字表示信号生成回路1054では、CPU部108から文字表示データの読み出し位置、文字表示の出力位置などの制御データが供給され、文字の表示方法や表示位置を変更できるようにしている。
Next, the operation of the audio display signal generation unit 105 will be described. When a voice signal of the
次に、表示信号合成回路106は、映像表示画面上に文字を表示できるように、映像表示信号生成回路104から供給される映像表示信号と文字表示信号生成回路1054から供給される文字表示信号を合成した表示信号を生成し、表示部107へ供給する。表示部107へ供給された表示信号は、プロジェクタ装置1の表示映像として、スクリーン2へ拡大投写される。この結果、スクリーン2上では、映像入力端子101から入力される映像信号の映像表示画面上に、音声入力端子1050から入力された音声信号が逐次文字表示される。
Next, the display signal combining circuit 106 receives the video display signal supplied from the video display
図3(a),(b)はそれぞれ図1におけるスクリーン画面の横方向表示の例を説明する図である。図3(a)に示すように、このスクリーン2は同一の映像画面(図示省略:以下同様)を写しており、しかも時間的に左から右に向かって推移する場合である。例えば、1つの映像画面に対し、複数の音声文を重畳させるためには、所定の時間とともに、音声文を次から次へ表示させる必要があるためである。この場合は、音声文を下側で横方向に表示させているが、図3(b)に示すように、音声文を上側で横方向に表示させることも可能である。
FIGS. 3A and 3B are diagrams for explaining examples of the horizontal display of the screen screen in FIG. As shown in FIG. 3 (a), this
図4(a),(b)はそれぞれ図1におけるスクリーン画面の縦方向表示の例を説明する図である。図4(a),(b)に示すように、このスクリーン2も動作的には図3と同様であり、図4(a)は音声文を右側縦方向に表示させた場合であり、図4(b)は音声文を左側縦方向に表示させた場合である。
4A and 4B are diagrams for explaining examples of the vertical display of the screen screen in FIG. As shown in FIGS. 4A and 4B, the
図5は図1におけるスクリーン画面の横方向表示の別の例を説明する図である。図5に示すように、このスクリーン2は時間的に音声文を移動させるのではなく、所定時間だけ音声文を一括して表示し、所定時間が過ぎると、その音声文を消去してしまう方式である。このため、複数の音声文があるときには、スクリーン2上に複数行にわたって表示すればよい。
FIG. 5 is a diagram for explaining another example of the horizontal display of the screen screen in FIG. As shown in FIG. 5, the
上述した図3〜図5の音声文の表示にあたっては、プロジェクタ装置1のCPU部108においてプログラム制御できるように設定すればよい。すなわち、CPU部108から文字表示信号生成回路1054に供給される文字表示データの読み出し位置、文字表示出力位置などの制御データを変更することにより、それぞれのイメージにすることができ、また文字の表示位置や表示速度を変更することもできる。
3 to 5 described above may be set such that the CPU 108 of the
図6(a),(b)はそれぞれ本発明の第2の実施の形態を説明する映像表示装置を用いたシステム構成図およびそのスクリーンの正面図である。図6(a),(b)に示すように、本実施の形態はプロジェクタ装置1に2つのマイクロフォン61,62を接続し、2人のオペレータ(話者)51,52の音声をスクリーン2上に表示するようにしたものである。この場合、プロジェクタ装置1には、前述した図2における音声入力端子1050を2つ設ける他に、音声認識回路1051と文字列バッファ回路1052もそれぞれ2つ設け、CPU部109に表示順序や表示方法をプログラム設定することにより、すなわち入力端子数に対応した処理経路を用意することで、2つの音声信号を同時に文字表示することも可能である。この場合、図6(b)に示すように、第1の話者51の音声は、スクリーン2の上側横方向で左から右に表示させ、また第2の話者52の音声は、下側横方向で右から左に表示させることにより、対話形式の表示をも実現することができる。また、この表示のさせ方は、前述した図3〜図5のように表示してもよいし、あるいはこれらを組合せて表示することもできる。なお、2人以上の複数のオペレータ(話者)が存在する場合においても同様である。
FIGS. 6A and 6B are a system configuration diagram using a video display device and a front view of the screen, respectively, for explaining the second embodiment of the present invention. As shown in FIGS. 6A and 6B, in the present embodiment, two
以上、2つの実施の形態については、電子プレゼンテーションの映像表示装置として最も一般的なプロジェクタ装置1を例に説明したが、これらに限定されることはない。例えば、映像表示装置の方式に関係なく、TVやモニタなどといった映像表示装置であっても音声表示信号生成部105を内蔵すれば同様の効果が得られる。
As described above, the two embodiments have been described by taking the most
また、CPU部108から文字表示信号生成回路1054に供給される文字表示データの読み出し位置、文字表示出力位置などの制御データを変更することにより、文字の表示位置や表示速度を変更することができ、その結果、様々な表示方法が可能となり、状況に応じた視覚効果を演出することが可能である。
Further, the display position and display speed of the characters can be changed by changing the control data such as the reading position and the character display output position of the character display data supplied from the CPU unit 108 to the character display
さらに、プロジェクタ装置1のパワーをオンオフしたり、映像入力端子101の切替を行ったりできるように、予めキーワードとその動作をCPU部108に設定しておくことにより、CPU部108が文字列バッファ回路1052において、キーワードと同じ文字コードデータを発見した場合には、キーワードに対応した動作を行わせることもできる。その結果、オペレータ(話者)がキーワードを発声することによって、リモートコントロール装置を用いずに、一般的なリモートコントロールと同様の効果を得ることもできる。
Further, the keyword and its operation are set in advance in the CPU unit 108 so that the power of the
1 映像表示装置
2 スクリーン
3 コンピュータ
4 ビデオ(VIDEO)機器
6,61,62 マイクロフォン
101 映像入力端子
102 入力映像信号処理回路
103 映像表示メモリ
104 映像表示信号生成回路
105 音声表示信号生成部
106 表示信号合成回路
107 表示部
108 CPU部
109 メモリ制御回路
110 制御バス
111 データバス
1050 音声入力端子
1051 音声認識回路
1052 文字列バッファ回路
1053 文字表示メモリ
1054 文字表示信号生成回路
1055 文字フォントROM
DESCRIPTION OF
Claims (6)
複数の映像信号が入力され、入力された複数の映像信号を切り替えてディジタル映像信号として出力することのできる入力映像信号処理回路と、
前記入力映像信号処理回路から出力されたディジタル映像信号を格納する映像表示メモリと、
前記映像表示メモリに格納されたディジタル映像信号を読出し、映像表示信号を生成する映像表示信号生成部と、
前記音声表示信号生成部から供給される文字表示信号と前記映像表示信号生成部から供給される映像表示信号を合成した表示信号を生成する表示信号合成回路と、
各回路をプログラムに基づいて制御せるCPU部と、
前記CPU部の制御により前記映像表示メモリおよび前記音声表示信号生成部を制御するメモリ制御回路と、
前記表示信号合成回路で生成された表示信号を表示する表示部とを有し、
前記CPU部から映像切替の指示を受けたとき、前記文字表示メモリの格納内容が無くなったことを識別してから映像切替を行うことを特徴とする音声認識機能を内蔵した映像表示装置。 Voice from a microphone is input, the inputted voice is recognized and converted into character data, the converted character data is stored in a character display memory, the stored character data is read, and a character display signal is An audio display signal generation unit to generate;
An input video signal processing circuit capable of inputting a plurality of video signals and switching the input video signals to output as a digital video signal;
A video display memory for storing a digital video signal output from the input video signal processing circuit;
A digital video signal stored in the video display memory, and a video display signal generator for generating a video display signal;
A display signal synthesis circuit that generates a display signal obtained by synthesizing the character display signal supplied from the audio display signal generation unit and the video display signal supplied from the video display signal generation unit;
A CPU unit for controlling each circuit based on a program;
A memory control circuit for controlling the video display memory and the audio display signal generation unit under the control of the CPU unit;
A display unit for displaying a display signal generated by the display signal synthesis circuit;
A video display device with a built-in voice recognition function, wherein when a video switching instruction is received from the CPU, the video switching is performed after identifying that the stored contents of the character display memory are lost.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011026929A JP5114578B2 (en) | 2011-02-10 | 2011-02-10 | Video display device with built-in voice recognition function |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011026929A JP5114578B2 (en) | 2011-02-10 | 2011-02-10 | Video display device with built-in voice recognition function |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001105652A Division JP4789227B2 (en) | 2001-04-04 | 2001-04-04 | Video display device with built-in voice recognition function |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011150705A true JP2011150705A (en) | 2011-08-04 |
JP5114578B2 JP5114578B2 (en) | 2013-01-09 |
Family
ID=44537573
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011026929A Expired - Fee Related JP5114578B2 (en) | 2011-02-10 | 2011-02-10 | Video display device with built-in voice recognition function |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5114578B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015046016A (en) * | 2013-08-28 | 2015-03-12 | 株式会社リコー | Image processing server, image processing system and program |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02206826A (en) * | 1989-02-06 | 1990-08-16 | Meidensha Corp | Electronic blackboard |
JPH0388592A (en) * | 1989-08-31 | 1991-04-12 | Sharp Corp | Video telephone system |
JPH04242300A (en) * | 1991-01-17 | 1992-08-28 | Oki Electric Ind Co Ltd | Voice recognition device |
JPH067372U (en) * | 1992-06-29 | 1994-01-28 | 東芝エンジニアリング株式会社 | Audio image output device |
JPH08339198A (en) * | 1995-06-12 | 1996-12-24 | Nec Corp | Presentation device |
JPH10191273A (en) * | 1996-12-25 | 1998-07-21 | Hitachi Ltd | Video/data display method and its device |
JPH10308940A (en) * | 1997-05-09 | 1998-11-17 | Fuji Electric Co Ltd | Industrial television camera monitor |
JPH1141538A (en) * | 1997-07-17 | 1999-02-12 | Nec Home Electron Ltd | Voice recognition character display device |
-
2011
- 2011-02-10 JP JP2011026929A patent/JP5114578B2/en not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02206826A (en) * | 1989-02-06 | 1990-08-16 | Meidensha Corp | Electronic blackboard |
JPH0388592A (en) * | 1989-08-31 | 1991-04-12 | Sharp Corp | Video telephone system |
JPH04242300A (en) * | 1991-01-17 | 1992-08-28 | Oki Electric Ind Co Ltd | Voice recognition device |
JPH067372U (en) * | 1992-06-29 | 1994-01-28 | 東芝エンジニアリング株式会社 | Audio image output device |
JPH08339198A (en) * | 1995-06-12 | 1996-12-24 | Nec Corp | Presentation device |
JPH10191273A (en) * | 1996-12-25 | 1998-07-21 | Hitachi Ltd | Video/data display method and its device |
JPH10308940A (en) * | 1997-05-09 | 1998-11-17 | Fuji Electric Co Ltd | Industrial television camera monitor |
JPH1141538A (en) * | 1997-07-17 | 1999-02-12 | Nec Home Electron Ltd | Voice recognition character display device |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015046016A (en) * | 2013-08-28 | 2015-03-12 | 株式会社リコー | Image processing server, image processing system and program |
Also Published As
Publication number | Publication date |
---|---|
JP5114578B2 (en) | 2013-01-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8515728B2 (en) | Language translation of visual and audio input | |
JP2012109901A (en) | Data presentation device | |
JP4789227B2 (en) | Video display device with built-in voice recognition function | |
JP2017167779A (en) | Image processor, display device, animation generating method, animation display method and program | |
JP2010015076A (en) | Display system, display control device, and display control method | |
CN110996163B (en) | System and method for automatic subtitle display | |
JP2009301248A (en) | Language processor | |
KR20150026645A (en) | Voice Recognition Application Program By Pattern Recognition Technology | |
JP5114578B2 (en) | Video display device with built-in voice recognition function | |
US20120154514A1 (en) | Conference support apparatus and conference support method | |
JPH1141538A (en) | Voice recognition character display device | |
JP2010128766A (en) | Information processor, information processing method, program and recording medium | |
JPWO2018020828A1 (en) | Translation apparatus and translation system | |
KR101039668B1 (en) | Method for generating talking heads from text and system thereof | |
JP6923029B1 (en) | Display device, display system, computer program and display method | |
KR20150060348A (en) | Apparatus and method of communication between disabled person and disabled person | |
JP6486582B2 (en) | Electronic device, voice control method, and program | |
WO2019234952A1 (en) | Speech processing device and translation device | |
JP2003339034A (en) | Network conference system, network conference method, and network conference program | |
JP2006163269A (en) | Language learning apparatus | |
WO2017183127A1 (en) | Display device, output device, and information display method | |
JP4443753B2 (en) | Character interpreter | |
JP2006085418A (en) | Presentation support device, presentation support method and presentation support program | |
CN114842690B (en) | Pronunciation interaction method, system, electronic equipment and storage medium for language courses | |
KR102115228B1 (en) | Sound learning system and method of a hearing-impaired person |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20110712 |
|
TRDD | Decision of grant or rejection written | ||
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121003 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121009 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121015 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151019 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |