JP2009145434A - Speech recognition system - Google Patents
Speech recognition system Download PDFInfo
- Publication number
- JP2009145434A JP2009145434A JP2007320332A JP2007320332A JP2009145434A JP 2009145434 A JP2009145434 A JP 2009145434A JP 2007320332 A JP2007320332 A JP 2007320332A JP 2007320332 A JP2007320332 A JP 2007320332A JP 2009145434 A JP2009145434 A JP 2009145434A
- Authority
- JP
- Japan
- Prior art keywords
- speech recognition
- recognition system
- voice
- feedback adjustment
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、音声認識システムに関し、特に、デスクトップ型パソコン、ノート型パソコン、家庭用マルチメディアシステム、テレビ、DVD、映像システム、携帯電話またはPDA等の画像表示インターフェイスの電子装置に適用し、波形で録音状態、音声処理状態または音声認識完成状態を表示することができ、且つ波形と文字表示インターフェイス上に少なくとも1つのフィードバック調整選択項目を有し、使用者がコマンドを選択し、音声認識エラーを更正するか、または、音声認識システムを調整する音声認識技術の視覚フィードバックインターフェースに関する。 The present invention relates to a speech recognition system, and in particular, applied to an electronic device of an image display interface such as a desktop personal computer, a notebook personal computer, a home multimedia system, a television, a DVD, a video system, a mobile phone or a PDA, and has a waveform. The recording status, speech processing status or speech recognition completion status can be displayed, and at least one feedback adjustment selection item is provided on the waveform and character display interface, and the user selects a command and corrects the speech recognition error. Or relates to a visual feedback interface of speech recognition technology for adjusting a speech recognition system.
昨今、多くの電子装置の使用方面において、音声認識技術の発展が使用者を更に便利にしている。デスクトップ型パソコン、ノート型パソコン、携帯電話、PDAまたはその他の電子装置は、いずれもその入力は、制御の目的を達成するために視覚と肢体の相互の協調が必要である。例を挙げれば、使用者がパソコンを操作する時、コマンドの入力を完成するためにキーボード、マウスまたはその他の付属の制御装置の補助が必要である。または、タッチ式モニターを使用し、プログラムの入力を簡易化するが、しかしながら、モニター表示面積は有限であり、且つ指を使用して操作を行う必要があり、依然として最大の便利性を達成できていない。上記問題は一般人にとっては、ただ不便であるだけかもしれないが、身体障害者、運動神経に疾患を有するもの、または視覚障害者である使用者にとっては、上記電子装置を操作することは、困難である。音声認識技術は、正にこれらの問題を解決することができる。 In recent years, the development of voice recognition technology has made the user more convenient in the usage of many electronic devices. Any desktop PC, notebook PC, mobile phone, PDA or other electronic device requires input and / or limb coordination to achieve control objectives. For example, when a user operates a personal computer, it needs the assistance of a keyboard, mouse or other attached control device to complete command input. Or, use a touch-type monitor to simplify program input. However, the monitor display area is limited, and it is necessary to perform operations using fingers, and the maximum convenience is still achieved. Absent. The above problem may only be inconvenient for the general public, but it is difficult to operate the electronic device for a physically handicapped person, a person with motor nerve disease, or a visually impaired user. It is. Speech recognition technology can exactly solve these problems.
音声認識の応用方面は、使用者が音声信号入力装置、例えば、マイクロフォンだけを必要とし、その音声入力を音声認識システムに認識させ、その後、入力したい音声に対応した文字を出力するか、または更に取得した音声認識結果に基づき直接コマンド操作を行う。 The application direction of voice recognition is that the user needs only a voice signal input device, for example, a microphone, and the voice recognition system recognizes the voice input, and then outputs a character corresponding to the voice to be input, or further Direct command operation is performed based on the acquired voice recognition result.
音声認識システムを使用する時、上記のように、使用者は音声信号入力装置によって音声を入力ならびに録音し、その後、認識過程を開始する。録音および認識過程中、多くの要因が最終的な音声認識結果に影響を及ぼし、例えば、使用する音声信号入力装置の種類、録音の環境、音声入力装置との距離等である。従って、録音および認識過程の監視制御に対して、その需要を有している。これに関して、従来の技術または異なる画像を使用し録音状態および認識状態を表示する、または画像の変化を利用し録音または認識状態を表示するものがある。しかしながら、状態を表示すると同時に、録音または認識結果の品質の優劣または録音過程が成功しているか否かを反映させることができない。 When using the voice recognition system, as described above, the user inputs and records voice by the voice signal input device, and then starts the recognition process. During the recording and recognition process, many factors affect the final speech recognition result, such as the type of speech signal input device used, the recording environment, the distance from the speech input device, and the like. Therefore, there is a need for monitoring and control of recording and recognition processes. In this regard, there is a conventional technique or using a different image to display the recording state and the recognition state, or using a change in the image to display the recording or recognition state. However, simultaneously with displaying the status, it is impossible to reflect the superiority or inferior quality of the recording or recognition result or whether the recording process is successful.
また、音声認識の結果に対して、従来技術または認識結果に基づき若干の調整機能を提供するものがあるが、大半は、音声認識結果全体に対して設けられるだけであるので、音声認識結果中の某部分に対して調整を行い、フィードバックにより音声認識システムの機能を向上させることはできず、使用者別の需要に適合することができない。例を挙げれば、使用者別の某文字または言葉の発音に特殊な訛りがあり、該文字、言葉に対する音声認識結果に対して、フィードバック、調整を行うことができない場合、使用者別に合わせた音声認識システムを提供することができず、その実際の運用の効果が大幅に減少する。
本発明の目的は、波形を利用して録音状態、音声認識進行中の状態、または音声認識完成状態を表す音声認識システムを提供し、使用者に直接音声信号波で録音品質、音声処理速度および音声認識結果品質を監視制御させることである。 An object of the present invention is to provide a voice recognition system that uses a waveform to indicate a recording state, a voice recognition in progress state, or a voice recognition completion state. The quality of the voice recognition result is monitored and controlled.
本発明のもう1つの目的は、エラー更正フィードバック調整機制を備えた音声認識システムを提供し、使用者に効率的な音声認識エラーの更正、または音声認識システムのフィードバック調整を提供することである。 Another object of the present invention is to provide a speech recognition system with an error correction feedback adjustment mechanism to provide a user with efficient speech recognition error correction or feedback adjustment of the speech recognition system.
上記目的を達成するため、本発明が提供する音声認識システムは、少なくとも1つの音声認識エンジンおよび表示装置を含み、且つ該表示装置上に信号インジケータインターフェイスおよび文字出力インターフェイスを設け、そのうち、該信号インジケータインターフェイスは、波形によって使用者が入力した音声信号を表し、録音状態、音声認識進行中状態または音声認識完成状態を表示する。該文字出力インターフェイスは、音声認識した文字結果を表示することに用い、且つ該文字結果は少なくとも1つのワードユニットを含む。また、表示するワードユニットおよび対応する波形ユニットがそれぞれ1つのフィードバック調整選択項目組と連結する;そのフィードバック調整選択項目組は、少なくとも1つのフィードバック調整選択項目を含み、使用者にコマンドを選択させ、音声認識エラーを更正するか、または音声認識システムをフィードバック調整する。 In order to achieve the above object, a speech recognition system provided by the present invention includes at least one speech recognition engine and a display device, and includes a signal indicator interface and a character output interface on the display device, and the signal indicator includes The interface represents a voice signal input by the user with a waveform, and displays a recording state, a voice recognition in progress state, or a voice recognition completion state. The character output interface is used to display a voice-recognized character result, and the character result includes at least one word unit. In addition, the word unit to be displayed and the corresponding waveform unit are each connected with one feedback adjustment selection item set; the feedback adjustment selection item set includes at least one feedback adjustment selection item, and allows the user to select a command; Correct the speech recognition error or feedback adjust the speech recognition system.
上記波形は、好適には、異なる色でそれぞれ録音状態、音声認識信号中状態および音声認識完成状態を表す。 The waveform preferably represents the recording state, the state of speech recognition signal, and the state of speech recognition completion in different colors.
上記入力した音声信号が認識完成した後、認識結果を文字出力インターフェイス上に出力し、且つ各ワードユニットが好適には、信号インジケータインターフェイス上に対応する波形ユニットと照合する。音声認識品質は、大きく分けて三種程度であり、品質良好、品質不良および品質劣悪で厳格な検視、更正が必要である状態を含み、それぞれ異なる色で表示される。 After the input speech signal is recognized, the recognition result is output on the character output interface, and each word unit is preferably checked against the corresponding waveform unit on the signal indicator interface. The speech recognition quality is roughly divided into about three types, including a state in which strict inspection and correction are required due to good quality, poor quality, and poor quality, and are displayed in different colors.
上記信号インジケータインターフェイスの波形ユニットと1つのフィードバック調整選択項目組が連結される;そのフィードバック調整選択項目組が少なくとも1つの選択項目の連結を含み使用者にコマンドを選択させ、効率的に音声認識エラーを更正するか、または音声認識システムをフィードバック調整する。 The waveform unit of the signal indicator interface and one feedback adjustment selection item set are connected; the feedback adjustment selection item set includes a connection of at least one selection item, and allows the user to select a command, thereby efficiently performing a voice recognition error. Or correct the feedback of the speech recognition system.
上記文字出力インターフェイスのワードユニットと1つのフィードバック調整選択項目組が連結する。そのフィードバック調整選択項目組が少なくとも1つの選択項目との連結を含み、使用者にコマンドを選択させ、効率的に音声認識エラーを更正するか、または音声認識システムをフィードバック調整する。 The word unit of the character output interface is connected to one feedback adjustment selection item set. The feedback adjustment selection set includes a concatenation with at least one selection item to allow the user to select a command and efficiently correct a speech recognition error or feedback adjust the speech recognition system.
本発明が提供する波形を利用し使用者の音声信号を表す音声認識システムによって、使用者は録音過程が成功しているか否かおよび入力音声信号の品質を即座に判断することができる。
本発明が提供する波形の色を変化させる音声認識システムによって、使用者は、音声処理の進度および音声認識結果の品質を便利に監視制御できる。
本発明が提供する音声認識システムによって、使用者は、ワードユニットが入力した音声信号および音声認識結果の文字に対してエラー更正またはシステムのフィードバック調整することで便利に文字入力の作業が完成でき、あるいは該音声認識システムの性能の改善を持続することができる。
The voice recognition system that represents the user's voice signal using the waveform provided by the present invention allows the user to immediately determine whether the recording process is successful and the quality of the input voice signal.
The speech recognition system that changes the color of the waveform provided by the present invention allows the user to conveniently monitor and control the progress of speech processing and the quality of speech recognition results.
With the speech recognition system provided by the present invention, the user can conveniently complete the character input operation by correcting the error or adjusting the feedback of the system for the speech signal input by the word unit and the characters of the speech recognition result. Alternatively, the improvement of the performance of the voice recognition system can be continued.
本発明の音声認識システムの好適な実施例を図面を用いて説明する。
図1は、本発明の実施例の音声認識技術の視覚フィードバックインターフェースを用いた音声認識システムについての説明図であるが、デスクトップ型パソコン、ノート型パソコン、家庭用マルチメディアシステム、テレビ、DVD、映像システム、携帯電話またはPDA等の画像表示インターフェイスの電子装置に適用する音声認識システムに関するものである。
図に示すように、本発明の実施例の音声認識システムは、少なくとも音声認識エンジン10および表示装置20を含み、且つ該表示装置20に信号インジケータインターフェイス30および文字出力インターフェイス40を設けてなる。そのうち、該信号インジケータインターフェイス30は波形32によって使用者が入力する音声信号を表し、録音状態の音声認識状態を表示する。該文字出力インターフェイス40は、音声認識結果の文字42を表示し、該文字結果は、少なくとも1つのワードユニットを含む。図に示すように、信号インジケータインターフェイス30上に表示する波形32は、使用者が入力した音声信号を表示することに用い、文字出力インターフェイス40上に表示する文字42は上記音声認識後に取得される結果である。
A preferred embodiment of the voice recognition system of the present invention will be described with reference to the drawings.
FIG. 1 is an explanatory diagram of a voice recognition system using a visual feedback interface of a voice recognition technique according to an embodiment of the present invention. A desktop personal computer, a notebook personal computer, a home multimedia system, a television, a DVD, and an image. The present invention relates to a speech recognition system applied to an electronic device of an image display interface such as a system, a mobile phone or a PDA.
As shown in the figure, the speech recognition system according to the embodiment of the present invention includes at least a
また、本発明の実施例の音声認識システムの表示装置20は、デスクトップ型パソコン、ノート型パソコン、家庭用マルチメディアシステム、テレビ、DVD、AV機器、携帯電話またはPDA等の電子装置の表示スクリーンに用いることができ、映像信号を出力する表示スクリーンまたはリモコン上の表示スクリーンに連結できる。
The
図2は、本発明の第1実施例の説明図であり、使用者の録音状態を表示する。図に示すように、録音過程時、使用者は、音声信号入力装置(図示せず、例えば、マイクロフォン)によって音声を音声認識システム内に入力し、入力した音声信号は波形32で信号インジケータインターフェイス30上に表示される。波形の使用は、2つの利点を有する内の1つは、使用者が録音過程において、ある原因によって使用者の音声信号を実際上円滑に入力できない場合、例えば、音声信号入力装置が起動しない、音声入力装置と音声認識システムを設けた電子装置の接触不良等の原因、この時、使用者は、波形の変化を観察し、即座に反応でき、時間の浪費を避けることができる。
もう1つは、波形の形状に基づき、使用者は、音声信号の入力品質をだいたい判別することができ、適切な調整を行うことができる。例を挙げれば、環境ノイズの干渉、使用する音声入力装置の感度、または使用者が音声入力装置を使用する方式等が音声信号を入力する品質に影響する可能性があり、録音段階において、音声信号入力品質に影響を及ぼす要因を掌握し排除すれは、その後の音声認識過程において、軽視できない補助となる。
FIG. 2 is an explanatory diagram of the first embodiment of the present invention, and displays the recording state of the user. As shown in the figure, during the recording process, the user inputs a voice into the voice recognition system by a voice signal input device (not shown, for example, a microphone), and the input voice signal has a
The other is that the user can roughly determine the input quality of the audio signal based on the waveform shape, and can make an appropriate adjustment. For example, environmental noise interference, the sensitivity of the audio input device used, or the method in which the user uses the audio input device may affect the quality of the audio signal input. Grasping and eliminating the factors that affect signal input quality is an auxiliary that cannot be neglected in the subsequent speech recognition process.
上記のように、本発明の第1実施例の該信号インジケータインターフェイス30は、波形32によって録音状態および音声認識状態を表示し、そのうち、音声認識状態が更に音声認識進行中状態および音声認識完成状態を含む。また、録音状態、音声認識進行中状態および音声認識完成状態を表す代表は、それぞれ異なる色で表示し、使用者が視覚上で処理状態を、音声認識品質、または音声認識の速度を判断できる。
As described above, the
使用者が入力した音声信号が識別進行中である時、上記信号インジケータインターフェイス30の信号波形32は、異なる色で既に処理された信号波形を表示し、音声認識の過程を示す。言い換えれば、開始時、使用者が入力した音声信号を録音状態の色で表示する。音声認識プロセス開始後、処理した音声信号は音声認識進行中状態の色で表示する。入力した音声信号認識が全て完成した後、音声認識完成状態の色で表示する。某ワードユニットは認識品質が良好な色であり、某ワードユニットは認識品質が不良な色であり、某ワードユニットは認識品質が劣悪の色である。
When the voice signal input by the user is in the process of identification, the
図3に示すように、実線の波形321は、音声認識過程を完成したものであり、点線の波形322は、音声認識過程を完成していないものである。音声認識が完成した後、全ての波形を新たな色へ変更させ、音声認識の処理が完成したことを表示する。詳細は後に記載する。
As shown in FIG. 3, a
使用者が音声信号を入力し且つ入力された音声信号も認識が完成した後、認識結果は好ましくは、ワードユニット420を選択し、逐一上記の文字出力インターフェイス40上に表示する。図4に示すように、使用者が入力する音声信号が波形32で表示され、そのうち、該波形32は、少なくとも1つの波形ユニット320を区分し、各波形ユニット320は、認識結果中のワードユニット420に対応し、両者の対応関係は、前後位置を相互に合わせるように調整する方式で対応する。本実施例中、各波形ユニット320は、認識結果のワードユニット420に対応する。図4から分かるように、使用者は、「今日の天気は如何」の音声信号を入力し、それが表示する文字結果は「今日の天気は如何」である。波形ユニット320に対応する入力音声信号は、認識結果中「今日」のワードユニット420であることができる。両者の位置前後は相互に照合され、且つ異なる色でその認識品質を表す。
After the user inputs the voice signal and the input voice signal is also recognized, the recognition result is preferably selected on the
該音声認識システムが音声理解に用いる時、信号インジケータインターフェイス30は、依然として図4に示すように、文字出力インターフェイス40は、音声理解の結果を出力する。また、文字出力インターフェイス40は音声認識結果の文字42を含むことができ、または、それをまず隠し、使用者が表示することを選択した後に表示させることもできる。
When the speech recognition system is used for speech understanding, the
図4に示すように、音声認識完成後、その信号と文字表示は、「今日」、「天気」、「如何」等のワードユニット420を単位とし段落を合わせ、そのうち、各ワードユニットがいずれも色で表示し、該ワードユニットの音声認識結果の品質を表す。本実施例中、各ワードユニット420は緑色、黄色または赤色で表示する。そのうち、緑色は、該文字が良好な音声認識品質であることを示す。黄色は、該文字が不良な音声品質を有することを警告する。赤色は、該文字が劣悪な音声品質を有し、検査、更正が必要である音声認識結果を表す。このように、使用者は、直接視覚上、各ワードユニットの音声認識結果品質の優劣を分別し、適切な誤り更正とフィードバック調整システムの処理を行うことができる。
As shown in FIG. 4, after the speech recognition is completed, the signal and character display are arranged in units of
また、上記各波形ユニット320は、フィードバック調整選択項目組と連結する。
該選択項目組は、少なくとも1つの選択項目を含み、使用者に再度録音させ、録音を更正し、音声認識のエラーを更正させるか、音声認識システムをフィードバック調整させる。図5に示すように、各波形ユニット320は、第1フィードバック調整選択項目組50と連結し、該第1フィードバック調整選択項目組50は、少なくとも1つのフィードバック調整選択項目52を含む。本実施例中、該第1フィードバック調整選択項目組50は、「リピート」、「再録」、「受け入れ調整」、「手書き入力に変更」、「キーボード入力に変更」等の第1フィードバック調整選択項目52を含む。
音声認識完成後、使用者は、該表示装置20上に表示されるマウスポインタ22をフィードバック調整したい波形ユニット320に移動させ、自動またはマウスまたはタッチパッドでポイントし、該波形ユニット320と連結する第1フィードバック調整選択項目組50を該表示装置20上に表示する。従って、使用者は、必要な第1フィードバック調整選択項目52を選択し、音声認識結果を更正、または音声認識システムをフィードバック調整する。
Each
The selection set includes at least one selection item that causes the user to re-record, correct the recording, correct the speech recognition error, or feed back the speech recognition system. As shown in FIG. 5, each
After the speech recognition is completed, the user moves the
例を挙げれば、使用者は、波形に異常を発見した時、第1フィードバック調整選択項目52の選択項目「リピート」を選択し、「該音声信号」をリピートし、ノイズ干渉がないかを確定する。または、音声認識の文字結果が程度の大きな偏差を有する時、該「リピート」とした第1フィードバック調整選択項目52によって入力した音声信号を再度聞き、原因の所在、例えば、発音の偏差を検出する。
問題があることが確定された場合、第1フィードバック調整選択項目52の選択項目「再録」を選択し、音声信号を再度入力する。音声認識の文字出力結果の偏差が元の発音習慣の問題によるものである場合、第1フィードバック調整選択項目52の「受け入れ調整」の選択項目を選択し、音声認識システムを鋭く調整し、該使用者の要求に適合させることができる。
該音声認識システムが該言葉を明瞭に認識できるように調整する前、使用者は入力モードの変更を決定し、例えば、「手書き入力に変更」または「キーボード入力に変更等」を選択し、音声入力モードを手書きまたはキーボードモードに切り替え、入力の目的を完成する。
For example, when an abnormality is found in the waveform, the user selects the selection item “repeat” of the first feedback
When it is determined that there is a problem, the selection item “re-record” of the first feedback
Before adjusting the speech recognition system so that the words can be clearly recognized, the user decides to change the input mode and selects, for example, “change to handwriting input” or “change to keyboard input” and the like. Switch the input mode to handwriting or keyboard mode and complete the input purpose.
上記文字表示結果中の各ワードユニット420も、フィードバック選択項目組と連結する。該選択項目組は、少なくともフィードバック調整選択項目との連結を含み、使用者に選択させ、音声認識のエラーを更正し、または音声認識システムをフィードバック調整する。
図6に示すように、各ワードユニット420は、第2フィードバック調整選択項目組60と連結し、該第2フィードバック調整選択項目組60は、少なくとも1つのフィードバック選択項目62を含む。本実施例中、該第2フィードバック調整選択項目組60は、「次の音声認識選択項目を表示する」、「音声の相似度に従い音声認識選択項目を優先的に表示する」、「全ての選択項目を表示する」、「手書き入力に変更する」、「キーボード入力に変更する」等のフィードバック選択項目62を含む。音声認識完成後、使用者は、該マウスポインタ22をフィードバック調整したいワードユニット420上に移動させ、自動またはマウス、またはタッチパッドでポイントすることによって、該ワードユニット420と連結する第2フィードバック調整選択項目組60を該表示装置20上に表示することができる。従って、使用者は、必要なフィードバック調整選択項目62を選択することによって、音声認識結果に対してフィードバック調整を行うことができる。
Each
As shown in FIG. 6, each
発音の問題によって、使用者が入力した音声信号に基づき獲得される音声認識文字結果は大きく変化する可能性がある。図6を例とし、使用者が朗読する音声は、「私はご飯が食べたい」であり、発音習慣の違いによって、認識が得る結果が異なる可能性がある。使用者が入力した音声信号に基づき、本発明の視覚フィードバックシステムは、使用者が該入力した音声信号の複数の音声認識近似結果に対して、選択させる。近似結果は、上記第2フィードバック調整選択項目組60中の異なるフィードバック選択項目62を選択し、決定することができる。例を挙げれば、「次の選択肢」の選択項目62を選択することによって、使用者は、次の選択肢を得ることができる。「音声相似度優先」の選択項目62を選択することによって、使用者は、前後の言葉の関連に基づき最も可能な選択肢を検出し獲得することができる。または、「全ての選択肢を表示」の選択項目62を選択することによって、使用者は、全ての音声認識選択肢を表示させることができる。または、使用者は、その他の入力モードを選択することができ、例えば「手書き入力に切り替え」または「キーボード入力に切り替え」を選択し、音声入力モードを手書きまたはキーボード入力モードに切り替え、入力の目的を完成することができる。
Due to the problem of pronunciation, the voice recognition character result obtained based on the voice signal input by the user may change greatly. Using FIG. 6 as an example, the speech read by the user is “I want to eat rice”, and the result of recognition may differ depending on the pronunciation habit. Based on the audio signal input by the user, the visual feedback system of the present invention allows the user to select a plurality of speech recognition approximation results of the input audio signal. The approximation result can be determined by selecting a different
なお、本発明では好ましい実施例を前述の通り開示したが、これらは決して本発明に限定するものではなく、当該技術を熟知する者なら誰でも、本発明の精神と領域を脱しない均等の範囲内で各種の変動や潤色を加えることができることは勿論である。 In the present invention, the preferred embodiments have been disclosed as described above, but these are not intended to limit the present invention in any way, and anyone who is familiar with the technology can make an equivalent scope without departing from the spirit and scope of the present invention. Of course, various fluctuations and hydration colors can be added.
10 音声認識エンジン
20 表示装置
22 マウスポインタ
30 信号インジケータインターフェイス
32,321,322 波形
320 波形ユニット
40 文字出力インターフェイス
42 文字
420 ワードユニット
50 第1フィードバック調整選択項目組
52 第1フィードバック調整選択項目
60 第2フィードバック調整選択項目組
62 第2フィードバック調整選択項目
10
Claims (13)
且つ該表示装置上に、
波形で使用者が入力する音声信号を表し、録音状態、音声認識進行中状態、音声認識完成状態を表示する信号インジケータインターフェイスと、
音声認識した文字結果を表示することに用い、且つ該文字結果が少なくとも2つのワードユニットを含む文字出力インターフェイスと、
を有することを特徴とする音声認識システム。 Including at least one speech recognition engine and a display device;
And on the display device,
A signal indicator interface that represents the voice signal input by the user in the waveform and displays the recording status, voice recognition in progress status, voice recognition completion status,
A character output interface that is used to display a voice-recognized character result and the character result includes at least two word units;
A speech recognition system comprising:
The speech recognition system according to claim 9, wherein the word unit is a word, a classifier, or an idiom.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007320332A JP2009145434A (en) | 2007-12-12 | 2007-12-12 | Speech recognition system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007320332A JP2009145434A (en) | 2007-12-12 | 2007-12-12 | Speech recognition system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009145434A true JP2009145434A (en) | 2009-07-02 |
Family
ID=40916132
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007320332A Pending JP2009145434A (en) | 2007-12-12 | 2007-12-12 | Speech recognition system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2009145434A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016156978A (en) * | 2015-02-25 | 2016-09-01 | カシオ計算機株式会社 | Voice recording device, voice recording method, and program |
KR20190042903A (en) * | 2017-10-17 | 2019-04-25 | 삼성전자주식회사 | Electronic device and method for controlling voice signal |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000259178A (en) * | 1999-03-08 | 2000-09-22 | Fujitsu Ten Ltd | Speech recognition device |
JP2003283947A (en) * | 2002-03-22 | 2003-10-03 | Canon Inc | Program retriever and program retrieving method |
JP2004279860A (en) * | 2003-03-18 | 2004-10-07 | Sis:Kk | Minutes retrieval assisting device |
JP2005077678A (en) * | 2003-08-29 | 2005-03-24 | Casio Comput Co Ltd | Text and voice synchronizing device and text and voice synchronization processing program |
JP2006163227A (en) * | 2004-12-10 | 2006-06-22 | Mitsubishi Electric Corp | Speech recognition device |
JP2006162693A (en) * | 2004-12-02 | 2006-06-22 | Ricoh Co Ltd | Speech recognition system |
JP2006267319A (en) * | 2005-03-23 | 2006-10-05 | Nec Corp | Support system for converting voice to writing, method thereof, and system for determination of correction part |
-
2007
- 2007-12-12 JP JP2007320332A patent/JP2009145434A/en active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000259178A (en) * | 1999-03-08 | 2000-09-22 | Fujitsu Ten Ltd | Speech recognition device |
JP2003283947A (en) * | 2002-03-22 | 2003-10-03 | Canon Inc | Program retriever and program retrieving method |
JP2004279860A (en) * | 2003-03-18 | 2004-10-07 | Sis:Kk | Minutes retrieval assisting device |
JP2005077678A (en) * | 2003-08-29 | 2005-03-24 | Casio Comput Co Ltd | Text and voice synchronizing device and text and voice synchronization processing program |
JP2006162693A (en) * | 2004-12-02 | 2006-06-22 | Ricoh Co Ltd | Speech recognition system |
JP2006163227A (en) * | 2004-12-10 | 2006-06-22 | Mitsubishi Electric Corp | Speech recognition device |
JP2006267319A (en) * | 2005-03-23 | 2006-10-05 | Nec Corp | Support system for converting voice to writing, method thereof, and system for determination of correction part |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016156978A (en) * | 2015-02-25 | 2016-09-01 | カシオ計算機株式会社 | Voice recording device, voice recording method, and program |
KR20190042903A (en) * | 2017-10-17 | 2019-04-25 | 삼성전자주식회사 | Electronic device and method for controlling voice signal |
WO2019078576A1 (en) * | 2017-10-17 | 2019-04-25 | 삼성전자주식회사 | Electronic device and method for controlling voice signal |
KR102421255B1 (en) * | 2017-10-17 | 2022-07-18 | 삼성전자주식회사 | Electronic device and method for controlling voice signal |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20090125299A1 (en) | Speech recognition system | |
JP6605995B2 (en) | Speech recognition error correction apparatus, method and program | |
US20120046945A1 (en) | Multimodal aggregating unit | |
US6728680B1 (en) | Method and apparatus for providing visual feedback of speed production | |
JP3662780B2 (en) | Dialogue system using natural language | |
US20090326938A1 (en) | Multiword text correction | |
US20110201387A1 (en) | Real-time typing assistance | |
US20020123894A1 (en) | Processing speech recognition errors in an embedded speech recognition system | |
US6499015B2 (en) | Voice interaction method for a computer graphical user interface | |
KR20080104099A (en) | Input apparatus and input method thereof | |
KR20040063153A (en) | Method and apparatus for a gesture-based user interface | |
US20040225502A1 (en) | Record button on a computer system | |
US10489642B2 (en) | Handwriting auto-complete function | |
JP3476007B2 (en) | Recognition word registration method, speech recognition method, speech recognition device, storage medium storing software product for registration of recognition word, storage medium storing software product for speech recognition | |
CN101452700A (en) | Voice identification system | |
US11631413B2 (en) | Electronic apparatus and controlling method thereof | |
US20080104512A1 (en) | Method and apparatus for providing realtime feedback in a voice dialog system | |
US10558417B1 (en) | Content prioritization for a display array | |
TW201512968A (en) | Apparatus and method for generating an event by voice recognition | |
JP2000250677A (en) | Device and method for multimodal interface | |
JP2009145434A (en) | Speech recognition system | |
KR20170133989A (en) | Electronic board and electronic board system having voice recognition function, method for converting mode of electronic board using the same | |
CN107391015A (en) | Control method, device and equipment of intelligent tablet and storage medium | |
JP2006011641A (en) | Information input method and device | |
KR20200137403A (en) | Electronic blackboard and electronic blackboard system with voice recognition function |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100623 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100630 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20101203 |