JP5556529B2 - In-vehicle speech recognition device - Google Patents
In-vehicle speech recognition device Download PDFInfo
- Publication number
- JP5556529B2 JP5556529B2 JP2010207766A JP2010207766A JP5556529B2 JP 5556529 B2 JP5556529 B2 JP 5556529B2 JP 2010207766 A JP2010207766 A JP 2010207766A JP 2010207766 A JP2010207766 A JP 2010207766A JP 5556529 B2 JP5556529 B2 JP 5556529B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- voice command
- signal input
- signal
- control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Telephone Function (AREA)
Description
本発明は、音声認識した音声コマンドに応じた制御信号を制御対象機器へ送出する車載音声認識装置に関するものである。 The present invention relates to an in-vehicle voice recognition device that sends a control signal corresponding to a voice command that has been voice-recognized to a control target device.
従来、車載情報端末においては、安全性や利便性向上のために音声認識機能を用いたHMI(Human Machine Interface)が多数採用されている。 Conventionally, in an in-vehicle information terminal, many HMIs (Human Machine Interfaces) using a voice recognition function have been adopted in order to improve safety and convenience.
このような車載情報端末として、例えば、音声認識機能を用いて乗員の発話する音声から音声コマンドを認識し、認識結果に応じた動作を行うようにしたものがある(例えば、特許文献1参照)。 As such an in-vehicle information terminal, for example, there is one that recognizes a voice command from a voice spoken by an occupant using a voice recognition function and performs an operation according to a recognition result (for example, see Patent Document 1). .
上記特許文献1に記載されたような装置では、音声認識した音声コマンドに対する動作が一律に規定されている。すなわち、音声認識した音声コマンドと、この音声コマンドに対応する動作とが1対1の関係となっている。
In an apparatus such as that described in
しかし、このように音声認識した音声コマンドと、この音声コマンドに対応する動作とが1対1の関係となっている構成では、1つの音声コマンドで1つの動作しか実施することかできないため、利便性の高い機能を実現することはできないといった問題がある。 However, in the configuration in which the voice command recognized in this way and the operation corresponding to the voice command have a one-to-one relationship, only one operation can be performed with one voice command. There is a problem that a highly functional function cannot be realized.
本発明は上記問題に鑑みたもので、より利便性の高い機能を実現できるようにすることを目的とする。 The present invention has been made in view of the above problems, and an object thereof is to realize a more convenient function.
上記目的を達成するため、請求項1に記載の発明は、音声信号入力手段を介して入力される音声信号から音声コマンドを音声認識し、当該音声コマンドに応じた制御信号を制御対象機器へ送出する車載音声認識装置であって、音声信号入力手段の1つは車室内マイクであり、音声信号入力手段の1つは、通信インタフェースを介して接続された携帯型通信機器であり、音声信号入力手段を介して入力される音声信号を予め定められた条件に従って区別し、当該音声信号の区別に従って音声コマンドに応じた制御信号を異ならせて制御対象機器へ送出する制御信号送出手段と、音声信号が入力される音声信号入力手段の区別に従って音声コマンドに応じた制御信号を異なるように規定した情報テーブルを記憶する記憶手段と、を備え、制御信号送出手段は、記憶手段に記憶された情報テーブルを参照して、音声信号が入力される音声信号入力手段の区別に従って音声コマンドに応じた制御信号を異ならせて制御対象機器へ送出することを特徴としている。 In order to achieve the above object, according to the first aspect of the present invention, a voice command is recognized from a voice signal input via the voice signal input means, and a control signal corresponding to the voice command is sent to the control target device. One of the voice signal input means is a vehicle interior microphone, and one of the voice signal input means is a portable communication device connected via a communication interface, and the voice signal input A control signal sending means for distinguishing a voice signal input through the means according to a predetermined condition, sending a control signal according to a voice command according to the distinction of the voice signal to a control target device, and a voice signal Storage means for storing an information table that defines different control signals according to voice commands according to the distinction of voice signal input means to Output means, characterized by referring to the information table stored in the storage unit, that transmits to the control target device by varying a control signal corresponding to the voice command according to the distinction between the speech signal input means to which the audio signal is inputted It is said.
このような構成によれば、音声信号入力手段を介して入力される音声信号を予め定められた条件に従って区別し、当該音声信号の区別に従って音声コマンドに応じた制御信号を異ならせて制御対象機器へ送出するので、1つの音声コマンドであっても音声信号の区別に従って異なる制御信号を制御対象機器へ送出することができ、より利便性の高い機能を実現することができる。
また、音声信号が入力される音声信号入力手段の区別に従って音声コマンドに応じた制御信号を異なるように規定した情報テーブルを参照して、音声信号が入力される音声信号入力手段の区別に従って音声コマンドに応じた制御信号を異ならせて制御対象機器へ送出することができる。
また、音声信号入力手段の1つを車室内マイクとし、音声信号入力手段の1つは、通信インタフェースを介して接続された携帯型通信機器とすることができる。
According to such a configuration, the audio signal input via the audio signal input unit is distinguished according to a predetermined condition, and the control target device is differentiated according to the audio command according to the audio signal distinction. Therefore, even for one voice command, different control signals can be sent to the control target device according to the distinction of the voice signal, and a more convenient function can be realized.
In addition, referring to the information table in which the control signal according to the voice command is defined differently according to the distinction of the voice signal input means to which the voice signal is inputted, the voice command according to the distinction of the voice signal input means to which the voice signal is inputted The control signal corresponding to the signal can be made different and sent to the control target device.
Further, one of the audio signal input means can be a vehicle interior microphone, and one of the audio signal input means can be a portable communication device connected via a communication interface.
また、請求項3に記載の発明は、複数の音声信号入力手段を介して音声信号が別々に入力されるようになっており、制御信号送出手段は、音声信号入力手段を介して入力される音声信号を、音声信号が入力される音声信号入力手段毎に区別することを特徴としている。In the invention according to
このように、音声信号入力手段を介して入力される音声信号を、音声信号が入力される音声信号入力手段毎に区別し、音声信号の区別に従って音声コマンドに応じた制御信号を異ならせて制御対象機器へ送出することができる。 In this way, the audio signal input through the audio signal input means is distinguished for each audio signal input means to which the audio signal is input, and control is performed by varying the control signal corresponding to the audio command according to the audio signal distinction. It can be sent to the target device.
また、請求項2に記載の発明は、車室内の乗員の有無を判定する乗員有無判定手段と、乗員有無判定手段により車室内に乗員がいると判定された場合、携帯型通信機器のマイクを介して入力される音声信号より音声認識した音声コマンドに応じた制御信号の送出を禁止する制御信号送出禁止手段と、を備えたことを特徴としている。 According to a second aspect of the present invention, when it is determined by the occupant presence / absence determining means for determining the presence / absence of an occupant in the vehicle interior and the occupant presence / absence determining means, the microphone of the portable communication device is used. Control signal transmission prohibiting means for prohibiting transmission of a control signal in accordance with a voice command recognized by voice from a voice signal input via the voice signal.
このような構成によれば、車室内に乗員がいると判定された場合、携帯型通信機器のマイクを介して入力される音声信号より音声認識した音声コマンドに応じた制御信号の送出が禁止されるので、車室内にいる搭乗者の意に反して携帯型通信機器の使用者によって制御対象機器の設定等が変更されてしまうといった問題を防止することができる。 According to such a configuration, when it is determined that there is an occupant in the vehicle compartment, transmission of a control signal according to a voice command recognized by voice from a voice signal input via the microphone of the portable communication device is prohibited. Therefore, it is possible to prevent the problem that the setting of the control target device is changed by the user of the portable communication device against the intention of the passenger in the passenger compartment.
(第1実施形態)
本発明の第1実施形態に係る車載音声認識装置のブロック構成を図1に示す。本車載音声認識装置1は、マイク10、通信部12、車内通信制御部13、ディスプレイ14、スピーカ15および制御部16を備えている。本車載音声認識装置1は、車内通信制御部13に接続された車内LAN5を介してエアコンECU2、オーディオECU3等と接続されている。
(First embodiment)
FIG. 1 shows a block configuration of the in-vehicle speech recognition device according to the first embodiment of the present invention. The in-vehicle
マイク10は、車室内の音声を集音するためのものであり、車室内の音声に応じた音声信号を制御部16へ送出する。
The
通信部12は、無線通信網を介して外部通信機器と通信するためのものである。本車載音声認識装置1は、通信部12を介して携帯電話4と通信することが可能となっている。
The
車内通信制御部13は、車内LAN5を介して接続されたエアコンECU2、オーディオECU3等の制御対象機器と通信するためのものである。
The in-vehicle
制御部16は、この車内通信制御部13を介してエアコンECU2およびオーディオECU3等の制御対象機器を制御することが可能となっている。
The
ディスプレイ14は、液晶等の表示部を有しており、制御部16より入力される映像信号に応じた映像を表示部に表示させる。
The display 14 has a display unit such as a liquid crystal, and displays a video corresponding to the video signal input from the
スピーカ15は、車室内に取り付けられており、制御部16より入力される音声信号に応じた音声を出力する。
The speaker 15 is attached to the vehicle interior and outputs sound corresponding to the sound signal input from the
制御部16は、音声認識処理を行うための音声認識エンジン16aと、ROM、RAM、フラッシュメモリから成る記憶部16bと、CPU(図示せず)を備えたコンピュータとして構成されている。CPUは、記憶部16bに記憶されたプログラムに従って各種処理を実施する。
The
制御部16は、マイク10あるいは携帯電話4を介して入力される音声信号から音声コマンドを音声認識し、当該音声コマンドに応じた制御信号を各制御対象機器2、3へ送出する。
The
本車載音声認識装置1の制御部16には、マイク10より音声信号が入力されるとともに、携帯電話4より音声信号が入力されるようになっている。制御部16は、マイク10より入力される音声信号から音声コマンドを音声認識することも、携帯電話4より入力される音声信号から音声コマンドを音声認識することも可能となっている。
An audio signal is input from the
本実施形態における制御部16は、マイク10より入力される音声信号と携帯電話4より入力される音声信号を区別し、マイク10より入力される音声信号から音声認識した音声コマンドと携帯電話4より入力される音声信号から音声認識した音声コマンドが同一であっても、マイク10より入力される音声信号から音声認識した音声コマンドに応じて送出する制御信号と、携帯電話4より入力される音声信号から音声認識した音声コマンドに応じて送出する制御信号とを異ならせることが可能となっている。
The
制御部16の記憶部16bには、音声信号の区別に従って音声コマンドに応じた動作、すなわち音声コマンドに応じて送出する制御信号を異ならせるように規定した情報テーブルが記憶されている。
The
制御部16は、記憶部16bに記憶された情報テーブルを参照してマイク10より入力される音声信号から音声認識した音声コマンドに応じて送出する制御信号と、携帯電話4より入力される音声信号から音声認識した音声コマンドに応じて送出する制御信号とを異ならせて送出する。
The
情報テーブルの構成を図2に示す。この図に示すように、情報テーブルには、各音声コマンドに対する動作が入力インタフェース毎に規定されている。 The configuration of the information table is shown in FIG. As shown in this figure, the operation for each voice command is defined for each input interface in the information table.
例えば、「エアコンオン」という音声コマンドに対する動作について、入力インタフェースがマイク10の場合には「前回使用時の送風箇所からの送風でエアコンをオン」すると規定され、入力インタフェースが携帯電話4の場合には「全ての送風箇所からの送風でエアコンをオン」すると規定されている。
For example, regarding the operation for the voice command “air conditioner on”, when the input interface is the
したがって、車室内でマイク10に向かって「エアコンオン」と発声した場合には、車両の前回使用時の送風箇所からの送風でエアコンがオンするような制御信号がエアコンECU2に送出され、例えば、車両に乗り込む前に車両から離れた場所から携帯電話4を用いて車載音声認識装置1に通信接続して「エアコンオン」と発声した場合には、車両の全ての送風箇所からの送風でエアコンがオンするような制御信号がエアコンECU2に送出される。
Therefore, when “air conditioner on” is uttered toward the
また、「インフォメーション」という音声コマンドに対する動作について、入力インタフェースがマイク10の場合には「交通情報、ガソリン価格等の情報を提供」すると規定され、入力インタフェースが携帯電話4の場合には「鍵が掛かっているかどうか、窓の開閉状態等の情報を提供」すると規定されている。
Further, regarding the operation for the voice command “information”, it is defined that “information such as traffic information and gasoline price” is provided when the input interface is the
したがって、車室内でマイク10に向かって「インフォメーション」と発声した場合には、交通情報、ガソリン価格等の情報を表示させるような制御信号がオーディオECU3に送出され、例えば、車両から離れた場所から携帯電話4を用いて車載音声認識装置1に通信接続して「インフォメーション」と発声した場合には、「鍵が掛かっているかどうか」、「窓の開閉状態」等の情報が携帯電話4へ通知される。
Therefore, when “information” is uttered toward the
次に、図3に従って制御部16の処理について説明する。本車載音声認識装置1は、車両のイグニッションスイッチがオン状態になると通常モードで動作するようになり、車両のイグニッションスイッチがオフ状態になると低消費電力モードで動作するようになる。制御部16は、音声認識の開始を指示するためのPTT(Push Talk Switch)の押下操作、あるいは、外部機器からの着呼があると、動作モードと関係なく図3に示す処理を実施する。
Next, processing of the
まず、入力インタフェースの判定を行う(S100)。本実施形態では、入力インタフェースとしてマイク10が用いられているか携帯電話4が用いられているかを判定する。
First, the input interface is determined (S100). In the present embodiment, it is determined whether the
ここで、入力インタフェースとしてマイク10が用いられている場合、S100の判定は「マイク」となり、次に、マイクを入力インタフェースとした設定にする(S102)。具体的には、RAMの予め定められた領域に入力インタフェースがマイクであることを示すフラグを設定する。
Here, when the
次に、コマンド発話を促すガイダンスを再生する(S104)。例えば、「音声コマンドを発声して下さい」といったガイダンスをスピーカ15より音声出力させる。 Next, the guidance for prompting command utterance is reproduced (S104). For example, a guidance such as “Please speak a voice command” is output from the speaker 15.
このガイダンスに従ってユーザの発話が行われると、次に、音声認識処理を実施する(S106)。例えば、ユーザが「エアコンオン」と発話すると、「エアコンオン」という音声コマンドが音声認識される。 If the user utters according to this guidance, then a speech recognition process is performed (S106). For example, when the user speaks “air conditioner on”, a voice command “air conditioner on” is recognized.
次に、認識結果に応じた制御信号を送出する(S108)。具体的には、S102にて設定したフラグを参照して、入力インタフェースとしてマイク10が用いられているか携帯電話4が用いられているかを区別するとともに、情報テーブルを参照して、音声信号が入力される入力インタフェースの区別に従って音声コマンドに応じた制御信号を異ならせて制御対象機器へ送出する。
Next, a control signal corresponding to the recognition result is sent (S108). Specifically, referring to the flag set in S102, it is discriminated whether the
上記したように、入力インタフェースとしてマイク10が用いられており、S106にて「エアコンオン」という音声コマンドが音声認識された場合、車両の全ての送風箇所からの送風でエアコンがオンするような制御信号がエアコンECU2に送出される。
As described above, when the
また、入力インタフェースとしてマイク10が用いられており、S106にて「インフォメーション」という音声コマンドが音声認識された場合、交通情報やガソリン価格等の情報を表示させるような制御信号がオーディオECU3に送出され、本処理を終了する。
In addition, when the
また、入力インタフェースとして携帯電話4が用いられている場合、S100の判定は「携帯電話」となり、次に、搭乗者が1人でもいるか否かを判定する(S110)。具体的には、車両の各座席の着座面に乗員の座席への着座を検出する着座センサが設けられており、これらの着座センサより出力される信号に基づいて搭乗者が1人でもいるか否かを判定する。
When the
ここで、搭乗者が1人もいない場合、S110の判定はNOとなり、次に、携帯電話4を入力インタフェースとして設定にする(S112)。具体的には、RAMの予め定められた領域に入力インタフェースが携帯電話4であることを示すフラグを設定し、S104へ進む。
Here, if there is no passenger, the determination in S110 is NO, and then the
この場合、S104にてコマンド発話を促すガイダンスが再生され、このガイダンスに従って、例えば、ユーザが「エアコンオン」と発話すると、「エアコンオン」という音声コマンドが音声認識され、S108にて、認識結果に応じた制御信号が送出される。 In this case, the guidance for prompting the command utterance is reproduced in S104. According to this guidance, for example, when the user utters “air conditioner on”, the voice command “air conditioner on” is recognized and the recognition result is obtained in S108. A corresponding control signal is sent out.
ここで、入力インタフェースとして携帯電話4が用いられており、S106にて「エアコンオン」という音声コマンドが音声認識された場合、車両の全ての送風箇所からの送風でエアコンがオンするような制御信号がエアコンECU2に送出される。
Here, when the
また、入力インタフェースとして携帯電話4が用いられており、S106にて「インフォメーション」という音声コマンドが音声認識された場合、「鍵が掛かっているかどうか」、「窓の開閉状態」等の情報が携帯電話4へ通知される。
In addition, when the
また、入力インタフェースとして携帯電話4が用いられており、搭乗者が1人でもいる場合、S110の判定はYESとなり、次に、携帯電話でのアクセスを禁止する(S114)。具体的には、携帯電話4のマイクにより集音された音声に応じた音声コマンドに応じた制御信号の送出を禁止する。これにより、車室内にいる搭乗者の意に反して携帯電話4を所有する他者によって勝手に制御対象機器の設定等が変更されてしまうといったことが防止される。
If the
次に、音声認識終了のガイダンスを再生して(S116)、本処理を終了する。 Next, the voice recognition end guidance is reproduced (S116), and this process is ended.
上記した構成によれば、音声信号入力手段を介して入力される音声信号を予め定められた条件に従って区別し、当該音声信号の区別に従って音声コマンドに応じた制御信号を異ならせて制御対象機器へ送出するので、1つの音声コマンドであっても音声信号の区別に従って異なる制御信号を制御対象機器へ送出することができ、より利便性の高い機能を実現することができる。 According to the above-described configuration, the audio signal input via the audio signal input unit is distinguished according to a predetermined condition, and the control signal according to the audio command is changed according to the audio signal to the control target device. Since it is transmitted, even if it is one voice command, different control signals can be sent to the control target device according to the distinction of the voice signal, and a more convenient function can be realized.
具体的には、入力される音声信号を、音声信号が入力される音声信号入力手段毎に区別し、音声信号の区別に従って音声コマンドに応じた制御信号を異ならせて制御対象機器へ送出することができる。 Specifically, the input audio signal is distinguished for each audio signal input means to which the audio signal is input, and the control signal corresponding to the audio command is differentiated according to the audio signal and sent to the control target device. Can do.
また、音声信号が入力される音声信号入力手段の区別に従って音声コマンドに応じた制御信号を異なるように規定した情報テーブルを参照して、音声信号が入力される音声信号入力手段の区別に従って音声コマンドに応じた制御信号を異ならせて制御対象機器へ送出することができる。 In addition, referring to the information table in which the control signal according to the voice command is defined differently according to the distinction of the voice signal input means to which the voice signal is inputted, the voice command according to the distinction of the voice signal input means to which the voice signal is inputted The control signal corresponding to the signal can be made different and sent to the control target device.
また、音声信号入力手段の1つを車室内マイクとし、音声信号入力手段の1つは、通信インタフェースを介して接続された携帯型通信機器とすることができる。 Further, one of the audio signal input means can be a vehicle interior microphone, and one of the audio signal input means can be a portable communication device connected via a communication interface.
また、車室内に乗員がいると判定された場合、携帯型通信端末のマイクを介して入力される音声信号より音声認識した音声コマンドに応じた制御信号の送出が禁止されるので、車室内にいる搭乗者の意に反して携帯型通信端末の使用者によって制御対象機器の設定等が変更されてしまうといった問題を防止することができる。 In addition, when it is determined that there is an occupant in the passenger compartment, transmission of a control signal according to a voice command recognized by voice from an audio signal input via the microphone of the portable communication terminal is prohibited. It is possible to prevent the problem that the setting of the control target device is changed by the user of the portable communication terminal against the intention of the passenger.
(第2実施形態)
本実施形態に係る車載音声認識装置の構成を図4に示す。本車載音声認識装置1は、マイク10、車内通信制御部13、ディスプレイ14、スピーカ15および制御部16を備えている。本車載音声認識装置1は、通信部12を介して携帯電話4と通信することが可能となっている。なお、上記第1実施形態と同一部分には同一符号を付して説明を省略し、以下、異なる部分を中心に説明する。
(Second Embodiment)
The configuration of the in-vehicle speech recognition device according to this embodiment is shown in FIG. The in-vehicle
本実施形態では、マイク10より出力される音声信号が制御部16へ直接入力されるようになっている。
In the present embodiment, an audio signal output from the
上記第1実施形態では、入力される音声信号を、マイク10より入力されたものであるか携帯電話4より入力されたものであるかによって区別し、この区別に従って音声コマンドに応じた制御信号を異ならせて制御対象機器へ送出したが、本実施形態では、入力される音声信号を解析して音声のトーンを区別し、この区別に従って音声コマンドに応じて制御対象機器へ送出する制御信号を異ならせるようになっている。
In the first embodiment, the input voice signal is distinguished depending on whether it is input from the
本実施形態における制御部16は、マイク10を介して入力される音声信号を解析して音声のトーンを区別するとともに、当該区別した音声のトーンと制御対象機器の設定内容を関連付けして蓄積記憶したデータベースを作成して記憶部16bに蓄積記憶させるとともに、このデータベースを参照して、解析した音声のトーンと同じトーンで過去に高い頻度で設定された設定内容を特定し、この特定した操作内容を示す音声コマンドを示す制御信号を制御対象機器へ送出する処理を実施する。この処理については後で詳細に説明する。
The
図5に、データベースの構成を示す。図に示すように、ユーザ毎に、かつ、音声コマンドを複数のトーンパターンに分類して、音声コマンドと動作履歴を関連付けしたデータベースが作成される。 FIG. 5 shows the configuration of the database. As shown in the figure, a database in which voice commands are classified into a plurality of tone patterns and associated with voice commands and operation histories is created for each user.
なお、トーンパターンは、音声のトーンの高さを表している。本実施形態では、音声コマンドの周波数を解析して、音声コマンドのトーンパターンを特定する。なお、「エアコンオン」という音声コマンドについては、A、B、Cの3つのトーンパターンに分類して音声コマンドと動作履歴が関連付けてデータベースに蓄積記憶され、「オーディオオン」という音声コマンドについてはA、Bの2つのトーンパターンに分類して音声コマンドと動作履歴が関連付けてデータベースに蓄積記憶される。なお、トーンパターンA、B、Cの順にトーンが低くなる。 The tone pattern represents the tone level of the voice. In the present embodiment, the tone pattern of the voice command is specified by analyzing the frequency of the voice command. The voice command “air conditioner on” is classified into three tone patterns A, B, and C, and the voice command and the operation history are associated with each other and accumulated and stored in the database. , B are classified into two tone patterns, and voice commands and operation histories are associated and stored in a database. Note that the tone decreases in the order of tone patterns A, B, and C.
例えば、ユーザXが、「エアコンオン」という音声コマンドに続いてエアコンの設定温度の入力を示す「設定温度変更」、「25℃」という音声コマンドをトーンパターンAに分類されるトーンで発声すると、図5に示すように「エアコンオン」という音声コマンドに対して、ユーザX、トーンパターンA、動作履歴25℃の項目の登録回数が1つ増加するようになっている。 For example, when the user X utters the voice command “set temperature change” and “25 ° C.” indicating the input of the set temperature of the air conditioner following the voice command “air conditioner on” with a tone classified into the tone pattern A, As shown in FIG. 5, the number of registrations of the items of user X, tone pattern A, and operation history 25 ° C. is increased by one for the voice command “air conditioner ON”.
また、ユーザXの体調が悪く、「エアコンオン」という音声コマンドに続いて、「設定温度変更」、「28℃」という音声コマンドをトーンパターンBに分類されるトーンで発声すると、図5に示すように「エアコンオン」という音声コマンドに対して、ユーザX、トーンパターンB、動作履歴28℃の項目の登録回数が1つ増加するようになっている。 Further, when the user X is in a poor physical condition and the voice command “set temperature change” and “28 ° C.” are uttered by the tone classified into the tone pattern B following the voice command “air conditioner ON”, it is shown in FIG. Thus, the number of registrations of the items of user X, tone pattern B, and operation history 28 ° C. is increased by one for the voice command “air conditioner ON”.
また、ユーザがYさんとなっている場合には、ユーザYの音声コマンドと動作履歴を関連付けしたデータベースが蓄積記憶される。 When the user is Mr. Y, a database in which the voice command of the user Y and the operation history are associated is stored.
また、「オーディオオン」という音声コマンドについては、ユーザ毎に、かつ、音声コマンドをトーンパターンA、Bに分類して、音声コマンドと動作履歴を関連付けしたデータベースが作成される。 For the voice command “audio on”, a database in which the voice command is classified into tone patterns A and B for each user and the voice command and the operation history are associated is created.
次に、制御部16の処理について説明する。図6に、制御部16のフローチャートを示す。本実施形態に係る制御部16は、音声認識の開始を指示するためのPTT(Push Talk Switch)が押下操作されると、図6に示す処理を実施する。
Next, processing of the
まず、ユーザ名の発話を促すガイダンスを生成する(S200)。例えば、「ユーザ名を発声して下さい」といったガイダンスをスピーカ15より音声出力させる。 First, a guidance for prompting a user name is generated (S200). For example, a guidance such as “Please speak your user name” is output from the speaker 15.
このガイダンスに従ってユーザ名の発話が行われると、次に、音声認識処理を実施する(S202)。例えば、ユーザが「X」と発話すると、「X」というユーザ名が音声認識される。 When the user name is uttered according to this guidance, a voice recognition process is performed (S202). For example, when the user utters “X”, the user name “X” is recognized by voice.
次に、音声認識したユーザ名に従って使用ユーザを設定する(S204)。S202にて「X」というユーザ名が音声認識された場合、使用ユーザを「X」として登録する。 Next, a user to be used is set according to the user name that has been recognized (S204). When the user name “X” is recognized by voice in S202, the user in use is registered as “X”.
次に、コマンド発話を促すガイダンスを再生する(S206)。例えば、「音声コマンドを発声して下さい」といったガイダンスをスピーカ15より音声出力させる。 Next, guidance for prompting command utterance is reproduced (S206). For example, a guidance such as “Please speak a voice command” is output from the speaker 15.
このガイダンスに従ってユーザの発話が行われると、次に、音声認識処理を実施する(S208)。例えば、「エアコンオン」という音声コマンドが発声されると、「エアコンオン」という音声コマンドが音声認識される。 When the user utters according to this guidance, next, speech recognition processing is performed (S208). For example, when a voice command “air conditioner on” is uttered, the voice command “air conditioner on” is recognized.
次に、マイク10より入力される音声信号を解析して音声コマンドのトーンを検出する(S210)。ここでは、「エアコンオン」という音声コマンドのトーンパターンを特定する。
Next, the voice signal input from the
次に、トーンパターンに対応した動作履歴内で登録回数が規定値を超えているものがあるか否かを判定する(S212)。具体的には、データベースを参照して、S208にて認識した音声コマンドで、かつ、S210にて特定されたトーンパターンで登録されている設定温度で、規定値を超えて登録されているものがあるか否かを判定する。 Next, it is determined whether or not there is an operation history corresponding to the tone pattern whose registration count exceeds a specified value (S212). Specifically, the voice command recognized in S208 with reference to the database and the preset temperature registered with the tone pattern specified in S210 and registered exceeding the specified value. It is determined whether or not there is.
ここで、S208にて認識した音声コマンドで、かつ、S210にて特定されたトーンパターンで登録されている設定温度で、規定値を超えて登録されているものがない場合、S212の判定はNOとなり、エアコンの設定温度を標準温度設定にする(S220)。本実施形態では、25℃が標準温度となっている。 Here, if there is no voice command recognized in S208 and the set temperature registered with the tone pattern specified in S210 that exceeds the specified value, the determination in S212 is NO. Thus, the set temperature of the air conditioner is set to the standard temperature setting (S220). In this embodiment, 25 ° C. is the standard temperature.
次に、設定温度の変更指示があるか否かを判定する(S222)。具体的には、「設定温度変更」という音声コマンドを音声認識した否かに基づいて設定温度の変更指示があるか否かを判定する。 Next, it is determined whether there is an instruction to change the set temperature (S222). Specifically, it is determined whether or not there is an instruction to change the set temperature based on whether or not the voice command “set temperature change” has been recognized.
ここで、「設定温度変更」という音声コマンドが発声され、「設定温度変更」という音声コマンドを音声認識した場合、S222の判定はYESとなり、次に、音声認識処理を実施する(S224)。ここで、ユーザXが、「27℃」と発声すると、「27℃」という音声コマンドを音声認識する。 Here, when the voice command “change in set temperature” is uttered and the voice command “change in set temperature” is voice-recognized, the determination in S222 is YES, and then the voice recognition process is performed (S224). Here, if the user X utters “27 ° C.”, the voice command “27 ° C.” is recognized.
次に、ユーザXが発声した音声コマンドのトーンを検出する(S226)。ここでは、「27℃」という音声コマンドのトーンパターンを特定する。このように、S210とは別に、再度、音声コマンドのトーンパターンを特定することで、音声コマンドのトーンの検出精度を高くしている。 Next, the tone of the voice command uttered by the user X is detected (S226). Here, the tone pattern of the voice command “27 ° C.” is specified. Thus, apart from S210, the tone pattern of the voice command is specified again to increase the accuracy of the voice command tone detection.
次に、トーンパターンと設定温度を関連付けてデータベースに登録する(S228)。例えば、S224にて「27℃」という音声コマンドが音声認識されており、S226にてトーンパターンがAとして特定されている場合、ユーザXに対して、トーンパターンAと設定温度「27℃」を関連付けてデータベースに登録する。なお、同条件のものが既にデータベースに登録されている場合には、同条件の登録回数に1を加算する。 Next, the tone pattern and the set temperature are associated and registered in the database (S228). For example, when the voice command “27 ° C.” is recognized in S224 and the tone pattern is specified as A in S226, the tone pattern A and the set temperature “27 ° C.” are set to the user X. Associate and register in the database. If the same condition is already registered in the database, 1 is added to the number of registrations under the same condition.
次に、認識結果に応じた制御信号をエアコンECU2へ送信する(S218)。ここでは、エアコンの設定温度が27℃になるような制御信号をエアコンECU2へ送信する。
Next, a control signal corresponding to the recognition result is transmitted to the air conditioner ECU 2 (S218). Here, a control signal is sent to the
また、「設定温度変更」という音声コマンドが一定時間内に発声されない場合、S222の判定はNOとなり、S210にて検出されたトーンパターンを標準温度と関連付けてデータベースに登録する(S230)。例えば、S210にて「エアコンオン」という音声コマンドのトーンパターンがCとして特定されている場合、トーンパターンを標準温度(25℃)と関連付けてデータベースに登録する。 If the voice command “change set temperature” is not uttered within a predetermined time, the determination in S222 is NO, and the tone pattern detected in S210 is registered in the database in association with the standard temperature (S230). For example, when the tone pattern of the voice command “air conditioner on” is specified as C in S210, the tone pattern is registered in the database in association with the standard temperature (25 ° C.).
次に、認識結果に応じた制御信号をエアコンECU2へ送信する(S218)。ここでは、設定温度が標準温度(25℃)で、エアコンをオンする制御信号をエアコンECU2へ送信する。
Next, a control signal corresponding to the recognition result is transmitted to the air conditioner ECU 2 (S218). Here, the set temperature is the standard temperature (25 ° C.), and a control signal for turning on the air conditioner is transmitted to the
また、S208にて、ユーザXによる「エアコンオン」という音声コマンドが音声認識され、S210にて、「エアコンオン」という音声コマンドのトーンパターンを特定し、データベースにS208にて認識した音声コマンドで、かつ、S210にて特定されたトーンパターンで登録されている設定温度で、規定値を超えて登録されているものがある場合、S212の判定はYESとなり、次に、最多の設定温度に設定する(S213)。すなわち、規定値を超えて登録されているものの中で、最多の設定温度にする。 In S208, the voice command “air conditioner on” by the user X is recognized as voice, and in S210, the tone pattern of the voice command “air conditioner on” is specified, and the voice command recognized in S208 in the database, If there is a set temperature registered with the tone pattern specified in S210 that exceeds the specified value, the determination in S212 is YES, and then the highest set temperature is set. (S213). That is, the highest set temperature among the registered values exceeding the specified value is set.
従って、図5に示したデータベース構成となっている場合、ユーザXが「エアコンオン」という音声コマンドをトーンパターンAに分類されるトーンで発声した場合、登録回数の最も多い25℃を設定温度として設定する。 Therefore, in the case of the database configuration shown in FIG. 5, when the user X utters the voice command “air conditioner ON” with a tone classified as tone pattern A, the preset temperature is 25 ° C. Set.
また、ユーザXが「エアコンオン」という音声コマンドをトーンパターンBに分類されるトーンで発声した場合、トーンパターンBで、規定値以上、かつ、最も登録回数の多い28℃を設定温度として設定する。 Further, when the user X utters a voice command “air conditioner ON” with a tone classified into the tone pattern B, the set temperature is set to 28 ° C., which is the specified value or more and the most frequently registered, in the tone pattern B. .
次に、設定温度の変更があるか否かを判定する(S214)。ここで、ユーザ操作により設定温度が変更されると、S214の判定はYESとなり、S224へ進む。また、設定温度が変更されない場合、S214の判定はNOとなり、次に、音声コマンドとトーンパターンを関連付けてデータベースを更新する(S215)。例えば、ユーザXに対して、「エアコンオン」という音声コマンドとトーンパターンを関連付けてデータベースに登録する。なお、同条件のものが既にデータベースに登録されている場合には、同条件の登録回数に1を加算する。 Next, it is determined whether there is a change in the set temperature (S214). Here, if the set temperature is changed by a user operation, the determination in S214 is YES, and the process proceeds to S224. If the set temperature is not changed, the determination in S214 is NO, and the database is then updated by associating the voice command with the tone pattern (S215). For example, for the user X, a voice command “air conditioner ON” and a tone pattern are associated with each other and registered in the database. If the same condition is already registered in the database, 1 is added to the number of registrations under the same condition.
次に、認識結果に応じた制御信号をエアコンECU2へ送信する(S218)。ユーザXが「エアコンオン」という音声コマンドをトーンパターンAに分類されるトーンで発声した場合には、設定温度を25℃として、エアコンをオンする制御信号をエアコンECU2へ送信する。また、ユーザXが「エアコンオン」という音声コマンドをトーンパターンBに分類されるトーンで発声した場合には、設定温度を28℃として、エアコンをオンする制御信号をエアコンECU2へ送信する。
Next, a control signal corresponding to the recognition result is transmitted to the air conditioner ECU 2 (S218). When the user X utters a voice command “air conditioner on” with a tone classified as the tone pattern A, the control signal for turning on the air conditioner is transmitted to the
上記したように、音声信号入力手段を介して入力される音声信号を解析して音声の特徴を特定する音声特徴特定手段を備え、音声信号入力手段を介して入力される音声信号を、音声特徴特定手段により特定された音声の特徴に従って区別し、音声の特徴の区別に従って音声コマンドに応じた制御信号を異ならせて制御対象機器へ送出することができる。 As described above, the audio signal specifying unit that analyzes the audio signal input through the audio signal input unit and specifies the audio feature is provided, and the audio signal input through the audio signal input unit is converted into the audio feature. It is possible to discriminate according to the voice feature specified by the specifying means, and to send the control signal according to the voice command differently according to the voice feature distinction and send it to the control target device.
また、音声特徴特定手段により特定された音声の特徴と制御対象機器の設定内容を関連付けしたデータベースが作成され、このデータベースを参照して、音声特徴特定手段により特定された音声の特徴と同一区分の特徴に関連付けられた制御対象機器の設定内容を示す音声コマンドを示す制御信号が制御対象機器へ送出される。すなわち、ユーザが過去に発声した音声コマンドの特徴と、そのときに設定された制御対象機器の設定内容とを関連付けしたデータベースが自動的に作成され、このデータベースを参照して、音声特徴特定手段により特定された音声の特徴と同一区分の特徴に関連付けられた制御対象機器の設定内容を示す音声コマンドを示す制御信号を制御対象機器へ送出することができる。 In addition, a database is created in which the audio features specified by the audio feature specifying means are associated with the setting contents of the control target device. The database is referred to, and the same classification as the audio features specified by the audio feature specifying means is made. A control signal indicating a voice command indicating the setting content of the control target device associated with the feature is transmitted to the control target device. That is, a database that automatically associates the features of the voice command that the user has uttered in the past with the settings of the control target device set at that time is automatically created. It is possible to send a control signal indicating a voice command indicating the setting contents of the control target device associated with the feature of the same category as the specified voice feature to the control target device.
また、音声コマンドを発声する乗員が別の乗員に変わっても、上記した構成によれば、乗員毎にデータベースが作成され、音声コマンドを発声する乗員に関する情報をデータベースより読み出して、解析された音声の特徴と同じ分類に関連付けられた制御対象機器の設定内容を示す音声コマンドを示す制御信号が制御対象機器へ送出されるので、乗員の音声を別の乗員の音声と混同して誤動作を引き起こすようなことを防止することが可能である。 Moreover, even if the occupant who utters a voice command changes to another occupant, according to the configuration described above, a database is created for each occupant, and information on the occupant who utters a voice command is read from the database and analyzed. Since a control signal indicating a voice command indicating the setting contents of the control target device associated with the same classification as that of the feature is sent to the control target device, the voice of the occupant is confused with the voice of another occupant so as to cause a malfunction. It is possible to prevent this.
なお、本発明は上記実施形態に限定されるものではなく、本発明の趣旨に基づいて種々なる形態で実施することができる。 In addition, this invention is not limited to the said embodiment, Based on the meaning of this invention, it can implement with a various form.
例えば、上記実施形態では、エアコンECU2、オーディオECU3を制御対象機器として説明したが、これらのECUの限定されるものではなく、例えば、他のECUや携帯電話4を制御対象機器としてもよい。
For example, in the above-described embodiment, the
また、上記第1実施形態では、音声信号入力手段の1つを通信インタフェースを介して接続された携帯電話のマイクとした構成を示したが、携帯電話に限定されるものではなく、例えば、携帯型通信装置とすることもできる。 In the first embodiment, the configuration is shown in which one of the audio signal input means is a microphone of a mobile phone connected via a communication interface. However, the present invention is not limited to a mobile phone. Type communication device.
また、上記第実施形態では、無線通信網を介して携帯電話4と通信する構成を示したが、例えば、ブルートゥース等のインタフェースを介して携帯電話4と通信するようにしてもよい。
Moreover, although the structure which communicates with the
上記第2実施形態では、入力される音声信号を、音声のトーンに従って区別したが、音声のトーンに限定されるものではなく、音声の大きさ、音声の大きさとトーンの組合せなど、各種音声の特徴に従って区別するようにしてもよい。 In the second embodiment, the input audio signal is distinguished according to the audio tone. However, the input audio signal is not limited to the audio tone, and various audio signals such as an audio volume, a combination of audio volume and tone, and the like are used. You may make it distinguish according to the characteristic.
なお、上記実施形態における構成と特許請求の範囲の構成との対応関係について説明すると、マイク10、携帯電話4のマイクが音声信号入力手段に相当し、エアコンECU2、オーディオECU3が制御対象機器に相当し、S100〜S108、S218が制御信号送出手段に相当し、記憶部16bが記憶手段に相当し、S110が乗員有無判定手段に相当し、S114が制御信号送出禁止手段に相当し、S210、S226が音声特徴特定手段に相当し、S222〜S230がデータベース作成処理手段に相当し、S200〜S204が乗員特定手段に相当する。
The correspondence relationship between the configuration of the above embodiment and the configuration of the claims will be described. The
1 車載音声認識装置
2 エアコンECU
3 オーディオECU
4 携帯電話
10 マイク
12 通信部
13 車内通信制御部
14 ディスプレイ
15 スピーカ
16 制御部
16a 音声認識エンジン
16b 記憶部
1 On-vehicle
3 Audio ECU
4
Claims (3)
前記音声信号入力手段の1つは車室内マイクであり、前記音声信号入力手段の1つは、通信インタフェースを介して接続された携帯型通信機器であり、
前記音声信号入力手段を介して入力される前記音声信号を予め定められた条件に従って区別し、当該音声信号の区別に従って前記音声コマンドに応じた制御信号を異ならせて前記制御対象機器へ送出する制御信号送出手段と、
前記音声信号が入力される前記音声信号入力手段の区別に従って前記音声コマンドに応じた制御信号を異なるように規定した情報テーブルを記憶する記憶手段と、を備え、
前記制御信号送出手段は、前記記憶手段に記憶された前記情報テーブルを参照して、前記音声信号が入力される前記音声信号入力手段の区別に従って前記音声コマンドに応じた制御信号を異ならせて前記制御対象機器へ送出することを特徴とする車載音声認識装置。 An in-vehicle voice recognition device that recognizes a voice command from a voice signal input via a voice signal input unit and sends a control signal corresponding to the voice command to a control target device,
One of the audio signal input means is a vehicle interior microphone, and one of the audio signal input means is a portable communication device connected via a communication interface,
Control for distinguishing the voice signal input through the voice signal input means according to a predetermined condition, and sending a control signal according to the voice command to the control target device according to the distinction of the voice signal A signal transmission means ;
Storage means for storing an information table defining different control signals according to the voice command according to the distinction of the voice signal input means to which the voice signal is input,
The control signal sending means refers to the information table stored in the storage means, and changes the control signal according to the voice command according to the distinction of the voice signal input means to which the voice signal is inputted. A vehicle-mounted speech recognition apparatus characterized by being sent to a control target device.
前記乗員有無判定手段により前記車室内に乗員がいると判定された場合、前記携帯型通信機器のマイクを介して入力される前記音声信号より音声認識した前記音声コマンドに応じた制御信号の送出を禁止する制御信号送出禁止手段と、を備えたことを特徴とする請求項1に記載の車載音声認識装置。 Occupant presence / absence determining means for determining the presence / absence of an occupant in the passenger compartment;
When it is determined by the occupant presence / absence determination means that there is an occupant in the passenger compartment, a control signal corresponding to the voice command recognized by the voice signal input from the microphone signal of the portable communication device is transmitted. The vehicle-mounted speech recognition apparatus according to claim 1 , further comprising a control signal transmission prohibiting unit that prohibits the signal.
前記制御信号送出手段は、前記音声信号入力手段を介して入力される前記音声信号を、前記音声信号が入力される前記音声信号入力手段毎に区別することを特徴とする請求項1または2に記載の車載音声認識装置。 The audio signals are input separately via a plurality of the audio signal input means,
Said control signal transmitting means, said voice signal inputted through the sound signal input means, to claim 1 or 2, characterized in that to distinguish for each of the audio signal input means for the audio signal is input The vehicle-mounted speech recognition apparatus described.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010207766A JP5556529B2 (en) | 2010-09-16 | 2010-09-16 | In-vehicle speech recognition device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010207766A JP5556529B2 (en) | 2010-09-16 | 2010-09-16 | In-vehicle speech recognition device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012063582A JP2012063582A (en) | 2012-03-29 |
JP5556529B2 true JP5556529B2 (en) | 2014-07-23 |
Family
ID=46059355
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010207766A Expired - Fee Related JP5556529B2 (en) | 2010-09-16 | 2010-09-16 | In-vehicle speech recognition device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5556529B2 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5570641B2 (en) * | 2013-08-21 | 2014-08-13 | パイオニア株式会社 | Portable terminal device, vehicle-mounted device, information presentation method, and information presentation program |
JP6095631B2 (en) * | 2014-10-31 | 2017-03-15 | 株式会社カーメイト | Vehicle remote control device and vehicle remote control system |
JP7229906B2 (en) * | 2019-12-06 | 2023-02-28 | Tvs Regza株式会社 | Command controller, control method and control program |
JP7527127B2 (en) | 2020-04-27 | 2024-08-02 | Tis株式会社 | Information processing device, program, and information processing method |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6435893A (en) * | 1987-07-31 | 1989-02-06 | Toshiba Electric Equip | Lighting control device |
JP3446805B2 (en) * | 1997-08-18 | 2003-09-16 | 本田技研工業株式会社 | Voice input device for vehicles |
JP2002251235A (en) * | 2001-02-23 | 2002-09-06 | Fujitsu Ltd | User interface system |
JP4086280B2 (en) * | 2002-01-29 | 2008-05-14 | 株式会社東芝 | Voice input system, voice input method, and voice input program |
JP2004354721A (en) * | 2003-05-29 | 2004-12-16 | Shimizu Corp | Controller by speech, speech control method, and speech control program |
JP2006254148A (en) * | 2005-03-11 | 2006-09-21 | Sony Corp | Handsfree system, mobile phone, and in-vehicle device |
JP4547721B2 (en) * | 2008-05-21 | 2010-09-22 | 株式会社デンソー | Automotive information provision system |
-
2010
- 2010-09-16 JP JP2010207766A patent/JP5556529B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2012063582A (en) | 2012-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5141463B2 (en) | In-vehicle device and communication connection destination selection method | |
JP6501217B2 (en) | Information terminal system | |
US7702130B2 (en) | User interface apparatus using hand gesture recognition and method thereof | |
US8190214B2 (en) | In-vehicle handsfree apparatus | |
US20020177472A1 (en) | Communication system, communication device, and communication method | |
CN103530991A (en) | Method and apparatus for detecting a left-behind phone | |
CN109273006B (en) | Voice control method of vehicle-mounted system, vehicle and storage medium | |
JP5556529B2 (en) | In-vehicle speech recognition device | |
JP2015074315A (en) | On-vehicle relay device, and on-vehicle communication system | |
CN104608710A (en) | Method and apparatus for vehicle radio station privacy mode control | |
CN103986490A (en) | System and Method of Arbitrating Audio Source Streamed by Mobile Applications | |
US8126514B2 (en) | In-vehicle apparatus, cellular phone device, and method for controlling communication therebetween | |
JP4292798B2 (en) | Information communication terminal and information providing method | |
JP2008236636A (en) | On-vehicle hands-free telephone call device and navigation system for vehicles | |
CN110626303A (en) | Child riding safety protection method and system based on vehicle-mounted terminal and vehicle-mounted terminal | |
JP2003345391A (en) | Terminal, voice recognition server, voice recognition system and computer program | |
CN106494326B (en) | A kind of vehicle-carrying communication control method and equipment | |
KR20110073193A (en) | Telematics system using human body communication, portable device having function of telematics using human body communication and method for providing telematics service using human body communication | |
CN113259798A (en) | Intelligent telephone | |
WO2014129111A1 (en) | Near field wireless communication apparatus | |
CN108234756A (en) | Call control method, device and computer readable storage medium | |
US7680519B2 (en) | Handsfree apparatus including volume control | |
JP5058699B2 (en) | Hands-free call device | |
JP7069868B2 (en) | Incoming call notification method and incoming call notification device | |
JP5376072B1 (en) | In-vehicle information system and speech recognition adaptation method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130612 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140128 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140327 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140507 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140520 |
|
LAPS | Cancellation because of no payment of annual fees |