CN104200805A - 汽车驾驶员语音助手 - Google Patents
汽车驾驶员语音助手 Download PDFInfo
- Publication number
- CN104200805A CN104200805A CN201410435118.7A CN201410435118A CN104200805A CN 104200805 A CN104200805 A CN 104200805A CN 201410435118 A CN201410435118 A CN 201410435118A CN 104200805 A CN104200805 A CN 104200805A
- Authority
- CN
- China
- Prior art keywords
- voice
- module
- driver
- pickup unit
- generation module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 description 10
- 230000005236 sound signal Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 241000238558 Eucarida Species 0.000 description 1
- 206010039203 Road traffic accident Diseases 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
Landscapes
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
- Lock And Its Accessories (AREA)
Abstract
一种汽车驾驶员语音助手,构成中包括智能控制器及与智能控制器相连的拾音单元和执行单元,所述智能控制器内设置有声纹识别模块、语音命令存储模块和指令生成模块,指令生成模块将拾音单元采集到的语音信号与预存于语音命令存储模块中的语音命令进行比较,若找到与之匹配的语音命令,则控制执行单元执行该语音命令所对应的操作;声纹识别模块对拾音单元输出的语音信号进行声纹识别并控制指令生成模块的使能端,只有判断该语音信号为驾驶员所发时,才允许指令生成模块输出信号。本发明利用声纹识别技术识别说话人的身份,防止驾驶员以外的人员利用语音命令操控汽车,在保证行车安全的同时,简化了驾驶员的操作,提高了驾车舒适性。
Description
技术领域
本发明涉及一种可通过汽车驾驶员的语音命令对汽车进行操控的装置,属于汽车技术领域。
背景技术
近几年来,语音识别技术有了较大的突破,已经出现了较为成熟的商用化的语音助手,如苹果公司的Siri,谷歌公司的Google Now,微软公司的Cortana等。而在国内,各种语音助手也是层出不穷,如智能360、小i机器人、虫洞和灵犀等,为各种设备和装置的人机交互提供了便利条件。
然而在汽车上,人机交互还是通过旋钮、按键及触屏来实现的,驾驶员还不能用自然语言直接发出各种操控命令。其主要原因是现有的语音识别系统还不能足够准确地识别说话人的身份,不能准确无误地区分驾驶员与乘客发出的语音信号,如果对乘客发出的与行车安全密切相关的语音操作命令(如加速、制动等),汽车控制系统也会执行,就很容易引发交通事故,给驾驶员、乘客和行人的安全造成极大的威胁,这是绝对不允许的。
发明内容
本发明的目的在于针对现有技术之弊端,提供一种高可靠性的汽车驾驶员语音助手,在保证行车安全的同时,简化驾驶员的操作。
本发明所述问题是以下述技术方案解决的:
一种汽车驾驶员语音助手,构成中包括智能控制器及与智能控制器相连的拾音单元和执行单元,所述智能控制器内设置有声纹识别模块、语音命令存储模块和指令生成模块,指令生成模块将拾音单元采集到的语音信号与预存于语音命令存储模块中的语音命令进行比较,若找到与之匹配的语音命令,则控制执行单元执行该语音命令所对应的操作;声纹识别模块对拾音单元输出的语音信号进行声纹识别并控制指令生成模块的使能端,只有判断该语音信号为驾驶员所发时,才允许指令生成模块输出信号。
上述汽车驾驶员语音助手,所述拾音单元包括三个麦克风,它们安装在驾驶室内的不同位置且与驾驶员头部距离相等,所述智能控制器内设置有相位比较模块,所述相位比较模块将三个麦克风所采集的语音信号的相位进行比较并控制指令生成模块的使能端,只有任意两个麦克风所输出的信号之间的相位差均小于设定的阈值时,才允许指令生成模块输出信号。
上述汽车驾驶员语音助手,所述指令生成模块将拾音单元采集到的语音信号与预存于语音命令存储模块中的语音命令进行比较的方法如下:
用n维向量 表示拾音单元采集到的语音信号,用n维向量表示存储的语音命令,用下式计算二者之间的相似度距离:
其中,ED为欧几里得距离:,为向量各维差值的和的绝对值: ,SAD为曼哈顿距离:,式中(,)是n 维向量各维的权值系数,
若相似度距离小于设定的阈值,则认为拾音单元采集到的语音信号与预存于语音命令存储模块中的语音命令匹配。
上述汽车驾驶员语音助手,所述声纹识别模块和相位比较模块的输出信号经与门与指令生成模块的使能端连接。
上述汽车驾驶员语音助手,三个麦克风应位于一个共圆内。
上述汽车驾驶员语音助手,三个麦克风之间的距离相等。
本发明利用声纹识别技术识别说话人的身份,防止驾驶员以外的人员利用语音命令操控汽车,在保证行车安全的同时,简化了驾驶员的操作,提高了驾车舒适性。三个麦克风不仅可以采集声音信号,还可用于判断声源位置,保证说话人身份识别的准确性。
附图说明
下面结合附图对本发明作进一步详述。
图1是本发明的电原理框图;
图2是三个麦克风的安装示意图。
图2中各符号为:H、驾驶员头部位置,a、b、c分别为三个麦克风的安装位置。
具体实施方式
声纹识别(Voiceprint Recognition,VR),即说话人的音色(或称声纹)识别(Speaker RecognitionSR),它与指纹识别技术一样,属于生物特征识别技术的一种,是一项根据语音波形中反映声纹生理和行为特征的语音参数,自动识别声纹身份的技术。与语音识别不同的是,声纹识别不考虑语音中的字词意思,它强调声纹的个性;而语音识别的目的是识别出语音信号的内容,并不考虑声纹是谁,强调声纹的共性。
近年来,在生物识别技术领域中,声纹识别技术因具有独特的方便性、经济性和准确性等优势而受到世人瞩目,并逐渐成为人们日常生活和工作中重要且普及的身份识别方法。通过声纹识别技术实现身份识别的过程包括:首先从输入的语音信号中提取能够反映说话人是谁的特征;然后根据该特征进行模式匹配,确定说话人的身份。然而声纹识别的特征相似时,也会将特征相似的其他人误识别为预识别人员。因此,要想准确识别说话人的身份,还需要采取其它辅助措施。
参看图1和图2,本发明采用声纹识别与说话人位置识别相结合的方法,保证了身份识别的准确性。
位置识别原理:
参看图2,三个麦克风安装在车内不同位置,它们到驾驶员头部的距离相同,由于驾驶员的语音传到三个麦克风的时间相同,因此当驾驶员说话时,三个麦克风所采集的语音信号的相位基本相同,而其他乘员说话时,三个麦克风所采集的语音信号的相位会有较大差别。智能控制器根据这一原理就可识别语音信号是否来自驾驶员。
一般人的语音频率都在1kH左右,根据声音在空气中的传播速度计算可知,语音的波长大概在30cm左右,驾驶员开车时,其头部晃动范围较小,对麦克风接收的声音信号的相位影响不大,不会影响检测精度。
为了保证其他乘员的头部到三个麦克风的距离不同,三个麦克风的高度差应尽量小,使经过三个麦克风的圆的轴线基本与水平面垂直。由于只有该轴线上的点到三个麦克风的距离才相等,而其他乘员的头部不会在该轴线上,这样就保证了检测精度。
本发明使用前,需先将驾驶员的声纹信息和各种语音命令存储在智能控制器中,存储的方法与传统方法相同,这里不再叙述。
本发明的工作过程:
三个麦克风采集的声音信号进入智能控制器后,首先由模数转换器转换为数字信号,然后分成三路,分别进入声纹识别模块、相位比较模块和指令生成模块,声纹识别模块根据其声纹信息库内存储的声纹信息对信号进行声纹识别,相位比较模块根据三个信号的相位差判断语音信号是否来自于驾驶员,声纹识别模块和相位比较模块的输出信号经与门接入指令生成模块的使能端,只有当两模块均判断语音信号来自于驾驶员时,才允许指令生成模块输出指令信号。指令生成模块将接收的语音信号与语音命令存储模块中存储的语音命令相比较,若找到匹配的语音命令,则向执行单元输出相应的指令信号,否则执行单元不输出信号。
司机在第一次驾驶汽车时,首先需要智能控制器对其进行语音学习,即将汽车操控的命令输入,并存储在语音命令存储模块中,以后即作为具体操控命令的比较基准。
Claims (6)
1.一种汽车驾驶员语音助手,其特征是,它包括智能控制器及与智能控制器相连的拾音单元和执行单元,所述智能控制器内设置有声纹识别模块、语音命令存储模块和指令生成模块,指令生成模块将拾音单元采集到的语音信号与预存于语音命令存储模块中的语音命令进行比较,若找到与之匹配的语音命令,则控制执行单元执行该语音命令所对应的操作;声纹识别模块对拾音单元输出的语音信号进行声纹识别并控制指令生成模块的使能端,只有判断该语音信号为驾驶员所发时,才允许指令生成模块输出信号。
2.根据权利要求1所述的汽车驾驶员语音助手,其特征是,所述拾音单元包括三个麦克风,它们安装在驾驶室内的不同位置且与驾驶员头部距离相等,所述智能控制器内设置有相位比较模块,所述相位比较模块将三个麦克风所采集的语音信号的相位进行比较并控制指令生成模块的使能端,只有任意两个麦克风所输出的信号之间的相位差均小于设定的阈值时,才允许指令生成模块输出信号。
3.根据权利要求1或2所述的汽车驾驶员语音助手,其特征是,所述指令生成模块将拾音单元采集到的语音信号与预存于语音命令存储模块中的语音命令进行比较,其步骤如下:
用n维向量 表示拾音单元采集到的语音信号,用n维向量表示存储的语音命令,用下式计算二者之间的相似度距离:
其中,ED为欧几里得距离:,为向量各维差值的和的绝对值: ,SAD为曼哈顿距离:,式中(,)是n 维向量各维的权值系数,
若相似度距离小于设定的阈值,则认为拾音单元采集到的语音信号与预存于语音命令存储模块中的语音命令匹配。
4.根据权利要求3所述的汽车驾驶员语音助手,其特征是,所述声纹识别模块和相位比较模块的输出信号经与门与指令生成模块的使能端连接。
5.根据权利要求4所述的汽车驾驶员语音助手,其特征是,三个麦克风应位于一个共圆内。
6.根据权利要求5所述的汽车驾驶员语音助手,其特征是,三个麦克风之间的距离相等。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410435118.7A CN104200805B (zh) | 2014-08-30 | 2014-08-30 | 汽车驾驶员语音助手 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410435118.7A CN104200805B (zh) | 2014-08-30 | 2014-08-30 | 汽车驾驶员语音助手 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104200805A true CN104200805A (zh) | 2014-12-10 |
CN104200805B CN104200805B (zh) | 2018-01-19 |
Family
ID=52086087
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410435118.7A Expired - Fee Related CN104200805B (zh) | 2014-08-30 | 2014-08-30 | 汽车驾驶员语音助手 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104200805B (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105068782A (zh) * | 2015-08-11 | 2015-11-18 | 胡达广 | 机器人声音指令识别系统 |
CN105128625A (zh) * | 2015-08-31 | 2015-12-09 | 宇龙计算机通信科技(深圳)有限公司 | 一种车用换气控制方法以及装置、系统 |
CN105501225A (zh) * | 2015-12-21 | 2016-04-20 | 东莞酷派软件技术有限公司 | 智能驾驶控制方法、智能驾驶控制装置和车载系统 |
CN105989836A (zh) * | 2015-03-06 | 2016-10-05 | 腾讯科技(深圳)有限公司 | 一种语音采集方法、装置及终端设备 |
US9707911B1 (en) | 2016-03-21 | 2017-07-18 | Ford Global Technologies, Llc | Identifying a driver of a vehicle |
CN107901915A (zh) * | 2017-11-24 | 2018-04-13 | 重庆长安汽车股份有限公司 | 基于语音控制的车辆驾驶自动化系统及方法 |
CN108091329A (zh) * | 2017-12-20 | 2018-05-29 | 江西爱驰亿维实业有限公司 | 基于语音识别控制汽车的方法、装置及计算设备 |
CN108962248A (zh) * | 2018-08-14 | 2018-12-07 | 福建龙马环卫装备股份有限公司 | 一种智能环卫装备语音识别控制系统及方法 |
US10169794B2 (en) | 2016-06-07 | 2019-01-01 | Microsoft Technology Licensing, Llc | Digital assistant for vehicle related activities |
CN110718222A (zh) * | 2019-10-24 | 2020-01-21 | 浙江交通职业技术学院 | 一种基于声纹识别和语音识别的车辆操作者认证方法 |
CN110880321A (zh) * | 2019-10-18 | 2020-03-13 | 平安科技(深圳)有限公司 | 基于语音的智能刹车方法、装置、设备及存储介质 |
CN111439271A (zh) * | 2020-04-21 | 2020-07-24 | 上汽大众汽车有限公司 | 基于语音控制的辅助驾驶方法及辅助驾驶设备 |
CN111993997A (zh) * | 2020-08-24 | 2020-11-27 | 安徽江淮汽车集团股份有限公司 | 基于语音的行人避让提示方法、装置、设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101488190A (zh) * | 2009-02-27 | 2009-07-22 | 华北电力大学(保定) | 一种向量间相似度的计算方法 |
CN102033223A (zh) * | 2010-12-29 | 2011-04-27 | 北京信息科技大学 | 使用麦克风阵列对声源定位的方法 |
CN102582576A (zh) * | 2012-03-15 | 2012-07-18 | 福州海景科技开发有限公司 | 基于声音识别技术的车辆防盗和人身安全保护系统 |
CN102930868A (zh) * | 2012-10-24 | 2013-02-13 | 北京车音网科技有限公司 | 身份识别方法和装置 |
CN103448632A (zh) * | 2012-05-28 | 2013-12-18 | 百度在线网络技术(北京)有限公司 | 汽车控制方法及装置 |
US8648692B2 (en) * | 1999-07-23 | 2014-02-11 | Seong Sang Investments Llc | Accessing an automobile with a transponder |
CN103811004A (zh) * | 2012-11-15 | 2014-05-21 | 上海船舶运输科学研究所 | 船舶主动力语音控制方法及系统 |
-
2014
- 2014-08-30 CN CN201410435118.7A patent/CN104200805B/zh not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8648692B2 (en) * | 1999-07-23 | 2014-02-11 | Seong Sang Investments Llc | Accessing an automobile with a transponder |
US20140156283A1 (en) * | 1999-07-23 | 2014-06-05 | Seong Sang Investments Llc | Accessing an automobile with a transponder |
CN101488190A (zh) * | 2009-02-27 | 2009-07-22 | 华北电力大学(保定) | 一种向量间相似度的计算方法 |
CN102033223A (zh) * | 2010-12-29 | 2011-04-27 | 北京信息科技大学 | 使用麦克风阵列对声源定位的方法 |
CN102582576A (zh) * | 2012-03-15 | 2012-07-18 | 福州海景科技开发有限公司 | 基于声音识别技术的车辆防盗和人身安全保护系统 |
CN103448632A (zh) * | 2012-05-28 | 2013-12-18 | 百度在线网络技术(北京)有限公司 | 汽车控制方法及装置 |
CN102930868A (zh) * | 2012-10-24 | 2013-02-13 | 北京车音网科技有限公司 | 身份识别方法和装置 |
CN103811004A (zh) * | 2012-11-15 | 2014-05-21 | 上海船舶运输科学研究所 | 船舶主动力语音控制方法及系统 |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105989836A (zh) * | 2015-03-06 | 2016-10-05 | 腾讯科技(深圳)有限公司 | 一种语音采集方法、装置及终端设备 |
CN105068782A (zh) * | 2015-08-11 | 2015-11-18 | 胡达广 | 机器人声音指令识别系统 |
CN105128625A (zh) * | 2015-08-31 | 2015-12-09 | 宇龙计算机通信科技(深圳)有限公司 | 一种车用换气控制方法以及装置、系统 |
CN105128625B (zh) * | 2015-08-31 | 2018-12-25 | 宇龙计算机通信科技(深圳)有限公司 | 一种车用换气控制方法以及装置、系统 |
CN105501225A (zh) * | 2015-12-21 | 2016-04-20 | 东莞酷派软件技术有限公司 | 智能驾驶控制方法、智能驾驶控制装置和车载系统 |
CN105501225B (zh) * | 2015-12-21 | 2018-06-15 | 东莞酷派软件技术有限公司 | 智能驾驶控制方法、智能驾驶控制装置和车载系统 |
US9707911B1 (en) | 2016-03-21 | 2017-07-18 | Ford Global Technologies, Llc | Identifying a driver of a vehicle |
US10169794B2 (en) | 2016-06-07 | 2019-01-01 | Microsoft Technology Licensing, Llc | Digital assistant for vehicle related activities |
CN107901915A (zh) * | 2017-11-24 | 2018-04-13 | 重庆长安汽车股份有限公司 | 基于语音控制的车辆驾驶自动化系统及方法 |
CN108091329A (zh) * | 2017-12-20 | 2018-05-29 | 江西爱驰亿维实业有限公司 | 基于语音识别控制汽车的方法、装置及计算设备 |
CN108962248A (zh) * | 2018-08-14 | 2018-12-07 | 福建龙马环卫装备股份有限公司 | 一种智能环卫装备语音识别控制系统及方法 |
CN110880321A (zh) * | 2019-10-18 | 2020-03-13 | 平安科技(深圳)有限公司 | 基于语音的智能刹车方法、装置、设备及存储介质 |
CN110880321B (zh) * | 2019-10-18 | 2024-05-10 | 平安科技(深圳)有限公司 | 基于语音的智能刹车方法、装置、设备及存储介质 |
CN110718222A (zh) * | 2019-10-24 | 2020-01-21 | 浙江交通职业技术学院 | 一种基于声纹识别和语音识别的车辆操作者认证方法 |
CN111439271A (zh) * | 2020-04-21 | 2020-07-24 | 上汽大众汽车有限公司 | 基于语音控制的辅助驾驶方法及辅助驾驶设备 |
CN111993997A (zh) * | 2020-08-24 | 2020-11-27 | 安徽江淮汽车集团股份有限公司 | 基于语音的行人避让提示方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN104200805B (zh) | 2018-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104200805B (zh) | 汽车驾驶员语音助手 | |
CN102023703B (zh) | 组合唇读与语音识别的多模式界面系统 | |
US8280732B2 (en) | System and method for multidimensional gesture analysis | |
KR102061925B1 (ko) | 깊이 기반 콘텍스트 식별 | |
CN102132227B (zh) | 用于对姿势的多维评估的系统和方法 | |
CN108320739B (zh) | 根据位置信息辅助语音指令识别方法和装置 | |
US9685157B2 (en) | Vehicle and control method thereof | |
CN109941231A (zh) | 车载终端设备、车载交互系统和交互方法 | |
US20230102157A1 (en) | Contextual utterance resolution in multimodal systems | |
US20160267909A1 (en) | Voice recognition device for vehicle | |
CN109102801A (zh) | 语音识别方法和语音识别装置 | |
CN106218557B (zh) | 一种带语音识别控制的车载麦克风 | |
CN111323753A (zh) | 定位汽车内语音源的方法 | |
JP2015059811A (ja) | ナビゲーション装置および方法 | |
CN106379262B (zh) | 一种带语音识别控制的车载蓝牙麦克风 | |
US11325605B2 (en) | Information providing device, information providing method, and storage medium | |
JP2021148971A (ja) | 音声認識方法及び音声認識装置 | |
US11535268B2 (en) | Vehicle and control method thereof | |
CN113555017A (zh) | 基于ai智能语音车载氛围灯控制系统及方法 | |
JP7239365B2 (ja) | エージェント装置、エージェント装置の制御方法、およびプログラム | |
US20240300328A1 (en) | Vehicle And Control Method Thereof | |
KR101086602B1 (ko) | 차량용 음성인식 시스템 및 그 방법 | |
Khare et al. | Multimodal interaction in modern automobiles | |
US20140358538A1 (en) | Methods and systems for shaping dialog of speech systems | |
CN118366438A (zh) | 语音控制的方法及装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20180119 |
|
CF01 | Termination of patent right due to non-payment of annual fee |