[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN112270930A - 一种语音识别转换的方法 - Google Patents

一种语音识别转换的方法 Download PDF

Info

Publication number
CN112270930A
CN112270930A CN202011138541.2A CN202011138541A CN112270930A CN 112270930 A CN112270930 A CN 112270930A CN 202011138541 A CN202011138541 A CN 202011138541A CN 112270930 A CN112270930 A CN 112270930A
Authority
CN
China
Prior art keywords
voice
module
signal connection
central control
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011138541.2A
Other languages
English (en)
Inventor
毕卉
储开网
王家骏
肖蓉蓉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Fengxin Network Technology Co ltd
Original Assignee
Jiangsu Fengxin Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Fengxin Network Technology Co ltd filed Critical Jiangsu Fengxin Network Technology Co ltd
Priority to CN202011138541.2A priority Critical patent/CN112270930A/zh
Publication of CN112270930A publication Critical patent/CN112270930A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • G10L21/028Voice signal separating using properties of sound source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02087Noise filtering the noise being separate speech, e.g. cocktail party

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Machine Translation (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种语音识别转换的方法,包括中控中心,所述中控中心信号连接有对声音进行接收的语音信息接收模块,所述语音信息接收模块信号连接有进行杂音消除的语音过滤模块,所述中控中心信号连接有用来显示信息的信息数据显示模块,所述中控中心信号连接有数据中心;解决了在讲述非标准普通话时,语音识别转换的准确度差、语音转换过程中出现噪音与周边人员交流时,相关的噪音与周边人员交流的语音被同时转换,导致语音转换失败、年轻人网络用语的大量使用,影响相关指令有效发出的问题;具有可对非标准的普通话进行精准的转换,转换效果好、有效过滤周边杂音,转换成功率高、可准确分析网络用语,指令发出稳定有效的优点。

Description

一种语音识别转换的方法
技术领域
本发明涉及一种语音识别技术领域,具体为一种语音识别转换的方法。
背景技术
语音识别是一门交叉学科,近二十年来,语音识别技术取得显著进步,开始从实验室走向市场,人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域,很多专家都认为语音识别技术是2000年至2010年间信息技术领域十大重要的科技发展技术之一,语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。
现有的语音识别转换的方法在使用时一般需要语音录入人员说出标准的普通话才能进行有效的语音录入,但是标准的普通话存在一定的难度,当语音录入人员在进行普通话讲述时,不可避免的会带上一些本土方言,这样掺杂有方言的普通话就会干扰语音转换的识别准确度,语音转换效果差;在语音转换的过程中,当周边存在一些噪音或周边人员进行语言沟通时,语音转换会同时转换一些无法分辨噪音和周边人员沟通产生的声音,导致语音识别转换失败;年轻人在进行语音转换时,不可避免的会带上一些网络用语,网络用语的大量使用也会对语音识别转换造成干扰,转换出错误指令,为此提出一种语音识别转换的方法。
发明内容
为解决现有技术存在的缺陷,本发明提供一种语音识别转换的方法,解决了在讲述非标准普通话时,语音识别转换的准确度差、语音转换过程中出现噪音与周边人员交流时,相关的噪音与周边人员交流的语音被同时转换,导致语音转换失败、年轻人网络用语的大量使用,影响相关指令有效发出的问题。
为了解决上述技术问题,本发明提供了如下的技术方案:
本发明一种语音识别转换的方法,包括中控中心,所述中控中心信号连接有对声音进行接收的语音信息接收模块,所述语音信息接收模块信号连接有进行杂音消除的语音过滤模块,所述中控中心信号连接有用来显示信息的信息数据显示模块,所述中控中心信号连接有数据中心,所述数据中心信号连接有区别语言的语句分析模块,所述数据中心信号连接有官方正式语言的普通话模块,所述数据中心信号连接有地方语言的方言模块,所述方言模块信号连接有方言选择。
优选的,所述语音过滤模块包括音调区分,所述语音过滤模块信号连接有区分音调高低的音调区分,所述语音过滤模块信号连接有分辨声音特征的音色区分,所述语音过滤模块信号连接有杂音分辨用的音量区分。
优选的,所述信息数据显示模块与方言选择信号连接,且信息数据显示模块信号控制方言选择。
优选的,所述数据中心连接有WIFI热点。
优选的,所述语句分析模块包括组词模块,所述语句分析模块信号连接有针对接收语音中包含的词语或成语等缺少部分进行补充的组词模块,所述语句分析模块信号连接有根据语音中表述意思进行分析的模糊搜索模块,所述语句分析模块信号连接有连接网络查找相关语句的智能检索模块。
本发明的有益效果是:该种语音识别转换的方法具有可对非标准的普通话进行精准的转换,转换效果好、有效过滤周边杂音,转换成功率高、可准确分析网络用语,指令发出稳定有效的优点。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明一种语音识别转换的方法的整体结构示意图;
图2是本发明一种语音识别转换的方法的语音过滤模块结构示意图;
图3是本发明一种语音识别转换的方法的语句分析模块结构示意图;
图中:1、中控中心;2、语音信息接收模块;3、语音过滤模块;31、音调区分;32、音色区分;33、音量区分;4、信息数据显示模块;5、数据中心;6、语句分析模块;61、组词模块;62、模糊搜索模块;63、智能检索模块;7、普通话模块;8、方言模块;9、方言选择。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
本实施例:如图1-3,本发明一种语音识别转换的方法,包括中控中心1,中控中心1根据需要进行信息的统筹与指令的发出,中控中心1信号连接有对声音进行接收的语音信息接收模块2,语音信息接收模块2信号连接有进行杂音消除的语音过滤模块3,中控中心1信号连接有用来显示信息的信息数据显示模块4,中控中心1信号连接有数据中心5,中控中心1对数据中心5传输数据,同时中控中心1根据数据中心5进行相关指令的发出,数据中心5信号连接有区别语言的语句分析模块6,数据中心5信号连接有官方正式语言的普通话模块7,数据中心5信号连接有地方语言的方言模块8,方言模块8信号连接有方言选择9,方言选择9选定所需要的地方语言,然后向方言模块8发出对应指令。
语音过滤模块3包括音调区分31,语音过滤模块3信号连接有区分音调高低的音调区分31,语音过滤模块3信号连接有分辨声音特征的音色区分32,语音过滤模块3信号连接有杂音分辨用的音量区分33,音调区分31可分析出较高音调属于女性,较低的音调属于男性,音色区分32根据音色的频率区分成人与儿童的声音,当在进行语音转换时,周边出现短暂的较高或较低的声音时,可自动将其筛选出去,进而分辨出真正需要转换的语音。
信息数据显示模块4与方言选择9信号连接,且信息数据显示模块4信号控制方言选择9,利用信息数据显示模块4对方言选择9发出指令,根据操作者所属地方进行地方语言选择对应的地方语言。
数据中心5连接有WIFI热点,数据中心5利用WIFI热点连接网络,根据需要定期更新相关的数据,如网络用语、地方语言补充、生僻字补充等信息。
语句分析模块6包括组词模块61,语句分析模块6信号连接有针对接收语音中包含的词语或成语等缺少部分进行补充的组词模块61,语句分析模块6信号连接有根据语音中表述意思进行分析的模糊搜索模块62,语句分析模块6信号连接有连接网络查找相关语句的智能检索模块63。
具体步骤如下:
一、在进行语音识别转换时,使用者先将自身的基本信息反馈给信息数据显示模块4,基本信息包括性别、年龄等,信息数据显示模块4将使用者的基本信息反馈给中控中心1,同时根据方言选择9选出符合自己实际情况的地方语言,相关信息同步反馈给中控中心1,数据中心5定期联网更新新的网络用语等;
二、使用者发出对应的语音,语音信息接收模块2将其发出的语音进行接收,此时接收的语音反馈给语音过滤模块3,语音过滤模块3配合音调区分31出接收的语音是男性还是女性发出的,根据使用者的性别将不符合该性别的杂音进行去除,语音过滤模块3配合音色区分32将成年人与儿童的语音进行区分,分辨出成年人与儿童的语音,语音过滤模块3配合音量区分33将周边过大或者过小的音量进行筛分,选出较为稳定的声音音量;
三、语音过滤模块3将筛选出的语音反馈给中控中心1,中控中心1将语音继续反馈给数据中心5,数据中心5结合方言模块8、普通话模块7、语句分析模块6对该语音进行分析,根据中控中心1反馈出使用者所属的地方方言,方言模块8配合普通话模块7将语音进行组合分析,组合分析后,语句分析模块6配合模糊搜索模块62、组词模块61、智能检索模块63将语音进行最终分析,根据分析出的语音进行对应指令等的转换,实现相关指令的有效发出。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种语音识别转换的方法,包括中控中心,其特征在于:所述中控中心信号连接有对声音进行接收的语音信息接收模块,所述语音信息接收模块信号连接有进行杂音消除的语音过滤模块,所述中控中心信号连接有用来显示信息的信息数据显示模块,所述中控中心信号连接有数据中心,所述数据中心信号连接有区别语言的语句分析模块,所述数据中心信号连接有官方正式语言的普通话模块,所述数据中心信号连接有地方语言的方言模块,所述方言模块信号连接有方言选择。
2.根据权利要求1所述的一种语音识别转换的方法,其特征在于:所述语音过滤模块包括音调区分,所述语音过滤模块信号连接有区分音调高低的音调区分,所述语音过滤模块信号连接有分辨声音特征的音色区分,所述语音过滤模块信号连接有杂音分辨用的音量区分。
3.根据权利要求1所述的一种语音识别转换的方法,其特征在于:所述信息数据显示模块与方言选择信号连接,且信息数据显示模块信号控制方言选择。
4.根据权利要求1所述的一种语音识别转换的方法,其特征在于:所述数据中心连接有WIFI热点。
5.根据权利要求1所述的一种语音识别转换的方法,其特征在于:所述语句分析模块包括组词模块,所述语句分析模块信号连接有针对接收语音中包含的词语或成语等缺少部分进行补充的组词模块,所述语句分析模块信号连接有根据语音中表述意思进行分析的模糊搜索模块,所述语句分析模块信号连接有连接网络查找相关语句的智能检索模块。
CN202011138541.2A 2020-10-22 2020-10-22 一种语音识别转换的方法 Pending CN112270930A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011138541.2A CN112270930A (zh) 2020-10-22 2020-10-22 一种语音识别转换的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011138541.2A CN112270930A (zh) 2020-10-22 2020-10-22 一种语音识别转换的方法

Publications (1)

Publication Number Publication Date
CN112270930A true CN112270930A (zh) 2021-01-26

Family

ID=74343029

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011138541.2A Pending CN112270930A (zh) 2020-10-22 2020-10-22 一种语音识别转换的方法

Country Status (1)

Country Link
CN (1) CN112270930A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116647634A (zh) * 2023-07-27 2023-08-25 河北跃创科技有限公司 一种广播对讲终端

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1286329A1 (en) * 2001-08-23 2003-02-26 Culturecom Technology (Macau) Ltd. Method and system for phonetic recognition
CN102638605A (zh) * 2011-02-14 2012-08-15 苏州巴米特信息科技有限公司 一种识别方言背景普通话的语音系统
CN103970731A (zh) * 2014-05-19 2014-08-06 无锡国澳实业有限公司 汉语语义活性识别法
CN105117034A (zh) * 2015-08-31 2015-12-02 任文 一种中文语音输入法及语句定位与纠错方法
CN105824861A (zh) * 2015-09-18 2016-08-03 维沃移动通信有限公司 一种推荐音频的方法和移动终端
CN105872687A (zh) * 2016-03-31 2016-08-17 乐视控股(北京)有限公司 一种通过语音控制智能设备的方法及装置
CN106098078A (zh) * 2016-06-14 2016-11-09 惠州Tcl移动通信有限公司 一种可过滤扬声器噪音的语音识别方法及其系统
CN106098054A (zh) * 2016-06-13 2016-11-09 惠州Tcl移动通信有限公司 一种语音识别中扬声器噪音的过滤装置及方法
CN107679196A (zh) * 2017-10-10 2018-02-09 中国移动通信集团公司 一种多媒体识别方法、电子设备及存储介质
KR20180069660A (ko) * 2016-12-15 2018-06-25 삼성전자주식회사 음성 인식 방법 및 장치
KR20190026518A (ko) * 2017-09-05 2019-03-13 엘지전자 주식회사 인공지능 음성 인식 장치의 동작 방법
KR20190050761A (ko) * 2019-05-03 2019-05-13 엘지전자 주식회사 음성 인식 장치
CN109949808A (zh) * 2019-03-15 2019-06-28 上海华镇电子科技有限公司 兼容普通话和方言的语音识别家电控制系统和方法
WO2019153999A1 (zh) * 2018-02-09 2019-08-15 广景视睿科技(深圳)有限公司 一种基于语音控制的动向投影方法、装置及动向投影系统

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1286329A1 (en) * 2001-08-23 2003-02-26 Culturecom Technology (Macau) Ltd. Method and system for phonetic recognition
CN102638605A (zh) * 2011-02-14 2012-08-15 苏州巴米特信息科技有限公司 一种识别方言背景普通话的语音系统
CN103970731A (zh) * 2014-05-19 2014-08-06 无锡国澳实业有限公司 汉语语义活性识别法
CN105117034A (zh) * 2015-08-31 2015-12-02 任文 一种中文语音输入法及语句定位与纠错方法
CN105824861A (zh) * 2015-09-18 2016-08-03 维沃移动通信有限公司 一种推荐音频的方法和移动终端
CN105872687A (zh) * 2016-03-31 2016-08-17 乐视控股(北京)有限公司 一种通过语音控制智能设备的方法及装置
CN106098054A (zh) * 2016-06-13 2016-11-09 惠州Tcl移动通信有限公司 一种语音识别中扬声器噪音的过滤装置及方法
CN106098078A (zh) * 2016-06-14 2016-11-09 惠州Tcl移动通信有限公司 一种可过滤扬声器噪音的语音识别方法及其系统
KR20180069660A (ko) * 2016-12-15 2018-06-25 삼성전자주식회사 음성 인식 방법 및 장치
KR20190026518A (ko) * 2017-09-05 2019-03-13 엘지전자 주식회사 인공지능 음성 인식 장치의 동작 방법
CN107679196A (zh) * 2017-10-10 2018-02-09 中国移动通信集团公司 一种多媒体识别方法、电子设备及存储介质
WO2019153999A1 (zh) * 2018-02-09 2019-08-15 广景视睿科技(深圳)有限公司 一种基于语音控制的动向投影方法、装置及动向投影系统
CN109949808A (zh) * 2019-03-15 2019-06-28 上海华镇电子科技有限公司 兼容普通话和方言的语音识别家电控制系统和方法
KR20190050761A (ko) * 2019-05-03 2019-05-13 엘지전자 주식회사 음성 인식 장치

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李育贤;李?;臧金环;: "车载语音交互技术发展现状及趋势展望", 智能网联汽车, no. 06 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116647634A (zh) * 2023-07-27 2023-08-25 河北跃创科技有限公司 一种广播对讲终端
CN116647634B (zh) * 2023-07-27 2024-03-12 河北跃创科技有限公司 一种广播对讲终端

Similar Documents

Publication Publication Date Title
CN110491382B (zh) 基于人工智能的语音识别方法、装置及语音交互设备
US8498857B2 (en) System and method for rapid prototyping of existing speech recognition solutions in different languages
KR100807307B1 (ko) 대화형 음성 인터페이스 시스템 및 그 응답 방법
CN111489748A (zh) 一种调度智能语音辅助系统
EP0262938A1 (en) Language translation system
KR20170034227A (ko) 음성 인식 장치 및 방법과, 음성 인식을 위한 변환 파라미터 학습 장치 및 방법
CN107016993A (zh) 一种智能家居的语音交互系统及方法
EP1685556B1 (en) Audio dialogue system and voice browsing method
JPH10504404A (ja) 音声認識のための方法および装置
US9805740B2 (en) Language analysis based on word-selection, and language analysis apparatus
CN108628836A (zh) 采用人工智能bp神经网络算法进行语音翻译的机器人
Desot et al. End-to-End Spoken Language Understanding: Performance analyses of a voice command task in a low resource setting
CN112270930A (zh) 一种语音识别转换的方法
CN111128175B (zh) 口语对话管理方法及系统
CN111695763A (zh) 一种基于语音问答的排产排程系统及方法
KR20110087742A (ko) 청각 장애인을 위한 수화 통역 시스템, 그 장치 및 방법
KR100400220B1 (ko) 대화 모델을 이용한 자동 통역 장치 및 방법
CN110364165A (zh) 航班动态信息语音查询方法
CN107825433A (zh) 一种儿童语音指令识别的卡片机器人
CN114238606A (zh) 一种智能语音客服机器人对话管理方法及装置
US20020169598A1 (en) Process for generating data for semantic speech analysis
CN111312211A (zh) 一种基于过采样技术的方言语音识别系统
CN117975968B (zh) 一种基于声音和语言模型的远程巡视系统控制方法及系统
CN219202338U (zh) 一种翻译机
CN116095532B (zh) 主站与厂站远动数据智能调试的装置及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210126

WD01 Invention patent application deemed withdrawn after publication