CN101064104A - 基于语音转换的情感语音生成方法 - Google Patents
基于语音转换的情感语音生成方法 Download PDFInfo
- Publication number
- CN101064104A CN101064104A CNA2006100760147A CN200610076014A CN101064104A CN 101064104 A CN101064104 A CN 101064104A CN A2006100760147 A CNA2006100760147 A CN A2006100760147A CN 200610076014 A CN200610076014 A CN 200610076014A CN 101064104 A CN101064104 A CN 101064104A
- Authority
- CN
- China
- Prior art keywords
- fundamental frequency
- speech
- emotional
- neutral
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000008451 emotion Effects 0.000 title claims abstract description 62
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 49
- 230000002996 emotional effect Effects 0.000 claims abstract description 66
- 230000007935 neutral effect Effects 0.000 claims abstract description 52
- 238000012549 training Methods 0.000 claims abstract description 38
- 238000013507 mapping Methods 0.000 claims abstract description 26
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 20
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 20
- 238000001228 spectrum Methods 0.000 claims abstract description 11
- 239000000284 extract Substances 0.000 claims abstract description 10
- 239000000203 mixture Substances 0.000 claims abstract description 6
- 230000003595 spectral effect Effects 0.000 claims description 2
- 230000006870 function Effects 0.000 description 19
- 238000012546 transfer Methods 0.000 description 17
- 230000008569 process Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 7
- 230000033764 rhythmic process Effects 0.000 description 7
- 230000008859 change Effects 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 238000010189 synthetic method Methods 0.000 description 5
- 230000009466 transformation Effects 0.000 description 4
- 239000000463 material Substances 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000012417 linear regression Methods 0.000 description 2
- 230000001373 regressive effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- 235000019634 flavors Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
Claims (5)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2006100760147A CN101064104B (zh) | 2006-04-24 | 2006-04-24 | 基于语音转换的情感语音生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2006100760147A CN101064104B (zh) | 2006-04-24 | 2006-04-24 | 基于语音转换的情感语音生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101064104A true CN101064104A (zh) | 2007-10-31 |
CN101064104B CN101064104B (zh) | 2011-02-02 |
Family
ID=38965092
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2006100760147A Active CN101064104B (zh) | 2006-04-24 | 2006-04-24 | 基于语音转换的情感语音生成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101064104B (zh) |
Cited By (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101226742B (zh) * | 2007-12-05 | 2011-01-26 | 浙江大学 | 基于情感补偿的声纹识别方法 |
CN101178897B (zh) * | 2007-12-05 | 2011-04-20 | 浙江大学 | 利用基频包络剔除情感语音的说话人识别方法 |
CN102063899A (zh) * | 2010-10-27 | 2011-05-18 | 南京邮电大学 | 一种非平行文本条件下的语音转换方法 |
CN101751921B (zh) * | 2009-12-16 | 2011-09-14 | 南京邮电大学 | 一种在训练数据量极少条件下的实时语音转换方法 |
CN101751922B (zh) * | 2009-07-22 | 2011-12-07 | 中国科学院自动化研究所 | 基于隐马尔可夫模型状态映射的文本无关语音转换系统 |
CN101419800B (zh) * | 2008-11-25 | 2011-12-14 | 浙江大学 | 基于频谱平移的情感说话人识别方法 |
CN102341842A (zh) * | 2009-05-28 | 2012-02-01 | 国际商业机器公司 | 用于语者调适的基频移动量学习装置、基频生成装置、移动量学习方法、基频生成方法及移动量学习程序 |
CN102005205B (zh) * | 2009-09-03 | 2012-10-03 | 株式会社东芝 | 情感语音合成方法和装置 |
CN102881283A (zh) * | 2011-07-13 | 2013-01-16 | 三星电子(中国)研发中心 | 用于语音处理的方法与系统 |
CN103065620A (zh) * | 2012-12-27 | 2013-04-24 | 安徽科大讯飞信息科技股份有限公司 | 在手机上或网页上接收用户输入的文字并实时合成为个性化声音的方法 |
CN104123932A (zh) * | 2014-07-29 | 2014-10-29 | 科大讯飞股份有限公司 | 一种语音转换系统及方法 |
CN105023570A (zh) * | 2014-04-30 | 2015-11-04 | 安徽科大讯飞信息科技股份有限公司 | 一种实现声音转换的方法及系统 |
CN105244042A (zh) * | 2015-08-26 | 2016-01-13 | 安徽建筑大学 | 一种基于有限状态自动机的语音情感交互装置与方法 |
CN105280179A (zh) * | 2015-11-02 | 2016-01-27 | 小天才科技有限公司 | 一种文字转语音的处理方法及系统 |
CN105355193A (zh) * | 2015-10-30 | 2016-02-24 | 百度在线网络技术(北京)有限公司 | 语音合成方法和装置 |
CN105551504A (zh) * | 2015-12-03 | 2016-05-04 | 广东欧珀移动通信有限公司 | 一种基于哭声触发智能移动终端功能应用的方法及装置 |
CN105931631A (zh) * | 2016-04-15 | 2016-09-07 | 北京地平线机器人技术研发有限公司 | 语音合成系统和方法 |
CN106205623A (zh) * | 2016-06-17 | 2016-12-07 | 福建星网视易信息系统有限公司 | 一种声音转换方法及装置 |
CN106531150A (zh) * | 2016-12-23 | 2017-03-22 | 上海语知义信息技术有限公司 | 一种基于深度神经网络模型的情感合成方法 |
CN106688034A (zh) * | 2014-09-11 | 2017-05-17 | 微软技术许可有限责任公司 | 具有情感内容的文字至语音转换 |
CN107068165A (zh) * | 2016-12-31 | 2017-08-18 | 南京邮电大学 | 一种语音转换方法 |
CN107103900A (zh) * | 2017-06-06 | 2017-08-29 | 西北师范大学 | 一种跨语言情感语音合成方法及系统 |
CN107221344A (zh) * | 2017-04-07 | 2017-09-29 | 南京邮电大学 | 一种语音情感迁移方法 |
CN107886938A (zh) * | 2016-09-29 | 2018-04-06 | 中国科学院深圳先进技术研究院 | 虚拟现实引导催眠语音处理方法及装置 |
CN108447470A (zh) * | 2017-12-28 | 2018-08-24 | 中南大学 | 一种基于声道和韵律特征的情感语音转换方法 |
CN109461435A (zh) * | 2018-11-19 | 2019-03-12 | 北京光年无限科技有限公司 | 一种面向智能机器人的语音合成方法及装置 |
CN109935225A (zh) * | 2017-12-15 | 2019-06-25 | 富泰华工业(深圳)有限公司 | 文字信息处理装置及方法、计算机存储介质及移动终端 |
WO2019218773A1 (zh) * | 2018-05-15 | 2019-11-21 | 中兴通讯股份有限公司 | 语音的合成方法及装置、存储介质、电子装置 |
CN110853616A (zh) * | 2019-10-22 | 2020-02-28 | 武汉水象电子科技有限公司 | 一种基于神经网络的语音合成方法、系统与存储介质 |
CN111108549A (zh) * | 2019-12-24 | 2020-05-05 | 深圳市优必选科技股份有限公司 | 语音合成方法、装置、计算机设备及计算机可读存储介质 |
CN111192568A (zh) * | 2018-11-15 | 2020-05-22 | 华为技术有限公司 | 一种语音合成方法及语音合成装置 |
CN112349272A (zh) * | 2020-10-15 | 2021-02-09 | 北京捷通华声科技股份有限公司 | 语音合成方法、装置、存储介质及电子装置 |
CN112489621A (zh) * | 2020-11-20 | 2021-03-12 | 北京有竹居网络技术有限公司 | 语音合成方法、装置、可读介质及电子设备 |
CN113611286A (zh) * | 2021-10-08 | 2021-11-05 | 之江实验室 | 一种基于共性特征提取的跨语种语音情感识别方法和系统 |
CN114420086A (zh) * | 2022-03-30 | 2022-04-29 | 北京沃丰时代数据科技有限公司 | 语音合成方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2853125A1 (fr) * | 2003-03-27 | 2004-10-01 | France Telecom | Procede d'analyse d'informations de frequence fondamentale et procede et systeme de conversion de voix mettant en oeuvre un tel procede d'analyse. |
-
2006
- 2006-04-24 CN CN2006100760147A patent/CN101064104B/zh active Active
Cited By (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101178897B (zh) * | 2007-12-05 | 2011-04-20 | 浙江大学 | 利用基频包络剔除情感语音的说话人识别方法 |
CN101226742B (zh) * | 2007-12-05 | 2011-01-26 | 浙江大学 | 基于情感补偿的声纹识别方法 |
CN101419800B (zh) * | 2008-11-25 | 2011-12-14 | 浙江大学 | 基于频谱平移的情感说话人识别方法 |
CN102341842A (zh) * | 2009-05-28 | 2012-02-01 | 国际商业机器公司 | 用于语者调适的基频移动量学习装置、基频生成装置、移动量学习方法、基频生成方法及移动量学习程序 |
CN102341842B (zh) * | 2009-05-28 | 2013-06-05 | 国际商业机器公司 | 用于语者调适的基频移动量学习装置和方法及基频生成装置和方法 |
CN101751922B (zh) * | 2009-07-22 | 2011-12-07 | 中国科学院自动化研究所 | 基于隐马尔可夫模型状态映射的文本无关语音转换系统 |
CN102005205B (zh) * | 2009-09-03 | 2012-10-03 | 株式会社东芝 | 情感语音合成方法和装置 |
CN101751921B (zh) * | 2009-12-16 | 2011-09-14 | 南京邮电大学 | 一种在训练数据量极少条件下的实时语音转换方法 |
CN102063899B (zh) * | 2010-10-27 | 2012-05-23 | 南京邮电大学 | 一种非平行文本条件下的语音转换方法 |
CN102063899A (zh) * | 2010-10-27 | 2011-05-18 | 南京邮电大学 | 一种非平行文本条件下的语音转换方法 |
CN102881283A (zh) * | 2011-07-13 | 2013-01-16 | 三星电子(中国)研发中心 | 用于语音处理的方法与系统 |
CN102881283B (zh) * | 2011-07-13 | 2014-05-28 | 三星电子(中国)研发中心 | 用于语音处理的方法与系统 |
CN103065620A (zh) * | 2012-12-27 | 2013-04-24 | 安徽科大讯飞信息科技股份有限公司 | 在手机上或网页上接收用户输入的文字并实时合成为个性化声音的方法 |
CN105023570A (zh) * | 2014-04-30 | 2015-11-04 | 安徽科大讯飞信息科技股份有限公司 | 一种实现声音转换的方法及系统 |
CN105023570B (zh) * | 2014-04-30 | 2018-11-27 | 科大讯飞股份有限公司 | 一种实现声音转换的方法及系统 |
CN104123932A (zh) * | 2014-07-29 | 2014-10-29 | 科大讯飞股份有限公司 | 一种语音转换系统及方法 |
CN106688034A (zh) * | 2014-09-11 | 2017-05-17 | 微软技术许可有限责任公司 | 具有情感内容的文字至语音转换 |
CN106688034B (zh) * | 2014-09-11 | 2020-11-13 | 微软技术许可有限责任公司 | 具有情感内容的文字至语音转换 |
CN105244042B (zh) * | 2015-08-26 | 2018-11-13 | 安徽建筑大学 | 一种基于有限状态自动机的语音情感交互装置与方法 |
CN105244042A (zh) * | 2015-08-26 | 2016-01-13 | 安徽建筑大学 | 一种基于有限状态自动机的语音情感交互装置与方法 |
CN105355193B (zh) * | 2015-10-30 | 2020-09-25 | 百度在线网络技术(北京)有限公司 | 语音合成方法和装置 |
CN105355193A (zh) * | 2015-10-30 | 2016-02-24 | 百度在线网络技术(北京)有限公司 | 语音合成方法和装置 |
CN105280179A (zh) * | 2015-11-02 | 2016-01-27 | 小天才科技有限公司 | 一种文字转语音的处理方法及系统 |
CN105551504B (zh) * | 2015-12-03 | 2019-04-23 | Oppo广东移动通信有限公司 | 一种基于哭声触发智能移动终端功能应用的方法及装置 |
CN105551504A (zh) * | 2015-12-03 | 2016-05-04 | 广东欧珀移动通信有限公司 | 一种基于哭声触发智能移动终端功能应用的方法及装置 |
CN105931631A (zh) * | 2016-04-15 | 2016-09-07 | 北京地平线机器人技术研发有限公司 | 语音合成系统和方法 |
CN106205623A (zh) * | 2016-06-17 | 2016-12-07 | 福建星网视易信息系统有限公司 | 一种声音转换方法及装置 |
CN107886938B (zh) * | 2016-09-29 | 2020-11-17 | 中国科学院深圳先进技术研究院 | 虚拟现实引导催眠语音处理方法及装置 |
CN107886938A (zh) * | 2016-09-29 | 2018-04-06 | 中国科学院深圳先进技术研究院 | 虚拟现实引导催眠语音处理方法及装置 |
CN106531150A (zh) * | 2016-12-23 | 2017-03-22 | 上海语知义信息技术有限公司 | 一种基于深度神经网络模型的情感合成方法 |
CN107068165B (zh) * | 2016-12-31 | 2020-07-24 | 南京邮电大学 | 一种语音转换方法 |
CN107068165A (zh) * | 2016-12-31 | 2017-08-18 | 南京邮电大学 | 一种语音转换方法 |
CN107221344A (zh) * | 2017-04-07 | 2017-09-29 | 南京邮电大学 | 一种语音情感迁移方法 |
CN107103900A (zh) * | 2017-06-06 | 2017-08-29 | 西北师范大学 | 一种跨语言情感语音合成方法及系统 |
CN109935225A (zh) * | 2017-12-15 | 2019-06-25 | 富泰华工业(深圳)有限公司 | 文字信息处理装置及方法、计算机存储介质及移动终端 |
CN108447470A (zh) * | 2017-12-28 | 2018-08-24 | 中南大学 | 一种基于声道和韵律特征的情感语音转换方法 |
WO2019218773A1 (zh) * | 2018-05-15 | 2019-11-21 | 中兴通讯股份有限公司 | 语音的合成方法及装置、存储介质、电子装置 |
CN111192568A (zh) * | 2018-11-15 | 2020-05-22 | 华为技术有限公司 | 一种语音合成方法及语音合成装置 |
CN109461435A (zh) * | 2018-11-19 | 2019-03-12 | 北京光年无限科技有限公司 | 一种面向智能机器人的语音合成方法及装置 |
CN110853616A (zh) * | 2019-10-22 | 2020-02-28 | 武汉水象电子科技有限公司 | 一种基于神经网络的语音合成方法、系统与存储介质 |
CN111108549A (zh) * | 2019-12-24 | 2020-05-05 | 深圳市优必选科技股份有限公司 | 语音合成方法、装置、计算机设备及计算机可读存储介质 |
CN111108549B (zh) * | 2019-12-24 | 2024-02-02 | 深圳市优必选科技股份有限公司 | 语音合成方法、装置、计算机设备及计算机可读存储介质 |
CN112349272A (zh) * | 2020-10-15 | 2021-02-09 | 北京捷通华声科技股份有限公司 | 语音合成方法、装置、存储介质及电子装置 |
CN112489621A (zh) * | 2020-11-20 | 2021-03-12 | 北京有竹居网络技术有限公司 | 语音合成方法、装置、可读介质及电子设备 |
CN113611286A (zh) * | 2021-10-08 | 2021-11-05 | 之江实验室 | 一种基于共性特征提取的跨语种语音情感识别方法和系统 |
CN114420086A (zh) * | 2022-03-30 | 2022-04-29 | 北京沃丰时代数据科技有限公司 | 语音合成方法和装置 |
CN114420086B (zh) * | 2022-03-30 | 2022-06-17 | 北京沃丰时代数据科技有限公司 | 语音合成方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN101064104B (zh) | 2011-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101064104B (zh) | 基于语音转换的情感语音生成方法 | |
US11222620B2 (en) | Speech recognition using unspoken text and speech synthesis | |
CN111785261B (zh) | 基于解纠缠和解释性表征的跨语种语音转换方法及系统 | |
CN112184858B (zh) | 基于文本的虚拟对象动画生成方法及装置、存储介质、终端 | |
US20200402497A1 (en) | Systems and Methods for Speech Generation | |
WO2020118521A1 (en) | Multi-speaker neural text-to-speech synthesis | |
US11908448B2 (en) | Parallel tacotron non-autoregressive and controllable TTS | |
US10235991B2 (en) | Hybrid phoneme, diphone, morpheme, and word-level deep neural networks | |
CN106128450A (zh) | 一种汉藏双语跨语言语音转换的方法及其系统 | |
Zhao et al. | Using phonetic posteriorgram based frame pairing for segmental accent conversion | |
JP2024505076A (ja) | 多様で自然なテキスト読み上げサンプルを生成する | |
Huang et al. | A preliminary study of a two-stage paradigm for preserving speaker identity in dysarthric voice conversion | |
Liu et al. | Controllable accented text-to-speech synthesis | |
CN115359778A (zh) | 基于说话人情感语音合成模型的对抗与元学习方法 | |
Chen et al. | The USTC System for Voice Conversion Challenge 2016: Neural Network Based Approaches for Spectrum, Aperiodicity and F0 Conversion. | |
CN1811912A (zh) | 小音库语音合成方法 | |
Yoon et al. | Enhancing multilingual tts with voice conversion based data augmentation and posterior embedding | |
Wang et al. | Non-parallel Accent Transfer based on Fine-grained Controllable Accent Modelling | |
Li et al. | A lyrics to singing voice synthesis system with variable timbre | |
CN113362803B (zh) | 一种arm侧离线语音合成的方法、装置及存储介质 | |
Gupta et al. | Text-to-Speech Conversion Technology using Deep Learning Algorithms | |
Wu et al. | Towards Realizing Mandarin-Tibetan Bi-lingual Emotional Speech Synthesis with Mandarin Emotional Training Corpus | |
Nitisaroj et al. | The Lessac Technologies system for Blizzard Challenge 2010 | |
Liang et al. | E $^{3} $ TTS: End-to-End Text-Based Speech Editing TTS System and Its Applications | |
Wilson et al. | Experiments in Making VOCALOID Synthesis More Human-like Using Deep Learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20170505 Address after: 100094, No. 4, building A, No. 1, building 2, wing Cheng North Road, No. 405-346, Beijing, Haidian District Patentee after: Beijing Rui Heng Heng Xun Technology Co., Ltd. Address before: 100080 Zhongguancun East Road, Beijing, No. 95, No. Patentee before: Institute of Automation, Chinese Academy of Sciences |
|
TR01 | Transfer of patent right |
Effective date of registration: 20181217 Address after: 100190 Zhongguancun East Road, Haidian District, Haidian District, Beijing Patentee after: Institute of Automation, Chinese Academy of Sciences Address before: 100094 No. 405-346, 4th floor, Building A, No. 1, Courtyard 2, Yongcheng North Road, Haidian District, Beijing Patentee before: Beijing Rui Heng Heng Xun Technology Co., Ltd. |
|
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20190527 Address after: 310019 1105, 11 / F, 4 building, 9 Ring Road, Jianggan District nine, Hangzhou, Zhejiang. Patentee after: Limit element (Hangzhou) intelligent Polytron Technologies Inc Address before: 100190 Zhongguancun East Road, Haidian District, Haidian District, Beijing Patentee before: Institute of Automation, Chinese Academy of Sciences |
|
TR01 | Transfer of patent right | ||
CP01 | Change in the name or title of a patent holder |
Address after: 310019 1105, 11 / F, 4 building, 9 Ring Road, Jianggan District nine, Hangzhou, Zhejiang. Patentee after: Zhongke extreme element (Hangzhou) Intelligent Technology Co., Ltd Address before: 310019 1105, 11 / F, 4 building, 9 Ring Road, Jianggan District nine, Hangzhou, Zhejiang. Patentee before: Limit element (Hangzhou) intelligent Polytron Technologies Inc. |
|
CP01 | Change in the name or title of a patent holder |