JP5158567B2 - 音声合成装置、音声合成方法及び音声合成プログラム - Google Patents
音声合成装置、音声合成方法及び音声合成プログラム Download PDFInfo
- Publication number
- JP5158567B2 JP5158567B2 JP2008092126A JP2008092126A JP5158567B2 JP 5158567 B2 JP5158567 B2 JP 5158567B2 JP 2008092126 A JP2008092126 A JP 2008092126A JP 2008092126 A JP2008092126 A JP 2008092126A JP 5158567 B2 JP5158567 B2 JP 5158567B2
- Authority
- JP
- Japan
- Prior art keywords
- segment
- unit
- speech
- candidate
- improvement
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000015572 biosynthetic process Effects 0.000 title claims description 55
- 238000003786 synthesis reaction Methods 0.000 title claims description 41
- 238000001308 synthesis method Methods 0.000 title claims description 15
- 230000006872 improvement Effects 0.000 claims description 124
- 238000000034 method Methods 0.000 claims description 91
- 238000004364 calculation method Methods 0.000 claims description 70
- 238000012545 processing Methods 0.000 claims description 56
- 238000012217 deletion Methods 0.000 claims description 43
- 230000037430 deletion Effects 0.000 claims description 43
- 230000008569 process Effects 0.000 claims description 26
- 238000004458 analytical method Methods 0.000 claims description 24
- 230000000877 morphologic effect Effects 0.000 claims description 8
- 230000001172 regenerating effect Effects 0.000 claims description 2
- 239000012634 fragment Substances 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 7
- 239000011295 pitch Substances 0.000 description 7
- 230000015556 catabolic process Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 241000665848 Isca Species 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
Description
[第1の実施の形態]
図1は、本発明の第1の実施の形態に係る音声合成装置の構成を示すブロック図である。図1に示す本実施の形態による構成では、言語処理部1、韻律生成部2、候補素片取得部3、素片選択部4、素片情報記憶部5、波形生成部6、削除対象の素片を指定する素片削除指令が入力される使用禁止素片情報取得部11、使用禁止素片情報記憶部12、最適素片情報記憶部13及び改善見込指標計算部140を備えている。
[第2の実施の形態]
第1の実施の形態では素片選択スコアを利用して改善見込指標を計算しているが、素片選択スコアは、音質の指標としては完全に信頼することは困難であるという問題がある。仮に、素片選択スコアが削除対象とすべき使用禁止素片の発見に関して十分に信頼可能な指標であるならば、素片選択時に高品質な素片が最適素片として選択されるはずであり、使用禁止素片を発見・指定する作業自体が不要になると言える。
[第3の実施の形態]
続いて、本発明の第3の実施の形態に係る音声合成装置について説明する。ここで、図6は、本発明の第3の実施の形態に係る音声合成装置の構成を示すブロック図である。
[第4の実施の形態]
続いて、本発明の第4の実施の形態に係る音声合成装置について説明する。ここで、図8は、本発明の第4の実施の形態に係る音声合成装置の構成を示すブロック図である。
2 韻律生成部
3、31 候補素片取得部
4 素片選択部
5 素片情報記憶部
6 波形生成部
11、112 使用禁止素片情報取得部
12 使用禁止素片情報記憶部
13 最適素片情報記憶部
140、141、142、143 改善見込指標計算部
152 使用禁止素片取得回数計算部
Claims (15)
- 入力テキストに対し、該入力テキストの読み及びアクセントの分析、形態素解析並びに構文解析、の一部或いは全部を含む言語処理を行う言語処理部と、
該言語処理の結果に基づいて少なくとも、音の強弱、長短及び高低、の一部或いは全部に係る韻律情報を生成する韻律生成部と、
前記言語処理の結果に基づいて合成音声に用いられる可能性がある音声素片を候補素片として取得する候補素片取得部と、
前記韻律情報及び前記言語処理の結果に基づいて前記候補素片の音声合成における適切度を示す指標である素片選択スコアを計算し、前記候補素片の中から合成音声に最適な音声素片を最適素片として選択する素片選択部と、
該最適素片に基づいて合成音声波形を生成する波形生成部と、
を有し、
前記候補素片取得部は、前記最適素片に削除対象の素片が含まれる場合、該素片を除いて候補素片の取得を再度実行し、前記波形生成部は合成音声波形を再生成する音声合成装置において、
前記削除対象の素片を削除した際に音質が改善する可能性の高さを表す改善見込指標を計算し、該計算した改善見込指標を出力する改善見込指標計算部と、
前記出力された改善見込指標を参照した合成音声編集者によって使用禁止素片として指定された素片を、前記削除対象の素片として前記候補素片取得部に伝達する使用禁止素片情報取得部と、
を備え、
前記改善見込指標計算部は、前記素片選択スコアに基づいて、前記削除対象の素片を削除した後の素片選択スコアを推定し、該推定された素片選択スコアが高ければ前記改善見込指標を高くすることを特徴とする音声合成装置。 - 前記削除対象の素片を指定する削除指定の回数を計算する削除指定回数計算部を更に有し、
前記改善見込指標計算部は、前記削除指定の回数が少なければ前記改善見込指標を大きくすることを特徴とする請求項1に記載の音声合成装置。 - 前記改善見込指標計算部は、前記候補素片取得部で取得した候補素片の数が多ければ、前記改善見込指標を大きくすることを特徴とする請求項1又は2に記載の音声合成装置。
- 前記改善見込指標計算部は、前記素片選択スコアのうち、高い数値を示すものの重みつき和を、前記改善見込指標計算部で用いられる前記削除対象の素片を削除した後の素片選択スコアとして推定することを特徴とする請求項1乃至3の何れか1項に記載の音声合成装置。
- 前記改善見込指標計算部は、前記素片選択スコアのうち、高い数値を示すものの平均値を、前記改善見込指標計算部で用いられる前記削除対象の素片を削除した後の素片選択スコアとして推定することを特徴とする請求項1乃至3の何れか1項に記載の音声合成装置。
- 入力テキストに対し、該入力テキストの読み及びアクセントの分析、形態素解析並びに構文解析、の一部或いは全部を含む言語処理を行う言語処理手順と、
該言語処理の結果に基づいて少なくとも、音の強弱、長短及び高低、の一部或いは全部に係る韻律情報を生成する韻律生成手順と、
前記言語処理の結果に基づいて合成音声に用いられる可能性がある音声素片を候補素片として取得する候補素片取得手順と、
前記韻律情報及び前記言語処理の結果に基づいて前記候補素片の音声合成における適切度を示す指標である素片選択スコアを計算し、前記候補素片の中から合成音声に最適な音声素片を最適素片として選択する素片選択手順と、
該最適素片に基づいて合成音声波形を生成する波形生成手順と、
を有し、前記候補素片取得手順は、前記最適素片に削除対象の素片が含まれる場合、該素片を除いて候補素片の取得を再度実行し、前記波形生成手順は合成音声波形を再生成する音声合成方法において、
前記削除対象の素片を削除した際に音質が改善する可能性の高さを表す改善見込指標を計算し、該計算した改善見込指標を出力する改善見込指標計算手順と、
前記出力された改善見込指標を参照した合成音声編集者によって使用禁止素片として指定された素片を、前記削除対象の素片として前記候補素片取得部に伝達する使用禁止素片情報取得手順と、
を更に有し、
前記改善見込指標計算手順は、前記素片選択スコアに基づいて、前記削除対象の素片を削除した後の素片選択スコアを推定し、該推定された素片選択スコアが高ければ前記改善見込指標を高くすることを特徴とする音声合成方法。 - 前記削除対象の素片を指定する削除指定の回数を計算する削除指定回数計算手順を更に有し、
前記改善見込指標計算手順は、前記削除指定の回数が少なければ前記改善見込指標を大きくすることを特徴とする請求項6に記載の音声合成方法。 - 前記改善見込指標計算手順は、前記候補素片取得手順で取得した候補素片の数が多ければ、前記改善見込指標を大きくすることを特徴とする請求項6又は7に記載の音声合成方法。
- 前記改善見込指標計算手順は、前記素片選択スコアのうち、高い数値を示すものの重みつき和を、前記改善見込指標計算手順で用いられる前記削除対象の素片を削除した後の素片選択スコアとして推定することを特徴とする請求項6乃至8の何れか1項に記載の音声合成方法。
- 前記改善見込指標計算手順は、前記素片選択スコアのうち、高い数値を示すものの平均値を、前記改善見込指標計算手順で用いられる前記削除対象の素片を削除した後の素片選択スコアとして推定することを特徴とする請求項6乃至8の何れか1項に記載の音声合成方法。
- 入力テキストに対し、該入力テキストの読み及びアクセントの分析、形態素解析並びに構文解析、の一部或いは全部を含む言語処理と、
該言語処理の結果に基づいて少なくとも、音の強弱、長短及び高低、の一部或いは全部に係る韻律情報を生成する韻律生成処理と、
前記言語処理の結果に基づいて合成音声に用いられる可能性がある音声素片を候補素片として取得する候補素片取得処理と、
前記韻律情報及び前記言語処理の結果に基づいて前記候補素片の音声合成における適切度を示す指標である素片選択スコアを計算し、前記候補素片の中から合成音声に最適な音声素片を最適素片として選択する素片選択処理と、
該最適素片に基づいて合成音声波形を生成する波形生成処理と、
をコンピュータに実行させ、前記候補素片取得処理は、前記最適素片に削除対象の素片が含まれる場合、該素片を除いて候補素片の取得を再度実行し、前記波形生成処理は合成音声波形を再生成する音声合成プログラムにおいて、
前記削除対象の素片を削除した際に音質が改善する可能性の高さを表す改善見込指標を計算し、該計算した改善見込指標を出力する改善見込指標計算処理と、
前記出力された改善見込指標を参照した合成音声編集者によって使用禁止素片として指定された素片を、前記削除対象の素片として前記候補素片取得部に伝達する使用禁止素片情報取得処理と、
を更にコンピュータに実行させ、
前記改善見込指標計算処理は、前記素片選択スコアに基づいて、前記削除対象の素片を削除した後の素片選択スコアを推定し、該推定された素片選択スコアが高ければ前記改善見込指標を高くすることを特徴とする音声合成プログラム。 - 前記削除対象の素片を指定する削除指定の回数を計算する削除指定回数計算処理を更にコンピュータに実行させ、
前記改善見込指標計算処理は、前記削除指定の回数が少なければ前記改善見込指標を大きくすることを特徴とする請求項11記載の音声合成プログラム。 - 前記改善見込指標計算処理は、前記候補素片取得処理で取得した候補素片の数が多ければ、前記改善見込指標を大きくすることを特徴とする請求項11又は12に記載の音声合成プログラム。
- 前記改善見込指標計算処理は、前記素片選択スコアのうち、高い数値を示すものの重みつき和を、前記改善見込指標計算処理で用いられる前記削除対象の素片を削除した後の素片選択スコアとして推定することを特徴とする請求項11乃至13の何れか1項に記載の音声合成プログラム。
- 前記改善見込指標計算処理は、前記素片選択スコアのうち、高い数値を示すものの平均値を、前記改善見込指標計算処理で用いられる前記削除対象の素片を削除した後の素片選択スコアとして推定することを特徴とする請求項11乃至13の何れか1項に記載の音声合成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008092126A JP5158567B2 (ja) | 2008-03-31 | 2008-03-31 | 音声合成装置、音声合成方法及び音声合成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008092126A JP5158567B2 (ja) | 2008-03-31 | 2008-03-31 | 音声合成装置、音声合成方法及び音声合成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009244661A JP2009244661A (ja) | 2009-10-22 |
JP5158567B2 true JP5158567B2 (ja) | 2013-03-06 |
Family
ID=41306602
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008092126A Expired - Fee Related JP5158567B2 (ja) | 2008-03-31 | 2008-03-31 | 音声合成装置、音声合成方法及び音声合成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5158567B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5123347B2 (ja) | 2010-03-31 | 2013-01-23 | 株式会社東芝 | 音声合成装置 |
JP5712818B2 (ja) * | 2011-06-30 | 2015-05-07 | 富士通株式会社 | 音声合成装置、音質修正方法およびプログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4639932B2 (ja) * | 2005-05-06 | 2011-02-23 | 株式会社日立製作所 | 音声合成装置 |
-
2008
- 2008-03-31 JP JP2008092126A patent/JP5158567B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009244661A (ja) | 2009-10-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10347238B2 (en) | Text-based insertion and replacement in audio narration | |
US8321208B2 (en) | Speech processing and speech synthesis using a linear combination of bases at peak frequencies for spectral envelope information | |
JP4241762B2 (ja) | 音声合成装置、その方法、及びプログラム | |
JP5269668B2 (ja) | 音声合成装置、プログラム、及び方法 | |
JP4406440B2 (ja) | 音声合成装置、音声合成方法及びプログラム | |
JP2013171196A (ja) | 音声合成装置、方法およびプログラム | |
CN101131818A (zh) | 语音合成装置与方法 | |
JP5411845B2 (ja) | 音声合成方法、音声合成装置及び音声合成プログラム | |
JP5434587B2 (ja) | 音声合成装置及び方法とプログラム | |
US9129596B2 (en) | Apparatus and method for creating dictionary for speech synthesis utilizing a display to aid in assessing synthesis quality | |
WO2016103652A1 (ja) | 音声処理装置、音声処理方法、および記録媒体 | |
JP5158567B2 (ja) | 音声合成装置、音声合成方法及び音声合成プログラム | |
US20110196680A1 (en) | Speech synthesis system | |
JP4247289B1 (ja) | 音声合成装置、音声合成方法およびそのプログラム | |
JP5874639B2 (ja) | 音声合成装置、音声合成方法及び音声合成プログラム | |
JP4639932B2 (ja) | 音声合成装置 | |
JP4533255B2 (ja) | 音声合成装置、音声合成方法、音声合成プログラムおよびその記録媒体 | |
KR101227716B1 (ko) | 음성 합성 장치, 음성 합성 방법 및 음성 합성 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체 | |
JP4640063B2 (ja) | 音声合成方法,音声合成装置,およびコンピュータプログラム | |
JP3881970B2 (ja) | 知覚試験用音声データセット作成装置、コンピュータプログラム、音声合成用サブコスト関数の最適化装置、及び音声合成装置 | |
JP2006084854A (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP2010224053A (ja) | 音声合成装置、音声合成方法、プログラム及び記録媒体 | |
JP2005091551A (ja) | 音声合成装置及びそのためのコスト計算装置、並びにコンピュータプログラム | |
JP2011013534A (ja) | 音声合成装置およびプログラム | |
Natvig et al. | Prosodic unit selection for text-to-speech synthesis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20100728 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20100728 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110214 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120529 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120604 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120802 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120820 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121012 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121119 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121202 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5158567 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151221 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |