JP4639932B2 - 音声合成装置 - Google Patents
音声合成装置 Download PDFInfo
- Publication number
- JP4639932B2 JP4639932B2 JP2005134732A JP2005134732A JP4639932B2 JP 4639932 B2 JP4639932 B2 JP 4639932B2 JP 2005134732 A JP2005134732 A JP 2005134732A JP 2005134732 A JP2005134732 A JP 2005134732A JP 4639932 B2 JP4639932 B2 JP 4639932B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- phoneme
- unit
- quality
- synthesis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
後者の例としては、上記技術と同様な評価値を用いて素片の選択を行うが、素片を接続する際に信号処理技術を用いて変形を行う技術がある(非特許文献2参照)
テキストデータから音声を生成する音声合成装置では、テキストデータを解析し、単語の読み、アクセントや韻律などの音声合成パラメータを得る。そして、この音声合成パラメータを元に、音声合成データベースから最適な音素片を選択し接続することにより合成音声を生成する。しかしながら、テキストデータの解析が必ずしも正確に行われるわけではなく、また、必ずしも最適な音素片が選択されるわけではない。
そこで、上記のような問題を解決するために、音声合成パラメータを編集することにより、また、音素片を差し替えることにより合成音声の品質を向上させる合成音声編集技術がある(例えば、特許文献1参照)
また、音素片を差し替える際に、複数の音素片候補から最適な音素片を操作者が選択しなければならず、音声に対する専門知識が必要であり、簡単ではない。
音声合成装置は、入力部11と音声合成手段12と記憶部13と制御手段14と合成音声品質劣化予測手段15と出力部16を備え、コーパスから選択した音素片を接続して行われる音声合成方法を行うものを前提とする。
入力部11は、音声合成装置に対して文字や数字その他の情報を入力するための装置であり、例えばキーボードやマウスなどにより構成されている。音声合成手段12は、入力された漢字かな混じりテキストや発音記号列から音声を生成するプログラムである。出力部16は、合成音声の出力や、文字列や波形その他の情報を出力するための装置であり、例えばスピーカやCRTディスプレイなどにより構成されている。記憶部13は、音声合成手段12と制御手段14と合成音声品質劣化予測手段15を格納するための記憶媒体であり、例えば磁気ディスクや半導体メモリなどにより構成されている。
合成音声品質予測にはこれらステップの全てを用いてもよいし、何れかを選択的に用いてもよい。また例えばターゲットコストと接続コストの合計値を判定に用いてもよい。また、合成音声の品質劣化を予測するための値は必ずしも一つでなくてもよい。また、合成音声の品質劣化を予測するために、必ずしもあらかじめ値を設定する必要はなく、前後のスコアとの相対値を用いてもよいしスコアそのものを品質劣化予測結果としてもよい。又図5に示したフローの順番にとらわれるものではない。
操作者は所望の音声が得られるまで、何度でも上記の操作を繰り返すことが出来る。
Claims (8)
- 文字列を入力する入力手段と、
波形データベースから最適な音素片を選択して入力された文字列の音声合成を行う音声合成手段と、
上記合成された音声の品質の劣化部分を予測する合成音声品質予測手段と、
上記合成音声品質予測手段により予測された品質の劣化部分と上記合成された音声の波形とを表示手段に表示させる出力部を有する音声合成装置。 - 上記表示手段は、上記合成音声品質予測手段で品質が設定値範囲外と判定された音素片を、上記波形中および入力文字列又は入力文字列の言語処理結果に明示的に表示することを特徴とする請求項1記載の音声合成装置。
- 上記品質予測部は、上記音声を構成する音素片選択時の接続コストを用いて上記品質を予測することを特徴とする請求項1又は2に記載の音声合成装置。
- 上記品質予測部は、上記音声を構成する音素片のターゲットコストを用いて上記品質を予測することを特徴とする請求項1乃至3の何れかに記載の音声合成装置。
- 上記音声合成手段は音声合成時に使用禁止音素片リストを参照し、使用禁止音素片リストに記録された音素片が存在するときに該音素片を除いて音声合成を行うことを特徴とする請求項1乃至4の何れかに記載の音声合成装置。
- 入力手段を介して上記合成された音声の波形を構成する素片の差し替え指示を受けると、上記音声合成手段は該音素片を使用禁止音素片リストに追加することを特徴とする請求項5に記載の音声合成装置。
- 入力手段を介して再合成の指示入力を受けると、
上記音声合成手段は、上記使用禁止音素片リストの音素片を除いて上記音声合成を行うことを特徴とする請求項6に記載の音声合成装置。 - 上記音声合成手段は、接続コスト又は/及びターゲットコストに基づいて上記波形データベースから音素片を選択することを特徴とする請求項1に記載の音声合成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005134732A JP4639932B2 (ja) | 2005-05-06 | 2005-05-06 | 音声合成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005134732A JP4639932B2 (ja) | 2005-05-06 | 2005-05-06 | 音声合成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006313176A JP2006313176A (ja) | 2006-11-16 |
JP4639932B2 true JP4639932B2 (ja) | 2011-02-23 |
Family
ID=37534700
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005134732A Expired - Fee Related JP4639932B2 (ja) | 2005-05-06 | 2005-05-06 | 音声合成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4639932B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4775236B2 (ja) * | 2006-11-22 | 2011-09-21 | 沖電気工業株式会社 | 音声合成装置 |
JP4973664B2 (ja) * | 2006-11-24 | 2012-07-11 | 富士通株式会社 | 文書読上げ装置、文書読上げ装置を制御する制御方法及び文書読上げ装置を制御する制御プログラム |
JP5158567B2 (ja) * | 2008-03-31 | 2013-03-06 | 日本電気株式会社 | 音声合成装置、音声合成方法及び音声合成プログラム |
JP5552797B2 (ja) * | 2009-11-09 | 2014-07-16 | ヤマハ株式会社 | 音声合成装置および音声合成方法 |
JP5123347B2 (ja) | 2010-03-31 | 2013-01-23 | 株式会社東芝 | 音声合成装置 |
JP5712818B2 (ja) * | 2011-06-30 | 2015-05-07 | 富士通株式会社 | 音声合成装置、音質修正方法およびプログラム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6078492A (ja) * | 1983-10-05 | 1985-05-04 | 日本電気株式会社 | 合成音声評価装置 |
JPH08263095A (ja) * | 1995-03-20 | 1996-10-11 | N T T Data Tsushin Kk | 音声素片選択方法および音声合成装置 |
JPH11149293A (ja) * | 1997-11-17 | 1999-06-02 | Ntt Data Corp | 音声モニタシステム及び音声モニタ方法 |
JP2001282275A (ja) * | 2000-03-31 | 2001-10-12 | Canon Inc | 音声合成方法および装置 |
-
2005
- 2005-05-06 JP JP2005134732A patent/JP4639932B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6078492A (ja) * | 1983-10-05 | 1985-05-04 | 日本電気株式会社 | 合成音声評価装置 |
JPH08263095A (ja) * | 1995-03-20 | 1996-10-11 | N T T Data Tsushin Kk | 音声素片選択方法および音声合成装置 |
JPH11149293A (ja) * | 1997-11-17 | 1999-06-02 | Ntt Data Corp | 音声モニタシステム及び音声モニタ方法 |
JP2001282275A (ja) * | 2000-03-31 | 2001-10-12 | Canon Inc | 音声合成方法および装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2006313176A (ja) | 2006-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10347238B2 (en) | Text-based insertion and replacement in audio narration | |
US6778962B1 (en) | Speech synthesis with prosodic model data and accent type | |
US8352270B2 (en) | Interactive TTS optimization tool | |
JP4241762B2 (ja) | 音声合成装置、その方法、及びプログラム | |
US7454343B2 (en) | Speech synthesizer, speech synthesizing method, and program | |
US20060259303A1 (en) | Systems and methods for pitch smoothing for text-to-speech synthesis | |
JP4406440B2 (ja) | 音声合成装置、音声合成方法及びプログラム | |
CN101131818A (zh) | 语音合成装置与方法 | |
JP2007249212A (ja) | テキスト音声合成のための方法、コンピュータプログラム及びプロセッサ | |
JP2001282278A (ja) | 音声情報処理装置及びその方法と記憶媒体 | |
US9020821B2 (en) | Apparatus and method for editing speech synthesis, and computer readable medium | |
US20090281808A1 (en) | Voice data creation system, program, semiconductor integrated circuit device, and method for producing semiconductor integrated circuit device | |
CN1787072B (zh) | 基于韵律模型和参数选音的语音合成方法 | |
JP4639932B2 (ja) | 音声合成装置 | |
WO2011004502A1 (ja) | 音声編集合成装置及び音声編集合成方法 | |
JP4247289B1 (ja) | 音声合成装置、音声合成方法およびそのプログラム | |
JP4648878B2 (ja) | 様式指定型音声合成方法、及び様式指定型音声合成装置とそのプログラムと、その記憶媒体 | |
WO2008056604A1 (fr) | Système de collecte de son, procédé de collecte de son et programme de traitement de collecte | |
JP5387410B2 (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP3060276B2 (ja) | 音声合成装置 | |
JP4640063B2 (ja) | 音声合成方法,音声合成装置,およびコンピュータプログラム | |
JP2006084854A (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP3892691B2 (ja) | 音声合成方法及びその装置並びに音声合成プログラム | |
JP5123347B2 (ja) | 音声合成装置 | |
EP1589524B1 (en) | Method and device for speech synthesis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080201 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100618 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100629 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100826 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101102 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101115 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4639932 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131210 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |