JP2856769B2 - Speech synthesizer - Google Patents
Speech synthesizerInfo
- Publication number
- JP2856769B2 JP2856769B2 JP1148996A JP14899689A JP2856769B2 JP 2856769 B2 JP2856769 B2 JP 2856769B2 JP 1148996 A JP1148996 A JP 1148996A JP 14899689 A JP14899689 A JP 14899689A JP 2856769 B2 JP2856769 B2 JP 2856769B2
- Authority
- JP
- Japan
- Prior art keywords
- accent
- digit
- speech
- unit
- digits
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Description
【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、コード化された数字列を自然性良く音声合
成することのできる音声合成装置に関する。DETAILED DESCRIPTION OF THE INVENTION [Object of the Invention] (Industrial application field) The present invention relates to a speech synthesizer that can naturally synthesize a coded numeric string with speech.
(従来の技術) 一般に、規則による音声合成装置で数字列、たとえば
「3561」を出力する場合、それが値段を表すときは「サ
ンゼン/ゴヒャク/ロクジュー/イチエン」のように位
読みするが、たとえば電話番号のときは、「サン/ゴー
/ロク/イチ」のように位読みしないほうが好ましい。
従来、この位読みをしない場合には、 のように1桁の数字ごとにアクセント的区切りを入れ、
さらに聞きやすくするためにアクセント的区切り位置に
ポーズを挿入していた。(Prior Art) In general, when a rule-based speech synthesizer outputs a digit string, for example, "3561", when it represents a price, it is read as "Sanzen / Gohjak / Rokju / Ichien". In the case of a telephone number, it is preferable not to read digits such as “Sun / Go / Roku / Ichi”.
Conventionally, if you do not do this reading, Insert an accent-like delimiter for each single digit like
Pauses were inserted at accent breaks to make it easier to hear.
しかしなら、実際に人が数字を発声する場合は、数字
1音1音を区切って発声することは少なく、連続して発
声することの方が多い。However, when a person actually utters a number, utterance is rarely performed while separating each sound of a number, and utterance is often performed continuously.
(発明が解決しようとする課題) 上記したように、従来の音声合成装置でコード化され
た数字列を位読みしないで出力する場合、数字の1音を
区切って発声するため、不自然なものとなっていた。(Problems to be Solved by the Invention) As described above, when outputting a digit string coded by a conventional speech synthesizer without digitizing, it utters one digit of a digit, which is unnatural. Had become.
そこで、本発明は、入力される数字列を先頭から2桁
毎に1つのアクセント句とすることにより、特に電話番
号などの数字列を自然性良く音声合成することが可能と
なる音声合成装置を提供することを目的とする。Therefore, the present invention provides a speech synthesizer that can synthesize a character string such as a telephone number with a natural sound by using an input number string as one accent phrase every two digits from the beginning. The purpose is to provide.
[発明の構成] (課題を解決するための手段) 本発明の音声合成装置は、コード化されて与えられる
数字列を位読みしないで音声出力するものにおいて、入
力される数字列の先頭から2桁ごとをアクセント境界に
して韻律パラメータを生成する韻律パラメータ生成手段
と、この韻律パラメータ生成手段で生成した韻律パラメ
ータに基づき合成音を生成し、出力する手段とを具備し
ている。[Structure of the Invention] (Means for Solving the Problems) A speech synthesizing apparatus according to the present invention, which outputs speech without digit reading of a coded given number sequence, includes two digits from the beginning of an input number sequence. Prosody parameter generation means for generating a prosody parameter with each digit as an accent boundary, and means for generating and outputting a synthesized sound based on the prosody parameter generated by the prosody parameter generation means.
(作用) 本発明の音声合成装置によれば、コード化された数字
列の先頭から2桁ごとをアクセント境界にし、2桁の数
字あるいは残りの1桁の数字にアクセント付けを行なう
ため、数字列の合成音が自然性良く生成できる。(Operation) According to the speech synthesizer of the present invention, every two digits from the beginning of a coded number string are used as accent boundaries to accentuate a two-digit number or the remaining one-digit number. Can be generated with good naturalness.
(実施例) 以下、本発明の一実施例について図面を参照して説明
する。Hereinafter, an embodiment of the present invention will be described with reference to the drawings.
第1図において、1は入力部で、コード化された文字
列および数字列などが入力される。2はアクセント検定
部で、入力部1を介して与えられるコードとアクセント
辞書3との照合を行ない、入力に対するアクセント型、
読み、品詞情報を得る。ここで、入力に対する品詞情報
が数字を表す「数」のときには、数字2桁で1つのアク
セント句とする。In FIG. 1, reference numeral 1 denotes an input unit for inputting a coded character string and a numeric string. Reference numeral 2 denotes an accent testing unit for comparing a code given through the input unit 1 with an accent dictionary 3 to obtain an accent type for the input,
Read and get part of speech information. Here, when the part-of-speech information corresponding to the input is “number” representing a number, two digits of the number constitute one accent phrase.
アクセント辞書3には、単語に対するアクセント型、
読み、品詞などが登録されている。合成パラメータ生成
部4は、アクセント検定部2から与えられるアクセント
型を基にして韻律パラメータを生成するとともに、読み
を基にして音声素片ファイル5を参照して音韻パラメー
タを生成し、それぞれ合成部6へ送る。音声素片ファイ
ル5には、各単音節を分析したパラメータが格納されて
いる。The accent dictionary 3 contains accent types for words,
Readings, parts of speech, etc. are registered. The synthesis parameter generation unit 4 generates a prosody parameter based on the accent type given from the accent test unit 2 and generates a phoneme parameter by referring to the speech unit file 5 based on the reading. Send to 6. The speech unit file 5 stores parameters obtained by analyzing each syllable.
合成部6は、合成パラメータ生成部4から送られる韻
律パラメータおよび音韻パラメータに基づいて合成音の
生成を行ない、それを出力する。The synthesizing unit 6 generates a synthesized sound based on the prosodic parameters and the phonological parameters sent from the synthesis parameter generating unit 4, and outputs it.
次に、このような構成において、たとえば「75387」
なる数字列の入力があった場合について説明する。この
「75387」なる数字列は、入力部1を介してアクセント
検定部2へ送られる。アクセント検定部2では、第2図
に示すようなアクセント辞書3と照合することにより、
全て品詞が「数」のため「75」「38」「7」に分割され
る。このときのアクセント型読みは、「5」の数字結合
アクセント情報を用いて (3型)、「8」の数字結合アクセント情報を用いて と検定される。この情報は、合成パラメータ生成部4に
送られ、音声素片ファイル5を参照して に対応する音韻パラメータおよび韻律パラメータが生成
され、それぞれ合成部6へ送られる。合成部6では、そ
れらの合成パラメータに基づいて合成音を生成し、その
音声出力を行なう。Next, in such a configuration, for example, “75387”
A case will be described in which a numeric string is input. The numeral string “75387” is sent to the accent testing unit 2 via the input unit 1. In the accent test unit 2, by comparing with an accent dictionary 3 as shown in FIG.
All parts of speech are divided into "75", "38" and "7" because of the "number". At this time, the accent-type reading is performed using the digit-combined accent information of “5”. (Type 3), using the digit-combined accent information of "8" Is tested. This information is sent to the synthesis parameter generation unit 4 and refers to the speech unit file 5. Are generated and sent to the synthesis unit 6, respectively. The synthesizer 6 generates a synthesized sound based on the synthesis parameters and outputs the sound.
また、数字の読みは全て2モーラ(「2」は「ニー」
「5」は「ゴー」とする)であるため、2つの数字を1
アクセント句とすると4モーラ、数字結合アクセント情
報は全て「1」のため、アクセント型はどのような組合
せでも「3型」となる。In addition, the number reading is all 2 mora ("2" is "knee"
"5" is "go"), so two numbers are 1
If the accent phrase is 4 moras, and all the digit combination accent information is “1”, any combination of accent types will be “type 3”.
1つの数字が残った場合は、アクセント型を「1」と
する。これらの規則を、たとえば第1図に破線で示した
数字アクセント検定部7で実現することも可能である。
この場合、入力部1で数字を検出し、それを数字アクセ
ント検定部7へ送る。数字アクセント検出部7は、数字
列を先頭から2桁ごとに分割し、その2桁の数字を1ア
クセント句とする。そして、2桁数字のアクセント型を
「3」とし、もし1桁の数字が残っているならば、その
数字のアクセント型を「1」とし、数字の読みとアクセ
ント型を合成パラメータ生成部4へ送る。If one number remains, the accent type is set to “1”. These rules can be implemented, for example, by the numeric accent testing unit 7 shown by a broken line in FIG.
In this case, the input unit 1 detects a number and sends it to the number accent testing unit 7. The numeric accent detector 7 divides the numeric string into two digits from the beginning, and uses the two-digit number as one accent phrase. Then, the accent type of the two-digit number is set to “3”, and if one digit remains, the accent type of the number is set to “1”, and the reading of the number and the accent type are sent to the synthesis parameter generation unit 4. send.
このように、電話番号などの数字列を音声出力する際
に、その数字列の先頭から2桁ごとをアクセント境界と
することにより、数字列の自然な発声が可能である。As described above, when a character string such as a telephone number is output as speech, by setting every two digits from the beginning of the number string as an accent boundary, natural utterance of the number string can be achieved.
なお、本発明は上述した実施例に限定されるものでは
ない。たとえば、第1図に示した音声合成装置の概略構
成図はあくまでも一例であり、また第2図のアクセント
辞書の内容についても前述した実施例に限定されるもの
ではない。また、数字を表す品詞は「数」でなくてもよ
い。要するに本発明は、その要旨を逸脱しない範囲で種
々変形して実施可能である。The present invention is not limited to the embodiments described above. For example, the schematic configuration diagram of the speech synthesizer shown in FIG. 1 is merely an example, and the contents of the accent dictionary in FIG. 2 are not limited to the above-described embodiment. Also, the part of speech that represents a number need not be “number”. In short, the present invention can be implemented with various modifications without departing from the scope of the invention.
[発明の効果] 以上詳述したように本発明によれば、入力される数字
列の先頭から2桁ごとをアクセント境界にし、2桁の数
字あるいは残りの1桁の数字にアクセント付けを行なう
ことにより、本来人が発声するのと同じような自然な音
声出力が得られる音声合成装置を提供できる。[Effects of the Invention] As described in detail above, according to the present invention, every two digits from the beginning of an input numeric string are set as accent boundaries, and two digits or the remaining one digit is accented. Accordingly, it is possible to provide a voice synthesizing apparatus capable of obtaining a natural voice output similar to a voice uttered by a human.
第1図は本発明の一実施例に係る音声合成装置の概略構
成図、第2図は同実施例におけるアクセント辞書の内容
を示す図である。 1……入力部、2……アクセント検定部、3……アクセ
ント辞書、4……合成パラメータ生成部、5……音声素
片ファイル、6……合成部、7……数字アクセント検定
部。FIG. 1 is a schematic configuration diagram of a speech synthesizer according to one embodiment of the present invention, and FIG. 2 is a diagram showing the contents of an accent dictionary in the embodiment. 1. Input unit 2. Accent test unit 3. Accent dictionary 4. Synthetic parameter generating unit 5. Speech unit file 6. Synthetic unit 7. Numerical accent test unit.
Claims (2)
しないで音声出力するものにおいて、 入力される数字列の先頭から2桁ごとをアクセント境界
にして韻律パラメータを生成する韻律パラメータ生成手
段と、 この韻律パラメータ生成手段で生成した韻律パラメータ
に基づき合成音を生成し、出力する手段とを具備したこ
とを特徴とする音声合成装置。1. A prosody parameter generating means for generating a prosody parameter with an accent boundary every two digits from the beginning of an input digit sequence, wherein the encoded digit sequence is output as voice without digit reading. Means for generating and outputting a synthesized speech based on the prosody parameters generated by the prosody parameter generation means.
に分割されたアクセント型を、「3型」にして韻律パラ
メータを生成することを特徴とする請求項1記載の音声
合成装置。2. A speech synthesizer according to claim 1, wherein said prosody parameter generation means generates a prosody parameter by setting the accent type divided every two digits to "type 3".
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1148996A JP2856769B2 (en) | 1989-06-12 | 1989-06-12 | Speech synthesizer |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1148996A JP2856769B2 (en) | 1989-06-12 | 1989-06-12 | Speech synthesizer |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0313999A JPH0313999A (en) | 1991-01-22 |
JP2856769B2 true JP2856769B2 (en) | 1999-02-10 |
Family
ID=15465375
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1148996A Expired - Lifetime JP2856769B2 (en) | 1989-06-12 | 1989-06-12 | Speech synthesizer |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2856769B2 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3354339B2 (en) | 1995-04-11 | 2002-12-09 | 株式会社リコー | Japanese language processor |
CN101192404B (en) * | 2006-11-28 | 2011-07-06 | 纽昂斯通讯公司 | System and method for identifying accent of input sound |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5907597A (en) * | 1994-08-05 | 1999-05-25 | Smart Tone Authentication, Inc. | Method and system for the secure communication of data |
-
1989
- 1989-06-12 JP JP1148996A patent/JP2856769B2/en not_active Expired - Lifetime
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3354339B2 (en) | 1995-04-11 | 2002-12-09 | 株式会社リコー | Japanese language processor |
CN101192404B (en) * | 2006-11-28 | 2011-07-06 | 纽昂斯通讯公司 | System and method for identifying accent of input sound |
Also Published As
Publication number | Publication date |
---|---|
JPH0313999A (en) | 1991-01-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2856769B2 (en) | Speech synthesizer | |
JPH05100692A (en) | Voice synthesizer | |
JP2642617B2 (en) | Speech synthesizer | |
JPH05281984A (en) | Method and device for synthesizing speech | |
JP2658109B2 (en) | Speech synthesizer | |
JP2703253B2 (en) | Speech synthesizer | |
JPH0887289A (en) | Voice rule synthesis device | |
JP3397406B2 (en) | Voice synthesis device and voice synthesis method | |
JPH02236600A (en) | Circuit for giving emotion of synthesized voice information | |
JP2839488B2 (en) | Speech synthesizer | |
JPH01321496A (en) | Speech synthesizing device | |
JP2839492B2 (en) | Speech synthesis apparatus and method | |
JP2977236B2 (en) | Speech synthesizer | |
JPH0229800A (en) | Voice synthesizing device | |
JPH037999A (en) | Voice output device | |
JP2507374B2 (en) | Speech synthesizer | |
JPH01112297A (en) | Voice synthesizer | |
JPS59155899A (en) | Voice synthesization system | |
JPS63217400A (en) | Japanese sentence voice converter | |
JP2001166787A (en) | Voice synthesizer and natural language processing method | |
JPH06161493A (en) | Long sound processing system of speech synthesizing device | |
JPS62215299A (en) | Sentence reciting apparatus | |
JPH01321497A (en) | Speech synthesizing device | |
JPH0285899A (en) | Voice synthesizing device | |
JPH04199195A (en) | Voice synthesizer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071127 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081127 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091127 Year of fee payment: 11 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091127 Year of fee payment: 11 |