JP2017111372A - 音声合成方法、音声合成制御方法、音声合成装置および音声合成制御装置 - Google Patents
音声合成方法、音声合成制御方法、音声合成装置および音声合成制御装置 Download PDFInfo
- Publication number
- JP2017111372A JP2017111372A JP2015247189A JP2015247189A JP2017111372A JP 2017111372 A JP2017111372 A JP 2017111372A JP 2015247189 A JP2015247189 A JP 2015247189A JP 2015247189 A JP2015247189 A JP 2015247189A JP 2017111372 A JP2017111372 A JP 2017111372A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- change
- pronunciation
- speech
- satisfied
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000015572 biosynthetic process Effects 0.000 title claims abstract description 80
- 238000003786 synthesis reaction Methods 0.000 title claims abstract description 72
- 238000000034 method Methods 0.000 title claims description 22
- 238000001308 synthesis method Methods 0.000 title claims description 7
- 230000008859 change Effects 0.000 claims abstract description 134
- 230000010365 information processing Effects 0.000 claims abstract description 59
- 230000005236 sound signal Effects 0.000 claims abstract description 9
- 238000012545 processing Methods 0.000 claims description 14
- 230000008569 process Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 7
- 230000001960 triggered effect Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000008451 emotion Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- 241001672694 Citrus reticulata Species 0.000 description 2
- TUBQDCKAWGHZPF-UHFFFAOYSA-N 1,3-benzothiazol-2-ylsulfanylmethyl thiocyanate Chemical compound C1=CC=C2SC(SCSC#N)=NC2=C1 TUBQDCKAWGHZPF-UHFFFAOYSA-N 0.000 description 1
- MQJKPEGWNLWLTK-UHFFFAOYSA-N Dapsone Chemical compound C1=CC(N)=CC=C1S(=O)(=O)C1=CC=C(N)C=C1 MQJKPEGWNLWLTK-UHFFFAOYSA-N 0.000 description 1
- 240000005561 Musa balbisiana Species 0.000 description 1
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 1
- 101150116232 NIBAN1 gene Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L13/10—Prosody rules derived from text; Stress or intonation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/033—Voice editing, e.g. manipulating the voice of the synthesiser
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63F—CARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
- A63F13/00—Video games, i.e. games using an electronically generated display having two or more dimensions
- A63F13/50—Controlling the output signals based on the game progress
- A63F13/54—Controlling the output signals based on the game progress involving acoustic signals, e.g. for simulating revolutions per minute [RPM] dependent engine sounds in a driving game or reverberation against a virtual wall
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63F—CARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
- A63F13/00—Video games, i.e. games using an electronically generated display having two or more dimensions
- A63F13/80—Special adaptations for executing a specific game genre or game mode
- A63F13/814—Musical performances, e.g. by evaluating the player's ability to follow a notation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/36—Accompaniment arrangements
- G10H1/361—Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2250/00—Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
- G10H2250/315—Sound category-dependent sound synthesis processes [Gensound] for musical use; Sound category-specific synthesis-controlling parameters or control means therefor
- G10H2250/455—Gensound singing voices, i.e. generation of human voices for musical applications, vocal singing sounds or intelligible words at a desired pitch or with desired vocal effects, e.g. by phoneme synthesis
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Machine Translation (AREA)
- Stereophonic System (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】情報処理装置100において、条件判定部26は情報処理に関する所定の条件の成否を判定し、変更決定部28は条件判定部での判断の結果、所定の条件が成立した場合に発音文字列を変更し、音声合成部34は変更後の発音文字列を発音した合成音声の音響信号Vを生成する。
【選択図】図3
Description
図1は、本発明の第1実施形態に係る情報処理装置100の構成図である。第1実施形態の情報処理装置100は、合成音声を表す音響信号Vを生成する信号処理装置であり、制御装置10と記憶装置12と表示装置14と入力装置16と放音装置18とを具備するコンピュータシステムで実現される。例えば携帯電話機やスマートフォン等の可搬型の端末装置またはパーソナルコンピュータ等の可搬型または据置型の端末装置が、情報処理装置100として利用され得る。第1実施形態の情報処理装置100は、特定の楽曲(以下「対象楽曲」という)を歌唱した音声の音響信号Vを生成する。なお、情報処理装置100は、単体の装置として実現されるほか、相互に別体で構成された複数の装置の集合(すなわちコンピュータシステム)でも実現される。
本発明の第2実施形態を説明する。なお、以下に例示する各形態において作用や機能が第1実施形態と同様である要素については、第1実施形態の説明で使用した符号を流用して各々の詳細な説明を適宜に省略する。
図7は、第3実施形態における発音文字列Wの変更の説明図である。図7に例示される通り、第3実施形態では、特定条件が成立した場合に、音声合成データDの発音文字列Wのうち特定の文字列(以下「対象文字列」という)を、置換候補として事前に選定された他の文字列(以下「置換文字列」という)に変更する。具体的には、第3実施形態の変更規則データCでは、図7に例示される通り、発音文字列W内の「つうじょう/[tsM][M][dZo][M]」という対象文字列に対して「とくべつ/[to][kM][be][tsM]」という置換文字列が登録される。
図9は、第4実施形態における発音文字列Wの変更の説明図である。図9に例示される通り、第4実施形態では、特定条件が成立した場合に、音声合成データDの発音文字列Wのうち特定の対象文字列を、当該発音文字列Wに含まれる他の文字列(置換文字列)に置換する。具体的には、対象楽曲が複数節(1番/2番)で構成される場合を想定すると、発音文字列Wのうち対象楽曲の第1節の対象文字列が、当該対象楽曲の第2節の置換文字列に変更される。例えば、対象楽曲の第1節に含まれる「いちばん/[i][tSi][ba][N\]」という対象文字列は、当該対象楽曲の第2節に含まれる「にーばん/[Ji][-][ba][N\]」という置換文字列に変更される。
以上の各形態は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様は適宜に併合され得る。
Claims (7)
- コンピュータが、
情報処理に関する所定の条件の成否を判定し、
前記所定の条件が成立した場合に発音文字列を変更し、
前記変更後の発音文字列を発音した合成音声の音響信号を生成する
音声合成方法。 - 前記所定の条件が成立した場合に、前記変更後の発音文字列を発音した合成音声の音響信号を生成する一方、前記所定の条件が成立しない場合には、当該変更前の発音文字列を発音した合成音声の音響信号を生成する
請求項1の音声合成方法。 - 前記合成音声の音響信号の生成に並行して、前記所定の条件が成立した場合に発音文字列を変更する
請求項1または請求項2の音声合成方法。 - コンピュータが、
情報処理に関する所定の条件が成立した場合に決定される変更内容に応じて発音文字列を変更し、
前記変更後の発音文字列を発音した合成音声の音響信号を生成する
音声合成方法。 - コンピュータが、
情報処理に関する所定の条件の成否を判定し、
前記所定の条件が成立した場合に発音文字列の変更内容を決定し、
前記発音文字列を変更するとともに当該変更後の発音文字列を発音した合成音声の音響信号を生成する合成処理部に対して前記変更内容を指示する
音声合成制御方法。 - 情報処理に関する所定の条件が成立した場合に決定される変更内容に応じて発音文字列を変更する合成管理部と、
前記変更後の発音文字列を発音した合成音声の音響信号を生成する音声合成部と
を具備する音声合成装置。 - 情報処理に関する所定の条件の成否を判定する条件判定部と、
前記所定の条件が成立した場合に発音文字列の変更内容を決定し、前記発音文字列を変更するとともに当該変更後の発音文字列を発音した合成音声の音響信号を生成する合成処理部に対して前記変更内容を指示する変更決定部と
を具備する音声合成制御装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015247189A JP6784022B2 (ja) | 2015-12-18 | 2015-12-18 | 音声合成方法、音声合成制御方法、音声合成装置、音声合成制御装置およびプログラム |
US15/381,201 US10204617B2 (en) | 2015-12-18 | 2016-12-16 | Voice synthesis method and voice synthesis device |
CN201611180346.XA CN106898345A (zh) | 2015-12-18 | 2016-12-19 | 语音合成方法及语音合成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015247189A JP6784022B2 (ja) | 2015-12-18 | 2015-12-18 | 音声合成方法、音声合成制御方法、音声合成装置、音声合成制御装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017111372A true JP2017111372A (ja) | 2017-06-22 |
JP6784022B2 JP6784022B2 (ja) | 2020-11-11 |
Family
ID=59066678
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015247189A Active JP6784022B2 (ja) | 2015-12-18 | 2015-12-18 | 音声合成方法、音声合成制御方法、音声合成装置、音声合成制御装置およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10204617B2 (ja) |
JP (1) | JP6784022B2 (ja) |
CN (1) | CN106898345A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019066648A (ja) * | 2017-09-29 | 2019-04-25 | ヤマハ株式会社 | 歌唱音声の編集支援方法、および歌唱音声の編集支援装置 |
JP2020181141A (ja) * | 2019-04-26 | 2020-11-05 | ヤマハ株式会社 | 歌詞入力方法およびプログラム |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6897101B2 (ja) * | 2017-01-06 | 2021-06-30 | ヤマハ株式会社 | 楽譜処理システム、楽譜処理方法および楽譜処理プログラム |
US10449440B2 (en) | 2017-06-30 | 2019-10-22 | Electronic Arts Inc. | Interactive voice-controlled companion application for a video game |
US10621317B1 (en) | 2017-09-14 | 2020-04-14 | Electronic Arts Inc. | Audio-based device authentication system |
CN109036375B (zh) | 2018-07-25 | 2023-03-24 | 腾讯科技(深圳)有限公司 | 语音合成方法、模型训练方法、装置和计算机设备 |
US10926173B2 (en) * | 2019-06-10 | 2021-02-23 | Electronic Arts Inc. | Custom voice control of video game character |
CN111667811B (zh) * | 2020-06-15 | 2021-09-07 | 北京百度网讯科技有限公司 | 语音合成方法、装置、设备和介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000350870A (ja) * | 1999-06-11 | 2000-12-19 | Takara Co Ltd | 多質音声発生玩具 |
JP2004077645A (ja) * | 2002-08-13 | 2004-03-11 | Sony Computer Entertainment Inc | 歌詞生成装置および歌詞生成機能を実現させるためのプログラム |
JP2013195982A (ja) * | 2012-03-23 | 2013-09-30 | Yamaha Corp | 歌唱合成装置および歌唱合成プログラム |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1032391C (zh) * | 1994-04-01 | 1996-07-24 | 清华大学 | 基于波形编辑的汉语文字-语音转换方法及系统 |
JP2000153061A (ja) * | 1998-11-19 | 2000-06-06 | Nintendo Co Ltd | ビデオゲーム装置およびビデオゲーム用情報記憶媒体 |
JP2001009157A (ja) * | 1999-06-30 | 2001-01-16 | Konami Co Ltd | ビデオゲームの制御方法、ビデオゲーム装置、並びにビデオゲームのプログラムを記録したコンピュータ読み取り可能な媒体 |
JP2002062889A (ja) * | 2000-08-14 | 2002-02-28 | Pioneer Electronic Corp | 音声合成方法 |
JP2004226741A (ja) * | 2003-01-23 | 2004-08-12 | Nissan Motor Co Ltd | 情報提供装置 |
CN101046956A (zh) * | 2006-03-28 | 2007-10-03 | 国际商业机器公司 | 交互式音效产生方法及系统 |
CN102479506A (zh) * | 2010-11-23 | 2012-05-30 | 盛乐信息技术(上海)有限公司 | 用于网络游戏的语音合成系统及其实现方法 |
US8745683B1 (en) * | 2011-01-03 | 2014-06-03 | Intellectual Ventures Fund 79 Llc | Methods, devices, and mediums associated with supplementary audio information |
JP6070010B2 (ja) * | 2011-11-04 | 2017-02-01 | ヤマハ株式会社 | 音楽データ表示装置および音楽データ表示方法 |
JP6127371B2 (ja) | 2012-03-28 | 2017-05-17 | ヤマハ株式会社 | 音声合成装置および音声合成方法 |
KR101193362B1 (ko) * | 2012-04-13 | 2012-10-19 | 최병기 | 문자열을 발음 단위로 분할하는 방법, 이를 이용하는 문자열의 어조 표현 방법 및 문자열의 어조를 표현하는 동영상 데이터가 저장된 저장매체 |
JP5817854B2 (ja) * | 2013-02-22 | 2015-11-18 | ヤマハ株式会社 | 音声合成装置およびプログラム |
JP6243618B2 (ja) * | 2013-04-02 | 2017-12-06 | 株式会社三共 | 遊技機 |
-
2015
- 2015-12-18 JP JP2015247189A patent/JP6784022B2/ja active Active
-
2016
- 2016-12-16 US US15/381,201 patent/US10204617B2/en active Active
- 2016-12-19 CN CN201611180346.XA patent/CN106898345A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000350870A (ja) * | 1999-06-11 | 2000-12-19 | Takara Co Ltd | 多質音声発生玩具 |
JP2004077645A (ja) * | 2002-08-13 | 2004-03-11 | Sony Computer Entertainment Inc | 歌詞生成装置および歌詞生成機能を実現させるためのプログラム |
JP2013195982A (ja) * | 2012-03-23 | 2013-09-30 | Yamaha Corp | 歌唱合成装置および歌唱合成プログラム |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019066648A (ja) * | 2017-09-29 | 2019-04-25 | ヤマハ株式会社 | 歌唱音声の編集支援方法、および歌唱音声の編集支援装置 |
JP7000782B2 (ja) | 2017-09-29 | 2022-01-19 | ヤマハ株式会社 | 歌唱音声の編集支援方法、および歌唱音声の編集支援装置 |
JP2020181141A (ja) * | 2019-04-26 | 2020-11-05 | ヤマハ株式会社 | 歌詞入力方法およびプログラム |
JP7243418B2 (ja) | 2019-04-26 | 2023-03-22 | ヤマハ株式会社 | 歌詞入力方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
US10204617B2 (en) | 2019-02-12 |
CN106898345A (zh) | 2017-06-27 |
JP6784022B2 (ja) | 2020-11-11 |
US20170178622A1 (en) | 2017-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6784022B2 (ja) | 音声合成方法、音声合成制御方法、音声合成装置、音声合成制御装置およびプログラム | |
JP5293460B2 (ja) | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 | |
JP6004358B1 (ja) | 音声合成装置および音声合成方法 | |
JP5949607B2 (ja) | 音声合成装置 | |
JP2008164932A (ja) | 音楽編集装置および方法、並びに、プログラム | |
JP6665446B2 (ja) | 情報処理装置、プログラム及び音声合成方法 | |
JP6729539B2 (ja) | 音声合成方法、音声合成システムおよびプログラム | |
US9711123B2 (en) | Voice synthesis device, voice synthesis method, and recording medium having a voice synthesis program recorded thereon | |
JP2019066649A (ja) | 歌唱音声の編集支援方法、および歌唱音声の編集支援装置 | |
CN107430849A (zh) | 声音控制装置、声音控制方法和声音控制程序 | |
JP6737320B2 (ja) | 音響処理方法、音響処理システムおよびプログラム | |
WO2015060340A1 (ja) | 歌唱音声の合成 | |
JP2019168542A (ja) | 情報処理方法および情報処理装置 | |
JP2013164609A (ja) | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 | |
JP2014098802A (ja) | 音声合成装置 | |
JP2017097332A (ja) | 音声合成装置および音声合成方法 | |
JP5157922B2 (ja) | 音声合成装置、およびプログラム | |
JP5106437B2 (ja) | カラオケ装置及びその制御方法並びにその制御プログラム | |
JP7124870B2 (ja) | 情報処理方法、情報処理装置およびプログラム | |
JP2023013684A (ja) | 歌唱声質変換プログラム及び歌唱声質変換装置 | |
JP2007225916A (ja) | オーサリング装置、オーサリング方法およびプログラム | |
JP6372066B2 (ja) | 合成情報管理装置および音声合成装置 | |
JP2009244790A (ja) | 歌唱指導機能を備えるカラオケシステム | |
WO2019239972A1 (ja) | 情報処理方法、情報処理装置およびプログラム | |
JP2024054052A (ja) | 音響モデルの訓練方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181025 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190906 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190917 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191115 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200414 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200603 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200923 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201006 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6784022 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313532 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |