DE3246712C2 - - Google Patents
Info
- Publication number
- DE3246712C2 DE3246712C2 DE3246712A DE3246712A DE3246712C2 DE 3246712 C2 DE3246712 C2 DE 3246712C2 DE 3246712 A DE3246712 A DE 3246712A DE 3246712 A DE3246712 A DE 3246712A DE 3246712 C2 DE3246712 C2 DE 3246712C2
- Authority
- DE
- Germany
- Prior art keywords
- phonemic
- section
- data
- interpolation
- sections
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 claims abstract description 54
- 238000004458 analytical method Methods 0.000 claims abstract description 10
- 238000005498 polishing Methods 0.000 claims 1
- 230000007704 transition Effects 0.000 abstract description 8
- 230000015572 biosynthetic process Effects 0.000 abstract description 2
- 238000003786 synthesis reaction Methods 0.000 abstract 1
- 238000005070 sampling Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 7
- 230000008859 change Effects 0.000 description 3
- 238000007792 addition Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephone Function (AREA)
- Electrophonic Musical Instruments (AREA)
Description
Die Erfindung betrifft ein Verfahren zur Analyse und
anschließenden Zusammensetzung einer Stimme,
bei welchem zur Analyse der Stimme aus einem Rohstimmen-
Signal repräsentative phonemische Teilstücke extrahiert,
die phonemischen Teilstücke zur Bildung von phonemischen
Teilstück-Daten abgetastet und entsprechende phonemische
Teilstück-Daten in einem Speicher abgespeichert werden
und zur Zusammensetzung der Stimme die abgespeicherten
phonemischen Teilstück-Daten aus dem Speicher ausgelesen,
daraus phonemische Teilstücke gebildet und die
phonemischen Teilstücke sequentiell verbunden werden, um
das gewünschte Stimmensignal zu erhalten.
Ein solches Verfahren ist aus der US-PS 35 88 353 bekannt.
Bei diesem bekannten Verfahren werden zur Analyse
der Stimme die aus einem Rohstimmen-Signal extrahierten,
repräsentativen, phonemischen Teilstücke zur Bildung von
phonemischen Teilstück-Daten abgetastet. Anschließend
werden die phonemischen Teilstück-Daten in einem Speicher
abgespeichert. Zur Zusammensetzung der Stimme werden
die abgespeicherten phonemischen Teilstück-Daten aus
dem Speicher ausgelesen, daraus phonemische Teilstücke
gebildet und die phonemischen Teilstücke sequentiell
miteinander verbunden, um das gewünschte Stimmensignal
zu erhalten. Zur Vermeidung von unerwünschten Geräuschen
und zur Erzielung eines weichen Überganges zwischen den
miteinander verbundenen phonemischen Teilstücken werden
die Frequenzkomponenten der aneinander angrenzenden
Abschnitte zweier benachbarter phonemischer Teilstücke
so verändert und aneinander angepaßt, daß sie im Verbindungsbereich
der beiden phonemischen Teilstücke gleich
oder zumindest annähernd gleich sind. Eine derartige
Beeinflussung der Frequenzkomponenten erfordert jedoch
einen hohen Aufwand an Hardware und Software und verändert
die erzeugte Stimme in unnatürlicher Weise.
Ein ähnliches Verfahren ist aus der US-PS 38 92 919
bekannt. Bei diesem bekannten Verfahren werden die Wellenlänge
und Wellenform jedes phonemischen Teilstückes
bzw. Sprachsegmentes einzeln gesteuert, damit die synthetisch
erzeugte Stimme weicher klingt. Dieses Verfahren
weist im wesentlichen die gleichen Nachteile wie das
zuvor beschriebene Verfahren auf.
Die DE-OS 14 72 004 betrifft ein Verfahren zur Aufbereitung
von gespeicherten Sprachsignalen. Bei diesem Verfahren
werden von einem gegebenen Sprachsignal begrenzter
Dauer die aufeinanderfolgenden Grundton-Perioden und
deren Zeitdauer sowie die Signalamplitude zwischen positiver
und negativer Spitze bestimmt. Die Grundton-Perioden
werden auf eine gewünschte Dauer verkürzt. Um die
Kurvenform der erzeugten synthetischen Stimme stetig und
glatt werden zu lassen, werden die Amplituden-Differenzen
zwischen dem Anfang und dem Ende benachbarter, verkürzter
Grundton-Perioden bestimmt und ein Übergangssignal
am Ende einer verkürzten Grundton-Periode addiert
oder subtrahiert, um die Amplitude durch Erhöhung oder
Verminderung an die Anfangs-Amplitude der folgenden,
verkürzten Grundton-Periode anzugleichen. Auch dieses
Verfahren erfordert einen hohen schaltungstechnischen
Aufwand und verändert die Stimme in unerwünschter Weise.
Demgegenüber ist es Aufgabe der vorliegenden Erfindung,
ein Verfahren zur Analyse und Zusammensetzung einer
Stimme zu schaffen, bei welchem die erzeugte Stimme
nicht nur glatte Übergänge, sondern auch die natürliche
Stimmenlage aufweist, wobei die Speicherkapazität zum
Speichern der Stimmendaten geringgehalten werden kann.
Diese Aufgabe wird mit den Verfahren gemäß den Ansprüchen
1 bis 10 gelöst.
Ein erstes gemeinsames Prinzip der erfindungsgemäßen Verfahren
besteht darin, ein durch Interpolation gewonnenes
phonemisches Interplations-Teilstück zwischen zwei
phonemische Teilstücke einzufügen und dabei die Anzahl
der Daten der phonemischen Teilstücke konstant zu halten.
Dabei wird die phonemische Teilstück-Datenfolge
einer zwei phonemische Teilstücke und das dazwischen
liegende phonemische Interpolations-Teilstück enthaltenden
phonemischen Teilstück-Gruppe durch Interpolation
der phonemischen Teilstück-Daten des vorangegangenen und
des nachfolgenden phonemischen Teilstückes gewonnen.
Dieses genannte erste Prinzip trägt dazu bei, daß
die zusammengesetzte Stimme nicht nur glatt, sondern
auch natürlich klingt.
Das zweite gemeinsame Prinzip der erfindungsgemäßen
Verfahren besteht darin, die Differenz zwischen den
Abtastdaten, die den benachbarten phonemischen Teilstücken
entsprechen, aus der phonemischen Teilstück-Datenfolge
zu ermitteln und anschließend die Anfangsdaten des
phonemischen Teilstückes der phonemischen Teilstück-
Datenfolge und die Differenz der phonemischen Teilstück-
Datenfolge in dem Speicher zu speichern. Demzufolge kann
die Kapazität des Speichers zur Speicherung der phonemischen
Teilstück-Daten klein gehalten werden.
Nachfolgend werden bevorzugte Ausführungen der erfindungsgemäßen
Verfahren anhand der beiliegenden Zeichnungen
näher erläutert. Es zeigt:
Fig. 1 einen Teil des Kurvenverlaufs bei
Anwendung der Verfahren zur Analyse
und anschließenden Zusammensetzung
einer Stimme;
Fig. 2 (a), (b), (c) Kurvenverläufe zur Darstellung der
Interpolation phonemischer Teilstücke;
Fig. 3 (a), (b), (c) Kurvenverläufe bei Anwendung der
erfindungsgemäßen Verfahren;
Fig. 4 ein Blockschaltbild einer Vorrichtung
zur Durchführung der Verfahren
zur Analyse und anschließenden
Zusammensetzung einer Stimme;
und
Fig. 5 ein Flußdiagramm zur Erläuterung
der Arbeitsweise der Verfahren.
In Fig. 1 ist ein Teil eines nach einem Verfahren zur
Analyse und anschließenden Zusammensetzung einer Stimme
zusammengesetzten Stimmen-Signalverlaufes dargestellt.
Das in Fig. 1 dargestellte Signal ist ein Stimmensignal,
das sich aus der dreifachen Wiederholung des phonemischen
Teilstückes PHA, der Verbindung mit einem phonemischen
Teilstück PHB und zweifacher Wiederholer des
Teilstückes PHB zusammensetzt.
Da der Signalverlauf und die Abtastperioden der phonemischen
Teilstücke an den Verbindungspunkten abrupt wechseln,
wird ein durch Interpolation gewonnenes phonemisches
Interpolations-Teilstück zwischen zwei phonemische
Teilstücke eingefügt, um ein geglättetes Stimmensignal
zu erhalten.
Dazu wird der i-te Datenwert PHI(i) des phonemischen
Interpolations-Teilstückes PHI, des vorangegangenen
phonemischen Teilstückes PHA und des nachfolgenden phonemischen
Teilstückes PHB mittels der nachfolgend angegebenen
Gleichung (1) abgeleitet, worin der i-te Datenwert
des vorangegangenen phonemischen Teilstückes PHA
der durch Abtasten
des Stimmensignals mit vorgegebener Abtastperiode
gewonnenen phonemischen Teilstück-Datengruppe
als PHA (i) angenommen wird (mit i=1, 2, . . ., NA,
worin NA die Datenzahl des PHA ist), der i-te Datenwert
des nachfolgenden phonemischen Teilstückes PHB
als PHB (i) angenommen wird (mit i=1, 2, . . ., NB,
worin NB die Datenzahl des PHB ist):
PHI (i)=f {PHA (i), PHB i)} (1)
In der Gleichung (1) bedeutet f (A, B) die Interpolations-
Funktion der beiden phonemischen Teilstück-Daten
A, B.
Die Interpolation der beiden phonemischen Teilstück-
Daten wird vorzugsweise mittels linearer Interpolation
durchgeführt. Nimmt man an, daß die Anzahl der zwischen
zwei phonemische Teilstücke einzufügenden phonemischen
Interpolation-Teilstücke M beträgt, so erhält man
den i-ten Datenwert PHI (i, j) des j-ten Interpolations-
Teilstückes mittels der nachstehenden Gleichung (2)
Da man den Datenwert PHB (i) des nachfolgenden phonemischen
Teilstückes durch die Bedingung j=M+1 gemäß Gleichung
(2) erhält, kann der Wert PHB als phonemisches
Interpolations-Teilstück in weitem Sinne bezeichnet
werden. Der in der nachstehenden Gleichung (3) definierte
Wert M′ wird als "Interpolations-Wiederholungszahl"
bezeichnet. Die Gleichung (4) kann aus der Gleichung
(2) abgeleitet werden, wenn der Wert für M′ eingesetzt
wird.
M′=M+1 (3)
worin j=1, 2, . . ., M′ bedeutet.
Bei Anwendung des bekannten Verfahrens treten jedoch
Schwierigkeiten bei der Berechnung der phonemischen
Teilstück-Daten des phonemischen Interpolations-Teils
gemäß Gleichung (1) oder Gleichung (2) auf, da aufgrund von
möglicherweise unterschiedlichen Abtastperioden der jeweiligen
phonemischen Teilstücke die Anzahl der Daten NA des
phonemischen Teilstückes PH unterschiedlich gegenüber
dem Wert der Datenzahl NB des phonemischen Teilstückes
PHB sein kann. In einem derartigen Fall werden die Daten
des phonemischen Interpolations-Teilstückes dadurch
gewonnen, daß die Datenzahl der beiden phonemischen
Teilstücke gleichgemacht wird, indem der letzte Datenwert
oder Null den phonemischen Teilstück-Daten hinzuaddiert
wird, die eine geringere Datenzahl aufweisen.
Um ein glattes, natürliches Stimmensignal zu erhalten,
muß dann die Abtastperiode leicht variiert werden. Demzufolge
wird die Datenzahl NI des phonemischen Interpolations-
Teilstückes gemäß der nachstehenden in Gleichung (5) dargestellten
Interpolation aus der Datenzahl NA des vorangegangenen
phonemischen Teilstückes PHA und der Datenzahl
(NB) des nachfolgenden phonemischen Teilstückes
PHB gewonnen werden.
NI=INT g {(NA, NB)} (5)
worin g (NA, NB) die Interpolationsfunktions-Funktion
der beiden Datenzahlen NA, NB und das Zeichen INT (x)
die Funktion zur Bildung ganzer Zahlen x bedeutet.
Die Anzahl der Daten des phonemischen Interpolations-
Teilstückes ist so bemessen, daß sie eine lineare Interpolation
ermöglicht. Bedeutet N die Anzahl der
zwischen zwei phonemische Teilstücke einzufügenden
phonemischen Interpolations-Teilstücke, so ist die
Datenzahl NI(j) des j-ten phonemischen Interpolations-
Teilstückes durch die nachstehende Gleichung (6) gegeben.
worin j=1, 2, . . ., M+1 bedeutet.
Demzufolge kann die jeweilige Abtastperiode durch Abgabe
der in oben beschriebener Weise erhaltenen phonemischen
Teilstück-Daten durch die Anzahl der durch
Interpolation erhaltenen Daten leicht variiert werden,
um die verbleibenden Daten wegzuschneiden.
Jedoch hat es sich gezeigt, daß infolge des Wegschneidens
der verbleibenden Daten des phonemischen Interpolations-
Teilstückes unerwünschte Geräusche verursacht
wurden.
In Fig. 2 (b) ist ein phonemisches Interpolations-
Teilstück PHI dargestellt, das aus den in Fig. 2 (a)
bzw. 2 (c) dargestellten phonemischen Teilstücken PHA
und PHB gewonnen wird.
Bei dem in Fig. 2 dargestellten phonemischen Interpolations-
Teilstück PHI handelt es sich um ein in den Mittelabschnitt
des phonemischen Teilstückes PHA und des
phonemischen Teilstückes PHB einzufügendes phonemisches
Teilstück. Sowohl der Datenwert als auch die Datenzahl
des phonemischen Interpolations-Teilstückes werden
mittels linearer Interpolation gewonnen.
Sofern der letzte Datenwert des phonemischen Interpolations-
Teilstückes gemäß Fig. 2 (b) nicht Null ist,
wird ein unerwünschter Geräuschklang verursacht.
In Fig. 2 ist mit τ die Taktperiode beim Abtasten
der Daten, mit i die Anzahl abgetasteter Daten, mit
t die Zeit und mit NA und NB die jeweilige Datenzahl
der phonemischen Teilstücke PHA und PHB bezeichnet.
Bei dem erfindungsgemäßen Verfahren
wird nun zuerst die Anzahl
der Daten an die vorgegebene Anzahl N der Daten
hinsichtlich der phonemischen Teilstück-Daten der phonemischen
Teilstücke zur Interpolation zwischen zwei
phonemischen Teilstücken angeglichen.
Um die Anzahl der Daten der phonemischen Teilstücke
mit unterschiedlichen Teilungsperioden anzugleichen,
ist ein Abtastverfahren erforderlich, bei dem die Taktperiode
zum Abtasten der phonemischen Teilstücke in
der Weise variiert wird, daß die Anzahl der Daten der
phonemischen Teilstücke konstant wird.
Da es jedoch äußerst
schwierig ist, die Abtast-Taktperiode der
phonemischen Teilstücke in Übereinstimmung mit der
Teilungsperiode zu variieren, wird die Interpolation
oder Dezimierung der Daten in der Weise durchgeführt,
wie es in dem Aufsatz "Interpolation And Decimation
of Digital Signals a Tutorial Review", von R. E.
Crochiere und L. R. Rabiner auf den Seiten 300 bis
331 der 69. Ausgabe, Nr. 3 vom März 1981 der Zeitschrift
"Proceedings Of The IEEE" detailliert beschrieben
wird, nachdem die phonemischen Teilstücke
in einer vorgegebenen Abtast-Taktperiode abgetastet
wurden. Die Anzahl der Daten wird anschließend reduziert
oder erhöht, um die vorgegebene Datenzahl zu
erreichen.
Die Interpolation wird gemäß Gleichung (1) oder gemäß
Gleichung (2) mit dem i-ten Datenwert PHA (i) (i=1,
2, . . ., N) des vorangegangenen phonemischen Teilstückes
PHA der phonemischen Teilstück-Daten mit konstanter
Datenzahl und mit dem i-ten Datenwert PHB (i) (i=1,
2, . . ., N) des nachfolgenden phonemischen Teilstückes
PHB durchgeführt, wodurch der i-te Datenwert PHI (i)
(i=1, 2, . . ., N) des phonemischen Interpolations-
Teilstückes PHI erzeugt wird.
Demnach ist die Anzahl
der Daten des zu interpolierenden phonemischen Teilstückes
konstant. Dadurch ist es
nicht erforderlich, einen End-Datenwert
oder einen Null-Datenwert künstlich an die phonemischen
Teilstück-Daten mit einer geringeren Datenzahl
anzuhängen.
Die phonemischen Teilstück-Daten des in der zuvor beschriebenen
Weise gewonnenen interpolierten Teilstückes PHI werden in die phonemischen Teilstück-
Daten des zu interpolierenden phonemischen Teilstückes
eingefügt, um eine phonemische Teilstück-Datenfolge
einer phonemischen Teilstückgruppe PHA, PHI, PHB einschließlich des
interpolierten phonemischen Teilstückes PHI zu erzeugen.
Um das gewünschte Stimmensignal zusammenzusetzen,
kann die phonemische Teilstück-Datenreihe einer phonemischen
Teilstück-Gruppe einschließlich des phonemischen
Interpolations-Teilstückes durch Interpolation
der phonemischen Teilstückdaten des vorangegangen
phonemischen Teilstückes
und den des nachfolgenden phonemischen Teilstückes
gewonnen werden. Die oben beschriebene Interpolation
wird dabei im voraus durchgeführt. Die Differenz der
Datenwerte gleicher Anzahl der benachbarten phonemischen
Teilstück-Daten der phonemischen Teilstück-Datenfolge
einer phonemischen Teilstück-Gruppe einschließlich
der interpolierten phonemischen Teilstücke wird
anschließend ermittelt, um die phonemische Teilstück-Datenfolgen-
Differenz zu erhalten. Speichert man diese
Folge in einem Speicher, so kann die phonemische Teilstück-Datenfolge
der phonemischen Teilstück-Gruppe PHA, PHI, PHB
einschließlich der interpolierten phonemischen Teilstücke
PHI durch Addition lediglich während der Stimmenzusammensetzung
erhalten werden. Auf diese Weise kann das
Verfahren zur Ermittlung der phonemischen Teilstück-
Datenfolge während der Stimmenzusammensetzung vereinfacht
werden.
Die Differenz der phonemischen Teilstück-Daten ΔPH
(i, j) zwischen (j-1) phonemischen Teilstück-
Daten und den j-ten phonemischen Teilstück-Daten wird
durch Gleichung (7) vorgeschrieben, in der der i-te
Datenwert der j-ten phonemischen Teilstück-Daten
(wobei j=0 eine zusätzliche Ziffer zu den phonemischen
Teilstück-Daten hinzufügt, die sequentiell
von Null aus ansteigen und wobei damit die
phonemischen Anfangs-Teilstück-Daten bezeichnet sind) der phonemischen
Teilstück-Datenfolge der phonemischen Teilstück-Gruppe
einschließlich der interpolierten phonemischen
Teils PH (i, j) beträgt.
ΔPH (i, j)=PH (i, j)-PH (i, j-1) (7)
worin i=1, 2, . . ., N bedeutet.
In diesem Zusammenhang ist festzuhalten, daß sich der
Differenzwert gemäß dem vorliegenden Verfahren hinsichtlich
der Art und Weise zur Ermittlung der Differenz
von dem Differenzwert gemäß dem DPCM-Verfahren
unterscheidet.
Bei dem DPCM-Verfahren wird die Differenz zwischen
benachbarten Abtastdaten genommen, während gemäß dem
vorliegenden Verfahren die Differenz zwischen den
Abtastdaten, die den benachbarten phonemischen Teilstücken
entsprechen, ermittelt wird, was der Gleichung
(7) zu entnehmen ist.
Anschließend werden die Anfangsdaten des phonemischen
Teilstückes der phonemischen Teilstück-Datenfolge und
die Differenz der phonemischen Teilstück-Datenfolge
in dem Speicher gespeichert.
Die nachstehende Gleichung (8) ist aus der vorstehenden
Gleichung (7) abgeleitet.
Um die phonemische Teilstück-Datenfolge einer phonemischen
Teilstück-Gruppe einschließlich der interpolierten
phonemischen Teilstücke bei der Zusammensetzung
der Stimmensignale aus der Gleichung (8) abzuleiten,
muß die Differenz der aus dem Speicher ausgelesenen
phonemischen Teilstück-Daten sequentiell den
Anfangsdaten der aus dem Speicher ausgelesenen phonemischen
Teilstück-Datenfolge hinzugefügt werden.
Die Übernahme des Interpolationverfahrens in die Differenz-
Daten des phonemischen Teilstückes ist mit den
folgenden Vorteilen verbunden:
Da die Datenfolge phonemischer Teilstücke einer phonemischen
Teilgruppe einschließlich der interpolierten
phonemischen Teile nur während der Addition beim
Zusammensetzen der Stimmensignale vorgesehen ist, kann
das erfindungsgemäße Verfahren mittels eines einfachen
Steuerschaltkreises, wie beispielsweise einem universellen
Mikrocomputer realisiert werden. Die natürliche
Stimme kann mittels eines derart einfachen Schaltungsaufbaus
zusammengesetzt werden.
Um die Daten des phonemischen Teils des interpolierten
phonemischen Teils mittels linearer Interpolation zu
erhalten, ist in Gleichung (9) der i-te Differenz-
Datenwert ΔPHI (i, j) der j-ten phonemischen Interpolations-
Teilstücke PHI zwischen zwei phonemischen Teilstücken
PHA und PHB angegeben:
worin PHA (i) der i-te Datenwert des vorangegangenen
phonemischen Teilstückes PHA des zu interpolierenden
phonemischen Teilstückes ist und die Anzahl der zwischen
die phonemischen Teilstücke einzufügenden interpolierten
phonemischen Teilstücke M beträgt und j=1, 2, . . .,
M+1 ist.
Bei der linearen Interpolation wird der Wert der Daten-
Differenz des phonemischen Teilstückes zwischen
zwei zu interpolierenden phonemischen Teilstücken PHA, PHB
konstant, wie der Gleichung (9) zu entnehmen ist. In
dem Speicher werden ein Wert, der um 1 gegenüber der
Anzahl der zwischen die zu interpolierenden phonemischen
Teilstücke erhöht wurde, die Anfangsdaten des zu
interpolierenden phonemischen Teilstückes und eine Daten-
Differenz des phonemischen Teilstückes, das durch Division
gewonnen wird, gespeichert. Zusätzlich wird ein
Wert, in dem 1 der Anzahl der interpolierten phonemischen
Teile hinzugefügt wird, die Differnz der Datenwerte
gleicher Anzahl der zu interpolierenden phonemischen
Teilstück-Daten des vorangegangenen phonemischen
Teils und des nachfolgenden phonemischen Teils in dem
Speicher gespeichert.
Um die phonemische Teilstück-Datenfolge einer phonemischen
Teilstück-Gruppe einschließlich des phonemischen
Interpolation-Teilstückes bei der Zusammensetzung
des gewünschten Stimmensignals, wie beispielsweise
PHI, zu erhalten, werden die phonemischen Teilstück-
Anfangsdaten PHA (i) der seriell aus einem Speicher
ausgelesenen phonemischen Teilstück-Daten
wiederholt der Differenz der phonemischen Teilstück-
Daten ΔPHI, die ebenfalls aus dem Speicher ausgelesen
werden, hinzuaddiert, wobei die Anzahl der Additionen
gleich der Summe einer Ziffer m des aus dem Speicher
ausgelesenen phonemischen Interpolations-Teilstückes
plus 1 ist.
Da das phonemische Anfangsteilstück einer phonemischen
Teilstück-Gruppe als phonemische Teilstück-Daten gemäß
der allgemeinen Interpolationsmethode mittels der phonemischen
Teilstück-Differenzdaten gespeichert ist,
erfordern die phonemischen Teilstück-Differenzdaten
einen Wert, bei dem die Anzahl der interpolierten phonemischen
Teilstücke der Anzahl der zu interpolierenden
phonemischen Teilstücke hinzugefügt wurde, d. h.
eine Anzahl, bei der 1 von der Anzahl der phonemischen
Teilstücke eines phonemischen Teilstückes abgezogen
wurde. Bei der linearen Interpolationsmethode erfordern
die phonemischen Teilstück-Differenzdaten lediglich
eine der um 1 von der Anzahl der zu interpolierenden
phonemischen Teilstücke verminderte Anzahl.
Auf diese Weise reicht selbst eine kleine Speicherkapazität
zur Speicherung der phonemischen Teilstück-
Differenzdaten aus.
Ebenso wird der weiche Übergang bzw. die glatte Veränderung
der Periodenteilung des zusammengesetzten
Stimmensignals durch den weichen Übergang der Taktperiode
erzielt, wenn die phonemische Teilstück-Datenfolge
einer phonemischen Teilgruppe einschließlich
der interpolierten phonemischen Teile abgegeben
wird. Dies soll nachstehend näher erläutert werden.
Bezeichnet man die Taktperiode des vorangegangenen
phonemischen Teilstückes PHA des zu interpolierenden
Teilstückes mit τA und die des nachfolgenden phonemischen
Teilstückes PHB mit τB, so errechnet sich die
Taktperiode τI des Interpolationsteils aus der nachstehenden
Gleichung (10):
τI=h ( τA, τB), (10)
in der h ( τA, τB) eine Interpolationsfunktion der beiden
Taktperioden τA und τB ist.
Nimmt man an, daß M die Anzahl der zwischen zwei phonemischen
Teilstücken einzufügenden phonemischen Interpolationsteile
ist, wobei die Taktperiode des phonemischen
Interpolationsteiles durch lineare Interpolation
ermittelt wird, so ergibt sich die Taktperiode
τ₁ (i) eines j-ten phonemischen Interpolationsteils
durch die nachstehende Gleichung (11).
in der j=1, 2, . . ., M+1 ist.
Danach wird die Taktperiode des interpolierten phonemischen
Teils in die Taktperiode des zu interpolierenden
phonemischen Teils eingesetzt, um die Taktperiodenfolge
einer phonemischen Teilstück-Gruppe einschließlich
der interpolierten phonemischen Teilstücke zu erhalten.
Bei der Abgabe der Stimmensignale werden die Taktperioden
der einzelnen phonemischen Teilstück-Gruppen einschließlich
der interpolierten phonemischen Teilstücke
aneinandergereiht, wobei die Interpolation der Taktperioden,
wie oben beschrieben, durchgeführt wird. Die
Anwendung des Verfahrens mit einer Differenz-Taktperiode
ermöglicht es, die Ableitung der Taktperiodenfolgen
während des Stimmen-Ausgabebetriebes zu verringern.
Dabei ist die Differenz-Taktperiodenfolge durch die
Vorgabe der Differenz benachbarter Taktperioden der
Taktperiodenfolgen der phonemischen Teilstück-Gruppen
einschließlich der interpolierten phonemischen Teilstücke,
wie oben beschrieben, gegeben.
Anschließend werden die Anfangs-Taktperiode der Taktperiodenfolgen
und die Differenz-Taktperiodenfolgen
in dem Speicher gespeichert.
Um die Taktperiodenfolgen der phonemischen Teilstück-
Gruppen einschließlich der interpolierten phonemischen
Teilstücke bei der Zusammensetzung des Stimmensignals
zu rekonstruieren, muß die aus dem Speicher
ausgelesene Differenz-Taktperiode sequentiell der Anfangs-
Taktperiode der aus dem Speicher ausgelesenen
Taktperiodenfolgen hinzuaddiert werden.
Durch die Anwendung der Interpolationsmethode mittels
der Differenz-Taktperiode können die Taktperiodefolgen
der phonemischen Teilstück-Gruppen einschließlich
der interpolierten phonemischen Teilstücke auf
einfache Weise durch Addition gewonnen werden, was
das Verfahren zur Erlangung der Taktperiodenfolgen
während der phonemischen Zusammensetzung wesentlich
vereinfacht.
Da die Differenz-Taktperiode zwischen zwei zu interpolierenden
phonemischen Teilstücken konstant wird,
wenn die Taktperiode durch lineare Interpolation erhalten
wird, kann ein Wert, bei dem 1 zu der Zahl
der zwischen den zu interpolierenden phonemischen
Teilstücken einzusetzenden interpolierten phonemischen
Teilstücke hinzuaddiert wurde und eine durch
Division durch einen Wert, bei dem 1 zu der Anzahl
der interpolierten phonemischen Teilstücke hinzugefügt
wurde, erhaltene Differenz-Taktperiode aus der
Differenz der Taktperiode τI des phonemischen Anfangs-
Teilstückes der zu interpolierenden phonemischen
Teilstücke, der Taktperiode τA des vorangegangenen phonemischen
Teilstückes der zu interpolierenden phonemischen
Teilstücke und der Taktperiode τB des nachfolgenden
phonemischen Teilstückes in dem Speicher gespeichert
werden.
Um die Taktperiodenfolgen der phonemischen Teilgruppe
einschließlich der phonemischen Interpolation-Teilstücke
bei der Zusammensetzung des gewünschten Stimmensignals
zu erhalten, muß die Ziffer des Wertes,
bei dem 1 der Anzahl der aus dem Speicher ausgelesenen
phonemischen Interpolations-Teilstücke hinzuaddiert
wurde und die aus dem Speicher ausgelesene Differenz-
Taktperiode der Taktperiode des phonemischen Anfangsteils
der aus dem Speicher ausgelesenen, zu interpolierenden
phonemischen Teilstücke hinzuaddiert werden.
Aufgrund der linearen Interpolation der phonemischen
Teilstück-Differenzdaten kann die Speicherkapazität
bei der linearen Interpolation der Differenz-Taktperiode
kleiner gehalten werden als es vergleichsweise
bei allgemeiner Interpolation erforderlich wäre.
Da darüber hinaus ein weicher Übergang der Taktperiode
gegeben ist, ist der dynamische Anteil beim Differenz-
Taktperiodenwert kleiner im Vergleich zum Taktperiodenwert.
Des weiteren kann die Speicherkapazität auch
deshalb kleiner ausgelegt werden, weil die Anzahl der
digitalen Bits kleiner gehalten werden kann.
Außerdem wird die Anzahl der
gegebenen Daten der phonemischen Teilstücke für jede
der phonemischen Teilstück-Gruppen variiert, um die
phonemischen Teilstück-Daten zu komprimieren.
Nachstehend soll ein Fall betrachtet werden, bei dem
eine natürliche Stimme, deren Stimmfrequenz
in einem Bereich von 200 bis
400 Hz schwankt, mit einer Frequenz von 10 KHz abgetastet
wird.
Für diesen Fall ergeben sich 50 Daten für ein phonemisches
Teilstück bei einer Stimmfrequenz von 200 Hz
und 25 Daten bei einer Stimm- bzw. Tonhöhenfrequenz
von 400 Hz.
Anschließend wird gemäß der vorliegenden Erfindung
die Anzahl der Daten der phonemischen Teilstücke in
die Anzahl der vorgegebenen Daten, nämlich 40 im vorliegenden
Fall, umgewandelt.
Demzufolge beträgt die Taktfrequenz bei Abgabe des
200 Hz-phonemischen Teilstückes 200×40=8000 Hz,
d. h. 8 KHz. Analog beträgt die Taktfrequenz bei Abgabe
des 400 Hz-Teilstückes 16 KHz.
Wird die Datenabtastung mit einer Frequenz von 10 KHz
gemäß dem vorgenannten Abtast-Theorem durchgeführt,
so verursacht die 5 KHz-Komponente verfälschte Signale.
Aus diesem Grunde wird ein Tiefpaßfilter zur
Eliminierung dieser Frequenzanteile verwendet.
Wird daher die Taktfrequenz im Abgabebetrieb auf 16 KHz
erhöht, so tritt auch dort die Frequenzkomponente
im Bereich von 5 bis 8 KHz im phonemischen Abgabe-
Teilstück nicht auf. Eine Anwendung höherer Taktfrequenzen
im Abgabebetrieb bringt daher keine Vorteile mit sich.
Die Wiedergabe der phonemischen Teilstücke mit einer
400 Hz-Abstandsfrequenz und einer Datenzahl 40 sowie
einer Taktfrequenz von 16 KHz ist äquivalent zur
Wiedergabe desselben phonemischen Teilstückes mit
einer Datenzahl 25 und einer Taktfrequenz von 10 KHz.
Demzufolge muß das phonemische Teilstück mit einer
Abstands- oder Teilungsfrequenz von 200 Hz mit einer
Datenzahl 40 und einer Taktfrequenz von 8 KHz wiedergegeben
werden. In gleicher Weise muß das 400 Hz-
phonemische Teilstück mit einer Datenzahl 25 und einer
Taktfrequenz von 10 KHz abgegeben werden.
Im Falle des Auftretens eines phonemischen Teilstückes
mit einer großen Teilungsfrequenz kann die Datenzahl
des betreffenden phonemischen Teilstückes kleiner gewählt
werden, um die Datenzahl des betreffenden phonemischen
Teilstückes zu reduzieren, so daß die Taktfrequenz
im Abgabebetrieb kleiner gehalten werden kann.
Wie oben beschrieben wurde, kann die Anzahl der Daten
der phonemischen Teilstücke durch die phonemische
Teilstück-Gruppe variiert werden, um die Speicherkapazität
zur Speicherung der phonemischen Teilstück-
Daten kleiner zu halten. In gleicher Weise kann die
Taktfrequenz während des Stimmenabgabebetriebes kleiner
gehalten werden, um die erforderliche Verarbeitungszeit
bis zur nächsten Aufgabe zu verlängern.
In Fig. 3 (b) ist ein phonemisches Interpolationsteil
PHI dargestellt, das durch Interpolation des in
Fig. 3 (a) dargestellten phonemischen Teilstückes
PHA und des in Fig. 3 (c) dargestellten phonemischen
Teilstückes PHB nach dem erfindungsgemäßen Verfahren
gewonnen wurde.
Die Darstellung gemäß Fig. 3 entspricht weitestgehend
der Darstellung gemäß Fig. 2 und die Kurvenverläufe
in Fig. 3 (a) und 3 (c) sind die gleichen wie die
Kurvenverläufe gemäß Fig. 2 (a) und 2 (c), sie weisen
jedoch unterschiedliche Abtast-Taktperioden auf.
In Fig. 3 stellt das phonemische Interpolations-Teilstück
PHI ein phonemisches Teil dar, das in die Mitte
zwischen die phonemischen Teilstücke PHA und PHB einzufügen
ist. Die jeweiligen Datenwerte des phonemischen
Interpolationsstückes und die Abtast-Taktperiode
werden durch lineare Interpolation ermittelt.
Wie aus der Darstellung gemäß Fig. 3 (b) deutlich
wird, wird der abrupte Wechsel bzw. Abbruch
des Kurvenverlaufes am Ende
im Vergleich zu dem in Fig. (2) dargestellten
Signalverlauf vermieden.
Aus diesem Grunde werden keinerlei Störgeräusche
erzeugt, woraus sich
eine natürliche, mit weichen Übergängen versehene
Stimme ergibt.
In Fig. 3 bezeichnen τA, τI, τB die den betreffenden
phonemischen Teilstücken PHA, PHI und PHB zugeordneten
Taktperioden, während i die jeweilige Abtast-
Datenzahl und N die Anzahl der betreffenden Daten
wiedergibt. Bei der oben beschriebenen Darstellung
ist lediglich die Interpolationsmethode
näher erläutert worden. Selbstverständlich kann
das gewünschte Stimmensignal auch durch eine Kombination
mit und ohne Interpolation phonemischer Teilstücke
gemäß dem erfindungsgemäßen Verfahren und gemäß
bekannter Verfahren und einer anschließenden
Verbindung beider Teile erzeugt werden.
In Fig. 4 ein Blockschaltbild einer
Vorrichtung zur Realisierung des erfindungsgemäßen
Verfahrens dargestellt.
In Fig. 4 ist mit der Bezugsziffer 1 eine Betriebsanzeige-
und Eingabeeinheit bezeichnet, in die die Bedienungsperson
eine Stimme und Betriebsweise eingibt.
Mit der Bezugsziffer 2 ist eine Steuer- und Regeleinheit
wie beispielsweise ein universeller Mikrocomputer
o. dgl. bezeichnet. Mit der Bezugsziffer 3 ist ein
Lesespeicher (ROM) zum Speichern eines Stimmen-Erzeugungsprogramms,
phonemischer Teilstück-Daten u. dgl.
versehen. Mit der Bezugsziffer 4 ist ein Speicher mit
wahlfreiem Zugriff (RAM) zum vorübergehenden Speichern
von Daten zur Durchführung des Programms o. dgl., bezeichnet.
Die Bezugsziffer 5 bezeichnet einen Digital-
Analog-Wandler zum Umwandeln der digitalen Signale
in analoge Signale. Schließlich ist mit der Bezugsziffer
6 ein Verstärker und mit der Bezugsziffer 7
ein Lautsprecher bezeichnet.
Die Funktionsweise der Vorrichtung
soll nachstehend mit Bezug auf die Fig. 4
näher erläutert werden.
Die in dem Nur-Lesespeicher 3 gespeicherten phonemischen
Teilstück-Daten werden sequentiell verarbeitet
und miteinander verbunden, während der RAM-Speicher 4
als vorübergehender Datenspeicher unter Steuerung
einer 2 verwendet wird, die von dem in dem Lesespeicher
3 gespeicherten Stimmenerzeugungsprogramm
in Abhängigkeit von dem von der Betriebsabgabeeinheit
2 abgegebenen Betriebsangabesignal gesteuert wird, so
daß resultierend die digitalen Signale der gewünschten
Stimme zusammengesetzt werden.
Anschließend werden die digitalen Signale in analoge
Signale mittels des D/A-Wandlers 5 umgewandelt. Die
nicht erforderlichen hohen Frequenzsignale werden mittels
des Tiefpaßfilters ausgefiltert. Danach wird das
Stimmensignal mittels des Verstärkers 6 verstärkt. Das
gewünschte Stimmensignal wird schließlich von dem
Lautsprecher 7 in der gewünschten Weise abgegeben.
In Fig. 5 ist ein Flußdiagramm zur Darstellung eines
Beispiels der Zusammensetzung des durch Interpolation
nach dem erfindungsgemäßen
Verfahren in der dargestellten
Vorrichtung gewonnenen Stimmensignals dargestellt.
Dieses Flußdiagramm gilt für den Fall, die Daten
sowohl des phonemischen Interpolationsstückes als
auch die Taktperiode durch lineare Interpolation ermittelt
werden.
Wie oben beschrieben wurde, kann die weiche, natürliche
Stimme aus den Kurvenverläufen des phonemischen
Teilstückes und der Interpolation des Teilungsabstands
zusammengesetzt werden. Dabei wird das durch
Interpolation ersetzte phonemische Teilstück durch die
Interpolation überflüssig. Demzufolge kann die Kapazität
des Speichers zur Speicherung der phonemischen
Teilstück-Daten klein gehalten werden. Da
das erfindungsgemäße Verfahren
mit einem einfachen Steuerschaltkreis, wie beispielsweise
einem universellen Mikrocomputer, realisiert
werden kann, kann die
Vorrichtung in einfacher Weise aufgebaut werden, die
sich durch eine höhere Stimmenqualität und durch einen
billigen Aufbau auszeichnet. Darüber hinaus kann der
verwendete Mikrocomputer auch für andere Aufgaben verwendet
werden, z. B. zur zusätzlichen Steuerung elektrischer
Haushaltsgeräte, Bürogeräte, Terminal, Lernmittelvorrichtungen,
Spiele, Spielzeug o. dgl., wobei
nicht nur die Stimmenabgabefunktionen sondern auch die
sonstigen Steuerfunktionen des verwendeten Mikrocomputers
verwendet werden können.
Vorstehend wurde ein Verfahren zur Analyse und anschließenden Zusammensetzung
einer Stimme beschrieben, bei dem die Anzahl der Abtastungen
der phonemischen Teilstück-Daten in eine
gewünschte Anzahl umgewandelt wird, um Geräuschprobleme
zu beseitigen. Diese Geräuschprobleme können
bei einer Zusammensetzung der Stimmanteile unter Anwendung
von Interpolationen auftreten.
Nach der Umwandlung der Abtastungen
werden die Differenz-Daten des phonemischen Teilstückes
aus den entsprechenden Datenwerten gleicher
Anzahl der phonemischen Teilstück-Daten des vorangegangenen
phonemischen Teilstückes und des nachfolgenden
phonemischen Teilstückes zwischen zwei zu interpolierenden
phonemischen Teilstücken, die sich aus
der Anzahl der Abtastungen derselben phonemischen Teilstückdaten
zusammensetzen, ermittelt. Alternativ können
die Taktdifferenz-Daten der abzugebenden Taktwerte
des vorangegangenen phonemischen Teilstückes
und des nachfolgenden phonemischen Teilstückes ermittelt
werden. An diesen Schritt schließt sich eine Speicherung
der phonemischen Differenz-Daten oder der
Taktdifferenz-Daten in einem Speicher und eine anschließende
Interpolations-Zusammensetzung unter Verwendung
der in dem Speicher gespeicherten phonemischen
Teilstück-Differenz-Daten oder der Taktdifferenzdaten
an. Dieses Verfahren gewährleistet eine weiche
Stimmenzusammensetzung, die frei von durch Interpolation
verursachte Geräusche ist, indem die Interpolation
zwischen den phonemischen Teilstücken durchgeführt
wird, die mit gleicher Häufigkeit abgetastet
werden. Die Zusammensetzung der Stimme kann in einfacher
Weise unter Verwendung eines Mikrocomputers durchgeführt
werden, da die Interpolationszusammensetzung
unter Anwendung der Differenz-Daten durchgeführt wird
und die Durchführungszeit geringer ist.
Claims (10)
1. Verfahren zur Analyse und anschließenden Zusammen
setzung einer Stimme,
bei welchem zur Analyse der Stimme aus einem Rohstimmen-
Signal repräsentative phonemische Teilstücke extrahiert,
die phonemischen Teilstücke zur Bildung von phonemischen
Teilstück-Daten abgetastet und entsprechend phonemische
Teilstück-Daten in einem Speicher abgespeichert werden
und zur Zusammensetzung der Stimme die abgespeicherten
phonemischen Teilstück-Daten aus dem Speicher ausgele
sen, daraus phonemische Teilstücke gebildet und die
phonemischen Teilstücke sequentiell verbunden werden, um
das gewünschte Stimmensignal zu erhalten,
dadurch gekennzeichnet, daß
zur Analyse der Stimme
- (a) die Anzahl der phonemischen Teilstück-Daten der phonemischen Teilstücke gleich einer vorgegebenen Anzahl der phonemischen Teilstück-Daten eines pho nemischen Teilstückes zur Interpolation zwischen zwei phonemischen Teilstücken gehalten wird, indem die Zahl der Abtastungen der phonemischen Teilstücke gleich der vorgegebenen Anzahl der phonemischen Teilstück-Daten ist,
- (b) phonemische Teilstück-Daten eines phonemischen In terpolations-Teilstückes durch Interpolation aus der gleichen Anzahl der phonemischen Teilstück- Daten des dem zu interpolierenden phonemischen Teilstück vorangegangenen phonemischen Teilstückes und des nachfolgenden phonemischen Teilstückes erzeugt werden,
- (c) eine phonemische Teilstück-Datenfolge einer zwei phonemische Teilstücke und das dazwischenliegende phonemische Interpolations-Teilstück enthaltenden pho nemischen Teilstückgruppe durch Einsetzen der phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes in die phonemischen Teil stück-Daten der zu interpolierenden phonemischen Teilstück-Daten erhalten wird,
- (d) eine phonemische Teilstück-Differenz-Datenfolge aus der Differenz derselben Anzahl der benachbarten phonemischen Teilstück-Daten der phonemischen Teilstück-Datenfolge abgeleitet wird und
- (e) die Anfangsdaten der phonemischen Teilstück-Daten folge und die phonemische Teilstück- Differenz-Datenfolge in einem Speicher gespeichert werden und zur Zusammensetzung der Stimme
- (f) die aus dem Speicher ausgelesenen phonemischen Teilstück-Differenz-Daten schrittweise den phonemischen Teilstück-Anfangsdaten der aus dem Speicher ausgele senen phonemischen Teilstück-Datenfolge hinzugefügt werden, so daß die phonemischen Teilstück-Datenfolgen der phonemischen Teilstück-Gruppe erhalten werden,
- (g) die Interpolation mit der Taktperiode des vorange gangenen phonemischen Teilstückes des zu interpolieren den phonemischen Teilstückes und der Taktperiode des nachfolgenden phonemischen Teilstückes durchgeführt wird, so daß die Taktperiode für das phonemische Interpolations-Teil stück erzeugt wird,
- (h) die Taktperiode des phonemischen Interpolations- Teilstückes in die Taktperiode des zu interpolieren den phonemischen Teilstückes eingesetzt wird, damit die Taktperioden-Folge der phonemischen Teilstück-Gruppen abgeleitet wird und
- (i) mittels der Taktperiodenfolge die phonemische Teilstück-Datenfolge der phonemischen Teilstück-Gruppe abgegeben und das geglättete Stimmensignal durch Einfügen des durch Inter polation erhaltenen phonemischen Interpolations-Teil stückes zwischen die phonemischen Teilstücke erzeugt wird.
2. Verfahren
nach dem Oberbegriff von Anspruch 1,
dadurch gekennzeichnet, daß
zur Analyse der Stimme
- (a) die Anzahl der phonemischen Teilstück-Daten der phonemischen Teilstücke gleich einer vorgegebenen Anzahl der phonemischen Teilstück-Daten eines phonemischen Teil stückes zur Interpolation zwischen zwei phonemischen Teilstücken gehalten wird, indem die Zahl der Abtastungen der phonemischen Teilstücke gleich der vorgegebenen Anzahl der phonemischen Teilstück-Daten ist, und
- (b) in einem Speicher ein Wert gespeichert wird, bei dem der Anzahl der phonemischen Teilstück-Daten des zwischen zwei zu interpolieren de phonemische Teilstücke einzusetzenden phonemi schen Interpolations-Teilstücks 1 hinzuaddiert wird, sowie die phonemischen Teilstück-Anfangsdaten des zu interpolierenden phonemischen Teilstückes und durch Division erhaltene phonemische Teilstück-Differenz daten gespeichert werden, wobei ein Wert, bei dem 1 der Anzahl der phonemischen Interpolations-Teilstücke hinzugefügt wurde und wobei die Differenz derselben Anzahl der phonemischen Teilstück-Daten dem zu interpolierend phonemischen Teilstück vorangegangenen phonemischen Teilstückes und des nachfolgenden phonemischen Teilstückes erzeugt wird, wobei die phonemischen Teilstück-Daten des zwischen die zu interpolierenden phonemischen Teilstücke ein zufügenden phonemischen Interpolations-Teilstückes durch lineare Interpolation erzeugt werden, und zur Zusammensetzung der Stimme
- (c) die aus dem Speicher ausgelesenen phonemischen Teilstück-Differenzdaten sequentiell den Anfangsdaten der aus dem Speicher ausgelesenen phonemischen Teil stück-Daten hinzuaddiert werden, wobei die Anzahl der Werte um 1 größer als die Anzahl der aus dem Speicher ausgelesenen phonemischen Interpolations-Teilstücke ist, so daß die phonemische Teilstück-Datenfolge der zwei phonemische Teilstücke und das dazwischenliegende phonemische Inerpolations-Teilstück enthaltenden phonemischen Teilstück-Gruppe erhalten wird,
- (d) die Interpolation mit der Taktperiode des vorange gangenen phonemischen Teilstückes der zu interpolieren den phonemischen Teilstücke und der Taktperiode des nachfolgend phonemischen Teilstückes durchgeführt wird, so daß die Taktperiode für die phonemischen Interpolations teilstücke erzeugt wird,
- (e) die Taktperiode des phonemischen Interpolations- Teilstückes in die Taktperiode des zu interpolieren den phonemischen Teilstückes eingesetzt wird, damit die Taktperiode-Folge der phonemischen Teilstück-Gruppen abgeleitet wird und
- (f) mittels der Taktperioden-Folge die phonemische Teilstück-Datenfolge der phonemischen Teilstück-Gruppe abgegeben und das geglättete Stimmensignal durch Einfügen des durch Inter polation erhaltenen phonemischen Interpolatiopns-Teil stückes zwischen die phonemischen Teilstücke erzeugt wird.
3. Verfahren
nach dem Oberbegriff von Anspruch 1,
dadurch gekennzeichnet, daß
zur Analyse der Stimme
- (a) die Anzahl der phonemischen Teilstück-Daten der phonemischen Teilstücke gleich einer vorgegebenen Anzahl der phonemischen Teilstück-Daten eines phonemischen Teilstückes zur Interpolation zwischen zwei phonemischen Teil stücken gehalten wird, indem die Zahl der Abtastungen der phonemischen Teilstücke gleich der vorgegebenen Anzahl der phonemischen Teilstück-Daten ist,
- (b) die Daten des phonemischen Interpolations-Teil stückes durch Interpolation aus der gleichen Anzahl der phonemischen Teilstück-Daten des dem zu unterpolierenden phonemischen Teilstück voran gegangenen phonemischen Teilstückes und des nachfol genden phonemischen Teilstückes erzeugt werden,
- (c) die phonemischen Teilstück-Daten der phonemischen Interpolations-Teilstücke in die phonemischen Teilstück-Daten der zu interpolierenden phonemischen Teilstücke eingesetzt werden, um phonemische Teilstück- Datenfolgen der zwei phonemische Teilstücke und das dazwischenliegende phonemische Interpolations-Teilstück enthaltenden phonemischen Teilstück-Gruppe zu erhalten,
- (d) die Interpolation mit der phonemischen Teilstück- Taktperiode des vorangegangenen phonemischen Teil stückes der zu interpolierenden phonemischen Teil stücke und der Taktperiode des betreffenden phonemischen Teilstückes zur Erzeugung der Taktperiode des phonemischen Interpolations-Teilstücks durchgeführt wird,
- (e) die Taktperiode des phonemischen Interpolations- Teilstückes in die Taktperiode des zu interpolieren den phonemischen Teilstückes eingesetzt wird, damit die Taktperiodenfolge der phonemischen Teilstück- Gruppen einschließlich der phonemischen Teilstücke abgeleitet wird,
- (f) die Differenz benachbarter Taktperioden der Takt periodenfolge ermittelt wird, um die Differenz-Takt periodenfolge zu erhalten und
- (g) die Anfangs-Taktperiode der Taktperiodenfolge und die Differenz-Taktperiodenfolge in einem Speicher ge speichert werden, und zur Zusammensetzung der Stimme
- (h) die aus dem Speicher ausgelesene Differenz-Takt periode sequentiell zur Anfangs-Taktperiode der eben falls aus dem Speicher ausgelesenen Taktperiodenfolge hinzuaddiert wird, um die Taktperiodenfolge der pho nemischen Teilstück-Gruppe zu erhalten, und
- (i) die phonemische Teilstück-Datenfolge der phonemischen Teilstück-Gruppe bei der Abgabe der phone mischen Teilstück-Daten durch sequentielle Verbindung der phonemischen Teilstück-Daten abgegeben und ein weiches Stimmensignal durch Einfügen des durch Inerpolation gewonnenen phonemischen Inter polations-Teilstückes zwischen zwei phonemische Teil stücke erzeugt wird.
4. Verfahren nach dem Oberbegriff von Anspruch 1
dadurch gekennzeichnet, daß
zur Analyse der Stimme
- (a) die Anzahl der phonemischen Teilstück-Daten der phonemischen Teilstücke gleich einer vorgegebenen Anzahl der phonemischen Teilstück-Daten eines phonemischen Teilstückes zur Interpolation zwischen zwei phonemischen Teilstücken gehalten wird, indem die Zahl der Abtastungen der phonemischen Teilstücke gleich der vorgegebenen Anzahl der phonemischen Teilstück- Daten ist,
- (b) eine Interpolation mit derselben Anzahl der phonemischen Teilstück-Daten des dem zu interpolierenden pho nemischen Teilstück vorangegangenen phonemischen Teilstückes und des nachfolgenden phonemi schen Teilstückes zur Erzeugung der phonemischen Teil stückdaten des phonemischen Interpolations-Teilstückes durchgeführt wird,
- (c) die phonemischen Teilstück-Daten des phonemischen Interpolationsteilstückes in die phonemischen Teil stück-Daten der zu interpolierenden phonemischen Teil stücke zur Gewinnung der phonemischen Teilstück-Daten folge der zwei phonemische Teilstücke und das dazwischenliegende phonemische Interpolations-Teilstück enthaltenden phonemischen Teilstück-Gruppe eingesetzt werden und
- (d) in einem Speicher sowohl ein Wert, der um 1 gegen über der Anzahl der zwischen die zu interpolierenden Teilstücke einzufügenden phonemischen Interpolations- Teilstücke erhöht wird, als auch die Taktperiode der phonemischen Anfangs-Teilstücke der zu interpolierenden phonemischen Teilstücke und eine Differenz-Takt periode gespeichert werden, wobei die Differenz-Takt periode durch Division mit einem Wert, der um 1 gegen über der Anzahl der phonemischen Interpolations-Teil stücke erhöht wurde, gewonnen wird, und die Differenz zwischen der Taktperiode des vorangegangenen phonemischen Teilstückes der zu interpolierenden phonemischen Teilstücke und der Taktperiode des nachfolgenden pho nemischen Teilstückes ermittelt wird, wobei die Takt periode des phonemischen Interpolations-Teilstückes durch lineare Interpolation zusammengesetzt wird, und zur Zusammensetzung der Stimme
- (e) die aus dem Speicher ausgelesene Differenz-Takt periode sequentiell der Taktperiode des phonemischen Anfangs-Teilstückes der aus dem Speicher mit einer Ziffer ausgelesenen, zu interpolierenden phonemischen Teilstücke, deren Wert um eins gegenüber der Ziffer der aus dem Speicher ausgelesenen phonemischen Inter polations-Teilstücke erhöht wurde, hinzuaddiert wird, woraus die Taktperiodenfolge der phonemischen Teil stück-Gruppe ermittelt wird und
- (f) mittels der Taktperiodenfolge die phonemische Teilstück-Datenfolge der phonemischen Teilstück-Gruppe abgegeben und das geglättete Stimmensignal durch Einfügen des durch Inter polation erhaltenen phonemischen Interpolations-Teil stückes zwischen die phonemischen Teilstücke erzeugt wird.
5. Verfahren nach dem Oberbegriff von Anspruch 1
dadurch gekenzeichnet, daß
zur Analyse der Stimme
- (a) die Anzahl der phonemischen Teilstück-Daten der phonemischen Teilstücke gleich einer vorgegebenen Anzahl der phonemischen Teilstück-Daten eines phonemischen Teilstückes zur Interpolation zwischen zwei phonemischen Teil stücken gehalten wird, indem die Zahl der Abtastungen der phonemischen Teilstücke gleich der vorgegebenen Anzahl der phonemischen Teilstück-Daten ist,
- (b) die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes durch Interpolation aus der gleichen Anzahl der phonemischen Teilstück-Daten des phonemischen Teil stückes des dem zu interpolierenden phonemischen Teilstück vorangegangenen phonemischen Teilstückes und des nachfolgenden phonemischen Teilstückes erzeugt wird,
- (c) die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes in die phonemischen Teil stück-Daten des phonemischen Teilstücks eingesetzt werden, bei denen die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes zu inter polieren sind, um die phonemische Teilstück-Daten reihe der zwei phonemische Teilstücke und das dazwischenliegende phonemische Interpolations-Teilstück enthaltenden phonemischen Teilstück-Gruppe einschließlich der phonemischen Interpolations-Teilstücke zu erhalten,
- (d) die Differenz der Datenwerte gleicher Ziffer be nachbarter phonemischer Teilstück-Daten der phonemischen Teilstück-Datenfolge ermittelt wird,
- (e) die Anfangsdaten der phonemischen Teilstück-Daten folge und die phonemische Teilstück-Diffe renz-Datenfolge in einem Speicher gespeichert werden,
- (f) die Interpolation mit der Taktperiode des phonemischen Anfangs-Teilstückes der zu interpolierenden phonemischen Teilstücke und der Taktperiode des nach folgenden phonemischen Teilstückes durchgeführt wird, so daß die Taktperiode des phonemischen Interpolations- Teilstückes erzeugt wird,
- (g) die Taktperiode des phonemischen Interpolations- Teilstückes in die Taktperiode des zu interpolierenden phonemischen Teilstückes eingesetzt wird, damit die Taktperiodenfolge der phonemischen Teilstück-Gruppen abgeleitet wird,
- (h) die Differenz der benachbarten Taktperioden der Taktperiodenfolge für die Differenz-Taktperiodenfolge ermittelt wird, und
- (i) die Anfangs-Taktperiode der Taktperiodenfolge und die Differenz-Taktperiodenfolge in einem Speicher ge speichert werden, und zur Zusammensetzung der Stimme
- (j) die aus dem Speicher ausgelesenen phonemischen Teil stück-Differenz-Daten sequentiell den phonemischen Teil stück-Anfangsdaten der aus dem Speicher ausgelesenen phonemischen Teilstück-Datenfolge hinzugefügt werden, so daß die phonemischen Teilstück-Datenfolgen der pho nemischen Teilstück-Gruppe gewonnen werden,
- (k) die aus dem Speicher ausgelesene Differenz-Takt periode sequentiell zur Anfangs-Taktperiode der eben falls aus dem Speicher ausgelesenen Taktperiodenfolge hinzuaddiert wird, um die Taktperiodenreihe der pho nemischen Teilstück-Gruppe zu erhalten, und
- (l) mittels der Taktperiodenfolge die phonemische Teilstück-Datenfolge der phonemischen Teilstück-Gruppe bei der Abgabe der phonemischen Teilstück-Daten durch sequentielle Verbindung der phonemischen Teil stück-Daten abgegeben und ein weiches Stimmensignal durch Einfügen des durch Interpo lation gewonnenen phonemischen Interpolations-Teil stückes zwischen zwei phonemischen Teilstücke erzeugt wird.
6. Verfahren nach dem Oberbegriff von Anspruch 1,
dadurch gekennzeichnet, daß
zur Analyse der Stimme
- (a) die Anzahl der phonemischen Teilstück-Daten der phonemischen Teilstücke gleich einer vorgegebenen Anzahl der phonemischen Teilstück-Daten eines phonemischen Teilstückes zur Interpolation zwischen zwei phonemischen Teil stücken gehalten wird, indem die Zahkl der Abtastungen der phonemischen Teilstücke gleich der vorgegebenen Anzahl der phonemischen Teilstück-Daten ist,
- (b) die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes durch Interpolation aus der gleichen Anzahl der phonemischen Teilstück-Daten des phonemischen Teil stückes des dem zu interpolierenden phonemischen Teilstück vorangegangenen phonemischen Teilstückes und des nachfolgenden phonemischen Teilstückes erzeugt wird,
- (c) die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes in die phonemischen Teil stück-Daten des phonemischen Teilstückes eingesetzt werden, bei denen die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes zu inter polieren sind, um die phonemischen Teilstück-Daten folge der zwei phonemische Teilstücke und das dazwischenliegende phonemische Interpolations-Teilstück enthaltenden phonemischen Teilstück-Gruppe zu erhalten,
- (d) die Differenz der Datenwerte gleicher Ziffer be nachbarter phonemischer Teilstück-Daten der phonemi schen Teilstück-Datenreihe ermittelt wird, um die phonemische Teilstück-Differenz-Datenfolge zu erhalten,
- (e) die Anfangsdaten der phonemischen Teilstück-Daten folge und die phonemischen Teilstück-Diffe renz-Datenfolgen in einem Speicher gespeichert werden, und
- (f) in einem Speicher sowohl ein Wert, der um 1 größer als die Anzahl der zwischen die zu interpolierenden Teilstücke einzufügenden phonemischen Interpolations- Teilstücke ist, als auch die Taktperiode der phonemischen Anfangs-Teilstücke der zu interpolierenden phonemischen Teilstücke und eine Differenz-Takt periode gespeichert werden, wobei die Differenz-Takt periode durch Division mit einem Wert, der um 1 größer als die Anzahl der phonemischen Interpolation-Teil stücke ist, gewonnen wird und die Differenz zwischen der Taktperiode des vorangegangenen phonemischen Teilstückes der zu interpolierenden phonemischen Teilstücke und der Taktperiode des nachfolgenden pho nemischen Teilstückes ermittelt wird, wobei die Takt periode des phonemischen Interpolations-Teilstückes durch lineare Interpolation zusammengesetzt wird,
- (g) die aus dem Speicher ausgelesenen phonemischen Teil stück-Differenz-Daten sequentiell den phonemischen Teil stück-Anfangsdaten der aus dem Speicher ausgelesenen phonemischen Teilstück-Datenfolge hinzugefügt werden, so daß die phonemischen Teilstück-Datenfolgen der pho nemischen Teilstück-Gruppe gewonnen werden,
- (h) die aus dem Speicher ausgelesene Differenz-Takt periode sequentiell der Taktperiode des phonemischen Anfangs-Teilstückes der aus dem Speicher mit einer Ziffer ausgelesene, zu interpolierenden phonemischen Teilstücke, deren Wert um ein gegenüber der Ziffer der aus dem Speicher ausgelesenen phonemischen Inter polations-Teilstücke erhöht wurde, hinzuaddiert wird, woraus die Taktperiodenfolge der phonemischen Teil stück-Gruppe ermittelt wird und
- (i) mittels der Taktperiodenreihe die phonemische Teilstück-Datenreihe der phonemischen Teilstück-Gruppe abgegeben und das geglättete Stimmensignal durch Einfügen des durch Inter polation erhaltenen phonemischen Interpolations-Teil stückes zwischen die phonemischen Teilstücke erzeugt wird.
7. Verfahren nach dem Oberbegriff von Anspruch 1,
mit einer Variation einer vorgegebenen Anzahl der
phonemischen Teilstückdaten für jede der phonemischen
Teilstück-Gruppen,
dadurch gekennzeichnet, daß
- (a) die Anzahl der phonemischen Teilstück-Daten der phonemischen Teilstücke gleich einer vorgegebenen Anzahl der phonemischen Teilstück-Daten eines phonemischen Teilstückes zur Interpolation zwischen zwei phonemischen Teil stücken gehalten wird, indem die Zahl der Abtastungen der phonemischen Teilstücke gleich der vorgegebenen Anzahl der phonemischen Teilstück-Daten ist,
- (b) die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes durch Interpolation aus der gleichen Anzahl der phonemischen Teilstück-Daten des phonemischen Teil stückes des dem zu interpolierenden phonemischen Teilstück vorangegangenen phonemischen Teilstückes und des nachfolgenden phonemischen Teilstückes erzeugt wird,
- (c) die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes in die phonemischen Teil stück-Daten des phonemischen Teilstücks eingesetzt werden, bei denen die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes zu inter polieren sind, um die phonemische Teilstück-Daten folge der zwei phonemische Teilstücke und das dazwischen liegende phonemische Interpolations-Teilstück enthaltenden phonemischen Teilstück-Gruppe zu erhalten,
- (d) die Interpolation mit der Taktperiode des voran gegangenen phonemischen Teilstückes der zu interpo lierenden phonemischen Teilstücke und der Taktperiode des nachfolgenden phonemischen Teilstückes durchgeführt wird, so daß die Taktperiode des phonemischen Interpolations- Teilstückes erzeugt wird, und
- (e) die Taktperiode des phonemischen Interpolations- Teilstückes in die Taktperiode des zu interpolierenden phonemischen Teilstückes eingesetzt wird, damit die Taktperiodenreihe der phonemischen Teilstück-Gruppen abgeleitet wird,
- (f) und zur Zusammensetzung der Stimme mittels der Taktperiodenfolge die phonemische Teilstück-Datenfolge der phonemischen Teilstück-Gruppe bei der Abgabe der phonemischen Teilstück-Daten durch sequentielle Verbindung der phonemischen Teil stück-Daten abgegeben und ein weiches Stimmensignal durch Einfügen des durch Interpo lation gewonnenen phonemischen Interpolations-Teil stückes zwischen zwei phonemische Teilstücke erzeugt wird.
8. Verfahren nach dem Oberbegriff von Anspruch 1,
mit einer Variation der vorgegebenen Anzahl der
phonemischen Teilstückdaten für jede der phonemischen
Teilstück-Gruppen,
dadurch gekennzeichnet, daß
zur Analyse der Stimme
- (a) die Anzahl der phonemischen Teilstück-Daten der phonemischen Teilstücke gleich einer vorgegebenen Anzahl der phonemischen Teilstück-Daten eines phonemischen Teilstückes zur Interpolation zwischen zwei phonemischen Teil stücken gehalten wird, indem die Zahl der Abtastungen der phonemischen Teilstücke gleich der vorgegebenen Anzahl der phonemischen Teilstück-Daten ist,
- (b) die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes durch Interpolation aus der gleichen Anzahl der phonemischen Teilstück-Daten des phonemischen Teil stückes des dem zu interpolierenden phonemischen Teilstück vorangegangenen Teilstückes und des nachfolgenden phonemischen Teilstückes erzeugt wird,
- (c) die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes in die phonemischen Teil stück-Daten des phonemischen Teilstückes eingesetzt werden, bei denen die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes zu inter polieren sind, um die phonemischen Teilstück-Daten folge der phonemischen Teilstück-Gruppe einschließlich der phonemischen Interpolations-Teilstücke zu erhalten,
- (d) die Differenz der Datenwerte gleicher Ziffer be nachbarter phonemischer Teilstück-Daten der phonemischen Teilstück-Datenfolge ermittelt wird, und
- (e) die Anfangsdaten der phonemischen Teilstück-Daten folge und die phonemischen Teilstück-Diffe renz-Datenfolgen in einem Speicher gespeichert werden, und zur Zusammensetzung der Stimme,
- (f) die aus dem Speicher ausgelesenen phonemischen Teil stück-Differenz-Daten sequentiell den phonemischen Teil stück-Anfangsdaten der aus dem Speicher ausgelesenen phonemischen Teilstück-Datenfolge hinzugefügt werden, so daß die phonemischen Teilstück-Datenfolgen der zwei phonemische Teilstücke und das dazwischenliegende phonemische Interpolations-Teilstück enthaltenden pho nemischen Teilstück-Gruppe gewonnen werden,
- (g) die Interpolation mit der Taktperiode des voran gegangenen phonemischen Teilstückes der zu interpo lierenden phonemischen Teilstücke und der Taktperiode des nachfolgenden phonemischen Teilstückes durchgeführt wird, so daß die Taktperiode des phonemischen Interpolations- Teilstückes erzeugt wird,
- (h) die Taktperiode des phonemischen Interpolations- Teilstückes in die Taktperiode des zu interpolierenden phonemischen Teilstückes eingesetzt wird, damit die Taktperiodenreihe der phonemischen Teilstück-Gruppen abgeleitet wird,
- (i) mittels der Taktperiodenfolge die phonemische Teilstück-Datenfolge der phonemischen Teilstück-Gruppe bei der Abgabe der phonemischen Teilstück-Daten durch sequentielle Verbindung der phonemischen Teil stück-Daten abgegeben und ein weiches Stimmensignal durch Einfügen des durch Interpo lation gewonnenen phonemischen Interpolations-Teil stückes zwischen zwei phonemische Teilstücke erzeugt wird.
9. Verfahren nach dem Oberbegriff von Anspruch 1,
mit einer Variation der vorgegebenen Anzahl der
phonemischen Teilstückdaten für jede der phonemischen
Teilstück-Gruppen,
dadurch gekennzeichnet, daß
zur Analyse der Stimme,
- (a) die Anzahl der phonemischen Teilstück-Daten der phonemischen Teilstücke gleich einer Anzahl der phonemischen Teilstück-Daten eines vorgegebenen phonemischen Teilstückes zur Interpolation zwischen zwei phonemischen Teilstücken gehalten wird, indem die Zahl der Abtastungen der phonemischen Teilstücke gleich der vorgegebenen Anzahl der phonemischen Teilstück-Daten ist,
- (b) die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes durch Interpolation aus der gleichen Anzahl der phonemischen Teilstück-Daten des phonemischen Teil stückes des dem zu interpolierenden phonemischen Teilstück vorangegangenen phonemischen Teilstückes und des nachfolgenden phonemischen Teilstückes erzeugt wird,
- (c) die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes in die phonemischen Teil stück-Daten des phonemischen Teilstücks eingesetzt werden, bei denen die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes zu inter polieren sind, um die phonemische Teilstück-Daten folge der zwei phonemische Teilstücke und das dazwischenliegende phonemische Interpolations-Teilstück enthaltenden phonemischen Teilstück-Gruppe zu erhalten,
- (d) die Interpolation mit der Taktperiode des voran gegangenen phonemischen Teilstückes der zu interpo lierenden phonemischen Teilstücke und der Taktperiode des nachfolgenden phonemischen Teilstückes durchgeführt wird, so daß die Taktperiode des phonemischen Interpo lations-Teilstückes erzeugt wird,
- (e) die Taktperiode des phonemischen Interpolations Teilstückes in die Taktperiode des zu interpolierenden phonemischen Teilstückes eingesetzt wird, damit die Taktperiodenfolge der phonemischen Teilstück-Gruppen abgeleitet wird,
- (f) die Differenz benachbarter Taktperioden der Takt periodenfolge ermittelt wird, um die Differenz-Takt periodenfolge zu erhalten, und
- (g) die Anfangs-Taktperiode der Taktperiodenfolge und die Differenz-Taktperiodenfolge in einem Speicher ge speichert werden, und zur Zusammensetzung der Stimme
- (h) die aus dem Speicher ausgelesene Differenz-Takt periode sequentiell zur Anfngs-Taktperiode der eben falls aus dem Speicher ausgelesenen Taktperiodenfolge hinzuaddiert wird, um die Taktperiodenfolge der pho nemischen Teilstück-Gruppe zu erhalten, und
- (i) die phonemischen Teilstück-Datenfolge der phonemi schen Teilstück-Gruppe bei der Abgabe der phone mischen Teilstück-Daten durch sequentielle Verbindung der phonemischen Teilstück-Daten abgegeben und ein weiches Stimmensignal durch Einfügen des durch Interpolation gewonnenen phonemischen Inter polations-Teilstückes zwischen zwei phonemische Teil stücke erzeugt wird.
10. Verfahren nach dem Oberbegriff von Anspruch 1,
mit einer Variation der vorgegebenen Anzahl der
phonemischen Teilstück-Daten für jede der phonemischen
Teilstück-Gruppen,
dadurch gekennzeichnet, daß
- (a) die Anzahl der phonemischen Teilstück-Daten der phonemischen Teilstücke gleich einer vorgegebenen Anzahl der phonemischen Teilstück-Daten eines phonemischen Teilstückes zur Interpolation zwischen zwei phonemischen Teil stücken gehalten wird, indem die Zahl der Abtastungen der phonemischen Teilstücke gleich der vorgegebenen Azahl der phonemischen Teilstück-Daten ist
- (b) die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes bei der Interpolation aus der gleichen Anzahl der phonemischen Teilstück-Daten des phonemischen Teil stückes des dem zu interpolierenden phonemischen Teilstück vorangegangenen phonemischen Teilstückes, des und des nachfolgenden phonemischen Teilstückes erzeugt wird,
- (c) die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes in die phonemischen Teil stück-Daten des phonemischen Teilstücks eingesetzt werden, bei denen die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes zu inter polieren sind, um die phonemische Teilstück-Daten folge der zwei phonemische Teilstücke und des dazwischenliegende phonemische Interpolations-Teilstück enthaltenden phonemischen Teilstück-Gruppe zu erhalten,
- (d) die Differenz der Datenwerte gleicher Ziffer be nachbarter phonemischer Teilstück-Daten der phonemischen Teilstück-Datenfolge ermittelt wird,
- (e) die Anfangsdaten der phonemischen Teilstück-Daten folge und die phonemische Teilstück-Diffe renz-Datenfolgen in einem Speicher gespeichert werden,
- (f) die Interpolation mit der Taktperiode des voran gegangenen phonemischen Teilstückes der zu interpo lierenden phonemischen Teilstücke und der Taktperiode des nachfolgenden phonemischen Teilstückes durchgeführt wird, so daß die Taktperiode des phonemischen Interpo lations-Teilstückes erzeugt wird,
- (g) die Taktperiode des phonemischen Interpolations- Teilstückes in die Taktperiode des zu interpolieren den phonemischen Teilstückes eingesetzt wird, damit die Taktperiodenfolge der phonemischen Teilstück-Gruppen abgeleitet wird,
- (h) die Differenz benachbarter Taktperioden der Takt periodenfolge ermittelt wird, um die Differenz-Takt periodenfolge zu erhalten, und
- (i) die Anfangs-Taktperiode der Taktperiodenfolge und die Differenz-Taktperiodefolge in einem Speicher ge speichert werden, und zur Zusammensetzung der Stimme
- (j) die aus dem Speicher ausgelesenen phonemischen Teil stück-Differenz-Daten sequentiell den phonemischen Teil stück-Anfangsdaten der aus dem Speicher ausgelesenen phonemischen Teilstück-Datenfolge hinzugefügt werden, so daß die phonemischen Teilstück-Datenfolgen der pho nemischen Teilstück-Gruppe gewonnen werden,
- (k) die aus dem Speicher ausgelesene Differenz-Takt periode sequentiell zur Anfangs-Taktperiode der eben falls aus dem Speicher ausgelesenen Taktperiodenfolge hinzuaddiert wird, um die Taktperiodenfolge der pho nemischen Teilstück-Gruppe zu erhalten, und
- (l) die phonemische Teilstück-Datenfolge der phonemi schen Teilstück-Gruppe bei der Abgabe der phone mischen Teilstück-Daten durch sequentielle Verbindung der phonemischen Teilstück-Daten abgegeben und ein weiches Stimmensignal durch Einfügen des durch Interpolation gewonnenen phonemischen Inter polations-Teilstückes zwischen zwei phonemische Teil stücke erzeugt wird.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP56203934A JPS58105199A (ja) | 1981-12-17 | 1981-12-17 | 音声分析合成方法 |
JP56203933A JPS5917440B2 (ja) | 1981-12-17 | 1981-12-17 | 音声分析合成方法 |
JP56203932A JPS58105197A (ja) | 1981-12-17 | 1981-12-17 | 音声分析合成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE3246712A1 DE3246712A1 (de) | 1983-06-30 |
DE3246712C2 true DE3246712C2 (de) | 1991-07-11 |
Family
ID=27328305
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19823246712 Granted DE3246712A1 (de) | 1981-12-17 | 1982-12-17 | Verfahren zur zusammensetzung einer stimmenanalyse |
Country Status (2)
Country | Link |
---|---|
US (1) | US4601052A (de) |
DE (1) | DE3246712A1 (de) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0642158B2 (ja) * | 1983-11-01 | 1994-06-01 | 日本電気株式会社 | 音声合成装置 |
WO1989003573A1 (en) * | 1987-10-09 | 1989-04-20 | Sound Entertainment, Inc. | Generating speech from digitally stored coarticulated speech segments |
JPH0727397B2 (ja) * | 1988-07-21 | 1995-03-29 | シャープ株式会社 | 音声合成装置 |
SE9200817L (sv) * | 1992-03-17 | 1993-07-26 | Televerket | Foerfarande och anordning foer talsyntes |
US5884253A (en) * | 1992-04-09 | 1999-03-16 | Lucent Technologies, Inc. | Prototype waveform speech coding with interpolation of pitch, pitch-period waveforms, and synthesis filter |
US5675778A (en) * | 1993-10-04 | 1997-10-07 | Fostex Corporation Of America | Method and apparatus for audio editing incorporating visual comparison |
US6591240B1 (en) * | 1995-09-26 | 2003-07-08 | Nippon Telegraph And Telephone Corporation | Speech signal modification and concatenation method by gradually changing speech parameters |
ES2382319B1 (es) * | 2010-02-23 | 2013-04-26 | Universitat Politecnica De Catalunya | Procedimiento para la sintesis de difonemas y/o polifonemas a partir de la estructura frecuencial real de los fonemas constituyentes. |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3104284A (en) * | 1961-12-29 | 1963-09-17 | Ibm | Time duration modification of audio waveforms |
US3369077A (en) * | 1964-06-09 | 1968-02-13 | Ibm | Pitch modification of audio waveforms |
US3588353A (en) * | 1968-02-26 | 1971-06-28 | Rca Corp | Speech synthesizer utilizing timewise truncation of adjacent phonemes to provide smooth formant transition |
JPS5331323B2 (de) * | 1972-11-13 | 1978-09-01 | ||
US4227435A (en) * | 1977-04-28 | 1980-10-14 | Nippon Gakki Seizo Kabushiki Kaisha | Electronic musical instrument |
US4328395A (en) * | 1980-02-04 | 1982-05-04 | Texas Instruments Incorporated | Speech synthesis system with variable interpolation capability |
-
1982
- 1982-12-08 US US06/447,899 patent/US4601052A/en not_active Expired - Lifetime
- 1982-12-17 DE DE19823246712 patent/DE3246712A1/de active Granted
Also Published As
Publication number | Publication date |
---|---|
DE3246712A1 (de) | 1983-06-30 |
US4601052A (en) | 1986-07-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE2362050C3 (de) | Elektronisches Musikinstrument | |
DE2115258C3 (de) | Verfahren und Anordnung zur Sprachsynthese aus Darstellungen von individuell gesprochenen Wörtern | |
DE2820425C2 (de) | Binärer Zufallsrauschgenerator zur stochastischen Kodierung | |
DE69128857T2 (de) | Vorrichtung zur Erzeugung eines Tonsignals | |
DE2920298A1 (de) | Binaere interpolatorschaltung fuer ein elektronisches musikinstrument | |
DE69720861T2 (de) | Verfahren zur Tonsynthese | |
DE2659096A1 (de) | Verfahren und vorrichtung zur spracherkennung | |
DE3246712C2 (de) | ||
DE2530380A1 (de) | Sprachsynthetisatorsystem | |
DE2906519C2 (de) | Verfahren zur Analog-Digitalwandlung | |
DE3733983A1 (de) | Verfahren zum daempfen von stoerschall in von hoergeraeten uebertragenen schallsignalen | |
EP0777326B1 (de) | Verfahren und Vorrichtung zur Filterung eines Audiosignals | |
DE2748422C2 (de) | Polyphones elektronisches Musikinstrument | |
DE1905680A1 (de) | Anlage zur Signalverarbeitung | |
DE3037276C2 (de) | Tonsynthesizer | |
DE1762492A1 (de) | Verfahren und Schaltung zur Hoerbarmachung der menschlichen Stimme den hochgradig Schwerhoerigen | |
DE2430018B2 (de) | Anordnung zur stufenlosen Kompression digital gespeicherter Datenfolgen zwecks analoger Wiedergabe | |
DE3101590A1 (de) | Verfahren und anordnung zum erzeugen eines sprachsignals | |
DE69028326T2 (de) | Signal-Pegel-Erkennungsschaltkreise | |
DE69326501T2 (de) | Verfahren und Vorrichtung zur Sprachsynthese mit variabler Geschwindigkeit | |
DE4441906C2 (de) | Anordnung und Verfahren für Sprachsynthese | |
DE2051589A1 (de) | Anordnung zur Synthese eines Signals | |
DE2854601A1 (de) | Ton-synthesizer und verfahren zur ton-aufbereitung | |
EP0402519B1 (de) | Verfahren und Anordnung zur Verbesserung des Dynamikbereichs eines adaptiven rekursiven Netzwerks zur Verarbeitung zeitdiskreter Signale | |
DE2826570C2 (de) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8128 | New person/name/address of the agent |
Representative=s name: EISENFUEHR, G., DIPL.-ING. SPEISER, D., DIPL.-ING. |
|
8110 | Request for examination paragraph 44 | ||
D2 | Grant after examination | ||
8364 | No opposition during term of opposition | ||
8339 | Ceased/non-payment of the annual fee |