DE3246712C2

DE3246712C2 -

Info

Publication number: DE3246712C2
Application number: DE3246712A
Authority: DE
Inventors: Hiroshi Katano Osaka Jp Saito; Kiyotaka Nagai; Daisuke Hirakata Osaka Jp Mori; Masahiko Moriguchi Osaka Jp Hatanaka; Hideo Shibuya; Tomoaki Yokohama Kanagawa Jp Abe; Minoru Tokio/Tokyo Jp Toyoda
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1981-12-17
Filing date: 1982-12-17
Publication date: 1991-07-11
Also published as: DE3246712A1; US4601052A

Description

Die Erfindung betrifft ein Verfahren zur Analyse und anschließenden Zusammensetzung einer Stimme, bei welchem zur Analyse der Stimme aus einem Rohstimmen- Signal repräsentative phonemische Teilstücke extrahiert, die phonemischen Teilstücke zur Bildung von phonemischen Teilstück-Daten abgetastet und entsprechende phonemische Teilstück-Daten in einem Speicher abgespeichert werden und zur Zusammensetzung der Stimme die abgespeicherten phonemischen Teilstück-Daten aus dem Speicher ausgelesen, daraus phonemische Teilstücke gebildet und die phonemischen Teilstücke sequentiell verbunden werden, um das gewünschte Stimmensignal zu erhalten.

Ein solches Verfahren ist aus der US-PS 35 88 353 bekannt. Bei diesem bekannten Verfahren werden zur Analyse der Stimme die aus einem Rohstimmen-Signal extrahierten, repräsentativen, phonemischen Teilstücke zur Bildung von phonemischen Teilstück-Daten abgetastet. Anschließend werden die phonemischen Teilstück-Daten in einem Speicher abgespeichert. Zur Zusammensetzung der Stimme werden die abgespeicherten phonemischen Teilstück-Daten aus dem Speicher ausgelesen, daraus phonemische Teilstücke gebildet und die phonemischen Teilstücke sequentiell miteinander verbunden, um das gewünschte Stimmensignal zu erhalten. Zur Vermeidung von unerwünschten Geräuschen und zur Erzielung eines weichen Überganges zwischen den miteinander verbundenen phonemischen Teilstücken werden die Frequenzkomponenten der aneinander angrenzenden Abschnitte zweier benachbarter phonemischer Teilstücke so verändert und aneinander angepaßt, daß sie im Verbindungsbereich der beiden phonemischen Teilstücke gleich oder zumindest annähernd gleich sind. Eine derartige Beeinflussung der Frequenzkomponenten erfordert jedoch einen hohen Aufwand an Hardware und Software und verändert die erzeugte Stimme in unnatürlicher Weise.

Ein ähnliches Verfahren ist aus der US-PS 38 92 919 bekannt. Bei diesem bekannten Verfahren werden die Wellenlänge und Wellenform jedes phonemischen Teilstückes bzw. Sprachsegmentes einzeln gesteuert, damit die synthetisch erzeugte Stimme weicher klingt. Dieses Verfahren weist im wesentlichen die gleichen Nachteile wie das zuvor beschriebene Verfahren auf.

Die DE-OS 14 72 004 betrifft ein Verfahren zur Aufbereitung von gespeicherten Sprachsignalen. Bei diesem Verfahren werden von einem gegebenen Sprachsignal begrenzter Dauer die aufeinanderfolgenden Grundton-Perioden und deren Zeitdauer sowie die Signalamplitude zwischen positiver und negativer Spitze bestimmt. Die Grundton-Perioden werden auf eine gewünschte Dauer verkürzt. Um die Kurvenform der erzeugten synthetischen Stimme stetig und glatt werden zu lassen, werden die Amplituden-Differenzen zwischen dem Anfang und dem Ende benachbarter, verkürzter Grundton-Perioden bestimmt und ein Übergangssignal am Ende einer verkürzten Grundton-Periode addiert oder subtrahiert, um die Amplitude durch Erhöhung oder Verminderung an die Anfangs-Amplitude der folgenden, verkürzten Grundton-Periode anzugleichen. Auch dieses Verfahren erfordert einen hohen schaltungstechnischen Aufwand und verändert die Stimme in unerwünschter Weise.

Demgegenüber ist es Aufgabe der vorliegenden Erfindung, ein Verfahren zur Analyse und Zusammensetzung einer Stimme zu schaffen, bei welchem die erzeugte Stimme nicht nur glatte Übergänge, sondern auch die natürliche Stimmenlage aufweist, wobei die Speicherkapazität zum Speichern der Stimmendaten geringgehalten werden kann.

Diese Aufgabe wird mit den Verfahren gemäß den Ansprüchen 1 bis 10 gelöst.

Ein erstes gemeinsames Prinzip der erfindungsgemäßen Verfahren besteht darin, ein durch Interpolation gewonnenes phonemisches Interplations-Teilstück zwischen zwei phonemische Teilstücke einzufügen und dabei die Anzahl der Daten der phonemischen Teilstücke konstant zu halten. Dabei wird die phonemische Teilstück-Datenfolge einer zwei phonemische Teilstücke und das dazwischen liegende phonemische Interpolations-Teilstück enthaltenden phonemischen Teilstück-Gruppe durch Interpolation der phonemischen Teilstück-Daten des vorangegangenen und des nachfolgenden phonemischen Teilstückes gewonnen.

Dieses genannte erste Prinzip trägt dazu bei, daß die zusammengesetzte Stimme nicht nur glatt, sondern auch natürlich klingt.

Das zweite gemeinsame Prinzip der erfindungsgemäßen Verfahren besteht darin, die Differenz zwischen den Abtastdaten, die den benachbarten phonemischen Teilstücken entsprechen, aus der phonemischen Teilstück-Datenfolge zu ermitteln und anschließend die Anfangsdaten des phonemischen Teilstückes der phonemischen Teilstück- Datenfolge und die Differenz der phonemischen Teilstück- Datenfolge in dem Speicher zu speichern. Demzufolge kann die Kapazität des Speichers zur Speicherung der phonemischen Teilstück-Daten klein gehalten werden.

Nachfolgend werden bevorzugte Ausführungen der erfindungsgemäßen Verfahren anhand der beiliegenden Zeichnungen näher erläutert. Es zeigt:

Fig. 1 einen Teil des Kurvenverlaufs bei Anwendung der Verfahren zur Analyse und anschließenden Zusammensetzung einer Stimme;

Fig. 2 (a), (b), (c) Kurvenverläufe zur Darstellung der Interpolation phonemischer Teilstücke;

Fig. 3 (a), (b), (c) Kurvenverläufe bei Anwendung der erfindungsgemäßen Verfahren;

Fig. 4 ein Blockschaltbild einer Vorrichtung zur Durchführung der Verfahren zur Analyse und anschließenden Zusammensetzung einer Stimme; und

Fig. 5 ein Flußdiagramm zur Erläuterung der Arbeitsweise der Verfahren.

In Fig. 1 ist ein Teil eines nach einem Verfahren zur Analyse und anschließenden Zusammensetzung einer Stimme zusammengesetzten Stimmen-Signalverlaufes dargestellt. Das in Fig. 1 dargestellte Signal ist ein Stimmensignal, das sich aus der dreifachen Wiederholung des phonemischen Teilstückes PHA, der Verbindung mit einem phonemischen Teilstück PHB und zweifacher Wiederholer des Teilstückes PHB zusammensetzt.

Da der Signalverlauf und die Abtastperioden der phonemischen Teilstücke an den Verbindungspunkten abrupt wechseln, wird ein durch Interpolation gewonnenes phonemisches Interpolations-Teilstück zwischen zwei phonemische Teilstücke eingefügt, um ein geglättetes Stimmensignal zu erhalten.

Dazu wird der i-te Datenwert PHI(i) des phonemischen Interpolations-Teilstückes PHI, des vorangegangenen phonemischen Teilstückes PHA und des nachfolgenden phonemischen Teilstückes PHB mittels der nachfolgend angegebenen Gleichung (1) abgeleitet, worin der i-te Datenwert des vorangegangenen phonemischen Teilstückes PHA der durch Abtasten des Stimmensignals mit vorgegebener Abtastperiode gewonnenen phonemischen Teilstück-Datengruppe als PHA (i) angenommen wird (mit i=1, 2, . . ., N_A, worin N_A die Datenzahl des PHA ist), der i-te Datenwert des nachfolgenden phonemischen Teilstückes PHB als PHB (i) angenommen wird (mit i=1, 2, . . ., N_B, worin N_B die Datenzahl des PHB ist):

PHI (i)=f {PHA (i), PHB i)} (1)

In der Gleichung (1) bedeutet f (A, B) die Interpolations- Funktion der beiden phonemischen Teilstück-Daten A, B.

Die Interpolation der beiden phonemischen Teilstück- Daten wird vorzugsweise mittels linearer Interpolation durchgeführt. Nimmt man an, daß die Anzahl der zwischen zwei phonemische Teilstücke einzufügenden phonemischen Interpolation-Teilstücke M beträgt, so erhält man den i-ten Datenwert PHI (i, j) des j-ten Interpolations- Teilstückes mittels der nachstehenden Gleichung (2)

Da man den Datenwert PHB (i) des nachfolgenden phonemischen Teilstückes durch die Bedingung j=M+1 gemäß Gleichung (2) erhält, kann der Wert PHB als phonemisches Interpolations-Teilstück in weitem Sinne bezeichnet werden. Der in der nachstehenden Gleichung (3) definierte Wert M′ wird als "Interpolations-Wiederholungszahl" bezeichnet. Die Gleichung (4) kann aus der Gleichung (2) abgeleitet werden, wenn der Wert für M′ eingesetzt wird.

M′=M+1 (3)

worin j=1, 2, . . ., M′ bedeutet.

Bei Anwendung des bekannten Verfahrens treten jedoch Schwierigkeiten bei der Berechnung der phonemischen Teilstück-Daten des phonemischen Interpolations-Teils gemäß Gleichung (1) oder Gleichung (2) auf, da aufgrund von möglicherweise unterschiedlichen Abtastperioden der jeweiligen phonemischen Teilstücke die Anzahl der Daten N_A des phonemischen Teilstückes PH unterschiedlich gegenüber dem Wert der Datenzahl N_B des phonemischen Teilstückes PHB sein kann. In einem derartigen Fall werden die Daten des phonemischen Interpolations-Teilstückes dadurch gewonnen, daß die Datenzahl der beiden phonemischen Teilstücke gleichgemacht wird, indem der letzte Datenwert oder Null den phonemischen Teilstück-Daten hinzuaddiert wird, die eine geringere Datenzahl aufweisen.

Um ein glattes, natürliches Stimmensignal zu erhalten, muß dann die Abtastperiode leicht variiert werden. Demzufolge wird die Datenzahl N_I des phonemischen Interpolations- Teilstückes gemäß der nachstehenden in Gleichung (5) dargestellten Interpolation aus der Datenzahl N_A des vorangegangenen phonemischen Teilstückes PHA und der Datenzahl (N_B) des nachfolgenden phonemischen Teilstückes PHB gewonnen werden.

N_I=INT g {(N_A, N_B)} (5)

worin g (N_A, N_B) die Interpolationsfunktions-Funktion der beiden Datenzahlen N_A, N_B und das Zeichen INT (x) die Funktion zur Bildung ganzer Zahlen x bedeutet.

Die Anzahl der Daten des phonemischen Interpolations- Teilstückes ist so bemessen, daß sie eine lineare Interpolation ermöglicht. Bedeutet N die Anzahl der zwischen zwei phonemische Teilstücke einzufügenden phonemischen Interpolations-Teilstücke, so ist die Datenzahl N_I(j) des j-ten phonemischen Interpolations- Teilstückes durch die nachstehende Gleichung (6) gegeben.

worin j=1, 2, . . ., M+1 bedeutet.

Demzufolge kann die jeweilige Abtastperiode durch Abgabe der in oben beschriebener Weise erhaltenen phonemischen Teilstück-Daten durch die Anzahl der durch Interpolation erhaltenen Daten leicht variiert werden, um die verbleibenden Daten wegzuschneiden.

Jedoch hat es sich gezeigt, daß infolge des Wegschneidens der verbleibenden Daten des phonemischen Interpolations- Teilstückes unerwünschte Geräusche verursacht wurden.

In Fig. 2 (b) ist ein phonemisches Interpolations- Teilstück PHI dargestellt, das aus den in Fig. 2 (a) bzw. 2 (c) dargestellten phonemischen Teilstücken PHA und PHB gewonnen wird.

Bei dem in Fig. 2 dargestellten phonemischen Interpolations- Teilstück PHI handelt es sich um ein in den Mittelabschnitt des phonemischen Teilstückes PHA und des phonemischen Teilstückes PHB einzufügendes phonemisches Teilstück. Sowohl der Datenwert als auch die Datenzahl des phonemischen Interpolations-Teilstückes werden mittels linearer Interpolation gewonnen.

Sofern der letzte Datenwert des phonemischen Interpolations- Teilstückes gemäß Fig. 2 (b) nicht Null ist, wird ein unerwünschter Geräuschklang verursacht.

In Fig. 2 ist mit τ die Taktperiode beim Abtasten der Daten, mit i die Anzahl abgetasteter Daten, mit t die Zeit und mit N_A und N_B die jeweilige Datenzahl der phonemischen Teilstücke PHA und PHB bezeichnet.

Bei dem erfindungsgemäßen Verfahren wird nun zuerst die Anzahl der Daten an die vorgegebene Anzahl N der Daten hinsichtlich der phonemischen Teilstück-Daten der phonemischen Teilstücke zur Interpolation zwischen zwei phonemischen Teilstücken angeglichen.

Um die Anzahl der Daten der phonemischen Teilstücke mit unterschiedlichen Teilungsperioden anzugleichen, ist ein Abtastverfahren erforderlich, bei dem die Taktperiode zum Abtasten der phonemischen Teilstücke in der Weise variiert wird, daß die Anzahl der Daten der phonemischen Teilstücke konstant wird.

Da es jedoch äußerst schwierig ist, die Abtast-Taktperiode der phonemischen Teilstücke in Übereinstimmung mit der Teilungsperiode zu variieren, wird die Interpolation oder Dezimierung der Daten in der Weise durchgeführt, wie es in dem Aufsatz "Interpolation And Decimation of Digital Signals a Tutorial Review", von R. E. Crochiere und L. R. Rabiner auf den Seiten 300 bis 331 der 69. Ausgabe, Nr. 3 vom März 1981 der Zeitschrift "Proceedings Of The IEEE" detailliert beschrieben wird, nachdem die phonemischen Teilstücke in einer vorgegebenen Abtast-Taktperiode abgetastet wurden. Die Anzahl der Daten wird anschließend reduziert oder erhöht, um die vorgegebene Datenzahl zu erreichen.

Die Interpolation wird gemäß Gleichung (1) oder gemäß Gleichung (2) mit dem i-ten Datenwert PHA (i) (i=1, 2, . . ., N) des vorangegangenen phonemischen Teilstückes PHA der phonemischen Teilstück-Daten mit konstanter Datenzahl und mit dem i-ten Datenwert PHB (i) (i=1, 2, . . ., N) des nachfolgenden phonemischen Teilstückes PHB durchgeführt, wodurch der i-te Datenwert PHI (i) (i=1, 2, . . ., N) des phonemischen Interpolations- Teilstückes PHI erzeugt wird.

Demnach ist die Anzahl der Daten des zu interpolierenden phonemischen Teilstückes konstant. Dadurch ist es nicht erforderlich, einen End-Datenwert oder einen Null-Datenwert künstlich an die phonemischen Teilstück-Daten mit einer geringeren Datenzahl anzuhängen.

Die phonemischen Teilstück-Daten des in der zuvor beschriebenen Weise gewonnenen interpolierten Teilstückes PHI werden in die phonemischen Teilstück- Daten des zu interpolierenden phonemischen Teilstückes eingefügt, um eine phonemische Teilstück-Datenfolge einer phonemischen Teilstückgruppe PHA, PHI, PHB einschließlich des interpolierten phonemischen Teilstückes PHI zu erzeugen.

Um das gewünschte Stimmensignal zusammenzusetzen, kann die phonemische Teilstück-Datenreihe einer phonemischen Teilstück-Gruppe einschließlich des phonemischen Interpolations-Teilstückes durch Interpolation der phonemischen Teilstückdaten des vorangegangen phonemischen Teilstückes und den des nachfolgenden phonemischen Teilstückes gewonnen werden. Die oben beschriebene Interpolation wird dabei im voraus durchgeführt. Die Differenz der Datenwerte gleicher Anzahl der benachbarten phonemischen Teilstück-Daten der phonemischen Teilstück-Datenfolge einer phonemischen Teilstück-Gruppe einschließlich der interpolierten phonemischen Teilstücke wird anschließend ermittelt, um die phonemische Teilstück-Datenfolgen- Differenz zu erhalten. Speichert man diese Folge in einem Speicher, so kann die phonemische Teilstück-Datenfolge der phonemischen Teilstück-Gruppe PHA, PHI, PHB einschließlich der interpolierten phonemischen Teilstücke PHI durch Addition lediglich während der Stimmenzusammensetzung erhalten werden. Auf diese Weise kann das Verfahren zur Ermittlung der phonemischen Teilstück- Datenfolge während der Stimmenzusammensetzung vereinfacht werden.

Die Differenz der phonemischen Teilstück-Daten ΔPH (i, j) zwischen (j-1) phonemischen Teilstück- Daten und den j-ten phonemischen Teilstück-Daten wird durch Gleichung (7) vorgeschrieben, in der der i-te Datenwert der j-ten phonemischen Teilstück-Daten (wobei j=0 eine zusätzliche Ziffer zu den phonemischen Teilstück-Daten hinzufügt, die sequentiell von Null aus ansteigen und wobei damit die phonemischen Anfangs-Teilstück-Daten bezeichnet sind) der phonemischen Teilstück-Datenfolge der phonemischen Teilstück-Gruppe einschließlich der interpolierten phonemischen Teils PH (i, j) beträgt.

ΔPH (i, j)=PH (i, j)-PH (i, j-1) (7)

worin i=1, 2, . . ., N bedeutet.

In diesem Zusammenhang ist festzuhalten, daß sich der Differenzwert gemäß dem vorliegenden Verfahren hinsichtlich der Art und Weise zur Ermittlung der Differenz von dem Differenzwert gemäß dem DPCM-Verfahren unterscheidet.

Bei dem DPCM-Verfahren wird die Differenz zwischen benachbarten Abtastdaten genommen, während gemäß dem vorliegenden Verfahren die Differenz zwischen den Abtastdaten, die den benachbarten phonemischen Teilstücken entsprechen, ermittelt wird, was der Gleichung (7) zu entnehmen ist.

Anschließend werden die Anfangsdaten des phonemischen Teilstückes der phonemischen Teilstück-Datenfolge und die Differenz der phonemischen Teilstück-Datenfolge in dem Speicher gespeichert.

Die nachstehende Gleichung (8) ist aus der vorstehenden Gleichung (7) abgeleitet.

Um die phonemische Teilstück-Datenfolge einer phonemischen Teilstück-Gruppe einschließlich der interpolierten phonemischen Teilstücke bei der Zusammensetzung der Stimmensignale aus der Gleichung (8) abzuleiten, muß die Differenz der aus dem Speicher ausgelesenen phonemischen Teilstück-Daten sequentiell den Anfangsdaten der aus dem Speicher ausgelesenen phonemischen Teilstück-Datenfolge hinzugefügt werden.

Die Übernahme des Interpolationverfahrens in die Differenz- Daten des phonemischen Teilstückes ist mit den folgenden Vorteilen verbunden:

Da die Datenfolge phonemischer Teilstücke einer phonemischen Teilgruppe einschließlich der interpolierten phonemischen Teile nur während der Addition beim Zusammensetzen der Stimmensignale vorgesehen ist, kann das erfindungsgemäße Verfahren mittels eines einfachen Steuerschaltkreises, wie beispielsweise einem universellen Mikrocomputer realisiert werden. Die natürliche Stimme kann mittels eines derart einfachen Schaltungsaufbaus zusammengesetzt werden.

Um die Daten des phonemischen Teils des interpolierten phonemischen Teils mittels linearer Interpolation zu erhalten, ist in Gleichung (9) der i-te Differenz- Datenwert ΔPHI (i, j) der j-ten phonemischen Interpolations- Teilstücke PHI zwischen zwei phonemischen Teilstücken PHA und PHB angegeben:

worin PHA (i) der i-te Datenwert des vorangegangenen phonemischen Teilstückes PHA des zu interpolierenden phonemischen Teilstückes ist und die Anzahl der zwischen die phonemischen Teilstücke einzufügenden interpolierten phonemischen Teilstücke M beträgt und j=1, 2, . . ., M+1 ist.

Bei der linearen Interpolation wird der Wert der Daten- Differenz des phonemischen Teilstückes zwischen zwei zu interpolierenden phonemischen Teilstücken PHA, PHB konstant, wie der Gleichung (9) zu entnehmen ist. In dem Speicher werden ein Wert, der um 1 gegenüber der Anzahl der zwischen die zu interpolierenden phonemischen Teilstücke erhöht wurde, die Anfangsdaten des zu interpolierenden phonemischen Teilstückes und eine Daten- Differenz des phonemischen Teilstückes, das durch Division gewonnen wird, gespeichert. Zusätzlich wird ein Wert, in dem 1 der Anzahl der interpolierten phonemischen Teile hinzugefügt wird, die Differnz der Datenwerte gleicher Anzahl der zu interpolierenden phonemischen Teilstück-Daten des vorangegangenen phonemischen Teils und des nachfolgenden phonemischen Teils in dem Speicher gespeichert.

Um die phonemische Teilstück-Datenfolge einer phonemischen Teilstück-Gruppe einschließlich des phonemischen Interpolation-Teilstückes bei der Zusammensetzung des gewünschten Stimmensignals, wie beispielsweise PHI, zu erhalten, werden die phonemischen Teilstück- Anfangsdaten PHA (i) der seriell aus einem Speicher ausgelesenen phonemischen Teilstück-Daten wiederholt der Differenz der phonemischen Teilstück- Daten ΔPHI, die ebenfalls aus dem Speicher ausgelesen werden, hinzuaddiert, wobei die Anzahl der Additionen gleich der Summe einer Ziffer m des aus dem Speicher ausgelesenen phonemischen Interpolations-Teilstückes plus 1 ist.

Da das phonemische Anfangsteilstück einer phonemischen Teilstück-Gruppe als phonemische Teilstück-Daten gemäß der allgemeinen Interpolationsmethode mittels der phonemischen Teilstück-Differenzdaten gespeichert ist, erfordern die phonemischen Teilstück-Differenzdaten einen Wert, bei dem die Anzahl der interpolierten phonemischen Teilstücke der Anzahl der zu interpolierenden phonemischen Teilstücke hinzugefügt wurde, d. h. eine Anzahl, bei der 1 von der Anzahl der phonemischen Teilstücke eines phonemischen Teilstückes abgezogen wurde. Bei der linearen Interpolationsmethode erfordern die phonemischen Teilstück-Differenzdaten lediglich eine der um 1 von der Anzahl der zu interpolierenden phonemischen Teilstücke verminderte Anzahl. Auf diese Weise reicht selbst eine kleine Speicherkapazität zur Speicherung der phonemischen Teilstück- Differenzdaten aus.

Ebenso wird der weiche Übergang bzw. die glatte Veränderung der Periodenteilung des zusammengesetzten Stimmensignals durch den weichen Übergang der Taktperiode erzielt, wenn die phonemische Teilstück-Datenfolge einer phonemischen Teilgruppe einschließlich der interpolierten phonemischen Teile abgegeben wird. Dies soll nachstehend näher erläutert werden.

Bezeichnet man die Taktperiode des vorangegangenen phonemischen Teilstückes PHA des zu interpolierenden Teilstückes mit τ_A und die des nachfolgenden phonemischen Teilstückes PHB mit τ_B, so errechnet sich die Taktperiode τ_I des Interpolationsteils aus der nachstehenden Gleichung (10):

τ_I=h ( τ_A, τ_B), (10)

in der h ( τ_A, τ_B) eine Interpolationsfunktion der beiden Taktperioden τ_A und τ_B ist.

Nimmt man an, daß M die Anzahl der zwischen zwei phonemischen Teilstücken einzufügenden phonemischen Interpolationsteile ist, wobei die Taktperiode des phonemischen Interpolationsteiles durch lineare Interpolation ermittelt wird, so ergibt sich die Taktperiode τ₁ (i) eines j-ten phonemischen Interpolationsteils durch die nachstehende Gleichung (11).

in der j=1, 2, . . ., M+1 ist.

Danach wird die Taktperiode des interpolierten phonemischen Teils in die Taktperiode des zu interpolierenden phonemischen Teils eingesetzt, um die Taktperiodenfolge einer phonemischen Teilstück-Gruppe einschließlich der interpolierten phonemischen Teilstücke zu erhalten.

Bei der Abgabe der Stimmensignale werden die Taktperioden der einzelnen phonemischen Teilstück-Gruppen einschließlich der interpolierten phonemischen Teilstücke aneinandergereiht, wobei die Interpolation der Taktperioden, wie oben beschrieben, durchgeführt wird. Die Anwendung des Verfahrens mit einer Differenz-Taktperiode ermöglicht es, die Ableitung der Taktperiodenfolgen während des Stimmen-Ausgabebetriebes zu verringern.

Dabei ist die Differenz-Taktperiodenfolge durch die Vorgabe der Differenz benachbarter Taktperioden der Taktperiodenfolgen der phonemischen Teilstück-Gruppen einschließlich der interpolierten phonemischen Teilstücke, wie oben beschrieben, gegeben.

Anschließend werden die Anfangs-Taktperiode der Taktperiodenfolgen und die Differenz-Taktperiodenfolgen in dem Speicher gespeichert.

Um die Taktperiodenfolgen der phonemischen Teilstück- Gruppen einschließlich der interpolierten phonemischen Teilstücke bei der Zusammensetzung des Stimmensignals zu rekonstruieren, muß die aus dem Speicher ausgelesene Differenz-Taktperiode sequentiell der Anfangs- Taktperiode der aus dem Speicher ausgelesenen Taktperiodenfolgen hinzuaddiert werden.

Durch die Anwendung der Interpolationsmethode mittels der Differenz-Taktperiode können die Taktperiodefolgen der phonemischen Teilstück-Gruppen einschließlich der interpolierten phonemischen Teilstücke auf einfache Weise durch Addition gewonnen werden, was das Verfahren zur Erlangung der Taktperiodenfolgen während der phonemischen Zusammensetzung wesentlich vereinfacht.

Da die Differenz-Taktperiode zwischen zwei zu interpolierenden phonemischen Teilstücken konstant wird, wenn die Taktperiode durch lineare Interpolation erhalten wird, kann ein Wert, bei dem 1 zu der Zahl der zwischen den zu interpolierenden phonemischen Teilstücken einzusetzenden interpolierten phonemischen Teilstücke hinzuaddiert wurde und eine durch Division durch einen Wert, bei dem 1 zu der Anzahl der interpolierten phonemischen Teilstücke hinzugefügt wurde, erhaltene Differenz-Taktperiode aus der Differenz der Taktperiode τ_I des phonemischen Anfangs- Teilstückes der zu interpolierenden phonemischen Teilstücke, der Taktperiode τ_A des vorangegangenen phonemischen Teilstückes der zu interpolierenden phonemischen Teilstücke und der Taktperiode τ_B des nachfolgenden phonemischen Teilstückes in dem Speicher gespeichert werden.

Um die Taktperiodenfolgen der phonemischen Teilgruppe einschließlich der phonemischen Interpolation-Teilstücke bei der Zusammensetzung des gewünschten Stimmensignals zu erhalten, muß die Ziffer des Wertes, bei dem 1 der Anzahl der aus dem Speicher ausgelesenen phonemischen Interpolations-Teilstücke hinzuaddiert wurde und die aus dem Speicher ausgelesene Differenz- Taktperiode der Taktperiode des phonemischen Anfangsteils der aus dem Speicher ausgelesenen, zu interpolierenden phonemischen Teilstücke hinzuaddiert werden.

Aufgrund der linearen Interpolation der phonemischen Teilstück-Differenzdaten kann die Speicherkapazität bei der linearen Interpolation der Differenz-Taktperiode kleiner gehalten werden als es vergleichsweise bei allgemeiner Interpolation erforderlich wäre. Da darüber hinaus ein weicher Übergang der Taktperiode gegeben ist, ist der dynamische Anteil beim Differenz- Taktperiodenwert kleiner im Vergleich zum Taktperiodenwert. Des weiteren kann die Speicherkapazität auch deshalb kleiner ausgelegt werden, weil die Anzahl der digitalen Bits kleiner gehalten werden kann.

Außerdem wird die Anzahl der gegebenen Daten der phonemischen Teilstücke für jede der phonemischen Teilstück-Gruppen variiert, um die phonemischen Teilstück-Daten zu komprimieren.

Nachstehend soll ein Fall betrachtet werden, bei dem eine natürliche Stimme, deren Stimmfrequenz in einem Bereich von 200 bis 400 Hz schwankt, mit einer Frequenz von 10 KHz abgetastet wird.

Für diesen Fall ergeben sich 50 Daten für ein phonemisches Teilstück bei einer Stimmfrequenz von 200 Hz und 25 Daten bei einer Stimm- bzw. Tonhöhenfrequenz von 400 Hz.

Anschließend wird gemäß der vorliegenden Erfindung die Anzahl der Daten der phonemischen Teilstücke in die Anzahl der vorgegebenen Daten, nämlich 40 im vorliegenden Fall, umgewandelt.

Demzufolge beträgt die Taktfrequenz bei Abgabe des 200 Hz-phonemischen Teilstückes 200×40=8000 Hz, d. h. 8 KHz. Analog beträgt die Taktfrequenz bei Abgabe des 400 Hz-Teilstückes 16 KHz.

Wird die Datenabtastung mit einer Frequenz von 10 KHz gemäß dem vorgenannten Abtast-Theorem durchgeführt, so verursacht die 5 KHz-Komponente verfälschte Signale. Aus diesem Grunde wird ein Tiefpaßfilter zur Eliminierung dieser Frequenzanteile verwendet.

Wird daher die Taktfrequenz im Abgabebetrieb auf 16 KHz erhöht, so tritt auch dort die Frequenzkomponente im Bereich von 5 bis 8 KHz im phonemischen Abgabe- Teilstück nicht auf. Eine Anwendung höherer Taktfrequenzen im Abgabebetrieb bringt daher keine Vorteile mit sich.

Die Wiedergabe der phonemischen Teilstücke mit einer 400 Hz-Abstandsfrequenz und einer Datenzahl 40 sowie einer Taktfrequenz von 16 KHz ist äquivalent zur Wiedergabe desselben phonemischen Teilstückes mit einer Datenzahl 25 und einer Taktfrequenz von 10 KHz.

Demzufolge muß das phonemische Teilstück mit einer Abstands- oder Teilungsfrequenz von 200 Hz mit einer Datenzahl 40 und einer Taktfrequenz von 8 KHz wiedergegeben werden. In gleicher Weise muß das 400 Hz- phonemische Teilstück mit einer Datenzahl 25 und einer Taktfrequenz von 10 KHz abgegeben werden.

Im Falle des Auftretens eines phonemischen Teilstückes mit einer großen Teilungsfrequenz kann die Datenzahl des betreffenden phonemischen Teilstückes kleiner gewählt werden, um die Datenzahl des betreffenden phonemischen Teilstückes zu reduzieren, so daß die Taktfrequenz im Abgabebetrieb kleiner gehalten werden kann.

Wie oben beschrieben wurde, kann die Anzahl der Daten der phonemischen Teilstücke durch die phonemische Teilstück-Gruppe variiert werden, um die Speicherkapazität zur Speicherung der phonemischen Teilstück- Daten kleiner zu halten. In gleicher Weise kann die Taktfrequenz während des Stimmenabgabebetriebes kleiner gehalten werden, um die erforderliche Verarbeitungszeit bis zur nächsten Aufgabe zu verlängern.

In Fig. 3 (b) ist ein phonemisches Interpolationsteil PHI dargestellt, das durch Interpolation des in Fig. 3 (a) dargestellten phonemischen Teilstückes PHA und des in Fig. 3 (c) dargestellten phonemischen Teilstückes PHB nach dem erfindungsgemäßen Verfahren gewonnen wurde.

Die Darstellung gemäß Fig. 3 entspricht weitestgehend der Darstellung gemäß Fig. 2 und die Kurvenverläufe in Fig. 3 (a) und 3 (c) sind die gleichen wie die Kurvenverläufe gemäß Fig. 2 (a) und 2 (c), sie weisen jedoch unterschiedliche Abtast-Taktperioden auf. In Fig. 3 stellt das phonemische Interpolations-Teilstück PHI ein phonemisches Teil dar, das in die Mitte zwischen die phonemischen Teilstücke PHA und PHB einzufügen ist. Die jeweiligen Datenwerte des phonemischen Interpolationsstückes und die Abtast-Taktperiode werden durch lineare Interpolation ermittelt.

Wie aus der Darstellung gemäß Fig. 3 (b) deutlich wird, wird der abrupte Wechsel bzw. Abbruch des Kurvenverlaufes am Ende im Vergleich zu dem in Fig. (2) dargestellten Signalverlauf vermieden. Aus diesem Grunde werden keinerlei Störgeräusche erzeugt, woraus sich eine natürliche, mit weichen Übergängen versehene Stimme ergibt.

In Fig. 3 bezeichnen τ_A, τ_I, τ_B die den betreffenden phonemischen Teilstücken PHA, PHI und PHB zugeordneten Taktperioden, während i die jeweilige Abtast- Datenzahl und N die Anzahl der betreffenden Daten wiedergibt. Bei der oben beschriebenen Darstellung ist lediglich die Interpolationsmethode näher erläutert worden. Selbstverständlich kann das gewünschte Stimmensignal auch durch eine Kombination mit und ohne Interpolation phonemischer Teilstücke gemäß dem erfindungsgemäßen Verfahren und gemäß bekannter Verfahren und einer anschließenden Verbindung beider Teile erzeugt werden.

In Fig. 4 ein Blockschaltbild einer Vorrichtung zur Realisierung des erfindungsgemäßen Verfahrens dargestellt.

In Fig. 4 ist mit der Bezugsziffer 1 eine Betriebsanzeige- und Eingabeeinheit bezeichnet, in die die Bedienungsperson eine Stimme und Betriebsweise eingibt. Mit der Bezugsziffer 2 ist eine Steuer- und Regeleinheit wie beispielsweise ein universeller Mikrocomputer o. dgl. bezeichnet. Mit der Bezugsziffer 3 ist ein Lesespeicher (ROM) zum Speichern eines Stimmen-Erzeugungsprogramms, phonemischer Teilstück-Daten u. dgl. versehen. Mit der Bezugsziffer 4 ist ein Speicher mit wahlfreiem Zugriff (RAM) zum vorübergehenden Speichern von Daten zur Durchführung des Programms o. dgl., bezeichnet. Die Bezugsziffer 5 bezeichnet einen Digital- Analog-Wandler zum Umwandeln der digitalen Signale in analoge Signale. Schließlich ist mit der Bezugsziffer 6 ein Verstärker und mit der Bezugsziffer 7 ein Lautsprecher bezeichnet.

Die Funktionsweise der Vorrichtung soll nachstehend mit Bezug auf die Fig. 4 näher erläutert werden.

Die in dem Nur-Lesespeicher 3 gespeicherten phonemischen Teilstück-Daten werden sequentiell verarbeitet und miteinander verbunden, während der RAM-Speicher 4 als vorübergehender Datenspeicher unter Steuerung einer 2 verwendet wird, die von dem in dem Lesespeicher 3 gespeicherten Stimmenerzeugungsprogramm in Abhängigkeit von dem von der Betriebsabgabeeinheit 2 abgegebenen Betriebsangabesignal gesteuert wird, so daß resultierend die digitalen Signale der gewünschten Stimme zusammengesetzt werden.

Anschließend werden die digitalen Signale in analoge Signale mittels des D/A-Wandlers 5 umgewandelt. Die nicht erforderlichen hohen Frequenzsignale werden mittels des Tiefpaßfilters ausgefiltert. Danach wird das Stimmensignal mittels des Verstärkers 6 verstärkt. Das gewünschte Stimmensignal wird schließlich von dem Lautsprecher 7 in der gewünschten Weise abgegeben.

In Fig. 5 ist ein Flußdiagramm zur Darstellung eines Beispiels der Zusammensetzung des durch Interpolation nach dem erfindungsgemäßen Verfahren in der dargestellten Vorrichtung gewonnenen Stimmensignals dargestellt.

Dieses Flußdiagramm gilt für den Fall, die Daten sowohl des phonemischen Interpolationsstückes als auch die Taktperiode durch lineare Interpolation ermittelt werden.

Wie oben beschrieben wurde, kann die weiche, natürliche Stimme aus den Kurvenverläufen des phonemischen Teilstückes und der Interpolation des Teilungsabstands zusammengesetzt werden. Dabei wird das durch Interpolation ersetzte phonemische Teilstück durch die Interpolation überflüssig. Demzufolge kann die Kapazität des Speichers zur Speicherung der phonemischen Teilstück-Daten klein gehalten werden. Da das erfindungsgemäße Verfahren mit einem einfachen Steuerschaltkreis, wie beispielsweise einem universellen Mikrocomputer, realisiert werden kann, kann die Vorrichtung in einfacher Weise aufgebaut werden, die sich durch eine höhere Stimmenqualität und durch einen billigen Aufbau auszeichnet. Darüber hinaus kann der verwendete Mikrocomputer auch für andere Aufgaben verwendet werden, z. B. zur zusätzlichen Steuerung elektrischer Haushaltsgeräte, Bürogeräte, Terminal, Lernmittelvorrichtungen, Spiele, Spielzeug o. dgl., wobei nicht nur die Stimmenabgabefunktionen sondern auch die sonstigen Steuerfunktionen des verwendeten Mikrocomputers verwendet werden können.

Vorstehend wurde ein Verfahren zur Analyse und anschließenden Zusammensetzung einer Stimme beschrieben, bei dem die Anzahl der Abtastungen der phonemischen Teilstück-Daten in eine gewünschte Anzahl umgewandelt wird, um Geräuschprobleme zu beseitigen. Diese Geräuschprobleme können bei einer Zusammensetzung der Stimmanteile unter Anwendung von Interpolationen auftreten. Nach der Umwandlung der Abtastungen werden die Differenz-Daten des phonemischen Teilstückes aus den entsprechenden Datenwerten gleicher Anzahl der phonemischen Teilstück-Daten des vorangegangenen phonemischen Teilstückes und des nachfolgenden phonemischen Teilstückes zwischen zwei zu interpolierenden phonemischen Teilstücken, die sich aus der Anzahl der Abtastungen derselben phonemischen Teilstückdaten zusammensetzen, ermittelt. Alternativ können die Taktdifferenz-Daten der abzugebenden Taktwerte des vorangegangenen phonemischen Teilstückes und des nachfolgenden phonemischen Teilstückes ermittelt werden. An diesen Schritt schließt sich eine Speicherung der phonemischen Differenz-Daten oder der Taktdifferenz-Daten in einem Speicher und eine anschließende Interpolations-Zusammensetzung unter Verwendung der in dem Speicher gespeicherten phonemischen Teilstück-Differenz-Daten oder der Taktdifferenzdaten an. Dieses Verfahren gewährleistet eine weiche Stimmenzusammensetzung, die frei von durch Interpolation verursachte Geräusche ist, indem die Interpolation zwischen den phonemischen Teilstücken durchgeführt wird, die mit gleicher Häufigkeit abgetastet werden. Die Zusammensetzung der Stimme kann in einfacher Weise unter Verwendung eines Mikrocomputers durchgeführt werden, da die Interpolationszusammensetzung unter Anwendung der Differenz-Daten durchgeführt wird und die Durchführungszeit geringer ist.

Claims

1. Verfahren zur Analyse und anschließenden Zusammen setzung einer Stimme, bei welchem zur Analyse der Stimme aus einem Rohstimmen- Signal repräsentative phonemische Teilstücke extrahiert, die phonemischen Teilstücke zur Bildung von phonemischen Teilstück-Daten abgetastet und entsprechend phonemische Teilstück-Daten in einem Speicher abgespeichert werden und zur Zusammensetzung der Stimme die abgespeicherten phonemischen Teilstück-Daten aus dem Speicher ausgele sen, daraus phonemische Teilstücke gebildet und die phonemischen Teilstücke sequentiell verbunden werden, um das gewünschte Stimmensignal zu erhalten, dadurch gekennzeichnet, daß zur Analyse der Stimme

(a) die Anzahl der phonemischen Teilstück-Daten der phonemischen Teilstücke gleich einer vorgegebenen Anzahl der phonemischen Teilstück-Daten eines pho nemischen Teilstückes zur Interpolation zwischen zwei phonemischen Teilstücken gehalten wird, indem die Zahl der Abtastungen der phonemischen Teilstücke gleich der vorgegebenen Anzahl der phonemischen Teilstück-Daten ist,
(b) phonemische Teilstück-Daten eines phonemischen In terpolations-Teilstückes durch Interpolation aus der gleichen Anzahl der phonemischen Teilstück- Daten des dem zu interpolierenden phonemischen Teilstück vorangegangenen phonemischen Teilstückes und des nachfolgenden phonemischen Teilstückes erzeugt werden,
(c) eine phonemische Teilstück-Datenfolge einer zwei phonemische Teilstücke und das dazwischenliegende phonemische Interpolations-Teilstück enthaltenden pho nemischen Teilstückgruppe durch Einsetzen der phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes in die phonemischen Teil stück-Daten der zu interpolierenden phonemischen Teilstück-Daten erhalten wird,
(d) eine phonemische Teilstück-Differenz-Datenfolge aus der Differenz derselben Anzahl der benachbarten phonemischen Teilstück-Daten der phonemischen Teilstück-Datenfolge abgeleitet wird und
(e) die Anfangsdaten der phonemischen Teilstück-Daten folge und die phonemische Teilstück- Differenz-Datenfolge in einem Speicher gespeichert werden und zur Zusammensetzung der Stimme
(f) die aus dem Speicher ausgelesenen phonemischen Teilstück-Differenz-Daten schrittweise den phonemischen Teilstück-Anfangsdaten der aus dem Speicher ausgele senen phonemischen Teilstück-Datenfolge hinzugefügt werden, so daß die phonemischen Teilstück-Datenfolgen der phonemischen Teilstück-Gruppe erhalten werden,
(g) die Interpolation mit der Taktperiode des vorange gangenen phonemischen Teilstückes des zu interpolieren den phonemischen Teilstückes und der Taktperiode des nachfolgenden phonemischen Teilstückes durchgeführt wird, so daß die Taktperiode für das phonemische Interpolations-Teil stück erzeugt wird,
(h) die Taktperiode des phonemischen Interpolations- Teilstückes in die Taktperiode des zu interpolieren den phonemischen Teilstückes eingesetzt wird, damit die Taktperioden-Folge der phonemischen Teilstück-Gruppen abgeleitet wird und
(i) mittels der Taktperiodenfolge die phonemische Teilstück-Datenfolge der phonemischen Teilstück-Gruppe abgegeben und das geglättete Stimmensignal durch Einfügen des durch Inter polation erhaltenen phonemischen Interpolations-Teil stückes zwischen die phonemischen Teilstücke erzeugt wird.

2. Verfahren nach dem Oberbegriff von Anspruch 1, dadurch gekennzeichnet, daß zur Analyse der Stimme

(a) die Anzahl der phonemischen Teilstück-Daten der phonemischen Teilstücke gleich einer vorgegebenen Anzahl der phonemischen Teilstück-Daten eines phonemischen Teil stückes zur Interpolation zwischen zwei phonemischen Teilstücken gehalten wird, indem die Zahl der Abtastungen der phonemischen Teilstücke gleich der vorgegebenen Anzahl der phonemischen Teilstück-Daten ist, und
(b) in einem Speicher ein Wert gespeichert wird, bei dem der Anzahl der phonemischen Teilstück-Daten des zwischen zwei zu interpolieren de phonemische Teilstücke einzusetzenden phonemi schen Interpolations-Teilstücks 1 hinzuaddiert wird, sowie die phonemischen Teilstück-Anfangsdaten des zu interpolierenden phonemischen Teilstückes und durch Division erhaltene phonemische Teilstück-Differenz daten gespeichert werden, wobei ein Wert, bei dem 1 der Anzahl der phonemischen Interpolations-Teilstücke hinzugefügt wurde und wobei die Differenz derselben Anzahl der phonemischen Teilstück-Daten dem zu interpolierend phonemischen Teilstück vorangegangenen phonemischen Teilstückes und des nachfolgenden phonemischen Teilstückes erzeugt wird, wobei die phonemischen Teilstück-Daten des zwischen die zu interpolierenden phonemischen Teilstücke ein zufügenden phonemischen Interpolations-Teilstückes durch lineare Interpolation erzeugt werden, und zur Zusammensetzung der Stimme
(c) die aus dem Speicher ausgelesenen phonemischen Teilstück-Differenzdaten sequentiell den Anfangsdaten der aus dem Speicher ausgelesenen phonemischen Teil stück-Daten hinzuaddiert werden, wobei die Anzahl der Werte um 1 größer als die Anzahl der aus dem Speicher ausgelesenen phonemischen Interpolations-Teilstücke ist, so daß die phonemische Teilstück-Datenfolge der zwei phonemische Teilstücke und das dazwischenliegende phonemische Inerpolations-Teilstück enthaltenden phonemischen Teilstück-Gruppe erhalten wird,
(d) die Interpolation mit der Taktperiode des vorange gangenen phonemischen Teilstückes der zu interpolieren den phonemischen Teilstücke und der Taktperiode des nachfolgend phonemischen Teilstückes durchgeführt wird, so daß die Taktperiode für die phonemischen Interpolations teilstücke erzeugt wird,
(e) die Taktperiode des phonemischen Interpolations- Teilstückes in die Taktperiode des zu interpolieren den phonemischen Teilstückes eingesetzt wird, damit die Taktperiode-Folge der phonemischen Teilstück-Gruppen abgeleitet wird und
(f) mittels der Taktperioden-Folge die phonemische Teilstück-Datenfolge der phonemischen Teilstück-Gruppe abgegeben und das geglättete Stimmensignal durch Einfügen des durch Inter polation erhaltenen phonemischen Interpolatiopns-Teil stückes zwischen die phonemischen Teilstücke erzeugt wird.

3. Verfahren nach dem Oberbegriff von Anspruch 1, dadurch gekennzeichnet, daß zur Analyse der Stimme

(a) die Anzahl der phonemischen Teilstück-Daten der phonemischen Teilstücke gleich einer vorgegebenen Anzahl der phonemischen Teilstück-Daten eines phonemischen Teilstückes zur Interpolation zwischen zwei phonemischen Teil stücken gehalten wird, indem die Zahl der Abtastungen der phonemischen Teilstücke gleich der vorgegebenen Anzahl der phonemischen Teilstück-Daten ist,
(b) die Daten des phonemischen Interpolations-Teil stückes durch Interpolation aus der gleichen Anzahl der phonemischen Teilstück-Daten des dem zu unterpolierenden phonemischen Teilstück voran gegangenen phonemischen Teilstückes und des nachfol genden phonemischen Teilstückes erzeugt werden,
(c) die phonemischen Teilstück-Daten der phonemischen Interpolations-Teilstücke in die phonemischen Teilstück-Daten der zu interpolierenden phonemischen Teilstücke eingesetzt werden, um phonemische Teilstück- Datenfolgen der zwei phonemische Teilstücke und das dazwischenliegende phonemische Interpolations-Teilstück enthaltenden phonemischen Teilstück-Gruppe zu erhalten,
(d) die Interpolation mit der phonemischen Teilstück- Taktperiode des vorangegangenen phonemischen Teil stückes der zu interpolierenden phonemischen Teil stücke und der Taktperiode des betreffenden phonemischen Teilstückes zur Erzeugung der Taktperiode des phonemischen Interpolations-Teilstücks durchgeführt wird,
(e) die Taktperiode des phonemischen Interpolations- Teilstückes in die Taktperiode des zu interpolieren den phonemischen Teilstückes eingesetzt wird, damit die Taktperiodenfolge der phonemischen Teilstück- Gruppen einschließlich der phonemischen Teilstücke abgeleitet wird,
(f) die Differenz benachbarter Taktperioden der Takt periodenfolge ermittelt wird, um die Differenz-Takt periodenfolge zu erhalten und
(g) die Anfangs-Taktperiode der Taktperiodenfolge und die Differenz-Taktperiodenfolge in einem Speicher ge speichert werden, und zur Zusammensetzung der Stimme
(h) die aus dem Speicher ausgelesene Differenz-Takt periode sequentiell zur Anfangs-Taktperiode der eben falls aus dem Speicher ausgelesenen Taktperiodenfolge hinzuaddiert wird, um die Taktperiodenfolge der pho nemischen Teilstück-Gruppe zu erhalten, und
(i) die phonemische Teilstück-Datenfolge der phonemischen Teilstück-Gruppe bei der Abgabe der phone mischen Teilstück-Daten durch sequentielle Verbindung der phonemischen Teilstück-Daten abgegeben und ein weiches Stimmensignal durch Einfügen des durch Inerpolation gewonnenen phonemischen Inter polations-Teilstückes zwischen zwei phonemische Teil stücke erzeugt wird.

4. Verfahren nach dem Oberbegriff von Anspruch 1 dadurch gekennzeichnet, daß zur Analyse der Stimme

(a) die Anzahl der phonemischen Teilstück-Daten der phonemischen Teilstücke gleich einer vorgegebenen Anzahl der phonemischen Teilstück-Daten eines phonemischen Teilstückes zur Interpolation zwischen zwei phonemischen Teilstücken gehalten wird, indem die Zahl der Abtastungen der phonemischen Teilstücke gleich der vorgegebenen Anzahl der phonemischen Teilstück- Daten ist,
(b) eine Interpolation mit derselben Anzahl der phonemischen Teilstück-Daten des dem zu interpolierenden pho nemischen Teilstück vorangegangenen phonemischen Teilstückes und des nachfolgenden phonemi schen Teilstückes zur Erzeugung der phonemischen Teil stückdaten des phonemischen Interpolations-Teilstückes durchgeführt wird,
(c) die phonemischen Teilstück-Daten des phonemischen Interpolationsteilstückes in die phonemischen Teil stück-Daten der zu interpolierenden phonemischen Teil stücke zur Gewinnung der phonemischen Teilstück-Daten folge der zwei phonemische Teilstücke und das dazwischenliegende phonemische Interpolations-Teilstück enthaltenden phonemischen Teilstück-Gruppe eingesetzt werden und
(d) in einem Speicher sowohl ein Wert, der um 1 gegen über der Anzahl der zwischen die zu interpolierenden Teilstücke einzufügenden phonemischen Interpolations- Teilstücke erhöht wird, als auch die Taktperiode der phonemischen Anfangs-Teilstücke der zu interpolierenden phonemischen Teilstücke und eine Differenz-Takt periode gespeichert werden, wobei die Differenz-Takt periode durch Division mit einem Wert, der um 1 gegen über der Anzahl der phonemischen Interpolations-Teil stücke erhöht wurde, gewonnen wird, und die Differenz zwischen der Taktperiode des vorangegangenen phonemischen Teilstückes der zu interpolierenden phonemischen Teilstücke und der Taktperiode des nachfolgenden pho nemischen Teilstückes ermittelt wird, wobei die Takt periode des phonemischen Interpolations-Teilstückes durch lineare Interpolation zusammengesetzt wird, und zur Zusammensetzung der Stimme
(e) die aus dem Speicher ausgelesene Differenz-Takt periode sequentiell der Taktperiode des phonemischen Anfangs-Teilstückes der aus dem Speicher mit einer Ziffer ausgelesenen, zu interpolierenden phonemischen Teilstücke, deren Wert um eins gegenüber der Ziffer der aus dem Speicher ausgelesenen phonemischen Inter polations-Teilstücke erhöht wurde, hinzuaddiert wird, woraus die Taktperiodenfolge der phonemischen Teil stück-Gruppe ermittelt wird und
(f) mittels der Taktperiodenfolge die phonemische Teilstück-Datenfolge der phonemischen Teilstück-Gruppe abgegeben und das geglättete Stimmensignal durch Einfügen des durch Inter polation erhaltenen phonemischen Interpolations-Teil stückes zwischen die phonemischen Teilstücke erzeugt wird.

5. Verfahren nach dem Oberbegriff von Anspruch 1 dadurch gekenzeichnet, daß zur Analyse der Stimme

(a) die Anzahl der phonemischen Teilstück-Daten der phonemischen Teilstücke gleich einer vorgegebenen Anzahl der phonemischen Teilstück-Daten eines phonemischen Teilstückes zur Interpolation zwischen zwei phonemischen Teil stücken gehalten wird, indem die Zahl der Abtastungen der phonemischen Teilstücke gleich der vorgegebenen Anzahl der phonemischen Teilstück-Daten ist,
(b) die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes durch Interpolation aus der gleichen Anzahl der phonemischen Teilstück-Daten des phonemischen Teil stückes des dem zu interpolierenden phonemischen Teilstück vorangegangenen phonemischen Teilstückes und des nachfolgenden phonemischen Teilstückes erzeugt wird,
(c) die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes in die phonemischen Teil stück-Daten des phonemischen Teilstücks eingesetzt werden, bei denen die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes zu inter polieren sind, um die phonemische Teilstück-Daten reihe der zwei phonemische Teilstücke und das dazwischenliegende phonemische Interpolations-Teilstück enthaltenden phonemischen Teilstück-Gruppe einschließlich der phonemischen Interpolations-Teilstücke zu erhalten,
(d) die Differenz der Datenwerte gleicher Ziffer be nachbarter phonemischer Teilstück-Daten der phonemischen Teilstück-Datenfolge ermittelt wird,
(e) die Anfangsdaten der phonemischen Teilstück-Daten folge und die phonemische Teilstück-Diffe renz-Datenfolge in einem Speicher gespeichert werden,
(f) die Interpolation mit der Taktperiode des phonemischen Anfangs-Teilstückes der zu interpolierenden phonemischen Teilstücke und der Taktperiode des nach folgenden phonemischen Teilstückes durchgeführt wird, so daß die Taktperiode des phonemischen Interpolations- Teilstückes erzeugt wird,
(g) die Taktperiode des phonemischen Interpolations- Teilstückes in die Taktperiode des zu interpolierenden phonemischen Teilstückes eingesetzt wird, damit die Taktperiodenfolge der phonemischen Teilstück-Gruppen abgeleitet wird,
(h) die Differenz der benachbarten Taktperioden der Taktperiodenfolge für die Differenz-Taktperiodenfolge ermittelt wird, und
(i) die Anfangs-Taktperiode der Taktperiodenfolge und die Differenz-Taktperiodenfolge in einem Speicher ge speichert werden, und zur Zusammensetzung der Stimme
(j) die aus dem Speicher ausgelesenen phonemischen Teil stück-Differenz-Daten sequentiell den phonemischen Teil stück-Anfangsdaten der aus dem Speicher ausgelesenen phonemischen Teilstück-Datenfolge hinzugefügt werden, so daß die phonemischen Teilstück-Datenfolgen der pho nemischen Teilstück-Gruppe gewonnen werden,
(k) die aus dem Speicher ausgelesene Differenz-Takt periode sequentiell zur Anfangs-Taktperiode der eben falls aus dem Speicher ausgelesenen Taktperiodenfolge hinzuaddiert wird, um die Taktperiodenreihe der pho nemischen Teilstück-Gruppe zu erhalten, und
(l) mittels der Taktperiodenfolge die phonemische Teilstück-Datenfolge der phonemischen Teilstück-Gruppe bei der Abgabe der phonemischen Teilstück-Daten durch sequentielle Verbindung der phonemischen Teil stück-Daten abgegeben und ein weiches Stimmensignal durch Einfügen des durch Interpo lation gewonnenen phonemischen Interpolations-Teil stückes zwischen zwei phonemischen Teilstücke erzeugt wird.

6. Verfahren nach dem Oberbegriff von Anspruch 1, dadurch gekennzeichnet, daß zur Analyse der Stimme

(a) die Anzahl der phonemischen Teilstück-Daten der phonemischen Teilstücke gleich einer vorgegebenen Anzahl der phonemischen Teilstück-Daten eines phonemischen Teilstückes zur Interpolation zwischen zwei phonemischen Teil stücken gehalten wird, indem die Zahkl der Abtastungen der phonemischen Teilstücke gleich der vorgegebenen Anzahl der phonemischen Teilstück-Daten ist,
(b) die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes durch Interpolation aus der gleichen Anzahl der phonemischen Teilstück-Daten des phonemischen Teil stückes des dem zu interpolierenden phonemischen Teilstück vorangegangenen phonemischen Teilstückes und des nachfolgenden phonemischen Teilstückes erzeugt wird,
(c) die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes in die phonemischen Teil stück-Daten des phonemischen Teilstückes eingesetzt werden, bei denen die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes zu inter polieren sind, um die phonemischen Teilstück-Daten folge der zwei phonemische Teilstücke und das dazwischenliegende phonemische Interpolations-Teilstück enthaltenden phonemischen Teilstück-Gruppe zu erhalten,
(d) die Differenz der Datenwerte gleicher Ziffer be nachbarter phonemischer Teilstück-Daten der phonemi schen Teilstück-Datenreihe ermittelt wird, um die phonemische Teilstück-Differenz-Datenfolge zu erhalten,
(e) die Anfangsdaten der phonemischen Teilstück-Daten folge und die phonemischen Teilstück-Diffe renz-Datenfolgen in einem Speicher gespeichert werden, und
(f) in einem Speicher sowohl ein Wert, der um 1 größer als die Anzahl der zwischen die zu interpolierenden Teilstücke einzufügenden phonemischen Interpolations- Teilstücke ist, als auch die Taktperiode der phonemischen Anfangs-Teilstücke der zu interpolierenden phonemischen Teilstücke und eine Differenz-Takt periode gespeichert werden, wobei die Differenz-Takt periode durch Division mit einem Wert, der um 1 größer als die Anzahl der phonemischen Interpolation-Teil stücke ist, gewonnen wird und die Differenz zwischen der Taktperiode des vorangegangenen phonemischen Teilstückes der zu interpolierenden phonemischen Teilstücke und der Taktperiode des nachfolgenden pho nemischen Teilstückes ermittelt wird, wobei die Takt periode des phonemischen Interpolations-Teilstückes durch lineare Interpolation zusammengesetzt wird,
(g) die aus dem Speicher ausgelesenen phonemischen Teil stück-Differenz-Daten sequentiell den phonemischen Teil stück-Anfangsdaten der aus dem Speicher ausgelesenen phonemischen Teilstück-Datenfolge hinzugefügt werden, so daß die phonemischen Teilstück-Datenfolgen der pho nemischen Teilstück-Gruppe gewonnen werden,
(h) die aus dem Speicher ausgelesene Differenz-Takt periode sequentiell der Taktperiode des phonemischen Anfangs-Teilstückes der aus dem Speicher mit einer Ziffer ausgelesene, zu interpolierenden phonemischen Teilstücke, deren Wert um ein gegenüber der Ziffer der aus dem Speicher ausgelesenen phonemischen Inter polations-Teilstücke erhöht wurde, hinzuaddiert wird, woraus die Taktperiodenfolge der phonemischen Teil stück-Gruppe ermittelt wird und
(i) mittels der Taktperiodenreihe die phonemische Teilstück-Datenreihe der phonemischen Teilstück-Gruppe abgegeben und das geglättete Stimmensignal durch Einfügen des durch Inter polation erhaltenen phonemischen Interpolations-Teil stückes zwischen die phonemischen Teilstücke erzeugt wird.

7. Verfahren nach dem Oberbegriff von Anspruch 1, mit einer Variation einer vorgegebenen Anzahl der phonemischen Teilstückdaten für jede der phonemischen Teilstück-Gruppen, dadurch gekennzeichnet, daß

(a) die Anzahl der phonemischen Teilstück-Daten der phonemischen Teilstücke gleich einer vorgegebenen Anzahl der phonemischen Teilstück-Daten eines phonemischen Teilstückes zur Interpolation zwischen zwei phonemischen Teil stücken gehalten wird, indem die Zahl der Abtastungen der phonemischen Teilstücke gleich der vorgegebenen Anzahl der phonemischen Teilstück-Daten ist,
(b) die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes durch Interpolation aus der gleichen Anzahl der phonemischen Teilstück-Daten des phonemischen Teil stückes des dem zu interpolierenden phonemischen Teilstück vorangegangenen phonemischen Teilstückes und des nachfolgenden phonemischen Teilstückes erzeugt wird,
(c) die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes in die phonemischen Teil stück-Daten des phonemischen Teilstücks eingesetzt werden, bei denen die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes zu inter polieren sind, um die phonemische Teilstück-Daten folge der zwei phonemische Teilstücke und das dazwischen liegende phonemische Interpolations-Teilstück enthaltenden phonemischen Teilstück-Gruppe zu erhalten,
(d) die Interpolation mit der Taktperiode des voran gegangenen phonemischen Teilstückes der zu interpo lierenden phonemischen Teilstücke und der Taktperiode des nachfolgenden phonemischen Teilstückes durchgeführt wird, so daß die Taktperiode des phonemischen Interpolations- Teilstückes erzeugt wird, und
(e) die Taktperiode des phonemischen Interpolations- Teilstückes in die Taktperiode des zu interpolierenden phonemischen Teilstückes eingesetzt wird, damit die Taktperiodenreihe der phonemischen Teilstück-Gruppen abgeleitet wird,
(f) und zur Zusammensetzung der Stimme mittels der Taktperiodenfolge die phonemische Teilstück-Datenfolge der phonemischen Teilstück-Gruppe bei der Abgabe der phonemischen Teilstück-Daten durch sequentielle Verbindung der phonemischen Teil stück-Daten abgegeben und ein weiches Stimmensignal durch Einfügen des durch Interpo lation gewonnenen phonemischen Interpolations-Teil stückes zwischen zwei phonemische Teilstücke erzeugt wird.

8. Verfahren nach dem Oberbegriff von Anspruch 1, mit einer Variation der vorgegebenen Anzahl der phonemischen Teilstückdaten für jede der phonemischen Teilstück-Gruppen, dadurch gekennzeichnet, daß zur Analyse der Stimme

(a) die Anzahl der phonemischen Teilstück-Daten der phonemischen Teilstücke gleich einer vorgegebenen Anzahl der phonemischen Teilstück-Daten eines phonemischen Teilstückes zur Interpolation zwischen zwei phonemischen Teil stücken gehalten wird, indem die Zahl der Abtastungen der phonemischen Teilstücke gleich der vorgegebenen Anzahl der phonemischen Teilstück-Daten ist,
(b) die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes durch Interpolation aus der gleichen Anzahl der phonemischen Teilstück-Daten des phonemischen Teil stückes des dem zu interpolierenden phonemischen Teilstück vorangegangenen Teilstückes und des nachfolgenden phonemischen Teilstückes erzeugt wird,
(c) die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes in die phonemischen Teil stück-Daten des phonemischen Teilstückes eingesetzt werden, bei denen die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes zu inter polieren sind, um die phonemischen Teilstück-Daten folge der phonemischen Teilstück-Gruppe einschließlich der phonemischen Interpolations-Teilstücke zu erhalten,
(d) die Differenz der Datenwerte gleicher Ziffer be nachbarter phonemischer Teilstück-Daten der phonemischen Teilstück-Datenfolge ermittelt wird, und
(e) die Anfangsdaten der phonemischen Teilstück-Daten folge und die phonemischen Teilstück-Diffe renz-Datenfolgen in einem Speicher gespeichert werden, und zur Zusammensetzung der Stimme,
(f) die aus dem Speicher ausgelesenen phonemischen Teil stück-Differenz-Daten sequentiell den phonemischen Teil stück-Anfangsdaten der aus dem Speicher ausgelesenen phonemischen Teilstück-Datenfolge hinzugefügt werden, so daß die phonemischen Teilstück-Datenfolgen der zwei phonemische Teilstücke und das dazwischenliegende phonemische Interpolations-Teilstück enthaltenden pho nemischen Teilstück-Gruppe gewonnen werden,
(g) die Interpolation mit der Taktperiode des voran gegangenen phonemischen Teilstückes der zu interpo lierenden phonemischen Teilstücke und der Taktperiode des nachfolgenden phonemischen Teilstückes durchgeführt wird, so daß die Taktperiode des phonemischen Interpolations- Teilstückes erzeugt wird,
(h) die Taktperiode des phonemischen Interpolations- Teilstückes in die Taktperiode des zu interpolierenden phonemischen Teilstückes eingesetzt wird, damit die Taktperiodenreihe der phonemischen Teilstück-Gruppen abgeleitet wird,
(i) mittels der Taktperiodenfolge die phonemische Teilstück-Datenfolge der phonemischen Teilstück-Gruppe bei der Abgabe der phonemischen Teilstück-Daten durch sequentielle Verbindung der phonemischen Teil stück-Daten abgegeben und ein weiches Stimmensignal durch Einfügen des durch Interpo lation gewonnenen phonemischen Interpolations-Teil stückes zwischen zwei phonemische Teilstücke erzeugt wird.

9. Verfahren nach dem Oberbegriff von Anspruch 1, mit einer Variation der vorgegebenen Anzahl der phonemischen Teilstückdaten für jede der phonemischen Teilstück-Gruppen, dadurch gekennzeichnet, daß zur Analyse der Stimme,

(a) die Anzahl der phonemischen Teilstück-Daten der phonemischen Teilstücke gleich einer Anzahl der phonemischen Teilstück-Daten eines vorgegebenen phonemischen Teilstückes zur Interpolation zwischen zwei phonemischen Teilstücken gehalten wird, indem die Zahl der Abtastungen der phonemischen Teilstücke gleich der vorgegebenen Anzahl der phonemischen Teilstück-Daten ist,
(b) die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes durch Interpolation aus der gleichen Anzahl der phonemischen Teilstück-Daten des phonemischen Teil stückes des dem zu interpolierenden phonemischen Teilstück vorangegangenen phonemischen Teilstückes und des nachfolgenden phonemischen Teilstückes erzeugt wird,
(c) die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes in die phonemischen Teil stück-Daten des phonemischen Teilstücks eingesetzt werden, bei denen die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes zu inter polieren sind, um die phonemische Teilstück-Daten folge der zwei phonemische Teilstücke und das dazwischenliegende phonemische Interpolations-Teilstück enthaltenden phonemischen Teilstück-Gruppe zu erhalten,
(d) die Interpolation mit der Taktperiode des voran gegangenen phonemischen Teilstückes der zu interpo lierenden phonemischen Teilstücke und der Taktperiode des nachfolgenden phonemischen Teilstückes durchgeführt wird, so daß die Taktperiode des phonemischen Interpo lations-Teilstückes erzeugt wird,
(e) die Taktperiode des phonemischen Interpolations Teilstückes in die Taktperiode des zu interpolierenden phonemischen Teilstückes eingesetzt wird, damit die Taktperiodenfolge der phonemischen Teilstück-Gruppen abgeleitet wird,
(f) die Differenz benachbarter Taktperioden der Takt periodenfolge ermittelt wird, um die Differenz-Takt periodenfolge zu erhalten, und
(g) die Anfangs-Taktperiode der Taktperiodenfolge und die Differenz-Taktperiodenfolge in einem Speicher ge speichert werden, und zur Zusammensetzung der Stimme
(h) die aus dem Speicher ausgelesene Differenz-Takt periode sequentiell zur Anfngs-Taktperiode der eben falls aus dem Speicher ausgelesenen Taktperiodenfolge hinzuaddiert wird, um die Taktperiodenfolge der pho nemischen Teilstück-Gruppe zu erhalten, und
(i) die phonemischen Teilstück-Datenfolge der phonemi schen Teilstück-Gruppe bei der Abgabe der phone mischen Teilstück-Daten durch sequentielle Verbindung der phonemischen Teilstück-Daten abgegeben und ein weiches Stimmensignal durch Einfügen des durch Interpolation gewonnenen phonemischen Inter polations-Teilstückes zwischen zwei phonemische Teil stücke erzeugt wird.

10. Verfahren nach dem Oberbegriff von Anspruch 1, mit einer Variation der vorgegebenen Anzahl der phonemischen Teilstück-Daten für jede der phonemischen Teilstück-Gruppen, dadurch gekennzeichnet, daß

(a) die Anzahl der phonemischen Teilstück-Daten der phonemischen Teilstücke gleich einer vorgegebenen Anzahl der phonemischen Teilstück-Daten eines phonemischen Teilstückes zur Interpolation zwischen zwei phonemischen Teil stücken gehalten wird, indem die Zahl der Abtastungen der phonemischen Teilstücke gleich der vorgegebenen Azahl der phonemischen Teilstück-Daten ist
(b) die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes bei der Interpolation aus der gleichen Anzahl der phonemischen Teilstück-Daten des phonemischen Teil stückes des dem zu interpolierenden phonemischen Teilstück vorangegangenen phonemischen Teilstückes, des und des nachfolgenden phonemischen Teilstückes erzeugt wird,
(c) die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes in die phonemischen Teil stück-Daten des phonemischen Teilstücks eingesetzt werden, bei denen die phonemischen Teilstück-Daten des phonemischen Interpolations-Teilstückes zu inter polieren sind, um die phonemische Teilstück-Daten folge der zwei phonemische Teilstücke und des dazwischenliegende phonemische Interpolations-Teilstück enthaltenden phonemischen Teilstück-Gruppe zu erhalten,
(d) die Differenz der Datenwerte gleicher Ziffer be nachbarter phonemischer Teilstück-Daten der phonemischen Teilstück-Datenfolge ermittelt wird,
(e) die Anfangsdaten der phonemischen Teilstück-Daten folge und die phonemische Teilstück-Diffe renz-Datenfolgen in einem Speicher gespeichert werden,
(f) die Interpolation mit der Taktperiode des voran gegangenen phonemischen Teilstückes der zu interpo lierenden phonemischen Teilstücke und der Taktperiode des nachfolgenden phonemischen Teilstückes durchgeführt wird, so daß die Taktperiode des phonemischen Interpo lations-Teilstückes erzeugt wird,
(g) die Taktperiode des phonemischen Interpolations- Teilstückes in die Taktperiode des zu interpolieren den phonemischen Teilstückes eingesetzt wird, damit die Taktperiodenfolge der phonemischen Teilstück-Gruppen abgeleitet wird,
(h) die Differenz benachbarter Taktperioden der Takt periodenfolge ermittelt wird, um die Differenz-Takt periodenfolge zu erhalten, und
(i) die Anfangs-Taktperiode der Taktperiodenfolge und die Differenz-Taktperiodefolge in einem Speicher ge speichert werden, und zur Zusammensetzung der Stimme
(j) die aus dem Speicher ausgelesenen phonemischen Teil stück-Differenz-Daten sequentiell den phonemischen Teil stück-Anfangsdaten der aus dem Speicher ausgelesenen phonemischen Teilstück-Datenfolge hinzugefügt werden, so daß die phonemischen Teilstück-Datenfolgen der pho nemischen Teilstück-Gruppe gewonnen werden,
(k) die aus dem Speicher ausgelesene Differenz-Takt periode sequentiell zur Anfangs-Taktperiode der eben falls aus dem Speicher ausgelesenen Taktperiodenfolge hinzuaddiert wird, um die Taktperiodenfolge der pho nemischen Teilstück-Gruppe zu erhalten, und
(l) die phonemische Teilstück-Datenfolge der phonemi schen Teilstück-Gruppe bei der Abgabe der phone mischen Teilstück-Daten durch sequentielle Verbindung der phonemischen Teilstück-Daten abgegeben und ein weiches Stimmensignal durch Einfügen des durch Interpolation gewonnenen phonemischen Inter polations-Teilstückes zwischen zwei phonemische Teil stücke erzeugt wird.