EP0685833B1

EP0685833B1 - Verfahren zur Sprachkodierung mittels linearer Prädiktion

Info

Publication number: EP0685833B1
Application number: EP95401262A
Authority: EP
Inventors: Sophie Scott; William Navarro
Original assignee: Matra Nortel Communications SAS
Current assignee: Nortel Networks France SAS
Priority date: 1994-06-03
Filing date: 1995-05-31
Publication date: 2000-04-26
Anticipated expiration: 2015-05-31
Also published as: DE69516455T2; FR2720850B1; US5642465A; EP0685833A1; FR2720850A1; DE69516455D1

Claims

Verfahren zur Sprachkodierung mittels linearer Vorhersage, bei welchem ein Sprachsignal (S_I), das in aufeinanderfolgenden Rahmen digitalisiert ist, einer Syntheseanalyse unterzogen wird, um für jeden Rahmen Quantifikationswerte von Syntheseparametern (a_i b, T, k G) zu erhalten, die es ermöglichen, eine Abschätzung (S and) des Sprachsignals zu erhalten, und bei welchem die Quantifikationswerte ausgegeben werden, wobei die Syntheseanalyse eine lineare Kurzzeit-Vorhersage des Sprachsignals umfaßt, um die Quantifikationswerte der Koeffizienten eines Kurzzeit-Synthesefilters zu bestimmen, dadurch gekennzeichnet, daß ein spektraler Status (Y) des Sprachsignals unter ersten und zweiten Stati (Y_A, Y_B) derart bestimmt wird, daß das Signal proportional weniger Energie bei tiefen Frequenzen in dem ersten Status enthält als in dem zweiten Status, und der eine oder der andere von zwei Quantifikationsmodi angewendet wird, um die Quantifikationswerte der Koeffizienten des Kurzzeit-Synthesefilters gemäß dem bestimmten spektralen Status (Y) des Sprachsignals zu erhalten.
Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß der bestimmte Status (Y) des Sprachsignals nicht modifiziert wird, solange er eine Energie unterhalb einer vorbestimmten Schwelle aufweist.
Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß Rahmen für Rahmen ermittelt wird, ob das Signal in einem ersten Zustand ist, der dem ersten Status (Y_A) entspricht, oder in einem zweiten Zustand, der dem zweiten Status (Y_B) entspricht, und der Status (Y) des Signals auf der Basis der Zustände Rahmen für Rahmen (X) ermittelt wird, wobei der bestimmte Status nur modifiziert wird, nachdem mehrere nachfolgende Rahmen einen Signalzustand zeigen, der sich von demjenigen unterscheidet, der dem vorhergehend bestimmten Status entspricht.
Verfahren nach Anspruch 3, dadurch gekennzeichnet, daß eine Zählvariable (V) inkrementiert wird, wenn der Zustand (X) des Signals in einem Rahmen sich von demjenigen unterscheidet, der dem bestimmten Status (Y) des Signals entspricht, daß diese Zählvariable (V) dekrementiert wird, wenn der Zustand des Signals in einem Rahmen derjenige ist, der dem bestimmten Status des Signals entspricht, außer wenn diese Variable 0 ist, und dadurch daß dann, wenn die Zählvariable (V) eine vorbestimmte Schwelle erreicht, diese auf 0 zurückgesetzt wird und festgestellt wird, daß das Signal den Status gewechselt hat.
Verfahren nach Anspruch 3 oder 4, dadurch gekennzeichnet, daß das Sprachsignal (S_I) einer Hochpaßfilterung unterzogen wird, die Energie (E2) des Signals (S_I'), das den Hochpaßfilter durchlaufen hat, mit derjenigen (E1) des nicht gefilterten Signals verglichen wird, um Rahmen für Rahmen zu bestimmen, ob das Signal in dem ersten Zustand ist, für den die Energie des Hochpaß-gefilterten Signals größer ist als ein vorbestimmter Teil der Energie des nicht gefilterten Signals, oder ob das Signal in dem zweiten Zustand ist, für den die Energie des Hochpaß-gefilterten Signals geringer ist als der vorbestimmte Teil der Energie des nicht gefilterten Signals.
Verfahren nach Anspruch 3 oder 4, dadurch gekennzeichnet, daß die Koeffizienten (a_I) des Kurzzeit-Synthesefilters durch eine Menge von Frequenzen von Spektrallinien (f_I) dargestellt sind und dadurch, daß die Verteilung der Frequenzen der Spektrallinien in jedem Rahmen des Sprachsignals (S_I) analysiert wird, um zu ermitteln, ob das Signal in dem ersten oder dem zweiten Zustand ist.
Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, daß die Koeffizienten (a_I) des Kurzzeit-Synthesefilters durch eine Menge von p geordneten Frequenzparametern von Spektrallinien (cos2πf_i) dargestellt werden, und zwar unterteilt in m Gruppen von aufeinanderfolgenden Frequenzparametern, wobei p die Ordnung der linearen Kurzzeitvorhersage ist und m eine ganze Zahl größer oder gleich 1 ist, und dadurch, daß wenigstens die erste Gruppe in Bezug auf einen mittleren Vektor differentiell quantifiziert wird, der aus zwei unterschiedlichen Vektoren (V_I,1, V_I,2) gemäß dem bestimmten spektralen Zustand (Y) des Sprachsignals ausgewählt wird.
Verfahren nach Anspruch 7, dadurch gekennzeichnet, daß die Anzahl m gleich 3 ist und dadurch, daß jede der ersten drei Gruppen der aufeinanderfolgenden Frequenzparameter in Bezug auf einen entsprechenden mittleren Vektors differentiell quantifiziert wird, der aus zwei unterschiedlichen entsprechenden Vektoren gemäß dem bestimmten spektralen Zustand (Y) des Sprachsignals ausgewählt wird.
Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, daß die Koeffizienten (a_i) des Kurzzeit-Synthesefilters durch eine Menge von p geordneten Frequenzparametern von Spektrallinien (cos2πf_i) bestimmt werden, wobei die Menge in m Gruppen von aufeinanderfolgenden Frequenzparametern unterteilt ist, wobei p die Ordnung der linearen Kurzzeit-Vorhersage ist und m eine ganze Zahl größer oder gleich 1 ist, und dadurch, daß wenigstens die erste Gruppe quantifiziert wird, indem in einer Quantifizierungstabelle ein Vektor ausgewählt wird, der einen minimalen Abstand zu den Frequenzparametern der Gruppe aufweist, wobei diese Quantifizierungstabelle aus zwei unterschiedlichen Tabellen (T_I,1, T_I,2) gemäß dem bestimmten spektralen Zustand (Y) des Sprachsignals ausgewählt wird.
Verfahren nach Anspruch 9, dadurch gekennzeichnet, daß die Anzahl gleich 3 ist und dadurch, daß jede der beiden ersten Gruppen der aufeinanderfolgenden Frequenzparameter quantifiziert wird, indem in einer entsprechenden Quantifizierungstabelle ein Vektor ausgewählt wird, der einen minimalen Abstand zu den Frequenzparametern der Gruppe darstellt, wobei jede der beiden Quantifizierungstabellen in Bezug auf die beiden ersten Gruppen aus zwei jeweils unterschiedlichen Tabellen gemäß dem bestimmten spektralen Status (Y) des Sprachsignals ausgewählt wird.
Verfahren nach Anspruch 10, dadurch gekennzeichnet, daß die zwei unterschiedlichen Quantifizierungstabellen (T_I,1, T_I,2) in Bezug auf die Gruppe disjunkt sind und dadurch, daß die zwei unterschiedlichen Quantifizierungstabellen (T_II,1, T_II,2) in Bezug au die zweite Gruppe einen gemeinsamen Teil aufweisen.
Verfahren nach einem der vorhergehenden Ansprüche 1 bis 6, dadurch gekennzeichnet, daß die Koeffizienten (a_i) des Kurzzeit-Synthesefilters durch eine Menge von p geordneten Frequenzparametern von Spektrallinien (cos2πf_i) dargestellt werden, wobei p die Ordnung der linearen Kurzzeit-Vorhersage darstellt, dadurch daß jeder der p Parameter quantifiziert wird, indem ein Variationsinterval
das in einem jeweiligen Referenzinterval ([m_i,M_i]) enthalten ist, in 2^Ni Segmente unterteilt wird, wobei Ni die Zahl der Codierbits ist, die für die Quantifizierung dieses Parameters verwendet wird, und dadurch, daß wenigstens für die ersten Ordnungsparameter Referenzintervalle verwendet werden, wobei jedes aus zwei unterschiedlichen Intervallen ([m_i,1, M_i,1],[m_i,2,M_i,2]) gemäß dem bestimmten spektralen Status (Y) des Sprachsignals ausgewählt wird.
Verfahren nach einem der Ansprüche 1 bis 6 oder nach Anspruch 12, dadurch gekennzeichnet, daß die Koeffizienten (a_i) des Kurzzeit-Synthesefilters durch eine Menge aus p geordneten Frequenzparametern von Spektrallinien (cos2πf_i) dargestellt werden, wobei p die Ordnung der linearen Kurzzeit-Vorhersage ist, dadurch, daß jeder der p Parameter quantifiziert wird, indem ein Variationsinterval ([m_i,min{M_i,c andos2πf_i-1}]), das in einem jeweiligen Referenzintervall ([m_i,M_i]) enthalten ist, in 2^Ni Segmente unterteilt wird, wobei Ni die Anzahl der Codierbits ist, die zur Quantifizierung der Parameter verwendet wird, und dadurch, daß wenigstens bestimmten der Anzahlen von Codierbits Ni der eine oder der andere der zwei unterschiedlichen Werte gemäß dem bestimmten spektralen Status (Y) des Sprachsignals zugewiesen wird.