DE3810068C2 - - Google Patents
Info
- Publication number
- DE3810068C2 DE3810068C2 DE19883810068 DE3810068A DE3810068C2 DE 3810068 C2 DE3810068 C2 DE 3810068C2 DE 19883810068 DE19883810068 DE 19883810068 DE 3810068 A DE3810068 A DE 3810068A DE 3810068 C2 DE3810068 C2 DE 3810068C2
- Authority
- DE
- Germany
- Prior art keywords
- signal
- amplitude
- speech
- period
- signals
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 claims description 38
- 238000001514 detection method Methods 0.000 claims description 20
- 230000002238 attenuated effect Effects 0.000 claims 1
- 230000001934 delay Effects 0.000 claims 1
- 230000000737 periodic effect Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Noise Elimination (AREA)
- Interconnected Communication Systems, Intercoms, And Interphones (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
Die Erfindung betrifft ein Verfahren zur Erkennung von Sprach
signalen, wobei diese zunächst einem Teifpaß zugeführt werden,
dessen Durchlaßbereich im Bereich der Sprachgrundfrequenz liegt.
Auf dem Gebiet der Elektroakustik ist die Erkennung von Sprachsig
nalen von großer Bedeutung, da das Vorliegen von Sprachsignalen als
Kriterium für die Anhebung der Verstärkung herangezogen werden kann.
So wird beispielsweise zur akustischen Entkopplung von Freisprech
einrichtungen die Verstärkung des Sende- oder auch des Empfangssig
nals in Abhängigkeit vom Vorliegen eines Sprachsignals gesteuert.
Das gleiche gilt auch für Konferenzeinrichtungen.
In der US-PS 44 84 344 wird ein durch Sprachsignale gesteuerter
Schalter beschrieben, wobei die Signale zunächst einem Tiefpaß
filter zugeführt werden, welches für Frequenzen unterhalb von
750 Hz durchlässig ist. Die am Ausgang des Filters anstehenden Sig
nale werden einem Silbenfolgefilter zugeführt, wobei mit Hilfe einer
Offset-Schwelle eine Unterscheidung zwischen zwei Signalzuständen mög
lich ist. In dem einen Zustand wird der Schalter betätigt und läßt
Sprachsignale durch, während bei deren Fehlen der Schalter geöffnet
ist.
Weiterhin ist aus der DE-OS 18 02 502 eine Schaltungsanordnung zur
Feststellung der Anwesenheit von Sprachlauten bekannt, bei welcher
die Signale einem Spitzendetektor zugeführt werden, dessen Zeitkon
stante einerseits ausreichend groß ist, um periodische Signale bis
oberhalb der Grundfrequenz und Dauerstörungen in Gleichstromsignale
zu verwandeln und andererseits klein genug ist, um Änderungen der
Sprachgrundfrequenz zu folgen, wobei eine vom Spitzendetektor ge
speiste Differenzzierschaltung und ein Signalfühler zur Überwachung
der Wiederholungsfrequenz der differenzierten Signale vorhanden ist.
Nachteilig bei dieser Schaltungsanordung ist, daß periodische, nicht
modulierte Störsignale, deren Frequenz im Bereich der Sprachgrundfre
quenz liegt, nicht in allen Fällen mit eindeutiger Sicherheit von
Sprachsignalen unterschieden werden können.
Die Aufgabe der Erfindung besteht nun darin, ein Verfahren zur Er
kennung von Sprachsignalen anzugeben, bei welchem auch mit großer
Sicherheit periodische, nicht modulierte Störsignale, deren Fre
quenz im Bereich der Sprachgrundfrequenz liegt, von Sprachsignalen
unterschieden werden.
Diese Aufgabe wird dadurch gelöst, daß das Tiefpaßfilter eine obere
Grenzfrequenz von höchstens 400 Hz aufweist, daß am Ausgang des Tief
paßfilters auftretende Signale auf einem vorgegebenen Amplitudenwert
geprüft werden, daß bei Vorhandensein eines Signals vorgegebener Dauer
(ZF) oberhalb des vorgegebenen Amplitudenwerts eine Periode (PF) er
zeugt wird, daß bei Auftreten eines weiteren Signals dieser Dauer (ZF)
oberhalb des vorgegebenen Amplitudenwerts während der Periode (PF) ein
Zeitfenster (F) erzeugt wird, und daß dann ein Sprachsignal erkannt wird,
wenn eine erste Amplitude der vorgegebenen Dauer (ZF), eine zweite
Amplitude der vorgegebenen Dauer (ZF) während der Periode (PF) und
eine dritte Amplitude vorgegebener Dauer (ZF) während des Zeitfensters
(F) aufgetreten sind, wobei die vorgegebene Dauer der Hälfte der
kürzesten Periode der Sprachgrundfrequenz entspricht.
Die Signale werden zunächst nach Amplitudenhöchstwerten überprüft.
Sobald ein Amplitudenhöchstwert festgestellt wird, wird das Zeitfenster
einer Periode erzeugt. Fällt in dieses Zeitfenster ein weiteres Signal
vorgegebener Dauer oberhalb des vorgegebenen Amplitudenwerts, so wird
ein weiteres Zeitfenster erzeugt. Fällt in das zweite Zeitfenster
wiederum ein Signal bestimmter Dauer oberhalb des vorgegebenen Amplituden
werts, so handelt es sich bei den Signalen um Sprachsignale. Da die be
handelten Signale zuerst ein Tiefpaßfilter durchlaufen haben, welches
nur Signale der Sprachgrundfrequenz durchläßt, so kann bei einer Sprach
grundfrequenz der Signale von 80 hz bereits nach weniger als 40 ms
festgestellt werden, ob es sich um Sprachsignale handelt. Die Reaktions
zeit der Erkennung von Sprachsignalen nach dem erfindungsgemäßen Ver
fahren ist demnach erstaunlich kurz, so daß es kaum zu einer Unter
drückung von Anfangssilben kommt.
Die Erfindung wird anhand eines Ausführungbeispiels näher erläutert,
welches in der Zeichnung dargestellt ist.
Es zeigt
Fig. 1 eine Darstellung der Perioden eines Sprach
signals in Verbindung mit den Auswertekriterien
und
Fig. 2 das Blockschaltbild für eine Anordnung zur Durch
führung des Verfahrens.
Die in Fig. 1 dargestellten drei Amplituden A 1 bis A 3 sind die Amplituden
eines Sprachsignals, welche am Ausgang eines Tiefpaßfilters anstehen, dessen
Grenzfrequenz bei ca. 400 Hz liegt. Die dem Eingang des Tiefpaßfilters zuge
führten Signale werden beispielsweise von einem Mikrofon erzeugt und setzen
sich aus Raumgeräuschen und Sprachsignalen zusammen.
Das erfindungsgemäße Verfahren zur Erkennung von Sprachsignalen
benutzt nun zur Analyse im wesentlichen den Frequenzbereich der
Sprachgrundfrequenz (80 bis 333 Hz). Das wichtigste Merkmal zur
Erkennung von Sprachsignalen ist die Periodendauer der Schwingungen
der Sprachsignale, die bei der Sprachgrundfrequenz je nach Sprecher
im Bereich von 3 bis 12,5 ms liegt. Dieses erste Merkmal dient zur
Unterscheidung zwischenSprache und Störgeräusch. Zur sicheren Er
kennung von Sprachsignalen ist die Detektion von Nulldurchgängen im
Sprachsignal nicht sinnvoll, da sich bei Störung, beispielsweise
durch Rauschen, die Anzahl der Nulldurchgänge so stark erhöhen kann, so
daß eine Erkennung von Sprache auf diese Weise nicht mehr möglich ist.
Das Verfahren gemäß der Erfindung benutzt zur Erkennung von Sprache
die Maxima des Sprachsignals. Liegen diese dann doch innerhalb eines
vorgegebenen Amplituden-Zeitfensters, so ist ein erstes Kriterium
für das Vorhandensein von Sprachsignalen gegeben. Einen wesentlichen
Einfluß auf die Periodenerkennung hat die Wahl der Fensterparameter.
Die Fenstergröße wird derart gewählt, daß diese kleiner ist als
die Hälfte der kleinstmöglichen Periode der Sprachgrundfrequenz,
damit sowohl positive als auch negative Maximalwerte des Sprach
signals erkannt werden können. Dies ist notwendig, da das Sprach
signal bezüglich des Aussteuerungsbereichs nicht symmetrisch ist.
Die Fenstergröße beträgt demnach ca. 0,9 ms.
Die Amplitudentoleranz der Maximalwerte ist bei ungestörtem
Sprachsignal über einige Perioden sehr gering, kann aber bei
hohen Störpegeln infolge additiver Überlagerung des Störsignals
deutlich vergrößert werden. Das Amplitudenfenter beträgt ca. plus
minus 20% des ersten Maximums.
Bei ungestörter Sprache ist der Abstand der Maximalwerte
der Signale nicht konstant, da das Sprachsignal frequenz
moduliert wird. Ein streng periodischer Verlauf des Anregungs
signals kann nicht erwartet werden, die Schwankungen der Sprach
grundfrequenz können deshalb erheblich sein. Einen quasi perio
dischen Verlauf weisen jedoch die stimmhaften, eingeschwungenen
Laute auf. Wird das Signal gestört (beispielsweise additiv durch
Rauschen), so kann sich eine zusätzliche Verschiebung der
Signalmaxima in zeitlicher Richtung ergeben. Durchgeführte
Untersuchungen haben gezeigt, daß der Toleranzbereich für die
Detektion der Signalmaxima ca. 15% betragen kann.
Unter diesen Randbedingungen kann davon ausgegangen werden, daß
auch bei ungestörtem Sprachsignal nie mehr als 10 Perioden des
Signals die vorgegebenen Kriterien erfüllen, so daß anhand des
erfindungsgemäßen Verfahrens auch periodische, nicht modulierte
Störsignale, deren Frequenz im Bereich der Sprachgrundfrequenz
liegt, von Sprachsignalen unterschieden werden können.
Sobald ein Maximalwert erkannt wird, wird dessen zeitliche Position
abgespeichert. Erfüllt der nächste auftretende Maximalwert nicht
die weiter unten beschriebenen Bedingungen, so werden die Daten
des ersten Maximalwertes gelöscht und diejenigen des nächsten
Maximalwertes an dessen Stelle eingespeichert.
Bei dem in Fig. 1 gezeigten Beispiel einer Amplitudenfolge wird
davon ausgegangen, daß die gezeigten drei Maximalwerte M 1 bis
M 3 sämtliche zur Erkennung von Sprachsignalen erforderliche
Bedingungen erfüllen. Die Amplitude A 1 ist als Maximalwert er
kannt worden, woraufhin deren Dauer t 1 als Periodendauer abge
speichert wird. Bei der zeitlichen Mitte der Amplitude A 1 des
ersten Maximums M 1 beginnt das Zeitfenster der Periode PF
zu laufen, welches zwischen 3 und 12,5 ms geöffnet ist. Fällt nun
die nächste Amplitude A 2 in das Zeitfenster der Periode PF, da
deren Zeitfenster ZF innerhalb des Amplitudenfensters AF liegt, dann
wird die Dauer der Amplitude A 2 als zweites Maximum durch Einspeicherung
des Wertes t 2 gekennzeichnet. Liegt nun die Amplitude A 3 innerhalb
eines Zeitfensters F, welches durch die Periodendauer t 2 ± 7,5%
bestimmt wird,
so wird auch der Zeitwert t 3 des dritten
Maximums M 3 abgespeichert. Es wird noch darauf hingewiesen, daß das
Amplitudenfenster AF als Schwelle in Abhängigkeit von dem Amplituden
wert des ersten Maximums M 1 festgelegt wird.
Durch einen einfachen Zählvorgang zur Erfassung der drei aufeinander
folgenden Amplituden A 1 bis A 3, welche die oben beschriebenen Be
dinungen erfüllen, kann bereits auf Vorliegen eines Sprachsignals
geschlossen werden, wobei in diesem Fall eine Abspeicherung der Perioden
dauern t 1 bis t 3 nicht notwendig ist. Für eine genauere Bestimmung von
Sprachsignalen können jedoch zwei Verfahren herangezogen werden, die
im folgenden beschrieben werden.
Wurden mehrere Perioden einer Schwingung im Sprachgrundfrequenzbereich
erkannt, so erfolgt die Bestimmung des Korrelationsgrades zwischen den
einzelnen Perioden. Durch eine Kreuzkorrelation zwischen den aufneinander
folgenden Signalabschnitten einer Periodenlänge werden hohe Werte für
den normierten Kreuzkorrelationskoeffizienten in den Bereichen erreicht,
in denen Sprache vorhanden ist. Handelt es sich bei der detektierten
Periode jedoch nur um zufällige Maxima im vorgegebenen Intervall, so
ergibt die Korrelationsanalyse kleine Werte.
mit:
N p = Periodenlänge (in Abtastwerten)
s(n) = Eingangssignal
M = Anzahl der detektierten Perioden
N p = Periodenlänge (in Abtastwerten)
s(n) = Eingangssignal
M = Anzahl der detektierten Perioden
Zur Bestimmung von KKF (k · N p) wird die zweite bzw. im Falle der
Detektion mehrer Perioden auch die dritte Periode mit der ersten
korreliert. Werden drei Perioden korreliert, so wird zur Entschei
dung der kleinere der beiden Werte herangezogen. Dies vermindert ins
besondere bei Störung durch Rauschsignale die Fehlerhäufigkeit bei
zufällig detektierten Perioden. Werden mehr Perioden zur Detektion
herangezogen, so vermindert sich die Detektionsgeschwindigkeit, eine
weitere Verbesserung ist jedoch nicht zu erzielen, da die Werte von
KKF (k · N p) aufgrund der Amplituden- und Frequenzmodulation des Sprach
signals deutlich abnehmen.
Eine weitere Verbesserung der Entscheidung kann dadurch erzielt werden,
wenn anstelle der Auswertung der Kreuzkorrelationsfunktion zur Sprach
entscheidung der normierte mittlere quadratische Fehler zwischen den
erkannten Perioden benutzt wird.
mit k = 1, 2, 3
mit:
Δ f ² = normierter mittlerer quadratischer Fehler
mit:
Δ f ² = normierter mittlerer quadratischer Fehler
Die Verwendung dieses Fehlerkriteriums führt bei ungestörter Sprache
zu ähnlichen Ergebnissen, wie die Bildung der KKF (k · N p). Unter
schiede ergeben sich jedoch bei gestörtem Sprachsignal. Bei Bildung
der KKF (k · N p) führt die Unterscheidung zwischen Sprache und Störung
anhand des Korrelationskoeffizientens häufiger zu Fehlentscheidungen
als die Bildung 1 - Δ f ².
Sowohl KKF (k · N p) als auch 1 - Δ f ² können Werte im Bereich von
0 bis 1 annehmen. Überschreitet der Wert von KKF (k · N p) bzw. von
1 - Δ f ² einen Wert von beispielsweise 0,7, so wird das Eingangssignal
als Sprache markiert. Untersuchungen haben gezeigt, daß die Wahl der
Schwelle unkritisch ist, sie kann auch im Bereich von 0,3 bis 0,9 ge
wählt werden.
Der entscheidende Vorteil dieses Verfahrens zur Sprachdetektion ist
die Erkennungszeit. Im ungünstigsten Fall, d. h. wenn der Sprecher
eine Stimmgrundfrequenz von 80 Hz hat und bei einer Detektion von
drei Perioden beträgt die Detektionszeit 37,5 ms.
Bei ungestörten Signalen ergibt die Analyse nach dem eingangs bechriebenen
vereinfachten Verfahren annähernd die gleichen Ergebnisse, wie das Aus
werteverfahren mit Kreuzkorrelation oder nach Ermittlung des mittleren
quadratischen Fehlers. Die Erkennungsrate liegt im Mittel 5% unter der
Erkennungsrate des zuvor beschriebenen Verfahrens, kann aber auch je
nach Störschallsituation höhere Werte annehmen. Unterschiede zu dem
vorgenannten Verfahren werden bei Störung der Sprachsequenz deutlich.
Bei den gewählten Parametern kann die Periodenerkennung, abhängig vom
jeweiligen Störgeräusch, für einige Störschallsituationen eine erhöhte
Anzahl von Fehlentscheidungen liefern. Insbesondere bei Störung durch
impulshaltige Signale werden Reflektionen des Störsignals, wenn sie die
Kriterien für das Vorhandensein von Sprache erfüllen, als Sprache er
kannt und führen zu Fehlentscheidungen. Die Detektion von sinusförmigen
Störanteilen im Bereich der Sprachgrundfrequenz ist nur anhand der zeit
lichen Dauer und Frequenzkonstanz dieses Störsignals möglich.
Die Auswahl des anzuwendenden Verfahrens zur Sprachdetektion wird im
wesentlichen von den zu erwartenden Nutz-/Störleistungsverhältnissen
sowie den Störgeräuschen bestimmt. Bei Nutz-/Störleistungsverhältnissen
von größer 12 dB kann bereits das vereinfachte Detektionsverfahren ohne
Rechenvorgänge angewandt werden. Sämtliche Verfahren haben jedoch nur eine
kurze Signalverzögerung im Bereich der Detektionszeit (9 bis 37 ms) zur
Folge, so daß Anfangssilben nicht unterdrückt werden.
Die Realisierung des vorgestellten Verfahrens kann beispielsweise mit
Hilfe eines Signalprozessors SP (s. Fig. 2) erfolgen. Das analoge
Signal des Mikrofons M wird über den Analog/Digitalwandler W 1 abge
tastet und digitalisiert. Die so gewonnenen Abtastwerte können ge
mäß dem erfindungsgemäßen Verfahren zur Sprachdetektion durch den Signal
prozessor herangezogen werden. Wird Sprache erkannt, so kann das Mikrofon
signal um einen festgelegten Betrag auf Veranlassung des Signalprozessors
SP durch den Regelverstärker RV 1 verstärkt werden.
Eine derartige Anordnung ist beispielsweise für Mikrofone geeignet,
welche sich in einem Raum mit einem großen Störgeräuschen befinden.
Durch die Verstärkung der Sprachsignale wird auf diese Weise eine
bessere Verständlichkeit erzielt.
Bei dem in Fig. 2 gezeigten Anwendungsbeispiel ist eine Freisprechein
richtung vorhanden, wobei bei dieser bei Vorhandensein eines Sprachsignals
im Signal des Mikrofons M der Regelverstärker RV 2 durch den Siganlpro
zessor SP veranlaßt wird, das Signal für den Lautsprecher LS entsprechend
zu dämpfen, um auf diese Weise eine akustische Rückkopplung zwischen Laut
sprecher LS und Mikrofon M zu verhindern. Umgekehrt könnte auch bei Vor
liegen von Sprachsignalen für den Lautsprecher LS der Regelverstärker RV 2
auf Veranlassung des Signalprozessors SP derart beeinflußt werden, daß
diese das Eingangssignal höher verstärkt, um auf diese Weise eine bessere
Verständlichkeit des Lautsprechersignals Ls zu erreichen.
Der Signalprozessor erhält an seinen Eingägne SE und EE Datenworte,
welche die Abtastwerte der Signale darstellen. Ebenso werden an den
Ausgängen SA und EA des Signalprozessors SP Datenworte an die ange
schlossenen Leitungen angelegt. Zur Vermeidung der Unterdrückung von An
fangssilben können die Eingangssignale mit Hilfe des Signalprozessors SP
um eine Zeit verzögert werden, welche im Bereich der Erkennungszeit (5-
37 ms) liegen. Ebenso kann durch den Signalprozessor SP eine Abfallzeit
für die die Regelverstärker RV beeinflussenden Steuersignale erzeugt werden,
die in einer Größenordnung von 200 bis 900 ms liegt und zur Überbrückung
von stimmlosen Lauten und kurzen Sprachpausen zwischen Wörtern und Sätzen
dient. Die Funktion der Tiefpaßfilterung mit einer Grenzfrequenz von
400 Hz kann ebenfalls durch den Signalprozessor SP vorgenommen werden.
Eine andere Anwendung des erfindungsgemäßen Verfahrens ist auch im Rahmen
einer Gegensprechanlage denkbar, wobei in Abhängigkeit von Sprahsignalen
in der einen Richtung die andere Richtung auf Veranlassung des Signalpro
zessors entsprechend gedämpft wird.
Auf den Aufbau eines Signalprozessors wird im Rahmen dieser Beschreibung
nicht weiter eingegangen, derartige Signalprozessoren werden jedoch bei
spielsweise von der Firma Texas Instruments unter der Bezeichnung TMS 320
oder von der Firma Fujitsu unter der Bezeichnung MB 8764 vertrieben.
Ein solchen Signalprozessor ist derart zu programmieren, daß die be
schriebenen Verfahrensschritte selbständig ablaufen. Zur Umsetzung der
analogen Signale in digitale Signale zur Signalverarbeitung in dem Signal
prozessor SP dienen die Analog/Digital-Wandler W 1 und W 4, während die Um
setzung der an den Ausgängen SA und EA auftretenden digitalen Signale in
analoge Signale durch die Digital/Analog-Wandler W 2 und W 3 erfolgt.
Im Gegensatz zu dem in Fig. 2 gezeigten Blockschaltbild kann auch auf
die Regelverstärker RV 1 und RV 2 verzichtet werden, wenn die Funktion der
Verstärkung der Signale durch den Signalprozessor SP selbst übernommen
wird, der auch als geeigneter Mikroprozessor ausgebildet sein kann. Ebenso
ist die Durchführung des erfindungsgemäßen Verfahrens durch eine entsprechen
de diskret aufgebaute analoge Schaltungsanordnung oder auch einen ent
sprechend ausgebildeten Kundenschaltkreis denkbar.
Claims (18)
1. Verfahren zur Erkennung von Sprachsignalen, wobei diese zunächst
einem Tiefpaßfilter zugeführt werden, dessen Durchlaßbereich im
Bereich der Sprachgrundfrequenz liegt,
dadurch gekennzeichnet
daß das Tiefpaßfilter eine obere Grenzfrequenz von höchstens 400 Hz
aufweist, daß am Ausgang des Tiefpaßfilters auftretende Signale auf
einen vorgegebenen Amplitudenwert geprüft werden, daß bei Vorhanden
sein eines Signals vorgegebener Dauer (ZF) oberhalb des vorgegebenen
Amplitudenwertes eine Periode (PF) erzeugt wird, daß bei Auftreten
eines weiteren Signals dieser Dauer (ZF) oberhalb des vorgegebenen
Amplitudenwerts während der Periode (PF) ein Zeitfenster (F) erzeugt
wird, und daß dann ein Sprachsignal erkannt wird, wenn eine erste Ampli
tude der vorgegebenen Dauer (ZF), eine zweite Amplitude der vorgegebenen
Dauer (ZF) während der Periode (PF) und eine dritte Amplitude vorge
gebener Dauer (ZF) während des Zeitfensters (F) aufgetreten sind, wobei
die vorgegebene Dauer der Hälfte der kürzesten Periode der Sprachgrund
frequenz entspricht.
2. Verfahren nach Anspruch 1,
dadurch gekennzeichnet,
daß sowohl positive als auch negative Amplituden überprüft werden.
3. Verfahren nach Anspruch 1,
dadurch gekennzeichnet,
daß die Überprüfung der folgenden Amplituden über ein Amplituden
fenster (AF) erfolgt, dessen Amplitudenbereich in Abhängigkeit von
dem ersten erkannten Amplitudenhöchstwert festgelegt wird.
4. Verfahren nach Anspruch 3,
dadurch gekennzeichnet,
daß das Amplitudenfenster einen Amplitudenbereich von +20 bis -20%
des Amplitudenhöchstwertes aufweist.
5. Verfahren nach einem der Ansprüche 1 oder 3,
dadurch gekennzeichnet,
daß der Zeitraum zwischen dem ersten erkannten Amplitudenhöchst
wert und der folgenden im Amplitudenfenster (AF) liegenden Amplitude
innerhalb eines vorgegebenen Zeitrahmens gemessen wird.
6. Verfahren nach Anspruch 5,
dadurch gekennzeichnet,
daß der Zeitrahmen (PF) zwischen 3 und 12,5 ms liegt.
7. Verfahren nach Anspruch 5,
dadurch gekennzeichnet,
daß der dritte Amplitudenhöchstwert (A 3) in einem Zeitfenster (F)
liegen muß, dessen Lage durch den Abstand zwischen dem ersten (A 1)
und dem zweiten (A 2) Amplitudenhöchstwert bestimmt wird und innerhalb
einer Toleranz von ± 7,5% desselben liegt.
8. Verfahren nach einem der Ansprüche 1 bis 7,
dadurch gekennzeichnet,
daß die erste Periode und die zweite Periode bzw. die erste Periode
und die dritte Periode zur Bestimmung der Kreuz-Korrelationsgrade
benutzt wird.
9. Verfahren nach einem der Ansprüche 1 bis 8,
dadurch gekennzeichnet,
daß aus den gemessenen Zeiträumen der ersten und der zweiten bzw.
der ersten und der dritten Periode der normierte mittlere quadratische
Fehler ermittelt wird.
10. Verfahren nach einem der Ansprüche 8 oder 9,
dadurch gekennzeichnet,
daß die ermittelten Werte mit Hilfe einer wählbaren Schwelle
überprüft werden und daß bei Überschreiten der Schwelle durch
einen ermittelten Wert ein Sprachsignal erkannt wird.
11. Verfahren nach einem der Ansprüche 1 bis 10,
dadurch gekennzeichnet,
daß das analoge Eingangssignal einem Analog/Digital-Wandler
zugeführt wird.
12. Verfahren nach einem der Ansprüche 1 bis 11,
dadurch gekennzeichnet,
daß das digitalisierte Eingangssignal einem Signalprozessor
(SP) zugeführt wird, welcher ein, das Vorliegen eines Sprach
signals kennzeichnendes Ausgangssignal liefert.
13. Verfahren für eine Mikrofonverstärkerschaltung mit einem Regel
verstärker nach einem der Ansprüche 1 bis 12,
dadurch gekennzeichnet,
daß bei Vorliegen eines Sprachsignals das Eingangssignal
des Regelverstärkers (RV) auf Veranlassung des Signalprozessors
um einen vorgegebenen Wert verstärkt wird.
14. Verfahren für eine ein Mikrofon und ein Lautsprecher aufweisen
de Freisprecheinrichtung mit je einem Regelverstärker für das
Mikrofon- und das Lautsprechersignal, nach einem der Ansprüche 1
bis 13, dadurch gekennzeichnet,
daß bei Vorliegen eines Sprachsignals des Mikrofons (M) das
Lautsprechersignal um einen vorgegebenen Wert durch den zugeord
neten Regelverstärker (RV 2) auf Veranlassung des Signalprozessors
(SP) gedämpft wird.
15. Verfahren nach einem der Ansprüche 12 bis 14,
dadurch gekennzeichnet,
daß durch den Signalprozessor (SP) das Mikrofonsignal um den
Betrag der Erkennungszeit von Sprachsignalen verzögert wird.
16. Verfahren für eine Gegensprecheinrichtung mit je einem in
jeder der beiden Richtungen liegenden Regelverstärker, nach
einem der Ansprüche 1 bis 15,
dadurch gekennzeichnet,
daß durch den Signalprozessor (SP) bei Vorliegen eines Sprachsig
nals der betreffende Regelverstärker aufgesteuert und der andere
Regelverstärker gedämpft wird.
17. Verfahren nach einem der Ansprüche 1 bis 16,
dadurch gekennzeichnet
daß das Steuersignal für den bzw. die Regelverstärker nach Aus
bleiben eines Sprachsignals für eine bestimmte Zeit aufrechter
halten wird.
18. Verfahren nach einem der Ansprüche 1 bis 17,
dadurch gekennzeichnet,
daß die Funktion der Regelverstärker (RV 1, RV 2) durch den Sig
nalprozessor (SP) übernommen wird.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19883810068 DE3810068A1 (de) | 1988-03-25 | 1988-03-25 | Verfahren zur erkennung von sprachsignalen |
EP19890102876 EP0334023A3 (de) | 1988-03-25 | 1989-02-20 | Verfahren zur Erkennung von Sprachsignalen |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19883810068 DE3810068A1 (de) | 1988-03-25 | 1988-03-25 | Verfahren zur erkennung von sprachsignalen |
Publications (2)
Publication Number | Publication Date |
---|---|
DE3810068A1 DE3810068A1 (de) | 1989-10-05 |
DE3810068C2 true DE3810068C2 (de) | 1990-01-11 |
Family
ID=6350648
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19883810068 Granted DE3810068A1 (de) | 1988-03-25 | 1988-03-25 | Verfahren zur erkennung von sprachsignalen |
Country Status (2)
Country | Link |
---|---|
EP (1) | EP0334023A3 (de) |
DE (1) | DE3810068A1 (de) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5315688A (en) * | 1990-09-21 | 1994-05-24 | Theis Peter F | System for recognizing or counting spoken itemized expressions |
US5822726A (en) * | 1995-01-31 | 1998-10-13 | Motorola, Inc. | Speech presence detector based on sparse time-random signal samples |
SE9502217L (sv) * | 1995-06-19 | 1996-09-23 | Tore Fjaellbrandt | Metod och anordning för att bestämma en pitchfrekvens i en talsignal |
FI991132A (fi) * | 1999-05-18 | 2000-11-19 | Voxlab Oy | Menetelmä tutkia näytteistä muodostetun digitaalisen signaalin rytmisy yttä |
DE10321625B4 (de) * | 2003-05-13 | 2007-08-23 | Gehrke Kommunikationssyteme Gmbh | Signalübertragungsvorrichtung und Verfahren zum Regeln einer Signalübertragungsvorrichtung |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3513260A (en) * | 1967-10-13 | 1970-05-19 | Ibm | Speech presence detector |
US3751602A (en) * | 1971-08-13 | 1973-08-07 | Bell Telephone Labor Inc | Loudspeaking telephone |
FR2380612A1 (fr) * | 1977-02-09 | 1978-09-08 | Thomson Csf | Dispositif de discrimination des signaux de parole et systeme d'alternat comportant un tel dispositif |
US4484344A (en) * | 1982-03-01 | 1984-11-20 | Rockwell International Corporation | Voice operated switch |
GB2137458B (en) * | 1983-03-01 | 1986-11-19 | Standard Telephones Cables Ltd | Digital handsfree telephone |
-
1988
- 1988-03-25 DE DE19883810068 patent/DE3810068A1/de active Granted
-
1989
- 1989-02-20 EP EP19890102876 patent/EP0334023A3/de not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
EP0334023A2 (de) | 1989-09-27 |
DE3810068A1 (de) | 1989-10-05 |
EP0334023A3 (de) | 1991-02-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE4126902C2 (de) | Sprachintervall - Feststelleinheit | |
DE2719973C2 (de) | ||
DE69331181T2 (de) | Tonverstärkervorrichtung mit automatischer Unterdrückung akustischer Rückkopplung | |
DE3101851C2 (de) | Vorrichtung zum Erkennen von Sprache | |
DE3802903C2 (de) | ||
DE69915711T2 (de) | Verfahren und signalprozessor zur verstärkung von sprachsignal-komponenten in einem hörhilfegerät | |
DE3235279C2 (de) | Spracherkennungseinrichtung | |
DE2518320A1 (de) | Verfahren und detektorschaltung zum feststellen einer signalaktivitaet im tonfrequenzbereich bei einer fernsprechverbindungsleitung | |
DE69529223T2 (de) | Testverfahren | |
DE3525472A1 (de) | Anordnung zum detektieren impulsartiger stoerungen und anordnung zum unterdruecken impulsartiger stoerungen mit einer anordnung zum detektieren impulsartiger stoerungen | |
CH691787A5 (de) | Klirrunterdruckung bei Hörgeräten mit AGC. | |
EP1101390B1 (de) | Hörhilfe mit verbesserter sprachverständlichkeit durch frequenzselektive signalverarbeitung sowie verfahren zum betrieb einer derartigen hörhilfe | |
DE69419223T2 (de) | Vorrichtung zur Sprachverbesserung | |
DE2710834C2 (de) | Einbruch-Alarmsystem | |
DE3810068C2 (de) | ||
DE4106405A1 (de) | Geraeuschunterdrueckungseinrichtung | |
DE3733983A1 (de) | Verfahren zum daempfen von stoerschall in von hoergeraeten uebertragenen schallsignalen | |
DE69112855T2 (de) | Sprachsignalverarbeitungsvorrichtung. | |
EP1458216B1 (de) | Vorrichtung und Verfahren zur Adaption von Hörgerätemikrofonen | |
EP1382034B1 (de) | Verfahren zur bestimmung von intensitätskennwerten von hintergrundgeräuschen in sprachpausen von sprachsignalen | |
DE69208602T2 (de) | Ein den Frequenzhub begrenzender Übertragungsschaltkreis | |
DE3779708T2 (de) | Schaltungsanordnung zur isolationsgewaehrung zwischen den uebertragungswegen eines freisprechapparates. | |
DE3734446C2 (de) | ||
EP0777130B1 (de) | Digitales Verfahren zur Detektion zeitlich kurzer Pulse und Anordnung zur Durchführung des Verfahrens | |
DE3320751A1 (de) | Schaltungsanordnung zum selbsttaetigen anpassen der lautstaerke eines lautsprechers an einen am lautsprecherort herrschenden stoergeraeuschpegel |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law | ||
D2 | Grant after examination | ||
8364 | No opposition during term of opposition | ||
8327 | Change in the person/name/address of the patent owner |
Owner name: TELENORMA GMBH, 6000 FRANKFURT, DE |
|
8327 | Change in the person/name/address of the patent owner |
Owner name: ROBERT BOSCH GMBH, 70469 STUTTGART, DE |
|
8327 | Change in the person/name/address of the patent owner |
Owner name: TENOVIS GMBH & CO. KG, 60326 FRANKFURT, DE |