[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

SE506034C2 - Förfarande och anordning för förbättring av parametrar representerande brusigt tal - Google Patents

Förfarande och anordning för förbättring av parametrar representerande brusigt tal

Info

Publication number
SE506034C2
SE506034C2 SE9600363A SE9600363A SE506034C2 SE 506034 C2 SE506034 C2 SE 506034C2 SE 9600363 A SE9600363 A SE 9600363A SE 9600363 A SE9600363 A SE 9600363A SE 506034 C2 SE506034 C2 SE 506034C2
Authority
SE
Sweden
Prior art keywords
power density
spectral power
estimate
improved
background noise
Prior art date
Application number
SE9600363A
Other languages
English (en)
Other versions
SE9600363D0 (sv
SE9600363L (sv
Inventor
Peter Haendel
Patrik Soerqvist
Original Assignee
Ericsson Telefon Ab L M
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ericsson Telefon Ab L M filed Critical Ericsson Telefon Ab L M
Priority to SE9600363A priority Critical patent/SE506034C2/sv
Publication of SE9600363D0 publication Critical patent/SE9600363D0/sv
Priority to US08/781,515 priority patent/US6324502B1/en
Priority to PCT/SE1997/000124 priority patent/WO1997028527A1/en
Priority to DE69714431T priority patent/DE69714431T2/de
Priority to AU16790/97A priority patent/AU711749B2/en
Priority to JP9527551A priority patent/JP2000504434A/ja
Priority to KR1019980705713A priority patent/KR100310030B1/ko
Priority to CN97191991A priority patent/CN1210608A/zh
Priority to EP97902783A priority patent/EP0897574B1/en
Priority to CA002243631A priority patent/CA2243631A1/en
Publication of SE9600363L publication Critical patent/SE9600363L/sv
Publication of SE506034C2 publication Critical patent/SE506034C2/sv

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Noise Elimination (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Filters That Use Time-Delay Elements (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Description

506 054 2 trycka bullret. De förbättrade talparametrarna kan dock även användas direkt såsom talparametrar i talkodning.
Ovanstående syftemål löses genom ett förfarande i enlighet med krav 1 och en an- ordning i enlighet med krav 11.
KORT BESKRIVNING AV RITNINGARNA Uppfinningen samt ytterligare syftemål och fördelar med denna förstås bäst genom hänvisning till nedanstående beskrivning och de bifogade ritningarna, i vilka: Figur 1 ning; Figur 2 Figur 3 Figur 4 Figur 5 Figur 6 Figur 7 är ett blockschema av en anordning i enlighet med föreliggande uppfin- är ett tillståndsdiagram för en talaktivitetsdetektor (VAD) som används i anordningen enligt krav 1; är ett flödesschema som illustrerar förfarandet i enlighet med föreliggande uppfinning; illustrerar de väsentliga särdragen för den spektrala effekttätheten (PSD) av bullrigt tal; illustrerar en liknande spektral effekttäthet för bakgrundsbuller; illustrerar den resulterande spektrala effekttätheten efter subtraktion av effekttätheten i figur 5 från effekttätheten i figur 4; illustrerar den förbättring som erhålls genom föreliggande uppfinning i form av en förlustfunktion; och 506 034 3 Figur 8 illustrerar den förbättring som erhålls genom föreliggande uppfinning i form av en förlustkvot.
DETALJERAD BESKRIVNING AV DE FÖREDRAGNA QTFÖRINGSFORMERNA Vid talsignalbehandling är det inmatade talet ofta förvrängt av bakgrundsbuller. Vid exempelvis ”hands-free"-mobiltelefoni kan förhållandet mellan tal och bakgrunds- buller vara så lågt som, eller till och med lägre än, 0 dB. Sådana höga bullernivåer försämrar väsentligt samtalskvaliteten, ej endast beroende på den höga bullerni- vàn, utan även pà grund av Ijudartifakter som alstras när bullrigt tal kodas och överförs via en digital kommunikationskanal. I syfte att reducera dessa Ijudartifakter kan det bullriga inmatade talet förbehandlas genom bullerreduktionsmetod, t.ex. ge- nom Kalman-filtrering [1].
Vid vissa bullerreduktionsmetoder (t.ex. vid Kalman-filtrering) är autoregressiva (AR) parametrar av intresse. Därför är noggranna skattningar av AR-parametrarna ur bullriga taldata väsentliga för att dessa metoder skall ge en förbättrad tal-utsignal med hög ljudkvalitet. En sådan metod för förbättring av parametrar representerande bullrigt tal kommer nu att beskrivas under hänvisning till figurema 1-6.
I figur 1 erhålls en kontinuerlig analog signal x(t) från en mikrofon 10. Signalen x(t) leds till en A/D-omvandlare 12. Denna A/D-omvandlare (och lämplig datamellanlag- ring) producerar ramar {x(k)} av ljuddata (innehållande antingen tal, bagrundsbuller eller båda). En ljudram kan i typfallet innehålla mellan 100-300 ljudsampel vid en samplingsfrekvens pà 8000 Hz. I syfte att förenkla nedanstående diskussion anta- ges en ramlängd N=256 sampel. Ljudramen {x(k)} leds till en talaktivitetsdetektor (VAD) 14, som styr en omkopplare 16 som leder ljudramar {x(k)} till olika block i an- ordningen beroende på talaktivitetsdetektoms 14 tillstånd.
Talaktivitetsdetektorn VAD 14 kan vara konstruerad i enlighet med principerna som diskuteras i (21, och är vanligen implementerad såsom en tillstàndsmaskin. Figur 2 506 034 4 illustrerar de möjliga tillstånden för en sådan tillståndsmaskin, “l tillstånd 0 är talakti- vitetsdetektorn 14 i ett vilotillstånd eller ”inaktiv", vilket innebär att ljudramar {x(k)} ej behandlas ytterligare. Tillståndet 20 innebär en bullernivà men inget tal. Tillståndet 21 innebär en bullernivà och ett lågt tallbullerförhållande. Detta tillstånd är framför- allt aktivt under övergångar mellan talaktivitet och buller. Slutligen innebär tillståndet 22 en bullernivà och ett högt tallbullerförhållande. En ljudram {x(k)} innehåller ljud- sampel som kan uttryckas såsom x(k) = s(k)+v(k) k=1,...,N (1) där x(k) betecknar bullriga talsampel, s(k) betecknar talsampel och v(k) betecknar färgat additivt bakgrundsbuller. Den bullriga talsignalen x(k) antages vara stationär över en ram. Vidare kan talsignalen s(k) beskrivas av en autoregressiv (AR) modell av ordning r f s(k) = -zcisfk -Ü+w,(k) (2) í=l där variansen av ws(k) ges av of. På liknande sätt kan v(k) beskrivas av en AR- modell av ordning q 9 v(k) = ' Eb: v(k _ Ü+ Wv i=l där variansen av wv(k) ges av of. Både r och q är mycket mindre än ramlängden N.
Normalt ligger värdet på r företrädesvis runt 10, medan q företrädesvis har ett värde i intervallet 0-7, t.ex. 4 (q=0 svarar mot en konstant spektral effekttäthet, dvs vitt brus).
Ytterligare information om AR-modellering av tal finns i [3]. 506 034 5 Vidare kan den spektrala effekttätheten q>,,(w ) av bullrigt tal delas upp i en summa av den spektrala effekttätheten m, (w ) av tal och den spektrala effekttätheten bakgrundsbullret, dvs cww) = cmwfloyfw) “ (4) av (2) följer att ara» = <5) ll+zcmeimiz m-I Av (3) följer på liknande sätt att 2 U + Zbmëimjz n|=l Av (2)-(3) följer att x(k) följer en autoregressiv modell med rörligt medelvärde (ARMA = autoregressive moving average) och med spektral effekttäthet q>,(w) . Ett estimat av q>,(m) (här och nedan skattade kvantiteter betecknas med en hatt "^”) kan uppnås genom en autoregressiv (AR) modell, dvs »z mm) ~ äga- (n ll + Zâ.. emlz mß] där {àj} och å f är de skattade parametrama av AR-modellen x(k) = -Éalxnf-vfinrk) <8) í=l där variansen av w,(k) ges av af och där rsp sN. Det bör noteras att (5,1 w ) i (7) ej är en statistiskt konsistent skattning av ,(w). Vid talsignalbehandling är detta dock ej ett allvarligt problem, eftersom x(k) i praktiken är långt ifrån en stationär process, 506 034 När talaktivitetsdetektorn VAD 14 i figur 1 indikerar tal (tillstånden 21 och 22 i figur 2) leds signalen x(k) till en AR-estimator 18 för bullrigt tal, vilken skattar parametrar- na of, {ai} i ekvation (8). Denna skattning kan utföras i enlighet med [3] (i flödesschemat i figur 3 svarar detta mot steg 120). De skattade parametrama leds till ett block 20,som beräknar en skattning av den spektrala effekttätheten av in-signalen x(k) i enlighet med ekvation (7) (steg 130 i figur 3).
Det är ett väsentligt särdrag hos föreliggande uppfinning att bakgrundsbullret kan be- handlas såsom varande långtidsstationärt, dvs stationärt över flera ramar. Eftersom ta- laktiviteten vanligen är tillräckligt låg för att medge skattning av bullerrnodellen i tidsperi- oder där s(k) ej förekommer, kan den làngtidsstationära egenskapen användas för spektral subtraktion av effekttätheten för buller under bullriga talramar genom mellanlag- ring' av bullerrnodellparametrama under bullerramar för senare användning under bullri- ga talramar. När talaktivitetsdetektom VAD 14 indikerar bakgrundsbuller (tillstånd 20 i figur 2) leds ramen sålunda till en AR-parameterestimator 22 för buller, vilken estimerar parametrama of och {bi} för ramen (detta svarar mot steg 140 iflödesschemat ifigur 3).
Såsom nämnts ovan lagras de skattade parametrama i en buffert 24 för senare an- vändning under en bullrig talram (steg 150 i figur 3). När dessa parametrar behövs (under en bullrig talram) hämtas de från bufferten 24. Parametrama leds också till ett block 26 för spektral effekttäthetsskattning av bakgrundsbullret, antingen under buller- ramen (steg 160 i figur 3), vilket innebär att skattningen måste mellanlagras för senare användning, eller under nästa talram, vilket innebär att endast parametrama behöver mellanlagras. Under ramar som innehåller endast bakgrundsbuller används alltså de skattade parametrama ej för förbättringsändamàl. Istället leds bullersignalen till en däm- pare 28, som dämpar bullemivàn med exempelvis 10 dB (steg 170 i figur 3).
Skattningen â>,(w) av den spektrala effekttätheten (PSD), definierad genom ekvation (7) och PSD-skattningen (ßfw) definierad av en ekvation liknande ekvation (6) men med "^”-tecknet över AR-parametrama och. of, är funktioner av frekvensen m. Nästa steg är att utföra den faktiska PSD-subtraktionen, vilket utförs i ett block 30 (steg 180 i 506 034 7 figur 3). I enlighet med uppfinningen skattas den spektrala effekttätheten av talsignalen enligt óßv) = öJaU-öèJw) (9) där ö är en skalär designvariabel, som i typfallet ligger i intervallet 0<ö<4. l normala fall har ö ett värde runt 1 (5 = 1 svarar mot ekvation (4)).
Det är ett väsentligt särdrag hos föreliggande uppfinning att den förbättrade spekt- rala effekttätheten (ßjw) samplas vid ett tillräckligt antal frekvenser m för att en nog- grann bild av den förbättrade spektrala effekttätheten skall erhållas. l praktiken beräk- nas den spektrala effekttätheten vid en diskret uppsättning frekvenser w=_ m=1,...,M (10) se [3], vilket ger en diskret sekvens av PSD-skattningar {<í>,(1).å>,(2).----<í>..(1W} = {<í>,(m)} m=1---M (11) Detta särdrag illustreras ytterligare i figurerna 4-6. Figur 4 illustrerar en typisk PSD- skattning (fy/w) för bullrigt tal. Figur 5 illustrerar en typisk PSD-skattning ännu) av bakgrundsbuller. l detta fall är signal-till-brus-förhàllandet mellan signalema i figurema 4 och 5 lika med 0 dB. Figur 6 illustrerar den förbättrade PSD-skattningen å>,(w) efter bullersubtraktion i enlighet med ekvation (9), varvid i detta fall ö = 1. Eftersom formen av FSD-skattningen fßfw) är av betydelse för skattningen av de förbättrade talparamet- rama (som kommer att beskrivas nedan) är det ett väsentligt särdrag hos föreliggande uppfinning att den förbättrade PSD-skattningen 431m ) samplas vid ett tillräckligt antal frekvenser för att ge en sann bild av funktionens form (i synnerhet av toppama). 506 034 8 l praktiken samplas (ßfw) genom användning av (6) och (7). l exempelvis uttrycket (7) kan (ßjw) samplas genom användning av den snabba Fourier-transformen (FFT).
Sålunda betraktas 1, a1, a; a, såsom en sekvens, vars snabba Fourier-transform skall beräknas. Eftersom antalet sampel M måste vara större än p (p är approximativt 10-20) kan det vara nödvändigt att nollfylla (zero pad) sekvensen. Lämpliga värden på M är värden som utgörs av potenser av 2, t.ex. 64, 128, 256. Vanligen kan dock antalet sampel M väljas mindre än ramlängden (N = 256 i detta exempel). Eftersom (ßxm) re- presenterar den spektrala tätheten av effekt, vilket är en icke-negativ kvantitet, måste de samplade värdena av (ßjw) begränsas till icke-negativa värden innan de förbättrade talparametrama beräknas ur den samplade förbättrade PSD-skattning (iyfw).
Sedan blocket 30 har utfört PSD-subtraktionen leds uppsättningen {¿;s(m) l av sampel till ett block 32 för beräkning av förbättrade talparametrar ur PSD-skattningen (steg 190 i figur 3). Denna operation är den omvända jämfört med blocken 20 och 26, vilka beräk- nar PSD-skattningar ur AR-parametrar. Eftersom det ej är möjligt att explicit beräkna dessa parametrar direkt ur PSD-skattningen mäste iterativa algoritmer användas. En generell algoritm för systemidentifiering, tex. såsom föreslås i [4] kan användas.
En föredragen procedur för beräkning av de förbättrade parametrama beskrivs också i bifogade APPENDlX.
De förbättrade parametrama kan antingen användas direkt, t.ex. i samband med talkod- ning, eller kan användas för att styra ett filter, tex. ett Kalman-filter 34 i brusundertrycka- ren i figur 1 (steg 200 i figur 3). Kalman-filtret 34 styrs också av de skattade AR- parametrama, och dessa två parameteruppsättningar styr Kalman-filtret 34 för filtrering av ramar {x(k)} innehållande bullrigt tal i enlighet med de principer som beskrivs i [1].
Om endast de förbättrade talparametrama erfordras av en tillämpning är det ej nödvän- digt att skatta AR-parametrar för buller (i bullerundertryckaren ifigur 1 måste de skattas .506 034 9 eftersom de styr Kalman-filtret 34). lstället kan làngtidsstationäriteten av bakgrundsbull- ret användas för skattning av atrwf” = para» /'"”+r1-p1$..rw) (12) där (51 w f” är den (löpande) medelvärdesbildade PSD-skattningen baserad på data upp till och inkluderande ramnummer m, och öjw) är skattningen som baseras på den aktuella ramen ( švm) kan skattas direkt ur in-signalsdata genom ett periodo- gram (FFT)). Skalären p e (0,1) avstäms i relation till den antagna stationäriteten av v(k). Ett medelvärde över 1 ramar svarar grovt mot ett p implicit givet av f = _2- (13) 1-12 Parametem p kan exempelvis ha ett värde runt 0,95. l en föredragen utföringsform utförs medelvärdesbildning l enlighet med (12) även för en parametrisk PSD-skattning i enlighet med (6). Denna medelvärdesbildningsprocedur kan utgöra en del av blocket i figur 1 och kan utföras såsom en del av steg 160 i figur 3. l en modifierad version av utföringsfonnen i figur 1 kan dämparen 28 utelämnas. istället kan Kalman-filtret 34 användas såsom en dämpare av signalen x(k). l detta fall leds pa- rametrama för AR-modellen av bakgrundsbuller till Kalman-filtrets 34 båda styringängar, men med en lägre variansparameter (svarande mot den önskade dämpningen) på sty- ringàngen som mottager förbättrade talparametrar under talramar.
Om vidare de fördröjningar som förorsakas av beräkningen av förbättrade talparametrar betraktas såsom alltför långa är det, i enlighet med en modifierad utföringsforrn av före- liggande uppfinning, möjligt att använda de förbättrade talparametrama för en aktuell talram även för filtrering av nästa talram (i denna utföringsform betraktas tal såsom sta- tionärt över två ramar). I den modifierade utföringsfonnen kan förbättrade talparametrar 506 054 10 för en talram beräknas samtidigt med filtreringen av ramen med förbättrade parametrar för föregående talram.
Den grundläggande algoritmen för förfarandet i enlighet med föreliggande uppfinning kan nu summeras enligt följande: I talramar utför - skatta PSD (i,,(w ) för bakgrundsbullret för en uppsättning av M frekvenser. Här kan varje lämplig typ av PSD-estimator användas, t.ex. parametrisk eller icke- parametrisk (periodogram) skattning. Genom användning av làngtidsmedelvär- desbildning i enlighet med (12) reduceras felvariansen i PSD-skattningen.
Förtalaktivitet: i varje ram utför på basis av {x(k)} skatta AR-parametrama {a;} och residualfelvariansen of för det bullriga talet. - på basis av dessa parametrar för bullrigt tal, beräkna PSD-skattningen (ßjw) för det bullriga talet för en uppsättning av M frekvenser. - på basis av (ßjw) och (ßjm), beräkna en skattning (51 w ) av den spektrala effekttätheten förtal genom användning av (9). Skalären ö är en designvariabel som är approximativt lika med 1. - på basis av den förbättrade spektrala effekttätheten (hm), beräkna de förbättra- de AR-parametrama och motsvarande residualvarians. 506 054 11 De flesta av blocken i anordningen i figur 1 implementeras företrädesvis såsom en eller flera mikro/signalprocessorkombinationer (t.ex. blocken 14, 18, 20, 22, 26, 30, 32 och 34).
I syfte att illustrera prestanda för förfarandet i enlighet med föreliggande uppfinning ut- fördes flera simuleringsexperiment. För att mäta förbättringen i de förbättrade paramet- rarna i förhållande till ursprungliga parametrar beräknades följande mått över 200 olika simuleringar M _ (m) I m, Z[1°gr<1>rk))-1°gr<1>,rk»]' V = 2 "f (14) 200 l M , "" Zlogrdark» k=I i Detta mått (förlustfunktion) beräknades både för bullriga och förbättrade parametrar, dvs <í>(k) betecknar antingen èJk) eller å;,(k). |(14) betecknar (-)(“'> resultatet av simulering nummer m. De två måtten illustreras i figur 7. Figur 8 illustrerar kvoten mellan dessa mått. Av figurema framgår att för lågt signal-till-bullerförhàllande (SNR< 15 dB) ger de förbättrade parametrarna bättre prestanda än de bullriga parametrarna, me- dan prestanda är approximativt lika för båda parameteruppsättningama vid högt signal-till-bullerförhàllande. Vid låga SNR-värden är förbättringen i SNR mellan för- bättrade och bullriga parametrar av storleksordningen 7 dB för ett givet värde på måttet V.
F ackmannen inser att olika modifieringar och förändringar kan göras vid föreliggan- de uppfinning utan avvikelse från dess grundtanke och ram, som definieras av de bifogade patentkraven. 506 034 12 APPENDIX För erhållande av en ökad numerisk robusthet i skattningen av förbättrade parametrar .transformeras skattade förbättrade PSD-data i (11) i enlighet med följande icke-linjära datatransformation f" = rf(u.fr21,....fMf (16) där A - 10min (10) ânflf) > ß flk) = _ -log(s) q>,(k)se där e är en användarvald eller databeroende tröskel som säkerställer att flk) är reell- värd. Genom användning av vissa grova approximationer (baserade på en Fourier- serieutveckling, ett antagande om ett stort antal sampel och en hög modellordning) gäl- ler i det frekvensintervall som är av intresse _ z-rofflf) k=i E[<ï>,(U-,(k)-d>,(k)]e N (17) 0 kxi Ekvation (17) ger 2_r k=i E[f(i)-7(I)][íflß)-7(k)] ß N (18) 0 kxi l (18) definieras uttrycket y(k) av m) = E/frki] = -løgrašfllogrlwfficme-fërf) (19) k=1,...,M (16)- 506 054 13 Om det antages att en statistiskt effektiv skattning f" och en skattning av motsvarande kovariansmatris far föreligger, kan vektom x = (Ö-fivf-'IIÛZH-'Icrf och dess kovariansmatris p, beräknas i enlighet med GW z [arm I öl rick) 13,00 = [Gfløffäoffkßf (21) iom) = 2rk1+f-,fløGrk)fi¥[f-ro2rk»] I med initialskattningar f' , år och 2 (0) . l ovanstående algoritm ges relationen mellan 171) och 1 av IYx) = (r(1).r(2),---,>'M)T (22) där yflc) ges av (19). Med hjälp av uttrycket 506 034 14 f - 1 \ Bl öraš) 1 + Zßflfï” _ m=l _ öflk) - - ac' 4ï2 “” = = 2R*'*“¿í¿L";:* am) 1+ Xena? âcz __ m=l _ öflk) x Ûc, 1 »får 2R8 i-*ïire 2,* (23) k 1 + zÛmeql-ím nr=l ges gradienten av Ng) med avseende på 1 av [arm ö I = (qllnwlflflvqJMj l Ovanstående algoritm (21) innebär en stor mängd beräkningar för skattningen av år.
En huvuddel av dessa beräkningar härrör från multipliceringen med och inverieringen av (M x M)-matrisen far. Matrisen lär är dock nära nog diagonal (se ekvation (18)) och kan approximeras genom ll far :í-r] = constø] (25) där l betecknar enhetsmatrisen av ordning (M x M). I enlighet med en föredragen utfö- ringsform kan därför följande sub-optimala algoritm användas 506 034 15 GW = [arm í öl m (26) »âr/Hu = iflw [Grk)c*rk)I*Grk1[f-rm2flø)] med initialskattningar f" och ,{f(0). |(26) har G(k) storleken ((r+1)xM). [1] [2] [3] [41 506 054 16 REFERENSER J.D. Gibson, B. Koo och S.D. Gray, "Fi|tering of colored noise for speech enhan- cement and coding", IEEE Transaction on Acoustics, Speech and Signal Proces- sing", vol. 39, nr. 8, sid. 1732-1742, Augusti 1991.
D.K. Freeman, G. Cosier, C.B. Southcott och I. Boyd, "The voice activity detector for the pan-European digital cellular mobile telephone service" 1989 IEEE Inter- national Conference Acoustics, Speech and Signal Processing, 1989, sid. 489- 502.
J.S. Lim och A.V. Oppenheim, "All-pole modeling of degraded speech", IEEE Transactions on Acoustics, Speech, and Signal Processing, Vol. ASSp-26, Nr. 3, Juni 1978, sid. 228-231.
T. Söderström, P. Stoica och B. Friedlander, "An indirect prediction error method for system identification", Automatica, vol. 27, nr. 1, sid. 183-188, 1991.

Claims (17)

506 os4 17 PATENTKRAV
1. Förfarande för förbättring av parametrar representerande bullrigt tal, känne- tecknat av av bestämning av en skattning av den spektrala effekttätheten för bakgrundsbuller vid M frekvenser, där M är ett förutbestämt positivt heltal, ur en första 'uppsättning bakgrundsbullersampel; bestämning av p autoregressiva parametrar, där p är ett förutbestämt positivt heltal som är väsentligt mindre än M, och en första residualvarians ur en andra upp- sättning bullriga talsampel; bestämning av en skattning av den spektrala effekttätheten för bullrigt tal vid de M frekvenserna ur de p autoregressiva parametrarna och den första residualva- nansen; i bestämning av en förbättrad skattning av den spektrala effekttätheten för tal genom subtrahering av skattningen av den spektrala effekttätheten för bakgrunds- buller multiplicerad med en förutbestämd positiv faktor från skattningen av den spektrala effekttätheten för bullrigt tal; bestämning av r förbättrade autoregressiva parametrar, där r är ett förutbe- stämt positivt heltal, och en förbättrad residualvarians ur den förbättrade skattningen av den spektrala effekttätheten för tal.
2. Förfarande enligt krav 1, kännetecknat av begränsning av den förbättrade skattningen av den spektrala effekttätheten för tal till icke-negativa värden.
3. Förfarande enligt krav 2, kännetecknat av att den positiva faktorn har ett värde i intervallet 0-4.
4. Förfarande enligt krav 3, kännetecknat av att den förutbestämda positiva fak- torn är approximativt lika med 1. 506 054 18
5. Förfarande enligt krav 4, kännetecknat av att det förutbestämda heltalet r är lika med det förutbestämda heltalet p.
6. Förfarande enligt krav 5, kännetecknat av skattning av q autoregressiva parametrar, där q är ett förutbestämt positivt heltal mindre än p, och en andra residualvarians ur den första uppsättningen bak- grundsbullersampel; bestämning av skattningen av den spektrala effekttätheten för bakgrundsbullret vid de M frekvenserna ur de q autoregressiva parametrarna och den andra residual- variansen.
7. Förfarande enligt krav 1 eller 6, kännetecknat av medelvärdesbildning av skattningen av den spektrala effekttätheten för bakgrundsbullret över ett förutbe- stämt antal uppsättningar av bakgrundsbullersampel.
8. Förfarande enligt något av föregående krav, kännetecknat av användning av de förbättrade autoregressiva parametrarna och den förbättrade residualvariansen för inställning av ett filter för filtrering av en tredje uppsättning bullriga talsampel.
9. Förfarande enligt krav 8, kännetecknat av att den andra och tredje uppsätt- ningen bullriga talsampel utgörs av samma uppsättning.
10. Förfarande enligt krav 8 eller 9, kännetecknat av Kalman-filtrering av den tredje uppsättningen bullriga talsampel.
11. Anordning för förbättring av parametrar representerande bullrigt tal, känne- tecknad av organ (22, 26) för bestämning av en skattning av den spektrala effekttätheten för bakgrundsbuller vid M frekvenser, där M är ett förutbestämt positivt heltal ur en första uppsättning av bakgrundsbullersampel; 506 034 19 organ (18) för skattning av p autoregressiva parametrar, där p är ett förutbe- stämt positivt heltal som är väsentligt mindre än M, och en första residuaivarians ur en andra uppsättning av bullriga talsampel; organ (20) för bestämning av en skattning av den spektrala effekttätheten för .bullrigt tal vid de M frekvenserna ur de p autoregressiva parametrarna och den första residualvariansen; organ (30) för bestämning av en förbättrad skattning av den spektrala effekt- tätheten för tal genom subtrahering av skattningen av den spektrala effekttätheten för bakgrundsbuller multiplicerad med en förutbestämd positiv faktor från skattning- en av den spektrala effekttätheten för bullrigt tal; och organ (32) för bestämning av r förbättrade autoregressiva parametrar, där r är ett förutbestämt positivt heltal, och en förbättrad residuaivarians ur den förbättrade skattningen av den spektrala effekttätheten för tal.
12. Anordning enligt krav 11, kännetecknad av organ (30) för begränsning av den förbättrade skattningen av den spektrala effekttätheten för tai till icke-negativa vär- den.
13. Anordning enligt krav 12, kännetecknad av organ (22) för skattning av q autoregressiva parametrar, där q är ett förutbe- stämt positivt heltal mindre än p, och en andra residuaivarians ur den första upp- sättningen av bakgrundsbullersampel; organ (26) för bestämning av skattningen av den spektrala effekttätheten för bakgrundsbullret vid de M frekvenserna ur de q autoregressiva parametrarna och den andra residualvariansen.
14. Anordning enligt krav 11 eller 13, kännetecknad av organ (26) för medelvär- desbildning av skattningen av den spektrala effekttätheten för bakgrundsbullret över ett förutbestämt antal uppsättningar av bakgrundsbullersampel. 506 034 20
15. Anordning enligt något av föregående krav, kännetecknad av organ (34) för användning av de förbättrade autoregressiva parametrararna och den förbättrade residualvariansen för inställning av ett filter för filtrering av en tredje uppsättning av bullriga talsampel.
16. Anordning enligt krav 15, kännetecknad av ett Kalman-filter (34) för filtrering av den tredje uppsättningen av bullriga talsampel.
17. Anordning enligt krav 15, kännetecknad av ett Kalman-filter (34) för filtrering av den tredje uppsättningen av bullriga talsampel, varvid den andra och den tredje uppsättningen av bullriga talsampel utgör samma uppsättning.
SE9600363A 1996-02-01 1996-02-01 Förfarande och anordning för förbättring av parametrar representerande brusigt tal SE506034C2 (sv)

Priority Applications (10)

Application Number Priority Date Filing Date Title
SE9600363A SE506034C2 (sv) 1996-02-01 1996-02-01 Förfarande och anordning för förbättring av parametrar representerande brusigt tal
US08/781,515 US6324502B1 (en) 1996-02-01 1997-01-09 Noisy speech autoregression parameter enhancement method and apparatus
CA002243631A CA2243631A1 (en) 1996-02-01 1997-01-27 A noisy speech parameter enhancement method and apparatus
AU16790/97A AU711749B2 (en) 1996-02-01 1997-01-27 A noisy speech parameter enhancement method and apparatus
DE69714431T DE69714431T2 (de) 1996-02-01 1997-01-27 Verfahren zum verbessern von verrauschter sprache und gerät
PCT/SE1997/000124 WO1997028527A1 (en) 1996-02-01 1997-01-27 A noisy speech parameter enhancement method and apparatus
JP9527551A JP2000504434A (ja) 1996-02-01 1997-01-27 ノイズのある音声パラメータを強化する方法および装置
KR1019980705713A KR100310030B1 (ko) 1996-02-01 1997-01-27 노이지음성파라미터강화방법및장치
CN97191991A CN1210608A (zh) 1996-02-01 1997-01-27 一种有噪语音参数增强的方法和装置
EP97902783A EP0897574B1 (en) 1996-02-01 1997-01-27 A noisy speech parameter enhancement method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
SE9600363A SE506034C2 (sv) 1996-02-01 1996-02-01 Förfarande och anordning för förbättring av parametrar representerande brusigt tal

Publications (3)

Publication Number Publication Date
SE9600363D0 SE9600363D0 (sv) 1996-02-01
SE9600363L SE9600363L (sv) 1997-08-02
SE506034C2 true SE506034C2 (sv) 1997-11-03

Family

ID=20401227

Family Applications (1)

Application Number Title Priority Date Filing Date
SE9600363A SE506034C2 (sv) 1996-02-01 1996-02-01 Förfarande och anordning för förbättring av parametrar representerande brusigt tal

Country Status (10)

Country Link
US (1) US6324502B1 (sv)
EP (1) EP0897574B1 (sv)
JP (1) JP2000504434A (sv)
KR (1) KR100310030B1 (sv)
CN (1) CN1210608A (sv)
AU (1) AU711749B2 (sv)
CA (1) CA2243631A1 (sv)
DE (1) DE69714431T2 (sv)
SE (1) SE506034C2 (sv)
WO (1) WO1997028527A1 (sv)

Families Citing this family (136)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6453285B1 (en) * 1998-08-21 2002-09-17 Polycom, Inc. Speech activity detector for use in noise reduction system, and methods therefor
US6289309B1 (en) * 1998-12-16 2001-09-11 Sarnoff Corporation Noise spectrum tracking for speech enhancement
FR2799601B1 (fr) * 1999-10-08 2002-08-02 Schlumberger Systems & Service Dispositif et procede d'annulation de bruit
US6980950B1 (en) * 1999-10-22 2005-12-27 Texas Instruments Incorporated Automatic utterance detector with high noise immunity
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US7035790B2 (en) * 2000-06-02 2006-04-25 Canon Kabushiki Kaisha Speech processing system
US7072833B2 (en) * 2000-06-02 2006-07-04 Canon Kabushiki Kaisha Speech processing system
US7010483B2 (en) * 2000-06-02 2006-03-07 Canon Kabushiki Kaisha Speech processing system
US20020026253A1 (en) * 2000-06-02 2002-02-28 Rajan Jebu Jacob Speech processing apparatus
US6983242B1 (en) * 2000-08-21 2006-01-03 Mindspeed Technologies, Inc. Method for robust classification in speech coding
US6463408B1 (en) * 2000-11-22 2002-10-08 Ericsson, Inc. Systems and methods for improving power spectral estimation of speech signals
DE10124189A1 (de) * 2001-05-17 2002-11-21 Siemens Ag Verfahren zum Signalempfang
GB2380644A (en) * 2001-06-07 2003-04-09 Canon Kk Speech detection
US7133825B2 (en) * 2003-11-28 2006-11-07 Skyworks Solutions, Inc. Computationally efficient background noise suppressor for speech coding and speech recognition
US20090163168A1 (en) * 2005-04-26 2009-06-25 Aalborg Universitet Efficient initialization of iterative parameter estimation
CN100336307C (zh) * 2005-04-28 2007-09-05 北京航空航天大学 接收机射频系统电路内部噪声的分配方法
JP4690912B2 (ja) * 2005-07-06 2011-06-01 日本電信電話株式会社 目的信号区間推定装置、目的信号区間推定方法、プログラム及び記録媒体
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US7844453B2 (en) * 2006-05-12 2010-11-30 Qnx Software Systems Co. Robust noise estimation
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
JP5291004B2 (ja) 2007-03-02 2013-09-18 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 通信ネットワークにおける方法及び装置
TWI420509B (zh) * 2007-03-19 2013-12-21 Dolby Lab Licensing Corp 語音增強用雜訊變異量估計器
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
EP2151822B8 (en) * 2008-08-05 2018-10-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an audio signal for speech enhancement using a feature extraction
US8392181B2 (en) * 2008-09-10 2013-03-05 Texas Instruments Incorporated Subtraction of a shaped component of a noise reduction spectrum from a combined signal
US8244523B1 (en) * 2009-04-08 2012-08-14 Rockwell Collins, Inc. Systems and methods for noise reduction
US8548802B2 (en) * 2009-05-22 2013-10-01 Honda Motor Co., Ltd. Acoustic data processor and acoustic data processing method for reduction of noise based on motion status
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US9324337B2 (en) * 2009-11-17 2016-04-26 Dolby Laboratories Licensing Corporation Method and system for dialog enhancement
US8600743B2 (en) * 2010-01-06 2013-12-03 Apple Inc. Noise profile determination for voice-related feature
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US8977584B2 (en) 2010-01-25 2015-03-10 Newvaluexchange Global Ai Llp Apparatuses, methods and systems for a digital conversation management platform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
JP5834449B2 (ja) * 2010-04-22 2015-12-24 富士通株式会社 発話状態検出装置、発話状態検出プログラムおよび発話状態検出方法
CN101930746B (zh) * 2010-06-29 2012-05-02 上海大学 一种mp3压缩域音频自适应降噪方法
US8892436B2 (en) * 2010-10-19 2014-11-18 Samsung Electronics Co., Ltd. Front-end processor for speech recognition, and speech recognizing apparatus and method using the same
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
CN103187068B (zh) * 2011-12-30 2015-05-06 联芯科技有限公司 基于Kalman的先验信噪比估计方法、装置及噪声抑制方法
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
CN102637438B (zh) * 2012-03-23 2013-07-17 同济大学 一种语音滤波方法
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
CN102890935B (zh) * 2012-10-22 2014-02-26 北京工业大学 一种基于快速卡尔曼滤波的鲁棒语音增强方法
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
CN110442699A (zh) 2013-06-09 2019-11-12 苹果公司 操作数字助理的方法、计算机可读介质、电子设备和系统
US9966065B2 (en) 2014-05-30 2018-05-08 Apple Inc. Multi-command single utterance input method
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
CN105023580B (zh) * 2015-06-25 2018-11-13 中国人民解放军理工大学 基于可分离深度自动编码技术的无监督噪声估计和语音增强方法
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
CN105788606A (zh) * 2016-04-03 2016-07-20 武汉市康利得科技有限公司 一种用于拾音器的基于递归最小追踪的噪声估计方法
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DE102017209585A1 (de) * 2016-06-08 2017-12-14 Ford Global Technologies, Llc System und verfahren zur selektiven verstärkung eines akustischen signals
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11373667B2 (en) * 2017-04-19 2022-06-28 Synaptics Incorporated Real-time single-channel speech enhancement in noisy and time-varying environments
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
CN107197090B (zh) * 2017-05-18 2020-07-14 维沃移动通信有限公司 一种语音信号的接收方法及移动终端
EP3460795A1 (en) * 2017-09-21 2019-03-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal processor and method for providing a processed audio signal reducing noise and reverberation
US10481831B2 (en) * 2017-10-02 2019-11-19 Nuance Communications, Inc. System and method for combined non-linear and late echo suppression
CN110931007B (zh) * 2019-12-04 2022-07-12 思必驰科技股份有限公司 语音识别方法及系统
CN114155870B (zh) * 2021-12-02 2024-08-27 桂林电子科技大学 低信噪比下基于spp和nmf的环境音噪声抑制方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3266042D1 (en) * 1981-09-24 1985-10-10 Gretag Ag Method and apparatus for reduced redundancy digital speech processing
US4628529A (en) 1985-07-01 1986-12-09 Motorola, Inc. Noise suppression system
JP2642694B2 (ja) * 1988-09-30 1997-08-20 三洋電機株式会社 雑音除去方法
EP0459364B1 (en) * 1990-05-28 1996-08-14 Matsushita Electric Industrial Co., Ltd. Noise signal prediction system
US5319703A (en) * 1992-05-26 1994-06-07 Vmx, Inc. Apparatus and method for identifying speech and call-progression signals
SE501981C2 (sv) 1993-11-02 1995-07-03 Ericsson Telefon Ab L M Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler
EP0681730A4 (en) 1993-11-30 1997-12-17 At & T Corp REDUCTION OF TRANSMISSION NOISE IN COMMUNICATION SYSTEMS.

Also Published As

Publication number Publication date
WO1997028527A1 (en) 1997-08-07
DE69714431T2 (de) 2003-02-20
EP0897574B1 (en) 2002-07-31
SE9600363D0 (sv) 1996-02-01
JP2000504434A (ja) 2000-04-11
CN1210608A (zh) 1999-03-10
KR19990081995A (ko) 1999-11-15
AU1679097A (en) 1997-08-22
KR100310030B1 (ko) 2001-11-15
SE9600363L (sv) 1997-08-02
DE69714431D1 (de) 2002-09-05
CA2243631A1 (en) 1997-08-07
US6324502B1 (en) 2001-11-27
EP0897574A1 (en) 1999-02-24
AU711749B2 (en) 1999-10-21

Similar Documents

Publication Publication Date Title
SE506034C2 (sv) Förfarande och anordning för förbättring av parametrar representerande brusigt tal
You et al. /spl beta/-order MMSE spectral amplitude estimation for speech enhancement
KR101120679B1 (ko) 이득-제한된 잡음 억제
US5708754A (en) Method for real-time reduction of voice telecommunications noise not measurable at its source
KR100330230B1 (ko) 잡음 억제 방법 및 장치
CA2210490C (en) Spectral subtraction noise suppression method
KR950011964B1 (ko) 신호처리장치
EP3439325A1 (en) Automatically tuning an audio compressor to prevent distortion
KR100821177B1 (ko) 통계적 모델에 기반한 선험적 음성 부재 확률 추정 방법
KR101737824B1 (ko) 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치
Ma et al. Speech enhancement using a masking threshold constrained Kalman filter and its heuristic implementations
JP4965891B2 (ja) 信号処理装置およびその方法
CN111951818B (zh) 一种基于改进功率差噪声估计算法的双麦克风语音增强方法
Naik et al. A literature survey on single channel speech enhancement techniques
CN109215672B (zh) 一种声音信息的处理方法、装置及设备
KR101295727B1 (ko) 적응적 잡음추정 장치 및 방법
JP2005258158A (ja) ノイズ除去装置
JP4123835B2 (ja) 雑音抑圧装置および雑音抑圧方法
KR100784456B1 (ko) Gmm을 이용한 음질향상 시스템
KR20110061781A (ko) 실시간 잡음 추정에 기반하여 잡음을 제거하는 음성 처리 장치 및 방법
KR20160116440A (ko) 음성인식 시스템의 신호대잡음비 추정 장치 및 방법
KR101811635B1 (ko) 스테레오 채널 잡음 제거 장치 및 방법
RU2206960C1 (ru) Способ подавления шума в информационном сигнале и устройство для его осуществления
KR101993003B1 (ko) 잡음 제거 장치 및 방법
KR20080049385A (ko) 마스킹 확률을 이용한 음성 인식 전처리 방법 및 전처리장치

Legal Events

Date Code Title Description
NUG Patent has lapsed