SE506034C2 - Förfarande och anordning för förbättring av parametrar representerande brusigt tal - Google Patents
Förfarande och anordning för förbättring av parametrar representerande brusigt talInfo
- Publication number
- SE506034C2 SE506034C2 SE9600363A SE9600363A SE506034C2 SE 506034 C2 SE506034 C2 SE 506034C2 SE 9600363 A SE9600363 A SE 9600363A SE 9600363 A SE9600363 A SE 9600363A SE 506034 C2 SE506034 C2 SE 506034C2
- Authority
- SE
- Sweden
- Prior art keywords
- power density
- spectral power
- estimate
- improved
- background noise
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 21
- 230000003595 spectral effect Effects 0.000 claims abstract description 38
- 238000001914 filtration Methods 0.000 claims description 10
- 238000012935 Averaging Methods 0.000 claims description 5
- 230000000694 effects Effects 0.000 description 10
- 238000004422 calculation algorithm Methods 0.000 description 6
- 230000006872 improvement Effects 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000007774 longterm Effects 0.000 description 4
- 101100069818 Caenorhabditis elegans gur-3 gene Proteins 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 235000008331 Pinus X rigitaeda Nutrition 0.000 description 2
- 235000011613 Pinus brutia Nutrition 0.000 description 2
- 241000018646 Pinus brutia Species 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 101100298295 Drosophila melanogaster flfl gene Proteins 0.000 description 1
- 101150023186 GRK1 gene Proteins 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013501 data transformation Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000005654 stationary process Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Noise Elimination (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Mobile Radio Communication Systems (AREA)
- Filters That Use Time-Delay Elements (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
Description
506 054 2 trycka bullret. De förbättrade talparametrarna kan dock även användas direkt såsom talparametrar i talkodning.
Ovanstående syftemål löses genom ett förfarande i enlighet med krav 1 och en an- ordning i enlighet med krav 11.
KORT BESKRIVNING AV RITNINGARNA Uppfinningen samt ytterligare syftemål och fördelar med denna förstås bäst genom hänvisning till nedanstående beskrivning och de bifogade ritningarna, i vilka: Figur 1 ning; Figur 2 Figur 3 Figur 4 Figur 5 Figur 6 Figur 7 är ett blockschema av en anordning i enlighet med föreliggande uppfin- är ett tillståndsdiagram för en talaktivitetsdetektor (VAD) som används i anordningen enligt krav 1; är ett flödesschema som illustrerar förfarandet i enlighet med föreliggande uppfinning; illustrerar de väsentliga särdragen för den spektrala effekttätheten (PSD) av bullrigt tal; illustrerar en liknande spektral effekttäthet för bakgrundsbuller; illustrerar den resulterande spektrala effekttätheten efter subtraktion av effekttätheten i figur 5 från effekttätheten i figur 4; illustrerar den förbättring som erhålls genom föreliggande uppfinning i form av en förlustfunktion; och 506 034 3 Figur 8 illustrerar den förbättring som erhålls genom föreliggande uppfinning i form av en förlustkvot.
DETALJERAD BESKRIVNING AV DE FÖREDRAGNA QTFÖRINGSFORMERNA Vid talsignalbehandling är det inmatade talet ofta förvrängt av bakgrundsbuller. Vid exempelvis ”hands-free"-mobiltelefoni kan förhållandet mellan tal och bakgrunds- buller vara så lågt som, eller till och med lägre än, 0 dB. Sådana höga bullernivåer försämrar väsentligt samtalskvaliteten, ej endast beroende på den höga bullerni- vàn, utan även pà grund av Ijudartifakter som alstras när bullrigt tal kodas och överförs via en digital kommunikationskanal. I syfte att reducera dessa Ijudartifakter kan det bullriga inmatade talet förbehandlas genom bullerreduktionsmetod, t.ex. ge- nom Kalman-filtrering [1].
Vid vissa bullerreduktionsmetoder (t.ex. vid Kalman-filtrering) är autoregressiva (AR) parametrar av intresse. Därför är noggranna skattningar av AR-parametrarna ur bullriga taldata väsentliga för att dessa metoder skall ge en förbättrad tal-utsignal med hög ljudkvalitet. En sådan metod för förbättring av parametrar representerande bullrigt tal kommer nu att beskrivas under hänvisning till figurema 1-6.
I figur 1 erhålls en kontinuerlig analog signal x(t) från en mikrofon 10. Signalen x(t) leds till en A/D-omvandlare 12. Denna A/D-omvandlare (och lämplig datamellanlag- ring) producerar ramar {x(k)} av ljuddata (innehållande antingen tal, bagrundsbuller eller båda). En ljudram kan i typfallet innehålla mellan 100-300 ljudsampel vid en samplingsfrekvens pà 8000 Hz. I syfte att förenkla nedanstående diskussion anta- ges en ramlängd N=256 sampel. Ljudramen {x(k)} leds till en talaktivitetsdetektor (VAD) 14, som styr en omkopplare 16 som leder ljudramar {x(k)} till olika block i an- ordningen beroende på talaktivitetsdetektoms 14 tillstånd.
Talaktivitetsdetektorn VAD 14 kan vara konstruerad i enlighet med principerna som diskuteras i (21, och är vanligen implementerad såsom en tillstàndsmaskin. Figur 2 506 034 4 illustrerar de möjliga tillstånden för en sådan tillståndsmaskin, “l tillstånd 0 är talakti- vitetsdetektorn 14 i ett vilotillstånd eller ”inaktiv", vilket innebär att ljudramar {x(k)} ej behandlas ytterligare. Tillståndet 20 innebär en bullernivà men inget tal. Tillståndet 21 innebär en bullernivà och ett lågt tallbullerförhållande. Detta tillstånd är framför- allt aktivt under övergångar mellan talaktivitet och buller. Slutligen innebär tillståndet 22 en bullernivà och ett högt tallbullerförhållande. En ljudram {x(k)} innehåller ljud- sampel som kan uttryckas såsom x(k) = s(k)+v(k) k=1,...,N (1) där x(k) betecknar bullriga talsampel, s(k) betecknar talsampel och v(k) betecknar färgat additivt bakgrundsbuller. Den bullriga talsignalen x(k) antages vara stationär över en ram. Vidare kan talsignalen s(k) beskrivas av en autoregressiv (AR) modell av ordning r f s(k) = -zcisfk -Ü+w,(k) (2) í=l där variansen av ws(k) ges av of. På liknande sätt kan v(k) beskrivas av en AR- modell av ordning q 9 v(k) = ' Eb: v(k _ Ü+ Wv i=l där variansen av wv(k) ges av of. Både r och q är mycket mindre än ramlängden N.
Normalt ligger värdet på r företrädesvis runt 10, medan q företrädesvis har ett värde i intervallet 0-7, t.ex. 4 (q=0 svarar mot en konstant spektral effekttäthet, dvs vitt brus).
Ytterligare information om AR-modellering av tal finns i [3]. 506 034 5 Vidare kan den spektrala effekttätheten q>,,(w ) av bullrigt tal delas upp i en summa av den spektrala effekttätheten m, (w ) av tal och den spektrala effekttätheten bakgrundsbullret, dvs cww) = cmwfloyfw) “ (4) av (2) följer att ara» = <5) ll+zcmeimiz m-I Av (3) följer på liknande sätt att 2 U + Zbmëimjz n|=l Av (2)-(3) följer att x(k) följer en autoregressiv modell med rörligt medelvärde (ARMA = autoregressive moving average) och med spektral effekttäthet q>,(w) . Ett estimat av q>,(m) (här och nedan skattade kvantiteter betecknas med en hatt "^”) kan uppnås genom en autoregressiv (AR) modell, dvs »z mm) ~ äga- (n ll + Zâ.. emlz mß] där {àj} och å f är de skattade parametrama av AR-modellen x(k) = -Éalxnf-vfinrk) <8) í=l där variansen av w,(k) ges av af och där rsp sN. Det bör noteras att (5,1 w ) i (7) ej är en statistiskt konsistent skattning av ,(w). Vid talsignalbehandling är detta dock ej ett allvarligt problem, eftersom x(k) i praktiken är långt ifrån en stationär process, 506 034 När talaktivitetsdetektorn VAD 14 i figur 1 indikerar tal (tillstånden 21 och 22 i figur 2) leds signalen x(k) till en AR-estimator 18 för bullrigt tal, vilken skattar parametrar- na of, {ai} i ekvation (8). Denna skattning kan utföras i enlighet med [3] (i flödesschemat i figur 3 svarar detta mot steg 120). De skattade parametrama leds till ett block 20,som beräknar en skattning av den spektrala effekttätheten av in-signalen x(k) i enlighet med ekvation (7) (steg 130 i figur 3).
Det är ett väsentligt särdrag hos föreliggande uppfinning att bakgrundsbullret kan be- handlas såsom varande långtidsstationärt, dvs stationärt över flera ramar. Eftersom ta- laktiviteten vanligen är tillräckligt låg för att medge skattning av bullerrnodellen i tidsperi- oder där s(k) ej förekommer, kan den làngtidsstationära egenskapen användas för spektral subtraktion av effekttätheten för buller under bullriga talramar genom mellanlag- ring' av bullerrnodellparametrama under bullerramar för senare användning under bullri- ga talramar. När talaktivitetsdetektom VAD 14 indikerar bakgrundsbuller (tillstånd 20 i figur 2) leds ramen sålunda till en AR-parameterestimator 22 för buller, vilken estimerar parametrama of och {bi} för ramen (detta svarar mot steg 140 iflödesschemat ifigur 3).
Såsom nämnts ovan lagras de skattade parametrama i en buffert 24 för senare an- vändning under en bullrig talram (steg 150 i figur 3). När dessa parametrar behövs (under en bullrig talram) hämtas de från bufferten 24. Parametrama leds också till ett block 26 för spektral effekttäthetsskattning av bakgrundsbullret, antingen under buller- ramen (steg 160 i figur 3), vilket innebär att skattningen måste mellanlagras för senare användning, eller under nästa talram, vilket innebär att endast parametrama behöver mellanlagras. Under ramar som innehåller endast bakgrundsbuller används alltså de skattade parametrama ej för förbättringsändamàl. Istället leds bullersignalen till en däm- pare 28, som dämpar bullemivàn med exempelvis 10 dB (steg 170 i figur 3).
Skattningen â>,(w) av den spektrala effekttätheten (PSD), definierad genom ekvation (7) och PSD-skattningen (ßfw) definierad av en ekvation liknande ekvation (6) men med "^”-tecknet över AR-parametrama och. of, är funktioner av frekvensen m. Nästa steg är att utföra den faktiska PSD-subtraktionen, vilket utförs i ett block 30 (steg 180 i 506 034 7 figur 3). I enlighet med uppfinningen skattas den spektrala effekttätheten av talsignalen enligt óßv) = öJaU-öèJw) (9) där ö är en skalär designvariabel, som i typfallet ligger i intervallet 0<ö<4. l normala fall har ö ett värde runt 1 (5 = 1 svarar mot ekvation (4)).
Det är ett väsentligt särdrag hos föreliggande uppfinning att den förbättrade spekt- rala effekttätheten (ßjw) samplas vid ett tillräckligt antal frekvenser m för att en nog- grann bild av den förbättrade spektrala effekttätheten skall erhållas. l praktiken beräk- nas den spektrala effekttätheten vid en diskret uppsättning frekvenser w=_ m=1,...,M (10) se [3], vilket ger en diskret sekvens av PSD-skattningar {<í>,(1).å>,(2).----<í>..(1W} = {<í>,(m)} m=1---M (11) Detta särdrag illustreras ytterligare i figurerna 4-6. Figur 4 illustrerar en typisk PSD- skattning (fy/w) för bullrigt tal. Figur 5 illustrerar en typisk PSD-skattning ännu) av bakgrundsbuller. l detta fall är signal-till-brus-förhàllandet mellan signalema i figurema 4 och 5 lika med 0 dB. Figur 6 illustrerar den förbättrade PSD-skattningen å>,(w) efter bullersubtraktion i enlighet med ekvation (9), varvid i detta fall ö = 1. Eftersom formen av FSD-skattningen fßfw) är av betydelse för skattningen av de förbättrade talparamet- rama (som kommer att beskrivas nedan) är det ett väsentligt särdrag hos föreliggande uppfinning att den förbättrade PSD-skattningen 431m ) samplas vid ett tillräckligt antal frekvenser för att ge en sann bild av funktionens form (i synnerhet av toppama). 506 034 8 l praktiken samplas (ßfw) genom användning av (6) och (7). l exempelvis uttrycket (7) kan (ßjw) samplas genom användning av den snabba Fourier-transformen (FFT).
Sålunda betraktas 1, a1, a; a, såsom en sekvens, vars snabba Fourier-transform skall beräknas. Eftersom antalet sampel M måste vara större än p (p är approximativt 10-20) kan det vara nödvändigt att nollfylla (zero pad) sekvensen. Lämpliga värden på M är värden som utgörs av potenser av 2, t.ex. 64, 128, 256. Vanligen kan dock antalet sampel M väljas mindre än ramlängden (N = 256 i detta exempel). Eftersom (ßxm) re- presenterar den spektrala tätheten av effekt, vilket är en icke-negativ kvantitet, måste de samplade värdena av (ßjw) begränsas till icke-negativa värden innan de förbättrade talparametrama beräknas ur den samplade förbättrade PSD-skattning (iyfw).
Sedan blocket 30 har utfört PSD-subtraktionen leds uppsättningen {¿;s(m) l av sampel till ett block 32 för beräkning av förbättrade talparametrar ur PSD-skattningen (steg 190 i figur 3). Denna operation är den omvända jämfört med blocken 20 och 26, vilka beräk- nar PSD-skattningar ur AR-parametrar. Eftersom det ej är möjligt att explicit beräkna dessa parametrar direkt ur PSD-skattningen mäste iterativa algoritmer användas. En generell algoritm för systemidentifiering, tex. såsom föreslås i [4] kan användas.
En föredragen procedur för beräkning av de förbättrade parametrama beskrivs också i bifogade APPENDlX.
De förbättrade parametrama kan antingen användas direkt, t.ex. i samband med talkod- ning, eller kan användas för att styra ett filter, tex. ett Kalman-filter 34 i brusundertrycka- ren i figur 1 (steg 200 i figur 3). Kalman-filtret 34 styrs också av de skattade AR- parametrama, och dessa två parameteruppsättningar styr Kalman-filtret 34 för filtrering av ramar {x(k)} innehållande bullrigt tal i enlighet med de principer som beskrivs i [1].
Om endast de förbättrade talparametrama erfordras av en tillämpning är det ej nödvän- digt att skatta AR-parametrar för buller (i bullerundertryckaren ifigur 1 måste de skattas .506 034 9 eftersom de styr Kalman-filtret 34). lstället kan làngtidsstationäriteten av bakgrundsbull- ret användas för skattning av atrwf” = para» /'"”+r1-p1$..rw) (12) där (51 w f” är den (löpande) medelvärdesbildade PSD-skattningen baserad på data upp till och inkluderande ramnummer m, och öjw) är skattningen som baseras på den aktuella ramen ( švm) kan skattas direkt ur in-signalsdata genom ett periodo- gram (FFT)). Skalären p e (0,1) avstäms i relation till den antagna stationäriteten av v(k). Ett medelvärde över 1 ramar svarar grovt mot ett p implicit givet av f = _2- (13) 1-12 Parametem p kan exempelvis ha ett värde runt 0,95. l en föredragen utföringsform utförs medelvärdesbildning l enlighet med (12) även för en parametrisk PSD-skattning i enlighet med (6). Denna medelvärdesbildningsprocedur kan utgöra en del av blocket i figur 1 och kan utföras såsom en del av steg 160 i figur 3. l en modifierad version av utföringsfonnen i figur 1 kan dämparen 28 utelämnas. istället kan Kalman-filtret 34 användas såsom en dämpare av signalen x(k). l detta fall leds pa- rametrama för AR-modellen av bakgrundsbuller till Kalman-filtrets 34 båda styringängar, men med en lägre variansparameter (svarande mot den önskade dämpningen) på sty- ringàngen som mottager förbättrade talparametrar under talramar.
Om vidare de fördröjningar som förorsakas av beräkningen av förbättrade talparametrar betraktas såsom alltför långa är det, i enlighet med en modifierad utföringsforrn av före- liggande uppfinning, möjligt att använda de förbättrade talparametrama för en aktuell talram även för filtrering av nästa talram (i denna utföringsform betraktas tal såsom sta- tionärt över två ramar). I den modifierade utföringsfonnen kan förbättrade talparametrar 506 054 10 för en talram beräknas samtidigt med filtreringen av ramen med förbättrade parametrar för föregående talram.
Den grundläggande algoritmen för förfarandet i enlighet med föreliggande uppfinning kan nu summeras enligt följande: I talramar utför - skatta PSD (i,,(w ) för bakgrundsbullret för en uppsättning av M frekvenser. Här kan varje lämplig typ av PSD-estimator användas, t.ex. parametrisk eller icke- parametrisk (periodogram) skattning. Genom användning av làngtidsmedelvär- desbildning i enlighet med (12) reduceras felvariansen i PSD-skattningen.
Förtalaktivitet: i varje ram utför på basis av {x(k)} skatta AR-parametrama {a;} och residualfelvariansen of för det bullriga talet. - på basis av dessa parametrar för bullrigt tal, beräkna PSD-skattningen (ßjw) för det bullriga talet för en uppsättning av M frekvenser. - på basis av (ßjw) och (ßjm), beräkna en skattning (51 w ) av den spektrala effekttätheten förtal genom användning av (9). Skalären ö är en designvariabel som är approximativt lika med 1. - på basis av den förbättrade spektrala effekttätheten (hm), beräkna de förbättra- de AR-parametrama och motsvarande residualvarians. 506 054 11 De flesta av blocken i anordningen i figur 1 implementeras företrädesvis såsom en eller flera mikro/signalprocessorkombinationer (t.ex. blocken 14, 18, 20, 22, 26, 30, 32 och 34).
I syfte att illustrera prestanda för förfarandet i enlighet med föreliggande uppfinning ut- fördes flera simuleringsexperiment. För att mäta förbättringen i de förbättrade paramet- rarna i förhållande till ursprungliga parametrar beräknades följande mått över 200 olika simuleringar M _ (m) I m, Z[1°gr<1>rk))-1°gr<1>,rk»]' V = 2 "f (14) 200 l M , "" Zlogrdark» k=I i Detta mått (förlustfunktion) beräknades både för bullriga och förbättrade parametrar, dvs <í>(k) betecknar antingen èJk) eller å;,(k). |(14) betecknar (-)(“'> resultatet av simulering nummer m. De två måtten illustreras i figur 7. Figur 8 illustrerar kvoten mellan dessa mått. Av figurema framgår att för lågt signal-till-bullerförhàllande (SNR< 15 dB) ger de förbättrade parametrarna bättre prestanda än de bullriga parametrarna, me- dan prestanda är approximativt lika för båda parameteruppsättningama vid högt signal-till-bullerförhàllande. Vid låga SNR-värden är förbättringen i SNR mellan för- bättrade och bullriga parametrar av storleksordningen 7 dB för ett givet värde på måttet V.
F ackmannen inser att olika modifieringar och förändringar kan göras vid föreliggan- de uppfinning utan avvikelse från dess grundtanke och ram, som definieras av de bifogade patentkraven. 506 034 12 APPENDIX För erhållande av en ökad numerisk robusthet i skattningen av förbättrade parametrar .transformeras skattade förbättrade PSD-data i (11) i enlighet med följande icke-linjära datatransformation f" = rf(u.fr21,....fMf (16) där A - 10min (10) ânflf) > ß flk) = _ -log(s) q>,(k)se där e är en användarvald eller databeroende tröskel som säkerställer att flk) är reell- värd. Genom användning av vissa grova approximationer (baserade på en Fourier- serieutveckling, ett antagande om ett stort antal sampel och en hög modellordning) gäl- ler i det frekvensintervall som är av intresse _ z-rofflf) k=i E[<ï>,(U-,(k)-d>,(k)]e N (17) 0 kxi Ekvation (17) ger 2_r k=i E[f(i)-7(I)][íflß)-7(k)] ß N (18) 0 kxi l (18) definieras uttrycket y(k) av m) = E/frki] = -løgrašfllogrlwfficme-fërf) (19) k=1,...,M (16)- 506 054 13 Om det antages att en statistiskt effektiv skattning f" och en skattning av motsvarande kovariansmatris far föreligger, kan vektom x = (Ö-fivf-'IIÛZH-'Icrf och dess kovariansmatris p, beräknas i enlighet med GW z [arm I öl rick) 13,00 = [Gfløffäoffkßf (21) iom) = 2rk1+f-,fløGrk)fi¥[f-ro2rk»] I med initialskattningar f' , år och 2 (0) . l ovanstående algoritm ges relationen mellan 171) och 1 av IYx) = (r(1).r(2),---,>'M)T (22) där yflc) ges av (19). Med hjälp av uttrycket 506 034 14 f - 1 \ Bl öraš) 1 + Zßflfï” _ m=l _ öflk) - - ac' 4ï2 “” = = 2R*'*“¿í¿L";:* am) 1+ Xena? âcz __ m=l _ öflk) x Ûc, 1 »får 2R8 i-*ïire 2,* (23) k 1 + zÛmeql-ím nr=l ges gradienten av Ng) med avseende på 1 av [arm ö I = (qllnwlflflvqJMj l Ovanstående algoritm (21) innebär en stor mängd beräkningar för skattningen av år.
En huvuddel av dessa beräkningar härrör från multipliceringen med och inverieringen av (M x M)-matrisen far. Matrisen lär är dock nära nog diagonal (se ekvation (18)) och kan approximeras genom ll far :í-r] = constø] (25) där l betecknar enhetsmatrisen av ordning (M x M). I enlighet med en föredragen utfö- ringsform kan därför följande sub-optimala algoritm användas 506 034 15 GW = [arm í öl m (26) »âr/Hu = iflw [Grk)c*rk)I*Grk1[f-rm2flø)] med initialskattningar f" och ,{f(0). |(26) har G(k) storleken ((r+1)xM). [1] [2] [3] [41 506 054 16 REFERENSER J.D. Gibson, B. Koo och S.D. Gray, "Fi|tering of colored noise for speech enhan- cement and coding", IEEE Transaction on Acoustics, Speech and Signal Proces- sing", vol. 39, nr. 8, sid. 1732-1742, Augusti 1991.
D.K. Freeman, G. Cosier, C.B. Southcott och I. Boyd, "The voice activity detector for the pan-European digital cellular mobile telephone service" 1989 IEEE Inter- national Conference Acoustics, Speech and Signal Processing, 1989, sid. 489- 502.
J.S. Lim och A.V. Oppenheim, "All-pole modeling of degraded speech", IEEE Transactions on Acoustics, Speech, and Signal Processing, Vol. ASSp-26, Nr. 3, Juni 1978, sid. 228-231.
T. Söderström, P. Stoica och B. Friedlander, "An indirect prediction error method for system identification", Automatica, vol. 27, nr. 1, sid. 183-188, 1991.
Claims (17)
1. Förfarande för förbättring av parametrar representerande bullrigt tal, känne- tecknat av av bestämning av en skattning av den spektrala effekttätheten för bakgrundsbuller vid M frekvenser, där M är ett förutbestämt positivt heltal, ur en första 'uppsättning bakgrundsbullersampel; bestämning av p autoregressiva parametrar, där p är ett förutbestämt positivt heltal som är väsentligt mindre än M, och en första residualvarians ur en andra upp- sättning bullriga talsampel; bestämning av en skattning av den spektrala effekttätheten för bullrigt tal vid de M frekvenserna ur de p autoregressiva parametrarna och den första residualva- nansen; i bestämning av en förbättrad skattning av den spektrala effekttätheten för tal genom subtrahering av skattningen av den spektrala effekttätheten för bakgrunds- buller multiplicerad med en förutbestämd positiv faktor från skattningen av den spektrala effekttätheten för bullrigt tal; bestämning av r förbättrade autoregressiva parametrar, där r är ett förutbe- stämt positivt heltal, och en förbättrad residualvarians ur den förbättrade skattningen av den spektrala effekttätheten för tal.
2. Förfarande enligt krav 1, kännetecknat av begränsning av den förbättrade skattningen av den spektrala effekttätheten för tal till icke-negativa värden.
3. Förfarande enligt krav 2, kännetecknat av att den positiva faktorn har ett värde i intervallet 0-4.
4. Förfarande enligt krav 3, kännetecknat av att den förutbestämda positiva fak- torn är approximativt lika med 1. 506 054 18
5. Förfarande enligt krav 4, kännetecknat av att det förutbestämda heltalet r är lika med det förutbestämda heltalet p.
6. Förfarande enligt krav 5, kännetecknat av skattning av q autoregressiva parametrar, där q är ett förutbestämt positivt heltal mindre än p, och en andra residualvarians ur den första uppsättningen bak- grundsbullersampel; bestämning av skattningen av den spektrala effekttätheten för bakgrundsbullret vid de M frekvenserna ur de q autoregressiva parametrarna och den andra residual- variansen.
7. Förfarande enligt krav 1 eller 6, kännetecknat av medelvärdesbildning av skattningen av den spektrala effekttätheten för bakgrundsbullret över ett förutbe- stämt antal uppsättningar av bakgrundsbullersampel.
8. Förfarande enligt något av föregående krav, kännetecknat av användning av de förbättrade autoregressiva parametrarna och den förbättrade residualvariansen för inställning av ett filter för filtrering av en tredje uppsättning bullriga talsampel.
9. Förfarande enligt krav 8, kännetecknat av att den andra och tredje uppsätt- ningen bullriga talsampel utgörs av samma uppsättning.
10. Förfarande enligt krav 8 eller 9, kännetecknat av Kalman-filtrering av den tredje uppsättningen bullriga talsampel.
11. Anordning för förbättring av parametrar representerande bullrigt tal, känne- tecknad av organ (22, 26) för bestämning av en skattning av den spektrala effekttätheten för bakgrundsbuller vid M frekvenser, där M är ett förutbestämt positivt heltal ur en första uppsättning av bakgrundsbullersampel; 506 034 19 organ (18) för skattning av p autoregressiva parametrar, där p är ett förutbe- stämt positivt heltal som är väsentligt mindre än M, och en första residuaivarians ur en andra uppsättning av bullriga talsampel; organ (20) för bestämning av en skattning av den spektrala effekttätheten för .bullrigt tal vid de M frekvenserna ur de p autoregressiva parametrarna och den första residualvariansen; organ (30) för bestämning av en förbättrad skattning av den spektrala effekt- tätheten för tal genom subtrahering av skattningen av den spektrala effekttätheten för bakgrundsbuller multiplicerad med en förutbestämd positiv faktor från skattning- en av den spektrala effekttätheten för bullrigt tal; och organ (32) för bestämning av r förbättrade autoregressiva parametrar, där r är ett förutbestämt positivt heltal, och en förbättrad residuaivarians ur den förbättrade skattningen av den spektrala effekttätheten för tal.
12. Anordning enligt krav 11, kännetecknad av organ (30) för begränsning av den förbättrade skattningen av den spektrala effekttätheten för tai till icke-negativa vär- den.
13. Anordning enligt krav 12, kännetecknad av organ (22) för skattning av q autoregressiva parametrar, där q är ett förutbe- stämt positivt heltal mindre än p, och en andra residuaivarians ur den första upp- sättningen av bakgrundsbullersampel; organ (26) för bestämning av skattningen av den spektrala effekttätheten för bakgrundsbullret vid de M frekvenserna ur de q autoregressiva parametrarna och den andra residualvariansen.
14. Anordning enligt krav 11 eller 13, kännetecknad av organ (26) för medelvär- desbildning av skattningen av den spektrala effekttätheten för bakgrundsbullret över ett förutbestämt antal uppsättningar av bakgrundsbullersampel. 506 034 20
15. Anordning enligt något av föregående krav, kännetecknad av organ (34) för användning av de förbättrade autoregressiva parametrararna och den förbättrade residualvariansen för inställning av ett filter för filtrering av en tredje uppsättning av bullriga talsampel.
16. Anordning enligt krav 15, kännetecknad av ett Kalman-filter (34) för filtrering av den tredje uppsättningen av bullriga talsampel.
17. Anordning enligt krav 15, kännetecknad av ett Kalman-filter (34) för filtrering av den tredje uppsättningen av bullriga talsampel, varvid den andra och den tredje uppsättningen av bullriga talsampel utgör samma uppsättning.
Priority Applications (10)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SE9600363A SE506034C2 (sv) | 1996-02-01 | 1996-02-01 | Förfarande och anordning för förbättring av parametrar representerande brusigt tal |
US08/781,515 US6324502B1 (en) | 1996-02-01 | 1997-01-09 | Noisy speech autoregression parameter enhancement method and apparatus |
CA002243631A CA2243631A1 (en) | 1996-02-01 | 1997-01-27 | A noisy speech parameter enhancement method and apparatus |
AU16790/97A AU711749B2 (en) | 1996-02-01 | 1997-01-27 | A noisy speech parameter enhancement method and apparatus |
DE69714431T DE69714431T2 (de) | 1996-02-01 | 1997-01-27 | Verfahren zum verbessern von verrauschter sprache und gerät |
PCT/SE1997/000124 WO1997028527A1 (en) | 1996-02-01 | 1997-01-27 | A noisy speech parameter enhancement method and apparatus |
JP9527551A JP2000504434A (ja) | 1996-02-01 | 1997-01-27 | ノイズのある音声パラメータを強化する方法および装置 |
KR1019980705713A KR100310030B1 (ko) | 1996-02-01 | 1997-01-27 | 노이지음성파라미터강화방법및장치 |
CN97191991A CN1210608A (zh) | 1996-02-01 | 1997-01-27 | 一种有噪语音参数增强的方法和装置 |
EP97902783A EP0897574B1 (en) | 1996-02-01 | 1997-01-27 | A noisy speech parameter enhancement method and apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SE9600363A SE506034C2 (sv) | 1996-02-01 | 1996-02-01 | Förfarande och anordning för förbättring av parametrar representerande brusigt tal |
Publications (3)
Publication Number | Publication Date |
---|---|
SE9600363D0 SE9600363D0 (sv) | 1996-02-01 |
SE9600363L SE9600363L (sv) | 1997-08-02 |
SE506034C2 true SE506034C2 (sv) | 1997-11-03 |
Family
ID=20401227
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
SE9600363A SE506034C2 (sv) | 1996-02-01 | 1996-02-01 | Förfarande och anordning för förbättring av parametrar representerande brusigt tal |
Country Status (10)
Country | Link |
---|---|
US (1) | US6324502B1 (sv) |
EP (1) | EP0897574B1 (sv) |
JP (1) | JP2000504434A (sv) |
KR (1) | KR100310030B1 (sv) |
CN (1) | CN1210608A (sv) |
AU (1) | AU711749B2 (sv) |
CA (1) | CA2243631A1 (sv) |
DE (1) | DE69714431T2 (sv) |
SE (1) | SE506034C2 (sv) |
WO (1) | WO1997028527A1 (sv) |
Families Citing this family (136)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6453285B1 (en) * | 1998-08-21 | 2002-09-17 | Polycom, Inc. | Speech activity detector for use in noise reduction system, and methods therefor |
US6289309B1 (en) * | 1998-12-16 | 2001-09-11 | Sarnoff Corporation | Noise spectrum tracking for speech enhancement |
FR2799601B1 (fr) * | 1999-10-08 | 2002-08-02 | Schlumberger Systems & Service | Dispositif et procede d'annulation de bruit |
US6980950B1 (en) * | 1999-10-22 | 2005-12-27 | Texas Instruments Incorporated | Automatic utterance detector with high noise immunity |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US7035790B2 (en) * | 2000-06-02 | 2006-04-25 | Canon Kabushiki Kaisha | Speech processing system |
US7072833B2 (en) * | 2000-06-02 | 2006-07-04 | Canon Kabushiki Kaisha | Speech processing system |
US7010483B2 (en) * | 2000-06-02 | 2006-03-07 | Canon Kabushiki Kaisha | Speech processing system |
US20020026253A1 (en) * | 2000-06-02 | 2002-02-28 | Rajan Jebu Jacob | Speech processing apparatus |
US6983242B1 (en) * | 2000-08-21 | 2006-01-03 | Mindspeed Technologies, Inc. | Method for robust classification in speech coding |
US6463408B1 (en) * | 2000-11-22 | 2002-10-08 | Ericsson, Inc. | Systems and methods for improving power spectral estimation of speech signals |
DE10124189A1 (de) * | 2001-05-17 | 2002-11-21 | Siemens Ag | Verfahren zum Signalempfang |
GB2380644A (en) * | 2001-06-07 | 2003-04-09 | Canon Kk | Speech detection |
US7133825B2 (en) * | 2003-11-28 | 2006-11-07 | Skyworks Solutions, Inc. | Computationally efficient background noise suppressor for speech coding and speech recognition |
US20090163168A1 (en) * | 2005-04-26 | 2009-06-25 | Aalborg Universitet | Efficient initialization of iterative parameter estimation |
CN100336307C (zh) * | 2005-04-28 | 2007-09-05 | 北京航空航天大学 | 接收机射频系统电路内部噪声的分配方法 |
JP4690912B2 (ja) * | 2005-07-06 | 2011-06-01 | 日本電信電話株式会社 | 目的信号区間推定装置、目的信号区間推定方法、プログラム及び記録媒体 |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US7844453B2 (en) * | 2006-05-12 | 2010-11-30 | Qnx Software Systems Co. | Robust noise estimation |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
JP5291004B2 (ja) | 2007-03-02 | 2013-09-18 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 通信ネットワークにおける方法及び装置 |
TWI420509B (zh) * | 2007-03-19 | 2013-12-21 | Dolby Lab Licensing Corp | 語音增強用雜訊變異量估計器 |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
EP2151822B8 (en) * | 2008-08-05 | 2018-10-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an audio signal for speech enhancement using a feature extraction |
US8392181B2 (en) * | 2008-09-10 | 2013-03-05 | Texas Instruments Incorporated | Subtraction of a shaped component of a noise reduction spectrum from a combined signal |
US8244523B1 (en) * | 2009-04-08 | 2012-08-14 | Rockwell Collins, Inc. | Systems and methods for noise reduction |
US8548802B2 (en) * | 2009-05-22 | 2013-10-01 | Honda Motor Co., Ltd. | Acoustic data processor and acoustic data processing method for reduction of noise based on motion status |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US9324337B2 (en) * | 2009-11-17 | 2016-04-26 | Dolby Laboratories Licensing Corporation | Method and system for dialog enhancement |
US8600743B2 (en) * | 2010-01-06 | 2013-12-03 | Apple Inc. | Noise profile determination for voice-related feature |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US8977584B2 (en) | 2010-01-25 | 2015-03-10 | Newvaluexchange Global Ai Llp | Apparatuses, methods and systems for a digital conversation management platform |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
JP5834449B2 (ja) * | 2010-04-22 | 2015-12-24 | 富士通株式会社 | 発話状態検出装置、発話状態検出プログラムおよび発話状態検出方法 |
CN101930746B (zh) * | 2010-06-29 | 2012-05-02 | 上海大学 | 一种mp3压缩域音频自适应降噪方法 |
US8892436B2 (en) * | 2010-10-19 | 2014-11-18 | Samsung Electronics Co., Ltd. | Front-end processor for speech recognition, and speech recognizing apparatus and method using the same |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
CN103187068B (zh) * | 2011-12-30 | 2015-05-06 | 联芯科技有限公司 | 基于Kalman的先验信噪比估计方法、装置及噪声抑制方法 |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
CN102637438B (zh) * | 2012-03-23 | 2013-07-17 | 同济大学 | 一种语音滤波方法 |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
CN102890935B (zh) * | 2012-10-22 | 2014-02-26 | 北京工业大学 | 一种基于快速卡尔曼滤波的鲁棒语音增强方法 |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
CN110442699A (zh) | 2013-06-09 | 2019-11-12 | 苹果公司 | 操作数字助理的方法、计算机可读介质、电子设备和系统 |
US9966065B2 (en) | 2014-05-30 | 2018-05-08 | Apple Inc. | Multi-command single utterance input method |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
CN105023580B (zh) * | 2015-06-25 | 2018-11-13 | 中国人民解放军理工大学 | 基于可分离深度自动编码技术的无监督噪声估计和语音增强方法 |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
CN105788606A (zh) * | 2016-04-03 | 2016-07-20 | 武汉市康利得科技有限公司 | 一种用于拾音器的基于递归最小追踪的噪声估计方法 |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DE102017209585A1 (de) * | 2016-06-08 | 2017-12-14 | Ford Global Technologies, Llc | System und verfahren zur selektiven verstärkung eines akustischen signals |
DK179309B1 (en) | 2016-06-09 | 2018-04-23 | Apple Inc | Intelligent automated assistant in a home environment |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US11373667B2 (en) * | 2017-04-19 | 2022-06-28 | Synaptics Incorporated | Real-time single-channel speech enhancement in noisy and time-varying environments |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
CN107197090B (zh) * | 2017-05-18 | 2020-07-14 | 维沃移动通信有限公司 | 一种语音信号的接收方法及移动终端 |
EP3460795A1 (en) * | 2017-09-21 | 2019-03-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal processor and method for providing a processed audio signal reducing noise and reverberation |
US10481831B2 (en) * | 2017-10-02 | 2019-11-19 | Nuance Communications, Inc. | System and method for combined non-linear and late echo suppression |
CN110931007B (zh) * | 2019-12-04 | 2022-07-12 | 思必驰科技股份有限公司 | 语音识别方法及系统 |
CN114155870B (zh) * | 2021-12-02 | 2024-08-27 | 桂林电子科技大学 | 低信噪比下基于spp和nmf的环境音噪声抑制方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3266042D1 (en) * | 1981-09-24 | 1985-10-10 | Gretag Ag | Method and apparatus for reduced redundancy digital speech processing |
US4628529A (en) | 1985-07-01 | 1986-12-09 | Motorola, Inc. | Noise suppression system |
JP2642694B2 (ja) * | 1988-09-30 | 1997-08-20 | 三洋電機株式会社 | 雑音除去方法 |
EP0459364B1 (en) * | 1990-05-28 | 1996-08-14 | Matsushita Electric Industrial Co., Ltd. | Noise signal prediction system |
US5319703A (en) * | 1992-05-26 | 1994-06-07 | Vmx, Inc. | Apparatus and method for identifying speech and call-progression signals |
SE501981C2 (sv) | 1993-11-02 | 1995-07-03 | Ericsson Telefon Ab L M | Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler |
EP0681730A4 (en) | 1993-11-30 | 1997-12-17 | At & T Corp | REDUCTION OF TRANSMISSION NOISE IN COMMUNICATION SYSTEMS. |
-
1996
- 1996-02-01 SE SE9600363A patent/SE506034C2/sv not_active IP Right Cessation
-
1997
- 1997-01-09 US US08/781,515 patent/US6324502B1/en not_active Expired - Lifetime
- 1997-01-27 JP JP9527551A patent/JP2000504434A/ja active Pending
- 1997-01-27 WO PCT/SE1997/000124 patent/WO1997028527A1/en active IP Right Grant
- 1997-01-27 KR KR1019980705713A patent/KR100310030B1/ko not_active IP Right Cessation
- 1997-01-27 DE DE69714431T patent/DE69714431T2/de not_active Expired - Lifetime
- 1997-01-27 CN CN97191991A patent/CN1210608A/zh active Pending
- 1997-01-27 EP EP97902783A patent/EP0897574B1/en not_active Expired - Lifetime
- 1997-01-27 CA CA002243631A patent/CA2243631A1/en not_active Abandoned
- 1997-01-27 AU AU16790/97A patent/AU711749B2/en not_active Ceased
Also Published As
Publication number | Publication date |
---|---|
WO1997028527A1 (en) | 1997-08-07 |
DE69714431T2 (de) | 2003-02-20 |
EP0897574B1 (en) | 2002-07-31 |
SE9600363D0 (sv) | 1996-02-01 |
JP2000504434A (ja) | 2000-04-11 |
CN1210608A (zh) | 1999-03-10 |
KR19990081995A (ko) | 1999-11-15 |
AU1679097A (en) | 1997-08-22 |
KR100310030B1 (ko) | 2001-11-15 |
SE9600363L (sv) | 1997-08-02 |
DE69714431D1 (de) | 2002-09-05 |
CA2243631A1 (en) | 1997-08-07 |
US6324502B1 (en) | 2001-11-27 |
EP0897574A1 (en) | 1999-02-24 |
AU711749B2 (en) | 1999-10-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
SE506034C2 (sv) | Förfarande och anordning för förbättring av parametrar representerande brusigt tal | |
You et al. | /spl beta/-order MMSE spectral amplitude estimation for speech enhancement | |
KR101120679B1 (ko) | 이득-제한된 잡음 억제 | |
US5708754A (en) | Method for real-time reduction of voice telecommunications noise not measurable at its source | |
KR100330230B1 (ko) | 잡음 억제 방법 및 장치 | |
CA2210490C (en) | Spectral subtraction noise suppression method | |
KR950011964B1 (ko) | 신호처리장치 | |
EP3439325A1 (en) | Automatically tuning an audio compressor to prevent distortion | |
KR100821177B1 (ko) | 통계적 모델에 기반한 선험적 음성 부재 확률 추정 방법 | |
KR101737824B1 (ko) | 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치 | |
Ma et al. | Speech enhancement using a masking threshold constrained Kalman filter and its heuristic implementations | |
JP4965891B2 (ja) | 信号処理装置およびその方法 | |
CN111951818B (zh) | 一种基于改进功率差噪声估计算法的双麦克风语音增强方法 | |
Naik et al. | A literature survey on single channel speech enhancement techniques | |
CN109215672B (zh) | 一种声音信息的处理方法、装置及设备 | |
KR101295727B1 (ko) | 적응적 잡음추정 장치 및 방법 | |
JP2005258158A (ja) | ノイズ除去装置 | |
JP4123835B2 (ja) | 雑音抑圧装置および雑音抑圧方法 | |
KR100784456B1 (ko) | Gmm을 이용한 음질향상 시스템 | |
KR20110061781A (ko) | 실시간 잡음 추정에 기반하여 잡음을 제거하는 음성 처리 장치 및 방법 | |
KR20160116440A (ko) | 음성인식 시스템의 신호대잡음비 추정 장치 및 방법 | |
KR101811635B1 (ko) | 스테레오 채널 잡음 제거 장치 및 방법 | |
RU2206960C1 (ru) | Способ подавления шума в информационном сигнале и устройство для его осуществления | |
KR101993003B1 (ko) | 잡음 제거 장치 및 방법 | |
KR20080049385A (ko) | 마스킹 확률을 이용한 음성 인식 전처리 방법 및 전처리장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
NUG | Patent has lapsed |