[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

SE519981C2 - Kodning och avkodning av signaler från flera kanaler - Google Patents

Kodning och avkodning av signaler från flera kanaler

Info

Publication number
SE519981C2
SE519981C2 SE0003285A SE0003285A SE519981C2 SE 519981 C2 SE519981 C2 SE 519981C2 SE 0003285 A SE0003285 A SE 0003285A SE 0003285 A SE0003285 A SE 0003285A SE 519981 C2 SE519981 C2 SE 519981C2
Authority
SE
Sweden
Prior art keywords
channels
correlation
channel
codebook
common
Prior art date
Application number
SE0003285A
Other languages
English (en)
Other versions
SE0003285D0 (sv
SE0003285L (sv
Inventor
Tor Bjoern Minde
Arne Steinarson
Jonas Svedberg
Tomas Lundberg
Original Assignee
Ericsson Telefon Ab L M
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ericsson Telefon Ab L M filed Critical Ericsson Telefon Ab L M
Priority to SE0003285A priority Critical patent/SE519981C2/sv
Publication of SE0003285D0 publication Critical patent/SE0003285D0/sv
Priority to AT01963659T priority patent/ATE363710T1/de
Priority to EP01963659A priority patent/EP1320849B1/en
Priority to DE60128711T priority patent/DE60128711T2/de
Priority to JP2002527492A priority patent/JP4485123B2/ja
Priority to PCT/SE2001/001885 priority patent/WO2002023528A1/en
Priority to AU2001284588A priority patent/AU2001284588A1/en
Priority to US10/380,423 priority patent/US7283957B2/en
Publication of SE0003285L publication Critical patent/SE0003285L/sv
Publication of SE519981C2 publication Critical patent/SE519981C2/sv

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Error Detection And Correction (AREA)

Description

lO 15 20 25 30 519 981 2 placerade nära varandra. I vissa inställningar är flera ljudkällor gemensam- ma och korrelationen mellan kanaler reduceras, medan i andra inställningar är en enstaka ljudkälla dominerande. Ibland är de akustiska inställningarna för varje mikrofon lika, i andra situationer kan några mikrofoner vara nära reflekterande ytor medan andra inte är det. Typen och graden av signalkor- relationer mellan och inom kanaler i dessa olika inställningar varierar troli- gen. Kodaren som beskrivs i [3] är inte alltid särskilt lämpad för att klara dessa olika fall.
SAMMANFATTNING Ett syfte med den föreliggande uppfinningen är att underlätta anpassning av kodning/avkodning av signaler från flera kanaler genom linjär predíktiv analys genom syntes till varierande korrelation mellan kanaler.
Det centrala problemet är att hitta en effektiv LPAS-talkodningsstruktur för flera kanaler som utnyttjar den varierande källsignalkorrelationen. För en talsignal från M kanaler vill vi ha en kodare som kan producera en bitström som i medel är signifikant under M gånger den hos en talkodare för en ka- nal, medan samma eller bättre ljudkvalitet bevaras vid en given medelbitrat.
Andra syften innefattar rimlig implementerings- och beräkningskomplexitet för realisering av kodare inom denna ram.
Dessa syften uppnås i enlighet med de bifogade patentkraven.
Kortfattat innefattar den föreliggande uppfinningen en kodare som kan om- koppla mellan olika multipla moder så att kodningsbitar kan omallokeras mellan olika delar av LPAS-kodaren för flera kanaler för att bäst passa typen och graden av korrelation mellan kanaler. Detta tillåter källsignalstyrd tal- kodning med multipla moder och flera kanaler genom analys genom syntes som kan användas för att i medel sänka bitraten och bibehålla en hög ljud- kvalitet. j__i CÛ 15 20 25 30 519 981 3 KORTBESKRHWWWGAVPHHUNGARNA Uppfinningen, tillsammans med ytterligare syften och fördelar med denna, kan bäst förstås genom hänvisningar till följande beskrivning läst tillsammans med de medföljande ritningarna, i vilka: FIG. l är ett blockdiagram av en konventionell LPAS-talkodare för en kanah FIG. 2 är ett blockdiagram av en utföringsform av analysdelen av en LPAS-talkodare för flera kanaler enligt känd teknik; FIG. 3 är ett blockdiagram av en utföringsform av syntesdelen av en LPAS-talkodare för flera kanaler enligt känd teknik; FIG. 4 är ett blockdiagram av en belysande utföringsform av syntesde- len av en LPAS-talkodare för flera kanaler i enlighet med den föreliggande uppfinningen; FIG. 5 är ett flödesdíagram av en belysande utföringsform av ett sökför- farande för en flerdelad fast kodbok; FIG. 6 är ett flödesdiagram av en annan belysande utföringsform av ett sökförfarande för en flerdelad fast kodbok; FIG. 7 är ett blockdiagram av en belysande utföringsform av analysde- len av en LPAS-talkodare för flera kanaler i enlighet med den föreliggande uppfinningen; samt FIG. 8 är ett flödesdiagram som illustrerar en belysande utföringsform av ett förfarande för bestämning av kodningsstrategi.
DEWMJERMDBESGUWWNGAVFÖREDRAGNAUTWÜUNGS- FORMER I den följande beskrivningen används samma hänvisningsbeteckningar för motsvarande eller liknande element.
Den föreliggande uppfinningen kommer nu att beskrivas genom introduktion av en konventionell talkodare för en kanal som utnyttjar linjär prediktiv ana- l0 15 20 25 30 519 981 4 lys genom syntes (LPAS) och en allmän talkodare för flera kanaler som ut- nyttjar linjär prediktiv analys genom syntes (LPAS) som beskrivs i [3].
Fig. 1 är ett blockdiagram av en konventionell LPAS-talkodare för en kanal.
Kodaren innefattar två delar, nämligen en syntesdel och en analysdel (en mot- svarande avkodare innehåller endast en syntesdel).
Syntesdelen innefattar ett LPC-syntesñltret 12 som mottager en exciterings- signal i(n) och matar ut en syntestalsignal šlnl- Excítationssignalfin i(n) bildas genom addering av två signaler u(n) och v(n) i en adderare 22. Signalen u(n) bildas genom skalning av en signal f(n) från en fast kodbok 16 med en för- stärkning gr i ett förstärkningselement 20. Signalen v(n) bildas genom skal- ning av en fördröjd (av fördröjning “lag”) version av excitatíonssígnalen i(n) från en adaptiv kodbok 14 med en förstärkning gA i ett förstärkningselement 18. Den adaptiva kodboken bildas av en återkopplad loop som innefattar ett fördröjningselement 24 som fördröjer excitationssignalen i(n) en delrams längd N. Den adaptiva kodboken innehåller således föregående excitationer i(n) som skiftas in i kodboken (de äldsta excitatíonerna skiftas ut från kodboken och kasseras). LPC-syntesfiltrets parametrar uppdateras typiskt var 20-40 ms ram medan den adaptiva kodboken uppdateras var 5- 10 ms delram.
Analysdelen av LPAS-kodaren utför en LFC-analys av den inkommande talsig- nalen s(n) samt utför även en excitatíonsanalys.
LPC-analysen utförs av ett LPC-analysfilter 10. Detta filter mottager talsigna- len s(n) och bygger en parametermodell av denna signal ram för ram. Modell- parametrarna väljs för att minimera energin hos en restvektor som bildas av skillnaden mellan en aktuell talramsvektor och den motsvarande signalvek- torn som framställs av modellen. Modellparametrarna representeras av ana- lysfiltrets 10 filterkoefficienter. Dessa filterkoefficienter definierar filtrets över- föringsfunktion A(z). Eftersom syntesfiltret 12 har en överföringsfunktion som är åtminstone ungefär lika med 1 /A(z) styr även dessa filterkoefñcienter syn- tesfiltret 12, vilket antyds av den streckade styrlinjen. lO 15 20 25 30 519 981 s Excitationsanalysen utförs för bestämning av den bästa kombinationen av fast kodboksvektor (kodboksindex), förstärkning gF, adaptiv kodboksvektor (lag) samt förstärkning gA som resulterar i den syntessignalvektorn (šlflll SOm bäst stämmer överens med talsignalvektor {s(n)} (här betecknar { } en samling sam- pel som bildar en vektor eller ram). Detta utförs i en uttömmande sökning som testar alla möjliga kombinationer av dessa parametrar (suboptimala sökplaner är också möjliga, i vilka några parametrar bestäms oberoende av de andra parametrarna och därefter hålls fasta under sökningen efter de återstående parametrarna). För att testa hur nära en syntesvektor (šlflll är den mOtSVa- rande talvektorn {s(n)} kan differensvektorns {e(n)} (som bildas i en adderare) energi beräknas i en energiberäknare 30. Det är emellertid effektivare att be- trakta energin hos en viktad felsignalvektor {ew(n)}, i vilken felen har omförde- lats på ett sådant sätt att stora fel maskas av frekvensband med stor ampli- tud. Detta utförs i viktningsfilter 28.
Modifieringen av LPAS-kodaren för en kanal i fig. l till en LPAS-kodare för flera kanaler i enlighet med [3] kommer nu att beskrivas med hänvisning till fig. 2-3. En talsignal från två kanaler (stereo) antas men samma principer kan användas för fler än två kanaler.
Fig. 2 är ett blockdiagram av en utföringsform av analysdelen av en LPAS- talkodare för flera kanaler som beskrivs i (3). I fig. 2 är nu insignalen en signal från flera kanaler vilket antyds av signalkomponenter s1(n), s2(n). LPC- analysfiltret 10 i fig. 1 har ersatts med ett LPC-analysfilterblock lOM som har en matrisvärd överföringsfunktion A(z). På liknande sätt ersätts adderaren 26, viktníngsfiltret 28 samt energiberäknaren 30 av motsvarande block för flera kanaler 26M, 28M respektive SOM.
Fig. 3 är ett blockdiagram av en utföringsform av syntesdelen av en LPAS- talkodare för flera kanaler som beskrivs i [3]. En avkodare för flera kanaler kan även bildas av en sådan syntesdel. Här har LPC-syntesfiltret 12 i fig. l ersatts av ett LPC-syntesfllterblock l2M som har en matrisvärd överförings- 10 15 20 25 30 519 981 ; i .. i i i n i 6 ^ i ~ » - i -v . ; » ~ , , funktion A'1(z) som är (vilket antyds av beteckningen) åtminstone ungefär lika med inversen av A(z). På liknande sätt ersätts adderaren 22, den fasta kodbo- ken 16, förstärkningselementet 20, fördröjningselementet 24, den adaptiva kodboken 14 samt förstärkningselementet 18 av motsvarande block med flera kanaler 22M, lóM, 24M, 14M respektive l8M.
Ett problem med denna kodare för flera kanaler enligt känd teknik är att den inte är särskilt anpassbar med avseende på varierande korrelation mellan kanaler som beror på varierande mikrofonmiljöer. Till exempel kan flera mik- rofoner i vissa situationer plocka upp tal från en enda talare. I ett sådant fall kan signalerna från de olika mikrofonerna väsentligen bildas av fördröjda och skalade versioner av samma signal, dvs. kanalerna är starkt korrelerade. I andra situationer kan det finnas flera talare samtidigt vid de individuella mik- rofonerna. I detta fall finns det nästan ingen korrelation mellan kanaler.
Ibland är de akustiska inställningarna för varje mikrofon lika, i andra situa- tioner kan nägra mikrofoner vara nära reflekterande ytor medan andra inte år det. Typen och graden av signalkorrelationer mellan och inom kanaler i dessa olika inställningar varierar troligen. Detta motiverar kodare som kan om- koppla mellan multipla moder så att bitar kan omallokeras mellan olika delar av LPAS-kodaren för flera kanaler för att bäst passa typen och graden av kor- relation mellan kanaler. En fast kvalitetströskel och signalegenskaper som varierar med tiden (enstaka högtalare, multipla högtalare, närvaro eller från- varo av bakgrundsbrus, etc.) motiverar CELP-kodare för flera kanaler som har variabla bruttobitrater. En fast bruttobitrat kan även användas där bitar- na endast ornallokeras för förbättring av kodning och den uppfattade slutan- vändarkvaliteten.
Den följande beskrivningen av en LPAS-kodare för flera kanaler och multipla moder beskriver hur kodningsanpassningen i de olika blocken kan ökas. Det bör emellertid förstås att inte alla block måste konfigureras på det beskrivna sättet. Den exakta balansen mellan kodningsanpassning och komplexitet måste beslutas för den individuella kodarimplementeringen. lO 15 20 25 30 519 981 7 Fig. 4 är ett blockdiagram av en belysande utföringsform av syntesdelen av en LPAS-talkodare för flera kanaler i enlighet med den föreliggande uppfinningen.
Ett väsentligt särdrag av kodaren är strukturen hos den flerdelade fasta kod- boken. Enligt uppfinningen innefattar den både individuella fasta kodböcker FC1, FC2 för varje kanal och en gemensam fast kodbok FCS. Fastän den ge- mensamma fasta kodboken FCS är gemensam för alla kanaler (vilket betyder att samma kodboksindex används av alla kanaler) associeras kanalerna med individuella fördröjningar Dl, D2, vilket illustreras i fig. 4. De individuella fasta kodböckerna FC1, FC2 associeras vidare med individuella förstärkningar gm, gm, medan de individuella fördröjningarna D1, D2 (som antingen kan vara heltal eller bråkdelar) associeras med individuella förstärkningar gFSI, gFSQ.
Excitationen från varje individuell fast kodbok FS1, FS2 adderas till den mot- svarande excitationen (en gemensam kodboksvektor men individuella fördröj- ningar och förstärkningar för varje kanal) från den gemensamma fasta kodbo- ken FCS i en adderare AFl, AF2. De fasta kodböckerna innefattar typiskt algebraiska kodböcker, i vilka excitationsvektorerna bildas av enhetspulser som fördelas över varje vektor i enlighet med vissa regler (detta är välkänt för fackmannen och kommer inte att beskrivas ytterligare).
Denna struktur av den flerdelade fasta kodboken är mycket anpassníngsbar.
Till exempel kan vissa kodare använda fler bitar i de individuella fasta kod- böckerna medan andra kodare kan använda fler bitar i den gemensamma fasta kodboken. Dessutom kan en kodare dynamiskt ändra fördelningen av bitar mellan individuella och gemensamma kodböcker beroende på korrela- tion mellan kanaler. I det ideala fallet där varje kanal består av en skalad och translaterad version av samma signal (ekofritt rum) behövs endast den ge- mensamma kodboken och fördröjningsvärdena motsvarar direkt ljudfort- plantningstid. I det motsatta fallet där korrelation mellan kanaler är mycket låg krävs endast separata fasta kodböcker. För vissa signaler kan det till och med vara lämpligt att allokera fler bitar till en individuell kanal än till de andra kanalerna (asymmetrisk fördelning av bitar). lO 15 20 25 30 519 981 8 Fastän fig. 4 illustrerar en fast kodboksstruktur med två kanaler inses att koncepten lätt generaliseras till fler kanaler genom ökning av antalet individu- ella kodböcker och antalet fördröjningar och förstärkningar mellan kanaler.
De gemensamma och individuella kodböckerna genomsöks typiskt seriellt.
Den föredragna ordningen är att först bestämma den gemensamma fasta kod- bokens excitationsvektor, fördröjningar och förstärkningar. Därefter bestäms de individuella fasta kodböckernas vektorer och förstärkningar.
Två sökförfaranden för en flerdelad fast kodbok kommer nu att beskrivas med hänvisning till ñg. 5 och 6.
Fig. 5 är ett flödesdiagram av en belysande utföringsform av ett sökförfarande för en flerdelad fast kodbok i enlighet med den föreliggande uppfinningen. Steg S1 bestämmer en primär eller ledande kanal, typiskt den starkaste kanalen (kanalen som har den största ramenergin). Steg S2 bestämmer korskorrelatio- nen mellan varje sekundär eller efterföljande kanal och den primära kanalen för ett förbestämt intervall, till exempel en del av eller en fullständig ram. Steg S3 lagrar fördröjningskandidater för varje sekundär kanal. Dessa fördröj- ningskandidater definieras av positionerna hos ett antal av de högsta korskor- relationstopparna och de närmaste positionerna runt varje topp för varje se- kundär kanal. Man skulle till exempel kunna välja de 3 högsta topparna och därefter addera de närmsta positionerna på båda sidorna om varje topp vilket ger totalt 9 fördröjningskandidater. Om fördröjningar med hög (bråkdel) upp- lösning används kan antalet kandidater runt varje topp ökas till exempelvis 5 eller 7. Den högre upplösningen kan erhållas genom uppsampling av insigna- len. Fördröjningen för den primära kanalen kan i en enkel utföringsform an- ses vara noll. Eftersom pulserna i kodboken typiskt inte kan ha godtyckliga positioner kan emellertid en viss kodningsvinst erhållas genom tilldelning av en fördröjning även till den primära kanalen. Detta är särskilt fallet när för- dröjningar med hög upplösning används. I steg S4 bildas en temporär gemen- sam fast kodboksvektor för varje lagrad kombination av fördröjningskandida- ter. Steg S5 väljer den fördröjningskombinationen som motsvarar den bästa lO 15 20 25 30 519 981 9 temporära kodboksvektorn. Steg S6 bestämmer de optimala inter-kanalför- stärkningarna. Slutligen bestämmer steg S7 de kanalspeciñka (icke- gemensamma) excitationerna och förstärkningarna.
I en variant av denna algoritm bibehålls alla eller de bästa temporära kod- boksvektorerna samt motsvarande fördröjningar och förstärkningar mellan kanaler. För varje bibehållen kombination utförs en kanalspecifik sökning i enlighet med steg S7. Slutligen väljs den bästa kombinationen av gemensam och individuell fast kodboksexcitation.
För att reducera detta förfarandes komplexitet är det möjligt att begränsa den temporära kodbokens excitationsvektor till endast några pulser. I exempelvis GSM-systemet innefattar den fullständiga fasta kodboken hos en förbättrad (eng. ”enhanced”) kanal med full hastighet 10 pulser. I detta fall är 3-5 tempo- rära kodbokspulser rimligt. I allmänhet skulle 25-50% av det totala antalet pulser vara ett rimligt antal. När den bästa fördröjningskombinationen har valts söks den fullständiga kodboken endast efter denna kombination (typiskt är de redan placerade pulserna oförändrade, endast de återstående pulserna i en fullständig kodbok måste placeras).
Fig. 6 är ett flödesdiagram av en annan utföringsform av ett sökförfarande för en flerdelad fast kodbok. I denna utföringsform är stegen S1, S6 och S7 sam- ma som i utföringsformen i fig. 5. Steg S10 placerar en ny excitationsvektor- puls i en optimal position för varje tillåten fördröjningskombination (den första gången detta steg utförs är alla fördröjningskombinationer tillåtna). Steg S11 testar huruvida alla pulser har förbrukats. Om inte begränsar steg S12 de tillåtna fördröjningskombinationerna till de bästa återstående kombinationer- na. Därefter adderas ytterligare en puls till de återstående tillåtna kombina- tionerna. Slutligen när alla pulser har förbrukats väljer steg S13 den bästa återstående fördröjningskombinationen och dess motsvarande gemensamma fasta kodboksvektor. lO 15 20 25 30 519 981 10 Det finns flera möjligheter med avseende på steget S12. En möjlighet är att endast bibehålla en viss procent, till exempel 25%, av de bästa fördröjnings- kombinationerna i varje iteration. För att undvika att det endast återstår en kombination innan alla pulser har förbrukats är det emellertid möjligt att säkerställa att åtminstone ett visst antal kombinationer återstår efter varje iteration. En möjlighet är att säkerställa att det alltid återstår åtminstone så många kombinationer som det finns pulser kvar plus ett. På detta sätt kom- mer det alltid finnas flera kandidatkombinationer att välja från i varje itera- tion.
Med endast en korskanalsgren i den fasta kodboken måste den primära och den sekundära kanalen bestämmas ram för ram. En möjlighet här är att till- dela den fasta kodboksdelen för den primära kanalen fler pulser än för den sekundära kanalen.
För de fasta kodboksförstärkningarna kräver varje kanal en förstärkning för den gemensamma fasta kodboken och en förstärkning för den individuella kodboken. Dessa förstärkningar har typiskt betydande korrelation mellan kanaler. De korreleras även till förstärkningar i den adaptiva kodboken. Inter- kanalprediktioner av dessa förstärkningar kommer således vara möjliga och vektorkvantisering kan användas för att koda dem.
Enligt fig. 4 innefattar den flerdelade adaptiva kodboken en adaptiv kodbok ACl, AC2 för varje kanal. En flerdelad adaptiv kodbok kan konfigureras på ett antal sätt i en kodare för flera kanaler.
En möjlighet är att låta alla kanaler dela en gemensam delningsfördröjning (eng. ”pitch lag”). Detta är lämpligt om det finns en stark korrelation mellan kanaler. Även när delningsfördröjningen är gemensam kan kanalerna fortfa- rande ha separata delningsförstärkningar (eng. ”pitch gain”) gAn, gAQQ. Den gemensamma delningsförstärkningen söks simultant i alla kanaler på ett sätt som liknar en sluten loop. lO 15 20 25 30 519 981 ll En annan möjlighet är att låta varje kanal har en individuell delningsfördröj- ning P11, P22. Detta är lämpligt när det finns en svag korrelation mellan ka- naler (kanalerna är oberoende). Delningsfördröjningarna kan kodas differenti- ellt eller absolut.
En ytterligare möjlighet är att använda kunskap om tidigare excitationer på ett korskanalssätt. Till exempel kan kanal 2 predikteras från kunskapen om tidi- gare excitationer hos kanal 1 vid fördröjningen P12 mellan kanaler. Detta är lämpligt när det finns en stark korrelation mellan kanaler.
Som i fallet med den fasta kodboken är den beskrivna adaptiva kodboks- strukturen mycket anpassbar och lämplig för multimodsdrift. Valet att använ- da gemensamma eller individuella delningsfördröjningar kan baseras på rest- signalenergin. I ett första steg bestäms den optimala gemensamma delnings- fördröjningens restenergi. I ett andra steg bestäms de optimala individuella delningsfördröjningarnas restenergi. Om restenergin i fallet med gemensam delningsfördröjning överskrider restenergin i fallet med individuella delnings- fördröjningar med ett förbestämt belopp används individuella delningsfördröj- ningar. Annars används en gemensam delningsfördröjning. Om så önskas kan ett rörligt medelvärde av energiskillnaden användas för att göra beslutet mju- kare .
Denna strategi kan anses vara en “sluten loop”-strategí för att besluta mellan gemensamma eller individuella delningsfördröjningar. En annan möjlighet är en “öppen loop”-strategi som baseras på, till exempel, korrelation mellan ka- naler. I detta fall används en gemensam delningsfördröjning om korrelationen mellan kanaler överskrider en förbestämd tröskel. Annars används individu- ella delningsfördröjningar.
Liknande strategier kan användas för att bestämma huruvida interkanaldel- ningsfördröjningar ska användas. lO l5 20 25 30 519 981 12 Vidare förväntas en betydande korrelation mellan de olika kanalernas adapti- va kodboksförstärkningar. Dessa förstärkningar kan predikteras från kunskap om kanalens tidigare förstärkningar, från förstärkningar i samma ram men som tillhör andra kanaler samt även från fasta kodboksförstärkningar. Som i fallet med den fasta kodboken är även vektorkvantisering möjligt.
I LPC-syntesfilterblocket l2M i fig. 4 använder varje kanal ett individuellt LPC- filter (linjär prediktiv kodning). Dessa filter kan härledas oberoende av var- andra på samma sätt som fallet med en enstaka kanal. Vissa eller alla kana- lerna kan emellertid även dela samma LPG-filter. Detta tillåter omkoppling mellan multipel- eller singelñltermoder beroende på signalegenskaper, t.ex. spektralavstånd mellan LPG-Spektra. Om interkanalprediktioner används för LSP-parametrarna (par av linjespektra) stängs prediktionen av eller reduceras för moder med låg korrelation.
F ig. 7 är ett blockdiagram av en belysande utföringsform av analysdelen av en LPAS-talkodare för flera kanaler i enlighet med den föreliggande uppfinningen.
Förutom blocken som redan har beskrivits med hänvisning till fig. 1 och 2 innefattar analysdelen i fig. 7 ett multimodsanalysblock 40. Blocket 40 be- stämmer korrelationen mellan kanaler för att bestämma huruvida det finns tillräcklig korrelation mellan kanaler för att motivera kodning genom använd- ning av endast den gemensamma fasta kodboken FCS, fördröjningarna Dl, D2 samt förstärkningarna gFsl, gFSQ. Om inte är det nödvändigt att använda de individuella fasta kodböckerna FCl, FC2 samt förstärkningarna gm, gm. Kor- relationen kan bestämmas av den vanliga korrelationen i tidsdomänen, dvs. genom skiftning av de sekundära kanalsignalerna med avseende på den pri- mära signalen tills en bästa passning erhålls. Om det finns fler än två kanaler används en gemensam fast kodbok om det minsta korrelationsvärdet överskrider en förbestämd tröskel. En annan möjlighet är att använda en gemensam fast kodbok för kanalerna som har en korrelation till den primära kanalen som överskrider en förbestämd tröskel och individuella fasta kod- böcker för de återstående kanalerna. Den exakta tröskeln kan bestämmas genom lyssnartester. lO 15 20 25 30 519 981š.ïj..ï._gg_. 13 Analysdelen kan även innefatta en beräknare 42 av relativ energi som be- stämmer skalfaktorer ei, e2 för varje kanal. Dessa skalfaktorer kan bestäm- mas i enlighet med: 6.: E: l l där Ei är energin hos ram i. Genom användning av dessa skalfaktorer kan de viktade restenergierna Ri, RQ för varje kanal omskalas i enlighet med kanalens relativa styrka, vilket antyds i fig. 7. Omskalning av restenergin för varje kanal har effekten att optimera för det relativa felet i varje kanal snarare än att op- timera för det absoluta felet i varje kanal. Felomskalning i fallet med flera kanaler kan användas i alla steg (härledning av LPC-filtret, adaptiva och fasta kodböcker).
Skalfaktorerna kan även vara generellare funktioner av den relativa kanal- styrkan el, till exempel: Z exp(a(2e, - 1)) l + exp(a(2e,. - 1)) fæf) där oi är en konstant i intervallet 4-7, till exempel oiz5. Skalningsfunktionens exakta form kan bestämmas av subjektiva lyssnartester.
De olika elementens funktion hos den föreliggande uppfinningens beskrivna utföringsformer implementeras typiskt av en eller flera mikroprocessorer eller mikro-/ signalprocessorkombinationer och motsvarande mjukvara.
I figurerna är flera block och parametrar valfria och kan användas baserat på egenskaperna hos signalen från flera kanaler samt på det totala talkvalitets- kravet. Bitar i kodaren kan allokeras där de bäst behövs. Ram för ram kan lO 15 20 25 30 519 981 14 kodaren välja att fördela bitar olika mellan LPC-delen, den adaptiva och fasta kodboken. Detta är en typ av intra-kanalmultimodsdrift.
En annan typ av multimodsdrift är att fördela bitar i kodaren mellan kanaler- na (asymmetrisk kodning). Detta hänvisas till som intra-kanalmultimodsdrift.
Ett exempel här skulle vara en större fast kodbok för en/ några kanaler eller kodarförstärkningar som kodas med fler bitar i en kanal. De två typerna av multimodsdrift kan kombineras för att effektivt utnyttja källsignalens egen- skaper. l drift med variabel rat kan den totala kodarbitraten ändras ram för ram.
Segment med liknande bakgrundbrus i alla kanaler kräver färre bitar än seg- ment med en övergång från icke-tonade tal till tonade tal som uppträder vid något olika positioner i flera kanaler. I scenarier såsom telekonferenser där flera talare kan överlappa varandra kan olika ljud dominera olika kanaler för efterföljande ramar. Detta motiverar även en tillfälligt ökad högre bitrat.
Multimodsdriften kan styras på ett sätt som liknar en sluten loop eller med ett förfarande med en öppen loop. Förfarandet med en sluten loop bestämmer mod beroende på ett restkodningsfel för varje mod. Detta är ett beräknings- mässigt dyrt förfarande. I ett förfarande med en öppen loop bestäms kod- ningsmoden av beslut som baseras på insignalens egenskaper. I intra- kanalfallet bestäms den variabla ratmoden baserat på till exempel graden av tonade tal, spektralegenskaper samt signalenergi, vilket beskrivs i [4]. För inter-kanalmodbesluten kan korskorrelationsfunktionen mellan kanaler eller en funktion för spektralavstånd användas för att bestämma mod. För kodning av brus eller icke-tonade tal är det relevantare att använda korrelationsegen- skaperna från flera kanaler i frekvensdomänen. En kombination av tekniker som bygger på öppen och sluten loop är även möjlig. Analysen med en öppen loop väljer nägra kandidatmoder som kodas och därefter används det slutliga restfelet i ett beslut med sluten loop. lO 15 20 25 30 519 981 ; 15 Korrelationen mellan kanaler är starkare vid fördröjningar som är relaterade till skillnader i avstånd mellan ljudkällor och mikrofonplaceringar. Sådana fördröjningar mellan kanaler utnyttjas i anslutning till de adaptiva och fasta kodböckerna i den föreslagna LPAS-kodaren för flera kanaler. För multimods- drift med flera kanaler stängs detta särdrag av för moder med låg korrelation och inga bitar spenderas pä fördröjningar mellan kanaler.
Multikanalprediktion och -kvantisering kan användas för moder med hög korrelation mellan kanaler för att reducera antalet bitar som krävs för LPAS- förstärkningen och LPC-parametrarna med flera kanaler. För moder med lägre korrelation mellan kanaler används mindre ínterkanalprediktion och - kvantisering. Endast prediktion och kvantisering inom kanaler skulle kunna vara tillräckliga.
Multikanalfelviktning som beskriven med hänvisning till fig. 7 skulle kunna sättas på och stängas av beroende på korrelation mellan kanaler.
Ett exempel på en algoritm som utförs av block 40 för att besluta om kod- ningsstrategi kommer att beskrivas nedan med hänvisning till fig. 8. Först kommer emellertid ett antal förklaringar och antaganden att ges.
Multimodsanalysblocket 40 kan arbeta i en öppen loop eller en sluten loop eller en kombination av båda principerna. En utföringsform med öppen loop analyserar de inkommande signalerna från kanalerna och väljer en lämplig kodningsstrategi för den nuvarande ramen samt den lämpliga felviktningen och -kriteriet som ska användas av den nuvarande ramen.
I det följande exemplet beslutas LPC-parameterkvantiseringen på ett sätt som liknar en öppen loop, medan de slutliga parametrarna hos den adaptiva kod- boken och den fasta kodboken bestäms på ett sätt som liknar en sluten loop när rösttal ska kodas. 15 20 25 30 519 981 16 , o ~ - , o Antag att ljudklasserna för varje kanal är (TONANDE, ICKE-TONANDE, TRANSIENT, BAKGRUND) med delklasser (MYCKET_BULLRIG, BULLRIG, KLAR). Delklasserna indikerar huruvida ínsignaler är bullrig, vilket ger en tillförlitlighetsindikation för ljudklassiñceringen som även kan användas för finjustering av det slutliga felkriteriet.
Om en ram i en kanal klassificeras som ICKE-TONANDE eller BAKGRUND ändras den fasta kodbokens felkríterium till ett felkriterium í energi- och fre- kvensdomän för den kanalen. För ytterligare information om ljusklassiñcering se [4].
Antag att LFC-parametrarna kan kodas på två olika sätt: 1. En gemensam uppsättning av LFC-parametrar för ramen. 2. Separata uppsättningar av LPC-parametrar för varje kanal.
Långtidspredíktorn (LTP) implementeras som en adaptiv kodbok.
Antag att LTP-fördröjningsparametrarna kan kodas på olika sätt: 1. Inga LTP-fördröjningsparametrar i någon kanal. 2 LTP-fördröjningsparametrar endast för kanal 1. 3. LT P-fördröjningsparametrar endast för kanal 2. 4 Separata LTP-fördröjningsparametrar för kanal 1 och kanal 2.
LTP-förstärkningsparametrarna kodas separat för varje fördröjningsparame- ter.
Antag att den fasta kodbokens parametrar för en kanal kan kodas på fem sätt: o Separat kodbok av liten storlek, (söks i frekvensdomänen, för kodning av icke-tonande/ bakgrundsbrus). o Separat kodbok av medelstorlek. o Separat kodbok av stor storlek. o Gemensam kodbok. o Gemensam kodbok och separat kodbok av medelstorlek.
UW LO 15 20 25 30 519 981 17 Förstärkningarna för varje kanal och kodbok kodas separat.
Fig. 8 är ett flödesdiagram som illustrerar en belysande utföringsform av ett förfarande för bestämning av kodningsstrategi.
Multimodsanalysen utför en förklassificering av insignalen från flera kanaler till tre huvudkvantiseringsstrategier: (MULTITAL, ENSTAKA_TAL, INGET_TAL).
Flödet illustreras i fig. 8.
För att välja den lämpliga strategin har varje kanal sin egen aktivitetsdetekte- ring inom kanaler samt ljudklassificering inom kanaler, steg S20 respektive S21. Om båda ljudklassiñceringarna A, B indikerar BAKGRUND är utsignalen i urskiljningssteg S22 från flera kanaler INGET_TAL, annars är utsignalen TAL. Steg S23 testar huruvida utsignalen från steg S22 indikerar TAL. Om detta inte är fallet fortsätter algoritmen till steg S24 för att utföra en ”inget taV-strategi. Ä andra sidan om steget S23 indikerar TAL forstätter algoritmen till steg S25 för urskiljning mellan en situation med flera/ en enstaka talare. Två interka- nalegenskaper används i detta exempel för att göra detta beslut i steget S25, nämligen tids- och frekvenskorrelationen mellan kanaler.
Värdet på tidskorrelationen mellan kanaler i detta exempel korrigeras och jämförs därefter med en tröskel [steg S26) för att få två diskreta värden (LÄG_TIDSKORRELATION och HÖG_TIDSKORRELATION).
Frekvenskorrelationen mellan kanaler implementeras (steg S27) genom extra- hering av ett normaliserat spektralhölje för varje kanal och därefter summe- ring av den korrigerade skillnaden mellan kanalerna. Summan jämförs däref- ter med en tröskel för att få två diskreta värden (LÄG_FREKVENSKORRELATION och HÖG_FREKVENSKORRELATION), där LÄG_FREKVENSKORRELATION sätts om summan av de korrigerade skillna- lO 15 25 30 519 981 18 derna är större än en tröskel (dvs. frekvenskorrelationen mellan kanaler upp- skattas genom användning som ett direkt mått på spektralskillnad (hölje)).
Spektralskillnaden kan till exempel beräknas i LSF-domänen eller genom användning av amplituderna från en N-punkts FFT. (Spektralskillnaden kan även frekvensviktas för att ge större vikt till små frekvensskillnader.) I steget S25 är utsignalen ENSTAKA om båda ljudklassificeringarna (A, B) indikerar TONANDE och om HÖG_TIDSKORRELATION sätts.
Om båda ljudklassificeringarna (A, B) indikerar lCKE-TONANDE och HÖG_FREKVENSKORRELATION sätts är utsignalen ENSTAKA.
Om en av ljudklassificeringarna (A, B) indikerar TONANDE och den föregående utsignalen var ENSTAKA och HÖG_TIDSKORRELATION sätts förblir utsigna- len EN STAKA.
Annars är utsignalen MULTI.
Steg S28 testar huruvida utsignalen från steget S25 är EN STAKA eller MULTI.
Om den är ENSTAKA fortsätter algoritmen till steg S29 för att utföra en strate- gi med enstaka tal. Annars fortsätter den till steg S30 för att utföra en multi- talsstrategi.
De tre strategierna som utfördes i stegen S24, S29 respektive S30 kommer nu att beskrivas. Förkortningarna FCB och ACB används för den fasta respektive den adaptiva kodboken.
I steget S24 (inget tal) finns det två möjligheter: HÖCLFREKVENSKORRELATION o Gemensamma bitar används (kort spektralavstånd) o LPC Låg bitrat används o ACB Hoppas över om långtidskorrelation är låg. 15 20 25 30 519 981 o , o :u o n . o o n! V -, .- = . ., - . . o . . »I f o o - o . 19 ' * ~ ~ i . » o i: o o o FCB Kodbok med mycket låg bitrat används.
LÅG_FREKVENSKORRELATION o Separata bitallokeringar används (långt spektralavstånd) för varje kanal o LPC Låg bitrat används o ACB Hoppas över om långtidskorrelation är låg. o FCB Kodbok med mycket låg bitrat används.
I steget S29 (enstaka tal) används den följande strategin. Allmänt: Om möjligt används gemensamma bitar. Val baserat på sluten loop och ljudklassificering används för att slutföra bitallokeringen. o LPC gemensam o ACB gemensam eller separat 1. Kanaler som klassificeras som TONANDE: ACB väljs på ett sätt som lik- nar en sluten loop för tonande ramar, gemensam ACB eller två separata ACB. 2. En kanal klassificeras som ICKE-TONANDE och den andra som TONANDE: Separata ACB för varje kanal. 3. Ingen av kanalerna klassificeras som TONANDE: ACB används inte alls. o FCB gemensam eller separat: 1. Om båda kanalerna år TONANDE används en gemensam FCB. 2. Om båda kanalerna är TONANDE och åtminstone en av de föregående ramarna från varje kanal var ICKE-TONANDE används en gemensam F CB plus två separata FCB av mellanstorlek (detta är ett antaget start- tillstånd). 3. Om en av kanalerna är ICKE-TONANDE används separata FCB. 4. Storleken på de separata FCB styrs genom användning av ljudklassen för den kanalen.
Notera: Om en av kanalerna klassificeras till bakgrundsklassen tillåts den andra kanalens FCB att använda de flesta tillgängliga bitarna, (dvs. FCB- kobok av stor storlek när en kanal är ledig). 10 20 25 30 519 981 20 I steget S30 (rnultital) används den följande strategin. Allmänt: Separata ka- naler antas, några eller inga gemensamma bitar. o LPC kodas separat. o ACB kodas separat. o FCB kodas separat, ingen gemensam FCB. Storleken på FCB för varje ka- nal beslutas genom användning av ljudklassen även ett tillvägagångssätt med en sluten loop med ett minimalt viktat SNR-mål används i tonande ramar för bestämning av slutstorleken hos FCB för tonande ramar.
En teknik som är känd som generaliserad LPAS (se [5]) kan även användas i en LPAS-kodare för flera kanaler enligt den föreliggande uppfinningen. Kort- fattat innefattar denna teknik förprocessning av insignalen ram för ram innan verklig kodning. Fler möjliga modifierade signaler undersöks och den som kan kodas med den minsta distorsionen väljs som signalen som ska kodas.
Beskrivningen ovan har huvudsakligen riktats mot en kodare. Den motsva- rande avkodaren skulle endast innefatta syntesdelen av en sådan kodare.
Typiskt används en kombination av kodare / avkodare i en terminal som sän- der/ mottager kodade signaler över en kommunikationskanal med begränsad bandbredd. Terminalen kan vara en radiokanal i en cellulär telefon eller bas- station. En sådan terminal skulle även innefatta olika andra element såsom en antenn, förstärkare, utjämnare, kanalkodare/-avkodare, etc. Dessa ele- ment är emellertid inte nödvändiga för beskrivning av den föreliggande upp- finningen och har därför utelämnats.
Det kommer att inses av fackmannen att olika modifikationer och ändringar kan göras av den föreliggande uppfinningen utan att avvika från dess omfatt- ning, som definieras av de bifogade patentkraven. lO 15 [1] [2] [3] [4] [5] 519 981 21 REFERENSER A. Gersho, "Advances in Speech and Audio Compression", Proc. of the IEEE, V01. 82, Nr. 6, sidorna 900-918, Juni 1994, A. S. Spanias, "Speech Coding: A Tutorial Review", Proc. of the IEEE, V01 82, Nr. 10, sidorna 1541-1582, Okt. 1994.
WO OO/ 19413 (Telefonaktiebolaget LM Ericsson).
Allen Gersho et.a1, “Variable rate speech Coding for Cellular networks”, sidorna 77-84, Speech and audio Coding for Wireless and network ap- plications, Kluwer Academic Press, 1993.
Bastiaan Kleijn et.al, “Generalized analysis-by-synthesis Coding and its application to pitch prediction”, sidorna 337-340, In Proc. IEEE Int.
Conf. Acoust., Speech and Signal Processing, 1992.

Claims (26)

10 15 20 25 30 : ~: Ü: 'É 21 f: f in: ri.. PATENTKRAV
1. Kodningsförfarande för linjär prediktiv analys genom syntes av signaler från flera kanaler, kännetecknat av detektering av korrelation mellan kanaler; val av kodningsmod på basis av den detekterade korrelationen mellan kanaler; och adaptiv fördelning av bitar mellan kanalspecifika fasta kodböcker och en gemensam fast kodbok beroende på korrelation mellan kanaler
2. Förfarande enligt patentkrav 1, kännetecknat av att valbara kodnings- moder har en fast bruttobitrat.
3. Förfarande enligt patentkrav 1, kännetecknat av att valbara kodnings- moder har en variabel bruttobitrat.
4. Förfarande enligt något av de föregående patentkraven, kännetecknat av bestämning av korrelationen mellan kanaler i tidsdomänen.
5. Förfarande enligt något av de föregående patentkraven, kännetecknat av bestämning av korrelationen mellan kanaler i frekvensdomänen.
6. Förfarande enligt något av de föregående patentkraven, känna-tecknat av användning av kanalspecifika LPC-filter för låg korrelation mellan kanaler; samt användning av ett gemensamt LPC-filter för hög korrelation mellan kanaler.
7. Förfarande enligt något av de föregående patentkraven, kännetecknat av användning av kanalspecifika fasta kodböcker för låg korrelation mel- lan kanaler; samt användning av en gemensam fast kodbok för hög korrelation mellan kanaler. 10 15 20 25 30 519 981§,j;=¿f-¿=._¿' 23
8. Förfarande enligt något av de föregående patentkraven, kännetecknat av användning av kanalspecifika adaptiva kodboksfördröjningar för låg korrelation mellan kanaler; samt användning av en gemensam adaptiv kodboksfördröjning för hög kor- relation mellan kanaler.
9. Förfarande enligt något av de föregående patentkraven, kännetecknat av användning av adaptiva kodboksfördröjningar mellan kanaler.
10. Förfarande enligt något av de föregående patentkraven, kännetecknat av viktning av restenergi i enlighet med relativ kanalstyrka för låg korrelation mellan kanaler.
11. ll. Förfarande enligt något av de föregående patentkraven 7-11, känne- tecknat av bestämning av storlek på individuell fast kodbok baserat på ljudklassificering.
12. Förfarande enligt något av de föregående patentkraven, kännetecknat av interkanalparameterprediktion och -kvantisering av multimodstyp.
13. Kodare för linjär prediktiv analys genom syntes av signaler från flera kanaler, kännetecknad av organ (40) för detektering av korrelation mellan kanaler; organ (40) för val av kodningsmod som baseras på den detekterade korrelationen; samt organ (40) för adaptiv fördelning av bitar mellan kanalspecifika fasta kodböcker och en gemensam fast kodbok beroende på korrelation mellan kanaler.
14. Kodare enligt patentkrav 13, kännetecknad av organ för bestämning av korrelation mellan kanaler i tidsdomånen. 10 15 20 25 30 519 981 ZH
15. Kodare enligt patentkrav 13 eller 14, kännetecknad av organ för be- stämning av korrelation mellan kanaler i frekvensdomånen.
16. Kodare enligt något av de föregående patentkraven 13-15, känneteck- nad av kanalspecifika LPC-filter för låg korrelation mellan kanaler; samt ett gemensamt LPC-filter för hög korrelation mellan kanaler.
17. Kodare enligt något av de föregående patentkraven 13-16, känneteck- nad av kanalspeciñka fasta kodböcker för låg korrelation mellan kanaler; samt en gemensam fast kodbok för hög korrelation mellan kanaler.
18. Kodare enligt något av de föregående patentkraven 13-17, känneteck- nad av kanalspecifika adaptiva kodboksfördröjningar för låg korrelation mel- lan kanaler; samt en gemensam adaptiva kodboksfördröjning för hög korrelation mellan kanaler.
19. l9. Kodare enligt något av de föregående patentkraven 13-18, känneteck- nad av adaptiva kodboksfördröjningar mellan kanaler.
20. Kodare enligt något av de föregående patentkraven 13-19, känneteck- nad av organ (42, ei, e2) för viktning av restenergi i enlighet med relativ ka- nalstyrka för låg korrelation mellan kanaler.
21. Kodare enligt något av de föregående patentkraven 17-20, känneteck- nad av organ (40) för bestämning av storlek på individuell fast kodbok base- rat på ljudklassiñcering. 10 15 20 25 519 981 26
22. Kodare enligt något av de föregående patentkraven 13-21, känneteck- nad av organ för interkanalparameterprediktion och -kvantisering av multi- modstyp.
23. Terminal som innefattar en kodare för linjär prediktiv analys genom syntes av signaler från flera kanaler, kännetecknad av organ (40) för detektering av korrelation mellan kanaler; organ (40) för val av kodningsmod som baseras på den detekterade korrelationen; samt organ (40) för adaptiv fördelning av bitar mellan kanalspecifika fasta kodböcker och en gemensam fast kodbok beroende på korrelation mellan kanaler.
24. Terminal enligt patentkrav 23, kännetecknad av organ för bestämning av korrelation mellan kanaler i tidsdomänen.
25. Terminal enligt patentkrav 23 eller 24, kännetecknad av organ för be- stämning av korrelation mellan kanaler i frekvensdomänen.
26. Terminal enligt något av de föregående patentkraven 23-25, känneteck- nad av kanalspecifika fasta kodböcker för låg korrelation mellan kanaler; samt en gemensam fast kodbok för hög korrelation mellan kanaler.
SE0003285A 2000-09-15 2000-09-15 Kodning och avkodning av signaler från flera kanaler SE519981C2 (sv)

Priority Applications (8)

Application Number Priority Date Filing Date Title
SE0003285A SE519981C2 (sv) 2000-09-15 2000-09-15 Kodning och avkodning av signaler från flera kanaler
AT01963659T ATE363710T1 (de) 2000-09-15 2001-09-05 Mehrkanal-signalcodierung und -decodierung
EP01963659A EP1320849B1 (en) 2000-09-15 2001-09-05 Multi-channel signal encoding and decoding
DE60128711T DE60128711T2 (de) 2000-09-15 2001-09-05 Mehrkanal-signalcodierung und -decodierung
JP2002527492A JP4485123B2 (ja) 2000-09-15 2001-09-05 複数チャネル信号の符号化及び復号化
PCT/SE2001/001885 WO2002023528A1 (en) 2000-09-15 2001-09-05 Multi-channel signal encoding and decoding
AU2001284588A AU2001284588A1 (en) 2000-09-15 2001-09-05 Multi-channel signal encoding and decoding
US10/380,423 US7283957B2 (en) 2000-09-15 2001-09-05 Multi-channel signal encoding and decoding

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
SE0003285A SE519981C2 (sv) 2000-09-15 2000-09-15 Kodning och avkodning av signaler från flera kanaler

Publications (3)

Publication Number Publication Date
SE0003285D0 SE0003285D0 (sv) 2000-09-15
SE0003285L SE0003285L (sv) 2002-03-16
SE519981C2 true SE519981C2 (sv) 2003-05-06

Family

ID=20281032

Family Applications (1)

Application Number Title Priority Date Filing Date
SE0003285A SE519981C2 (sv) 2000-09-15 2000-09-15 Kodning och avkodning av signaler från flera kanaler

Country Status (8)

Country Link
US (1) US7283957B2 (sv)
EP (1) EP1320849B1 (sv)
JP (1) JP4485123B2 (sv)
AT (1) ATE363710T1 (sv)
AU (1) AU2001284588A1 (sv)
DE (1) DE60128711T2 (sv)
SE (1) SE519981C2 (sv)
WO (1) WO2002023528A1 (sv)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11551706B2 (en) * 2018-07-12 2023-01-10 Alibaba Group Holding Limited Crosstalk data detection method and electronic device
US11741973B2 (en) 2015-03-09 2023-08-29 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE519976C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
SE519981C2 (sv) 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
US7111102B2 (en) * 2003-10-06 2006-09-19 Cisco Technology, Inc. Port adapter for high-bandwidth bus
FR2867649A1 (fr) * 2003-12-10 2005-09-16 France Telecom Procede de codage multiple optimise
CN101010725A (zh) * 2004-08-26 2007-08-01 松下电器产业株式会社 多信道信号编码装置以及多信道信号解码装置
US20080255832A1 (en) * 2004-09-28 2008-10-16 Matsushita Electric Industrial Co., Ltd. Scalable Encoding Apparatus and Scalable Encoding Method
EP2138999A1 (en) * 2004-12-28 2009-12-30 Panasonic Corporation Audio encoding device and audio encoding method
ATE521143T1 (de) * 2005-02-23 2011-09-15 Ericsson Telefon Ab L M Adaptive bitzuweisung für die mehrkanal- audiokodierung
US9626973B2 (en) 2005-02-23 2017-04-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
US8000967B2 (en) * 2005-03-09 2011-08-16 Telefonaktiebolaget Lm Ericsson (Publ) Low-complexity code excited linear prediction encoding
EP1876586B1 (en) * 2005-04-28 2010-01-06 Panasonic Corporation Audio encoding device and audio encoding method
KR101259203B1 (ko) * 2005-04-28 2013-04-29 파나소닉 주식회사 음성 부호화 장치와 음성 부호화 방법, 무선 통신 이동국 장치 및 무선 통신 기지국 장치
US9058812B2 (en) * 2005-07-27 2015-06-16 Google Technology Holdings LLC Method and system for coding an information signal using pitch delay contour adjustment
EP1771021A1 (en) * 2005-09-29 2007-04-04 Telefonaktiebolaget LM Ericsson (publ) A method and apparatus for allocation of radio resources
KR100667852B1 (ko) * 2006-01-13 2007-01-11 삼성전자주식회사 휴대용 레코더 기기의 잡음 제거 장치 및 그 방법
ATE423433T1 (de) * 2006-04-18 2009-03-15 Harman Becker Automotive Sys System und verfahren zur mehrkanal- echokompensation
RU2426179C2 (ru) * 2006-10-10 2011-08-10 Квэлкомм Инкорпорейтед Способ и устройство для кодирования и декодирования аудиосигналов
KR101398836B1 (ko) * 2007-08-02 2014-05-26 삼성전자주식회사 스피치 코덱들의 고정 코드북들을 공통 모듈로 구현하는방법 및 장치
CN101802907B (zh) * 2007-09-19 2013-11-13 爱立信电话股份有限公司 多信道音频的联合增强
GB2470059A (en) * 2009-05-08 2010-11-10 Nokia Corp Multi-channel audio processing using an inter-channel prediction model to form an inter-channel parameter
US8620660B2 (en) * 2010-10-29 2013-12-31 The United States Of America, As Represented By The Secretary Of The Navy Very low bit rate signal coder and decoder
JP5737077B2 (ja) * 2011-08-30 2015-06-17 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
WO2014046916A1 (en) 2012-09-21 2014-03-27 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
CN106104684A (zh) 2014-01-13 2016-11-09 诺基亚技术有限公司 多通道音频信号分类器
EP3067885A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
MX2021005090A (es) 2015-09-25 2023-01-04 Voiceage Corp Método y sistema para codificar una señal de sonido estéreo utilizando los parámetros de codificación de un canal primario para codificar un canal secundario.
US12125492B2 (en) 2015-09-25 2024-10-22 Voiceage Coproration Method and system for decoding left and right channels of a stereo sound signal
US9978381B2 (en) * 2016-02-12 2018-05-22 Qualcomm Incorporated Encoding of multiple audio signals
US10475457B2 (en) * 2017-07-03 2019-11-12 Qualcomm Incorporated Time-domain inter-channel prediction
JP2023540377A (ja) * 2020-09-09 2023-09-22 ヴォイスエイジ・コーポレーション 音コーデックにおける、非相関ステレオコンテンツの分類、クロストーク検出、およびステレオモード選択のための方法およびデバイス
CN115410584A (zh) * 2021-05-28 2022-11-29 华为技术有限公司 多声道音频信号的编码方法和装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8913758D0 (en) 1989-06-15 1989-08-02 British Telecomm Polyphonic coding
JP3343962B2 (ja) 1992-11-11 2002-11-11 ソニー株式会社 高能率符号化方法及び装置
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US6345246B1 (en) 1997-02-05 2002-02-05 Nippon Telegraph And Telephone Corporation Apparatus and method for efficiently coding plural channels of an acoustic signal at low bit rates
TW384434B (en) 1997-03-31 2000-03-11 Sony Corp Encoding method, device therefor, decoding method, device therefor and recording medium
DE19829284C2 (de) 1998-05-15 2000-03-16 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verarbeiten eines zeitlichen Stereosignals und Verfahren und Vorrichtung zum Decodieren eines unter Verwendung einer Prädiktion über der Frequenz codierten Audiobitstroms
SE519552C2 (sv) * 1998-09-30 2003-03-11 Ericsson Telefon Ab L M Flerkanalig signalkodning och -avkodning
SE519981C2 (sv) 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11741973B2 (en) 2015-03-09 2023-08-29 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
US11881225B2 (en) 2015-03-09 2024-01-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
US11551706B2 (en) * 2018-07-12 2023-01-10 Alibaba Group Holding Limited Crosstalk data detection method and electronic device

Also Published As

Publication number Publication date
DE60128711T2 (de) 2008-02-07
SE0003285D0 (sv) 2000-09-15
DE60128711D1 (de) 2007-07-12
US7283957B2 (en) 2007-10-16
AU2001284588A1 (en) 2002-03-26
WO2002023528A1 (en) 2002-03-21
US20040109471A1 (en) 2004-06-10
SE0003285L (sv) 2002-03-16
JP2004509366A (ja) 2004-03-25
ATE363710T1 (de) 2007-06-15
EP1320849A1 (en) 2003-06-25
JP4485123B2 (ja) 2010-06-16
EP1320849B1 (en) 2007-05-30

Similar Documents

Publication Publication Date Title
SE519981C2 (sv) Kodning och avkodning av signaler från flera kanaler
US7263480B2 (en) Multi-channel signal encoding and decoding
KR100415356B1 (ko) 다중 채널 신호 인코딩 및 디코딩 방법 및 장치
AU2001282801B2 (en) Multi-channel signal encoding and decoding
AU2007305960B2 (en) Pitch lag estimation
JP4390803B2 (ja) 可変ビットレート広帯域通話符号化におけるゲイン量子化方法および装置
EP1755109B1 (en) Scalable encoding and decoding apparatuses and methods
US20070171931A1 (en) Arbitrary average data rates for variable rate coders
AU2001282801A1 (en) Multi-channel signal encoding and decoding
EP1818913B1 (en) Wide-band encoding device, wide-band lsp prediction device, band scalable encoding device, wide-band encoding method
JP2008513823A (ja) 知覚的歪みを最小化する結合オーディオ符号化
EP1793373A1 (en) Audio encoding apparatus, audio decoding apparatus, communication apparatus and audio encoding method
EP1887567B1 (en) Scalable encoding device, and scalable encoding method
US20130346088A1 (en) Audio coding method and apparatus
US8655650B2 (en) Multiple stream decoder
RU2248619C2 (ru) Способ и устройство преобразования речевого сигнала методом линейного предсказания с адаптивным распределением информационных ресурсов