Akustisk Lokalisering af Akkumuleret Korrelation

Link: http://www.ces.clemson.edu/~stb/research/acousticloc/

To traditionelle teknikker til akustisk lokalisering er beamforming og tidsforsinkelse skøn. Historisk har man skulle vælge mellem variationer af disse to teknikker, og dermed gøre en afvejning mellem nøjagtigheden af ​​beamforming tilgange eller hastigheden af ​​tidsforsinkelse estimering algoritmer. I vores forskning har vi opdaget, at denne afvejning ikke er grundlæggende for selve problemet, men kun til den måde, vi har set på det. I virkeligheden behøver man ikke at ofre nøjagtighed for hastighed, i det mindste i situationer, hvor afstanden mellem mikrofonerne ikke er for stor, som når mikrofonerne er op til et par meter fra hinanden i en indendørs rum.

Vi har udviklet en teknik kaldet akkumuleret korrelation, der kombinerer hastigheden af ​​tidsforsinkelse estimering med nøjagtigheden af ​​stråleformning. Som det ses i nedenstående diagram, ideen er meget enkel. Signaler fra par af mikrofoner er krydskorreleret, og hele krydskorrelationsvektoren er knyttet til et fælles koordinatsystem at måle sandsynligheden for, at lydkilden er i enhver af en række af kandidat steder. Den forfiltrering og tidsmæssige udjævning er valgfrie trin, der kan føjes til enhver algoritme.

Princippet i hjertet af de fleste akustiske lokalisering algoritmer, herunder akkumuleret korrelation, er, at den lyd, der udsendes af en lydkilde generelt vil tage et andet beløb af tid til at nå hver mikrofon i opstillingen. Ved at måle tiden for ankomst (eller ækvivalent, tidsforsinkelse) af signalet for hver mikrofon, kan placeringen af lydkilden bestemmes. Overvej tilfældet, når blot et par mikrofoner er tilgængelige, som vist i figuren nedenfor. Lydkilden vil nå én mikrofon på tidspunktet t1, og den anden på tidspunktet t2. Den relative tidsforsinkelse t = t1 – t2 kan estimeres ved at vælge toppen af krydskorrelationsvektoren mellem de to mikrofonsignaler. Hvis t vurderes korrekt, så lydkilden skal ligge på et punkt i rummet, således at t1 – t2 = t, som definerer den ene halvdel af en hyperboloid.

 

Krydskorrelation, selvfølgelig, er ikke en perfekt teknik, og der er ingen garanti for, at toppen af ​​krydskorrelationen vecotr vil være den korrekte tidsforsinkelse skøn. Med rigtige signaler, vil krydskorrelationsvektoren den normalt indeholde flere toppe, og den sande tidsforsinkelse ofte ikke giver den højeste top. Akkumuleret korrelation håndterer problemet med støj ved at fastholde hele krydskorrelationsvektoren af ​​hvert mikrofonpar, snarere end at vælge top. Som vist nedenfor hvert element i krydskorrelationsvektoren den svarer til en anden halv-hyperboloid i rummet, og værdien af ​​dette element indikerer sandsynligheden for, at lydkilden er placeret på den halve hyperboloide. For en given kandidat placering, sandsynligheden — kun baseret på oplysninger fra en enkelt par mikrofoner — er givet ved at interpolere værdierne af de nærliggende halve hyperboloids. Værdier fra flere mikrofonpar summeres til opnåelse af samlede sandsynlighed for det pågældende sted. Efter at der er taget alle de oplysninger i betragtning, så er det sted med den højeste sandsynlighed er valgt som estimat for lydkilden placering. Som før, forbehandling og / eller tidsmæssig udjævning kan anvendes i tillæg til den grundlæggende algoritme netop beskrevne.

 

 

Undersøgelse af ligninger for de forskellige teknikker afslører en tæt forbindelse mellem dem. Akkumuleret korrelation er en approksimation til stråledannende ved at antage, at det tidspunkt, hvor mikrofonerne modtager lyden er en konstant forskydning fra tiden, hvor lyden er blevet udsendt, der er ca. tilfældet i indeholdt miljøer såsom en indendørs rum. Samtidig, akkumuleret sammenhæng er en generalisering af tidsforsinkelse estimering formulering, fordi de begge deler en væsentlig beregning, nemlig på tværs af korrelere hvert par mikrofonsignaler; forskellen er, at akkumuleret korrelation bevarer hele krydskorrelationsvektoren snarere end blot toppen. Som et resultat, akkumuleret korrelation tager alle tilgængelige oplysninger i betragtning, før den træffer en beslutning, der sikrer robusthed. Denne forsinkelse af beslutningsprocessen er essensen af ​​princippet om mindst engagement, en velkendt filosofi for algoritme udvikling. Akkumuleret korrelation er også kendt som en direkte metode, fordi den direkte beregner resultatet uden mellemliggende beslutninger, der har potentiale til at miste information.

Ligheden mellem de algoritmer fører naturligt til en samlende ramme, som vist i tabellen nedenfor. Listed er algoritmer af stråleformning, akkumuleret korrelation og lineær kryds (en populær tidsforsinkelse estimering teknik), sammen med flere andre varianter. Alle de teknikker kan udtrykkes som beregning af sandsynligheden for en placering q ved anvendelse af ligningen vist. Der er tre forskelle mellem de algoritmer: (1) hvordan de kombinerer oplysninger fra flere mikrofonpar, udtrykt ved funktionen G; (2) de Integrationsgrænser anvendes til sammenligning af signaler i et enkelt par, fanget af funktionen T; og (3) hvordan de vægter den energi sigt givet af den værdi, en. Af tabellen er det klart, at beamforming er nøjagtig, tidsforsinkelse estimering er effektiv, og akkumuleret korrelation er både præcis og effektiv.

 

Akkumuleret korrelation er enkel at implementere, er størrelsesordener hurtigere end beamforming, og har vist sig at frembringe resultater med i det væsentlige samme nøjagtighed som for beamforming. Nedenfor er vist sandsynligheden beregnes funktionen på en ramme lyd med akkumuleret korrelation og med stråleformning, hvilket illustrerer, at forskellen mellem resultaterne er ofte uskelnelige. Mere omfattende forsøg, sammen med en mere detaljeret forklaring kan findes i de publikationer om dette emne.

 

Comments are closed.