Revolucionarne slušalke, ki jih poganja umetna inteligenca, lahko izolirajo posamezne glasove v hrupnih okoljih

Raziskovalci z Univerze Washington so dosegli pomemben napredek v tehnologiji zvoka z izdelavo slušalk, ki uporabljajo umetno inteligenco za izoliranje posameznikovega glasu iz kaosa zvokov. Novost tega sistema je v njegovi sposobnosti filtriranja glasu določenega govornika iz hrupnega ozadja, kar močno izboljša poslušalčovo izkušnjo v živahnih okoljih.

Inovativni proces vključuje:

Identifikacija: Uporabniki, ki nosijo standardne slušalke opremljene z mikrofoni, lahko preprosto pogledajo osebo, s katero želijo komunicirati, ter pritisnejo gumb za zagon postopka.

Učenje: Mikrofoni zajamejo zvočne valove glasu, medtem ko AI sistem uči razlikovati in prepoznati to edinstveno glasovno podpisovanje.

Izolacija: Nato so vse druge okoliške šume zavite, poslušalcu pa ostane le izbrani glas, ne glede na gibanje ali spremembo pogleda.

Čeprav je tehnologija s poimenovanjem “Target Speech Hearing” (TSH) še v razvoju, je pokazala obetavne rezultate. Med testiranjem s 21 udeleženci so le-ti poročali o skoraj dvakrat večji jasnosti glasu z izoliranim zvokom v primerjavi s filtriranim zvokom.

Trenutno TSH lahko usmeri pozornost zgolj na enega govorca in deluje optimalno, kadar ni glasnih šumov iz iste smeri. Vendar pa raziskovalna ekipa aktivno izboljšuje sposobnosti te tehnologije, da podpira ne le slušalke temveč tudi ušesne čepke in slušne pripomočke.

Potencialne uporabe tega preboja so obsežne, segajo od izvajanja pogovorov na hrupnih mestih do obiskovanja predavanj ali konferenc. Prihodnost obljublja še bolj jasne in osebno prilagojene slušne izkušnje. S stalnim napredkom ta AI temelječi sistem kmalu lahko spreminja, kako se povezujemo z zvokom v našem vsakdanjem življenju.

Ključna vprašanja in odgovori:

V: Kako AI prispeva k izolaciji posameznih glasov z uporabo slušalk?
– O: AI pomaga tako, da se uči prepoznati edinstveno glasovno podpisovanje osebe na podlagi zvočnih valov, ki jih zajamejo mikrofoni v slušalkah opremljenih s mikrofoni. Nato izolira ta identificiran glas od ozadnega hrupa.

V: Kakšne so nekatere potencialne uporabe te tehnologije?
– O: Uporabe vključujejo izboljšanje komunikacije v hrupnih okoljih, pomoč posameznikom z okvarami sluha, izboljšanje jasnosti predavanj in konferenc ter ponujanje osebno prilagojene slušne izkušnje na različnih lokacijah, kot so javni prevoz in gneče.

V: Ali obstajajo kakršne koli omejitve trenutne tehnologije TSH?
– O: Trenutne omejitve vključujejo sposobnost izolacije le enega govorca naenkrat in zmanjšano učinkovitost v okoljih, kjer prihajajo glasni hrupi iz iste smeri kot govornik.

Ključni izzivi ali kontroverze:

Več govorcev: Ločevanje več prekrivajočih se glasov je še vedno velik izziv za AI podprto izolacijo zvoka. Prihodnji napredki bodo morali rešiti, kako tehnologija obravnava scenarije z več govorci.

Skrbi za zasebnost: Ker se mikrofoni in sistemi AI trenirajo za prepoznavanje in obdelavo glasov, lahko nastanejo zasebnostne posledice, ki jih je treba nasloviti, zlasti v zvezi z beleženjem in obdelavo podatkov.

Natančnost v raznolikih okoljih: Zagotavljanje zanesljivega delovanja tehnologije v različnih akustično raznolikih okoljih ostaja izziv.

Prednosti:

Pomoč pri komunikaciji: Ta tehnologija je še posebej koristna za posameznike s slabo sluhov ali okvarami sluha, saj ponuja možnost boljšega razumevanja pogovorov na gnečnih mestih.

Izboljšanje fokusa: Sposobnost izolacije glasu lahko pomaga vsakomur, ki poskuša osredotočiti na določen pogovor ali zvočni vir, ne da bi ga motili okoljski zvoki.

Mednapravna združljivost: Prihodnji načrti vključevanja te tehnologije v različne avdio naprave, vključno s slušnimi pripomočki, širijo njen potencialni obseg uporabe.

Slabosti:

Zapletenost in stroški: Razvoj takšne napredne tehnologije lahko poveča zapletenost in stroške potrošniških slušalk in podobnih avdio naprav.

Odvisnost od vizualnih znakov: Potreba po tem, da uporabniki pogledajo osebo, ki jo želijo poslušati, lahko omeji uporabnost slušalk v situacijah, kjer očesni stik ni mogoč ali družbeno primeren.

Omejena funkcionalnost v določenih okoljih: Tehnologija še ni v celoti učinkovita v vseh hrupnih okoljih, še posebej tam, kjer več ljudi govori iz iste smeri.

Za dodatne informacije o tej temi obiščite:
Univerza Washington

Prosimo, upoštevajte, da povezave vodijo na glavno domeno, saj niso vključeni specifični podrejeni URL-ji, v skladu z navedenimi omejitvami.

[vdelano]https://www.youtube.com/embed/MCW5HUkrr-o[/vdelano]

Privacy policy
Contact