Zlepšenie kvality zvuku využitím mocnosti ľudskej vnímania

V zaujímavom prielomovom objave výskumníci odhalili nový model hlbokého učenia, ktorý má potenciál výrazne zlepšiť kvalitu zvuku vo skutočných situáciách. Model, využívajúci mocnosť ľudskej vnímania, prekonáva tradičné prístupy tým, že zahŕňa subjektívne hodnotenia kvality zvuku.

Tradičné metódy redukcie hluku sa spoliehali na algoritmy umelého inteligence na extrakciu hluku zo žiaducich signálov. Avšak tieto objektívne techniky sa nie vždy zhodujú s posudkami poslucháčov o tom, čo robí reč ľahko pochopiteľnou. To je miesto, kde prichádza nový model. Použitím vnímania ako nástroja tréningu môže model efektívne odstraňovať nechcené zvuky a zlepšovať kvalitu reči.

Štúdia, zverejnená v časopise IEEE Xplore, sa zameriava na zlepšenie monaurálneho zvýraznenia reči – reči, ktorá pochádza z jedného zvukového kanálu. Výskumníci trénovali model na dvoch datasetoch, ktoré zahŕňali nahrávky ľudí rozprávajúcich, z ktorých niektoré boli zakryté hlukmi pozadia. Poslucháči potom ohodnotili kvalitu reči každej nahrávky na stupnici od 1 do 100.

To, čo odlišuje túto štúdiu od ostatných, je jej závislosť na subjektívnej povaha kvality zvuku. Tým, že zahrňuje ľudské posudky zvuku, model využíva ďalšie informácie na lepšie odstránenie hluku. Výskumníci použili metódu spoločného učenia, ktorá kombinuje špecializovaný jazykový modul na zlepšenie reči s predikčným modelom, ktorý dokáže odhadnúť priemerne hodnotenie poslucháčov pre signál s hlukom.

Výsledky boli pozoruhodné. Nový prístup konzistentne prekonal ostatné modely, ako bolo merané pomocou objektívnych metrík ako vnímateľná kvalita, zrozumiteľnosť a posudky ľudí. Tento prielomový objav má významné dôsledky pre zlepšenie sluchadiel, programov na rozpoznávanie reči, aplikácií na overenie rečníka a bezdrôtových komunikačných systémov.

Avšak existujú výzvy, pokiaľ ide o využitie ľudskej vnímania kvality zvuku. Hodnotenie hluku v audio súvisí s veľkou subjektivitou a závisí na schopnostiach a skúsenostiach jednotlivcov. Faktory ako sluchadlá alebo cochleárne implantáty môžu tiež ovplyvniť vnímanie zvuku v prostredí človeka. Napriek týmto výzvam sa výskumníci zaväzujú doladiť svoj model pomocou subjektívnych hodnotení, aby mohli ovládať ešte komplexnejšie zvukové systémy a spĺňať očakávania ľudských používateľov.

V budúcnosti si výskumníci predstavujú budúcnosť, kde sa technológie budú v reálnom čase vylepšovať zvukové skúsenosti podobne ako zariadenia na rozšírenú realitu pre obrazy. Pokračovaním zapojenia ľudskej vnímania do procesu strojového učenia umelou inteligenciou sa oblasť môže ešte ďalej posúvať a otvoriť cestu revolučným inováciám v zlepšovaní zvuku.

The source of the article is from the blog smartphonemagazine.nl