Heli kvaliteedi parandamine inimtaju võimekust kasutades

Põneva läbimurde käigus on teadlased tutvustanud uut sügava õppimise mudelit, mis suudab potentsiaalselt oluliselt parandada heli kvaliteeti reaalmaailma olukordades. Inimtaju võimekust ära kasutades ületab see mudel traditsioonilisi lähenemisviise, lisades subjektiivseid hinnanguid helikvaliteedile.

Traditsioonilised taustamüra vähendamise meetodid on toetunud tehisintellekti algoritmidele, et eraldada soovitud signaalidest müra. Siiski ei lange need objektiivsed tehnikad alati kokku kuulajate hindamustega selle kohta, mis muudab kõne arusaadavaks. Selleks tulebki appi uus mudel. Taju kasutamise koolitusvahendina võib mudel efektiivselt eemaldada soovimatud helid ja parandada kõne kvaliteeti.

Uurimus, mis avaldati ajakirjas IEEE Xplore, keskendus monauraalse kõne parendamisele – see tähendab kõnele, mis tuleb ühest audio kanalist. Teadlased koolitasid mudelit kahe koondandmestiku abil, mis sisaldasid inimeste kõne salvestusi, millest osad olid varjatud taustamüraga. Kuulajad hindasid iga salvestuse kõnekvaliteeti skaalal 1 kuni 100.

See uurimus eristub teistest oma helikvaliteedi subjektiivse olemuse osas. Inimeste hinnangute integreerimisega kasutab mudel lisainformatsiooni, et paremini müra eemaldada. Teadlased kasutasid ühise õppimise meetodit, mis ühendab spetsialiseeritud kõne parendava keele mooduli ennustusmudeliga, mis suudab hinnata, milline oleks kuulajate antud keskmine arvamusmärk mürasele signaalile.

Tulemused olid märkimisväärsed. Uus lähenemine ületas järjekindlalt teisi mudeleid objektiivsete mõõdikute, näiteks tajutava kvaliteedi, arusaadavuse ja inimeste hinnangute järgi. See läbimurre omab olulisi tagajärgi kuuldeaparaatide, kõnesünteesiprogrammide, kõne kinnitamise rakenduste ja käed-vabad suhtluste süsteemide parandamiseks.

Siiski on helikvaliteedi subjektiivse taju kasutamisel omad väljakutsed. Müra hindamine on väga subjektiivne ja sõltub inimeste kuulmisvõimest ning kogemustest. Kuuldeaparaatide või sisekõrva implantaatidega seotud tegurid võivad samuti mõjutada inimeste taju nende helikeskkonnast. Hoolimata nendest väljakutsetest on teadlased otsustanud täiustada oma mudelit, integreerides inimlikke subjektiivseid hinnanguid, et käsitleda veelgi keerulisemaid audio süsteeme ja vastata inimeste ootustele.

Tulevikus näevad teadlased ette sarnast tulevikuvisiooni, kus, sarnaselt täiendatud reaalsuse seadmetele piltide puhul, täiustatakse tehnoloogiaid reaalajas heli parendamiseks, parandades üldist kuulamiskogemust. Tänu inimtaju kaasamisele masinõppe tehisintellekti protsessi saab valdkond jõuda veelgi kaugemale ja sillutada teed läbimurdelistele uuendustele heli parendamises.

The source of the article is from the blog qhubo.com.ni

Privacy policy
Contact