Synteettisten äänien luominen OpenAI:n äänigeneraattorilla

OpenAI on tehnyt vaikuttavia edistysaskelia tekoälyn alalla erilaisten projektien, kuten ChatGPT:n ja Sora AI:n, kautta. Viimeisin lisäys sen repertuaariin on Voice Generation eli äänigeneraattori, työkalu, joka pystyy luomaan synteettisiä ääniä pelkästä 15 sekunnin ääninäytteestä.

Jatkuvan kehityksen tuloksena vuodesta 2022 lähtien OpenAI on testannut Voice Engine -ominaisuutta pienimuotoisena esikatseluna. Tätä ominaisuutta käytetään jo ChatGPT-sovelluksen Read Aloud -toiminnossa, joka lukee käyttäjille vastauksia ääneen. Käyttäjät voivat kouluttaa äänen lyhyellä näytteellä ja sen jälkeen saada sen lukemaan haluamaansa tekstiä tunteikkaalla ja realistisella sävyllä.

Äänigeneraattorilla on laaja ja monipuolinen valikoima mahdollisia sovelluksia. OpenAI viittaa siihen, että sitä voitaisiin hyödyntää koulutustarkoituksiin, podcastien kääntämiseen eri kielille, yhteyden luomiseen etäyhteisöihin ja henkilöiden tukemiseen, jotka eivät voi puhua. Kuitenkin Voice Engine ei vielä ole laajalti saatavilla yleisön käyttöön.

OpenAI on jakanut näytteitä Voice Enginen luomista synteettisistä äänistä, jotka ovat vakuuttaneet kuulijat laadullaan. Kuitenkin äänessä on havaittavissa hieman robottimainen ja kankea laatu, mikä viittaa siihen, että lisäparannuksia tarvitaan.

Pääasiallinen huoli Voice Enginen käyttöönoton yhteydessä on väärinkäytön riski. OpenAI tutkii aktiivisesti keinoja estää väärän tiedon leviämistä ja synteettisten äänien luvatonta käyttöä. Yhtiön tavoitteena on käynnistää keskustelu tämän teknologian vastuullisesta käytöstä ja tutkia, miten yhteiskunta voi sopeutua tähän uuteen mahdollisuuteen. Pienimuotoisten testien tulosten ja näiden keskustelujen perusteella OpenAI tekee tiedostetun päätöksen siitä, milloin ja miten Voice Generation julkaistaan laajemmin.

Synteettisten äänien väärinkäyttö voi olla merkittävillä seurauksilla erityisesti äänen tunnistuksen ja mahdollisten huijausten näkökulmasta. Aidot huolenaiheet heräävät äänten aitouden määrittämisen vaikeudesta äänivuorovaikutuksissa. Kun Yhdysvalloissa ja Isossa-Britanniassa on määräysvaltava määrä vaaleja tänä vuonna, luottamuksen kysymys kaikkiin tekoälyn muotoihin, mukaan lukien ääni, teksti ja video, muuttuu ratkaisevaksi.

Tehokkaiden ratkaisujen löytäminen näihin haasteisiin on yhä tärkeämpää generatiivisten tekoälytyökalujen jatkaessa kehitystään. OpenAI tunnustaa näiden ongelmien monimutkaisuuden ja tarpeen löytää keinoja niiden käsittelyyn. Aikakaudella, jossa äänten luotettavuus on kyseenalainen, sopeutuminen ja innovaatio ovat välttämättömiä.

UKONSA

The source of the article is from the blog maltemoney.com.br

Web Story

Privacy policy
Contact