Nove Perspektive na Voice Generation od OpenAI

OpenAI je predstavio generiranje glasa: Stvaranje sintetičkih glasova pomoću umjetne inteligencije. Postigli su značajan napredak u području umjetne inteligencije s različitim projektima, uključujući ChatGPT i Sora AI. Najnoviji dodatak njihovom repertoaru je Voice Generation, alat sposoban stvarati sintetičke glasove samo na temelju 15 sekundi audio uzorka.

Kroz kontinuirani razvoj od kraja 2022., OpenAI je pokrenuo manji pregled Voice Enginea. Ova značajka već se koristi u funkciji Glasno čitanje aplikacije ChatGPT, koja korisnicima čita odgovore. Obukom glasa pomoću kratkog uzorka, korisnici ga mogu koristiti za čitanje bilo kojeg teksta koji žele, s emotivnim i realističnim tonom.

Potencijalne primjene Voice Generationa su raznolike i opsežne. OpenAI sugerira da bi se mogao koristiti u edukacijske svrhe, prevođenje podcasta na različite jezike, povezivanje s udaljenim zajednicama te podršku osobama koje nisu verbalne. Međutim, Voice Engine još nije široko dostupan za upotrebu opće javnosti.

OpenAI je podijelio uzorke sintetičkih glasova stvorenih pomoću Voice Enginea, koji su impresionirali slušatelje svojom kvalitetom. Ipak, postoji blago robotski i ukrućen kvalitet zvuka, što ukazuje na potrebu za daljnjim poboljšanjima.

Glavna zabrinutost u vezi s implementacijom Voice Enginea je rizik od zloupotrebe. OpenAI aktivno istražuje načine kako spriječiti širenje dezinformacija i neovlašteno korištenje sintetičkih glasova. Tvrtka ima cilj pokrenuti dijalog o odgovornoj upotrebi ove tehnologije i istražiti kako društvo može prilagoditi se ovoj novoj mogućnosti. Na temelju rezultata manjih testova i ovih razgovora, OpenAI će donijeti informiranu odluku o tome hoće li i na koji način implementirati generiranje glasa na velikoj skali.

Zloupotreba sintetičkih glasova može imati značajne posljedice, posebno u vezi s autentikacijom glasa i potencijalnim prijevarama. Postoje opravdane zabrinutosti u vezi s poteškoćama u određivanju autentičnosti glasova u zvučnim interakcijama. S obzirom da su glavni izbori zakazani u SAD-u i Velikoj Britaniji ove godine, pitanje povjerenja u sve oblike AI sadržaja, uključujući zvuk, tekst i video, postaje ključno.

Pronalaženje učinkovitih rješenja za ove izazove postaje sve važnije kako napreduju generativni AI alati. OpenAI priznaje složenost ovih problema i potrebu za pronalaskom načina kako ih riješiti. U eri kada je povjerenje glasova u pitanju, prilagodba i inovacija su imperativ.

Često postavljana pitanja (FAQ)The source of the article is from the blog lisboatv.pt

Često postavljana pitanja (FAQ)
The source of the article is from the blog lisboatv.pt