Žinojimo balsas: kurti sintetinius balsus su dirbtiniais intelekto įrankiais

OpenAI savo įvairiais projektų, įskaitant ChatGPT ir Sora AI, laukė įspūdingų pažangų dirbtinio intelekto srityje. Naujausia priemonė jų arsenale yra Balso Kūrimas, įrankis, galintis kurti sintetinius balsus iš vos 15 sekundžių garso įrašo.

Nuolat plėtojamas nuo 2022 metų pabaigos, OpenAI vykdo mažo masto „Balso Variklio” peržiūrą. Ši funkcija jau panaudojama ChatGPT programėlės „Skaitau” funkcijoje, kuri vartotojams skaito atsakymus. Treniruojant balsą su trumpu pavyzdžiu, vartotojai gali jį panaudoti skaitant norimą bet kokį tekstą su emocingu ir realistišku tonu.

Žinojimo Balso potencialios taikymo sritis yra plati ir įvairi. OpenAI teigia, kad ją galima naudoti švietimo tikslais, verčiant podcastus į skirtingas kalbas, jungiantis su nutolusiomis bendruomenėmis ir palaikantis nebesakomais asmenis. Tačiau „Balso Variklis” dar nėra plačiai prieinamas naudojimui visuomenei.

OpenAI pasidalino sintetinių balsų, sukurtų „Balso Varikliu”, pavyzdžiais, kurie sužavėjo klausytojus savo kokybe. Tačiau garso turi šiek tiek robotišką ir stilizuotą kokybę, nurodydami, kad reikalingi tolesni patobulinimai.

Pagrindinis susirūpinimas, verčiant „Balso Variklį”, yra rizika piktnaudžiauti. OpenAI aktyviai tyrinėja būdus, kaip užkirsti kelią dezinformacijos plitimui ir nepageidaujamam sintetinių balsų naudojimui. Įmonė siekia pradėti dialogą dėl atsakingo šios technologijos naudojimo ir ištirti, kaip visuomenė gali prisitaikyti prie šios naujos galimybės. Remdamiesi mažosios masto bandymų rezultatais ir šiomis diskusijomis, OpenAI priims informuotą sprendimą, ar ir kaip plėtoti Žinojimo Balsą mastu.

Sintetinių balsų piktnaudžiavimas gali turėti reikšmingų padarinių, ypač kalbinių patvirtinimo ir galimų apgavysčių srityje. Kilę autentiškų balsų autentiškumo nustatymo sunkumai garsiniuose pokalbiuose kelia rimtų rūpesčių. Su svarbiais rinkimais, vykstančiais JAV ir Didžiojoje Britanijoje šiais metais, pasitikėjimo visų formų dirbtiniais intelekto turiniu, įskaitant garsą, tekstą ir video, klausimas tampa lemiamu.

Rasti efektyvius sprendimus šiems iššūkiams tampa vis svarbiau, kai generavimo dirbtinio intelekto įrankiai toliau plėtojasi. OpenAI pripažįsta šių problemų sudėtingumą ir būtinybę rasti būdus joms spręsti. Esant laikotarpiui, kai balsų patikimumas yra pavojuje, prisitaikymas ir inovacijos yra būtini.

DUKThe source of the article is from the blog trebujena.net

DUK
The source of the article is from the blog trebujena.net