Ievads OpenAI balss ģenerēšana: radīt sintētiskās balss ar mākslīgo intelektu

OpenAI ir veikusi iespaidīgus progresus mākslīgā intelekta jomā ar dažādiem projektiem, ieskaitot ChatGPT un Sora AI. Jaunākais papildinājums tā darbībā ir balss ģenerēšana, rīks, kas spēj radīt sintētiskas balsis no tikai 15 sekunžu garas audio paraugieraksta.

Kopš 2022. gada beigām OpenAI nepārtraukti attīsta Balss dzinēju un ir veikusi ierobežotu priekšskatījumu. Šī funkcija jau tiek izmantota ChatGPT lietojumprogrammas Funkcija Lasīt skaļi, kura lasa atbildes lietotājiem. Balss trenējot ar īsu paraugu, lietotāji to var izmantot, lai izlasītu jebkuru tekstu, ko vēlas, izmantojot emociju bagātu un reālistisku intonāciju.

Balss ģenerēšanas potenciālās lietojuma jomas ir plašas un daudzveidīgas. OpenAI norāda, ka tā var tikt izmantota izglītības nolūkos, pārtulkot podcastus uz dažādām valodām, savienoties ar attālinātiem kopienām un atbalstīt personus, kuri nespej runāt. Tomēr Balss dzinējs vēl nav plaši pieejams vispārējam lietojumam.

OpenAI ir dalījusies paraugos ar sintētiskajām balsīm, kas radītas ar Balss dzinēju, un klausītājus ir iepriecinājuši to kvalitāte. Taču skaņai ir nedaudz robotiska un kustīga kvalitāte, norādot, ka nepieciešami turpmāki uzlabojumi.

Galvenā baža saistībā ar Balss dzinēja izplatīšanu ir ļaunprātīgas izmantošanas risks. OpenAI aktīvi pēta veidus, kā novērst dezinformācijas izplatīšanu un autorizētas sintezēto balsu lietošanas veidus. Uzņēmums cenšas uzsākt dialogu par atbildīgu šīs tehnoloģijas izmantošanu un izpētīt, kā sabiedrība var pielāgoties šai jaunajai iespējai. Balstoties uz iegūto informāciju no mazām mērogā veiktajām testēm un šo sarunu rezultātiem, OpenAI pieņems informētu lēmumu par to, vai un kā izplatīt Balss ģenerēšanu plašumā.

Sintētisko balsu nepareizs izmantojums var radīt nozīmīgas sekas, it īpaši attiecībā uz balss autentifikāciju un potenciālajiem nelikumīgiem uzkrājumiem. Rodas reālas bažas par balsu autentiskuma noteikšanas sarežģītību audio mijiedarbībās. Ar galvenajām vēlāk šogad notiekošajām lielajām vēlēšanām ASV un Lielbritānijā, uzticības jautājums visu veidu AI saturā, ieskaitot audio, tekstu un video, kļūst būtisks.

Šo izaicinājumu risināšana kļūst arvien būtiskāka, jo ģeneratīvās AI rīku turpina attīstīties. OpenAI atzīst šo jautājumu sarežģītību un nepieciešamību atrast veidus, kā ar tiem tikt galā. Ērā, kur balstu uzticamībai ir uz spēles, pielāgošanās un inovācijas ir nepieciešamas.

Bieži uzdotie jautājumiThe source of the article is from the blog macholevante.comWeb Story

Bieži uzdotie jautājumi
The source of the article is from the blog macholevante.com
Web Story