Revija OpenAI predstavlja glasovni motor: Spreminjanje AI-generiranega zvoka

OdprtAI, ustvarjalec priljubljenega chatbota ChatGPT, je predstavil svoje najnovejše prebojno orodje umetne inteligence imenovano Glasovni Motor. Ta vrhunsko tehnološki dosežek ima sposobnost posnemanja pravih človeških glasov, kar predstavlja revolucionarno spremembo na področju generativne AI.

Glasovni Motor je bil razkrit v petek, ob tem pa so bile predstavljene vzorce zgodnjih testov, ki dokazujejo njegove impresivne zmogljivosti. S 15-sekundnim vzorcem nekoga, ki govori, to orodje lahko ustvari neverjetno prepričljivo repliko njihovega glasu. Uporabniki lahko nato vnesete odstavek besedila, in Glasovni Motor ga bo prebral v AI-generiranem glasu, pri čemer oživi besedilo.

Čeprav so že na voljo AI-generirane glasovne storitve za javnost, je OpenAI še enkrat dokazal svoje znanje pri široki uporabi orodij za AI. Glasovni Motor ima ogromen potencial kot orodje AI za besedilo v govor, ki ponuja pomoč pri prevajanju, pomoč pri branju otrokom in nudenje podpore osebam, ki so izgubile sposobnost govora.

Vendar izrazijo nekateri skeptiki pomisleke glede morebitnih negativnih posledic te tehnologije. Strah je, da bi lahko to tehnologijo potencialno uporabili za spodbujanje dezinformacij ali omogočanje lažnih predstav. OpenAI priznava te tveganja in poudarja potrebo po odgovorni uporabi sintetične glasovne tehnologije.

Za reševanje teh pomislekov OpenAI trenutno omejuje uporabo Glasovnega Motorja na izbrano skupino zaupanja vrednih partnerjev, med katere spadajo podjetja s področja šolstva in zdravstva. Ti partnerji se morajo držati smernic, ki prepovedujejo ponovno ustvarjanje glasov ljudi brez izrecnega soglasja in zahtevajo jasno identifikacijo vsebine AI-ja. OpenAI uporablja te teste, da določi, kako nadaljevati z širšo dostopnostjo.

OpenAI priznava pomembnost uveljavljanja pomembnih sprememb, saj postaja AI-generirani zvok bolj dostopen. Čeprav Glasovni Motor še ni na voljo javnosti, OpenAI namerava postopoma opustiti avtentikacijo na podlagi glasu za bančne račune in predlaga vključitev izkušenj z avtentikacijo glasu, ki preverjajo privolitev prvotnega govorca pred širšim razporeditvom sintetične glasovne tehnologije. Poleg tega OpenAI predlaga vzpostavitev seznama “glasov, ki niso dovoljeni”, da prepreči ustvarjanje glasov, ki preveč podobajo znanim osebam.

Ena izmed opaznih značilnosti Glasovnega Motorja je njegova večjezičnost. Z uporabo vzorca glasu v enem jeziku to orodje lahko ustvari repliko glasu, ki je sposobna govoriti v več drugih jezikih. OpenAI je to funkcionalnost demonstriral v svoji objavi na blogu, kjer so bili prikazani primeri AI-generiranega zvočnega posnetka, ki ohranja ton in naglas izvirnega govorca med branjem istega odstavka v španščini, mandarinščini, nemščini, francoščini in japonščini.

Medtem ko uporabniki nestrpno čakajo na javni izid Sora, OpenAI-jevega orodja za AI-generirani video, predstavitev Glasovnega Motorja prikazuje ogromen potencial AI tehnologije. OpenAI še naprej vodi pot pri razvoju inovativnih AI orodij, ki imajo široke posledice v različnih industrijah.

Pogosta vprašanja (FAQ)

1. Kaj je Glasovni Motor?
Glasovni Motor je vrhunsko orodje AI, razvito s strani OpenAI, ki lahko generira zvok, ki posnema prave človeške glasove. Uporablja vzorec nekoga, ki govori, da ustvari prepričljivo repliko njihovega glasu.

2. Kako se lahko uporablja Glasovni Motor?
Glasovni Motor ima širok spekter potencialnih aplikacij. Lahko pomaga pri prevajanju, nudi pomoč pri branju otrokom in pomaga osebam, ki so izgubile sposobnost govora.

3. Kakšne skrbi obstajajo v zvezi z Glasovnim Motorjem?
Čeprav Glasovni Motor ponuja številne koristi, obstajajo skrbi v zvezi z možnostjo ustvarjanja dezinformacij in prevar, olajšanih s to tehnologijo.

4. Kako OpenAI naslavlja te skrbi?
OpenAI omejuje uporabo Glasovnega Motorja na zaupanja vredne partnerje in uveljavlja stroge smernice za zagotovitev odgovorne implementacije. Načrtujejo tudi postopno odpravo avtentikacije na podlagi glasu za bančne račune in predlagajo izkušnjo avtentikacije glasu za preverjanje soglasja.

5. Ali lahko Glasovni Motor generira glasove v različnih jezikih?
Da, Glasovni Motor lahko uporabi vzorec glasu v enem jeziku za ustvarjanje replike glasu, ki je sposoben govoriti v več drugih jezikih.

Viri: [OpenAI Blog](https://www.openai.com)

The source of the article is from the blog elblog.pl

Privacy policy
Contact