Balsų variklis: Naujos galimybės dirbtinio intelekto sukurtam garso turiniui

OpenAI ne tik pristatė galingą ChatGPT chatbot kūrėją, bet ir įvedė naujausią revoliucingą dirbtinio intelekto įrankį, vadinamą Balsų variklis. Ši pažangi technologija geba imituoti tikrus žmogaus balsus, todėl ji tampa esminiu veiksniais generuojančio dirbtinio intelekto srityje.

Balsų variklis buvo pristatytas penktadienį, kartu su pavyzdžiais iš ankstyvųjų bandymų, parodančių jo įspūdingas galimybes. Šis įrankis, naudodamas 15 sekundžių ilgio pavyzdį, gali sukurti labai įtikinamą tikrųjų balsų kopiją. Vartotojai gali įvesti teksto fragmentą, o Balsų variklis jį perskaitys dirbtiniu balsu, atgaivindamas tekstą.

Nors jau yra viešai prieinamų dirbtinio intelekto sugeneruotų balsų paslaugų, OpenAI dar kartą įrodė savo kompetenciją platinant dirbtinio intelekto įrankius. Balsų variklis turi didelį potencialą kaip dirbtinio intelekto įgalintas teksto į balsą vertėjas, suteikiantis pagalbą vertimuose, padedantis vaikams skaityti ir teikiantis palaikymą asmenims, netekusiems gebėjimo kalbėti.

Tačiau kai kurie skeptikai išreiškia susirūpinimą dėl šios technologijos galimų neigiamų pasekmių. Baimė yra ta, kad tai galėtų skatinti dezinformacijos kūrimą ar padaryti lengvesnį sukčiavimą. OpenAI pripažįsta šias rizikas ir pabrėžia atsakingo sintezinio balsų technologijos naudojimo svarbą.

Kad išspręstų šias problemas, OpenAI šiuo metu riboja Balsų variklio naudojimą iki pasitikėtinos partnerių grupės, tarp jų yra švietimo ir sveikatos technologijų įmonės. Šie partneriai turi laikytis gairių, draudžiančių žmonių balsų atkūrimą be aiškios sutikimo ir reikalaujantį aiškaus AI sugeneruoto turinio identifikavimo. OpenAI naudoja šiuos bandymus, kad nuspręstų, kaip toliau tęsti platinimą.

OpenAI pripažįsta svarbų pokytį, kuomet dirbtinio intelekto sugeneruotas garsas tampa labiau prieinamas. Nors Balsų variklis dar nebuvo išleistas visuomenei, OpenAI planuoja panaikinti balsu pagrįstą autentifikavimą banko sąskaitose ir siūlo įtraukti balsavimo patirtis, patvirtinančias pradinio kalbėtojo sutikimą prieš sintetinio balso technologijos platinimą į platesnes masiškumo sritis. Be to, OpenAI siūlo įsteigti „no-go balso sąrašą”, kad būtų išvengta balsų, panašių į akivaizdžius veikėjus, kurie pernelyg arti atitiktų tikrovę.

Vienas iš pastebimų Balsų variklio ypatumų yra jo daugiakalbisis gebėjimas. Naudodamas balso pavyzdį vienu kalba, šis įrankis gali sukurti balsų kopiją, kuri gali kalbėti kitomis kalbomis. OpenAI įrodė šią funkcionalumą savo tinklaraščio įraše, pateikiant pavyzdžius su dirbtiniu garsu, kuris išsaugo pradinio kalbėtojo toną ir akcentą, skaitant tą patį tekstą ispanų, kinų, vokiečių, prancūzų ir japonų kalbomis.

Kol vartotojai laukia Sora, OpenAI sukurtos AI sugeneruotos vaizdo įrankio, viešo pranešimo, Balsų variklio įvedimas demonstruoja milžinišką dirbtinio intelekto technologijos potencialą. OpenAI toliau lydi inovacijų keliu, kuriuo padedami sukurti įvairių pramonės šakų transformavimo įrankiai, turintys giliai nusistovėjusias pasekmes.

Dažniausiai užduodami klausimai (DUK)

The source of the article is from the blog macnifico.pt

Privacy policy
Contact