Інноваційна візія OpenAI чи загроза розвитку синтетичного аудіо

OpenAI, виробник популярного чат-робота ChatGPT, представив свій новий першопрохідний інструмент штучного інтелекту, під назвою Voice Engine. Ця передова технологія має здатність імітувати реальні людські голоси, що робить її відмінником у світі генеративного штучного інтелекту.

Voice Engine був представлений у п’ятницю, разом зі зразками ранніх тестів, які демонструють його вражаючі можливості. За допомогою 15-секундного зразка говоріння людини цей інструмент може згенерувати дуже переконливу репліку їх голосу. Користувачі можуть ввести абзац тексту, і Voice Engine прочитає його штучним голосом, надаючи тексту життєвість.

Хоча вже існують доступні для громадськості послуги із синтезу голосу за допомогою штучного інтелекту, OpenAI знову продемонстрував свою майстерність у масовому впровадженні інструментів штучного інтелекту. Voice Engine має величезний потенціал як інструмент штучного інтелекту для перетворення тексту в мовлення, пропонуючи допомогу у перекладі, сприяючи дітям у навчанні читання і надаючи підтримку людям, які втратили здатність до мовлення.

Однак деякі симпатизанти висловлюють турботу щодо можливих негативних наслідків цієї технології. Їх тривога полягає в тому, що вона може стимулювати створення дезінформації або ускладнити здійснення афер. OpenAI визнає ці ризики і наголошує на необхідності відповідального впровадження синтетичної голосової технології.

Для вирішення цих питань OpenAI наразі обмежує використання Voice Engine на вибраний кіл ексклюзивних партнерів, включаючи компанії з галузей освіти і охорони здоров’я. Ці партнери підпадають під встановлені принципи, які забороняють відтворення голосу людей без їхньої згоди та вимагають чіткої ідентифікації вмісту, створеного із застосуванням штучного інтелекту. OpenAI використовує ці випробування, щоб визначити, як продовжувати з подальшою доступністю.

OpenAI визнає важливість впровадження значних змін у міру того, як штучно генероване аудіо стає більш доступним. Хоча Voice Engine ще не був випущений для громадськості, OpenAI має намір припинити аутентифікацію на основі голосу для банківських рахунків та пропонує включення досвідів аутентифікації голосу, які підтверджують згоду первісного спікера до впровадження синтетичної технології голосу на широку шкалу. Крім того, OpenAI пропонує створення “списку голосів, які не можна наслідувати”, щоб уникнути створення голосів, що занадто схожі на видатних особистостей.

Однією з найбільш визначних функцій Voice Engine є його багатомовність. За допомогою зразка голосу на одній мові цей інструмент може створити репліку голосу, яка може говорити на кількох інших мовах. OpenAI продемонстрував цей функціонал у своєму блозі, надаючи приклади штучного аудіофайлу, який зберігає тон і акцент первісного спікера під час читання того самого уривка іспанською, китайською, німецькою, французькою та японською.

Поки користувачі із нетерпінням очікують на публічний випуск Sora, інструменту штучного генерування відео від OpenAI, поява Voice Engine показує величезний потенціал технології штучного інтелекту. OpenAI продовжує бути лідером у розробці інноваційних інструментів штучного інтелекту, які мають далекосяжні наслідки в різних галузях.

Часті запитання (FAQ)

1. Що таке Voice Engine?
Voice Engine – це передовий інструмент із штучного інтелекту, розроблений OpenAI, який може генерувати аудіо, імітуючи реальні людські голоси. Він використовує зразок говоріння людини для створення переконливої репліки їх голосу.

2. Як можна використовувати Voice Engine?
Voice Engine має широкий спектр потенційних застосувань. Він може допомагати у перекладі, надавати підтримку при читанні дітям та допомагати людям, які втратили здатність до мовлення.

3. Які є турботи, пов’язані з Voice Engine?
Хоча Voice Engine пропонує низку переваг, є певні турботи щодо можливості створення дезінформації та афер у зв’язку з цією технологією.

4. Як OpenAI вирішує ці турботи?
OpenAI обмежує використання Voice Engine для довірених партнерів та впроваджує строгі рекомендації, щоб забезпечити відповідальне використання. Вони також планують припинити аутентифікацію на основі голосу для банківських рахунків та пропонують аутентифікаційні враження голосу для підтвердження згоди.

5. Чи може Voice Engine генерувати голоси на різних мовах?
Так, Voice Engine може використовувати зразок голосу на одній мові для створення репліки голосу, яка може говорити на кількох інших мовах.

Джерела: OpenAI Blog

The source of the article is from the blog procarsrl.com.ar