اپنآی اخیراً ابزاری به نام «Voice Generation» معرفی کرده است که قادر به ایجاد صداهای مصنوعی از یک نمونه صوتی 15 ثانیهای است. این ابزار توانایی خلق صداهای ترقیقی با تن صدا واقعگرایانه از متنهای مختلف را دارد.
OpenAI در زمینه هوش مصنوعی با پروژههای مختلفی از جمله ChatGPT و Sora AI پیشرفتهای قابل توجهی کرده است. Voice Generation جدیدترین افزایش به تجربه این شرکت است که توانایی ایجاد صداهای ترقیقی را ارائه میدهد.
استفاده از Voice Generation در حال توسعه میباشد و اکنون در اپلیکیشن ChatGPT در بخش Read Aloud برای خواندن پاسخها به کاربران مورد استفاده قرار میگیرد. این ابزار با آموزش صدای کوتاه به کاربران اجازه میدهد تا آن را برای خواندن هر متنی که میخواهند، با یک تن احساسی و واقعگرایانه مورد استفاده قرار دهند.
حوزههای کاربردی بالقوه Voice Generation وسیع و متنوع میباشد. OpenAI بر این باور است که این تکنولوژی میتواند برای اهداف آموزشی، ترجمه پادکستها به زبانهای مختلف، ارتباط با جوامع دورافتاده و حمایت از افراد غیر-کلام مورد استفاده قرار گیرد. با این حال، Voice Engine هنوز برای استفاده توسط عموم آدمیان منتشر نشده است.
شرکت OpenAI نمونههایی از صداهای ترقیقی ساخته شده توسط Voice Engine را به اشتراک گذاشته است که با کیفیت آنها افراد را مبهوت کرده است. با این حال، کیفیت صوت با کمیتی رباتیک و از نظر صداشناختی، اشاره به نیاز به بهبودهای بیشتر دارد.
همراه با قرار گیری این تکنولوژی، اصلیترین نگرانی محیط اطراف مربوط به ممکنه سوء استفاده از Voice Engine است. OpenAI فعالانه راهکارهایی برای جلوگیری از گسترش اطلاعات غلط و استفاده غیر مجاز از صداهای ترقیقی در دستور کار قرار داده است. این شرکت قصد دارد گفتگویی در مورد استفاده مسئولانه از این تکنولوژی را آغاز کرده و علاقهمند به بررسی شود که چطور جامعه میتواند به این قابلیت جدید سازمانیافته شود. اتخاذ یک تصمیم آگاهانه در مورد اینکه آیا و چگونه باید Voice Generation را به مقیاس منبعدهی کند، براساس نتایج آزمونهای کوچک مقیاس و این گفتوگوها، هدف OpenAI است.
سوال برگزیده
1. چیست Voice Generation؟
Voice Generation ابزاری هوش مصنوعی است که توسط OpenAI توسعه یافته است و قادر است از نمونههای صوتی کوتاه صداهای ترقیقی را ایجاد نماید. این صداها سپس میتوانند برای خواندن هر متنی با یک تن احساسی و واقعگرایانه استفاده شوند.
2. کاربردهای بالقوه Voice Generation چیست؟
Voice Generation کاربردهای متعددی دارد. این میتواند برای اهداف آموزشی، ترجمه پادکستها به زبانهای مختلف، ارتباط با جوامع دورافتاده و حمایت از افراد غیر-کلام مورد استفاده قرار گیرد.
3. آیا هر کسی میتواند از Voice Generation استفاده کند؟
در حال حاضر، Voice Generation فقط در یک نگاه اولیه محدود موجود است و برای عموم آدمیان دسترسی ندارد. با این حال، OpenAI نمونههایی از صداهای ترقیقی ساخته شده توسط Voice Engine را برای گوش دادن ارائه داده است.
4. چه نگرانیهای محیط اطراف مربوط به Voice Generation وجود دارد؟
نگرانی اصلی، خطر سوء استفاده از صداهای ترقیقی میباشد، مانند گسترش اطلاعات غلط یا کپی کردن صداها بدون رضایت. OpenAI در حال تحقیق فعال و توسعه راهکارهایی برای پیشگیری از سوء استفاده و اطمینان از استقرار مسئولانه تکنولوژی میباشد.
5. چگونه Voice Generation بر شناسایی صدا تأثیر میگذارد؟
Voice Generation چالشهایی برای اقدامات شناسایی صدایی ایجاد میکند، چرا که تشخیص صداهای واقعی و تولید شده از تبادلات صوتی به سختی ممکن میشود. این میتواند منجر به مشکلات در بیسیمهای شناسایی صدا، چون بیومتریکهای صدا برای سیستمهای امنیتی یا تکنولوژی تأیید صدای پشتیبانی مشتری شود. یافتن راهکارهای مؤثر برای حفظ اعتماد و امنیت در تبادلات صوتی بسیار حائز اهمیت میشود.
با پیشرفت این تکنولوژی، یافتن راهحلهای موثر برای این چالشها ضروری میشود. OpenAI پیچیدگی این مسائل را میداند و هدف از برنامههای گسترده برای استفاده مسئولانه و تطبیق جامعه میباشد.
The source of the article is from the blog portaldoriograndense.com