نقل

اپن‌آی اخیراً ابزاری به نام «Voice Generation» معرفی کرده است که قادر به ایجاد صداهای مصنوعی از یک نمونه صوتی 15 ثانیه‌ای است. این ابزار توانایی خلق صداهای ترقیقی با تن صدا واقع‌گرایانه از متن‌های مختلف را دارد.

OpenAI در زمینه هوش مصنوعی با پروژه‌های مختلفی از جمله ChatGPT و Sora AI پیشرفت‌های قابل توجهی کرده است. Voice Generation جدیدترین افزایش به تجربه این شرکت است که توانایی ایجاد صداهای ترقیقی را ارائه می‌دهد.

استفاده از Voice Generation در حال توسعه می‌باشد و اکنون در اپلیکیشن ChatGPT در بخش Read Aloud برای خواندن پاسخ‌ها به کاربران مورد استفاده قرار می‌گیرد. این ابزار با آموزش صدای کوتاه به کاربران اجازه می‌دهد تا آن را برای خواندن هر متنی که می‌خواهند، با یک تن احساسی و واقع‌گرایانه مورد استفاده قرار دهند.

حوزه‌های کاربردی بالقوه Voice Generation وسیع و متنوع می‌باشد. OpenAI بر این باور است که این تکنولوژی می‌تواند برای اهداف آموزشی، ترجمه پادکست‌ها به زبان‌های مختلف، ارتباط با جوامع دورافتاده و حمایت از افراد غیر-کلام مورد استفاده قرار گیرد. با این حال، Voice Engine هنوز برای استفاده توسط عموم آدمیان منتشر نشده است.

شرکت OpenAI نمونه‌هایی از صداهای ترقیقی ساخته شده توسط Voice Engine را به اشتراک گذاشته است که با کیفیت آن‌ها افراد را مبهوت کرده است. با این حال، کیفیت صوت با کمیتی رباتیک و از نظر صداشناختی، اشاره به نیاز به بهبودهای بیشتر دارد.

همراه با قرار گیری این تکنولوژی، اصلی‌ترین نگرانی محیط اطراف مربوط به ممکنه سوء استفاده از Voice Engine است. OpenAI فعالانه راهکارهایی برای جلوگیری از گسترش اطلاعات غلط و استفاده غیر مجاز از صداهای ترقیقی در دستور کار قرار داده است. این شرکت قصد دارد گفتگویی در مورد استفاده مسئولانه از این تکنولوژی را آغاز کرده و علاقه‌مند به بررسی شود که چطور جامعه می‌تواند به این قابلیت جدید سازمان‌یافته شود. اتخاذ یک تصمیم آگاهانه در مورد اینکه آیا و چگونه باید Voice Generation را به مقیاس منبعدهی کند، براساس نتایج آزمون‌های کوچک مقیاس و این گفت‌وگوها، هدف OpenAI است.

سوال برگزیده

1. چیست Voice Generation؟
Voice Generation ابزاری هوش مصنوعی است که توسط OpenAI توسعه یافته است و قادر است از نمونه‌های صوتی کوتاه صداهای ترقیقی را ایجاد نماید. این صداها سپس می‌توانند برای خواندن هر متنی با یک تن احساسی و واقع‌گرایانه استفاده شوند.

2. کاربردهای بالقوه Voice Generation چیست؟
Voice Generation کاربردهای متعددی دارد. این می‌تواند برای اهداف آموزشی، ترجمه پادکست‌ها به زبان‌های مختلف، ارتباط با جوامع دورافتاده و حمایت از افراد غیر-کلام مورد استفاده قرار گیرد.

3. آیا هر کسی می‌تواند از Voice Generation استفاده کند؟
در حال حاضر، Voice Generation فقط در یک نگاه اولیه محدود موجود است و برای عموم آدمیان دسترسی ندارد. با این حال، OpenAI نمونه‌هایی از صداهای ترقیقی ساخته شده توسط Voice Engine را برای گوش دادن ارائه داده است.

4. چه نگرانی‌های محیط اطراف مربوط به Voice Generation وجود دارد؟
نگرانی اصلی، خطر سوء استفاده از صداهای ترقیقی می‌باشد، مانند گسترش اطلاعات غلط یا کپی کردن صداها بدون رضایت. OpenAI در حال تحقیق فعال و توسعه راهکارهایی برای پیشگیری از سوء استفاده و اطمینان از استقرار مسئولانه تکنولوژی می‌باشد.

5. چگونه Voice Generation بر شناسایی صدا تأثیر می‌گذارد؟
Voice Generation چالش‌هایی برای اقدامات شناسایی صدایی ایجاد می‌کند، چرا که تشخیص صداهای واقعی و تولید شده از تبادلات صوتی به سختی ممکن می‌شود. این می‌تواند منجر به مشکلات در بی‌سیم‌های شناسایی صدا، چون بیومتریک‌های صدا برای سیستم‌های امنیتی یا تکنولوژی تأیید صدای پشتیبانی مشتری شود. یافتن راهکارهای مؤثر برای حفظ اعتماد و امنیت در تبادلات صوتی بسیار حائز اهمیت می‌شود.

با پیشرفت این تکنولوژی، یافتن راه‌حل‌های موثر برای این چالش‌ها ضروری می‌شود. OpenAI پیچیدگی این مسائل را می‌داند و هدف از برنامه‌های گسترده برای استفاده مسئولانه و تطبیق جامعه می‌باشد.

The source of the article is from the blog portaldoriograndense.com