سورا: دستاورد اوپن‌ای‌آی در تولید متن به ویدئو

اوپن‌ای‌آی، شرکت معروف پشت ChatGPT، به تازگی در هوش مصنوعی تولیدی مولد، یک توسعه نوآورانه را معرفی کرده است. آخرین اختراع آن، با نام سورا، یک تولیدکننده متن به ویدئو است که به طور فوری ویدئوهای کوتاهی در پاسخ به دستورات مکتوب تولید می‌کند. در حالی که شرکت‌هایی نظیر گوگل، متا و آرانوی ام‌ال نیز فن‌آوری‌های مشابهی را نشان داده‌اند، اما ویدئوهای با کیفیت بالایی که توسط اوپن‌ای‌آی تولید شده‌است، مشاهده‌کنندگان را تحت تأثیر قرار داده و به طور همزمان، نگران مشکلات اخلاقی و اجتماعی شده‌اند.

سورا، برخلاف سایر متن به ویدئوها، با استعداد خود در زنده کردن ترغیب‌ها، توجه را به خود جلب کرد. پس از اینکه مدیرعامل اوپن‌ای سام آلتمن کاربران را فراخوانده و دستورهایی را دریافت کرد، دستور “یک جلسه آشپزی آموزشی برای نوشتن نوشته هزارکی به همراهی یک نفر نسل سوم معروف در آشپزخانه یک سنتی توسکان روستایی در جوشش نور پردازی سینمایی” توجه آلتمن را جلب کرد. در چند زمان کوتاه، آلتمن با ویدئویی واقعگرایانه پاسخی مناسب نشان داد.

اوپن‌ای‌آی هنوز جزئیات خاصی درباره ساختار سورا یا منابع تصویر و ویدئویی استفاده شده در آموزش آن منتشر نکرده‌است، اما این شرکت با دقتی به این موضوع می‌پردازد. اوپن‌ای‌آی تعهد خود را اعلام کرده‌است که پیش از عرضه این ابزار به عموم، با هنرمندان، صنعتگران و کارشناسان صنعتی همکاری خواهد کرد تا برخی از نگرانی‌هایی مانند اطلاعات نادرست، محتوای تحقیرآمیز و تعصب‌آمیز که از استفاده از این فناوری به وجود می‌آیند، را برطرف سازد.

به علاوه، اوپن‌ای‌آی به فعالیت در زمینه مبارزه با محتوای گمراه‌کننده تولیدشده توسط سورا می‌پردازد. آن‌ها در حال توسعه یک طبقه‌بندی‌گر تشخیصی هستند که قادر است تشخیص دهد ویدئویی تولیدشده توسط مولد متن به ویدئو باشد یا خیر. با اجرای اقداماتی برای شناسایی و جلوگیری از گسترش ویدئوهای گمراه‌کننده، اوپن‌ای‌آی تعهد خود را در نسبت به نوآوری مسئولانه نشان داده است.

سورا پیشرفت قابل توجهی در زمینه هوش مصنوعی به حساب می‌آید و امکانات خلاقیتی ارائه‌شده توسط مدل‌های تولیدی را گسترش می‌دهد. تعهد اوپن‌ای‌آی در مشورت با کارشناسان و آدرس‌دهی به خطرات محتمل مرتبط با این تکنولوژی، گامی تحسین‌برانگیز به سوی اطمینان از استفاده مسئولانه‌ی آینده از ویدئوهای تولیدشده توسط هوش مصنوعی است. همچنین، تکامل سورا را جهان با شور و شوق منتظرین، در مورد فرصت‌ها و چالش‌هایی که با این مرز جدید ویدئوهای تولیدشده توسط هوش مصنوعی بوجود می‌آیند، دنبال می‌کند.

سوالات متداول:

1. سورا چیست؟
سورا یک تولیدکننده متن به ویدئو است که توسط اوپن‌ای‌آی توسعه یافته و به طور فوری ویدئوهای کوتاهی را در پاسخ به دستورات مکتوب تولید می‌کند.

2. سورا چگونه از سایر تولیدکننده‌های متن به ویدئو متفاوت است؟
سورا برای استعداد خود در زنده کردن ترغیب‌ها و تولید ویدئوهای با کیفیت بالا شناخته می‌شود.

3. کدام ترغیب جلب توجه مدیرعامل اوپن‌ای‌آی سام آلتمن را جلب کرد؟
ترغیبی که توجه سام آلتمن را به خود جلب کرد، یک “جلسه آشپزی آموزشی برای منجانب حاشیه‌گرفته با نوشتن گنوچی خانگی میزبانی شده توسط یک تأثیرگذار رسانه اجتماعی نسل سوم در یک آشپزخانه رستیک روستایی توسکان با نورپردازی سینمایی” بود.

4. آیا اوپن‌ای‌آی جزئیات ساختار سورا را اعلام کرده است؟
نه، اوپن‌ای‌آی درباره ساختار سورا و منابع استفاده شده در آموزش آن جزئیات خاصی منتشر نکرده‌است.

5. اوپن‌ای‌آی چه رویکردی درباره دردسترس برای عموم نمودن سورا دارد؟
اوپن‌ای‌آی متعهد شده‌است که قبل از عرضه محصول به عموم، با هنرمندان، سیاستگذاران و کارشناسان صنعتی همکاری کند تا نگرانی‌ها و استفاده مسئولانه از این فناوری را برطرف سازند.

6. آیا اوپن‌ای‌آی به صورت فعال به مبارزه با محتوای گمراه‌کننده تولیدشده توسط سورا می‌پردازد؟
بله، اوپن‌ای‌آی در حال توسعه یک طبقه‌بندی کننده تشخیصی است تا بتواند تشخیص دهد آیا ویدئویی توسط مولد متن به ویدئو تولید شده یا خیر. با اجرای تدابیری برای شناسایی و جلوگیری از گسترش محتواهای گمراه‌کننده، اوپن‌ای‌آی از عزم خود در نسبت به نوآوری مسئولانه خود را نشان می‌دهد.

7. هدف اوپن‌ای‌آی با سورا چیست؟
اوپن‌ای‌آی هدف خود را در توسعه امکان‌های خلاقیتی مدل‌های تولیدی و اطمینان از استفاده مسئولانه از ویدئوهای تولیدی توسط هوش مصنوعی با مشورتی با کارشناسان و آدرس‌دهی به خطرات محتمل مرتبط با این تکنولوژی تعیین کرده است.

تعاریف:

تولیدکننده متن به ویدئو: فناوری‌ای که متن نوشتاری را به محتوای ویدئویی تبدیل می‌کند.

مدل‌های تولیدی: مدل‌های هوش مصنوعی که بر اساس داده‌های موجود، محتوای جدیدی تولید می‌کنند، بیشتر از تکنیک‌های یادگیری عمیق استفاده می‌کنند.

طبقه‌بندی کننده تشخیصی: ابزار یا الگوریتمی است که برای تشخیص الگوها یا ویژگی‌های مشخص در داده‌ها استفاده می‌شود، در این مورد، می‌توانید تشخیص دهید آیا یک ویدئو توسط مولد متن به ویدئو تولید شده است یا خیر.

لینک‌های مرتبط پیشنهادی:

– اوپن‌ای‌آی
– وبلاگ اوپن‌ای‌آی

The source of the article is from the blog mivalle.net.ar

Privacy policy
Contact