رقابت تشدید می‌شود زمانی که OpenAI مدل GPT-4o را قبل از کنفرانس اصلی گوگل عرضه می‌کند

OpenAI و Google اخیراً رهبری خود را در بخش هوش مصنوعی نشان دادند، به خصوص OpenAI که محبوبیت زیادی داشت. درست قبل از کنفرانس سالانه مورد انتظار بسیار مهم Google به نام I/O، انتظارات برای اعلان‌های جدید مرتبط با هوش مصنوعی از این عظیم‌الجثه بود. با این حال، OpenAI با یک تیزر رمزآمیز از نوآوری آینده‌اش توجه رسانه‌ها را به خود جلب کرد.

مدیر عامل OpenAI، معروف به تحریک صنعت، به ظهور نزدیک فناوری‌ای اشاره کرد که او آن را مشابه “جادو” می‌داند. زمان‌بندی این امر به منظور برانگیزاندن کنجکاوی بود و یک روز قبل از رویداد Google اتفاق افتاد.

در روز دوشنبه، OpenAI GPT-4o را معرفی کرد، که “o” به معنی “omni” است و برای نشان دادن قابلیت‌های چند‌منظوره‌اش استفاده می‌شود. با پردازش نه تنها متن بلکه ورودی‌های صوتی و ویدیو، این نماد از یک قدم به سوی تعاملات انسانی به زمان واقعی بیشتر اشاره می‌کند.

نمایشی از یک دستیار صوتی دمونتره کرد که توانایی ترجمه‌ی گفتار را در هوا دارد و پاسخ‌های همانند انسانی را نشان می‌دهد. علاوه بر این، چگونگی حل معادلاتی که بر روی کاغذ نشان داده شده با استفاده از دوربین گوشی هوشمند را نشان داد. بهبود‌هایی مانند تعاملات دوست‌دارانه‌تر و خدمات کارآمدتر توسط OpenAI توجه شدند، با قول ارائه تجربه اقتصادی و سریعتر از نمونه پیشین GPT-4 Turbo خود.

حتی کاربرانی که فقط به نسخه رایگان GPT-3.5 دسترسی داشتند، اکنون می‌توانند از قابلیت‌های GPT-4o بهره ببرند، با وجود یک محدودیت روزانه حدود ده درخواست. طبق گفته‌های متخصص یادگیری ماشین، ایگور کوتنکوف، کاربران جدید ممکن است به قابلیت‌های شبکه عصبی این مدل تعجب کنند.

دسترسی به دستیار هوش مصنوعی جدید در حال حاضر فقط برای اعضای پولی است، با برنامه‌هایی برای دسترسی گسترده‌تر به اعضای پلاس شات‌جی‌پی‌تی و کسب‌وکارها. زمان پاسخ بهبود یافته‌ی قابلیت صوتی اکنون به طور میانگین حدود ۳۲۰ میلی‌ثانیه است و نشانه‌ای از سرعت آن نسبت به مدل‌های گذشته ارائه می‌دهد و مبنای یک گفتگوی طبیعی را فراهم می‌کند.

علاوه بر این، چندمنظوره‌بودن GPT-4o واقعاً یک بازیگر تغییرگر است و نیاز به شبکه‌های جداگانه مانند Dall-E برای تولید تصاویر را حذف کرده است. کوتنکوف توجه دارد که فرآیند آراسته‌شده اکنون تصاویر را به صورت مستقیم تحویل می‌دهد، شامل تصویرسازی روی کاراکترهای خاص در پیام‌ها.

بررسی‌های مستقل ابتدایی از مدل به طور عمده مثبت هستند، مدح آپی نظافته و قابلیت کدنویسی مدل. با این حال، در ارتباط با انگیزه‌ورزی و ایجاد محتوا، GPT-4o ممکن است هنوز از نسخه Turbo و رقبای مانند Claude 3 شرکت Anthropic عقب بیفتد. با این حال، در پلتفرم‌های رقابتی فعلی، اکنون برتری دارد.

تمجید برای دستیار صوتی برپایه GPT-4o حتی بیشتر برجسته است، و بر اساس تجربه‌ی صنعتی مانند Mark Spoonauer از Tom’s Guide، محصول OpenAI را نسبت به رقبا مانند Siri اپل و Alexa آمازون برتری می‌دهد.

از نظر اعلان‌های هوش مصنوعی گوگل، به رغم غنای نوآوری‌ها، با تلاش برای برجسته شدن در مقابل ارائه جریاندهنده OpenAI دچار مشکل شدند. زمان‌بندی‌های مختلفی برای ارائه‌های گوگل ارائه شد، با اطلاعات بیشتر به اولین مشترکان برنامه Google One AI Premium اختصاص یافته بود، که احساس انتظار و اختصاصی بودن ایجاد کرد. با برنامه‌ها برای عرضه خلاصه‌های جستجویی مبتنی بر هوش مصنوعی به پایه کاربران وسیع خود، گوگل در حال تبدیل شدن به چگونگی یافتن اطلاعات است و ممکن است بهبودیاری زمینه‌ای در پرس و جوهای پیچیده‌ای از جمله لوکیشن ایجاد کند.

حقایق مربوط:
– اقدام OpenAI برای عرضه GPT-4o پیش از رویداد I/O گوگل، تاکید بر زمان‌بندی استراتژیک در رقابت با شرکت‌های فناوری بزرگ است.
– قابلیت‌های ورودی صوتی و ویدیو در مدل‌های هوش مصنوعی مانند GPT-4o در حال رقم زدن برای ایجاد رابط‌های کاربری طبیعی‌تر هستند.
– گوگل که به دلیل موتور جستجوی خود و پروژه‌های متعدد هوش مصنوعی شناخته شده است، در حوزه هوش مصنوعی پیشرفت‌های قابل توجهی داشته است که جزئیات زیادی از آنها برای مشترکین پریمیوم Google One AI نگهداری شده است، که احساس انتظار و اختصاصیت ایجاد می‌کند.

سوالات و پاسخ‌های مهم:
– اهمیت قابلیت‌های چندمنظوره GPT-4o چیست؟ ادغام انواع ورودی‌ها (متن، صوت، ویدیو) امکان تعاملاتی شبیه به انسانی را ارائه می‌دهد و ممکن است حوزه‌هایی مانند خدمات مشتریان، آموزش و دسترسی‌پذیری را انقلابی کند.
– چگونه GPT-4o با نسخه‌های قبلی خود مقایسه می‌شود؟ GPT-4o بهبود‌هایی در قابلیت‌های چندمنظوره، زمان پاسخ، و دسترسی ارائه می‌دهد، همچنین ویژگی‌های خود را به کاربران بیشتری گسترش داده است با تیراژ آزاد خود.
– چالش‌های OpenAI با GPT-4o چیست؟ آنها باید تضمین کنند که فناوری به طور مسئولانه توسعه یابد تا از سوءاستفاده جلوگیری شود، نقص‌های مدل در پاسخ‌ها را رفع کنند، و حفظ حریم شخصی و امنیت داده‌های کاربر را اطمینان دهند.

چالش‌ها و اختلافات کلیدی:
– استفاده اخلاقی از هوش مصنوعی و احتمال سوگیری‌ها در پاسخ‌های هوش مصنوعی که می‌تواند منجر به انتشار اطلاعات نادرست یا تبعیض شود.
– اطمینان از حریم خصوصی کاربر و امنیت داده، به ویژه با ورودی‌های چندمنظوره که می‌توانند اطلاعات بیشتری را آشکار کنند.
– تعادل میان دسترسی آزاد و فناوری اختصاصی، که سوالاتی از دموکراتیک‌سازی هوش مصنوعی و عدالت مطرح می‌کند.

مزایا و معایب:
– مزایا: تجربه کاربری بهبود یافته، دسترسی‌پذیری، و کارایی در تعامل؛ پتانسیل افزایش کاربردهای فناوری مختلف، و ارائه قابلیت‌های هوش مصنوعی به یک پایه کاربری گسترده‌تر.
– معایب: خطر افزایش شکاف دیجیتال، افزایش احتمال سواستفاده از هوش مصنوعی، و چالش‌های بیشتری برای حریم خصوصی.

پیوندهای مرتبط پیشنهادی:
– OpenAI
– Google
– DeepMind

با توجه به قابلیت‌های روزافزون هوش مصنوعی و یکپارچگی آن در زندگی روزمره ما، رقابت بین غول‌هایی چون OpenAI و Google بیش از یک جنگ برای قسمت بازار نیست، بلکه یک دویدن به سوی شکل دادن آینده فناوری و نقش آن در جوامع است.

The source of the article is from the blog foodnext.nl