OpenAI و Google اخیراً رهبری خود را در بخش هوش مصنوعی نشان دادند، به خصوص OpenAI که محبوبیت زیادی داشت. درست قبل از کنفرانس سالانه مورد انتظار بسیار مهم Google به نام I/O، انتظارات برای اعلانهای جدید مرتبط با هوش مصنوعی از این عظیمالجثه بود. با این حال، OpenAI با یک تیزر رمزآمیز از نوآوری آیندهاش توجه رسانهها را به خود جلب کرد.
مدیر عامل OpenAI، معروف به تحریک صنعت، به ظهور نزدیک فناوریای اشاره کرد که او آن را مشابه “جادو” میداند. زمانبندی این امر به منظور برانگیزاندن کنجکاوی بود و یک روز قبل از رویداد Google اتفاق افتاد.
در روز دوشنبه، OpenAI GPT-4o را معرفی کرد، که “o” به معنی “omni” است و برای نشان دادن قابلیتهای چندمنظورهاش استفاده میشود. با پردازش نه تنها متن بلکه ورودیهای صوتی و ویدیو، این نماد از یک قدم به سوی تعاملات انسانی به زمان واقعی بیشتر اشاره میکند.
نمایشی از یک دستیار صوتی دمونتره کرد که توانایی ترجمهی گفتار را در هوا دارد و پاسخهای همانند انسانی را نشان میدهد. علاوه بر این، چگونگی حل معادلاتی که بر روی کاغذ نشان داده شده با استفاده از دوربین گوشی هوشمند را نشان داد. بهبودهایی مانند تعاملات دوستدارانهتر و خدمات کارآمدتر توسط OpenAI توجه شدند، با قول ارائه تجربه اقتصادی و سریعتر از نمونه پیشین GPT-4 Turbo خود.
حتی کاربرانی که فقط به نسخه رایگان GPT-3.5 دسترسی داشتند، اکنون میتوانند از قابلیتهای GPT-4o بهره ببرند، با وجود یک محدودیت روزانه حدود ده درخواست. طبق گفتههای متخصص یادگیری ماشین، ایگور کوتنکوف، کاربران جدید ممکن است به قابلیتهای شبکه عصبی این مدل تعجب کنند.
دسترسی به دستیار هوش مصنوعی جدید در حال حاضر فقط برای اعضای پولی است، با برنامههایی برای دسترسی گستردهتر به اعضای پلاس شاتجیپیتی و کسبوکارها. زمان پاسخ بهبود یافتهی قابلیت صوتی اکنون به طور میانگین حدود ۳۲۰ میلیثانیه است و نشانهای از سرعت آن نسبت به مدلهای گذشته ارائه میدهد و مبنای یک گفتگوی طبیعی را فراهم میکند.
علاوه بر این، چندمنظورهبودن GPT-4o واقعاً یک بازیگر تغییرگر است و نیاز به شبکههای جداگانه مانند Dall-E برای تولید تصاویر را حذف کرده است. کوتنکوف توجه دارد که فرآیند آراستهشده اکنون تصاویر را به صورت مستقیم تحویل میدهد، شامل تصویرسازی روی کاراکترهای خاص در پیامها.
بررسیهای مستقل ابتدایی از مدل به طور عمده مثبت هستند، مدح آپی نظافته و قابلیت کدنویسی مدل. با این حال، در ارتباط با انگیزهورزی و ایجاد محتوا، GPT-4o ممکن است هنوز از نسخه Turbo و رقبای مانند Claude 3 شرکت Anthropic عقب بیفتد. با این حال، در پلتفرمهای رقابتی فعلی، اکنون برتری دارد.
تمجید برای دستیار صوتی برپایه GPT-4o حتی بیشتر برجسته است، و بر اساس تجربهی صنعتی مانند Mark Spoonauer از Tom’s Guide، محصول OpenAI را نسبت به رقبا مانند Siri اپل و Alexa آمازون برتری میدهد.
از نظر اعلانهای هوش مصنوعی گوگل، به رغم غنای نوآوریها، با تلاش برای برجسته شدن در مقابل ارائه جریاندهنده OpenAI دچار مشکل شدند. زمانبندیهای مختلفی برای ارائههای گوگل ارائه شد، با اطلاعات بیشتر به اولین مشترکان برنامه Google One AI Premium اختصاص یافته بود، که احساس انتظار و اختصاصی بودن ایجاد کرد. با برنامهها برای عرضه خلاصههای جستجویی مبتنی بر هوش مصنوعی به پایه کاربران وسیع خود، گوگل در حال تبدیل شدن به چگونگی یافتن اطلاعات است و ممکن است بهبودیاری زمینهای در پرس و جوهای پیچیدهای از جمله لوکیشن ایجاد کند.
حقایق مربوط:
– اقدام OpenAI برای عرضه GPT-4o پیش از رویداد I/O گوگل، تاکید بر زمانبندی استراتژیک در رقابت با شرکتهای فناوری بزرگ است.
– قابلیتهای ورودی صوتی و ویدیو در مدلهای هوش مصنوعی مانند GPT-4o در حال رقم زدن برای ایجاد رابطهای کاربری طبیعیتر هستند.
– گوگل که به دلیل موتور جستجوی خود و پروژههای متعدد هوش مصنوعی شناخته شده است، در حوزه هوش مصنوعی پیشرفتهای قابل توجهی داشته است که جزئیات زیادی از آنها برای مشترکین پریمیوم Google One AI نگهداری شده است، که احساس انتظار و اختصاصیت ایجاد میکند.
سوالات و پاسخهای مهم:
– اهمیت قابلیتهای چندمنظوره GPT-4o چیست؟ ادغام انواع ورودیها (متن، صوت، ویدیو) امکان تعاملاتی شبیه به انسانی را ارائه میدهد و ممکن است حوزههایی مانند خدمات مشتریان، آموزش و دسترسیپذیری را انقلابی کند.
– چگونه GPT-4o با نسخههای قبلی خود مقایسه میشود؟ GPT-4o بهبودهایی در قابلیتهای چندمنظوره، زمان پاسخ، و دسترسی ارائه میدهد، همچنین ویژگیهای خود را به کاربران بیشتری گسترش داده است با تیراژ آزاد خود.
– چالشهای OpenAI با GPT-4o چیست؟ آنها باید تضمین کنند که فناوری به طور مسئولانه توسعه یابد تا از سوءاستفاده جلوگیری شود، نقصهای مدل در پاسخها را رفع کنند، و حفظ حریم شخصی و امنیت دادههای کاربر را اطمینان دهند.
چالشها و اختلافات کلیدی:
– استفاده اخلاقی از هوش مصنوعی و احتمال سوگیریها در پاسخهای هوش مصنوعی که میتواند منجر به انتشار اطلاعات نادرست یا تبعیض شود.
– اطمینان از حریم خصوصی کاربر و امنیت داده، به ویژه با ورودیهای چندمنظوره که میتوانند اطلاعات بیشتری را آشکار کنند.
– تعادل میان دسترسی آزاد و فناوری اختصاصی، که سوالاتی از دموکراتیکسازی هوش مصنوعی و عدالت مطرح میکند.
مزایا و معایب:
– مزایا: تجربه کاربری بهبود یافته، دسترسیپذیری، و کارایی در تعامل؛ پتانسیل افزایش کاربردهای فناوری مختلف، و ارائه قابلیتهای هوش مصنوعی به یک پایه کاربری گستردهتر.
– معایب: خطر افزایش شکاف دیجیتال، افزایش احتمال سواستفاده از هوش مصنوعی، و چالشهای بیشتری برای حریم خصوصی.
پیوندهای مرتبط پیشنهادی:
– OpenAI
– Google
– DeepMind
با توجه به قابلیتهای روزافزون هوش مصنوعی و یکپارچگی آن در زندگی روزمره ما، رقابت بین غولهایی چون OpenAI و Google بیش از یک جنگ برای قسمت بازار نیست، بلکه یک دویدن به سوی شکل دادن آینده فناوری و نقش آن در جوامع است.
The source of the article is from the blog foodnext.nl