هوش مصنوعی تولیدشونده مانند مدل زبان بزرگ معروف GPT-4 تواناییهای شگفتانگیزی را به خود ثابت کرده است، اما محدودیتهای مدهش خود را نیز دارد. اگرچه GPT-4 میتواند به سرعت مسائل پیچیدهای را که ممکن است متخصصان انسان به چالش بکشند، حل کند، اما اغلب در مسائل ریاضیات ساده خطاهایی مرتکب میشود و با وظایفی که یک کودک 10 ساله به راحتی میتواند انجام دهد، مشکل دارد.
نیکولاس کارلینی، یک پژوهشگر در گوگل دیپمایند، یک آزمون جذاب را در وبسایت خود ایجاد کرده است تا تواناییهای قابل توجه و پرسشبرانگیز GPT-4 را به نمایش بگذارد. شکستهای مدل در چالش Wordle و حرکت پیروزی در بازی دوز و مات نقاط ضعف آن را نشان میدهد. با این حال GPT-4 به راحتی میتواند صفحه وبی جاوا اسکریپت کاملی را برای بازی دوز و مات با کامپیوتر تولید کند تا کامپیوتر هیچگاه باخت نکند.
پیشبینیناپذیری عملکرد GPT-4 آشکار میشود هنگام بررسی یک مطالعه انجام شده توسط تیمی از پژوهشگرانی که با شرکت مشاورهای بوستون کنسالتینگ گروه (BCG) همکاری میکردند. مشاوران مدیریت با استفاده از GPT-4 در وظایف واقعگرایانه مختلفی مانند ایجاد ایدههای محصول، تجزیه و تحلیل نمودارهای بازار و نوشتن اطلاعیههای مطبوعاتی، عملکرد بهتری نسبت به همکاران بدون این ابزار را داشتند. این مشاوران با مجهز شدن به هوش مصنوعی، کار بیشتری را با کیفیت بالاتر و در زمان کمتر انجام دادند.
با این حال، این مطالعه یک وظیفهای را به طور عمدی طراحی کرد تا GPT-4 را در تحقیقات منطقی خود آزمایش کند و ضعف آن را برجای بگذارد. ارائه توصیههای استراتژیک بر اساس دادههای مالی و مصاحبه با کارمندان به چالشی برای مدل تبدیل شد. این مدل به طور معمول توصیههای ضعیفی را بدون مد نظر قرار دادن بینش مصاحبهها ارائه میدهد. این وظیفه تنها وظیفهای بود که مشاوران بدون استفاده از هوش مصنوعی بهتر عمل کردند.
مسیریابی در مرزهای نواحی خشن هوش مصنوعی تولیدشونده چالشی را به دنبال دارد. اوقاتی هوش مصنوعی تواناییهای انسان را فراتر میگیرد، در حالیکه در دیگر اوقات انسانها غلبه میکنند. مهم است که درک کنیم که کی به هوش مصنوعی اعتماد کنیم و کی به ارزیابی انسانی اعتماد کنیم.
با استناد به تأثیر آیفون، مهم است که بررسی کنیم چقدر جامعه به سرعت وابسته به تلفنهای هوشمند شده است و اغلب به آنها روی میآوردم. هوش مصنوعی تولیدشونده ممکن است جای خود را در آینده پیدا کند، اما برای تشخیص کاربرد آن و نقاط ضعف محتمل نیاز به ارزیابی دقیقی خواهد بود. در عوض، همه میتوانند لیستی از آنچه را که با یک تلفن هوشمند درست انجام میدهند و آنچه را که بهتر انجام میدهند هنگامی که آن را در دسترس ندارند، بنویسند. چالش در یادآوری و اقدام مناسب است.
همانطور که با ابزارهای هوش مصنوعی پیش میرویم، آیا میتوان بهتر از آنچه که با تلفنهای هوشمند خود انجام میدهیم، از آنها استفاده کنیم.
پاسخ به سؤالهای متداول در مورد هوش مصنوعی تولیدشونده
1. هوش مصنوعی تولیدشونده چیست؟
هوش مصنوعی تولیدشونده به مدلهای هوش مصنوعی اطلاق میشود که براساس دادهها یا الگوهای ورودی، محتواهایی مانند متن، تصویر یا حتی کد را تولید، ایجاد یا تولید میکند. یکی از نمونههای هوش مصنوعی تولیدشونده، GPT-4 است که یک مدل زبان بزرگ توسعه داده شده توسط OpenAI است.
2. تواناییهای GPT-4 چیست؟
GPT-4 توانایی حل مسائل قابل توجهی دارد و میتواند وظایف پیچیدهای را که متخصصان انسان را چالش میکند، انجام دهد. این مدل میتواند صفحات وب جاوا اسکریپت کاملی برای بازیهای تعاملی مانند دوز و مات تولید کند تا کامپیوتر هیچگاه باخت نکند.
3. محدودیتهای GPT-4 چیست؟
GPT-4 با ریاضیات ساده و وظایفی که یک کودک 10 ساله به راحتی میتواند انجام دهد، مشکل دارد. اغلب با چالشهایی مانند بازی Wordle و انجام حرکتهای بهینه در دوز و مات، خطاهایی دارد.
4. پژوهشگران چگونه تواناییها و محدودیتهای GPT-4 را به نمایش گذاشتند؟
نیکولاس کارلینی، یک پژوهشگر در گوگل دیپمایند، یک آزمون ایجاد کرد تا تواناییهای قابل توجه و محدودیتهای سرگرمکننده GPT-4 را نشان دهد. این آزمون شامل چالشهای Wordle و بازی دوز و مات بود.
5. GPT-4 در مطالعهای انجام شده توسط بوستون کنسالتینگ گروه (BCG) چگونه عملکرد کرد؟
این مطالعه نشان داد که مشاوران مدیریت مجهز به GPT-4 در وظایف مختلفی مانند ایجاد ایدههای محصول، تجزیه و تحلیل نمودارهای بازار و نوشتن اطلاعیههای مطبوعاتی، عملکرد بهتری نسبت به همکاران بدون این ابزار را داشتند. آنها کار بیشتری را با کیفیت بالاتر و در زمان کمتر انجام دادند.
6. GPT-4 در همه وظایف مطالعه موفق بود؟
خیر، یک وظیفه در مطالعه به طور عمدی طراحی شده بود تا GPT-4 را گیج کند و توصیههای استراتژیک بر اساس دادههای مالی و مصاحبه با کارمندان را ارائه دهد. این مدل با این وظیفه سختی داشت و اغلب توصیههای ضعیفی را ارائه م
The source of the article is from the blog cheap-sound.com