به سوی یادگیری ماشین پیشرفته، اخیراً اپل مجموعه ای از مدل های زبان AI خود را به نام OpenELM معرفی کرده است. این مدل ها برای فشرده سازی طراحی شدهاند تا بتوانند بر روی تلفن های هوشمند کار کنند – بعدی جدیدی از هوش مصنوعی را به صورت مستقیم در دستان کاربران بیاورند. به عنوان یک قسمت از مجموعه OpenELM، اپل مدل هایی با سطوح پیچیده مختلف ارائه می دهد که قادرند به طور کارآمد و سریع وظایف درک زبان را انجام دهند.
مدل های OpenELM تحت مجوز کد نمونه اپل در دسترس قرار گرفته اند، که نشان از آگاهی از مدل های AI سنگین سنتی است که به ایجاد مراکز داده مبتنی بر ابر احتیاج دارند. به جای اینکه ارائه دهندگان خدمات ابر باشند، اینها به امکان آینده ابزارهای AI بر روی دستگاه اپل می انجامند. این مدل ها به دو گروه تقسیم می شوند: برخی از آنها “پیش آموزش دیده” هستند در حالی که برخی دیگر برای وظایف مبتنی بر دستورات تخصصیتر هستند که مفید برای ایجاد دستیاران و ربات های گفتگویی AI هستند. در زیر لیستی از مدل های آنها را مشاهده میکنید:
- OpenELM-270M
- OpenELM-450M
- OpenELM-1_1B
- OpenELM-3B
- OpenELM-270M-Instruct
- OpenELM-450M-Instruct
- OpenELM-1_1B-Instruct
- OpenELM-3B-Instruct
اندازه این مدل ها از 270 میلیون تا 3 میلیارد پارامتر متغیر است و هر توکن قسمتی از داده هایی را که مدلها باید تفسیر کنند را نشان میدهد. به عکسالعملی که شرکتهای دیگر مدلهای AI با تعداد پارامترهای بسیار بیشتری راه انداخته اند و این به شکل سنتی به موضوع پیچیدگی و قدرت مدلها اشاره داشت. با این حال، هدف اپل این بوده است که مدلهای فشرده ایجاد کند که عملکرد را فدا نکنند.
علاوه بر این، رویکرد توسعهی اپل برای OpenELM بر روی “استراتژی مرحلهای لایه ها” تمرکز دارد. این روش گزارهای است که پارامترها را به صورت موثرتری توزیع می کند، بنابراین عملکرد را افزایش می دهد در حالی که منابع محاسباتی را صرفه جویی می کند. بر مبنای کاغذ سفید اپل، این باعث بهبود قابل ملاحظهای در دقت مدل های زبان کوچک موجود شده است.
اپل نه تنها مدل های OpenELM را معرفی کرده است بلکه کد اصلی CoreNet نیز را به اشتراک گذاشته است، و دستورات آموزشی که استفاده شده است منتشر کرده است، این موضوع به تکرار پذیری – حرکتی در جهت شفافیت در زمینه مدل های زبان بزرگ است. منتشر کردن این اطلاعات به ارائه معامله به جامعه تحقیقات مفتوح هدفمند است، اگرچه اپل در مورد محدودیت های ذاتی موجود در زیر سازمان های دادههای عمومی که ممکن است در خروجی ها نهادینه ن اقتصادی یا نادرستی ها را نشان دهند احتیاط می کند.
اگرچه این مدل ها هنوز به دستگاه های مصرفی اصلی اپل انتقال نیافتهاند، اما نشانه های قوی بر این است که به روزرسانی های آینده ممکن است از پردازش بر روی دستگاه برای افزایش حریم خصوصی کاربر استفاده کند – که نشان دهنده ارتقاء نزدیک و مهم در توانایی های هوش مصنوعی اپل می باشد.
سوالات کلیدی و پاسخ ها:
– OpenELM چیست؟
OpenELM یک مجموعه از مدل های زبان AI است که توسط اپل طراحی شدهاند و به اندازه کافی فشرده هستند تا بتوانند بر روی تلفن های هوشمند کار کنند، به منظور کار کردن به صورت کارآمد در وظایف درک زبان.
– چرا اپل به مدلهای کوچک AI مانند OpenELM گذار می کند؟
حرکت اپل به سمت مدل های کوچک AI، مانند مدلهای OpenELM، به منظور یکپارچه سازی ابزارهای هوش مصنوعی کارآمد به صورت مستقیم بر روی دستگاه ها است که می تواند حریم خصوصی کاربران را ارتقا دهد و وابستگی کمتری به محاسبات بر اساس ابر.
چالشهای کلیدی و اختلافات:
یک چالش بالقوه برای OpenELM اپل تعادل بین اندازه مدل و عملکرد است. سنتیاً مدلهای بزرگ تر به عنوان قدرتمندتر در نظر گرفته شده اند. رویکرد اپل بر تولید مدلهای کوچکتری تمرکز دارد که عملکرد را کم نکنند. اما رسیدن به این هدف ممکن است به لحاظ فنی چالشی باشد و جوامع تحقيقات هوش مصنوعی ممکن است این مدل ها را مورد معاینه قرار دهند تا ببینند آیا کارآیی آنها با کسانی که حداقل بازه های نهایی داده بیشتری دارند، همخوانی دارد یا نه.
یک اختلاف دیگر مربوط به مدلهای زبان AI به بایاس و مسائل اخلاقی مربوط میشود. خود اپل هشدار می دهد که از آنجا که این مدل ها بر روی دادههای منبع عمومی تمرین می شوند، بایاس ها و نادقنیه ها ممکن است در خروجی ها نشان داده شوند. این موضوع مرکز بحث اخلاقیات هوش مصنوعی است و چگونگی مدیریت این بایاسها توسط اپل یا دیگران به عنوان یک نقطه بحث درون صنعت باقی خواهد ماند.
مزایا و معایب:
مزایا:
– کارآمدی: مدل های جمع و جور OpenELM به پردازش بر روی دستگاه کاربر اجازه می دهد که به زمان پاسخ سریع تری و کاهش انتقال داده به ابر منجر شود.
– حریم خصوصی کاربر: با پردازش داده ها به صورت مستقیم بر روی دستگاه کاربر، کمترین اطلاعات شخصی باید به سرورهای دور ارسال شود، که حریم خصوصی را افزایش می دهد.
– شفافیت: به اشتراک گذاری اپل از کد اصلی CoreNet، همراه با دستورات آموزش قابلیت شفافیت و تکرار پذیری در توسعه هوش مصنوعی را ترویج می کند.
معایب:
– محدودیت های عملکرد: مدل های جمع و جور ممکن است محدودیت هایی در پیچش و عمق درک نسبت به مدل های بزرگ تر داشته باشند که ممکن است بر کیفیت پاسخ های هوش مصنوعی تأثیرگذار باشد.
– محدودیت منابع: پردازش بر روی دستگاه نیازمند این است که سخت افزار دستگاه برای پردازش های کافی برخوردار باشد که شاید برای دستگاه های قدیمی صادق نباشد.
– بایاس های ممکن: مانند همه مدل های هوش مصنوعی، مدل های موجود در مجموعه OpenELM با توجه به داده های آموزشی به بایاس های موجود ارث برده می تواند که ممکن است منجر به پیامدهای ناهمساخته و اشتباه شود.
برای کسانی که به آموزش درباره نوآوری های اپل در زمینه هوش مصنوعی و کاربردهای آن علاقهمند هستند، می توانند به وب سایت رسمی اپل به آدرس Apple مراجعه کنند. لطفاً توجه داشته باشید که احتمالاً اپل پیوند مستقیمی به اطلاعات OpenELM روی صفحه اصلی خود ندارد و جزئیات خاص ممکن است از طریق اخبار و به روز رسانی های فناوری درون سایت پیدا شوند.
The source of the article is from the blog kewauneecomet.com