اپل محصول OpenELM را عرضه می‌کند: یک قدم مهم به سوی مدل‌های زبان هوشمند AI

به سوی یادگیری ماشین پیشرفته، اخیراً اپل مجموعه ای از مدل های زبان AI خود را به نام OpenELM معرفی کرده است. این مدل ها برای فشرده سازی طراحی شده‌اند تا بتوانند بر روی تلفن های هوشمند کار کنند – بعدی جدیدی از هوش مصنوعی را به صورت مستقیم در دستان کاربران بیاورند. به عنوان یک قسمت از مجموعه OpenELM، اپل مدل هایی با سطوح پیچیده مختلف ارائه می دهد که قادرند به طور کارآمد و سریع وظایف درک زبان را انجام دهند.

مدل های OpenELM تحت مجوز کد نمونه اپل در دسترس قرار گرفته اند، که نشان از آگاهی از مدل های AI سنگین سنتی است که به ایجاد مراکز داده مبتنی بر ابر احتیاج دارند. به جای اینکه ارائه دهندگان خدمات ابر باشند، اینها به امکان آینده ابزارهای AI بر روی دستگاه اپل می انجامند. این مدل ها به دو گروه تقسیم می شوند: برخی از آن‌ها “پیش آموزش دیده” هستند در حالی که برخی دیگر برای وظایف مبتنی بر دستورات تخصصی‌تر هستند که مفید برای ایجاد دستیاران و ربات های گفتگویی AI هستند. در زیر لیستی از مدل های آن‌ها را مشاهده می‌کنید:

OpenELM-270M
OpenELM-450M
OpenELM-1_1B
OpenELM-3B
OpenELM-270M-Instruct
OpenELM-450M-Instruct
OpenELM-1_1B-Instruct
OpenELM-3B-Instruct

اندازه این مدل ها از 270 میلیون تا 3 میلیارد پارامتر متغیر است و هر توکن قسمتی از داده هایی را که مدل‌ها باید تفسیر کنند را نشان می‌دهد. به عکس‌العملی که شرکت‌های دیگر مدل‌های AI با تعداد پارامترهای بسیار بیشتری راه انداخته اند و این به شکل سنتی به موضوع پیچیدگی و قدرت مدل‌ها اشاره داشت. با این حال، هدف اپل این بوده است که مدل‌های فشرده ایجاد کند که عملکرد را فدا نکنند.

علاوه بر این، رویکرد توسعه‌ی اپل برای OpenELM بر روی “استراتژی مرحله‌ای لایه ها” تمرکز دارد. این روش گزاره‌ای است که پارامترها را به صورت موثرتری توزیع می کند، بنابراین عملکرد را افزایش می دهد در حالی که منابع محاسباتی را صرفه جویی می کند. بر مبنای کاغذ سفید اپل، این باعث بهبود قابل ملاحظه‌ای در دقت مدل های زبان کوچک موجود شده است.

اپل نه تنها مدل های OpenELM را معرفی کرده است بلکه کد اصلی CoreNet نیز را به اشتراک گذاشته است، و دستورات آموزشی که استفاده شده است منتشر کرده است، این موضوع به تکرار پذیری – حرکتی در جهت شفافیت در زمینه مدل های زبان بزرگ است. منتشر کردن این اطلاعات به ارائه معامله به جامعه تحقیقات مفتوح هدفمند است، اگرچه اپل در مورد محدودیت های ذاتی موجود در زیر سازمان های داده‌های عمومی که ممکن است در خروجی ها نهادینه ن اقتصادی یا نادرستی ها را نشان دهند احتیاط می کند.

اگرچه این مدل ها هنوز به دستگاه های مصرفی اصلی اپل انتقال نیافته‌اند، اما نشانه های قوی بر این است که به روزرسانی های آینده ممکن است از پردازش بر روی دستگاه برای افزایش حریم خصوصی کاربر استفاده کند – که نشان دهنده ارتقاء نزدیک و مهم در توانایی های هوش مصنوعی اپل می باشد.

سوالات کلیدی و پاسخ ها:

– OpenELM چیست؟
OpenELM یک مجموعه از مدل های زبان AI است که توسط اپل طراحی شده‌اند و به اندازه کافی فشرده هستند تا بتوانند بر روی تلفن های هوشمند کار کنند، به منظور کار کردن به صورت کارآمد در وظایف درک زبان.

– چرا اپل به مدل‌های کوچک AI مانند OpenELM گذار می کند؟
حرکت اپل به سمت مدل های کوچک AI، مانند مدل‌های OpenELM، به منظور یکپارچه سازی ابزارهای هوش مصنوعی کارآمد به صورت مستقیم بر روی دستگاه ها است که می تواند حریم خصوصی کاربران را ارتقا دهد و وابستگی کمتری به محاسبات بر اساس ابر.

چالش‌های کلیدی و اختلافات:

یک چالش بالقوه برای OpenELM اپل تعادل بین اندازه مدل و عملکرد است. سنتیاً مدل‌های بزرگ تر به عنوان قدرتمندتر در نظر گرفته شده اند. رویکرد اپل بر تولید مدل‌های کوچکتری تمرکز دارد که عملکرد را کم نکنند. اما رسیدن به این هدف ممکن است به لحاظ فنی چالشی باشد و جوامع تحقيقات هوش مصنوعی ممکن است این مدل ها را مورد معاینه قرار دهند تا ببینند آیا کارآیی آن‌ها با کسانی که حداقل بازه های نهایی داده بیشتری دارند، همخوانی دارد یا نه.

یک اختلاف دیگر مربوط به مدل‌های زبان AI به بایاس و مسائل اخلاقی مربوط می‌شود. خود اپل هشدار می دهد که از آنجا که این مدل ها بر روی داده‌های منبع عمومی تمرین می شوند، بایاس ها و نادقنیه ها ممکن است در خروجی ها نشان داده شوند. این موضوع مرکز بحث اخلاقیات هوش مصنوعی است و چگونگی مدیریت این بایاس‌ها توسط اپل یا دیگران به عنوان یک نقطه بحث درون صنعت باقی خواهد ماند.

مزایا و معایب:

مزایا:

– کارآمدی: مدل های جمع و جور OpenELM به پردازش بر روی دستگاه کاربر اجازه می دهد که به زمان پاسخ سریع تری و کاهش انتقال داده به ابر منجر شود.
– حریم خصوصی کاربر: با پردازش داده ها به صورت مستقیم بر روی دستگاه کاربر، کمترین اطلاعات شخصی باید به سرورهای دور ارسال شود، که حریم خصوصی را افزایش می دهد.
– شفافیت: به اشتراک گذاری اپل از کد اصلی CoreNet، همراه با دستورات آموزش قابلیت شفافیت و تکرار پذیری در توسعه هوش مصنوعی را ترویج می کند.

معایب:

– محدودیت های عملکرد: مدل های جمع و جور ممکن است محدودیت هایی در پیچش و عمق درک نسبت به مدل های بزرگ تر داشته باشند که ممکن است بر کیفیت پاسخ های هوش مصنوعی تأثیرگذار باشد.
– محدودیت منابع: پردازش بر روی دستگاه نیازمند این است که سخت افزار دستگاه برای پردازش های کافی برخوردار باشد که شاید برای دستگاه های قدیمی صادق نباشد.
– بایاس های ممکن: مانند همه مدل های هوش مصنوعی، مدل های موجود در مجموعه OpenELM با توجه به داده های آموزشی به بایاس های موجود ارث برده می تواند که ممکن است منجر به پیامدهای ناهمساخته و اشتباه شود.

برای کسانی که به آموزش درباره نوآوری های اپل در زمینه هوش مصنوعی و کاربردهای آن علاقه‌مند هستند، می توانند به وب سایت رسمی اپل به آدرس Apple مراجعه کنند. لطفاً توجه داشته باشید که احتمالاً اپل پیوند مستقیمی به اطلاعات OpenELM روی صفحه اصلی خود ندارد و جزئیات خاص ممکن است از طریق اخبار و به روز رسانی های فناوری درون سایت پیدا شوند.

The source of the article is from the blog kewauneecomet.com