بهبود کارایی و سرعت در توسعه ML/AI

در دنیای پرسرعت توسعه هوش مصنوعی/یادگیری ماشین، اهمیت دارد که زیرساختی داشته باشیم که بتواند با تقاضاهای مهندسان ML هماهنگی داشته باشد. زمان ساخت آهسته و ناسازگاری‌ها در بسته‌بندی و توزیع فایل‌های اجرایی باعث کاهش بهره‌وری و هدر رفتن زمان ارزشمند می‌شود.

برای مقابله با این چالش‌ها، تیم ما به تدابیری عملی برای مقابله با ساخت آهسته و ناسازگاری در بسته‌بندی مراجعه کردیم که منجر به کاهش قابل توجه هزینه‌های اضافی و افزایش کارایی شد.

به جای وابستگی به نسخه‌های قدیمی که نیاز به ساختمان‌دهی و پیوند‌دهی تکراری داشت، ما تمرکز خود را بر کمینه‌سازی ساخت فایل‌های اجرایی با ساده‌سازی نمودار ساخت و بهینه‌سازی تعداد وابستگی‌ها گذاشتیم. این روش به طور قابل توجهی نیاز به ساختمان‏دهی گسترده را کاهش داده و سرعت کلی ساخت را بهبود بخشید.

یکی از موانع اصلی دیگری که با آن مواجه شدیم، بسته‌بندی و توزیع فایل‌های اجرایی بود. برای مقابله با این چالش، ما یک رویکرد تدریجی با استفاده از سیستم فایل قابل آدرس‌دهی محتوا (CAF) پیاده‌سازی کردیم. با اتخاذ رویکردی متأثر از محتوای CAF، این سیستم قادر است از برون‌ریزی‌های تکراری فایل‌هایی که در حافظه ذخیره محتوا قابل آدرس‌دهی (CAS) قرار دارند، عبور کند. این علاوه بر کاهش زمان بسته‌بندی، منجر به کاهش بار در هنگام دسترسی به فایل‌های اجرایی بزرگ نیز می‌شود.

برای افزایش کارایی سیستم CAF، ما شبکه دمونی‌های کمکی را در اکثر میزبان‌های مرکز داده‌مان راه‌اندازی کردیم. این دمون وظیفه نگهداری حافظه‌های محلی، تشکیل یک شبکه همتا به همراه سایر نمونه‌های دمون و بهینه‌سازی ارتباط با محتوا را برعهده دارد. با استفاده از این شبکه، ما می‌توانیم محتوا را مستقیماً از دیگر نمونه‌ها دریافت کنیم و از این راه، زمان تأخیر و ظرفیت پهنای باند ذخیره‌سازی را کاهش دهیم.

بر خلاف روش‌های سطح مبتنی بر لایه، مانند OverlayFS Docker، رویکرد ما بر دسترسی مستقیم به فایل و مسیریابی هوشمند متمایز تمرکز دارد. این امکان را به ما می‌دهد تا بتوانیم به طور کارآمد با وابستگی‌های متنوع در اجرایی‌های مختلف مدیریت نماییم بدون پیچیدگی سازمان لایه. به علاوه، با استفاده از Btrfs به عنوان سیستم فایل ما، از قابلیت‌های فشرده‌سازی و قابلیت نوشتن داده‌های ذخیره سازی فشرده به صورت مستقیم در قسمت‌ها بهره‌برداری می‌کنیم.

با مقابله با چالش‌های ساخت آهسته و ناسازگاری بسته‌بندی و توزیع فایل‌های اجرایی، ما مهندسان ML خود را قادر به کارآمدتر کار کردن و ارائه راه حل‌های نوآورانه کرده‌ایم. تمرکز ما بر کاهش ساختمانی مجدد، بهینه‌سازی مدیریت وابستگی و پیاده‌سازی یک روش بسته‌بندی تدریجی، منجر به صرفه‌جویی قابل توجه در زمان و بهبود بهره‌وری در فرآیند توسعه AI/ML شده است.

قسمت سوالات متداول:

س: چه چالش‌هایی توسط تیم در توسعه AI/ML مواجه شدند؟
ج: چالش‌هایی که تیم مواجه شده بود شامل زمان ساخت آهسته، ناسازگاری در بسته‌بندی و توزیع فایل‌های اجرایی و پیچیدگی مدیریت وابستگی‌های متنوع در اجرایی‌های مختلف بود.

س: تیم چگونه با ساختمان آهسته مقابله کرد؟
ج: تیم با ساده‌سازی نمودار ساخت و بهینه‌سازی تعداد وابستگی‌ها، ساخت آهسته را کاهش داد که منجر به بهبود کلی سرعت ساخت شد.

س: تیم چگونه به بسته‌بندی و توزیع فایل‌های اجرایی رسید؟
ج: تیم یک رویکرد تدریجی با استفاده از سیستم فایل قابل آدرس‌دهی محتوا (CAF) پیاده‌سازی کرد که برون‌ریزی‌های تکراری فایل‌هایی که در حافظه ذخیره محتوا قابل آدرس‌دهی (CAS) قرار دارند، را کاهش می‌دهد. این روش به طور همزمان باعث کاهش زمان بسته‌بندی و کاهش هزینه هنگام دسترسی به فایل‌های اجرایی بزرگ می‌شود.

س: هدف از استقرار دمون CAS در میزبان‌های مرکز داده چیست؟
ج: دمون CAS مسئول نگه‌داری حافظه محلی، تشکیل یک شبکه همتا با دیگر نمونه‌های دمون و بهینه‌سازی ارتباط با محتوا می‌باشد. این امکان را فراهم می‌کند تا به طور مستقیم از دیگر نمونه‌ها محتوا را دریافت کرده و باعث کاهش زمان تاخیر و ظرفیت پهنای باند ذخیره‌سازی شود.

س: تیم چگونه وابستگی‌ها را بدون پیچیدگی سازمان لایه مدیریت می‌کند؟
ج: در مقابل روش‌های سنتی، تیم بر دسترسی مستقیم به فایل و مسیریابی هوشمندی متمایز تمرکز می‌کند. این رویکرد امکان مدیریت کارآمد وابستگی‌های متنوع در اجرایی‌های مختلف را بدون پیچیدگی سازمان لایه فراهم می‌کند.

س: تیم از چه فایل سیستمی استفاده می‌کند و چه مزایایی دارد؟
ج: تیم از Btrfs به عنوان فایل سیستم خود استفاده می‌کند که از قابلیت فشرده‌سازی و توانایی نوشتن داده‌های ذخیره‌سازی فشرده به صورت مستقیم در قسمت‌ها بهره‌برداری می‌کند. این قابلیت‌ها کارایی و قابلیت‌های ذخیره‌سازی را بهبود می‌بخشد.

The source of the article is from the blog maltemoney.com.br