إطار جديد لتسريع إنتاج الصور باستخدام نماذج الانتشار بخطوة واحدة

يقدم إطار DMD الذي قام به باحثون في مختبر علوم الكمبيوتر والذكاء الاصطناعي في MIT طريقة جديدة لوظيفة نماذج الانتشار في مجال الذكاء الاصطتناعي. على عكس الأساليب السابقة التي اعتمدت على التحسين التدريجي، يبسط DMD العملية المتعددة الخطوات إلى خطوة واحدة، مما يقلل بشكل كبير من الوقت الحسابي مع الحفاظ على جودة المحتوى البصري المولد. هذه الابتكارات لها القدرة على تعزيز أدوات التصميم، وتسريع عمليات إنشاء المحتوى، والتفوق على الصناعات مثل اكتشاف الأدوية ونمذجة الثلاثية الأبعاد.

إطار DMD يستخدم نموذج المعلم-الطالب، حيث يتعلم النموذج الكمبيوتري الجديد تقليد سلوك النماذج الأصلية الأكثر تعقيدًا. يدمج هذا النموذج خسارة الانحدار لتثبيت عملية التدريب وخسارة تطابق التوزيع لضمان أن الصور المولدة تتوافق مع تردديات حدوث الواقع. من خلال استغلال معرفة نموذجي انتشار، يقوم DMD بتقطير تعقيد النماذج الأصلية إلى واحدة أبسط وأسرع، تتجاوز المشاكل الشائعة مثل عدم الاستقرار وانهيار النمط.

سرعة وكفاءة إطار DMD تفوق نماذج الانتشار السابقة مثل Stable Diffusion و DALLE-3، حيث يقوم بتوليد الصور بسرعة تصل إلى ٣٠ مرة. ومع ذلك، هناك قيود ما زالت تحتاج للنظر فيها. جودة الصور المولدة تعتمد على قدرات النموذج المعلم المستخدم خلال عملية التقطير. قد تواجه تقديم النصوص التفصيلية والوجوه الصغيرة تحديات، ولكن يمكن التغلب على هذه القيود بواسطة تقدمات في نماذج المعلم المتقدمة.

تبعث إمكانات إطار DMD على الكثير من الروعة. يمكنه تسريع إنشاء المحتوى وتحسين أدوات التصميم. يمكن لصناعات مثل اكتشاف الأدوية ونمذجة الثريات الأبعاد الاستفادة من العمليات الأسرع والأكثر فعالية. الجمع بين مرونة وجودة العالية لنماذج الانتشار مع أداء شبكات GAN يفتح آفاقًا جديدة لتحرير الصور بشكل فوري.

تم عرض عمل فريق البحث حول إطار DMD في مؤتمر الرؤية الحاسوبية والتعرف على الأنماط، مما يشير إلى تطوره السريع في مجال الإنتاج البصري.

أسئلة شائعة

The source of the article is from the blog oinegro.com.br

Privacy policy
Contact