منهجية جديدة للتحكم في المركبات الجوية الذاتية الطائرة

تقنية المركبات الجوية الذاتية الطائرة (AAVs) قد غيرت العديد من الصناعات، بدءًا من اللوجستيات وصولاً إلى الزراعة، من خلال تمكين خدمات التوصيل الفعالة وفحوصات البنية التحتية. ومع ذلك، فإن المهمة المعقدة للتحكم في المركبات الجوية الذاتية لا تزال تواجه تحديات، حيث تتطلب التنسيق الدقيق بين عدة وحدات تحكم والتكيف مع الاضطرابات غير المتوقعة.

لتبسيط عملية التحكم وتوفير حلاً أكثر تطبيقية، قام الباحثون بأبحاث في إمكانية التعلم العميق للتعزيز في حل مشكلة التحكم في المركبات الجوية الذاتية. بينما توضح هذه النهج الفعالية في المحاكاة الحاسوبية، إلا أن نقلها إلى سيناريوهات العالم الحقيقي كان صعبًا بسبب عوامل مثل عدم الدقة في النماذج والاضطرابات.

في الآونة الأخيرة، اقترح فريق من المهندسين في جامعة نيويورك حلاً مبتكراً يمكن أن يمكّن التحكم الموثوق في المركبات الجوية الذاتية من خلال خوارزميات التعلم بالتعزيز. قاموا بتطوير شبكة عصبية تم تدريبها لتحويل القراءات الحسية مباشرةً إلى سياسات التحكم في المحرك. وبشكل مدهش، أظهرت هذه النظام الجديدة قدرات التحكم الدقيق بعد مرور 18 ثانية فقط من التدريب على جهاز كمبيوتر عادي. وعلاوة على ذلك، يمكن للخوارزمية المدربة تنفيذها في الوقت الحقيقي على متحكم منخفض الطاقة.

استخدم الفريق نظاماً ممثلاً – نقادياً لتدريب عامل التعلم بالتعزيز. حيث يقوم العامل بتحديد الإجراءات بناءً على حالة البيئة الحالية، في حين يقوم الناقد بتقييم هذه الإجراءات وتزويد ردود الفعل. يمكن لهذا العملية التكرارية تمكين العامل من تحسين قدرات اتخاذ القرار.

بينما تم تدريب النموذج في بيئة محاكاة، اتخذ الباحثون خطوات إضافية للتعامل مع تحديات التطبيق في العالم الحقيقي. قاموا بإدخال ضوضاء في قراءات الحساسات لمعالجة العيوب في العالم الحقيقي واستخدموا التعلم البرنامجي للتعامل مع السيناريوهات المعقدة. من خلال تزويد هندسة العامل-الناقد بمعلومات إضافية مثل سرعات المحرك الفعلية، تم تعزيز دقة النموذج.

للتحقق من نهجهم، نشروا النموذج المدرب على Crazyflie Nano Quadcopter مع متحكم onboard. قدم خوارزمية التعلم بالتعزيز خطة طيران مستقرة بنجاح، مما يدل على فائدتها في العالم الحقيقي.

لقد أتاح الباحثون رمز المشروع بالكامل لفرق البحث الأخرى بهدف تقدم تكنولوجيا AAV أكثر. مع هذا النهج الجديد، يمكن أن يصبح التحكم في المركبات الجوية الذاتية أكثر توجيهاً وقابلية للتكيف، مما يفتح الباب أمام إمكانات الرحلة الذاتية بأكملها.

الأسئلة المتداولة (FAQs)

1. ما هي المركبات الجوية الذاتية الطائرة (AAVs)؟
المركبات الجوية الذاتية الطائرة (AAVs) هي طائرات يمكنها التشغيل بدون تدخل بشري. قد غيرت العديد من الصناعات من خلال تمكين خدمات التوصيل الفعالة وفحوصات البنية التحتية.

2. ما هي التحديات المرتبطة بالتحكم في المركبات الجوية الذاتية الطائرة؟
التحكم في المركبات الجوية الذاتية الطائرة مهمة معقدة تتطلب التنسيق الدقيق بين وحدات التحكم المتعددة والتكيف مع الاضطرابات غير المتوقعة. تجعل عدم الدقة في النماذج والاضطرابات تحقيقها في العالم الحقيقي تحدياً.

3. ما هو التعلم العميق للتعزيز؟
التعلم العميق للتعزيز هو نهج يستخدم الشبكات العصبية لتدريب الخوارزميات على اتخاذ قرارات استنادًا إلى ردود الفعل من البيئة. وقد أظهر نجاحًا في المحاكاة الحاسوبية.

4. ما هو الحل الذي اقترحه المهندسون في جامعة نيويورك للتحكم في المركبات الجوية الذاتية الطائرة؟
قام المهندسون بتطوير شبكة عصبية تحوّل القراءات الحسية مباشرةً إلى سياسات التحكم في المحرك. استخدموا خوارزميات التعلم العميق للتعزيز ومنهجية الممثل-الناقد لتدريب النظام.

5. كم من الوقت استغرق تدريب الشبكة العصبية؟
أظهرت الشبكة العصبية قدرات دقة التحكم بعد مرور 18 ثانية فقط من التدريب على جهاز كمبيوتر عادي.

6. كيف عالج الباحثون تحديات تطبيقها في العالم الحقيقي؟
ضمن الباحثون ضوضاء في قراءات الحساسات للتعامل مع العيوب في العالم الحقيقي واستخدموا التعلم البرمجي للتعامل مع السيناريوهات المعقدة. كما قدموا معلومات إضافية مثل سرعات المحرك لتعزيز دقة النموذج.

7. كيف قام الباحثون بالتحقق من نهجهم؟
نشروا النموذج المدرب على Crazyflie Nano Quadcopter مع متحكم مدمج. خطط طيران الخوارزمية التعلم بالتعزيز أظهرت نجاحًا في العالم الحقيقي.

8. هل رمز المشروع متاح لفرق البحث الأخرى؟
نعم، رته إتاحة رمز المشروع بالكامل لفرق البحث الأخرى بهدف تقدم تكنولوجيا AAV أكثر.

المصطلحات:
– المركبات الجوية الذاتية الطائرة (AAVs): طائرات يمكنها التشغيل بدون تدخل بشري.
– التعلم العميق للتعزيز: نهج يستخدم الشبكات العصبية لتدريب الخوارزميات على اتخاذ قرارات استنادًا إلى ردود الفعل من البيئة.
– منهجية الممثل-الناقد: منهجية تدريبية حيث يحدد الـ”ممثل” الإجراءات بناءً على حالة البيئة الحالية، بينما يقيّم الـ”ناقد” هذه الإجراءات ويوفر ردود الفعل.

روابط ذات صلة:
– جامعة نيويورك
– Crazyflie Nano Quadcopter

The source of the article is from the blog klikeri.rs

Privacy policy
Contact