باز کردن رمز کد سگی با هوش مصنوعی
پژوهشگران از دانشگاه میشیگان همراه با همکاران خود از مؤسسه ملی فوتونیک، نوری، و الکترونیکها (INAOE) در مکزیک، گامهای موفقیتآمیزی را با یک ابزار هوش مصنوعی برای تفسیر ووو و خروشهای سگان پیش میبرند. این ابزار بامیتوانستن به طور پتنسیلی نوآورانه، نه تنها بین وووهای شاداب و خروشهای خشن تفاوت قائل شود بلکه ویژگیهایی همچون سن، نژاد، و جنسیت سگها را از صداهای تولیدشدهٔ آنها شناسایی کند.
تیم تحقیقات از مدلهای AI موجود در شناسایی صدایی و توصیف، که ابتدا بر روی صداهای انسانها آموزش داده شدهاند، برای استخراج دانشهای معنیدار از صداییهای غربلک سگان استفاده کردند. این رویکرد نوآورانه امکاناتی جدید برای کاربردهای جدید فناوریپردازی صحبت را برای درک دقیق تیوهای ووو سگان فراهم میکند، به گفتهٔ رادا میهالچها، استاد علوم رایانه و مهندسی و رئیس آزمایشگاه AI دانشگاه میشیگان.
غلبه بر چالشها: راه به انتخاب دادههای صوتی
تیم با چالشهای اولیه از جمله کمبود دادههای صوتی دربارهٔ خرسان سرکار داشت. با توجه به این، آنها وووها از 74 سگ مختلف را با نژاد، سن، و جنسیتهای مختلف ضبط کردند. این ضبطها سپس توسط Wav2Vec2، یک مدل تشخیص خودکار صدا توسعه یافته توسط Meta، تجزیه و تحلیل شدند.
نتایج خوب و امکانات آینده
نتایج انگیزه آور بهسرعت بروز آمد: Wav2Vec2 این وضوحهای صوتی خرسی را به 4 دستهٔ مختلف تقسیم کرد و دقت بالاتری از سایر مدلهای بویژهٔ آموزش دیده شده بر روی صداهای سگی جلب کرد، با دقت تا 70٪. رادا میهالچها این را به عنوان نخستین باری اعلام کرد که تکنیکهای تجزیه و تحلیل گفتار انسان به موفقیتآمیزی در برقراری ارتباط با جانداران و بویژهٔ ارتباطات حیوانات اعمال شدهاست.
هرچند این تحقیق همچنان در مراحل ابتدایی خود است، اما به یک آیندهای اشاره میکند که زبان حیوانی میتواند رمزگشایی شود. این پیشرفت دارای بزرگترین مزایای بالقوه برای زیستشناسان و صاحبان سگ است. انسانها با درک جزئیات وووهای سگی، ممکن است به بهبود درک و تامین نیازهای عاطفی و جسمانی همدستانپا،، بهبودی در زندگی دوستانهٔ بهتر سگان خود برسانند.
این ابزار هوش مصنوعی در حال توسعه برای درک ارتباطات سکویی، یک تلاقی جذاب از فناوری، رفتار حیوانی و بیو آکوستیک میباشد. برای ارائهٔ بیشترین زمینهای، اینجا بعضی واقعیتها و دانشهای مرتبط آورده شده است:
سوالات و پاسخهای مهم:
1. اهمیت درک برقیصدایی سگان چیست؟
درک برقیصدایی سگان میتواند ارتباط بین انسان و سگ را برای آموزش و تغییر رفتار سگان بهبود بخشد و نیز میتواند در درک و غلبه بر نیازهای عاطفی و جسمانی آنان به بهتری کمک کند. همچنین میتواند در شناسایی نشانههای نگرانی یا بیماری در ابتداییترین مراحل کمک کند.
2. تکنولوژی AI چگونه بین مختلف برقیصدایی سگان تشابه قائل میشود؟
تکنولوژی AI از روشهای الگوریتمی استفاده میکند که پیشتر در تشخیص گفتار انسانها به کار رفتهاند و آنها را به منظور توجیه فرکانس صدا، الگو، حجم، و تنظیم صداهای برقی تنظیم میکند.
چالشها یا چالشها کلیدی:
– جمعآوری دادههای کیفیت کافی: به دست آوردن مجموعه دادههای بزرگ و متنوع از برقیصدایی سگان با کیفیت بالا یک چالش عمده است. سگان متنوعی از نژادها دارند که هر کدام احتمالا ویژگیهای صوتی یکتا را دارند و برقیصدایی آنها ممکن است توسط محیط تحت تأثیر عمل بوده که تجمیع دادهها را پیچیده میکند.
– انسانگرایی: ممکن است اختلاف نظری بر سر تفسیر احساسات و نیتهای حیوانات بر اساس استانداردهای انسانی، تحت عنوان انسانگرایی، وجود داشته باشد که ممکن است منجر به تفسیرات غلط گردد.
– نگرانیها در مورد حفظ حریم خصوصی: ضبط و مورد تحلیل قرار دادن وووهای سگهای خانگی به سوالات مطرح در مورد حریم خصوصی و نیاز به موافقت از صاحبان حیوان پرداختهاست.
مزیتها:
– ارتباط بهبود یافته: یک ابزاری که وووها را بتواند تفسیر کرد ممکن است منجر به ارتباط بهتر بین سگان و انسانها گردد، که منجر به مراقبت و آموزش بهتر میشود.
– رفاه حیوانی: درک علایم نگرانی میتواند در جلوگیری یا آدرسدهی به رنج حیوانات کمک نماید.
– بینشهای علمی: پژوهشگران میتوانند بینشهای ارزشمندی را در رفتارهای اجتماعی و ارتباطی سگان پیدا کنند که به زمینهای از شناخت حیوانات اضافه میشود.
معایب:
– اکالیسم بیش از اندازه بر تکنولوژی: وجود خطر اکالیسم بر تکنولوژی برای تفسیر احساسات سگان و تهمت به غافلاورداییهای طبیعی و رابطه طبیعی بین انسانها و سگان.
– خطرات تفسیر اشتباه: تکنولوژی ممکن است بدون در نظر گرفتن سیاق یا ژست بدنی رایهای پیچیده را نادرست تفسیر نماید.
– دسترسی به تکنولوژی: ابزار ممکن است برای همهٔ صاحبان سگ یا عملکردها موجود نباشد و این موضوع به تفاوتهایی در افرادی که میتوانند از این پیشرفتها بهره مند شوند، منجر شود.
برای کسانی که به اطلاعات مربوط به تحقیقات AI یا بیو آکوستیک علاقهمند هستند، منابع زیر ممکن است مفید باشند:
– دانشگاه میشیگان
– موسسه ملی فوتونیک، نوری، و الکترونیکها (INAOE)
این پیوندها به دامینهای اصلی از موسسات مربوطه در تحقیق، جایی که میتوان به صورت جزئی اطلاهت بیشتری دربارهٔ برنامهها و پیشرویهای تحقیقاتی آنها پیدا کرد، هدایت میکنند. با وجود این، اهمیتها به آن میدهد که پروژههای خاص یا توسعه این ابزار هوش مصنعی ممکن است به صورت مستقیم در صفحات اصلی آنها به نمایش درآورده نشود.