سماعات رأس مبتكرة مدعومة بالذكاء الاصطناعي يمكنها عزل الأصوات الفردية في البيئات الصاخبة

قدم باحثون من جامعة واشنطن قفزة هامة في تكنولوجيا الصوت عن طريق تطوير سماعات رأس تستخدم الذكاء الاصطناعي لعزل صوت الشخص في وسط الضجيج. تكمن جديّة هذا النظام في قدرته على تصفية صوت متحدث معين من الضجيج الخلفي، مما يعزز بشكل كبير تجربة الاستماع في البيئات الصاخبة.

يتكون العملية الابتكارية من:

التعرف: يمكن للمستخدمين الذين يرتدون السماعات القياسية المجهزة بميكروفونات أن ينظروا ببساطة إلى الشخص الذي يرغبون في التواصل معه والضغط على زر لبدء العملية.

التعلم: تلتقط الميكروفونات أمواج الصوت بينما يتعلم النظام الذكاء الاصطناعي التعرف على توقيع الصوت الفريد والتمييز عنه.

العزل: بعد ذلك، يتم قمع جميع الأصوات المحيطة الأخرى، تاركًا المستمع بالصوت المحدد فقط، بغض النظر عن الحركة أو التغيير في النظر.

على الرغم من أن التكنولوجيا المسماة “سماعة الاستماع لصوت الهدف” (TSH) لا تزال قيد التطوير، إلا أنها أظهرت نتائج مشجعة. خلال الاختبارات التي شملت 21 مشتركًا، أبلغ المشاركون عن تحسين بتقريب رؤية الصوت بمقدار ما يقرب من ضعف الوضوح بالصوت المعزول مقارنة بالصوت الخام.

حاليًا، يمكن لـ TSH التركيز على متحدث واحد في كل مرة ويعمل بكفاءة عندما لا تكون هناك أصوات عالية تنافسية من نفس الاتجاه. مع ذلك، فإن فريق البحث يعمل جاهدًا على تعزيز إمكانياته لدعم ليس فقط السماعات الرأسية بل أيضًا سماعات الأذن وأجهزة السمع.

تتنوع التطبيقات المحتملة لهذا الاختراع بشكل كبير، بدءًا من إجراء محادثات في الأماكن الصاخبة إلى الحضور في المحاضرات أو المؤتمرات. تعده المستقبل لتجارب سمعية أكثر وضوحًا وأكثر تخصيصًا. ومع استمرار التقدم، قد يعيد هذا النظام القائم على الذكاء الاصطناعي تعريف كيف نتفاعل مع الصوت في حياتنا اليومية.

أسئلة مفتاحية وإجاباتها:

س: كيف يساهم الذكاء الاصطناعي في عزل أصوات الأفراد باستخدام السماعات الرأسية؟
ج: الذكاء الاصطناعي يساهم بتعلم التعرف على توقيع الصوت الفريد للشخص بناءً على أمواج الصوت التي تلتقطها سماعات الرأس المجهزة بالميكروفون. ثم يعزل هذا الصوت المحدد عن الضوضاء الخلفية.

س: ما هي بعض التطبيقات المحتملة لهذه التكنولوجيا؟
ج: تشمل التطبيقات تعزيز التواصل في البيئات الصاخبة، ومساعدة الأشخاص ذوي صعوبات في السمع، وتحسين وضوح المحاضرات والمؤتمرات، وتقديم تجربة صوتية شخصية في مختلف الإعدادات مثل وسائل النقل العامة والأماكن المزدحمة.

س: هل هناك أي قيود على تكنولوجيا TSH الحالية؟
ج: تتضمن القيود الحالية القدرة على عزل متحدث واحد فقط في كل مرة وتقليل الفعالية في البيئات حيث يكون هناك ضوضاء عالية تأتي من نفس الاتجاه الذي يتحدث منه المتحدث.

تحديات مفتاحية أو جدلية:

متحدثون متعددون: يظل فصل الأصوات المتداخلة متعددة تحديًا كبيرًا لعزل الصوت بواسطة الذكاء الاصطناعي. يجب على التطورات المستقبلية التصدي لكيفية التعامل مع التقنية في الحالات التي تتضمن متحدثين متعددين يتحدثون في نفس الوقت.

مخاوف الخصوصية: حيث يتم تدريب الميكروفونات ونظم الذكاء الاصطناعي على تعرف ومعالجة الأصوات، قد تكون هناك تأثيرات خصوصية تحتاج إلى معالجتها، خاصة فيما يتعلق بالتسجيل ومعالجة البيانات.

الدقة في البيئات المتنوعة: يظل ضمان عمل التكنولوجيا بشكل موثوق في مجموعة متنوعة من البيئات الصوتية تحديًا.

المزايا:

مساعد التواصل: تعتبر هذه التكنولوجيا مفيدة بشكل خاص للأشخاص ذوي الإعاقات السمعية، مما يوفر إمكانية فهم أفضل للمحادثات في الأماكن المزدحمة.

تحسين التركيز: يمكن أن تساعد قدرة عزل الصوت أي شخص يحاول التركيز على محادثة معينة أو مصدر صوت دون أن يتشتت بسبب الضوضاء المحيطة.

توافق متعدد الأجهزة: تعمل الخطط المستقبلية على دمج هذه التكنولوجيا في أجهزة صوتية مختلفة، بما في ذلك أجهزة السمع، مما يوسع نطاق استخدامها المحتمل.

العيوب:

التعقيد والتكلفة: قد تزيد تطوير تكنولوجيا متقدمة مثل هذه من تعقيدات وتكاليف السماعات الرأسية للمستهلك وأجهزة الصوت المماثلة.

الاعتماد على إشارات بصرية: قد تحد من ضرورة المستخدمين النظر إلى الشخص الذي يرغبون في سماعه قدرتها في الأماكن التي قد لا يكون فيها الاتصال بالعين ممكنًا أو اجتماعيًا مناسبًا.

وظائف محدودة في بعض البيئات: لم تكن التكنولوجيا فعالة بشكل كامل بعد في جميع البيئات الصاخبة، خاصة حيث يتحدث عدة أشخاص من نفس الاتجاه.

للمزيد من المعلومات حول هذا الموضوع، يُرجى زيارة:
جامعة واشنطن

Privacy policy
Contact