Революційні навушники з штучним інтелектом покращують конкретний голос в шумних середовищах

Розблокування потужності цілеспрямованого прослуховування за допомогою штучного інтелекту

Дослідники з Університету Вашингтона зробили стрибок у галузі аудіотехнологій, створивши навушники, які використовують штучний інтелект для посилення голосу певної людини у кімнаті. Ця інноваційна технологія, позначена як “Цілепокладене прослуховування мови”, пропонує покращене аудіо, фокусуючись на мові вибраної особи навіть у випадку, якщо вона виходить з поля зору.

Для активації цієї функції користувачам спочатку потрібно спрямувати свою увагу на динамік протягом кількох секунд, дозволяючи навушникам зафіксувати голос. Цей цілеспрямований підхід усуває загальне підсилення всіх звуків, ефективно відокремлюючи бажаний голос від фонового шуму.

Обмеження та майбутні поліпшення

Операція є складною і наразі не готова до комерційного випуску. Користувачам потрібно носити передові шумознежирні навушники, підключені до вбудованого комп’ютера, який обробляє та вдосконалює аудіосигнал. Система все ще має певну похибку, іноді плутаючи говорящих, що стоять поруч через свою 16-градусну толерантність.

Відгуки від осіб, які випробовували навушники, повідомляли про помітне покращення чіткості, деякі голоси звучали вдвічі чіткіше, ніж через стандартні пристрої. Хоча система наразі підтримує покращення лише одного голосу одночасно, подальший розвиток може призвести до розвитку дискримінації між кількома голосами та потенційної інтеграції з слуховими апаратами або бездротовими навушниками.

Вплив такої технології може бути трансформаційним, особливо в середовищах, де фоновий шум заважає комунікації, наприклад, під час публічних виступів або лекцій. При розробці команди дослідників продовжують вдосконалювати систему, майбутнє аудіопристроїв стає все більш обіцяючим.

Питання та відповіді:

Яка є мета технології “Цілепокладене прослуховування мови”?
Технологія спрямована на покращення аудіопрослуховування шляхом підсилення голосу певної особи і послаблення фонового шуму. Вона може бути особливо цінною в шумних середовищах, де сконцентруватися на мові однієї людини важко.

Що мають робити користувачі для активації функції?
Користувачам потрібно спрямовати свою увагу на динамік протягом кількох секунд, щоб дозволити навушникам зі штучним інтелектом зафіксувати голос, який вони хочуть підсилити.

Які наявні обмеження технології?
На даний момент система потребує використання шумознежирних навушників, підключених до вбудованого комп’ютера, і має певну похибку, яка може сплутувати говорящих, які знаходяться в непосредственній близькості через її 16-градусну толерантність.

Які можливі майбутні покращення?
Можливі покращення можуть дозволити технології одночасно розрізняти кілька голосів та інтегруватися з пристроями, такими як слухові апарати або бездротові навушники.

Щоб отримати додаткову інформацію про пов’язані технології та передові досягнення в обробці аудіо, ви можете відвідати ці основні домени:
– Інститут інженерів з електротехніки та електроніки (IEEE)
– Асоціація обчислювальної лінгвістики (ACL)
– Apple (відомий своїми досягненнями в споживчих аудіопродуктах)
– Sony (пропонує різноманітні аудіотехнології та продукцію)
– Bose (лидер у технологіях шумознежирних навушників)

Зверніть увагу, що важливо відвідувати вищезазначені веб-сайти, щоб переконатися, що надані посилання залишаються актуальними і відповідними, оскільки URL-адреси веб-сайтів можуть змінюватися або застарівати.

The source of the article is from the blog karacasanime.com.ve