Културната слепота на ИИ: Маргинализацията на езика Фон

В един загрижен откритие, Бонавентур Досу се сблъска с лингвистическо пропускане в добре известен модел на изкуствен интелект, който неправилно идентифицира Фон езика, който се говори от милиони хора в Бенин и околностите, като измислен. Този провал на технологията отразява по-широко забелязани от Досу шаблон на пренебрегване, липсващи инструменти като Уикипедия на Фонски или помощни средства за превод при общуване с близките говорили френски. Спрямо полученото преживяване, Досу изрази дълбоко чувство за невидимост, причинена от технологията.

Възходът на английския към световна престижност, подпомаган от интернет и американското влияние, не е представен в глобалния лингвистичен пейзаж. Въпреки че английският доминира над половината от съдържанието в мрежата, той остава чужд за над 80% от световното население, което оставя големи множества без основни цифрови инструменти като Google търсене или гласови асистенти.

Генеративните технологии на изкуствен интелект, с нуждата си от големи множества от данни и изчислителна мощ, имат потенциал да изолират още повече хора, говорещи извън английски, като се базират основно на английски текстове, извлечени от интернет. Тъй като уебът е главно построен на само 10 езика, изобилството от други световни езици, които включват приблизително 7 000 разновидности, получава малка подкрепа от моделите на изкуствен интелект.

Само малка част от тези езици се поддържат от платформи като Google Преводач или генеративни платформи на изкуствен интелект като чатботовете на OpenAI, което показва рязко падане в представянето отвъд популярните езици. Тази ексклузивност може да превърне истински езици като Фон към забрава и да откаже по-младите поколения да запазят своето езиково наследство.

В контраманевър, изследователи като Досу и Ифе Адебара си сътрудничат с инициативи като Masakhane, за да разработят инструменти на изкуствения интелект за езици, които са подпомогнати. Този глобален опит е в основата на изненадващата способност на изкуствения интелект да различава основни комуникативни елементи между различни езици, залитайки надежда за по-голямо включване в цифровото бъдеще. Въпреки тези усилия, пътят към включването е труден, понеже създаването на модели за по-малките езици изисква много труд и изисква голямо количество специализирани данни и ресурси.

The source of the article is from the blog lokale-komercyjne.pl

Privacy policy
Contact