Слепота на изкуствен интелект към културното наследство: Маргинализация на езика Фон

В едно тревожно откритие Бонавентюр Досу срещна езикова грешка в добре известен модел на изкуствен интелект, който неправилно идентифицира фонския език, който се използва от милиони хора в Бенин и съседните райони, като измислен. Този провал на технологията е отговор на по-голям шаблон на пренебрежение, който Досоу забеляза, липсата на инструменти като Уикипедия на fon или помощни средства за превод за комуникация със сродници, говорещи на френски. Размишлявайки за преживяването, Досоу изрази дълбоко чувство за невидимост, наложена от технологията.

Издигането на английския език до глобално значение, подпомогнато от интернет и американското влияние, не е представено в целия глобален езиков пейзаж. Въпреки че английският доминира над половината от съдържанието в интернет, той остава чужд за над 80% от световното население, което оставя големи множества без основни цифрови инструменти като Google търсене или гласови асистенти.

Генеративните технологии на изкуствен интелект, които изискват масивни набори от данни и изчислителна мощ, имат потенциал да изолират още повече хора, говорещи на езици, различни от английски, като се базират предимно на английски текстове, извлечени от интернет. Тъй като мрежата е главно конструирана на само 10 езика, множеството други глобални езици, което включва приблизително 7 000 разновидности, срещат малка подкрепа от моделите на изкуствен интелект.

Само част от тези езици се поддържат от платформи като Google Преводак и генеративни платформи на Индустриално-изследователския институт, като указват на рязко падане на производителността извън популярните езици. Тази ексклузивност може, в крайна сметка, да отстрани изчезването на коренните езици като фонския и да спре младите поколения да запазят своето лингвистично наследство.

В усилие за компенсиране, изследователи като Досу и Ифе Адебара си сътрудничат с инициативи като Масахане, за да разработят инструменти на изкуствения интелект за езиците, които са подпомагани. Това глобално усилие се корени в изненада капацитет на изкуствения интелект да различи основни комуникативни елементи в различните езици, подпалващо надежда за по-инклузивно цифрово бъдеще. Въпреки тези усилия, пътят към инклузивността е труден, тъй като създаването на модели за по-малко общоприетите езици е трудоемко и изисква голямо количество специализирани данни и ресурси.

The source of the article is from the blog radardovalemg.com

Privacy policy
Contact