Improviģ access to hyperlocal information in rural communitiesUzlabojot piekļuvi hiperlokalai informācijai lauku kopienās

Starptautiskās informācijas tehnoloģiju institūta Bangalore (IIIT-B) pētnieku un studentu komanda ir izstrādājusi meklēšanas saskarni, kas veicina piekļuvi hiperlokalai informācijai lauku kopienām. Šī iniciatīva ir vērsta uz problēmu risināšanu, ar ko saskaras cilvēki, kas dzīvo ārpus pilsētas un kuriem informācijas piekļuve ir ierobežota salīdzinājumā ar pilsētas iedzīvotājiem, kam ir viegla piekļuve zināšanām.

Lauku kopienas bieži uzticas sabiedriskajai radio, vietējiem laikrakstiem un brīvprātīgo organizācijām, lai iegūtu informāciju, kas attiecas uz to teritoriju. Tomēr šo entitāšu ražotās zināšanas parasti ir lokalizētas un nav pieejamas internetā, tādējādi cilvēkiem ir grūti vēlāk atgūt informāciju. Turklāt, valodas barjeras vēl vairāk apgrūtina piekļuvi informācijai.

Lai risinātu šīs problēmas, IIIT-B komanda izstrādāja meklēšanas saskarni, kas saucās Graama-Kannada Audio Search, un tā ir speciāli izstrādāta ikdienas valodas audio saturam Kannada valodā. Saskarne lietotājiem ļauj meklēt un piekļūt hiperlokālai informācijai audio formātā no Tumakuru reģiona. Komanda sadarbojās ar Namma Halli Radio, kopienas īpašumā esošo Wi-Fi rādiostaciju, kuru pārvalda Janastu nevalstiskā organizācija Tumakuru reģionā, lai iekļautu viņu audio korpusu meklēšanas modelī.

Izmantojot automātiskās runas atpazīšanas (ASR) modeļus, Namma Halli Radio audio tika pārrakstīta teksta formātā. Kad lietotājs meklē konkrētu atslēgas vārdu, pārrakstītais teksts tiek salīdzināts, lai nodrošinātu rezultātus audio formātā. Saskarnē atbalstītas meklēšanas operācijas gan Kannada, gan angļu valodā, un audio rezultāti ir laika zīmju papildināti, lai precīzi norādītu atslēgas vārda atrašanās vietu.

Iekļaujot ikdienas dialektus valodas modeļos, piemēram, Graama Kannadā, kas ir apmācīti ar datiem no kopienas radio audio korpusa, komanda mēģina risināt lielo valodas modeļu ierobežojumus, kas bieži nespēj atspoguļot cilvēku populācijas heterogenitāti.

Lai arī šobrīd lietojumprogramma atbalsta tikai tekstveida meklēšanu, komanda plāno iekļaut arī audio meklēšanu nākotnē. Tas ļautu lietotājiem veikt balss meklēšanu, izmantojot Tumakuru dialekta vai citus reģionālos dialektus, tādējādi uzlabojot informācijas pieejamību lauku kopienām.

Meklēšanas saskarne, papildus sniedzot atbalstu kopienas locekļiem, arī dod ieskatu vispārējai sabiedrībai, lai iegūtu informāciju par reģionālajām kultūrām un vietējo informāciju par Tumakuru reģionu. Tīmekļa lietojumprogramma piedāvā visvairāk meklēto vārdu sarakstu, kas sniedz norādes par korpusu un atvieglo saprašanu tiem, kas maz zina par šo kopienas.

Kopienas radio audio pārveidošana par tekstiem bija būtisks izaicinājums komandai. Tomēr, ieviešot uzlabotas ASR modeļus, piemēram, OpenAI Whisper un Meta daudzvalodu modeli, komanda sasniega labākus rezultātus. Viņi arī risināja problēmu saistībā ar transkripcijas rakstīšanas kļūdām, ieviešot atvieglotu kritēriju meklētās frāzes salīdzināšanai.

Šīs meklēšanas saskarnes izstrāde ir būtisks solis uz priekšu, uzlabojot piekļuvi hiperlokalai informācijai lauku kopienās. Savienojot lokalizēto zināšanu un digitālo pieejamību, šī iniciatīva dod lauku iedzīvotājiem iespēju iegūt vērtīgu informāciju, kas agrāk nebija pieejama.

The source of the article is from the blog macholevante.com

Privacy policy
Contact