농촌 지역에서 하이퍼로컬 정보 접근성 향상

국제정보기술연구소인 IIIT-B에서 연구원과 학생들로 구성된 팀이 농촌 지역 사회를 위해 하이퍼로컬 정보 접근을 용이하게 하는 검색 인터페이스를 개발했습니다. 이 이니셔티브는 도시 지역에 비해 정보 접근이 제한된 지역에서 살아가는 사람들이 직면한 도전을 극복하기 위한 것으로, 도시 주민들에 비해 지식에 쉽게 접근할 수 있는 도시 주민들과 달리, 농촌 지역은 지식을 얻기 어려운 것이 특징입니다.

농촌 지역 사회는 종종 지역 사회 라디오, 지역 신문 및 자원 봉사 단체에게 자신들 지역에 특화된 정보에 의존합니다. 그러나 이러한 단체가 생산한 지식은 일반적으로 지역화되어 있고 인터넷에서 이용할 수 없기 때문에 사람들은 나중에 그 정보를 검색하기 어렵습니다. 또한 언어 장벽이 정보 접근을 더 방해합니다.

이러한 도전에 대응하기 위해 IIIT-B 팀은 Graama-Kannada Audio Search라는 검색 인터페이스를 개발했습니다. 이 인터페이스는 카나다어로 된 구어체 오디오 콘텐츠를 위해 특별히 설계되었습니다. 이 인터페이스를 사용하여 사용자는 투마쿠루 지역에서 하이퍼로컬 정보를 오디오 형식으로 검색하고 이에 접근할 수 있습니다. 팀은 투마쿠루 지역의 Janastu NGO에서 운영하는 지역 사회 소유의 Wi-Fi 매시 라디오인 Namma Halli Radio와 협력하여 오디오 코퍼스를 검색 모델에 통합했습니다.

자동 음성 인식(ASR) 모델을 사용하여 Namma Halli Radio의 오디오를 텍스트로 변환했습니다. 사용자가 특정 키워드를 검색할 때, 변환된 텍스트가 일치하여 오디오 형식으로 결과를 제공합니다. 이 인터페이스는 카나다어와 영어 모두에서 검색을 지원하며, 키워드의 정확한 위치를 확인하기 위해 오디오 결과에 타임스탬프가 부착됩니다.

Graama Kannada와 같은 사회 라디오의 오디오 코퍼스 데이터로 훈련된 언어 모델에 구어체 방언을 포함시킴으로써 인간 인구의 다양성을 포착하는 것에 실패하는 대형 언어 모델의 한계를 극복하기 위한 것이 팀의 목표입니다.

현재 해당 애플리케이션은 텍스트 기반 검색을 지원하고 있지만, 팀은 향후 오디오 기반 검색을 통합할 계획입니다. 이를 통해 사용자들은 투마쿠루 방언이나 다른 지역 방언을 사용하여 음성 검색을 수행할 수 있게 되고, 농촌 지역 사회의 정보 접근성을 향상시킬 수 있습니다.

지역 사회 구성원들에게 서비스를 제공하는 것 외에도, 이 검색 인터페이스는 일반 대중에게 투마쿠루 지역의 지역 문화 및 지역 정보를 알려주는 창구 역할을 합니다. 웹 애플리케이션은 가장 많이 검색된 단어 목록을 제공하여 코퍼스에 대한 힌트를 제공하고, 해당 지역에 대해 잘 알지 못하는 사람들에게 이해를 돕습니다.

사회 라디오의 오디오를 텍스트로 변환하는 것은 팀에게 큰 도전이었습니다. 그러나 OpenAI의 Whisper와 Meta의 다국어 모델과 같은 고급 ASR 모델의 도입으로 팀은 좋은 결과를 이뤄냈습니다. 팀은 또한 검색 쿼리와의 일치를 위해 관대한 기준을 도입하여 전사에서의 맞춤법 오류 문제에 대처했습니다.

이 검색 인터페이스의 개발은 농촌 지역 사회에 대한 하이퍼로컬 정보 접근성을 향상시키는 중요한 한 걸음입니다. 지역화된 지식과 디지털 접근성 사이의 격차를 좁힘으로써, 이 이니셔티브는 이전에 이용할 수 없었던 가치 있는 정보로 농촌 주민들을 능력 있게 만들 수 있습니다.

The source of the article is from the blog enp.gr

Privacy policy
Contact