Viimeisimmässä tutkimuksessa King Abdullahin teknillisen yliopiston ja NVIDIA:n tutkijat ovat kehittäneet uuden tavan parantaa automaattisen puheentunnistuksen (ASR) järjestelmien tarkkuutta. ASR-tekniikkaa käytetään laajasti kuluttajalaitteissa, kuten älykaiuttimissa, muuttamaan puhuttu kieli kirjoitetuksi tekstiksi.
Tiimin kehittämä lähestymistapa, nimeltään Whispering-LLaMA, yhdistää kaksi komponenttia ASR-tarkkuuden parantamiseksi. Ensimmäinen komponentti on Whisper ASR perusmalli, joka on koulutettu suurella määrällä monikielistä äänidataa.… Read the rest