Uz nevjerojatne inovacije u području umjetne inteligencije, istraživači tvrtke Apple nedavno su predstavili revolucionarni sustav koji ima potencijal potpunog preoblikovanja interakcija s glasovnim asistentima. Sustav nazvan kao ReALM (Reference Resolution As Language Modeling) pojednostavljuje složeni proces tumačenja nejasnih referenci i kontekstualnih znakova, otvarajući nove mogućnosti za komunikaciju s glasovnim asistentima.
Tradicionalno, digitalni asistenti su imali problema s razumijevanjem zamjenica i implicitnih referenci u razgovorima, jer im je bilo izazovno obrađivati audio signale i vizualne kontekste. Međutim, Appleov projekt ReALM rješava te probleme obraćajući se izazovu tumačenja referenci kao zadatka modeliranja jezika. Korištenjem velikih jezičnih modela, sustav sada može bez poteškoća razumjeti i odgovoriti na spominjanje vizualnih elemenata na zaslonu, glatko integrirajući tu vještinu u razgovore.
Bit ReALM-a leži u inovaciji pretvaranja vizualne strukture zaslona u strukturirani tekst. Može identificirati i locirati elemente na zaslonu, prevodeći te vizualne signale u tekstualnu reprezentaciju koja hvata sadržaj i raspored ekrana. Zahvaljujući prilagođenom treniranju jezičnog modela koje se fokusira na razlučivanje referenci, Appleov pristup nadmašuje tradicionalne metode, čak i nadmašujući GPT-4 tvrtke OpenAI.
Ova revolucija u razumijevanju prirodnog jezika može imati značajne posljedice za različite industrije. Prema istraživaču na području umjetne inteligencije Danu Faggelli, budući izlazak AI sustava sposobnih za odgovaranje na brza i jednostavna pitanja korisnika mogao bi značajno poboljšati korisničko iskustvo, što bi moglo dovesti do veće vjernosti korisnika i prodaje. Potencijalni utjecaj na krajolik trgovine je ogroman.
Česta pitanja
Što je ReALM sustav?
ReALM (Reference Resolution As Language Modeling) je revolucionarni sustav tvrtke Apple koji pojednostavljuje tumačenje nejasnih referenci i kontekstualnih znakova u interakcijama s glasovnim asistentima.
Kako ReALM inovira proces razumijevanja referenci?
ReALM obrađuje tumačenje referenci kao zadatak modeliranja jezika, koristeći velike jezične modele za bolje razumijevanje i odgovaranje na spominjanje vizualnih elemenata na zaslonu.
Izvor: www.apple.com
—
**Izvori:**
– [www.apple.com](www.apple.com)