Novi članak: Višemodalni okvir poboljšava robotsko donošenje odluka

Sažetak: Institut za umjetnu inteligenciju MIT-a razvio je novi višemodalni okvir nazvan Kompozicijski modeli osnove za hijerarhijsko planiranje (HiP) kako bi pomogao robotima da naprave detaljne, izvedive planove. Za razliku od prethodnih modela koji su se oslanjali na sparivanje vizualnih, jezičnih i akcijskih podataka, HiP koristi tri različita modela osnove obučena na različitim modalitetima podataka kako bi uhvatila različite aspekte procesa donošenja odluka. Ovaj pristup eliminira potrebu za skupim spariranim podacima i čini proces zaključivanja transparentnijim. Tim istraživača vjeruje da HiP može omogućiti robotima da obavljaju kućanske poslove i složene zadatke u građevinarstvu i proizvodnji. Sistem je u testovima nadmašio slične okvire prilagođavajući svoje planove na temelju novih informacija i uspješno izvodio manipulacijske zadatke. HiP-ova hijerarhija uključuje veliki jezični model za planiranje zadataka, model difuzije videa za razumijevanje okoline i model egocentričnih akcija za određivanje izvršenja na temelju okoline.

Roboti su uvijek imali izazove u planiranju i izvođenju zadataka koje ljudi smatraju intuitivnima. Dok ljudi lako obavljaju korake jedan za drugim, roboti zahtijevaju složen plan koji uključuje detaljne konture. MIT-ov Improbable AI Lab suočio se s tim problemom s inovativnim višemodalnim okvirom, HiP.

Korištenjem tri različita modela osnove, HiP poboljšava robotsko donošenje odluka i planiranje. Za razliku od prethodnih modela koji se oslanjaju na sparirane podatke, modeli osnove HiP-a hvataju različite aspekte procesa donošenja odluka i surađuju prilikom donošenja odluka. To eliminira potrebu za teško dostupnim spariranim podacima, čime se čini proces zaključivanja transparentnijim.

Mogućnosti za HiP su ogromne. Tim istraživača zamišlja da roboti koriste ovaj okvir za obavljanje kućanskih poslova poput pospremanja knjiga ili stavljanja posuđa u perilicu suđa. Dodatno, HiP bi mogao pomoći u složenim zadacima poput građevinarstva i proizvodnje, stapajući i postavljajući različite materijale prema određenim sekvencama.

U testovima je HiP nadmašio slične okvire prilagođavajući svoje planove novim informacijama i uspješno izvršavajući manipulacijske zadatke. Na primjer, u jednom testu, robot je uspješno poslagao blokove različitih boja i prilagodio svoje planove kako bi se prilagodio nedostajućim bojama. U drugom testu, sustav je slagao predmete, ignorirajući nepotrebne stvari i prilagođavao svoje planove kako bi se nosio sa prljavim predmetima.

HiP djeluje kao hijerarhija, pri čemu je svaka komponenta prethodno obučena na različitim skupovima podataka. Veliki jezični model započinje proces razbijanjem zadatka na podciljeve, dok model difuzije videa prikuplja fizičke informacije o okolini. Na kraju, model egocentričnih akcija određuje odgovarajuće akcije na temelju okoline robota.

S HiP-om, roboti sada mogu oslanjati na višemodalni pristup koji uključuje jezičku, fizičku i okolinsku inteligenciju. Ovaj novi okvir otvara mogućnosti za poboljšano robotsko donošenje odluka i uspješno izvođenje složenih zadataka, čime roboti postaju učinkovitiji i sposobniji partneri u različitim okruženjima.

The source of the article is from the blog maltemoney.com.br

Privacy policy
Contact