Naujas straipsnis: Daugiabūdių pagrindų modeliai didina robotų sprendimų priėmimą

MIT „Improbable AI Lab” sukūrė naują daugiabūdį pagrindų modelį, vadinamą „Compositional Foundation Models for Hierarchical Planning” (HiP), kuris padeda robotams kurti išsamius, įgyvendinamus planus. Skirtingai nuo ankstesnių modelių, kurie remėsi poruotu matymo, kalbos ir veiksmo duomenų, HiP naudoja tris skirtingus pagrindų modelius, treniruotus skirtingo tipo duomenimis, siekiant užfiksuoti sprendimų priėmimo proceso skirtingas sritis. Šis požiūris elimina poreikį brangiems poruotiems duomenims ir palengvina sprendimo priėmimo procesą. Tyrimų komanda mano, kad HiP gali padėti robotams atlikti namų ruošos darbus ir sudėtingus užduotis statyboje ir gamyboje. Sistemą testuose pranoko kitos panašios struktūros pagrindai, prisitaikydama prie naujos informacijos, bei tiksliai atlikdama manipuliacijos užduotis. HiP hierarchija apima didelį kalbos modelį užduočių planavimui, vaizdo sklaidos modelį, skirtą suprasti aplinką, ir ego-ego modelį, skirtą vykdymui nustatyti remiantis aplinka.

Robotai visada susidūrė su iššūkiais planuojant ir vykstant užduotis, kurias žmonėms atlikimas atrodo intuityvus. Žmonės lengvai atlieka nuoseklias darbo etapas, o robotai reikalauja sudėtingo plano su detaliais nurodymais. MIT „Improbable AI Lab” spręs šią problemą pasitelkdami savo inovatyvų daugiabūdį pagrindų modelį „HiP”.

Pasitelkus tris skirtingus pagrindų modelius, „HiP” spręs robotų sprendimų priėmimo ir planavimo problemas. Skirtingai nuo ankstesnių modelių, kurie remiasi poruotais duomenimis, „HiP” pagrindiniai modeliai užfiksuoja skirtingas sprendimų priėmimo proceso sritis ir dirba kartu priimant sprendimus. Tai eliminuoja poreikį gauti sunkiai įgyjamus poruotus duomenis ir palengvina sprendimo priėmimo procesą.

Galimybių „HiP” yra labai daug. Tyrimų komanda numato, kad robotai naudos šią struktūrą, kad atliktų namų ruošos darbus, pavyzdžiui, sutvarkytų knygas arba padėtų indus į indaplovę. Be to, „HiP” galėtų padėti sudėtingose užduotyse, tokiomis kaip statyba ir gamyba, kai reikia kelti ir tvarkyti skirtingus medžiagų rinkinius pagal tam tikras sekas.

Tyrimų metu „HiP” pranoko panašius pagrindus, prisitaikydama prie naujos informacijos ir tiksliai atliekant manipuliacijos užduotis. Pavyzdžiui, viename teste robotas sėkmingai padėjo vienspalvius blokus ir pritaikė savo planus pagal trūkstamus spalvų variantus. Kito teste sistema sudėliojo objektus, ignoruodama nereikalingus elementus ir prisitaikė prie nešvarių objektų.

„HiP” veikia kaip hierarchija, kurioje kiekvienas komponentas yra išankstinai treniruotas skirtingų duomenų rinkinių. Didelis kalbos modelis pradeda procesą skaidydamas užduotį į po- tikslus, tuo tarpu vaizdo sklaidos modelis renka informaciją apie aplinką. Galiausiai ego-ego modelis nustato tinkamus veiksmus, remiantis roboto aplinka.

Su „HiP” robotai gali pasitikėti daugiabūdžiu požiūriu, kuris apima kalbinę, fizinę ir aplinkos intelektą. Ši nauja struktūra atveria galimybes pagerinti robotų sprendimų priėmimą ir sėkmingai vykdyti sudėtingas užduotis, padarydama robotus efektyvesniais ir galinčiais įgyvendinti įvairiose aplinkose.

The source of the article is from the blog maestropasta.cz