Edasijõudnud robotika: Figuur avaldab vestlusroboti

Robotika arendaja Figure on teinud läbilöögi robotika valdkonnas. Ettevõte näitas hiljuti videotemonstratsiooni, kus nende esimene humanoidrobot on reaalajas vestlustes tänu generatiivsele tehisintellektile OpenAI-l.

Figuuri ja OpenAI koostöös on humanoidrobot, mida tuntakse kui Figuur 01, nüüd võimeline inimestega täismahus vestlema. See märkimisväärne saavutus rõhutab roboti võimet inimsuhtlust mõista ja sellele koheselt reageerida, avades uusi võimalusi inimese-roboti suhtluses.

OpenAI-ga sõlmitud partnerlus on varustanud Figuur 01 kõrgtasemelise visuaalse ja keelelise intelligentsiga, võimaldades robotil teha kiireid, madalatasemelisi ja osavalt koordineeritud tegevusi. Need tipptehnoloogiate kombinatsioon võimaldab robotil täpsust ja tõhusust silmas pidades teostada erinevaid ülesandeid.

Videodemonstratsioon näitas Figuur 01 võimeid improvisatsioonilises köögis, kus robot suhtles oma looja, vanem tehisintellekti insener Corey Lynchiga. Robot tuvastas kergelt esemeid nagu õun, nõud ja tassid, kui Lynch seda palus. Märkimisväärne on, et Figuur 01 tunnustas õuna toiduna ja korjas prügi korvi, näidates oma mitmele tegevusele suunatud võimeid.

Lynch täpsustas edasi Figuur 01 projekti, rõhutades roboti ulatuslikke võimeid. Ta mainis, et robot suudab kirjeldada oma visuaalset kogemust, planeerida tulevasi tegevusi, mõtiskleda mälestuste üle ja selgitada oma põhjendusi suulise suhtluse kaudu. Selliseid oskuste oskusi on võimalik saavutada, ära kasutades OpenAI poolt treenitud suurt multimodaalset mudelit, mis suudab töödelda pilte roboti kaameratest ja transkribeerida kõnet pardal olevate mikrofonide kaudu.

“Multimodaalne tehisintellekt” viitab tehisintellekti võimele mõista ja genereerida erinevat tüüpi andmeid, sh teksti ja pilte. Multimodaalse tehisintellekti ärakasutamise abil suudab Figuur 01 integreerida visuaalset ja keelelist teavet, et saavutada parem arusaamine ümbritsevast keskkonnast.

Oluline on rõhutada, et Lynch selgitas, et Figuur 01 käitumine on õpitud, töötab normaalse kiirusega ja pole kaugjuhitav. Roboti kasutatav mudel arvestab kogu vestluse ajalugu, sealhulgas möödunud pilte, et genereerida sobivaid keelelisi vastuseid, mis seejärel kuvatakse inimesele tekst-kõne tehnoloogia abil. Lisaks vastutab sama mudel kõige sobivama õpitud käitumise valimise eest antud käsu täitmiseks ja selle teostamise eest neuronaalvõrgu kaalude abil.

Figuur 01 on spetsiaalselt loodud andma lühikesi kirjeldusi oma ümbrusest, kasutades “üldist tarkust” teadlike otsuste tegemiseks. Näiteks võib see järeldada, et nõusid paigutatakse kuivatusrestile. Lisaks suudab robot tõlgendada ebamääraseid avaldusi, näiteks viidet näljale, ja võtta sobivaid meetmeid, nt pakkuda õuna, selgitades samal ajal iga tegevuse tagamaid.

Figuur 01 tutvustamine on tekitanud märkimisväärset elevust ja kiitust sotsiaalmeedia platvormidel. Paljud isikud on avaldanud oma hämmastust roboti arenenud võimetega, omistades selle tähtsa verstaposti tulevaste tehnoloogiliste edusammude teel.

Reageerides entusiastlikule vastuvõtule, suhtles Lynch humoorikalt sotsiaalmeedia kasutajatega, jagades nende muresid ja viiteid ulmefilmidele. Siiski kinnitas ta avalikkusele, et Figuur 01 arendamine lähtub praktilistest eesmärkidest, eesmärgiga võimaldada robotitel täita kasulikke ülesandeid ja panustada erinevatesse valdkondadesse, sealhulgas kosmose uurimine.

Kuigi tehisintellekti tehnoloogia integreerimine füüsiliste humanoidrobotitega jätkab arengut, liitub Figure teiste märkimisväärsete ettevõtetega, kes püüavad neid valdkondi ühendada. Hanson Robotics oma Desdemona AI robotiga on samuti olnud esirinnas piire inimese-roboti suhtluses lükates.

Figuur AI ja OpenAI ei ole Decrypti taotlusele kohe vastanud. Sellest hoolimata toob Figuur 01 avalikustamine esile järjepideva jõupingutuse uurida AI-toega robotite potentsiaali kõikehõlmavamal ja tähendusrikkamal viisil kui kunagi varem.

Kokkuvõttes on Figure läbimurre vestleva humanoidroboti arendamisel tunnistus robotika ja tehisintellekti kiirest edenemisest. Figuur 01 silmapaistvate võimetega surutakse piire inimese-roboti suhtluses, avades tee tulevikus veelgi intelligentsematele ja interaktiivsetele robotitele.

KKK

1. Mis on generatiivne tehisintellekt?
Generatiivne tehisintellekt viitab tehisintellekti tehnoloogiatele, mis suudavad luua uut ja originaalsisu, näiteks pilte, videoid või teksti, lähtudes olemasolevatest andmetest ja mustritest.

2. Mis on multimodaalne tehisintellekt?
Multimodaalne tehisintellekt on tehisintellekti tüüp, mis suudab mõista ja genereerida erinevat tüüpi andmeid, sh teksti ja pilte. See võimaldab tehisintellekti süsteemidel integreerida teavet erinevatest allikatest, et saavutada maailma terviklikum arusaamine.

3. Kuidas Figuur 01 töötleb vestlusi inimestega?
Figuur 01 töötleb vestlusi, kasutades OpenAI poolt treenitud multimodaalset mudelit. See analüüsib oma kaamerate poolt püütud pilte ja transkribeerib mikrofonidega salvestatud kõnet. Mudel arvestab kogu vestluse ajalugu, kaasa arvatud varasemad pildid, et genereerida sobivaid keelelisi vastuseid.

Allikad:
– OpenAI
– Hanson Robotics

The source of the article is from the blog mgz.com.tw