Napredovanje robotike: Predstavljen pogovorni humanoidni robot

Podjetje Figure, priznani razvijalec robotike, je s svojim najnovejšim dosežkom na področju robotike dvignilo veliko prahu. Nedavno je podjetje predstavilo posnetek demonstracije, v katerem je njegov prvi humanoidni robot sodeloval v pogovoru v realnem času, in to zahvaljujoč integraciji generativne umetne inteligence iz podjetja OpenAI.

Z združitvijo moči med Figure in OpenAI je humanoidni robot, znan kot Figure 01, zdaj sposoben imeti polnovredne pogovore z ljudmi. Ta izjemen dosežek poudarja zmožnost robota, da takoj razume in odzove na človeške interakcije, kar odpira nova možnosti v komunikaciji med človekom in robotom.

Partnerstvo z OpenAI je opremilo Figure 01 z visokim nivojem vizualne in jezikovne inteligence, kar omogoča robotu izvajanje hitrih, nizkih nivojev in spretnih dejanj. Ta kombinacija najsodobnejših tehnologij robotu omogoča izvajanje različnih nalog s preciznostjo in učinkovitostjo.

Posnetek demonstracije je prikazal zmožnosti Figure 01 v improvizirani kuhinji, kjer je robot komuniciral s svojim ustvarjalcem, višjim inženirjem za umetno inteligenco, Coreyjem Lynchom. Robot je brez težav identificiral predmete, kot so jabolko, krožniki in skodelice, ko ga je pozval Lynch. Figure 01 je na primer jabolko prepoznal kot hrano in nadaljeval s pobiranjem smeti v košaro, pri čemer je prikazal svoje sposobnosti večopravilnosti.

Lynch je nadalje razložil projekt Figure 01, poudaril je celovite zmožnosti robota. Omenil je, da robot lahko opiše svojo vizualno izkušnjo, načrtuje prihodnja dejanja, se spominja preteklih dogodkov in pojasnjuje svoje sklepe prek verbalne komunikacije. Ta obsežen nabor veščin je omogočen z izkoriščanjem velikega multimodalnega modela, usposobljenega s strani OpenAI, ki lahko obdeluje slike s kamer robota in prenaša govor posnet s ploščicami.

Izraz “multimodalna AI” se nanaša na sposobnost umetne inteligence, da razume in generira različne vrste podatkov, vključno s besedilom in slikami. Z izkoriščanjem multimodalne AI lahko Figure 01 brez težav integrira vizualne in jezikovne informacije, da doseže bolj celovito razumevanje svoje okolice.

Pomembno je poudariti, da je Lynch pojasnil, da je vedenje Figure 01 naučeno, deluje s normalno hitrostjo in ni nadzorovano na daljavo. Model, uporabljen za robota, upošteva celotno zgodovino tekočega pogovora, vključno s preteklimi slikami, da generira ustrezne jezikovne odzive, ki se nato prenašajo ljudem prek tehnologije pretvorbe besedila v govor. Poleg tega isti model izbere najprimernejše naučeno ravnanje, da izpolni dano navodilo in ga izvede z uporabo teže nevronske mreže.

Figure 01 je bil posebej zasnovan za zagotavljanje jasnih opisov svoje okolice, pri čemer uporablja “zdrav razum” za sprejemanje informiranih odločitev. Na primer, lahko sklepa, da bodo krožniki postavljeni v stojalo. Poleg tega lahko robot interpretira nejasne izjave, kot je omenjanje lakote, in sprejme ustrezne ukrepe, kot je ponujanje jabolka, pri tem pa razlaga svojo logiko za vsako dejanje.

Predstavitev Figure 01 je vzbudila veliko navdušenja in pohval na platformah družbenih medijev. Mnogi posamezniki so izrazili svoje začudenje nad naprednimi zmožnostmi robota, postavljajo ga kot pomemben mejnik na poti k prihajajočim tehnološkim dosežkom.

V odzivu na navdušen sprejem se je Lynch s humorjem povezal s uporabniki družbenih medijev, delil njihove pomisleke in reference na znanstveno fantastične filme. Kljub temu je javnosti zagotovil, da razvoj Figure 01 sledi praktičnim ciljem, ki si prizadevajo omogočiti robotom izvajanje koristnih nalog in prispevati k različnim področjem, vključno z raziskovanjem vesolja.

Ko se integracija AI tehnologije s fizično humanoidno robotiko nadaljuje, se Figure pridružuje vrstam drugih pomembnih podjetij, ki si prizadevajo za združitev teh področij. Hanson Robotics s svojim robotom Desdemona AI je prav tako na čelu v poganjanju meja interakcije med človekom in robotom.

Figure AI in OpenAI nista takoj odgovorila na prošnjo Decrypta po komentarju. Kljub temu predstavitev Figure 01 ponazarja nenehen trud za raziskavo potenciala robotske umetne inteligence na celovit in pomenski način, kot še nikoli prej.

V sklepni besedi je preboj podjetja Figure pri razvoju pogovornega humanoidnega robota dokaz hitrega napredka robotike in umetne inteligence. Z izjemnimi zmožnostmi Figure 01 so meje človeško-robotske komunikacije potiskane naprej, kar odpira pot za bolj inteligentne in interaktivne robote v prihodnosti.

Pogosta vprašanja

1. Kaj je generativna AI?
Generativna AI se nanaša na tehnologije umetne inteligence, ki imajo sposobnost ustvarjanja novega in izvirnega vsebina, kot so slike, videoposnetki ali besedilo, z osnovnimi podatki in vzorci.

2. Kaj je multimodalna AI?
Multimodalna AI je vrsta umetne inteligence, ki lahko razume in generira različne vrste podatkov, vključno s besedilom in slikami. Omogoča AI sistemom integracijo informacij iz različnih modalnosti za bolj celovito razumevanje sveta.

3. Kako Figure 01 obdeluje pogovore s človeki?
Figure 01 obdeluje pogovore s pomočjo multimodalnega modela, usposobljenega s strani OpenAI. Analizira slike, posnete s svojimi kamerami in transkribira govor, posnet s ploščicami. Model upošteva celotno zgodovino pogovora, vključno s preteklimi slikami, da generira ustrezne jezikovne odzive.

Viri

– OpenAI (uradna spletna stran OpenAI)
– Hanson Robotics (uradna spletna stran Hanson Robotics)

The source of the article is from the blog krama.net