Pokrok v robotice: Promyšlené pohyby a zpracování řeči v reálném čase

Technologie robotů udělala další krok vpřed s vývojem humanoidního robota, který dokáže samoopravovat a učit se úkoly pozorováním lidí. V nedávném propagačním videu ukázal Figure 01 svou schopnost uvařit šálek kávy a odpovědět na otázky díky integraci s technologií společnosti OpenAI.

Video prezentuje Figure 01 provádějící řadu jednoduchých úkolů v minimalistickém testovacím prostředí připomínajícím kuchyň. Technik požádal robota, aby mu přinesl něco k jídlu, a Figure 01 mu odpověděl podáním jablka. Zajímavěji, technik pak požádal robota, aby vysvětlil svůj výběr jablka, zatímco vyhazoval odpad. Robot Figure 01 dokázal v robotickém, avšak přátelském hlasu odpovědět na otázky technika.

Tato konverzace mezi technikem a Figure 01 je možná díky technologii OpenAI, která robota vybavuje schopnostmi zpracování přirozeného jazyka. I když přesné AI nástroje použité u Figure 01 nebyly potvrzeny jako ChatGPT, je zřejmé, že integrace s OpenAI umožňuje robotovi zapojit se do plných konverzací s lidmi, předváděje vysokou úroveň vizuální a jazykové inteligence.

Tento pokrok má významné důsledky pro robotiku ve dvou klíčových oblastech. Za prvé, představuje průlom v mechanickém inženýrství, zejména v dosahování zručných a samoopravných pohybů podobných těm, které vykonávají lidé. Vyžaduje to přesné motory, akční členy a gripovací zařízení inspirované mechanikou lidských kloubů a svalů. Navíc to vyžaduje sofistikované algoritmy pro řízení motoru k manipulaci těmito komponentami a citlivé manipulace s objekty. Pozoruhodně, zdánlivě jednoduché akce jako zvednutí šálku vyžadují rozsáhlé zpracování na palubní desce pro přesné koordinování svalových pohybů.

Druhá oblast pokroku spočívá v zpracování přirozeného jazyka v reálném čase (NLP) usnadněné integrací technologie společnosti OpenAI. NLP je obor počítačové vědy věnovaný vybavení strojů schopností porozumět a efektivně přenášet řeč lidí. Přidání motoru od OpenAI umožňuje Figure 01 rychlé zpracování jazykových vstupů a rychlou odpověď, srovnatelnou s rychlostí a efektivitou ChatGPT.

Zatímco propagační video demonstruje impozantní schopnosti, odborníci vyjádřili určité pochybnosti. Při bližším zkoumání videa naznačuje určité prvky, že hlasové vzorce a intonace Figure 01 mají lidské atributy. Skeptici kladou otázku na zahrnutí přirozených lidských charakteristik do motoru umělé inteligence. Naznačují možnost, že video může být kurátorské a prezentuje probíhající výzkum a vývojové úsilí společnosti Figure Robotics spíše než skutečný polní test.

Pokud video skutečně zachycuje autentické v reálném čase reakce Figure 01, znamená to významný pokrok v oblasti robotiky. Integrace zručných pohybů a zpracování jazyka v reálném čase nás přibližuje k budoucnosti, kde roboti mohou provádět složité úkoly a zapojovat se do přirozených a plynulých konverzací s lidmi. Další výzkum a testování budou vyžadovány k úplnému určení rozsahu schopností Figure 01 a důsledků, které to přináší pro budoucnost robotiky.

FAQ

The source of the article is from the blog mivalle.net.ar

Privacy policy
Contact