Predstavljanje GPT-4o: AI, ki zaznava in interakcira kot še nikoli doslej

OpenAI je ponovno presegel pričakovanja z uvedbo GPT-4o, umetniškega modela inteligence, ki ne le komunicira prek besedila, temveč tudi zaznava in odziva na vizualne in zvočne vhode. GPT-4o, imenovan “Omni”, je sposoben generiranja slik v realnem času ter ima napredne zmožnosti interakcije z ljudmi, s čimer potiska rob AI tehnologije.

Predstavitev GPT-4o je potekala v okolju, ki spominja na sitcom ‘Prijatelji’, kjer so vodilne osebe iz podjetja OpenAI sodelovale z umetno inteligenco, kot da bi bila še en član njihovega tima. Čeprav interakcija ni bila brezhibna, je GPT-4o pokazal impresivno zmožnost prepoznavanja in popravljanja svojih napak ter celo pokazal smisel za humor glede le-teh. Pogovarjal se je tekoče, reševal matematične probleme, pripovedoval zgodbe ter simultano prevajal jezike brez vidnega zamika.

Medtem je Google predstavil projekt Astra, ki vključuje umetno inteligenco v svoj ekosistem, s pametnimi očali poimenovanimi Gemini. Medtem ko predstavitev Googla ni povzročila tako velikega razburjenja kot OpenAI, je pomembno, da se AI Googla lahko integrira v njihovo paleto trdnih storitev, kot so YouTube, Gmail ali Google Dokumenti, kar ustvarja praktično vrednost za uporabnike.

Razpoložljivost teh modelov AI je stopničasta, pri čemer OpenAI trenutno ponuja besedilne interakcije GPT-4o in namerava kmalu izdati naprednejše funkcije za premium uporabnike. Google je podobno prestavil uvedbo svojih novih AI zmožnosti, ne da bi navedel specifične datume.

Te razvojne priložnosti nakazujejo prihodnost, kjer bo AI vseprisoten sopotnik, ki pomaga s naravnimi jezikovnimi interakcijami in podpira uporabnike pri virtualnih in resničnih opravilih. Ko AI nadaljuje z napredkom pri pisanju, govorjenju, poslušanju in generiranju slik, je njegov naslednji cilj preusmeriti se k vsevednosti, odpirajoč pot novi dobi interakcije med človekom in strojem.

The source of the article is from the blog scimag.news