OpenAI otkriva revolucionarni multimodalni AI model "GPT-4o"

OpenAI predstavlja sljedeći val umjetne inteligencije s “GPT-4o”, multimodalnim AI modelom koji je besplatan za korištenje. U velikom ažuriranju 13. svibnja, OpenAI je lansirao revolucionarni AI model nadimkom GPT-4o, osmišljen za razumijevanje i generiranje sadržaja ne samo u tekstu, već i u audio i vizualnim formatima.

Sam Altman, izvršni direktor tvrtke, istaknuo je izvanredne sposobnosti GPT-4o, naglašavajući njegove prirodne multimodalne sposobnosti koje mu omogućuju obradu i odgovaranje na naredbe putem govora ili slika.

Nove značajke i primjene preuzimaju središnje mjesto. Demonstracije su pokazale glasovne razgovore u stvarnom vremenu s ChatGPT, izazove poput prekida u sred rečenice te sposobnost prebacivanja između različitih jezika, emocija i glasovnih tonova. Iako Altman nije bio prisutan tijekom prijenosa uživo, izrazio je u blogu da je interakcija s računalima sada prirodna i intuitivna kao što je prikazano u znanstvenofantastičnim filmovima.

GPT-4o također se ističe u analizi slika. Znanstvenici su podijelili isječke gdje je GPT-4o vodio dijete kroz matematički problem korak po korak koristeći uploadanu sliku. Dodatno, može interagirati u stvarnom vremenu s prepoznavanjem lica, početno je zamijenio lice istraživača s drvenim stolom, ali nakon preispitivanja AI je živopisno komentirao veselo raspoloženje istraživača.

Pristup GPT-4o širi se, s naglaskom na inkluzivnost. Za razliku od svojeg prethodnika GPT-4, OpenAI je objavio pristup GPT-4o za korisnike koji ne plaćaju, iako s manje prava na uporabu u usporedbi s Plus članovima. Altman je razmišljao o putovanju OpenAI-a, naglašavajući želju za koristiti javnost s besplatnim pristupom AI-ju i plaćenim razvojnim API-ima.

Je li GPT-4o zaista inovativan? Analitičar Chirag Dekate iz konzultantske tvrtke ‘Gartner’ primijetio je sličnost između novih funkcija i značajki OpenAI-a i Googleovog Gemini 1.5 Pro, signalizirajući konkurentno okruženje u kojem Google čini korak naprijed.

Ostanite u tijeku dok tehnološka zajednica s nestrpljenjem iščekuje nove ažuriranja, posebno s nadolazećom Google I/O developerskom konferencijom, na kojoj se očekuje da će biti otkrivena sljedeća iteracija Googleovog AI-ja, Gemini.

Pitanja i odgovori:

P: Što čini GPT-4o posebnim u odnosu na njegove prethodnike?
O: Jedinstvena značajka GPT-4o-a je njegova multimodalna sposobnost, što znači da može razumjeti i generirati sadržaj u različitim formatima, uključujući tekst, zvuk i slike.

P: Kako GPT-4o poboljšava interakciju korisnika s računalima?
O: Omogućujući prirodnije i intuitivnije metode komunikacije, poput glasovnih razgovora i vizualnih unosa, paralelno s interakcijama prikazanim u znanstvenofantastičnim filmovima, tehnologija postaje pristupačnija i korisniku prijateljskija.

P: Je li pristup modela AI-a zaista besplatan za svakoga?
O: OpenAI omogućuje korisnicima koji ne plaćaju pristup GPT-4o sa određenim ograničenjima, dok Plus članovi imaju proširena prava na uporabu, što ukazuje na napor da se postigne šira inkluzivnost uz održavanje modela usluga s različitim razinama.

Ključni izazovi i kontroverze:

Pouzdanost: S obzirom na to da GPT-4o može krivo protumačiti ulazne podatke, kao što je u slučaju kada je lice zamijenjeno drvenim stolom, osiguravanje dosljednog i točnog prepoznavanja ključno je.

Privatnost: S mogućnostima poput prepoznavanja lica i obrade zvuka, upravljanje privatnošću i sigurnošću korisničkih podataka velik je izazov.

Predrasude: Kao i kod bilo kojeg sustava umjetne inteligencije, postoji opasnost od urođenih predrasuda u sadržaju generiranom pomoću AI-ja, što se mora neprestano rješavati kako bi se izbjeglo poticanje stereotipa i dezinformacija.

Konkurencija i inovacije: S Googleovim Gemini 1.5 Pro koji nudi slične značajke, OpenAI mora razlikovati svoj proizvod i dokazati svoju superiornu inovaciju.

Prednosti:
– Poboljšava interakciju obradom različitih vrsta ulaza
– Proširuje mogućnosti za kreativne, obrazovne i pristupačne primjene
– Olakšava prirodnu komunikaciju između ljudi i AI-ja

Mane:
– Moguće poticanje predrasuda ako se ne pravilno rješava
– Potencijalno zloupotreba multimodalnih sposobnosti, poput dubokih laža
– Može intenzivirati konkurenciju, potencijalno ograničavajući suradnju u području AI-ja

Kao što je zatraženo, ovdje je poveznica na glavnu web stranicu OpenAI-a za one koji su zainteresirani za dodatne informacije: OpenAI.

Napomena: Iako se trudim pružiti točne URL poveznice, uvijek postoji mogućnost da je domena promijenjena ili da je određeni sadržaj premješten ili izbrisan nakon mog datuma posljednjeg ažuriranja.

The source of the article is from the blog windowsvistamagazine.es

OpenAI otkriva revolucionarni multimodalni AI model “GPT-4o”

Kevin Topolsky

OpenAI otkriva revolucionarni multimodalni AI model “GPT-4o”

Kevin Topolsky

Don't Miss

Poboljšanje zakonodavstva i razvoj umjetne inteligencije u Hong Kongu

Cruise imenuje glavnog časnika za sigurnost kako bi povratio povjerenje u autonomna vozila