OpenAI pokreće GPT-4o: Jedinstveni AI sposoban za vizualne i audio interakcije

OpenAI je nedavno predstavio svoj inovativni model umjetne inteligencije, GPT-4o, obećavajući optimiziranje korisničkog iskustva preko teksta, slika te prvi put integriranjem audio i video interakcija putem aplikacija na pametnim telefonima. Tranzicija prema holističkom modelu, opisana od strane CTO-a OpenAI-a, Mire Murati, kao ‘omnimodel’, očekuje se da će bitno smanjiti vrijeme odgovora i računalne troškove u usporedbi s prethodnikom, GPT-4, koji je koristio odvojene modele za rukovanje složenim upitima.

GPT-4o, predstavljen nekoliko dana prije očekivane predstave Googleovih AI proizvoda na Google I/O konferenciji, kombinira sposobnosti koje biste očekivali od razgovornih agenata poput Siri ili Alexe, ali ih proširuje dalje. Ova moćna umjetna inteligencija može razumjeti i odgovoriti na kompleksne upute koje uključuju vizuale u stvarnom vremenu, omogućavajući joj funkcioniranje kao istinski interaktivni asistent.

Osim prilagodbi razgovora u stvarnom vremenu i promjene tonova po zahtjevu – značajka demonstrirana kroz dramatičnu priču za laku noć istraživača Marka Chena – GPT-4o pokazuje sposobnost održavanja kontinuiteta kroz sve razgovore. Ta kontinuirana memorija pomaže modelu u pružanju kontekstualno relevantnih interakcija, korak bliže prirodnom dijalogu.

Štoviše, GPT-4o se može obrazovati i ispravljati sam sebe tijekom razgovora, čineći ga sličnim učitelju uživo. Kada mu je zadatak rješavanje algebraičkih jednadžbi prikazanih putem kamere telefona, AI ne daje samo odgovore; vodi korisnike kroz proces rješavanja problema.

Iako su se tijekom prikaza uživo pojavile neke poteškoće, s AI-jem povremeno odgovarajući nepravilno ili izvan konteksta, brza obnova je demonstrirana, potvrđujući robusnost GPT-4o-a. OpenAI nastavlja nuditi svoje vizionarske značajke putem besplatnog sloja, ali s premium planom, korisnici dobivaju pristup poboljšanim sposobnostima. Međutim, prava sposobnost verzije koja je dostupna besplatno još uvijek mora biti detaljno opisana od strane organizacije.

Izazovi i kontroverze:

Jedan od ključnih izazova povezan s GPT-4o-om je osiguravanje privatnosti korisnika, posebno kada model komunicira s potencijalno osjetljivim vizualnim i audio podacima. Postoji također inherentni rizik razvoja pristranosti unutar AI-a, temeljen na podacima na koje je treniran, čineći točnost i neutralnost njegovih interakcija kritičnom točkom zabrinutosti.

Još jedan izazov je računalna snaga potrebna za optimalno funkcioniranje modela poput GPT-4o. Kako se povećava složenost zadataka, može doći do značajnih energetskih i hardverskih zahtjeva koji bi mogli utjecati na skalabilnost i dostupnost takvih tehnologija.

Kontroverze se mogu pojaviti oko etičkih implikacija, poput načina na koji ljudi mogu koristiti takvu naprednu AI, njezine mogućnosti zamjene ljudskih poslova ili kako bi mogla doprinijeti tehnologijama dubinskih laži, koje se mogu koristiti za stvaranje uvjerljivog, ali lažnog audiovizualnog sadržaja.

Prednosti:

– Sposobnost GPT-4o-a da funkcionira preko različitih vrsta podataka (teksta, slika i audio) može znatno poboljšati dostupnost AI tehnologija, omogućavajući prirodniju, višeslojnu interakciju.
– Modelove sposobnosti obrade u stvarnom vremenu i rješavanja problema mogu revolucionirati obrazovne alate i sustave podrške, pružajući personaliziranu pomoć korisnicima.
– Mogućnosti kontinuiranog razgovora omogućuju koherentniji i kontekstualno svjesniji dijalog, što može poboljšati zadovoljstvo korisnika i učinkovitost u zadacima poput korisničke podrške ili osobne pomoći.

Mane:

– Ovisnost o takvom sveobuhvatnom AI modelu mogla bi dovesti do zabrinutosti za privatnost ako odgovarajuće mjere zaštite podataka korisnika nisu na snazi.
– Potencijal zloupotrebe i generiranja štetnog ili zavaravajućeg sadržaja mogu predstavljati društvene rizike.
– Moglo bi doći do širenja jaza u dostupnosti, gdje korisnici bez najnovije opreme možda neće u potpunosti imati koristi od naprednih značajki modela.

Povezane poveznice preporučene za posjetiti:

– Kako biste saznali više o razvoju OpenAI-a i AI modelima, možda biste željeli posjetiti službenu web stranicu na OpenAI.
– Za uvide u širi kontekst razvoja AI-a i kako modeli poput GPT-4o pristaju u pejzaž, možda biste željeli posjetiti MIT Technology Review na MIT Technology Review.
– Za više o etici i sigurnosnim zabrinutostima vezanim uz AI, Future of Life Institute nudi relevantne resurse dostupne na Future of Life Institute.

Razumijevanje ovih aspekata bitno je za potpuno shvaćanje implikacija novih AI tehnologija poput GPT-4o. Ovi elementi bit će ključni u oblikovanju načina na koji društvo pristupa, usvaja i regulira ove nastajuće sposobnosti.

The source of the article is from the blog mendozaextremo.com.ar