Google otkriva Gemini 1.5 AI modele na konferenciji za razvojne inženjere.

Google je na svojoj godišnjoj konferenciji za programere, I/O, predstavio novu seriju AI modela nazvanu najefikasnijom i najlakšom do danas. Serija Gemini sada pozdravlja svoj najnoviji izum, Flash Gemini 1.5, dizajniran za brzo sažimanje razgovora, dodavanje naslova slikama i videima te izvlačenje podataka iz obimnih dokumenata i tablica. CEO tvrtke Google DeepMind, Demis Hassabis, istaknuo je njihovu želju za bržim i ekonomičnijim rješenjima u skladu s zahtjevima programera.

Ovaj lansiranje poklapa se s trendom gdje tehnološke tvrtke ponovno usmjeravaju svoje strategije razvoja i implementacije proizvoda oko produktivnije umjetne inteligencije. Ovi novi alati korisnicima nude sofisticiranije i inventivnije načine pristupa online informacijama u usporedbi s tradicionalnim web pretragama, što označava značajan razvoj za Google. Istovremeno, i OpenAI je objavio svoj vlastiti AI model i stolno izdanje ChatGPT-a nazvano GPT-4o, hvaleći se dvostrukom brzinom i pola cijene u odnosu na prethodnika, GPT-4 Turbo. Google sada cilja pružiti snažnu konkurenciju OpenAI-u s njihovim svježim modelima.

Gemini 1.5 Pro, još jedna nova varijanta iz Gemini-a, može razumjeti više obimnih dokumenata (do 1.500 stranica) ili sažeti 100 e-pošta. Sissie Hsiao, potpredsjednica u Googleu, najavila je da će Gemini 1.5 Pro uskoro obraditi sat vremenskog sadržaja na videozapisu ili kôd koji prelazi 30.000 linija. Snažne mogućnosti ovog modela omogućavaju brze odgovore i uvide u gusto dokumentiranje kao što je pronalaženje pravila o kućnim ljubimcima u ugovoru o najmu ili usporedba ključnih argumenata preko brojnih znanstvenih radova.

Opremljen s prozorom od 2 milijuna tokena, Gemini 1.5 Pro može procijeniti kontekst i demonstrirati granicu obrade informacija modela na 35 jezika. Izvršni u Googleu istaknuli su poboljšanja u lokalnom zaključivanju, mogućnostima planiranja i razumijevanju slika koje donosi novi model. Sundar Pichai, izvršni direktor kompanije Alphabet, tvrdi da ovaj model pruža najdulji prozor konteksta ikad viđen u temeljnom modelu.

Za početak, Gemini 1.5 Pro će proći testiranje u Workspace Labs, dok će Gemini 1.5 Flash biti dostupan za ispite unutar platforme Vertex AI, Googleove platforme za obuku i distribuciju aplikacija za umjetnu inteligenciju.

Google je također odgovorio na OpenAI-ev Sora sa svojim vlastitim kreativnim video modelom nazvanim Veo, pohvaljenim kao najkompetentniji model za stvaranje videozapisa do danas od strane izvršnog direktora Google DeepMinda Demisa Hassabisa. Veo korisnicima omogućava izradu visokokvalitetnih videozapisa (do 1080p) korištenjem tekstualnih uputa, slikovnih unosa i video signala. Novi Veo obećava proizvodnju emocionalno nijansiranih prijelaza između vizualnih stilova i filmskih efekata. Za razliku od selektivne dostupnosti Sore samo određenim developerima, Google poziva korisnike da se pridruže listi čekanja kako bi eksperimentirali s Veo-om, počevši s pristupom u Sjedinjenim Američkim Državama putem Googleovog eksperimentalnog alata, VideoFX.

Googlov prodor na konkurentskom pejzažu umjetne inteligencije: Otkrivanje Gemini 1.5 AI modela od strane Googlea strateški je potez za učvršćivanje njegove pozicije na sve konkurentnijem tržištu umjetne inteligencije. Tvrtke poput OpenAI-a s njihovim GPT-4 modelom i Microsofta, koji je integrirao umjetnu inteligenciju u svoje proizvode, značajni su igrači u ovom području. Najave na Googlovoj konferenciji za programere signaliziraju namjeru tvrtke da bude u samom vrhu tehnologije umjetne inteligencije, nudeći napredne alate za programere i krajnje korisnike.

Ključna pitanja i odgovori:
– Kakva je važnost Gemini 1.5 AI modela?
Gemini 1.5 AI modeli predstavljaju najnovije napore tvrtke Google da pruži programerima učinkovitije i ekonomičnije alate umjetne inteligencije. Ovi modeli također predstavljaju napredak u AI sposobnostima koje mogu obraditi i sažeti velike količine informacija, što bi moglo revolucionirati način interakcije korisnika s digitalnim sadržajem.

– Kako se novi modeli uspoređuju s postojećim AI tehnologijama?
S povećanim prozorom tokena i sposobnošću razumijevanja više obimnih dokumenata, Gemini 1.5 modeli nude proširen prozor konteksta u usporedbi s prethodnim modelima. To bi moglo dovesti do boljeg razumijevanja i koherentnijih izlaza, posebno u zadacima procesiranja jezika.

Izazovi i kontroverze:
Pitanja koja se tiču AI modela poput Gemini 1.5 uključuju etičke uvjete o tome kako su modeli obučeni i kvaliteti izlaza, osiguravajući da su slobodni od pristranosti i dezinformacija. Privacy implicacije AI modela koji procesuiraju osobne ili osjetljive podatke su još jedna briga. Nadalje, tu je izazov učinkovitog integriranja takvih složenih alata umjetne inteligencije u postojeće proizvode i usluge bez narušavanja korisničkog iskustva ili uzrokovati namerne štetne efekte.

Prednosti i nedostaci:
Gemini 1.5 AI modeli unapređuju način na koji AI može upravljati i sintetizirati velike skupove informacija što je znatna prednost za učinkovitost kako u osobnom tako i poslovnom kontekstu. Također ukazuju na potencijalne smanjenja troškova i ubrzanja operacija AI-a.

Međutim, postoji rizik pretjeranog oslanjanja na AI što bi moglo utjecati na razvoj ljudskih vještina. Osim toga, postoji zabrinutost zbog gubitka poslova zbog automatizacije, a kvaliteta AI-generiranog sadržaja može eventualno zavarati ili dezinformirati ako nije adekvatno regulirana.

Povezane poveznice:
Za daljnje istraživanje napretka i inicijativa tvrtke Google i njenih konkurenata u području umjetne inteligencije, možete posjetiti:
– Google
– OpenAI
– DeepMind
– Microsoft

Napomena: Ove poveznice vas vode na glavne domene, a specifične informacije o AI modelima ili platformama mogu zahtijevati navigaciju s tih domena na relevantne podstranice za ažurirane pojedinosti.

The source of the article is from the blog anexartiti.gr