Google presenta Gemini 1.5 Pro: ridefinendo le prestazioni dell’IA

Google ha svelato il suo ultimo modello di intelligenza artificiale, Gemini 1.5 Pro, che offre prestazioni notevolmente migliorate rispetto alla precedente versione. Lo sviluppo di questo modello avanzato si allinea con l’accento crescente di Google sulla tecnologia dell’IA come parte cruciale del suo futuro.

Gemini 1.5 Pro si basa sul successo di Gemini 1.0 Ultra, presentato la scorsa settimana insieme al rebranding del chatbot Bard come Gemini. Il CEO di Google, Sundar Pichai, e il CEO di Google DeepMind, Demis Hassabis, mirano a rassicurare il loro pubblico sulle implicazioni etiche dell’IA, evidenziando nel contempo i rapidi progressi delle capacità dei loro modelli.

Gemini 1.5 Pro offre risultati paragonabili al suo predecessore, ma con un’efficienza migliorata e requisiti computazionali ridotti. Le sue capacità multimodali gli consentono di elaborare testo, immagini, video, audio e codice, offrendo una gamma versatile di funzionalità in una singola casella di input.

Una caratteristica notevole di Gemini 1.5 Pro è la sua capacità di gestire fino a un milione di token in una singola richiesta. Ciò significa che può elaborare oltre 700.000 parole, un’ora di video, 11 ore di audio o basi di codice con oltre 30.000 linee di codice. In modo impressionante, Google ha persino testato una versione che supporta fino a 10 milioni di token.

Google afferma che Gemini 1.5 Pro mantiene un’alta precisione nelle query con conteggi token più grandi, a patto che abbia accesso a dati di apprendimento nuovi sufficienti. Si è comportato eccezionalmente bene in valutazioni come il test Needle In a Haystack, in cui ha estratto con successo testo incorporato da blocchi di dati lunghi fino a un milione di token il 99 percento delle volte.

Inoltre, Gemini 1.5 Pro mostra la sua capacità di ragionare su informazioni complesse. È in grado di analizzare dettagli da documenti estesi come le trascrizioni della missione Apollo 11 o interpretare punti di trama da film muti. Google riconosce che la lunga finestra di contesto di Gemini 1.5 Pro lo distingue da altri modelli su larga scala, suscitando lo sviluppo continuo di nuove valutazioni e benchmark per testare le sue nuove capacità.

Con il suo lancio, Gemini 1.5 Pro offre capacità simili ai modelli GPT-4 di OpenAI che raggiungono un massimo di 128.000 token. Tuttavia, Google ha pianificato di introdurre nuovi livelli di prezzo che supportino richieste di un milione di token in futuro.

Una caratteristica sorprendente di Gemini 1.5 Pro è la sua capacità di apprendere nuove competenze da input lunghi senza ulteriori affinamenti. Ha dimostrato questa capacità attraverso compiti come la traduzione dall’inglese al kalamang, una lingua con meno di 200 parlanti in tutto il mondo. Il modello ha ottenuto una performance paragonabile a quella di un essere umano che apprende lo stesso contenuto.

Google ha anche posto l’accento sull’etica e la sicurezza nello sviluppo di Gemini 1.5 Pro. Ha implementato pratiche di distribuzione responsabili simili ai modelli Gemini 1.0, inclusi test di controllo per una serie di potenziali danni. La sicurezza del contenuto e i danni rappresentazionali sono aree di particolare attenzione e Google mira a sviluppare nuovi test etici e di sicurezza per i suoi strumenti di intelligenza artificiale.

Inizialmente disponibile per sviluppatori e clienti aziendali tramite accesso anticipato, Gemini 1.5 Pro diventerà progressivamente più accessibile. Mentre Google continua a spingere i limiti della tecnologia dell’IA, Gemini 1.5 Pro si pone come nuovo standard di prestazioni e versatilità.

Google presenta il modello Gemini 1.5 Pro di Intelligenza Artificiale

The source of the article is from the blog kewauneecomet.com

Privacy policy
Contact