A cikk fordítása a Gemini 1.5 Pro bemutatásáról

Google bejelentette legújabb AI modelljét, a Gemini 1.5 Prot, amely jelentősen javított teljesítményt nyújt az előző változathoz képest. Ez a fejlett modell az AI technológia növekvő hangsúlyával kapcsolódik a Google jövőképéhez.

A Gemini 1.5 Pro épít a Gemini 1.0 Ultra sikereire, amelyet a Bard chatbot újbóli márkanév-váltása mellett múlt héten mutattak be. A Google vezérigazgatója, Sundar Pichai és a Google DeepMind vezérigazgatója, Demis Hassabis arra törekszenek, hogy megbizonyosodjanak a közönségük érdekében az AI etikai kérdéseinek fontosságáról, miközben kiemelik a modellek képességeinek gyors fejlődését.

A Gemini 1.5 Pro összehasonlítható eredményeket nyújt az elődjéhez képest, de javított hatékonysággal és csökkentett számítási igénnyel rendelkezik. A multimodális képességei lehetővé teszik, hogy szövegeket, képeket, videókat, hangokat és kódot is feldolgozzon, így sokoldalú funkciók válnak elérhetővé egyetlen beviteli mezőn belül.

A Gemini 1.5 Pro egyik figyelemre méltó jellemzője az, hogy képes kezelni akár egymillió token támogatásával érkező kéréseket. Ez azt jelenti, hogy több mint 700 000 szó, egy óra videó, 11 óra hang, vagy több mint 30 000 sor kód feldolgozására képes. A Google még olyan verziót is tesztelt, amely támogatja akár tízmillió token használatát.

A Gemini 1.5 Pro esetében a Google azt állítja, hogy magas pontosságot tart fenn olyan lekérdezések esetében, amelyek nagyobb token számmal rendelkeznek, feltéve, hogy rendelkezésére áll elegendő új adat tanuláshoz. Kiváló eredményeket ért el olyan értékeléseken, mint a Needle In a Haystack teszt, ahol 99 százalékban képes volt kiemelt szöveget extrahálni egymillió token hosszú adatblokkokból.

A Gemini 1.5 Pro bemutatja a komplex információk értelmezésének képességét. Képes elemzéseket végezni kiterjedt dokumentumokról, mint például az Apollo 11 küldetés tranzkriptumairól, vagy értelmezni cselekményeket némafilmekből. A Google elismeri, hogy a Gemini 1.5 Pro hosszú kontextusablaka megkülönbözteti azt más nagy méretű modellektől, ezért új értékeléseket és benchmarkokat fejleszt a képességeinek tesztelésére.

A Gemini 1.5 Pro az OpenAI GPT-4 modellekhez hasonló képességeket kínál, amelyek maximum 128 000 tokenig támogatnak. A Google tervezi, hogy a jövőben új árstruktúrát vezet be, amely támogatja az egymillió-tokenes lekérdezéseket.

A Gemini 1.5 Pro egyik lenyűgöző jellemzője az, hogy képes új készségeket elsajátítani hosszú bevezető információk nélkül további finomhangolás nélkül. Ezt a képességét például az angol nyelv fordításakor Kalamangra, egy olyan nyelvre, amelyet globálisan kevesebb mint 200 ember beszél, bemutatta, és hasonló teljesítményt ért el, mint egy ember, aki ugyanazt a tartalmat tanulja.

A Gemini 1.5 Pro fejlesztésében a Google erős hangsúlyt fektetett az etika és a biztonság kérdéseire. Az etikus és felelős bevezetési gyakorlatokat alkalmazza, ideértve a vörös-csapatszerű technikákat is a potenciális károk és káros hatások tesztelésére. A tartalom biztonsága és a reprezentációs káros hatások különös figyelmet kapnak, és a Google új etikai és biztonsági teszteket kíván kifejleszteni AI eszközei számára.

Az eredetileg csak korai hozzáféréssel elérhetővé tett Gemini 1.5 Pro a fejlesztőknek és az üzleti ügyfeleknek, a Google pedig tervezi, hogy a jövőben szélesebb körben elérhetővé teszi. Ahogy a Google folytatja az AI technológia határainak feszegetését, a Gemini 1.5 Pro új szintet állít fel a teljesítmény és sokoldalúság terén.

The source of the article is from the blog elblog.pl