Novi Pristop k Razvoju Generativne Umestitvene Inteligence

V osprednji potezi je Google letos odstopil od svojega običajnega zaprto-kodnega pristopa in predstavil niz odprtokodnih orodij, namenjenih podpori projektov in infrastrukture za generativno umetno inteligenco. Ta premik predstavlja pomemben korak naprej v podjetje zavezi k spodbujanju dobre volje razvijalcev in napredovanju njegovih ambicij ekosistema.

Edino orodje, ki ga je Google predstavil, je MaxRazpršenost, zbirka referenčnih implementacij različnih difuzijskih modelov. Ti modeli, kot je slikovni generator Stabilna Razpršenost, so zasnovani za izvajanje na napravah XLA. XLA, ali Pospešena Linear Algebra, se nanaša na tehniko, ki optimizira in pospešuje specifične obremenitve z umetno inteligenco, vključno z fine-tjuniranjem in postrežbo. Obe enoti za obdelavo tenzorjev (TPU) Googla in najnovejše grafične kartice Nvidia spadata med naprave XLA.

Google je prav tako predstavil Viharnik, motor, ki je posebej zasnovan za zagon modelov generativne umetnosti inteligence, zlasti modelov, ki proizvajajo besedilo. Trenutno omejen na podporo TPU, z združljivostjo z grafičnimi karticami pričakovano v prihodnosti, Viharnik ponuja do 3-krat višjo zmogljivost na dolar za modele, kot sta Googlejev Gemma 7B in Metajev Llama 2. Ta izboljšana zmogljivost je ključnega pomena, saj se stranke zanimajo za stroškovno učinkovite obremenitve skupščine, ki zagotavljajo visoko zmogljivost.

“Čeprav Viharnik ponuja pomembne izboljšave zmogljivosti, podrobnosti za trditev o 3-kratni izboljšavi ostajajo nejasne,” je dejal Mark Lohmeyer, generalni direktor za računalništvo in infrastrukturo strojnega učenja v oblaku Googla. Pojavila so se vprašanja v zvezi z generacijo uporabljenega TPU, primerjanimi izhodišči in definicijo zmogljivosti. Google so kontaktirali za nadaljnje pojasnilo.

MaxBesedilo, še en dodatek Googlovim odprtokodnim prispevkom, je zbirka modelov za generiranje besedilne umetne inteligence, namenjenih TPU-jem in grafičnim karticam Nvidia. Gemma 7B, OpenAI GPT-3, Llama 2 in modeli iz Mistrala so bili integrirani v MaxBesedilo. Te modele je mogoče prilagoditi in fine-tjunirati, da ustrezajo specifičnim potrebam razvijalcev. Google je optimiziral njihovo zmogljivost na TPU-jih in sodeloval z Nvidio za izboljšanje zmogljivosti na velikih skupinah grafičnih kartic, kar je privedlo do večje energetske učinkovitosti in optimizacije stroškov.

V sodelovanju s startup podjetjem na področju umetne inteligence Hugging Face je Google ustvaril Optimalni TPU, ki omogoča izvajanje določenih obremenitev umetne inteligence na TPU-jih. Glavni namen je znižati prag za sprejetje modelov generativne umetne inteligence, zlasti modelov za generiranje besedil, na strojni opremi TPU. Trenutno Optimalni TPU podpira le Gemmo 7B in izobraževanje generativnih modelov na TPU-jih še ni podprto. Vendar je Google zagotovil, da so izboljšave na obzorju.

Ta odprtokodna orodja Googla imajo potencial, da preoblikujejo področje generativne umetne inteligence in omogočijo razvijalcem, da raziskujejo nove možnosti. Z odpiranjem dostopa do zmogljivih modelov umetne inteligence in infrastrukture Google omogoča inovacije in sodelovanje znotraj razvijalske skupnosti. Z obljubljenimi stalnimi izboljšavami in napredki je prihodnost obetavna za razvoj generativne umetne inteligence.

Pogosta vprašanja

The source of the article is from the blog macnifico.pt

Privacy policy
Contact