Uudenlainen lähestymistapa tekoälyn energiatehokkuuteen

Nvidia järjesti GTC-kehittäjäkonferenssin San Josessa, Kaliforniassa, mikä on saanut huomiota tekoälyn maailmassa. Tapahtumaa kutsuttiin ”tekoälyn Woodstockiksi” ja siellä nähtiin suuryrityksiä kuten Nvidia, OpenAI, xAI, Meta, Google ja Microsoft, sekä johtohenkilöitä yrityksistä kuten L’Oréal, Lowe’s, Shell ja Verizon, jotka kaikki halusivat hyödyntää tekoälyteknologiaa.

Konferenssissa Nvidia:n toimitusjohtaja Jensen Huang esitteli yrityksen uusimman grafiikkaprosessoriyksikön (GPU), Blackwell GPU:N. Tämä uusi siru ylpeilee vaikuttavalla 208 miljardin transistorin määrällä, ylittäen sen edeltäjän, H100 GPU:N, jossa oli 80 miljardia transistoria. Blackwell GPU:N suuremmat sirut tarjoavat kaksi kertaa nopeamman suorituskyvyn tekoälymallien opettamiseen ja ovat viisinkertaisesti nopeampia tuottamaan tulosteita koulutetuista malleista (inference). Nvidia myös esitteli tehokkaan GB200 ”superchipin”, joka sisältää kaksi Blackwell GPU:ta yhdistettynä Grace CPU:un, ylittäen olemassa olevat Grace Hopper MGX -yksiköt, joita käytetään datakeskuksissa.

Blackwell GPU:N huomionarvoinen ominaisuus on sen virrankulutusprofiili, ja Nvidia hyödyntää tätä markkinoinnissaan. Aikaisemmin voimakkaat sirut kuluttivat enemmän energiaa, missä energiatehokkuus jäi suorituskyvyn varjoon. Kuitenkin Blackwell GPU:n julkistamisen myötä Huang korosti sen suurempaa prosessointinopeutta ja korosti vähentynyttä energiankulutusta koulutuksessa verrattuna aikaisempiin malleihin. 2000 Blackwell GPU:ta käyttämällä suurten tekoälymallien kouluttaminen vaatisi 4 megawattia tehoa 90 päivän aikana, verrattuna aiempiin 8000 GPU:hun, jotka kuluttaisivat 15 megawattia saman koulutusjakson aikana. Tämä merkittävä ero energiankulutuksessa käsittelee huolia liittyen rahan menoon ja hiilijalanjälkeen, jotka liittyvät tekoälyteknologiaan.

Energiankulutukseen keskittyminen on ratkaisevan tärkeää, sillä tietoisuus tekoälyn kustannuksista ja ympäristövaikutuksista on saanut yritykset epäröimään omaksumasta täysin generatiivisen tekoälyn vallankumousta. Pilvipalveluntarjoajat esimerkiksi veloittavat korkeita maksuja GPU:jen käytöstä, ei vain kattaakseen sirujen kustannukset itse, vaan myös kattaakseen energiankulutuksen ja jäähdytysvaatimukset datakeskuksissa. Nvidia tunnistaa tämän huolen ja pyrkii lieventämään sitä korostamalla Blackwellin energiatehokkuutta. Lisäksi Nvidia huomauttaa, että tekoälyasiantuntijat ovat keksineet keinoja matkia suurempien, energiatehokkaiden mallien suorituskykyä, kuten GPT-4:ää pienemmillä, vähemmän energiaa käyttävillä malleilla.

Vaikka tekoälyn datakeskusten energiankulutus edustaa nyt vain pientä osaa maailman kokonaisenergiankulutuksesta, arviot viittaavat siihen, että se saattaa kasvaa nopeasti tulevaisuudessa. Esimerkiksi Schneider Electricin arvion mukaan tekoäly kuluttaa energiaa saman verran kuin Kyproksen vuosittainen kulutus. Microsoftin asiantuntijan mukaan pelkästään Nvidia H100:sten käyttö on odotettavissa kuluttavan yhtä paljon energiaa kuin koko Phoenixin kaupungin loppuvuodesta.

Kuitenkin huoli tekoälyn datakeskusten energiankulutuksesta saattaa olla osittain harhaanjohtava. Useimmat pilvihyperskaalereiden käyttämät datakeskukset, joissa suurin osa tekoälyprosessoinnista tapahtuu, ovat nyt riippuvaisia uusiutuvasta energiasta tai vähähiilisestä ydinvoimasta. Solmimalla sopimuksia suurista määristä uusiutuvaa energiaa vakiintuneilla hinnoilla, nämä hyperskaalerit ovat pelanneet keskeisen roolin kannustaessaan uusiutuvan energian yrityksiä rakentamaan tuuliturbiini- ja aurinkovoimahankkeita. Tämä on johtanut siihen, että uusiutuvaa energiaa on enemmän saatavilla kaikille, hyödyttäen sekä pilvipalveluntarjoajia että energianlähteiden kestävyyttä. Kuitenkin datakeskusten jäähdyttämiseen tarvittava vedenkulutus pysyy huolenaiheena kestävyysponnisteluissa.

Vaikka monet datakeskukset toimivat kestävillä ratkaisuilla, jotkut alueet saattavat olla vailla pääsyä uusiutuvaan energiaan. Jos tekoälyn käyttö jatkaa laajenemistaan ja mallit kasvavat suuremmiksi, kysyntä uusiutuvalle energialle saattaa ylittää vähähiilisen tarjonnan jopa Yhdysvalloissa ja Euroopassa. Tämä ohjaa toimenpiteitä, kuten Microsoftin kiinnostusta käyttää tekoälyä nopeuttaakseen uusien ydinvoimaloiden hyväksymisprosessia Yhdysvalloissa.

Tekoälyn energiankulutus korostaa myös yhtä monista alueista, joilla ihmisaivot ovat parempia kuin luodut tekoälymme. Ihmisaivot kuluttavat päivittäin noin 0,3 kilowattituntia, pääasiassa kalorien saannista, kun taas keskimääräinen H100 GPU vaatii noin 10 kilowattituntia päivittäin. Jotta tekoälyä voidaan hyödyntää laajalti ja kestävällä tavalla vahingoittamatta planeettaa, keinotekoisten hermoverkkojen saatetaan toimia energia-profiililla, joka muistuttaa enemmän biologisia vastineitaan.

Iso-Britannian Advance Research and Invention Agency (Aria), vastaa Yhdysvaltojen puolustusministeriön DARPA:ta, pyrkii ratkaisemaan tämän haasteen. Aria on sitoutunut rahoittamaan £42 miljo…

The source of the article is from the blog radiohotmusic.it

Privacy policy
Contact