AI tööstus liigub suurematelt keelemudelitelt kulutõhusamatele väiksematele mudelitele

Hiigelsed tehnoloogiahiiglased otsivad tasakaalu võimekuse ja maksumuse vahel väiksemamahuliste tehisintellekti mudelitega

Strateegilise pöörde korras on suured tehnoloogiakorporatsioonid, kes on rängalt investeerinud tehisintellekti (AI) valdkonda, otsustanud nüüd eelistada oma suuremate kolleegide asemel väiksemaid keelemudeleid. Pärast miljardite investeerimist ulatuslikesse AI süsteemidesse esindavad need väiksemad mudelid uut suunda, mille eesmärk on suurendada tulu, pakkudes samal ajal võimsaid funktsionaalsusi.

Apple, Microsoft ja Google on hiljuti tutvustanud AI mudeleid vähemate parameetritega, kuid mis on välja töötatud, et säilitada tugevad funktsioonid. See samm tuleb pingutuste ajal julgustada ettevõtete AI kasutuselevõttu. Mured kõrgete töökulude ja suurte keelemudelite käivitamiseks vajaliku arvutusvõimsuse pärast – tehnoloogia, mis toetab populaarseid juturoboteid nagu OpenAI ChattiGPT – on sundinud ettevõtteid kaaluma ökonoomsemaid alternatiive.

Üldiselt vastab suurem parameetrite arv AI tarkvaras paremale jõudlusele ja võimekusele teostada keerulisi ülesandeid täpsusega. Hoolimata sellest on nii OpenAI kui ka Google teatanud vastavalt GPT-4.0-st ja Gemini 1.5 Pro-st, mõlemad triljonit parameetrit omavad mudelid. Samal ajal arendab Meta versiooni oma avatud lähtekoodiga ‘LAMA’ mudelist, millel on 400 miljardit parameetrit.

Suured tehnoloogiaettevõtted reklaamivad väikseid mudeleid taskukohaste asenduslahendustena

Suured kulud, mis on seotud suurte AI mudelitega, tekitavad väljakutseid ettevõtte klientidele AI tehnoloogiatesse investeerimisel veenmiseks. Lisaks on muresid seoses andmevastutuse ja autoriõigusega, mis takistavad AI kasutuselevõtu määra.

Vastuseks reklaamivad ettevõtted nagu Meta ja Google väiksemaid keelemudeleid taskukohase ja energiasäästliku lahendusena, mida saab kohandada vähemate koolitus- ja käitamisnõuetega, pakkudes samal ajal kaitsemeetmeid tundlike andmete suhtes.

Microsofti Azure AI asepresident Eric Boyd rõhutab, et need kvaliteetsed, odavad mudelid avavad ukse laiaulatuslike rakenduste jaoks, võimaldades klientidel teha projekte, mida varem poleks investeerimine õigustanud.

Väiksemad keelemudelid saavad ülesandeid töödelda kohapealsetes seadmetes, mitte saata teavet pilve, mis võib meelitada privaatsusteadlikke kliente, kes soovivad hoida oma andmed sisevõrkudes.

Lisaks võimaldavad need kompaktsed mudelid jooksvaid AI funktsioone mobiilseadmetes. Google ‘Gemini Nano’ on saadaval Pixeli telefoni ja Samsungi S24 nutitelefoni viimastes iteratsioonides. Apple on vihjanud ka oma enimmüüdud iPhone’ide varustamiseks AI mudelitega, avaldanud “OpenAI ELM”-i, väikese mahuga mudeli, mis on mõeldud tekstipõhisteks ülesanneteks, alles eelmisel kuul.

Tööstuses on elevust, kuna oodatakse, et väiksemad mudelid viivad “huvitavate rakendusteni”, ulatudes telefonide ja sülearvutiteni. OpenAI tegevjuht Sam Altman avaldas entusiasmi nende väiksemate mudelite mitmekesise potentsiaali suhtes, samal ajal andes lubaduse arendada suuremaid AI süsteeme, mis suudavad täiustatud kognitiivseid funktsioone täita.

Tähtsad küsimused ja vastused:

1. Miks liiguvad tehnoloogiaettevõtted väiksemate AI keelemudelite poole?
Tehnoloogiaettevõtted liiguvad väiksemate AI mudelite poole peamiselt kõrgete töökulude leevendamiseks ja AI ligipääsetavamaks muutmiseks ettevõtete kasutajatele. Väiksemad mudelid nõuavad vähem arvutusvõimsust ja vähem ressursse hooldamiseks, pakkudes seega kulutõhusamat ja energiatõhusamat lahendust.

2. Kas väiksemad AI mudelid suudavad pakkuda võrreldavat jõudlust suuremate kolleegidega?
Kuigi suuremate mudelitega on ajalooliselt seostatud parem jõudlus tänu rohkematele parameetritele, on tehnoloogilised edusammud võimaldanud väiksematel mudelitel saavutada kõrge funktsionaalsus. See tehakse mudelite arhitektuuride optimeerimisega ja nende efektiivsemaks muutmisega, ehkki mõnel juhul võib siiski olla jõudluse kompromisse keerukamate ülesannete puhul.

3. Millised on suurte AI keelemudelite kasutusele võtmisega seotud peamised väljakutsed?
Peamisteks väljakutseteks on kõrged töökulud, vajadus märkimisväärse arvutusvõimsuse järele, vastutusega seotud andmeküsimused ja autoriõiguse küsimused. On ka keskkonnaalaseid kaalutlusi, kuna suuremad mudelid tarbivad rohkem energiat, tõstes jätkusuutlikkuse küsimusi.

Väiksemate AI keelemudelite eelised ja puudused:

Väiksemate AI keelemudelite eelised:
– Kulutõhusus: Nende arendamine, koolitamine ja käivitamine on odavam.
– Energiasäästlikkus: Nad kasutavad vähem energiat ja on keskkonnasõbralikumad.
– Privaatsus: Nad saavad andmeid töödelda kohapeal, suurendades kasutaja privaatsust.
– Ligipääsetavus: Nad võimaldavad AI tehnoloogiat mobiilseadmetes, suurendades kasutajate ligipääsu.

Väiksemate AI keelemudelite puudused:
– Jõudlus: Nad võivad mõnda keerukat ülesannet mitte nii tõhusalt käsitseda kui suuremad mudelid.
– Üleõppimine: Vähemate parameetritega on oht, et mudelid ei üldistaks hästi.
– Piiratud võimalused: Neil võib olla piiratud võimekus konteksti mõistmisel ja nüansirikaste vastuste loomisel.

Põhilised väljakutsed või vastuolud:
Liikumine väiksemate mudelite poole pole ka ilma vastuoludeta. Mõned väidavad, et see võib viia AI võimete ja innovatsiooni tasandikule. On ka küsimusi andmekvaliteedi ja eelarvamuse kohta, kuna väiksematel mudelitel võib olla vähem kokkupuudet mitmekesisele infole. Lisaks on tööstuses väljakutse hoida väiksemaid AI mudeleid ajakohasena, kuna keele- ja kultuurilised kontekstid arenevad.

Seotud lingid:
Ettevõtete ja nende AI algatuste kohta rohkem teada saamiseks võite külastada nende peamisi veebisaite:
– Apple
– Microsoft
– Google
– Meta (endine Facebook)
– OpenAI

Palun pange tähele, et need lingid viivad vastavate ettevõtete peamistele lehtedele, mis võivad omakorda juhtida teid nende AI arenduste konkreetsema teabe juurde.

The source of the article is from the blog klikeri.rs