Apple uvaja OpenELM: Skok proti učinkovitim jezikovnim modelom AI.

V korak proti naprednim strojnim učenjem je Apple nedavno predstavil svojo zbirko AI jezikovnih modelov, imenovano OpenELM. Ti modeli so zasnovani tako, da so kompaktni, kar jim omogoča delovanje na pametnih telefonih in prinašajo novo dimenzijo umetne inteligence neposredno uporabnikom na dosegu roke. Kot del svoje zbirke OpenELM Apple ponuja različne modele, primerna za različne kompleksnosti, ki z impresivno učinkovitostjo opravljajo naloge razumevanja jezika.

Na voljo pod licenco za vzorčno kodo Apple, modeli OpenELM pomenijo odmik od tradicionalnih zmogljivih AI modelov, ki zahtevajo podatkovna središča v oblaku. Namesto tega nudijo možnost prihodnjih orodij za AI na napravi s strani Apple. Modeli so razdeljeni v dve kategoriji: nekateri so “prednastavljeni”, drugi pa so bolj specializirani za naloge, koristne za ustvarjanje AI pomočnikov in pogovornih botov. Tu je vpogled v njihovo ponudbo:

OpenELM-270M
OpenELM-450M
OpenELM-1_1B
OpenELM-3B
OpenELM-270M-Instruct
OpenELM-450M-Instruct
OpenELM-1_1B-Instruct
OpenELM-3B-Instruct

Velikost teh modelov se razlikuje od 270 milijonov do 3 milijarde parametrov, pri čemer vsak žeton odraža del podatkov, ki jih modeli lahko interpretirajo. Nasprotno pa so druge družbe lansirale AI modele z znatno večjim številom parametrov, kar je tradicionalno nakazovalo večjo kompleksnost in moč. Kljub temu je bil cilj Apple-a ustvariti kompaktne modele, ki se ne odpovedujejo zmogljivosti.

Poleg tega je razvojna metoda Apple za OpenELM osredotočena na “layer-wise scaling strategijo”. Ta metoda naj bi parametre porazdelila bolj učinkovito, hkrati pa izboljšala zmogljivost in varčevala s računalniškimi viri. Na podlagi Apple-ovega beležnice, je to pripeljalo do znatnega izboljšanja natančnosti v primerjavi z obstoječimi majhnimi jezikovnimi modeli.

Apple ni samo predstavil modelov OpenELM, temveč je tudi delil osnovno kodo za CoreNet in trenerske recepte, ki so bili uporabljeni, kar omogoča reproducibilnost – korak proti prosojnosti na področju velikih jezikovnih modelov. Izdaja prispeva k odprti raziskovalni skupnosti, čeprav Apple opozarja na inherentne omejitve zaradi usposabljanja na javno dostopnih nizih podatkov, ki se lahko odražajo v rezultatih, ki nosijo pristranskosti ali netočnosti.

Čeprav se ti modeli še niso integrirali v glavne potrošniške naprave Apple-a, obstajajo močni znaki, da bi lahko prihajajoče posodobitve začele uporabljati obdelavo na napravi, da bi izboljšale zasebnost uporabnikov – kar kaže na neposredno in pomembno nadgradnjo zmogljivosti umetne inteligence Apple-a.

Ključna vprašanja in odgovori:

– Kaj je OpenELM?
OpenELM je zbirka AI jezikovnih modelov, zasnovana s strani Apple-a, ki je dovolj kompaktna, da deluje na pametnih telefonih, z namenom učinkovite obdelave jezika.

– Zakaj se Apple preusmerja k kompaktnim AI modelom, kot je OpenELM?
Prehod Apple-a k kompaktnim AI modelom, kot so tisti v zbirki OpenELM, je namenjen vključevanju učinkovitih orodij za AI neposredno na naprave, kar lahko izboljša zasebnost uporabnikov in zmanjša odvisnost od računalniških izračunov v oblaku.

Ključni izzivi in kontroverze:

Eden od potencialnih izzivov za OpenELM Apple-a je ravnotežje med velikostjo modela in učinkovitostjo. Tradicionalno so obsežnejši modeli veljali za močnejše. Apple-ov pristop se osredotoča na ustvarjanje manjših modelov, ki ne ogrožajo učinkovitosti. Vendar pa doseči to lahko tehnično predstavlja izziv, in raziskovalna skupnost AI lahko skrbno preuči te modele, da bi videla, ali je njihova učinkovitost primerljiva z tistimi, ki imajo znatno več parametrov.

Druga kontroverza, ki obdaja jezikovne modele AI, se nanaša na pristranskost in etične vidike. Apple sam opozarja, da ker so modeli usposobljeni na javno dostopnih nizih podatkov, se pristranskosti in netočnosti lahko odražajo v rezultatih. Ta zaskrbljenost je osrednja v razpravi o etiki AI, in kako Apple ali drugi omilijo te pristranskosti, bo neprestano poudarjeno v industriji.

Prednosti in slabosti:

Prednosti:

– Učinkovitost: Kompaktni modeli OpenELM omogočajo učinkovito obdelavo na napravi, kar lahko privede do hitrejših odzivnih časov in zmanjšane prenosa podatkov v oblaku.
– Zasebnost uporabnikov: Z obdelavo podatkov neposredno na uporabnikovi napravi, se manj osebnih informacij pošlje na oddaljene strežnike, kar izboljšuje zasebnost.
– Prosojnost: Deljenje Apple-ove osnovne kode za CoreNet, skupaj s trenerskimi recepti, spodbuja prosojnost in reproducibilnost pri razvoju AI.

Slabosti:

– Omejitve zmogljivosti: Kompaktni modeli se lahko soočajo z omejitvami glede kompleksnosti in globine razumevanja v primerjavi z večjimi modeli, kar lahko vpliva na kakovost odzivov AI.
– Omejitev virov: Obdelava na napravi zahteva, da je strojna oprema naprave zadostna za obvladovanje izračunov, kar morda ni primer za starejše naprave.
– Možne pristranskosti: Kot vsi modeli AI, tisti v sklopu OpenELM lahko podedujejo pristranskosti, prisotne v učnih podatkih, kar lahko vodi do neenakih in napačnih izidov.

Za tiste, ki jih zanima več o inovacijah Apple-a v AI in njihovi uporabi, lahko obiščete Apple-ovo uradno spletno stran na Apple. Upoštevajte, da Apple morda nima neposredne povezave do informacij o OpenELM na svoji domači strani, specifični podatki pa se lahko nahajajo prek novic in posodobitev tehnologije na spletnem mestu.

The source of the article is from the blog girabetim.com.br