Jabĺk uvádza modely OpenELM AI so zameraním na prístupnosť a inovácie vo verejnej oblasti

Apple vstúpil do open-source oblasti s vydávaním série generačných umelej inteligencie (AI) jazykových modelov známych kolektívne ako OpenELM. Tieto modely sú významne menšie v kapacite než mnoho ich súčasníkov a ponúkajú zjednodušený prístup k integrácii do rôznych projektov, potenciálne revolucionizujúcich aplikácie AI v rôznych odvetviach.

Názov OpenELM je skratka pre „Open Efficient Language Models“ a naznačuje základnú filozofiu dizajnu platformy. OpenELM ponúka schopnosti generovania textu štruktúrované okolo viacerých veľkostí parametrov:

– 270 miliónov parametrov
– 450 miliónov parametrov
– 1,1 miliardy parametrov
– 3 miliardy parametrov

Parametre tu odkazujú na počet premenných, ktoré model používa na spracovanie a generovanie textu na základe svojho školenia. Najväčší model OpenELM od Applu je trochu menší než najjednoduchší model umelej inteligencie Phi-3 od Microsoftu, ktorý pozostáva z 3,8 miliardy parametrov.

OpenELM je pripravený na použitie v handheld zariadeniach a kompaktný počet parametrov ho robí ideálnym pre zariadenia s obmedzenou výpočtovou silou alebo batériovou kapacitou, vrátane rozpočtových smartfónov a nositeľnej technológie. Všestrannosť OpenELM je zvýšená cez jeho dostupnosť na Hugging Face s „licenciou kódu vzorku“, čo umožňuje úpravy a dokonca aj komerčné využívanie zdrojového kódu modelu. Možnosti sú obmedzené len tvorivosťou vývojárov.

Jedno potenciálne využitie predstavuje situáciu, kde si užívateľ pokynie telefónu, aby napísal odpoveď na e-mail hlasom – úlohu, ktorú by aplikácia založená na OpenELM mohla vykonať s minimálnym nárokom na spracovanie a energiu. Táto situácia, aj keď hypotetická, zdôrazňuje efektívnosť a kreativitu, ktoré OpenELM môže priniesť do každodenných úloh.

Applin krok k priaznivejšiemu postaveniu v open-source s vydaním OpenELM otvára nové možnosti využitia a rozvoja. Avšak vývojári by sa mali dôkladne oboznámiť s licenčnými podmienkami, aby sa vyhli porušeniu, pretože Apple si vyhradzuje právo uplatňovať patenty na odvodené diela, ktoré by mohli porušiť práva spoločnosti.

Je dôležité podotknúť, že modely OpenELM boli trénované použitím rozsiahleho 1,8 biliónového datasetu tokenov, čerpajúceho z rôznych zdrojov ako Reddit, StackExchange, Wikipedia a arXiv, čo naznačuje rozsah a hĺbku základného poznania modelu.

Pre ďalšie informácie o Apple a jeho iniciatívach môžete navštíviť hlavnú webovú stránku na Apple. Myslite však na to, že konkrétna stránka týkajúca sa OpenELM by nemusela byť priamo prístupná z domovskej stránky. Doména poskytuje východisko na preskúmanie rôznych projektov a noviniek.