Az Apple innovációja az AI területén: Bemutatkozik az MM1 Modell

Az Apple, amelyet az innovációról és a titokzatosságról ismernek, viszonylag csendes volt a generatív mesterséges intelligencia (AI) területén. Azonban az Apple mérnökeinek legújabb kutatása azt sugallja, hogy a vállalat jelentős befektetéseket tesz az AI területén, és kifejlesztett egy új modellt, amelyet MM1-nek hívnak. Habár az Apple jelenleg előzetes tárgyalásokat folytat a Google-lel a keresőóriás Gemini AI modell integrálásáról az iPhone-okba, az MM1 fejlesztése rávilágít az Apple saját előrehaladására az AI területén.

Az MM1 egy multimodális nagy nyelvi modell (MLLM), amely működik mind a szövegekkel, mind az ábrákkal. Képes válaszolni a fényképekkel kapcsolatos kérdésekre és megjeleníteni olyan általános ismereteket, amelyek hasonlítanak a ChatGPT által nyújtott chatbotokhoz. A modell neve arra utal, hogy ez az első MultiModal, és hasonlít az olyan AI modellekre, mint a Meta Llama 2 vagy a Google Gemini. Ez azt jelzi, hogy az MM1 potenciálisan beépülhet az Apple termékeibe, gazdagítva ezzel a felhasználói élményt.

Az egyik érdekes példa, amit a kutatási dokumentumban bemutatnak, az MM1 képessége, hogy megértse és válaszoljon bonyolult kérdésekre a képekkel kapcsolatban. Amikor egy olyan fényképet kap, ami egy napfényes étteremasztalt mutat be sörösüvegekkel és étlappal, az MM1 pontosan kiszámítja az asztalon lévő összes sör árát. Ez rámutat az MM1 potenciáljára olyan alkalmazásokban, amelyek képfelismerést és szövegértést igényelnek.

Az Apple MM1-ről szóló kutatási dokumentuma meglepően részletes információkat nyújt a modell képzési módszereiről, beleértve olyan technikákat is, amelyek javítják annak teljesítményét a kép felbontásának növelésével és a szöveg és képadatok beépítésével. Ez a transzparencia szokatlan az Apple számára, és tükrözi azt a vágyát, hogy vonzza az AI tehetségeket és bemutassa képességeit ezen a kulcsfontosságú területen.

Bár az MM1 dokumentuma nem fed fel konkrét terveket az Apple számára, az szakértők spekulálnak arról, hogy ez lépés lehet egy multimodális asszisztens kifejlesztése felé, amely leírja és válaszol a különféle médiaformákra vonatkozó kérdésekre. Ebbe beletartozhatnak a fényképek, dokumentumok és diagramok is. Az Apple zászlóshajó terméke, az iPhone már rendelkezik az AI asszisztens Siri-vel. Azonban a ChatGPT és más hasonló AI modellek térnyerése rávilágított arra, hogy szükség van fejlettebb és sokoldalúbb AI asszisztensekre.

Jelentések arról szólnak, hogy az Apple fontolóra veszi a Google Gemini integrálását az iPhone-okba. Ez arra utal, hogy az Apple AI stratégiájának esetleges bővítése zajlik a generatív AI területén. Az Apple korábban már támaszkodott a Google-re a webes keresési technológia terén mobil eszközeinél, így a Gemini beépítése természetes kiterjesztése lehetne ennek a partnerségnek. Az Apple azonban bebizonyította képességét az alternatívák létrehozására az külső szolgáltatások esetén, ahogy az 2012-es Google Térkép saját térképalkalmazással való helyettesítése is mutatja.

Az Apple vezérigazgatója, Tim Cook, megígérte, hogy a vállalat több részletet is elárul a generatív AI terveiről idén. Míg olyan riválisok, mint a Samsung és a Google már integrálják a generatív AI eszközöket eszközeikbe, az Apple komoly nyomás alatt áll az állandóan fejlődő technológiai környezetben. Elképzelhető, hogy az Apple a Gemini-változatait és saját belső AI-ját is kihasználhatja a jelenleg MM1 és más saját modelljén alapuló új generatív AI eszközök építésekor.

Tekintve az Apple hangsúlyát a felhasználói adatvédelemre és az eszközön belüli algoritmusokra, várható, hogy az Apple az on-device algoritmusok fejlesztésére összpontosít majd az AI modellek, például az MM1 esetében. Ez egybevág az Apple elkötelezettségével a felhasználói adatok védelme és a felesleges adatmegosztás elkerülése terén. Az Apple legutóbbi AI kutatási dokumentumai is azt vizsgálták, hogyan lehet a felhasználók adatvédelmét megőrizni.

Az Apple folytatja befektetéseit és előrelépéseit az AI területén, és az MM1 fejlesztése friss nézőpontot kínál a cég elkötelezettségéről ezen átalakító technológia iránt. Az MM1 és a Gemini esetleges integrációjával az Apple erőteljes multimodális AI képességekkel gazdagíthatja termékeit, miközben megtartja a magas adatvédelmi és biztonsági színvonalait.

GYIK

The source of the article is from the blog xn--campiahoy-p6a.es

Privacy policy
Contact