Csendes-STaR: A Mesterséges Intelligencia Képességeinek Fejlesztése

Az inspiráló kutatások szerint a kutatók felfedezték, hogy a mesterséges intelligencia (MI) rendszereknek egy „belső monológ” adása jelentősen növeli képességüket a gondolkodásra. Az AI tanítása arra, hogy gondolkodjon mielőtt válaszolna az ösztönzésekre, hasonlóan ahogy az emberek mérlegelik következő szavait mielőtt megszólalnának, egy forradalmian új módszertan, a „Csendes-STaR” került kifejlesztésre. Ez az innovatív megközelítés arra tanítja az AI rendszereket, hogy egyszerre generáljanak több belső indoklást, mielőtt választ alkotnának, lehetővé téve az AI számára a legjobb válasz nyújtását.

A hagyományos AI chatbotokkal, mint például a ChatGPT, ellentétben, amelyek nem mérlegelik válaszaikat, vagy nem számítanak különböző beszélgetési lehetőségekre, a Csendes-STaR algoritmus felruházza az AI ügynököket azzal a képességgel, hogy egyszerre több jóslatot és indoklást generáljanak. Amikor válaszokat szolgáltatnak, az AI kombinálja és bemutatja a legmegfelelőbb választ, amelyet ezután egy emberi résztvevő értékelhet a kérdés természetétől függően. Ezen folyamat során az incorrakt indoklásokat elvetik, lehetővé téve, hogy az AI felkészüljön a jövőbeli beszélgetésekre és tanuljon az aktuális interakciók során.

A kutatók a Mistral 7B nyílt forráskódú nagy nyelvi modellt (LLM) használva alkalmazták a Csendes-STaR algoritmust, és figyelemre méltó javulásokat tapasztaltak. A Csendes-STaR képzett Mistral 7B változata 47,2%-os érvelési pontszámot ért el a képzés előtti 36,3%-os pontszámmal összehasonlítva. Habár még mindig küzdött egy iskola matematika teszttel, ahol 10,9%-ot ért el, ez jelentős javulást jelentett a vanilla verzió kezdeti 5,9%-os pontszámához képest.

Fontos megjegyezni, hogy a kutatók arra összpontosítottak, hogy megoldják a meglévő AI modellek korlátait a józan észbeli érvelés és a kontextualizáció területén. A ChatGPT és Gemini nevű nyelvi modellek, amelyek neuronhálózatokon alapulnak és megpróbálják utánozni az emberi agy szerkezetét és tanulási mintázatait, jelenleg nem képesek valódi megértésre. Az érvelési képességek növelésére irányuló korábbi kísérletek leginkább területspecifikusak voltak, korlátozva alkalmazhatóságuk különböző AI modellekre.

A Csendes-STaR módszertan kiemelkedik sokoldalúsága, a háttérben csendben működő képessége és az eltérő LLM típusokkal való implementálásának lehetősége miatt. A kutatók a máról-tanult érvelő (STaR) algoritmus alapjain építve azt a célt tűzték ki maguk elé, hogy áthidalják a neuronhálózat alapú AI rendszerek és az emberihez hasonló érvelési képességek közötti szakadékot. Ez az ígéretes kutatás új ajtókat nyit az MI technológia fejlesztése felé.

Gyakran Ismételt Kérdések (FAQ)

1. Mi az a Csendes-STaR?
– A Csendes-STaR egy módszertan, amely arra tanítja az AI rendszereket, hogy generáljanak belső indoklásokat mielőtt válaszolnának az ösztönzésekre, javítva ezzel érvelő képességüket. Az incorrakt indoklásokat elveti, és különböző jóslatok kombinációját használja a legjobb válasz nyújtására.

2. Miben különbözik a Csendes-STaR a hagyományos AI chatbotoktól?
– Ellentétben a hagyományos AI chatbotokkal, amelyek nem gondolkoznak vagy nem várnak különböző lehetőségekbe a beszélgetés során, a Csendes-STaR felruházza az AI ügynököket a képességgel, hogy egyszerre számos indokolást megfontoljanak és jobb válaszokat generáljanak.

3. Milyen korlátai vannak a jelenlegi AI modelleknek?
– A meglévő AI modellek küzdenek a józan észbeli érvelés és a kontextualizáció területén. A neuronhálózat alapú modellek, mint a ChatGPT és a Gemini, hiányoznak a valódi megértésből.

4. Hogyan segíti a Csendes-STaR az AI érvelési képességeit?
– Az AI rendszerek tanításával azon gondolkodásra mielőtt válaszolnak, a Csendes-STaR lehetővé teszi számukra a jövőbeli beszélgetések előrejelzését, tanulást az aktuális interakciókból és az érvelő pontszámok javítását.

Források:
– arXiv Database
– Live Science

The source of the article is from the blog newyorkpostgazette.com