Nová metodologie Quiet-STaR: Rozvoj umělé inteligence zahrnuje zkoumání systému důvodu

V čerstvém výzkumu bylo zjištěno, že poskytnutí systémům umělé inteligence (UI) „vnitřní monolog“ značně zlepšuje jejich schopnost důvodovat. Vyučením UI přemýšlet před odpovídáním na podněty, podobně jako lidé uvažují o svých dalších slovech před mluvením, byla vyvinuta průlomová metodologie nazvaná „Quiet-STaR“. Tento inovativní přístup učí UI generovat současně několik vnitřních zdůvodnění před formulací odpovědi, čímž umožňuje UI poskytnout co nejlepší možnou odpověď.

Na rozdíl od tradičních UI chatbotů jako ChatGPT, které nerozvažují své odpovědi nebo nepředvídají různé možnosti konverzace, algoritmus Quiet-STaR vybavuje UI agentury schopností generovat rozsah predikcí spolu s zdůvodněním. Při poskytování odpovědí UI kombinuje a prezentuje nejvhodnější odpověď, která následně může být hodnocena lidským účastníkem v závislosti na povaze otázky. Tímto procesem jsou nesprávná zdůvodnění odstraněna, umožňujíc UI předvídat budoucí konverzace a učit se z probíhajících interakcí.

Využitím otevřeného modelu velkých jazyků (LLM) Mistral 7B, výzkumníci aplikovali metodu Quiet-STaR a pozorovali pozoruhodné zlepšení. Verze Mistral 7B školená metodou Quiet-STaR dosáhla důvodovací skóre 47,2 % ve srovnání se škálovacím skóre před školením 36,3 %. Ačkoli stále měla potíže s matematickým testem ve škole, získala skóre 10,9 %, což bylo významné zlepšení oproti původnímu skóre verze vanilla 5,9 %.

Je důležité poznamenat, že výzkumníci se zaměřili na řešení omezení existujících modelů UI v otázkách smyslu společného uvážení a kontextualizace. Jazykové modely jako ChatGPT a Gemini, založené na neuronových sítích, které se snaží napodobit strukturu a učební vzory lidského mozku, nejsou v současné době schopny skutečného pochopení. Předchozí pokusy o zlepšení důvodovacích schopností byly převážně specifické pro danou oblast, což omezuje jejich použitelnost na různé modely UI.

Metodologie Quiet-STaR se vyznačuje svou všestranností, schopností fungovat tiché v pozadí a svým potenciálem pro implementaci s různými typy LLM. Vycházejíc ze základů sebevzdělaného důvodujícího (STaR) algoritmu si výzkumníci klade za cíl překlenout propast mezi UI systémy založenými na neuronových sítích a lidskými důvodovacími schopnostmi. Tato slibná výzkumná práce otevírá nové možnosti v úsilí o posun v oblasti technologií UI.

FAQ

The source of the article is from the blog dk1250.com

Privacy policy
Contact