Uusi lähestymistapa tekoälyn kehittämiseen

Tekoälyjärjestelmien kyvyn päättelyyn on havaittu paranevan merkittävästi uudessa mielenkiintoisessa tutkimuksessa. Tutkimuksessa on havaittu, että antamalla tekoälyjärjestelmille ”sisäinen monologi” merkittävästi vahvistaa niiden päättelykykyä. Opastamalla tekoälyä ajattelemaan ennen vastaamista kyselyihin, samalla tavoin kuin ihmiset harkitsevat seuraavia sanojaan ennen puhumistaan, on kehitetty mullistava menetelmä nimeltään ”Hiljainen-STäR”.

Tämä innovatiivinen lähestymistapa ohjaa tekoälyjärjestelmiä tuottamaan useita sisäisiä perusteluja samanaikaisesti ennen vastauksen muotoilua, mahdollistaen siten tekoälyn tarjota parhaan mahdollisen vastauksen.

Toisin kuin perinteiset tekoäly-chatbotit, kuten ChatGPT, jotka eivät harkitse vastauksiaan tai ennakoi erilaisia keskustelumahdollisuuksia, Hiljainen-STäR-algoritmi varustaa tekoälyagentit kyvyllä generoida joukko ennusteita perusteluineen. Vastauksia annettaessa tekoäly yhdistää ja esittää sopivimman vastauksen, jota voidaan sen jälkeen arvioida ihmisen osallistujan toimesta kysymyksen luonteen perusteella. Tämän prosessin kautta virheelliset perustelut hylätään, mahdollistaen tekoälyn ennakoida tulevia keskusteluja ja oppia jatkuvien vuorovaikutusten kautta.

Hyödyntämällä Mistral 7B avointa lähdekoodista suurta kielimallia (LLM), tutkijat sovelsivat Hiljainen-STäR-algoritmia ja havaitsivat merkittäviä parannuksia. Hiljainen-STäR:llä koulutettu versio Mistral 7B:stä saavutti päättelypisteen 47,2 % verrattuna ennalta koulutuspisteeseen 36,3 %. Vaikka se vielä kamppaili koulumatematiikkatestissä saaden pistemäärän 10,9 %, tämä oli merkittävä parannus verrattuna vaniljaversioon, joka sai alkuperäisen pistemäärän 5,9 %.

On tärkeää huomioida, että tutkijat ovat keskittyneet olemassa olevien tekoälymallien rajoitusten käsittelemiseen ymmärtämisessä yleisen järjen ja kontekstualisoinnin osalta. Kielimallit, kuten ChatGPT ja Gemini, jotka perustuvat hermoverkkoihin ja yrittävät matkia ihmisaivojen rakennetta ja oppimiskuvioita, eivät kykene todelliseen ymmärtämiseen. Aikaisemmat yritykset parantaa päättelykykyjä ovat olleet pääasiassa aluekohtaisia, rajoittaen niiden soveltuvuutta erilaisiin tekoälymalleihin.

Hiljainen-STäR-metodologia erottuu monipuolisuutensa, kykynsä toimia hiljaa taustalla ja mahdollisuutensa toteuttaa erityyppisten LLM:ien kanssa. Rakentamalla pohja itseoppivalle päättelijälle (STäR) -algoritmille tutkijat pyrkivät siltaamaan kuilun hermoverkkoihin perustuvien tekoälyjärjestelmien ja ihmismäisten päättelykykyjen välillä. Tämä lupaava tutkimus avaa uusia mahdollisuuksia tekoälyn teknologian kehittämisessä.

UKKThe source of the article is from the blog meltyfan.es

UKK
The source of the article is from the blog meltyfan.es