Priversdami dirbti dirbti programoms: Raktas į pažangą su didelėmis kalbos modeliais

Generuojantys dirbtinio intelekto (AI) modeliai pastaraisiais metais sparčiai pažengė, tačiau buvęs Salesforce vadovas Richard Socheris mano, kad yra vietos tobulinimui. Harvard Business Review interviu Socheris aptarė, kaip galime padidinti didelius kalbos modelius, verčiant juos atsakyti į programavimo užduotis, o ne tik prognozuoti sekančią žymę.

Šiuo metu didieji kalbos modeliai remiasi prognozuojant sekančią žymę pagal ankstesnius duomenis. Nors šie modeliai demonstruoja įspūdingą skaitymo supratimą ir programavimo įgūdžius, jie dažnai kenčia nuo haliucinacijų, kuomet, pavyzdžiui, klaidingai pateikia faktines klaidas. Tai tampa ypač problematiška susidūrus su sudėtingais matematiniais klausimais.

Socheris pateikė tokio klausimo pavyzdį, su kuriuo didelis kalbos modelis gali susidurti: „Jeigu kūdikiui gimimo metu duosiu 5000 dolerių investuoti į fondą be mokesčių už akcijas ir priimsime tam tikrą metinį pelno procentą, kiek jis turės sulaukęs dvejų ar penkių metų?” Vietoje kruopščiai apsvarstymo ir būtinų skaičiavimų atlikimo modelis sugeneruotų tekstą pagal panašius ankstesnius klausimus.

Norint įveikti šią ribotybę, Socheris siūlo „priversti” modelį išversti klausimą į kompiuterinį kodą ir pagal tą kodą generuoti atsakymą. Taip padarydami, modelis tikėtiniau pateiks tikslesnį atsakymą. Socheris minėjo, kad jo valdomame AI pagrindiniame paieškos variklyje, You.com, jie jau sugebėjo išversti klausimus į Python programavimo kalbos kodą.

Priešingai nei paplitusi praktika tik didinant duomenų ir skaičiavimo galios mastą, Socheris siūlo, jog programavimas labai svarbus dideliems kalbos modeliams tobulinti. Mokydamiesi programuoti šie modeliai įgis gilesnį supratimą ir platesnes gebėjimas spręsti problemas. Šis programavimo metodas leis jiems įveikti sudėtingesnes užduotis ateityje.

Didelių kalbos modelių konkurencija vis smarkėja, su OpenAI GPT-4 ir Google Gemini siekiančiais viršenybės, Todėl Socherio požiūris suteikia naują perspektyvą į AI galimybes. Vietoje vien tik didinant duomenis, priverstinis AI modelių programavimas gali atskleisti jų visą potencialą ir leisti žymiai pažangos šioje srityje.

D.U.K (Daugiausiai Užduodami Klausimai) apie didelius kalbos modelius, patobulintus per programavimą

K: Kokia problema su dabartiniais dideliais kalbos modeliais?
A: Esami didelai kalbos modeliai turi apribojimus, kadangi neatitinka reikalavimų tiksliai atsakyti į sudėtingus klausimus, ypač tuos, reikalaujančius matematinių skaičiavimų. Dažnai jie patiria haliucinacijas, kurios sukelia klaidingas faktines klaidas.

K: Kokia yra pasiūlyta problema, kurią įveikti?
A: Richard Socheris siūlo „priversti” didelius kalbos modelius išversti klausimus į kompiuterinį kodą ir pagal tai generuoti atsakymus. Taip padarydami, modeliai tikėtiniau pateiks tikslius atsakymus.

K: Kaip klausimų vertimas į kodą gerina modelius?
A: Klausimų vertimas į kodą padeda modeliams giliau suprasti klausimus ir leidžia jiems atlikti būtinus skaičiavimus. Šis požiūris pagerina jų problemų sprendimo gebėjimus ir padidina tikimybę gauti tiksliais atsakymais.

K: Ar šis metodas buvo įgyvendintas kokiame nors AI variklyje?
A: Taip, valdomame AI paieškos variklyje You.com sėkmingai išverčiami klausimai į Python programavimo kalbos kodą, norint pagerinti atsakymų tikslumą.

K: Kuo šis programavimo metodas skiriasi nuo tradicinio duomenų ir skaičiavimo galios didinimo metodo?
A: Socheris teigia, kad didiesiems kalbos modeliams išmokyti programuoti bus lemiamas veiksnys tobulinant jų galimybes, o ne vien tik didinant duomenis. Programuojant modelius, jie įgauna gilesnį supratimą ir platesnes gebėjimas spręsti problemas, kurios yra sudėtingesnės ateityje.

K: Kuo Socherio požiūris išsiskiria tarp didelių kalbos modelių konkurencijos?
A: Socherio požiūris į AI galimybes įneša naują perspektyvą. Vietoje vien tik didinant duomenis, priverstinis AI modelių programavimas gali atskleisti jų visą potencialą ir vesti prie reikšmingų pažangų šioje srityje.

Pagrindiniai terminai/žargonas:
– Generuojanti AI technologija: Nuoroda į AI modelius, gebančius generuoti originalų turinį pagal egzistuojančių duomenų pavyzdžius ir šablonus.
– Kalbos modeliai: AI modeliai, specialiai sukurti generuoti ir suprasti žmogaus kalbą.
– Haliucinacijos: AI kalbos modelių kontekste tai reiškia klaidingų faktinių klaidų generavimą, tarsi jos būtų tiesa.
– Žymių žymė: Kalbos modeliuose žymių žymė yra tekstinė dalis, dažniausiai žodis arba simbolis.
– Python kodas: Socheriui naudojama programavimo kalba kaip pavyzdys, kaip išversti kodą didelių kalbos modelių gerinimui.

Siūlomi susiję nuorodų:
OpenAI – Oficiali OpenAI svetainė, žinoma dėl didelių kalbos modelių, tokių kaip GPT-4.
Google – Oficiali Google svetainė, bendrovė, stovinti už didelių kalbos modelių, pvz., Gemini.

The source of the article is from the blog klikeri.rs