Jõusta tehisintellekti programmeerima: suurte keelemudelite edendamise võti

Tehisintellekti genereerimistehnoloogia on viimastel aastatel kiiresti arenenud, kuid endine Salesforce’i juht Richard Socher usub, et siin on siiski arendamise ruumi. Harvard Business Review podcastis arutles Socher, kuidas suudame suured keelemudelid paremaks muuta, sundides neid reageerima koodi abil antud ülesannetele, mitte ainult ennustades järgmist märksõna.

Hetkel tuginevad suured keelemudelid eelnevate andmete põhjal järgmise märksõna ennustamisele. Kuigi need mudelid näitavad muljetavaldavat lugemisarusaamist ja programmeerimisoskust, esineb neil sageli hallutsinatsioone, kus nad teevad faktivead nagu need oleksid tõesed. See muutub eriti probleemseks keerukate matemaatiliste küsimuste korral.

Socher tõi näite suurele keelemudelile keerulise küsimuse esitamisest: “Kui ma annaksin beebile sünnihetkel 5000 dollarit, et investeerida mitterahaaktsiaindeksifondi, ja eeldades teatud protsendilist keskmist aastatulu, kui palju tal oleks vanuses 2-5 aastat?” Selle asemel, et küsimust hoolikalt kaaluda ja vajalikud arvutused teha, genereeriks mudel teksti, mis põhineb sarnastele varem kogetud küsimustele.

Selle piirangu ületamiseks pakub Socher välja mudeli “sundimise” tõlkida küsimus arvutikoodiks ja genereerida vastus selle koodi alusel. Sel viisil on mudelil suurem tõenäosus pakkuda täpset vastust. Socher mainis, et nende tehisintellekti toel töötavas otsingumootoris You.com on neil õnnestunud küsimusi tõlkida Pythoni koodiks.

Erinevalt tavapärasele lähenemisviisile, mis seisneb lihtsalt andmete ja arvutusvõimu suurendamises, usub Socher, et programmeerimisel on suur roll suurte keelemudelite edendamisel. Õpetades neid mudelitele programmeerima, saavad need sügavama arusaamise ja mitmekülgsemad probleemilahendusvõimed. Selline programmeerimisõpe võimaldab neil tulevikus tegeleda keerukamate ülesannetega.

Suurte keelemudelitevahelise konkurentsi intensiivistudes, kus OpenAI GPT-4 ja Google’i Gemini püüavad saavutada ülemvõimu, pakub Socheri seisukoht värsket vaatenurka tehisintellekti võimete edendamisele. Selle asemel, et tugineda ainult andmete suurendamisele, võib tehisintellektimudelite sundimine programmeerima avada nende täieliku potentsiaali ja viia valdkonnas olulistesse edusammudesse.

Sagedased küsimused (KKK) suurte keelemudelite edendamise kohta programmeerimise abil

K: Mis on praeguste suurte keelemudelite väljakutse?
A: Praegustel suurtel keelemudelitel on piirangud täpsete vastuste pakkumisel keerulistele küsimustele, eriti neile, mis vajavad matemaatilisi arvutusi. Neil esineb sageli hallutsinatsioone, kus luuakse faktivead nagu need oleksid tõesed.

K: Milline on ettepanek lahendada need piirangud?
A: Richard Socher pakub välja suurte keelemudelite “sundimise” tõlkida küsimused arvutikoodiks ja genereerida vastused selle koodi põhjal. See suurendab mudelite suutlikkust anda täpseid vastuseid.

K: Kuidas küsimuste tõlkimine koodiks parandab mudeleid?
A: Küsimuste tõlkimine koodiks aitab mudelitel sügavamalt mõista küsimusi ja võimaldab neil teha vajalikke arvutusi. See lähenemine tugevdab nende probleemilahendusvõimeid ja suurendab täpsete vastuste tõenäosust.

K: Kas see lähenemine on rakendatud mõnes tehisintellekti toel töötavas otsingumootoris?
A: Jah, You.com tehisintellekti toel töötavas otsingumootoris on edukalt tõlgitud küsimusi Pythoni koodiks, et parandada vastuste täpsust.

K: Kuidas erineb see programmeerimisõpe traditsioonilisest lähenemisviisist, kus suurendatakse andmeid ja arvutusvõimsust?
A: Socheri sõnul on suurte keelemudelite võimete edendamiseks oluline õpetada neile programmeerimist, mitte ainult suurendada andmeid. Mudelite programmeerimine võimaldab neil sügavamat arusaamist ja mitmekülgsemaid probleemilahendusoskusi keerukamate ülesannete lahendamiseks tulevikus.

K: Kuidas eristub Socheri seisukoht suurte keelemudelite vahelises konkurentsis?
A: Socheri seisukoht pakub värsket vaatenurka tehisintellekti võimete edendamisele. Selle asemel, et ainult andmeid suurendada, võib tehisintellektimudelite sundimine programmeerima avada nende täieliku potentsiaali ja viia valdkonnas olulistesse edusammudesse.

Võtmesõnad/sõnastik:
– Genereeriv tehisintellekti tehnoloogia: viitab AI mudelitele, mis suudavad toota originaalset sisu, luues uusi andmeid olemasolevatest mustritest ja näidetest.
– Keelemudelid: AI mudelid, mis on spetsiaalselt välja töötatud inimkeele genereerimiseks ja mõistmiseks.
– Hallutsinatsioonid: tehisintellekti keelemudelite kontekstis viitab faktiveale, mida luuakse nagu need oleksid tõesed.
– Märksõna: keelemudelites viitab märksõna tekstisegmendile, tavaliselt sõnale või sümbolile.
– Pythoni kood: programmeerimiskeel, mida Socher kasutab näitena keelemudelite parendamiseks koodi tõlkimiseks.

Soovitatavad seotud lingid:
OpenAI – OpenAI ametlik veebisait, tuntud suurte keelemudelite nagu GPT-4 poolest.
Google – Google’i ametlik veebisait, ettevõte, mis on suurte keelemudelite nagu Gemini taga.

The source of the article is from the blog macholevante.com