Kas on Generatiivne AI usaldusväärne abivahend?

Generatiivne AI, nagu juhtiv suur keelemodel GPT-4, on tõestanud, et omab hämmastavaid võimeid, kuid tal on ka üllatavaid piiranguid. Kuigi GPT-4 suudab kiiresti lahendada keerulisi probleeme, mis panevad proovile inimese eksperdid, jääb ta sageli hätta elementaarsete matemaatikaülesannetega ning raskustega, mida 10-aastane kergesti lahendaks.

Google Deepmind’i uurija Nicholas Carlini lõi oma veebisaidile sõltuvusttekitava viktoriini, et tutvustada GPT-4 märkimisväärseid ja segadusttekitavaid võimeid. Mudeli läbikukkumised Wordle’i väljakutse ja tic-tac-toe võidusammu osas toovad esile selle piirangud. Siiski suudab GPT-4 hõlpsalt luua täisfunktsionaalse javascripti veebilehe, et mängida tic-tac-toe arvuti vastu ja tagada, et arvuti kunagi ei kaota.

GPT-4 ettearvamatud esitlused ilmnevad, kui uurime Boston Consulting Group (BCG) uurimisrühma läbiviidud uuringut. AI-ga varustatud juhtimiskonsultandid ületasid mitmetes reaalsetes ülesannetes, nagu tooteideede genereerimine, turusegmendi analüüs ja pressiteadete kirjutamine, oma kolleege ilma selle tööriistata. AI-ga varustatud konsultandid tegid rohkem tööd kõrgema kvaliteediga ja lühema ajaga.

Siiski sisaldas uuring ülesannet, mis oli teadlikult kavandatud GPT-4 segadusse ajamiseks, paljastades selle haavatavuse. Strateegiliste soovituste andmine finantsteabe ja personaliintervjuude põhjal osutus mudelile väljakutseks. Sageli pakkus see kehva nõu, arvestamata intervjuude sisendeid. See ülesanne oli ainus, kus abita konsultandid tegid paremini.

Generatiivse AI ebaselge piiriga maastiku käsitlemine on väljakutse. Mõnikord ületab AI inimese võimed, teinekord aga jäävad inimesed peale. On oluline eristada, millal toetuda AI abivahendile ja millal usaldada inimlikku otsustusvõimet.

Analoogia saamine iPhone’i mõjust on oluline, et mõelda, kui kiiresti ühiskond muutus nutitelefonidele sõltuvaks, tihti kasutades neid harjumusest, mitte teadliku valiku tagajärjel. Generatiivne AI võib leida oma koha tulevikus, kuid selle kasulikkuse ja võimalike puuduste hindamiseks on vaja hoolikat läbivaatamist. Erinevalt AI-st saab igaüks koostada nimekirja selle kohta, milles nad nutitelefoniga silma paistavad, ja mida nad teevad paremini, kui see on silmist ära. Väljakutse seisneb meenutamises ja vastavalt tegutsemises.

AI tööriistade kasutamise edasiarendamisel jääb näha, kas saame neid paremini kasutada kui nutitelefone.

Korduma kippuvad küsimused Generatiivse AI kohta

1. Mis on Generatiivne AI?
Generatiivne AI viitab tehisintellekti mudelitele, mis suudavad genereerida, luua või toota sisu, nagu tekst, pildid või isegi kood, lähtudes sisendandmetest või mustritest. Üks näide Generatiivsest AI-st on GPT-4, suur keelemodel, mille on välja töötanud OpenAI.

2. Millised on GPT-4 võimed?
GPT-4-l on muljetavaldavad probleemide lahendamise võimed ning ta suudab hakkama saada keerukate ülesannetega, mis panevad proovile inimese eksperdid. Ta suudab luua täisfunktsionaalseid tic-tac-toe mänge toetavaid JavaScripti veebilehti, tagades, et arvuti kunagi ei kaota.

3. Millised on GPT-4 piirangud?
GPT-4-l on raskusi elementaarse matemaatika ja ülesannetega, mida 10-aastane kergesti lahendaks. Ta jääb sageli hätta väljakutsetega nagu Wordle mäng ja optimaalsete käikude tegemine tic-tac-toe’s.

4. Kuidas näitasid teadlased GPT-4 võimeid ja piiranguid?
Google Deepmind’i uurija Nicholas Carlini lõi viktoriini, et näidata GPT-4 märkimisväärseid võimeid ja üllatavaid piiranguid. Viktoriin sisaldas Wordle’i väljakutseid ja tic-tac-toe mänge.

5. Kuidas esines GPT-4 Boston Consulting Group (BCG) poolt läbi viidud uuringus?
Uuring näitas, et AI-ga varustatud juhtimiskonsultandid ületasid oma kolleege, kellel ei olnud seda tööriista, mitmesugustes ülesannetes, nagu tooteideede genereerimine, turusegmendi analüüs ja pressiteadete kirjutamine. Nad tegid rohkem tööd kõrgema kvaliteediga ja lühema ajaga.

6. Kas GPT-4 oli uuringus kõigis ülesannetes edukas?
Ei, uuringus oli ülesanne, mis oli teadlikult kavandatud GPT-4 segadusse ajamiseks: strateegiliste soovituste andmine finantsteabe ja personaliintervjuude põhjal. Mudelil oli selle ülesandega raskusi ning sageli pakkus ta kehva nõu, erinevalt abita konsultantidest, kes tegid paremini.

7. Millal peak

The source of the article is from the blog windowsvistamagazine.es