Pokreipininės informacijos išgavimo naudojant didelio kalbos modelių rinkinio galimybes

Išskirtinė studija, kurią atliko Kinijos Mokslo ir Technologijos Universitetas, Kognityvinės intelekto valstybinio svarbos laboratorija, Honkongo Miesto Universitetas ir „Jarvis” tyrimų centras, aiškina naują metodiką pokreipininei informacijos išgavimui (IE) naudojant didelių kalbos modelių (LLM) rinkinį. Vietoje tradicinių metodo, kuris paremtas struktūrizuotos žinių išgavimo iš nestruktūrizuotų tekstų, šis naujas metodas naudoja LLM’us informacijos struktūros generavimui, demonstruodamas jo galimybes praktiniuose taikymuose.

Tyrimo autoriai naudoja du taksonomijos principus, klasifikuodami dabartinius atstovaujančius IE metodus: vienas susijęs su mokymo paradigma, o kitas – su IE po-taikymu. Naudojant šias taksonomijas, studija įvertina LLM’us IE pagal jų pasirodymą konkrečiose srityse. Įvertinimas taip pat suteikia įžvalgų apie ribas ir ateities galimybes, siekiant naudoti LLM’us pokreipininei informacijos išgavimui.

Studija pristato keturias vadinamojo vardo subjekto atpažinimo (NER) samprotavimo strategijas, kurios kopijuoja ChatGPT galimybes atliekant nulinio ižvalgos NER. Nors LLM’ai rodo galimybes Atstovaujancios medžiagos išgavime (RE), reikia toliau tirti jų pasirodymą Užėmimo išgavimo (EE) užduotyse dėl instrukcijų sudėtingumo ir atsparumo trūkumo. Be to, studija vertina įvairias IE po-taikybes, atskleisdama, kad LLM’ai puikiai pasirodo tam tikrose aplinkose, tokiose kaip Atvirasis IE, tuo tarpu lyginant su BERT pagrindiniais modeliais jie nepatenkina normalių IE nustatymų.

Nors ankstesni pokreipinės IE metodai buvo srities ar užduoties specializuoti, LLM’ų įtraukimas suteikia galimybę derinti vienodas technikas. Vis dėlto, iššūkiai tebėra, pvz., išplėsto konteksto įvesties ir struktūrizuoto išvesties sutelkimas. Tyrimo autoriai rekomenduoja toliau tir-ti kontekste mokymosi galimybes atsižvelgiant į LLM’us, pabrėždami pavyzdžių atrankos svarbą ir universalių IE pagrindų kūrimą, pritaikomų skirtingoms sritims ir veikloms.

Tyrimas taip pat pabrėžia reikšmę tobulinant mėginimus, siekiant pagerinti LLM’ų supratimo ir samprotaujančių gebėjimų. Tai apima skatinti LLM’us daryti logiškas išvadas ir generuoti paaiškinamą išvestį. Interaktyvus lūkesčių projektavimas, įtraukiant kelių atsakymų į klausimus scenarijus, yra dar viena akademinių tyrimų kryptis.

Išvadose ši pionierinė studija parodo pokreipinės IE potencialą, naudojant LLM’us, suteikiant vertingų įžvalgų apie jų pasirodymą, ribas ir ateities kryptis. Tolimesni LLM’ų pagrindu paremti IE patobulinimai gali labai prisidėti prie natūraliosios kalbos apdorojimo srities.

The source of the article is from the blog yanoticias.es