Generatiivse teabe eraldamise kasutamine suurtes keelemudelites

Ülitähtis uuring, mille viis läbi Hiina Teaduse ja Tehnoloogia Ülikool, Kognitiivse Intelligentsi Riiklik Võtme labor, City University of Hong Kong ja Jarvisi Uurimiskeskus, uurib uut lähenemisviisi generatiivse teabe eraldamisele (IE), kasutades suuri keelemudeleid (LLM). Selle asemel, et tugineda traditsioonilistele meetoditele struktureeritud teabe eraldamiseks struktureerimata tekstist, kasutab see uus lähenemisviis LLM-e struktuurse teabe genereerimiseks, näidates selle potentsiaali reaalmaailma rakendustes.

Uurijad kasutavad kahte taksonoomiat, et klassifitseerida praeguste esinduslike meetodite generatiivset IE-d: üks keskendub õppimise paradigmatitele ja teine IE alamtöödele. Kasutades neid taksonoomiaid, hindab uuring LLM-e IE jaoks nende etenduse põhjal konkreetsetes valdkondades. Hindamine annab ka ülevaate LLM-ide kasutamise piirangutest ja tulevastest võimalustest generatiivses IE-s.

Uuring tutvustab neli nimetatud isiku tuvastamise (NER) järeldusstrateegiat, mis jäljendavad ChatGPT võimekust nulliga NER-is. Kuigi LLM-id näitavad lootust suhtesid ekstraheerides (RE), on vaja edasisi uuringuid nende etenduse parandamiseks sündmuste ekstraheerimise (EE) ülesannetes, arvestades juhiste keerukust ja vähese vastupidavust. Lisaks hindab uuring erinevaid IE alamtöid, paljastades, et LLM-id on teatud keskkondades, nagu OpenIE, suurepärased, samas kui nad jäävad BERT-põhiste mudelitele alla tavalistes IE seadetes.

Kuigi varasemad generatiivse IE lähenemised olid valdkonna- või ülesandest eristatud, pakub LLM-ide integreerimine võimalust ühtsemateks tehnikateks. Siiski on väljakutseid, näiteks laiendatud konteksti sisendi ja struktureeritud väljundi ühtlustamine. Uurijad soovitavad edasi uurida LLM-ides kontekstipõhist õppimist, rõhutades näidete valiku olulisust ja universaalsete IE raamistike arendamist, mis sobivad erinevate valdkondade ja tegevustega.

Uuring rõhutab ka promptide tähtsust LLM-ide mõistmise ja järeldamisvõime parandamiseks. Selle hulka kuulub LLM-ide sundimine loogilistele järeldustele ja seletatava väljundi genereerimisele. Interaktiivne prompti kujundus, mis hõlmab mitme sammu küsimuste ja vastuste struktuuri, on veel üks akadeemiline uurimissuund.

Kokkuvõttes näitab see pioneeriuuring generatiivse IE potentsiaali kasutamiseks LLM-ides, pakkudes olulisi teadmisi nende etenduse, piirangute ja tulevaste suundade kohta. LLM-idega seotud IE edasised edusammud võivad oluliselt kaasa aidata loomuliku keele töötlemise valdkonnale.

The source of the article is from the blog mivalle.net.ar