Microsoft Research esitleb GraphRAG-i: Suurte keelemudelite võimu avamine

Suured keelemudelid (LLMid) on revolutsioonilised mitmesugustes tööstusharudes, alates tervishoiust meelelahutuseni, tänu nende erakordsetele võimetele loomuliku keele töötlemises (NLP) ja loomuliku keele genereerimises (NLG). Siiski on nende mudelite funktsionaalsuse laiendamine kaugemale treenitud andmetest keelemudelite uurimisvaldkonnas olnud oluline väljakutse.

Selle probleemi lahendamiseks on Microsoft Research välja töötanud innovaatilise lahenduse nimega GraphRAG. GraphRAG kasutab LLM-ide loodud teadmiste graafe, et parandada tagastamise lisatud genereerimise (RAG) süsteemide jõudlust. Erinevalt traditsioonilistest RAG metoodikatest, mis tuginevad otsingustrateegiates vektorisarnasusele, tutvustab GraphRAG LLM-ide loodud teadmiste graafe keeruka teabe analüüsimiseks dokumentides, mis viib parandatud jõudluseni.

Traditsioonilised baasjoone RAG süsteemid võitlevad sageli kondenseeritud semantiliste kontseptsioonide mõistmisega ja seoste loomisega mitteseotud andmete vahel. Vastupidiselt pakub GraphRAG keerukamat lähenemist, nagu näitab ulatuslik analüüs.

Microsoft Research viis läbi põhjaliku analüüsi kasutades Violent Incident Information from News Articles (VIINA) andmestikku GraphRAG-i potentsiaali demonstreerimiseks. Tulemused näitasid GraphRAG-superioorset jõudlust võrreldes baasjoone RAG-iga, eriti olukordades, kus on vaja põhjalikku arusaamist semantilistest kontseptsioonidest ja seoste loomist.

Lisaks rikastas meeskond oma LLM-ide põhist tagasipöördumist luues privaatse andmekogumi. Nad tõlgendasid tuhandeid uudislugusid vene ja ukraina allikatest inglise keelde, mis täiendas nende GraphRAG-süsteemi veelgi. Võrreldes baasjoone RAG-iga, näitas GraphRAG erakordseid võimeid päringute käitlemisel, mis nõudsid andmete kogumist mitmest andmekogumist.

GraphRAG ületas baasjoone RAG-i gruppeerides privaatse andmekogumi relevantsesse semantilisse klastri kasutades struktureeritud teadmistegraafi. See lähenemine võimaldas GraphRAG-il pakkuda põhjalikke ülevaateid teemadest ja kontseptsioonidest, suurendades oluliselt RAG-i tagasipöördumise osa.

Kokkuvõttes pakub Microsoft Researchi GraphRAG läbimurdelist arengut keelemudelites, kasutades LLM-ide loodud teadmistegraafide võimu. See ainulaadne metoodika avab uued võimalused andmete uurimiseks ja seab GraphRAG-i tugevaks tööriistaks tagastamise lisatud genereerimise võimete suurendamisel. GraphRAG-i abil saavad LLM-id nüüd lahendada keerulisi probleeme erakogumikel, muutes keelemudelite uurimisvaldkonna revolutsiooniks.

The source of the article is from the blog lokale-komercyjne.pl

Privacy policy
Contact