Új keretrendszer ‘DocGraphLM’ javítja a dokumentumértést

A JPMorgan AI Kutató és a Dartmouth College kutatói kifejlesztettek egy új, innovatív keretrendszert, amelyet ‘DocGraphLM’-nek neveznek, és jelentősen javítja a vizuálisan gazdag dokumentumok megértését. A pontos adatfeldolgozás és értelmezés kihívása különböző dokumentumformátumok esetén, különösen a vállalati űrlapok, nyugták és számlák esetén, régóta nyomasztó probléma volt.

A hagyományos módszerek a transzformátor alapú modellekre és gráf neurális hálózatokra (GNN) támaszkodtak dokumentumértelmezés céljából. Azonban ezek a módszerek nehezen képesítik le a térbeli kapcsolatokat elemek között, mint például a táblázatcellák és a fejlécek, vagy a szövegek sorvégi szakadások mentén.

A DocGraphLM egy új megközelítést kínál a nyelvi modellek előnyeinek egyesítésével a GNN által nyújtott strukturális betekintéssel. Ez az egyedi integráció egy sokkal stabilabb dokumentum-reprezentációt tesz lehetővé, amely lehetővé teszi a bonyolult kapcsolatok és struktúrák pontos modellezését a vizuálisan gazdag dokumentumokban.

A DocGraphLM központi eleme egy közös kódoló architektúra a dokumentum reprezentációhoz és egy innovatív link-előrejelző megközelítés a dokumentumgráfok helyreállításához. A modell kiemelkedő tulajdonsága a képessége a csomópontok közötti irány és távolság előrejelzésére a dokumentumgráfban. Az távolságok normalizálásához logaritmikus transzformációt alkalmazva a modell hatékonyan leképezi a vizuálisan gazdag dokumentumok összetett elrendezését.

Az eredmények szempontjából a DocGraphLM jobb teljesítményt nyújtott az információkinyerésben és a kérdés-válaszolásban a szokásos adatkészleteken. A gráf jellemzőinek integrációja javította a modell pontosságát és felgyorsította a tanulási folyamatot a képzés során, ami gyorsabb és pontosabb információkinyerést eredményezett.

A DocGraphLM fejlesztése jelentős előrelépést jelent a dokumentumértés terén. Az innovatív keretrendszer pontosabb és hatékonyabb információk kinyerését teszi lehetővé a vizuálisan gazdag dokumentumokból. Ez a fejlesztés új lehetőségeket nyit a hatékony adatkinyerésre és elemzésre a mai digitális korban.

The source of the article is from the blog combopop.com.br

Privacy policy
Contact