Naujasis ‘DocGraphLM’ modelis gerina dokumentų supratimą

JPMorgan AI Research ir Dartmouth koledžo mokslininkai sukūrė naują inovatyvų modelį, vadinamą ‘DocGraphLM’, kuris žymiai pagerina supratimą apie vizualiai turtingus dokumentus. Tikslus duomenų apdorojimas ir interpretavimas iš įvairių dokumentų formatų, ypač iš vizualiai turtingų dokumentų, tokių kaip verslo formos, čekiai ir sąskaitos, buvo viena iš pagrindinių problemų.

Tradiciški metodai daugiausia pasikliauja transformatoriais grindžiamais modeliais ir grafo neuroniniais tinklais dokumentų interpretavimui. Tačiau šie metodai sunkiai sugeba sugauti erdviškus santykius tarp elementų, tokius kaip lentelės langelių ir antraštės arba tekstas per eilučių persidengimą.

‘DocGraphLM’ siūlo naują požiūrį, derindamas kalbos modelių stiprybes su grafo neuroninių tinklų struktūriniu supratimu. Toks unikalus integravimas leidžia sukurti patikimesnį dokumentų modelį, kuris leidžia tiksliai atkurti sudėtingus ryšius ir struktūras vizualiai turtinguose dokumentuose.

Pagrindinis ‘DocGraphLM’ bruožas yra tai, kad jis įveda bendrą dokumentų reprezentacijos koduotojo architektūrą ir inovatyvų ryšių nuspėjimo metodą, skirtą atkurti dokumentų grafinius tinklus. Modelio išskirtinumas yra jo gebėjimas nuspėti kryptį ir atstumą tarp mazgų dokumentų grafe. Taikant logaritminę transformaciją atstumams normalizuoti, modelis efektyviai atkuria vizualiai turtingų dokumentų sudėtingas išdėstymo struktūras.

Kalbant apie veikimą, ‘DocGraphLM’ modelis pranoko esamus modelius informacijos išgavimo ir klausimų atsakymo uždaviniuose, naudojant standartinius duomenų rinkinius. Grafo savybių integracija pagerino modelio tikslumą ir pagreitino mokymo procesą, rezultatuose pasiekiant greitesnį ir tiksliau informacijos išgavimą.

‘DocGraphLM’ plėtojimas žymi svarbų žingsnį dokumentų supratimo srityje. Šio inovatyvaus modelio savybės suteikia didesnį tikslumą ir efektyvumą išgaunant informaciją iš vizualiai turtingų dokumentų. Šis progresas atveria naujas galimybes efektyviam duomenų išgavimui ir analizei šiandieninėje skaitmeninėje eroje.

The source of the article is from the blog krama.net

Privacy policy
Contact