Nov okvir ‘DocGraphLM’ izboljšuje razumevanje dokumentov

Raziskovalci inženirske umetne inteligence pri JPMorgan AI Research in Dartmouth College so razvili inovativen okvir, imenovan ‘DocGraphLM’, ki bistveno izboljšuje razumevanje vizualno bogatih dokumentov. Natančna obdelava in razlaga podatkov iz različnih dokumentnih formatov, še posebej vizualno bogatih dokumentov, kot so poslovni obrazci, računi in računi, je bila vedno težava.

Klasične metode so temeljile na modelih, ki temeljijo na transformatorjih, in grafovskih nevronskih mrežah (GNN) za razlago dokumentov. Vendar pa se te metode težko soočajo s prostorskimi odnosi med elementi, kot so celice tabele in njihovi naslovi ali besedilo preko vrstic.

DocGraphLM ponuja nov pristop, ki združuje prednosti jezikovnih modelov s strukturnimi vpogledi, ki jih omogočajo GNN. Ta edinstvena integracija omogoča bolj zanesljivo predstavitev dokumenta in omogoča natančno modeliranje zapletenih odnosov in struktur v vizualno bogatih dokumentih.

Osrednja značilnost DocGraphLM je uvedba skupne arhitekture kodirnika za predstavitev dokumenta in inovativnega pristopa za napovedovanje povezav za rekonstrukcijo grafov dokumenta. Izjemna lastnost modela je njegova sposobnost napovedovanja smeri in razdalje med vozlišči v grafu dokumenta. Logaritemska transformacija za normalizacijo razdalj omogoča modelu natančno zajemanje kompleksnih postavitev vizualno bogatih dokumentov.

Glede na zmogljivost je DocGraphLM presegel obstoječe modele pri nalogah izvlečevanja informacij in odgovarjanja na vprašanja na standardnih naborih podatkov. Integracija grafnih lastnosti je izboljšala natančnost modela in pospešila proces učenja med treningom, kar je privedlo do hitrejšega in natančnejšega izvlečenja informacij.

Razvoj DocGraphLM predstavlja velik korak naprej na področju razumevanja dokumentov. Njegov inovativen okvir zagotavlja večjo natančnost in učinkovitost pri izvlečenju informacij iz vizualno bogatih dokumentov. Ta napredek odpira nove možnosti za učinkovito izvlečenje podatkov in analizo v digitalni dobi.

The source of the article is from the blog meltyfan.es

Privacy policy
Contact