Nový rámec strojového učenia ukazuje sľub pri detekcii daňových podvodov

Daňové podvody predstavujú vážnu výzvu pre vlády po celom svete a spôsobujú významné finančné straty. Aby sa zlepšila schopnosť odhaľovať podvody a chránili sa daňové príjmy, daňové orgány sa čoraz viac obracajú na stratégie strojového učenia. Súčasné stratégie detekcie však majú svoje obmedzenia, čo vyvoláva potrebu nového prístupu.

Nedávne publikácie výskumníkov z King Saud Univerzity predstavuje revolučný rámec strojového učenia pre detekciu daňových podvodov. Na rozdiel od tradičných prístupov tento rámec kombinuje modely s dohľadaným aj nedorohľadaným učením a využíva paradigmy súborového učenia na zlepšenie presnosti a komplexnosti.

Rámec sa skladá zo štyroch modulov:

1. Modul s dohľadaným učením: Implementuje extrémny systém zosilňovania gradientov (XGBoost), aby klasifikoval daňové priznania do rôznych skupín. Model generuje maticu, ktorá predstavuje priradenie daňového priznania k listovým uzlom v každom strome, a tá slúži ako vstup pre ďalší modul.

2. Modul nedorohľadaného učenia: Používa autoenkódery na identifikáciu anormalít v pôvodných dátach. Anomalie sú zistené na základe chyby regenerácie po zakódovaní a opätovnom generovaní vstupu. Výsledná matica a skóre anormalít sú nasledne použité v ďalšom module.

3. Správny modul: Meria dodržiavanie daňovej povinnosti pre každého daňovníka s ohľadom na výsledky auditu a čas. Toto skóre odráža dodržiavanie alebo nedodržiavanie povinností v čase a poskytuje cenné informácie pre detekciu podvodov.

4. Modul predikcie: Kombinuje všetky vytvorené rysy na predikciu daňových podvodov. Využíva vstupy z modulu s dohľadaným učením, modulu nedorohľadaného učenia a správneho modulu a používa dva klasifikátory (umelú neurónovú sieť a podporný vektorový stroj) na testovanie výkonu vytvorených rysov.

Vykonaná hodnotiaca štúdia s použitím údajov zo Saudskej agentúry pre zakat, dane a coly preukázala sľubné výsledky. Model umelých neurónových sietí prejavil vysokú presnosť pri predikcii triedy „podvod“. Tento rámec prekonal modely, ktoré používali len pôvodné údaje, čo ukazuje jeho potenciál na globálnu adopciu.

Napriek svojmu úspechu má tento rámec niekoľko obmedzení. Sem patrí predpoklad homogénneho správania sa v rámci sektorov/veľkosti podnikov a skóre dodržiavania daňovej povinnosti blízke nule pre mnoho daňovníkov. Napriek tomu táto inovatívna metóda výrazne zlepšuje schopnosti daňových orgánov detekovať daňové podvody. Integrácia modelov s dohľadaným a nedorohľadaným učením s hodnotami správania sa predstavuje potenciálnu zmenu paradigmy v detekcii podvodov a podporuje presnejšie a komplexnejšie opatrenia.

The source of the article is from the blog lisboatv.pt