Nový rámec pro strojové učení se ukazuje jako slibný při detekci daňových podvodů

Daňový podvod představuje značnou výzvu pro vlády po celém světě a má za následek významné finanční ztráty. S cílem zvýšit schopnosti detekce podvodů a zabezpečit příjmy státu se daňové orgány stále více spoléhají na strategie strojového učení. Nicméně současné detekční strategie mají své omezení, a proto je zapotřebí nového přístupu.

Nová publikace vědců z King Saud University představuje průlomový rámec pro strojové učení pro detekci daňových podvodů. Tento rámec na rozdíl od tradičních přístupů kombinuje nadzorované a nenadzorované modely a využívá paradigmat ensamblu učení k zlepšení přesnosti a komplexnosti.

Rámec se skládá z čtyř modulů:

1. Nadzorovaný modul: Používá model Extreme Gradient Boosting (XGBoost) klasifikovat daňové přiznání do různých skupin. Model generuje matici, která reprezentuje přiřazení daňového přiznání ke listům v každém stromu, což slouží jako vstup pro další modul.

2. Nenadzorovaný modul: Využívá autoenkodéry k identifikaci anomálních vlastností ve vstupních datech. Anomálie jsou detekovány na základě chyby regenerace při zakódování a opětovném generování vstupu. Výsledná matice a skóre anomálie jsou předány dalšímu modulu.

3. Chování modul: Měří skóre plnění každého daňového poplatníka s ohledem na auditní výsledky a čas. Toto skóre odráží splnění nebo nesplnění požadavků v průběhu času a poskytuje cenné informace pro detekci podvodů.

4. Predikční modul: Kombinuje všechny inženýrské vlastnosti pro předpověď daňového podvodu. Používá vstup z nadzorovaného modulu, nenadzorovaného modulu a chování modulu a využívá dva klasifikátory (umělé neuronové sítě a podpůrné vektorové stroje) pro testování výkonnosti inženýrských vlastností.

Hodnotící studie provedená pomocí dat ze saúdského daňového úřadu Zakat, Tax a Customs Authority prokázala slibné výsledky. Model umělé neuronové sítě vysokou přesností předpověděl třídu „podvod“. Rámec předčil modely používající pouze původní data, což ukazuje jeho potenciál pro globální přijetí.

Přestože rámec dosáhl úspěchu, má některá omezení. Mezi ně patří předpoklady o homogenním chování v rámci odvětví/velikosti podniků a skóre plnění blízké nule pro mnoho daňových poplatníků. Přesto však tento inovativní přístup významně zlepšuje schopnosti daňových orgánů detekovat daňové podvody. Zapojení nadzorovaných a nenadzorovaných modelů s hodnocením chování při dodržování pravidel představuje potenciální posun paradigmatu v detekci podvodů, podporující přesnější a komplexnější opatření.

The source of the article is from the blog qhubo.com.ni