Rimani aggiornato!
Iscriviti gratuitamente alla nostra newsletter, e ricevi quotidianamente le notizie che la redazione ha preparato per te.
Nella “Relazione per orientare le azioni del Governo volte a ridurre l’evasione fiscale derivante da omessa fatturazione” il Dipartimento delle Finanze identifica nel text mining e nel data scraping la nuova frontiera tecnologica per combattere l’evasione dell’IVA attraverso un apposito iter di valutazione del profilo di rischio fiscale del contribuente.
Il rischio fiscale può essere definito come “il rischio di operare in violazione di norme di natura tributaria in palese contrasto con i principi o le finalità dell’ordinamento”.
Quando si tratta di rischi fiscali bisogna premettere che questi possono avere diverse cause e natura e sono generalmente classificabili come segue:
Il Text Mining è una tecnica di Intelligenza Artificiale che utilizza l’elaborazione di un linguaggio naturale per trasformare il testo libero, non strutturato, di documenti/database come pagine web, articoli di giornale, e-mail, agenzie stampa, post/commenti sui social media in dati strutturati e normalizzati.
Si tratta di dati che rappresentano già una informazione, “ovvero fatti, relazioni e asserzioni che possono essere integrati in database, data-warehouse o dashboard di business intelligence e utilizzati per indagini descrittive, predittive e prescrittive” che attraverso algoritmi di Machine Learning possono non solo comprendere un comportamento, ma anche “anticipare problematiche e comportamenti, bisogni e tendenze”.
Secondo la relazione del Dipartimento delle Finanze, il Text Mining sarebbe tuttavia da sottoporre al parere del Garante della Privacy insieme alla tecnica del Data Scraping, chiarendo quali sono le tecniche utilizzabili, le tempistiche di utilizzo/cancellazione dei dati avente natura particolare ed individua e le strutture deputate a svolgere l’attività.
Il Data Scraping è una tecnica già utilizzata in Francia e che consentirebbe all’Agenzia delle Entrate di avvalersi di particolari algoritmi di Intelligenza Artificiale “addestrati” ad “effettuare sistematicamente attività di analisi del rischio basate sulla raccolta massiva e sull’elaborazione automatizzata dei dati liberamente accessibili sui siti e piattaforme web, nonché’ di quelli resi pubblici dagli utenti”.
Qualora i dati acquisiti attraverso il Text Mining ed il Data Scraping ai fini dell’accertamento e quindi degli approfondimenti istruttori dovessero essere effettivamente utilizzati insieme ad altri dati di cui già dispone l’Agenzia delle Entrate, il periodo della loro conservazione potrebbe essere fissato a 10 anni, mentre in caso di procedimenti contenziosi dovrebbero essere conservati fino al termine dell’iter di giudizio.