Nell’ultimo decennio, grazie al vertiginoso sviluppo delle tecnologie digitali connesse al Web, i Big Data sono diventati un argomento di studio e dibattito centrale; tanto per le materie informatiche quanto per quelle economiche-giuridiche. Proprio nel mondo giuridico, in questi anni, oltre alla volontà definitoria-normativa, la nuova corrente Law&Tech. sta proponendo l’assimilazione organica (non solo strumentale) delle tecnologie di Internet. Attraverso strumenti informatici, in grado di ordinare, analizzare ed elaborare i dati presenti in rete, si cerca di implementare e velocizzare i complessi processi di formazione, interpretazione ed applicazione del Diritto stesso. Nasce così l’Analisi Computazionale del Diritto.
La vastità documentale del diritto, tanto in ambito nazionale quanto ancor più in quello internazionale, pone l’attuale universo giuridico (comprensivo degli atti normativi, della giurisprudenza e della dottrina) in un quadro numericamente simile, al mondo dei “Big Data”. Principiando da questa considerazione, che mette in relazione l’attuale ipertrofia documentale giuridica con lo sterminato universo dei dati scambiati e archiviati in Internet, è nata l’idea di utilizzare strumenti e modalità proprie dell’informatica per fornire ai giuristi un sostanziale ausilio in differenti ambiti.
L’analisi computazionale del diritto, indicata anche con l’acronimo CAL (dalla denominazione inglese Computational Analysis of Law) costituisce un’importante branca dell’informatica giuridica che, collocandosi nell’ambito della corrente della scuola Law & Technology, si pone l’obiettivo di regolare, ordinare e analizzare – fornendo ai suoi operatori uno strumentario adeguato – il mondo del diritto.
Attraverso gli strumenti già adottati (come l’analisi semantica e spaziale del testo, la comparazione inter-normativa e l’analisi percettiva del significato del lessico), in parte, per analizzare e regolare i Big Data, la CAL consente di indagare il diritto con una profondità e un’ampiezza senza precedenti, rendendo l’analisi giuridica controllabile, minuziosa e con ampie possibilità di istantanea comparazione. “Controllabile” perché attraverso i diversi sistemi informatici di archiviazione può garantire all’utente l’efficace recupero di tutta la documentazione richiesta, “minuziosa” perché con altrettanta precisione può ricercare e associare a documenti simili ogni termine giuridico presente nella ricerca principale, permettendo contemporaneamente -per gli stessi motivi- grazie all’interconnessione delle banche dati, l’istantanea comparazione con altre fonti simili.
Come avviene nel caso dell’archiviazione e dell’elaborazione dei Big Data, nonché nell’estrazione dei metadata o dei dati aggregati, l’uso dell’analisi computazionale può consentire agli operatori del diritto di acquisire maggiori informazioni legali, da più fonti, in maniera più precisa e celere. L’analisi computazionale informatica dei documenti rende l’indagine giuridica “scalabile”, ovvero facilmente padroneggiabile dal fruitore, per cui ogni dato o informazione utile è tratto efficacemente da ogni fonte normativa, giurisprudenziale o dottrinaria al mondo (informatico) disponibile. In tal modo, aumentando l’elaborazione delle informazioni legali, l’analisi computazionale si sviluppa, in profondità ed ampiezza, su tre aspetti.
In primis, gli strumenti computazionali consentono una maggiore completezza delle ricerche giuridico-istituzionali e dottrinali con una più ampia ricerca di prove a suffragio dei casi. Si pensi, ad esempio, alla possibilità di consultare e comparare simultaneamente, con precisione matematica, tanto le varie normative nazionali e internazionali su un determinato argomento, quanto le diverse interpretazioni, fornite dalle massime dottrine in materia, con il conseguente confronto della diretta applicazione tenuta nelle giurisprudenze di riferimento. In questo modo, il professionista legale potrà individuare le tendenze decisionali nel processo giurisprudenziale e legislativo, usate dagli studiosi per tracciare gli sviluppi futuri del diritto, orientandole ai propri scopi. L’influenza di alcune decisioni specifiche può essere sistematicamente accertata, grazie all’incrocio computazionale dei dati, invece che indovinata; inoltre, un ampio processo di ricerca dati negli archivi secondo schemi, impropriamente improntati ai processi di data mining, potrà portare alla costruzione di nuove prospettive interpretative. L’analisi computazionale, pertanto, non modifica radicalmente le professioni giuridiche ma apporta sostanziali cambiamenti alla modalità di lavoro, fornendo un’inestimabile ricchezza di informazioni e comparazioni. In particolare, il trattamento dei testi giuridici come dati informatici non è un modo per far elaborare ragionamenti giuridici o processi decisionali agli algoritmi. Il ricercatore umano rimane responsabile della progettazione della ricerca, del ragionamento normativo e dell’interpretazione, nonché della selezione dei risultati. L’analisi computazionale riguarda, invece, il completamento della tecnologia che il giurista attualmente utilizza per elaborare il materiale legale e la sua lettura mediante l’analisi informatica. Ecco perché l’analisi giuridica computazionale non cambia radicalmente le professioni legali ma mette a loro disposizione strumenti di analisi come l’analisi della rete, l’elaborazione artificiale del linguaggio naturale (Natural Language Processing) e l’apprendimento automatico (supervisionato o non-supervisionato) per il continuo miglioramento delle ricerche dei dati analizzati.
Secondariamente, la CAL rivoluziona l’archiviazione della casistica legale, consentendo ai ricercatori di porre quesiti inediti e ad ampio orizzonte sulle sfide diritto e sulla sua interazione con il mondo. La curiosità professionale dei giuristi può essere soddisfatta in varia misura; per esempio, la CAL mediante l’analisi della rete e l’impiego di programmi di apprendimento automatico supervisionato sui dati prodotti da un algoritmo di ricerca, applicato su testi giuridici, può fornire la differente percezione sociale di alcuni termini giuridici. Sistemi simili, applicati ai dati forniti da programmi di archiviazione della giurisprudenza, messi in correlazione con le istanze politico e sociali del tempo, possono invece aiutare il legislatore a farsi un’idea sui nuovi interventi normativi richiesti o a predire l’impatto di una legge appena entrata in vigore.
Gli approcci computazionali, pertanto, aiutano ad approfondire il funzionamento dei processi legali, tra cui il monitoraggio dell’impatto delle decisioni giudiziarie sulla legislazione (per esempio, in materia penale per una più stringete definizione di condotte “ibride”) e viceversa, la valutazione dell’impatto normativo sulla società e le esigenze di quest’ultima che spingono costantemente l’aggiornamento del diritto (es. percezione sociale di alcuni principi, la cui concezione muta nel tempo).
Infine, i motori di ricerca legali avanzati, dotati di programmi con sistemi di CAL, rendono più efficiente il recupero delle informazioni legali; le piattaforme di analisi giuridica che confrontano e analizzano le diverse fonti di diritto unitamente alla giurisprudenza correlata, possono supportare il processo decisionale giudiziario, negoziale e finanche politico. Questi strumenti non rientrano propriamente nella CAL, non trattandosi di indagine scientifica strettamente intesa; piuttosto trattasi di strumenti ausiliari di informatica giuridica, come ben illustrato dal Prof. Wolfgang Alschner nel secondo incontro dei “Law&Reg.Tech.Seminar”, tenutosi presso la LUISS “Guido Carli il 25 febbraio scorso.
Per svolgere questi compiti, la CAL deve archiviare (prima) e analizzare (poi) un’enorme quantità di testi giuridici (tra legislazione, giurisprudenza e dottrina), a volte scritti anche in lingue e stili differenti (si pensi alla stretta connessione tra norme nazionali, fonti europee e trattati internazionali). Ne consegue che è necessario che conosca tutte le terminologie utilizzate nei testi: in altre parole, deve prima conoscere il linguaggio.
Come sopra menzionato, infatti, l’analisi computazionale del diritto si serve della tecnica di elaborazione del linguaggio naturale, indicata anche con l’acronimo NLP (da Natural Language Processing), che consiste nell’elaborazione automatica della lingua di un testo completo. Non si tratta di un apprendimento gnoseologico degli scritti e dei singoli vocaboli, ma di una memorizzazione massiva dei significati associati ad ogni singolo termine, dei collegamenti con i sinonimi (o le traduzioni in altra lingua), del contesto nel quale vengono utilizzate e della diversa accezione che assumono, proprio al mutare degli altri elementi logico-sintattici delle proposizioni. Destrutturando i testi, in una specie di “analisi logica informatica”, i computer possono analizzarne il contenuto con interrogazioni logiche o trasformarlo in una rappresentazione numerica.
Una delle tecniche adoperate, ad esempio, è quella delle domande logiche, meglio identificate con il termine inglese di “query”, attraverso cui in maniera semplice, ma estremamente efficace, mediante espressioni regolari, i sistemi di NLP possono elaborare automaticamente un testo.
Le tipologie di query utilizzate, oltre alle tradizionali tipologie di accodamento (per aggiungere dati), di aggiornamento (per modificare i dati) e di selezione (per estrarre dati da un elenco), possono prevedere anche query interne ad altre query, (definite per questo anche subquery o query annidate) che trasferiscono i risultati della loro interrogazione alla query esterna (in cui sono insite), che li traspone validandoli attraverso la clausola “where”. Questa tipologia di query, che si presta bene all’interrogazione complessa dei delle banche dati, per l’estrazione di metadati, si può a sua volta suddividere in due macrogruppi: le domande annidate che rispondono con un solo valore e quelle che, invece, offrono un gruppo di valori. Un’altra tipologia di interrogazione prevista dai sistemi di CAL è quella delle query pivot (dette anche “a campi incrociati”), che consentono di incrociare i dati di più tabelle, così da ottenere banche dati in cui sussistono parti (campi orizzontali) di tipo descrittivo e riepilogativo e parti (colonne) di conteggi e totali.
Affinché i sistemi di NLP possano elaborare automaticamente i testi, in ogni sistema di CAL sono presupposti algoritmi di apprendimento automatico dai modelli dei risultati dei dati che, pertanto, tendono a migliorare con l’aumento di quest’ultimi. Parlando di apprendimento automatico, inoltre, occorre precisare che se ne distinguono due tipologie: l’apprendimento supervisionato e quello non supervisionato.
L’apprendimento automatico supervisionato (noto anche come supervised machine learning) è alla base dello straordinario successo di alcuni recenti programmi di intelligenza artificiale; dagli assistenti virtuali alle auto a guida autonoma. Il suo funzionamento non si basa sull’imitazione del ragionamento umano, bensì sul comportamento umano, apprendendo dagli umani come eseguire determinate funzioni. A differenza degli algoritmi che imitano il ragionamento umano, la tecnologia di apprendimento supervisionato fa sì che, specificando regole esplicite (se si verifica A, esegui B), l’algoritmo trovi le regole implicitamente, memorizzando in modo autonomo la relazione tra input e output. Tale tecnologia può quindi essere utilizzata per svolgere velocemente operazioni complesse come, in ambito di CAL, la classificazione dei casi giudiziari, l’analisi dei testi, finanche la previsione di certi risultati giudiziari o la stesura di bozze normative.
Considerando la capacità di semplificare e velocizzare la ricerca giuridica, il miglioramento del potenziale comparativo e, quindi, le prospettive illimitate di estensione del ragionamento giuridico, è probabile che in futuro l’analisi computazionale del diritto e della regolazione si affermi come strumento giuridico indispensabile.
Ad oggi, si tratta ancora di un ambito pionieristico, in via di definizione e continua implementazione, tanto dal punto di vista tecnico informatico quanto da quello giuridico. Come previsto dalla dottrina della scuola Law & Tech, infatti, lo sviluppo e l’utilizzo delle CAL prevedono un perfetto bilanciamento tra la conoscenza delle materie informatiche, matematiche-computazionali e le discipline giuridiche, da cui necessariamente devono partire le linee guida definitorie e applicative degli algoritmi. In tal senso, la sfida per i prossimi anni consisterà nello sviluppo di un’infrastruttura e di una metodologia adeguate allo studio e all’applicazione dell’analisi computazionale nelle varie branche del diritto.
Il gruppo di ricerca che opera nell’ambito del corso Innovation Law and Regulation della LUISS, in relazione al progetto di ricerca PRIN2017 “Algorithmic Disclosure Regulation”, ha il fine di contribuire allo sviluppo della disciplina della Law & Tech e di CAL. Costituisce, infatti, il primo nucleo in Italia di studio, divulgazione e applicazione delle tecniche di analisi computazionale del diritto.
Quest’opera è distribuita con Licenza Creative Commons Attribuzione 4.0 Internazionale