Analytics Everywhere: il SAS Forum e il Data Driven Storytelling

“I dati raccontano una storia”

È il tema affrontato nello speech di Andrea Nelson Mauro e Alessio Cimarelli, Data Journalist e Data Scientist, al SAS Forum 2016 di Milano.

Se, come dice il titolo del #SASForumMilan, Analytics are Everywhere, ossia che i dati sono reperibili dappertutto, ne consegue che tutto ciò che ci circonda può raccontare una storia e portarci a risolvere alcuni dei problemi che ci affliggono. Esistono però delle condizioni alle quali sottostare per poter raccontare dei dati, soprattutto se si aspira a fare Data Drive Storytelling, ossia in modo scientifico.

Dall’intervista che mi hanno rilasciato Cimarelli e Nelson Mauro, co-fondatori di DataNinja, è emerso che, per giungere a raccontare una storia, occorre seguire un processo scientifico e trasparente, in cui numerosi sono gli ostacoli da superare, per realizzare il quale occorrono degli skills provenienti da ambiti professionali diversi, l’insieme dei quali contribuisce propriamente a delineare la figura del Data Scientist Storyteller, una figura poliedrica, che accorpa le caratteristiche tipiche del Data Journalist a quelle del Data Scientist: è questo il professionista che dovrà portare a termine il difficile compito di raccogliere, elaborare, interpretare e raccontare in modo narrativo i dati relativi, ad esempio, alla nostra vita quotidiana, alla storia, ad ambiti economici e finanziari, ma anche dati che ci consentono di interpretare meglio fenomeni sociali complessi entro i quali siamo immersi.

Ma come fare a far narrare dei dati? E quale storia raccontare?
Il “C’era una volta …” del racconto Data Driven può avvenire in modo razionale, decidendo di studiare un fenomeno per poi raccontarlo, ma anche in modo apparentemente casuale: un interesse specifico per un argomento, una curiosità, che induce a scavare più in profondità un tema, ma anche l’imbattersi per caso in una fonte di dati sono tutte possibili cause che accendono la fame di conoscenza e che induce a porsi una domanda, quell’unica domanda a cui si vuole fornire una risposta.

Ma il compito che ci si propone di realizzare è duro e irto di difficoltà, che ostacolano fin da subito il cammino: la prima riguarda proprio la problematicità nel reperire gli stessi dati.
Infatti, oltre alla selezione accurata delle fonti, che devono essere attendibili e sicure, i dati raccolti devono essere consultabili, sempre verificabili (e in questo risiede il modello giornalistico del Data Driven Storytelling). Inoltre, in Italia manca quella che è stata definita dai cofondatori di DataNinja come “cultura del dato”, quell’atteggiamento volto a informatizzare e archiviare online i documenti cartacei. Purtroppo può capitare anche di ritrovare quelli che vengono inopportunamente definiti come “archivi digitali” dei documenti, che in realtà si rivelano essere dei file costituiti da un elenco di nomi identificativi di documenti, ognuno dei quali si differenzia dall’altro semplicemente nella numerazione; ogni record corrisponde ad una relativa documentazione cartacea, conservata in grossi faldoni spesso dimenticati in bui e polverosi archivi, ma è privo di qualsiasi riferimento informatico ai contenuti presenti nel documento cartaceo, o ai dati in esso riportati.
Che fare in questi casi? Abbandonare la ricerca, oppure, nonostante la frustrazione generata da questo grave vuoto digitale, ricercare una soluzione alternativa per colmare le lacune informative e informatiche riscontrate?

Anche la mancanza di open data contribuisce a rendere difficoltoso il reperimento delle informazioni: se questa prassi è ormai comune nei Paesi digitalmente più avanzati, da noi le Regioni più virtuose sono rare, se non circoscritte ad un unico caso, la Lombardia (così riferisce Andrea Nelson Mauro). Ne consegue una dura battaglia con la burocrazia statale, che di solito coincide con un iter tortuoso che si dipana in mezzo a compilazioni di moduli, a richieste di varia natura da effettuare presso numerosi uffici dislocati in anfratti degli edifici o in diversi punti del territorio, per individuare i quali occorre una vera e propria mappa del tesoro.

Una volta che si riescono a reperire i dati necessari per rispondere alla domanda iniziale, occorre spesso ricondurli ad un identico formato e in un foglio dati, che possa essere processato attraverso l’utilizzo di software analitici, in grado di facilitarne la lettura, ma anche “normalizzati”, ossia resi confrontabili tra loro, riducendo la distorsione generata dalle differenti misurazioni del fenomeno.
Il rischio di interpretare male i dati è elevato, soprattutto se la fase di analisi è stata sottovalutata e non sufficientemente approfondita. Al di là degli errori metodologici che potrebbero essere compiuti, occorre tenere presente che, come tutte le narrazioni appartenenti a qualsiasi settore, dalle fiabe, alla narrativa, allo storytelling d’impresa, il dato non dice mai la verità: avvicina alla verità, ma non è una verità assoluta. È parte della storia; costituisce una fotografia di un momento, per l’interpretazione della quale sono state considerate alcune variabili, ma tante altre variabili sommerse potrebbero essere state inavvertitamente escluse, nonostante abbiano influito sul fenomeno oggetto d’analisi, come ad esempio il contesto socio-culturale nel quale si manifestano: è per questo che non bisogna fermarsi alla semplice lettura dei dati, ma occorre contestualizzarli nell’ambiente in cui si realizza il fenomeno.

Per raccontare poi visivamente i risultati analitici accorrono in aiuto del Data Scientist Storyteller numerosi software, che non potranno mai sanare la conflittualità che si genera nella scelta della linea narrativa più adatta per raccontare i risultati: occorre infatti scrivere narrazioni semplici, partendo però da dati scientifici che spesso si riferiscono a fenomeni complessi, adottando il punto di vista del lettore, calandosi nei suoi panni, consapevoli della possibilità che il risultato potrebbe essere interpretato diversamente, o addirittura manipolato in malafede.

Ad esempio, come fare a non diffondere allarmismo nella popolazione europea, soprattutto quando si parla di sbarchi di immigrati? Questo fenomeno sociale c’è sempre stato e ha indotto Nelson Mauro e Cimarelli a effettuare alcune osservazioni e a porsi una domanda su quanti siano i migranti morti nel tentativo di raggiungere l’Europa: si tratta infatti di un’informazione solitamente marginale rispetto al numero di nuovi sbarchi riportati quotidianamente e in modo dettagliato sui mass media, ma in grado di attirare l’attenzione di questi due ricercatori.
Ne è nata un’inchiesta #MigrantsFiles, sulla storia dei naufragi dei migranti nel Mediterraneo, per il quale DataNinja ha vinto anche un premio, l’European Press Prize.
L’inchiesta, corredata da link che consentono di consultare i dati grezzi utilizzati per l’analisi, ha comportato un’attività di un paio d’anni e realizzata nei ritagli di tempo, caratterizzata da un controllo minuzioso e incrociato delle fonti consultate, che li ha portati a completare un foglio dati sui naufragi avvenuti nelle acque mediterranee con le rispettive coordinate geografiche e il relativo numero di decessi. Il lavoro di questi due giornalisti ha messo in luce un fenomeno trascurato dai mezzi di comunicazione, ma ampio e complesso, raccogliendo anche le storie di persone che hanno perso la loro vita nella ricerca della libertà.
Anche in questo caso, il dato non è certo e la verità è solo parziale: il numero di morti individuati è sicuramente inferiore alla realtà: di tante altre vittime, di tante storie personali si è perduta traccia proprio perché non esistono dati (e dati attendibili) del numero di persone presenti su queste barche naufragate.

Anche a questo servono i dati: a dare voce a delle vittime che ormai non hanno più voce.

Un ringraziamento particolare ad Alessio Cimarelli e Andrea Nelson Mauro per l’intervista rilasciata e a Sas Italia che ha reso possibile tutto questo.

Simona

 

Hai apprezzato questo post?
Condividilo, per favore: potrebbe essere utile anche ad altre persone. Grazie 1.000! 🙂

 

One thought on “Analytics Everywhere: il SAS Forum e il Data Driven Storytelling

  1. Ciao Simona, grazie del tempo e dello spazio (digitale) che ci hai dedicato… 🙂 Abbiamo parlato parecchio e in effetti ci hai messo dentro un sacco di roba! Un paio di integrazioni: comunque vogliamo chiamarli, i cantastorie digitali non sono eroi né gente particolarmente dotata, ma come in tutte le attività umane riescono meglio quando lavorano in squadra, mettendo insieme competenze e sensibilità diverse. L’inchiesta sui migranti è nata nel 2012 da nostri lavori preliminari in Italia, ma ha fatto il salto di qualità quando si sono aggiunti amici e colleghi europei, dalla redazione dati del Confidential a Journalism++ a molti altri. E infine gli ingredienti per fare un buon lavoro sono sempre i soliti: curiosità, passione, onestà intellettuale e buona birra, che non deve mai mancare… 😉 A presto!

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.