Più Giuseppe mi racconta i salti professionali con una laurea di Statistica in tasca, più rafforzo il dubbio per cui ho cercato la storia di un giovane che avesse scelto quel tipo di studi: girano poche storie, poche informazioni su certi mestieri.
«Proprio così, gli sbocchi professionali sono tanti. Infatti poi mi sono spostato in ambiente startup. Diciamo che sono sempre stato appassionato di tecnologia, fin da piccolo, e, quando unisci la statistica più classica alla tecnologia dei giorni nostri, in pratica diventa intelligenza artificiale».
Gli chiedo di tradurmi l’ultimo passaggio, che Giuseppe dà per scontato, l’Italia no: “statistica più classica e tecnologia dei giorni nostri”.
«Diciamo che la materia in quanto tale, cioè la statistica, è antichissima, affonda le origini nelle civiltà dei Sumeri e dei Romani, ma la nascita come disciplina moderna è relativamente giovane, a cavallo tra XVII e XVIII secolo. Vuol dire che, quando si studia statistica o scienze statistiche all’università, si fanno cose, tra virgolette, molto classiche. Tante dimostrazioni scritte a mano, formule infinite, insomma ci siamo intesi. Oggi la materia si è evoluta grazie alla enorme potenza di calcolo che abbiamo raggiunto, e siamo sconfinati in ciò che viene chiamato machine learning, o deep learning, o intelligenza artificiale in senso lato. Perché l’intelligenza artificiale, compresi i grossi modelli di linguaggio utilizzati un po’ da tutti come ChatGPT e compagnia varia, non sono altro che statistica applicata. Meglio: statistica e probabilità applicata, e calcolo matriciale, supportati da tanta potenza dei computer. La tecnologia alla base dell’intelligenza artificiale c’era già negli anni Ottanta e Novanta, anche prima, ma non c’era la potenza di calcolo. Solo adesso si può utilizzare su grande scala. Alla fine ho fatto il salto nei settori più moderni e contemporanei rispetto a chi sceglie di fare un lavoro che lo mandi all’ISTAT, per fare l’esempio più evidente. Il mio è un mestiere che ha bisogno di competenze informatiche avanzate, quindi di programmazione informatica, e per ora mi sono spostato a essere un data scientist. Tutti gli statistici sono anche data scientist, cioè più spinti sul lato tecnologia e IA.»
Non vale il contrario: i data scientist non sono anche statistici. Il terreno su cui scivola la disinformazione e lo scarso orientamento professionale non mette radici sulla segnalazione dei mestieri che davvero drenano più offerta dalle aziende. E molti giovani perdono occasioni.
«Infatti al mestiere di data scientist si può arrivare anche con un background in fisica, in matematica, in ingegneria informatica. È un mestiere che raggruppa diverse figure professionali, ma chi proviene dal mio percorso ha un forte background statistico, quindi comprende meglio alcuni aspetti; chi proviene dall’ingegneria informatica e diventa un data scientist ha più chiara la parte di infrastruttura e programmazione informatica, di software. Trovandosi in un team è pur vero che ci si contamina a vicenda, però di me posso dire che mi sento avvantaggiato perché alla stregua di un ingegnere software, avendo anche lavorato in startup di tecnologia e quindi implementato soluzioni software che utilizzano la statistica e l’analisi di grandi quantità di dati. La metodologia classica della statistica è un’ottima base per fare analisi dei dati business driven o business intelligence».
Parlandomi appassionato, aggiunge che tutti gli algoritmi di machine learning, compresa la IA, sono un insieme di formule sparate con la forza bruta dei PC. Il problema è che sono come delle calcolatrici: qualunque calcolo gli chiedi di fare, loro te lo restituiscono in risultato, ma non è detto che quel risultato abbia senso nel contesto in cui stai lavorando.
«La statistica insegna ai giovani il contesto del dato, il recinto dentro cui analizzare, il senso da assegnare alle cose, e lo fa trasferendo la pratica con i concetti di causalità, di rapporto causa-effetto, di come le variabili interagiscono fra loro nello studio dei fenomeni. Sia il calcolo delle probabilità, sia la statistica sono materie che possono sembrare controintuitive. Un dato che sembra lampante potrebbe non esserlo quando viene interpretato. Non mi reputo migliore di un data scientist, ma conosco il mio valore.»