"Abbiamo un'affluenza molto ampia".

La matematica è la base di tutte le nuove possibilità aperte dalla "digitalizzazione". Il professore di statistica Nicolai Meinshausen parla dell'importanza crescente del suo campo e delle sfide da affrontare.

Nicolai Meinshausen
"Le conoscenze nel campo dell'elaborazione dei dati sono aumentate in modo significativo. Molti scienziati sono in grado di elaborare i propri dati molto bene da soli", spiega Nicolai Meinshausen in un'intervista. (Immagine: ETH di Zurigo)

Intelligenza artificiale e machine learning: questi argomenti sono attualmente in voga nell'opinione pubblica. Ma sicuramente i matematici ci stanno lavorando da tempo.

Nicolai Meinshausen: In linea di principio, sì. Ma dipende sempre da come si definiscono i termini. L'apprendimento automatico in quanto tale esiste già da diversi decenni. Oggi sono semplicemente possibili applicazioni completamente diverse, perché la potenza di calcolo dei computer è aumentata e la quantità di dati elaborati ha raggiunto dimensioni completamente nuove in termini di qualità e quantità.

Dove si aprono nuove applicazioni?

Ad esempio, nel riconoscimento delle immagini, un settore in cui gli esseri umani sono molto bravi e da tempo superiori ai computer. Riconoscere i pedoni in un'immagine o distinguere un'auto da un albero: Ciò che per lungo tempo ha funzionato molto male per i computer è ora possibile grazie alla maggiore potenza di calcolo. Tuttavia, le questioni di fondo sono molto antiche.

Quali argomenti ti interessano particolarmente come statistico?

Applicazioni che non vogliono sostituire le persone, ma aprire campi completamente nuovi: Volumi di dati provenienti da studi biologici o modelli climatici, ad esempio. Questi possono essere compresi solo attraverso l'interazione tra uomini e computer.

E quali aspetti sono al centro?

Il rapporto tra machine learning e causalità. Molte domande riguardano la possibilità di fare previsioni. Ad esempio, cosa succede alla salute delle persone se cambiano le emissioni di azoto? Posso allungare la mia vita se bevo più tè verde? Queste sono domande causali. Potrei rendermi conto che le persone che bevono tè verde vivono più a lungo di quelle che preferiscono altre bevande. Ma questo non dimostra una relazione causale. Potrebbe anche essere che lo stile di vita generale, che include il tè verde, mi faccia vivere più a lungo, ma che il consumo di tè in sé non abbia alcuna influenza sull'aspettativa di vita.

Ad esempio, perché i non fumatori sono più propensi a bere tè verde?

Sì, esattamente. Un tempo il caffè aveva una pessima reputazione perché non si teneva conto del fatto che i fumatori tendono a bere più caffè. Oggi, gli studi che escludono questi fattori dall'equazione mostrano che il caffè tende ad avere un effetto positivo sulla salute.

Collaborate con scienziati di altre discipline su questi temi?

Questa è la cosa più interessante di noi. Per esempio, sto lavorando con la fisica a un progetto che riguarda il cambiamento climatico e la questione della misura in cui gli eventi e i cambiamenti sono causati dall'uomo. In progetti precedenti, abbiamo studiato l'interazione delle reti genetiche insieme ai biologi; e abbiamo avuto un progetto con gli astronomi in cui abbiamo esplorato il sistema solare esterno. Tutto ciò mi dà la possibilità di conoscere molte aree di applicazione.

Come dovremmo visualizzare la collaborazione in termini concreti? I ricercatori si rivolgono a voi con una domanda specifica e una serie di dati?

Questo varia molto. I miei progetti tendono a nascere da contatti personali a lungo termine. Tuttavia, abbiamo anche un Centro di consulenza,a cui molte persone si rivolgono. Alcuni di loro hanno domande di base, ma altri hanno anche preoccupazioni piuttosto complesse. Questo può portare a collaborazioni, alcune delle quali si sviluppano su un periodo di tempo più lungo.

Chi può contattare il centro di consulenza?

In principio tutti. La consulenza è gratuita per i membri dell'ETH e dell'UZH, ma gli utenti esterni devono pagare. A volte si rivolgono a noi anche aziende e istituzioni. La FIFA, ad esempio, ha mostrato interesse per il modo in cui le quote delle scommesse possono essere analizzate per individuare le frodi dietro il risultato di una partita.

E chi gestisce queste richieste?

Abbiamo un team permanente composto da due persone che hanno appena conseguito un master e da uno o due scienziati senior. Alcune richieste possono essere esaudite molto rapidamente. Altre diventano progetti di studenti, tesine o tesi di Master.

Fino a che punto gli statistici devono familiarizzare con un argomento per poter rispondere a una domanda?

Anche se a volte è possibile fornire una prima risposta in tempi brevi, spesso vale la pena approfondire l'argomento. In biologia, in particolare, le domande sembrano spesso semplici, ma diventano più complesse quanto più le si guarda da vicino. Per me è più facile in fisica perché provengo da questo campo.

Oggi si raccolgono sempre più dati. ? per questo che ricevete più richieste di analisi?

Stiamo notando una tendenza verso un numero sempre maggiore di punti di contatto. Tuttavia, oggi quasi tutte le branche della scienza lavorano su base statistica e basata sui dati. Di conseguenza, anche la conoscenza è aumentata in modo significativo. Molti scienziati sono in grado di elaborare i loro dati molto bene da soli.

Questo ci porta alla formazione. Come si presenta il programma di insegnamento?

Offriamo principalmente corsi a livello di Master, come le lezioni sulla causalità o sui nuovi metodi per la statistica multivariata. Queste lezioni sono frequentate da un'ampia varietà di studenti. Oltre ai matematici, partecipano anche studenti e dottorandi di biologia, chimica o fisica che hanno capito di aver bisogno di conoscenze statistiche per le loro ricerche. Siamo anche coinvolti nel nuovo corso di laurea magistrale in Data Science, iniziato in autunno.

La statistica è diventata più popolare come materia?

Sì, abbiamo molto interesse per il nostro programma di Master, sia da parte di studenti interni alla matematica sia da parte di studenti esterni che vengono da noi con un Bachelor in biologia, per esempio. Pensavamo che l'introduzione del Master in Data Science avrebbe portato a un calo delle iscrizioni al Master in Statistica già esistente. Invece è successo il contrario: il numero di iscrizioni è aumentato.

E come valuta la conoscenza della statistica da parte del pubblico? Dopo tutto, la statistica può essere usata anche per commettere frodi...

Il termine statistica viene spesso frainteso come semplice sintesi di dati; noi, invece, ci occupiamo soprattutto di fare previsioni. In altre parole, la domanda "Cosa accadrebbe se...?". Nel caso dell'imbroglio, bisogna distinguere tra imbroglio intenzionale e non. Ci sono domande che riguardano relazioni complesse e non esiste un'unica risposta corretta, ma diverse prospettive che possono essere supportate da dati.

Per esempio?

Il processo di ammissione alle università è equo? Le donne sono svantaggiate? Le procedure di prestito sono eque? Alcuni gruppi di popolazione sono svantaggiati? Sono tutte domande molto complicate. A seconda di come le si guarda, gli stessi dati possono sostenere affermazioni diverse. In linea di principio, si risponde a domande diverse. Questa differenziazione è stimolante perché devo scoprire a quale domanda voglio effettivamente rispondere. Spesso, però, tutto questo viene riassunto in un titolo generale.

Ma ci sono anche persone che usano le statistiche per i propri scopi.

La statistica viene ovviamente utilizzata anche per difendere le posizioni. Soprattutto quando si tratta di relazioni causali, è molto difficile per una persona non addestrata giudicare la validità dei dati statistici. Ogni giorno vediamo sui giornali esempi in cui alle domande si risponde con dati che in realtà non ammettono alcuna affermazione significativa.

Perché non sono significativi?

Uno dei motivi è che, ad esempio, non è stato intervistato un numero sufficiente di persone. L'altro è che il modo in cui vengono raccolti i dati può portare a una loro distorsione. In altre parole, la metodologia fornisce un'affermazione falsa, indipendentemente dal numero di persone esaminate.

Avete un esempio di questo tipo?

Spesso le domande ruotano intorno alla salute, ad esempio se certi alimenti sono benefici o dannosi per la salute. Oppure si chiede se sia più sano vivere in città o in campagna. Non si può rispondere a questa domanda semplicemente confrontando la salute delle persone in città e in campagna. Anche l'influenza della formazione sul successivo successo professionale è difficile da determinare, poiché sono coinvolti molti fattori diversi. Oppure l'influenza dell'immigrazione sul livello salariale della popolazione autoctona. Gli esempi sono innumerevoli e se ne incontrano ogni giorno.

Quale sarebbe il metodo giusto?

Il metodo gold standard è rappresentato dagli studi randomizzati, come quelli utilizzati per i farmaci. Tuttavia, tali studi non possono essere condotti ovunque. Non si può costringere le persone a essere esposte all'aria cattiva o a bere più caffè per anni. Attualmente stiamo lavorando a metodi per rispondere a domande di tipo causale a partire da dati privi di studi randomizzati. ? difficile, ma stiamo facendo progressi.

Sulla persona

Nicolai Meinshausen è professore di Statistica all'ETH di Zurigo dal 2013, dove dirige il Dipartimento di Statistica. La sua ricerca si concentra sulla causalità, sui dati ad alta dimensionalità e sull'apprendimento automatico. Nel 2016 ha ricevuto il COPSS Presidents' Award dal Committee of Presidents of Statistical Societies, che, insieme al Premio Internazionale di Statistica, è considerato il più alto riconoscimento per gli statistici.

Dati relativi all'argomento Focus

I dati svolgono un ruolo sempre più importante nella nostra società. Per questo motivo, nei prossimi anni l'ETH di Zurigo si concentrerà su questo tema in modo più approfondito. In una serie di interviste, Notizie ETH fornisce esempi di argomenti specifici su cui i ricercatori dell'ETH di Zurigo stanno lavorando e di come valutano gli sviluppi sociali nel loro campo.

Articoli precedenti di questa serie:

Argomenti correlati

JavaScript è stato disabilitato sul tuo browser