"Non ci limitiamo ad acquistare un nuovo computer".
Il supercomputer di punta del CSCS, "Piz Daint", deve essere sostituito. L'installazione del computer successore "Alps" avverrà in tre fasi e sarà completata nel 2023. Il direttore del CSCS Thomas Schulthess spiega in un'intervista perché il nuovo computer è così speciale.
Notizie ETH: La prima fase dell'installazione del nuovo supercomputer "Alps", il successore di "Piz Daint", è iniziata lo scorso anno. Come sono andati i lavori finora durante la crisi della corona?
Thomas Schulthess: Abbiamo dovuto cambiare il nostro approccio, ma siamo riusciti più o meno a rispettare il programma, anche se ci sono stati alcuni piccoli ritardi. Durante il primo blocco, non è stato possibile portare in Svizzera i primi quattro cabinet del nuovo computer dagli Stati Uniti come previsto. Tuttavia, il produttore HPE è riuscito comunque a umwelt und Geomatik l'hardware in modo che in giugno e luglio abbiamo avuto accesso alle nostre macchine negli Stati Uniti e siamo stati in grado di lavorare su di esse. Di conseguenza, l'accettazione degli armadi informatici a Lugano in autunno si è svolta senza grossi problemi.
L'ampliamento di "Alps" durerà fino alla primavera del 2023. Perché ci vuole così tanto tempo?
Perché il prodotto che vogliamo non è ancora completamente sviluppato. L'elemento centrale del nuovo computer è lo stack software Cray Shasta, che abbiamo contribuito a sviluppare insieme ad altri centri di calcolo. Questo stack software è ora operativo. Tuttavia, ci vorranno altri due anni prima che l'infrastruttura informatica desiderata sia completamente pronta.
Cosa c'è di speciale nella nuova infrastruttura informatica?
Con lo stack software di Cray Shasta, abbiamo optato per un'infrastruttura definita dal software. Questo è il punto cruciale per me. Senza questo stack software, la nuova macchina perderebbe molto valore per me. "Alps" sarebbe ancora la migliore opzione nel settore del calcolo ad alte prestazioni che sarà disponibile sul mercato nel prossimo futuro. Ma è chiaro che abbiamo obiettivi più alti che non riusciremmo a raggiungere. Sarebbe una grande delusione.
Cosa significa esattamente?
Al CSCS gestiamo principalmente un'infrastruttura di ricerca che mettiamo a disposizione dei ricercatori come laboratorio utente, tra le altre cose. Questo è il nostro compito principale. A differenza di altre infrastrutture di ricerca, come lo SwissFEL del PSI, non facciamo praticamente ricerca sui nostri strumenti. Dobbiamo quindi trovare un modo creativo per ampliare le nostre competenze e contribuire allo sviluppo dell'infrastruttura di ricerca. Per questo motivo collaboriamo strettamente con ricercatori di diverse scuole universitarie svizzere.
Il CSCS non si considera principalmente un fornitore di servizi?
Sì, ma non nel senso di un'azienda informatica che gestisce computer per poter offrire tempo di calcolo. Per noi il computer è il mezzo per raggiungere un fine, e il fine è l'infrastruttura di ricerca che stiamo costruendo e sviluppando insieme ai ricercatori con il finanziamento del Consiglio dei PF e gestendo con il contributo dell'ETH di Zurigo. Ora vogliamo sviluppare ulteriormente questa infrastruttura di ricerca con il programma Kathmandu.
Di cosa tratta esattamente questo programma?
Il programma Kathmandu è una parte importante del nuovo appalto di cui sopra. Non stiamo semplicemente acquistando un nuovo computer che sarà integrato nel centro di calcolo invariato, ma stiamo ricostruendo il centro di calcolo in diverse fasi di espansione. Oggi al CSCS sono in funzione diversi sistemi informatici per le diverse esigenze. In futuro ci sarà un'unica infrastruttura. Ad esempio, finora abbiamo gestito un computer separato per MeteoSvizzera. In futuro, MeteoSvizzera calcolerà su una o più partizioni di questa nuova infrastruttura.
Umwelt und Geomatik: "Stiamo convertendo l'intero centro di calcolo in diverse fasi di espansione".Thomas Schulthess
Qual è il vantaggio di questa soluzione?
Al CSCS abbiamo sempre offerto vari servizi ai ricercatori, ma l'architettura del sistema non era orientata ai servizi. Abbiamo quindi dovuto dedicare molto tempo e sforzi per definire questi servizi in base alle esigenze degli utenti e all'architettura delle macchine. Ora questo processo è più semplice perché disponiamo di un'infrastruttura definita dal software.
Cos'è un'infrastruttura definita dal software?
Se insieme ad HPE facciamo tutto bene, in futuro saremo in grado di utilizzare il nostro hardware in modo molto flessibile. In futuro, definiremo quali servizi offrire tramite il software e non più tramite l'hardware. A tal fine, combineremo i cosiddetti microservizi. In questo modo potremo definire le partizioni per i vari utenti, che poi metteremo a loro disposizione tramite interfacce standardizzate. Si può trattare di cluster virtuali ad hoc per i singoli utenti, ma anche di cluster predefiniti che infrastrutture di ricerca come il PSI mettono insieme con noi e poi gestiscono autonomamente. Con i microservizi possiamo anche creare piattaforme di dati. Ad esempio, stiamo progettando di sviluppare una cosiddetta piattaforma di dominio per le simulazioni meteorologiche e climatiche con diversi partner.
Lei cita esplicitamente il campo del meteo e del clima. "Alps" sarà utile anche per altri campi scientifici?
Sì, con "Alps" stiamo sviluppando un "supercomputer di uso generale". I nostri obiettivi non si fermano alle simulazioni climatiche. Tuttavia, queste sono un ottimo mezzo per raggiungere il fine, poiché la definizione del problema delle simulazioni climatiche è formulata in modo molto chiaro. Inoltre, riflettono tutti i requisiti di una moderna infrastruttura di supercalcolo e di dati. Rispondiamo a queste esigenze molto specifiche con un'infrastruttura che possiamo offrire anche ad altre aree di ricerca.
Cosa cambierà per gli utenti del Laboratorio utenti?
Gli attuali utenti di "Piz Daint" potranno utilizzare il nuovo sistema senza alcuna modifica. Anzi, dovrebbe essere più facile per loro. Continueremo inoltre a sviluppare la piattaforma HPC per lo User Lab come area virtuale all'interno del sistema informatico. Questo renderà le risorse più potenti e coprirà una gamma più ampia di flussi di lavoro. Gli scienziati potranno non solo effettuare simulazioni qui, ma anche pre-processare o post-processare i loro dati. Ciò rende l'intero processo più efficiente.
Quindi non cambierà molto per gli utenti. Cosa significa la riorganizzazione per i collaboratori del CSCS?
La nuova strategia richiederà un ripensamento fondamentale in alcune aree. Gli ingegneri di sistema e di supporto agli utenti dovranno ripensarsi, ad esempio, perché i nostri attuali computer, che gestiamo oltre a "Piz Daint", in futuro saranno cluster virtuali. Alcuni collaboratori svilupperanno e manterranno microservizi, mentre altri combineranno questi microservizi in cluster o applicazioni virtuali che saranno poi decisi dai ricercatori come servizi.
"La nuova strategia richiederà un ripensamento fondamentale in alcune aree".Thomas Schulthess
In Europa si stanno compiendo grandi sforzi per far progredire il supercalcolatore ad alte prestazioni. In particolare, ciò include l'iniziativa Pre-Exascale dell'UE. In che modo il CSCS è coinvolto in questi sforzi?
Il CSCS è membro del consorzio LUMI, che fa parte della Pre-Exascale Initiative. L'acronimo sta per "Large Unified Modern Infrastructure". Si tratta di un nuovo supercomputer di classe pre-exascale che sarà situato in Finlandia. Il consorzio LUMI conta dieci Stati membri, tra cui i Paesi scandinavi, dove esistono le condizioni per la produzione di energia a basso costo e a bassa emissione di CO2-L'elettricità è gratuita e il raffreddamento dei computer è ottimizzato.
Perché questo aspetto è così importante?
Questo può essere spiegato facendo riferimento alla ricerca sul clima. Il nostro obiettivo è quello di sviluppare modelli climatici in grado di rappresentare le nubi convettive come i tuoni. "Alps", il successore di "Piz Daint", avrà un carico connesso di 5-10 megawatt. Tuttavia, un'infrastruttura informatica in grado di fornire in modo produttivo la suddetta risoluzione per la scienza del clima deve essere 50 volte più potente. Poiché non è più possibile ottenere incrementi di prestazioni grazie alla Legge di Moore, abbiamo bisogno di una macchina cinquanta volte più grande di "Alps", il che significa che anche il consumo energetico aumenterà di conseguenza. ? quindi sensato costruire in futuro un'infrastruttura informatica di questo tipo dove l'energia necessaria possa essere generata a basso costo e nel rispetto dell'ambiente. Nell'Europa centrale non ci sono luoghi di questo tipo, ma nel Nord Europa sì.
Qual è il programma di LUMI?
Anche il computer LUMI è stato costruito da HPE e si prevede che raggiungerà la classe di prestazioni pre-esascala nell'autunno del 2021 ed entrerà in funzione nella primavera del 2022. Il nostro sistema "Alps" sarà installato un anno e mezzo dopo, alla fine del 2022, e sostituirà "Piz Daint" a partire da aprile 2023. Ma i nostri nuovi servizi saranno disponibili già questa primavera e durante le prime fasi di espansione in estate/autunno; inoltre stiamo cercando di integrare LUMI. In questo modo avremo a disposizione un'infrastruttura complessiva molto forte che funziona su due sotto-infrastrutture, "Alps" e LUMI. In questa direzione ci muoveremo più velocemente di altri in Europa.
Questo significa che in futuro le risorse informatiche svizzere saranno trasferite all'estero?
No, ma dobbiamo essere realistici: Non potremo mai utilizzare computer da 100 MW o più in Svizzera. Dobbiamo concentrare le risorse informatiche locali in Svizzera su progetti pilota innovativi e integrarli in una rete più ampia per la produzione. La nostra intenzione è quella di sviluppare piattaforme software che funzionino su entrambe le infrastrutture, in modo che gli utenti praticamente non si accorgano se la loro applicazione viene eseguita in Finlandia o a Lugano.
Il supercalcolatore a Lugano
Il Centro nazionale svizzero di supercalcolo (CSCS) sviluppa e fornisce l'infrastruttura e il know-how per risolvere importanti problemi scientifici e sociali nel campo del supercalcolo ad alte prestazioni. Attua la strategia nazionale per i supercalcolatori e le reti, adottata dal Parlamento svizzero nel 2009. Dal 2011, il CSCS dispone di un laboratorio utente per il supercalcolo e fa parte della roadmap delle infrastrutture di ricerca svizzere. Dal 2020 è anche membro del consorzio europeo LUMI, che sta costruendo un supercomputer europeo di classe di prestazioni pre-esascala.