La National Supercomputing Center di Shenzhen ha reso pubblico un progetto ambizioso: Lingsheng, un supercomputer che aspira a superare i 2 ExaFLOPS di potenza computazionale appoggiandosi esclusivamente a CPU, senza acceleratori GPU e con l’obiettivo dichiarato di non dipendere da componenti stranieri. L’annuncio ha suscitato interesse perché propone un percorso tecnico diverso rispetto alle macchine exascale attualmente operative, che fanno largo uso di GPU o di soluzioni ibride CPU+GPU.
Secondo quanto illustrato dai responsabili del centro, il sistema previsto conterà 47.000 processori alloggiati in 92 cabinet di calcolo, configurazione che, se realizzata, segnerebbe il primo esempio di supercomputer exascale progettato per funzionare in modalità CPU-only. Tuttavia, i dati diffusi sono per lo più teorici: non sono stati forniti benchmark indipendenti né una timeline operativa precisa, e restano aperte domande sui fornitori finali dei processori.
Progettazione e architettura
La struttura del progetto è pensata su due livelli: una fase pilota e una fase industriale. La piattaforma pilota si basa su 100 server Huawei Kunpeng con core Arm Taishan, per un totale di 12.800 core, utile per verificare software e toolchain. La configurazione definitiva prevede invece 1.580 blade server x86 con 101.120 core, integrati da ulteriori server four-way e eight-way che aumenterebbero la dotazione complessiva. Questo approccio mira a coniugare una prova su scala ridotta con un’espansione modulare, ma introduce anche la questione della disponibilità di processori x86 prodotti localmente.
Fasi del progetto
La fase di prova ha la funzione di validare l’ecosistema software, inclusi compilatori, debugger e strumenti di tuning, elementi fondamentali per sfruttare la capacità di calcolo.
In seguito, la fase industriale punta a replicare e moltiplicare i nodi per raggiungere la cifra promessa di 47.000 CPU. È importante sottolineare che molte decisioni rimangono aperte: non sono stati chiariti i nomi dei fornitori per i processori x86, e le alternative cinesi come Zhaoxin o Hygon hanno finora dimostrato capacità inferiori rispetto alle piattaforme più mature di Intel o AMD.
Numeri dell’infrastruttura
Il progetto include specifiche infrastrutturali di grande scala: 36 cabinet di rete con un’interconnessione progettata per raggiungere l’ordine di grandezza di un milione di porte, 428 nodi di storage capaci di offrire complessivamente 650 PB e 67 cabinet di archiviazione raffreddati a liquido, con una larghezza di banda dichiarata di 10 TB/s.
Questi elementi sono pensati per sostenere sia carichi HPC tradizionali sia attività legate all’intelligenza artificiale e al trattamento massivo di dati.
Storage e raffreddamento
Lo schema di raffreddamento liquido e la dimensione del sottosistema di archiviazione sono aspetti chiave per garantire efficienza energetica e throughput elevato. La presenza di cabinet dedicati al raffreddamento e di un’ampia capacità di storage suggerisce che il design tenga conto di applicazioni intensive di I/O, oltre alla mera potenza di calcolo in FLOPS. Nonostante le dichiarazioni, l’efficacia reale dipenderà dall’integrazione software-hardware e dalla gestione termica in esercizio.
Aspetti tecnici e criticità
La stima di oltre 2 ExaFLOPS è un valore teorico che, se confermato, supererebbe il risultato misurato di El Capitan su Linpack (1,809 ExaFLOPS), sebbene il picco teorico di El Capitan sia più alto (2,79 ExaFLOPS).
Va però ricordato che i risultati di benchmark reali spesso divergono dai numeri teorici e che nessun test pubblico è stato ancora eseguito su Lingsheng. Inoltre, la scelta di rinunciare agli acceleratori solleva dubbi sull’efficienza in carichi tipici di AI, dove le GPU e le APU dimostrano vantaggi comunicativi e di throughput per operazioni matriciali massicce.
Dal punto di vista politico e strategico, il progetto ha un forte valore simbolico: indica la volontà di perseguire l’autonomia tecnologica e di sperimentare un modello alternativo per raggiungere l’exascale. Resta però da vedere se la disponibilità reale di processori competitivi, l’ottimizzazione dei software di base e la mancanza di benchmark indipendenti permetteranno a Lingsheng di trasformare l’ambizione in un risultato concreto e misurabile.

