1 of 15

WLCG, CoE, etc

Tommaso Boccali

(INFN Pisa)

2 of 15

WLCG

  • Ultimo anno di presa dati Run3, modificato in corsa a inizio marzo
    • Lungo run low pileup richiesto da ATLAS e CMS (soprattutto per W mass)
    • High intensity run alla fine – test di HL-LHC
    • Risorse sulla carta ok con pledge, ma …

3 of 15

Altri problemi

  • I run HI e LP decisi dopo la richiesta risorse, non banali da gestire (per esempio LP → gli esperimenti aprono il trigger a > 30 kHz)
  • Alcune FA non stanno facendo deployment in tempo delle risorse (il CNAF fra queste)

  • I Prezzi!

4 of 15

Il problema dei prezzi …

  • Cominciato a ~ settembre 2025 (*): enorme (5x o piu’) aumento dei prezzi di alcune componenti per richiesta (AI) >> capacita’ di produzione

*:Per fortuna molte FA avevano gia’ comprato le risorse 2026

5 of 15

Non solo un problema di soldi per le memorie

  • I grandi hyperscaler una volta comprato tutti I dischi SSD, sono passata ai dischi HDD .. Stanno per finire pure quelli
  • I tape che un tempo sembravano destinati a morire, Adesso sono richiestissimi
  • Ci si aspetta un bel trauma l’1 Aprile: molte ditte aggiornano ogni 3 mesi I prezzi. Per esempio IBM sembra mettera’ un +30% a tape
  • Non e’ solo un problema di prezzo. Semplicemente x alcune componenti anche le future produzioni sono state gia’ assegnate

6 of 15

Altre news WLCG

7 of 15

Trigger rate 2x rispetto a quanto si era sempre detto:

  • 5 → 10 kHz per Run4
  • 7.5 → 15 kHz per Run5

[compreso parking → delayed reconstruction]

Oggi (Run3) CMS prende ~ 6 kHz, ridicolo pensare che in Run4 sarebbe stato meno.

Nonostante questo, si starebbe nel nuovo flat budget definito nel 2025 … sperando abbia ancora senso!

8 of 15

WLCG Workshop 2026

  • A Bologna (CNR), 2-6 Novembre 2026
  • Daniele Cesini LOC, grazie per tutto il lavoro!
  • Come spesso, e’ shared WLCG e HSF

9 of 15

10 of 15

Il Center of Excellence per HEP in EuroHPC

  • Dopo parecchia attesa [gennaio 2025 (o 24??): lettera di proposta mia e di L. Giusti alla comunita’ HENP per sollecitare questa call]

  • uscite nuove call per Centri di Eccellenza EuroHPC:
    • Community: un dominio scientifico si organizza per elevare la sua capacita’ di uso di HPC
    • Transversal: un tool potenzialmente multidominio viene realizzato / testato
    • Lighthouse: un codice con potenziali utilizzatori anche industriali viene ingegnerizzato per uso “esterno

11 of 15

Cosa abbiamo sottomesso?

  • PI = CERN (visto come messaggio forte della comunita’, che mette a capofila il principale laboratorio)
  • INFN = coordinamento tecnico e in tutti i board decisionali
  • La call era dedicate ai codici: selezionati 8 codici di rilevanza HEP per porting / ottilizzazione su HPC: 2(+1) di LatticeQCD, Madgraph, Pepper, ALICE O2, CMS MLPF, Geant4 Adept per LHCb e ATLAS
  • Altro WP (forse + importante per noi): piattaforma di integrazione codici con HPC (CVMFS, Rucio, WMS, AI, …)
  • WP di technology tracking: test di efficienza energetica e RISC-V

12 of 15

(troppo) grossa componente italiana:

  • INFN
  • ICSC che fa da ombrello a UNIBA, UNIMIB, CINECA
  • E4
  • INFN e’ technical coordinator, stakeholder di codice (2xQCD, O2, AdePT, …), guida il WP di integrazione, ha attivita’ di tracking, …

CERN

IN2P3 + SDU

INFN

E4

13 of 15

WP1 (PM):

  • T1.1:PM
  • T1.2: Technical Coordination (including Q/A + Risk + IP… ) 
  • T1.3: Dissemination and outreach 
  • T1.4: Collaboration and connection to other projects (including scientific boards, CoPs, industry, external stakeholders) 

WP2 (Scientific codes and performance on HPC): 

  • T2.1: TH codes (LQCD) 
  • T2.2: Common Codes (e.g. AdePT includes AI)
  • T2.3: EXP code(includes AI) 
  • T2.4: other codes.. 
  • T2.5: Cross-HPC application domain / infrastructure domain experts (scalability, portability, performance optimization)

WP3 (Enabling technologies for integration, development of interfaces to EFP):

  • T3.1: Data management and data access
  • T3.2: Workload management (slurm, etc, …)
  • T3.3: Access to resources (AAI, software distribution, …)
  • T3.4: AI on HPC tools: distributed training, HPO, etc… 
  • T3.5: Interfaces to Architecture Testbeds 

WP4 (Architecture co-design, testbeds and sustainability):

  • T4.1: Hardware testbeds (RISC-V, ARM, AI specialized architectures),�and testbeds from HPC centers
  • T4.2: validation and benchmarking on provided testbeds
  • T4.3: sustainability and environmental optimizations 

14 of 15

budget

  • Tutto 8 Meur, di cui EC rimborsa 50%
  • Italia: ~ 1.6 Meur → 800keur rimborsati
    • Gli staff coprono almeno la meta’, per cui non c’e’ rischio di esborso
    • E4 sottoporra’ un Progetto MIMIT Complementare, per avere gli altri 800keur
    • Se va tutto bene, rimborso 100% (come per TEXTAROSSA)

  • INFN: boccali, bozzi, piano, pepe, spiga

  • E’ abbastanza ovvio che i nostri codici non sono ancora al livello (p.e.) di quelli della chimica teorica o delle simulazioni astrofisiche
  • Vediamo come va, AZ sta provando a agire su DG-CONNECT

15 of 15

AoB

  • AI: si sta muovendo tantissimo. Dopo la disfatta di RAISE, HEP sembra essere rientrata nel giro almeno del Progetto SCIANCE
    • Entro il 10 Aprile, proponiamoci per i WG!!!
  • Dovrebbero uscire alter call tematiche RAISE e Apply AI a breve. Speriamo che quelle RAISE siano aperte e non come l’ultima.
  • Stanno uscendo della call che uno potrebbe anche interpretare come “CERN per l’AI”. Chi le segue?