1 of 16

Come inserire richieste informatiche

2 of 16

Chi / cosa / come / quanto ?

  • E’ arrivata la mail sulla possibilita di inserire richieste di risorse informatiche a ICSC →
  • Cosa serve per farlo? Un login qualunque fra PICA / LoginMiur / Referees
    • PISA: va bene anche lo SPID
    • LoginMiur: immagino lo consociate tutti (e’ quello in cui si inseriscono PRIN, VQR etc)
    • Referees: per I referees di FIRB, VQR, PRIN …

  • Se non lo avete, usate il tasto

3 of 16

Chi?

  • Nella nostra organizzazione, l’idea e’ che a inserire la richiesta risorse siano i PI delle Flagship / Innovation Grants / Altre attivita’ di Spoke non FS / Open Calls (one day…)
    • O un loro delegato (per esempio nel caso degli Innovation Grants)
    • In caso di progetti con delle sottoiniziative, vanno bene anche I responsabili di queste sottoiniziative (ma il PI deve essere informato)
  • Come: loggandosi su quel form, automaticamente si crea una richiesta a nome della persona loggata …
  • NON vi e’ feedback diretto allo Spoke o ai WP, per cui cerchiamo di evitare il far west:
    • Le sottoattivita’ di ogni Flagship / IG / Attivita’ devono informare il PI
    • I PI devono informare I WP leader
    • I WP leader gli SP

Worksflow nella prossima slide →

4 of 16

PI della singola iniziativa (FlagShip / IG / anche altra attivita’)

Riempie il portale o delega persone a farlo (nel caso di sottoattivita’ o di task specifici che necessitano di risorse

Quando il documento e’ RIEMPITO ma NON FINALIZZATO, lo mostra al WP leader

Ok dei WP leader (di tutti i WP coinvolti, per esempio WP4 e WP5 per la parte infrastrutturale)

Lo finalizza

WP leader

SL leader

PDF finale uploadato in un’area GDrive

Spoke leaders prioritizzano

1

2

3

4

5

6

CHI FA COSA

5 of 16

Upload sul drive

  • Istruzioni e folder qui
  • Il README definisce la convenzione dei nomi dei files PDF

6 of 16

Cosa?

  • Noi SL avevamo gia’ fatto una ricognizione (leggendo I vari progetti) su cosa ci pareva servisse
    • Qui
  • pero’
    • non tutte le attivita’ sono nelle flagship
    • purtroppo il form chiede cose un po diverse, e spesso molto tecniche
  • Andiamoci attraverso …

7 of 16

Pagina 1

  • Autocompilata con I dati della persona che ha fatto login

8 of 16

Pagina 2

  • Inserire il nome della persona che sta compilando (di nuovo), e del suo Gruppo di lavoro
  • La persona che compila, come detto prima, puo’ essere
    • Il PI dell’iniziativa
    • Una persona da lui delegata per inserire la richiesta per tutto il Progetto
    • Una persona che si occupa di una sottoattivita’ del Progetto (in questo caso per un singolo Progetto ci saranno piu’ inserimenti)

  • E’ tutto molto formale, e speriamo / crediamo alla fine anche poco rilevante, ma serve (crediamo) per capire a quanti serva dare accesso informatico

9 of 16

Pagina 3

Lo spoke di riferimento e’ chiaramente Spoke 2

Il “confirm” e’ per noi relative al fatto che si sia avuto ok da WP leaders

(nota: il confirm dice solo che e’ un’attivita’ nota allo spoke, ma non dice il livello di priorita’ che ovviamente sara’ deciso centralmente, anche in base ai commitment – una flagship priorita’ > di un’altra attivita’ di WP non flagship)

10 of 16

Pagina 4

  • Dovrebbe essere tutto copiabile dal Progetto Flagship / Innovation grant, va scritto per attivita’ “other”(se non gia’ in altri documenti di progetto)
  • In particolare, dove si deve uploadare file si puo’ usare il progetto completo
  • Executive summary: taglia e incolla dalla introduzione del progetto

nel caso di FS e IG mettere tra parentesi nel Project title il codice (UC2.3.6)

11 of 16

Pagina 5

  • Gia’ piu’ complesso, immaginiamo venga dal modulo standard ISPRA-C (anche la parte del “prove” non la riterrei importante)
  • Lasciando ovviamente ampia liberta’ al sottomettitore esperto, diremmo che la scelta’ e’ fra
    • Calcolo su N sistemi con CPU e/o GPU, con necessita’ di comunicazione veloce fra i nodi (“calcolo HPC”)
    • Calcolo su N sistemi con CPU e/o GPU, senza necessita’ di comunicazione veloce fra i nodi (“calcolo HTC”)
    • N VM cloud su cui istanziare servizi e/o un batch system
    • N Macchine “isolate” da usare in attivita’ di R&D con CPU e/o GPU
      • per esempio per fare training di sistemi ML

12 of 16

Pagina 6

  • Richieste tipiche di un Sistema HPC:
    • Unita’ di misura e’ CPU e/o GPU hours da usare in totale
      • Minimo e ottimale da specificare
      • Si intende per tutto il periodo fino a alla fine del progetto (Settembre 2025)
        • Inserire nelle note, dove possible, lo sviluppo temporale: il 10% nel 2024 e il 90% nel 2025, per esempio
      • Galileo 100 = solo CPU; Leonardo Booster = solo GPU
        • Mettere nelle note che le richieste sono ok anche su altre macchine simili
          • Esempio: G100 → Leonardo GP; Leonardo Booster → Lisa etc etc
    • Spazio disco scratch (60 gg) e permanente (fino alla fine del Progetto) richiesto
  • CINECA offre anche risorse cloud, simili a quelli nelle slides dopo.
    • resta inteso (parlato con RAC) che sistemeranno loro richieste cloud fra CINECA e INFN, consiglio e’ richiederla a Pagina 7 e non qui

13 of 16

Pagina 7

  • Richieste di tipo cloud
    • VM, batch systems on demand, Jupyter notebooks, machine per R&D
  • .. O batch (GRID)
    • Accesso ai batch HTCondor dei siti INFN
  • Accesso ad alcuni sistemi con GPU
    • Per esempio interessanti per R&D di Machine Learning
  • Richieste con FPGA: sono fuori da questo modulo, facciamo mediante connessione diretta con INFN
  • Richieste “HPC bubbles”: considerarle come Cloud INFN e specificate nel caso “serve rete veloce”

14 of 16

Pagina 7

  • Risorse di tipo Cloud (VM)
    • PaaS include anche IaaS (single machine virtuali)
      • PaaS: macchine virtuali con servizi sopra (per esempio sistemi ad alto rate, JupyterLab, data transfer)
      • IaaS: macchine virtuali nude, come un sistema linux appena installato
    • Inserire numero di macchine e numero di cores virtuali per macchina (sia per CPU che CPU+GPU), e RAM per vCORE
    • Se si vuole che ci sia installato un serivizio “centrale” (cioe’ non installato da Spoke2) specificarlo
  • Risorse su Batch system/GRID (su siti INFN)
    • Queste sono risorse accessibili sia via GRID che (quasi sempre) anche via batch; si puo’ anche specificare in quale centro siano installate; Tier dell’INFN sono
      • Torino, Milano, Padova, Legnaro, Bologna, Pisa, Roma1, Frascati, Napoli, Bari Catania

15 of 16

Pagina 8

  • Richieste storage distribuito e locale, incluso il tape
    • domande importanti sono:
      • Quali protocolli per accedere al disco
        • POSIX (“ls”), Xrootd, WebDAV, S3, …
      • (poi su questi oggetti Spoke 2, con WP5, puo’ mettere data management etc … → contattateli)
    • Le domande sotto le capisco meno, sembrano la copia di quelle a pagina 7 … rispondere in modo consistente

16 of 16

Alcune note

  • In tutti i casi in cui sia noto, mettere nelle note lo sviluppo temporale, tipo
    • “delle XX ore che richiedo, ne servirebbero YY nel 2024 e ZZ nel 2025”
  • Quando nel Progetto si chiedono risorse come Numero di Nodi, attenzione a scalare per l’utilizzo vero. Per esempio: se serve 1 macchina per fare R&D in interattivo, su CINECA, questo non vuol dire 24*365 ore, ma contare le ore in cui si usa davvero (per esempio, 20% delle ore “vere dell’anno”)
  • Lo stesso per le GPU: mettere le ore per I test veri, non per attivita’ come compilazione, che si dovranno effettuare da sistemi che NON costano ora (come i login nodes)