1 of 20

1

ICSC_progetto_comunicazione**

Spoke 2 - FUNDAMENTAL RESEARCH & SPACE ECONOMY

Sandra Malvezzi (INFN – MIB)

Antonio Stamerra (INAF – OAR)

Tommaso Boccali (INFN – PI)

2 of 20

Outline

  • Modalita’ di utilizzo fondi IG
  • Proposte lato ENI ? (qui veloce recap di use cases)
  • Come proseguire

2

3 of 20

Modalita’ di utilizzo IG

  • In approvazione finale al CDA febbraio 2023
  • Draft distribuito seconda meta’ gennaio 2023
    • Qui
  • Un piccolo riassunto segue …
    • Sono comunque fondi di progetto → non serve gara o call, solo “che il budget venga allocato”

3

Una parte negli spokes

Una parter nell’hub

4 of 20

  • L’idea e’ procedere ASAP con l’allocazione di quello che e’ gia’ negli Spokes (1.8 MEur in spoke 2)
    • 30 marzo pare troppo presto oggettivamente, verra’ probabilmente spostato +2 mesi
  • In un secondo giro, si cominciano anche a usare fondi nell’HUB (6 MEur), con l’idea che
    • Le progettualita’ migliori avranno di piu’
    • Si cerchera’ un bilanciamento nel caso un affiliato industriale abbia avuto piu’ di altri

Inviti per la presentazione dei progetti (Calls for Proposals per IG)

  • Prima Call for Proposals per IG
    • Scadenza per la presentazione delle proposte: 30 Marzo 2023
    • Il budget totale a disposizione è il budget per Innovation Funds assegnato agli spokes
  • Seconda Call for Proposals per IG
    • Scadenza per la presentazione delle proposte: 30 Settembre 2023
    • Il budget a disposizione è l’eventuale residuo budget spokes e la metà del budget per Innovation Grants dell’hub
    • nella seconda tornata possono essere finanziati nuovi progetti o la fase 2 dei progetti finanziati dalla prima call.
  • Terza Call for Proposals per IG
    • Scadenza per la presentazione delle proposte: 31 Gennaio 2024
    • Il budget a disposizione è il residuo budget Hub); nella terza tornata possono essere finanziati nuovi progetti o fasi di sviluppo successive dei progetti già finanziati

4

5 of 20

Come usarli?

  • Nello scorso meeting avevamo prospettato 3 modalita’ →
  • Sembrano essere tutte davvero possibili, con dei caveat
    • Per 1 e 2 l’agevolazione MUR non e’ il 100%
    • Per 2 ovviamente serve una controparte accademica che accetti

5

Dalle slides di Dicembre

6 of 20

6

7 of 20

Come procedere?

  • Lato vs, ci aspettiamo un follow-up sulle proposte presentate a Dicembre
    • Le abbiamo lasciate alla fine di queste slides
  • Se si sceglie ipotesi di finanziamento (1 o 2) o 3
  • 1 o 2:
    • Organizzare a breve un meeting tecnico con i WP leaders per inquadrare le attivita’
  • 3:
    • Come sopra +
    • Identificare fra gli affiliati chi e’ disponibile (ad una primissima survey, molti …)

7

8 of 20

Vecchie slides

8

9 of 20

In una slide: keywords delle attivita’ previste

  • Algoritmi: porting a GPU e in generale calcolo eterogeneo, soluzioni realtime e offline con FPGA, sistemi con intelligenza artificiale a scala piccola-media-grande

  • Infrastrutturale: calcolo distribuito, calcolo con sorgenti di dati eterogenee, analisi data intensive al livello di PB-EB di dati, calcolo interattivo e infrastrutturale

  • La nostra sfida / percezione è che la maggior parte delle soluzioni NON sia relativa alla ricerca «fondamentale», e neppure alla «ricerca tout-court»

9

10 of 20

Le industrie

  • Già elencate al momento del bando
    • Leonardo: interesse soprattutto lato Space Economy
    • Intesa Sanpaolo: molteplici punti di contatto
      • Data management, analisi dati da sorgenti eterogenee, AI, ...

  • Discussioni post bando
    • IFAB: molteplici interessi; i più chiari al momento
      • E4: testbed tecnologici su soluzioni «non standard»
      • BIP e Esteco: data analysis e processing
    • ENI:

  • In attesa di definizione:
    • UnipolSAI

10

11 of 20

I testbed

  • Per noi la realizzazione di testbed è una parte essenziale dell’attività del 2o e 3o anno, e il modo principe di collaborare con l’industria
  • Per noi il testbed è una piattaforma tecnologica, messa a disposizione dai partner Spoke 2 o mediante Open Calls o Innovation Grants o dallo Spoke 0 o dallo Spoke 1 (“Living Labs”), su cui sperimentare use cases accademici e industriali. Esempi (non finali):
    • Una piattaforma per test di calcolo eterogeneo (standard se da Spoke 0, meno se autoprocurata o da Spoke 1: ARM + GPU, GPU non Nvidia)
    • Una piattaforma per test di calcolo distribuito e porting di modelli su datalake
    • Una piattaforma ottimizzata per ML training
  • Ovviamente l’ideale sarebbe condividerle ANCHE con altri spoke

11

12 of 20

Collaborazioni con altri Spoke

  • Ancora in fase di studio; ci aspettiamo grosso contributo dalle Riunioni dello Steering degli Spoke
  • Alcune Ovvie
    • Spoke 0: alcuni dei nostri use cases sono già pronti a USARE risorse 🡪 Spoke Allocation Board + Spoke 0; middleware datalake da integrare con WP5
    • Spoke 3: Spoke “sinergico”. Scambio di persone a livello di Steering per armonizzare le attività, previste collaborazioni a molti livelli (attività “astroparticle”, data management, …)
    • Spoke 1: sinergia a livello tecnologico: accesso a piattaforme di R&D, studio di framework per calcolo eterogeneo

12

13 of 20

A che punto siamo con l’organizzazione?

  • Kick off Spoke 12: 13-14 Ottobre
  • Kick off CN: 25-25 Novembre
  • I WP hanno cominciato le riunioni piu’ o meno periodiche
  • Per Natale (ora!) e’ stato chiesto ai vari WP di avere una prima lista di use cases che vorrebbero presentare come “flagship”
    • Meeting di review inizio 2023

13

14 of 20

Possibili modalita’ di ingaggio con l’industria

  • Stiamo ancora aspettando dall’HUB il documento finale, ma tecnicamente nel CN ci sono 2 modalita’:
    • Open Calls (OC): riservate a industrie NON partner (quindi NON Intesa/ENI/Leonardo/…) - 32 MEur
    • Innovation Grants (IG): riservate a partecipanti al CN (quindi SI Intesa/ENI/Leonardo/…) – 18 MEur sugli spokes (1.8 MEur su Spoke 2) + 12 MEur centralmente sull’HUB

  • Come usarli?

14

15 of 20

Modalita’ tentative di utilizzo degli IG (pending documento CdA)

  • Non ancora chiarissimo, ma sembra plausibile
    1. L’industria X mette a disposizione un testbed (per esempio usando cluster / risorse che ha gia’ a disposizione o che puo’ acquisire) con tecnologie non gia’ disponibili, e viene rimborsata per la sua operativita’
    2. L’industria X acquisisce su IG unita’ di personale / stagisti / … (da verificare forma legale) e li manda a lavorare con il lato accademico, anche fisicamente
    3. L’industria X chiede a un partner accademico di assumere unita’ di personale (PhD? Borse tecnologiche? Tempi determinati?) che poi lavori su progetti comuni, anche co-locati

(differenti modalita’ di rendicontazione?)

15

16 of 20

Modalita’ di definizione progetti industriali

  • Un misto di top down e bottom up, a nostra comprensione
    • Top down: le industrie propongono macro temi all’Industrial Board, e poi si cerca un match con gli Spoke (“a chi interessa?”)
      • Ci immaginiamo principalmente vero per IG su HUB
    • Bottom up: a livello di spoke si discutono use cases di interesse comune e si trovano dei progetti su cui mettere i fondi, con le modalita’ della slide precedente
      • Come sopra, per fondi IG su Spoke

16

17 of 20

Nostre proposte (ad alto livello)

  • Testbeds:
    • Messa a disposizione del centro/spoke di risorse che l’industria abbia gia’ a disposizione / voglia acquisire
      • Per esempio per inserire un ulteriore centro in un testbed di calcolo in un testbed di calcolo distribuito

  • Use cases su utilizzo di sistemi ML a vario livello di scala
    • Idea: partire dalla sperimentazione su use case scientifici, e dimostrare utilizzabilita’ su use case scientifici. Alcuni esempi:
      • Time series: anomaly detection in apparati industriali
      • Simulazioni con GAN, VAE, Normalizing flows, … anche a larga scala
      • Mimicking di algoritmi, con Graph Networks, Transformers, ….

17

18 of 20

  • Use cases sul porting di software
    • Porting e benchmarking di codice esistente su framework di calcolo eterogeneo (GPU, TPU, FPGA, ….)
    • Sistemi per inferenza Machine Learning su FPGA
  • Use cases di calcolo distribuito
    • Adattamento di algoritmi ad accesso dati da datalake
    • Data management distribuito al PB e oltre (accesso, trasferimento, consistenza, …)
    • Fruizione di risorse remote (modelli di inferenza su FPGA remote, …)
  • Use cases di analisi ad alta performance
    • Jupyter notebooks legati a sistemi distribuiti e HPC, analisi “interattiva” su grandi basi di dati (anche distribuiti)
  • Space Economy e’ un caso a parte 🡪

18

19 of 20

Space Economy

  • Siamo in contatto con il Copernicus User Forum per la realizzazione di PoC su tematiche similari nell’ambito Space Economy (per esempio nell’ambito SNPA). Idea:
    1. prendere use cases rilevanti nei vari settori (come prioritizzati dal tavolo SE)
    2. Realizzare PoC (non in produzione!) con le tecnologie del CN, in pratica gli use cases delle slides precedenti
    3. Poi saranno le industrie per esempio gia’ finanziate nell’Azione di Accompagnamento a portare il sistema in produzione
      • Molte industrie del CN sono anche in AdA, possibile interesse a fare R&D su CN e poi produzione su AdA

19

20 of 20

Caso Specifico ENI

  • In una prima versione del progetto, c’era anche un centro ENI (dal punto di vista logico) a Milano Bicocca
  • Adesso almeno a noi non e’ ben chiaro se ci sia ancora / se sia recuperabile via altre forme di finanziamento
  • Se cosi’ fosse, sarebbe interesse del CN (ma anche di ENI!) che questo fosse inserito dello stesso datalake di tutte le altre risorse de CN
    • Una parte degli innovation grants, forse quelli centrali o di Spoke0 possono essere usati per personale che aiuti la gestione del sito, e la sua integrazione con le altre infrastrutture

20