Tutorial CSV
pagina di riferimento: http://www.innovazione.provincia.tn.it/contenuti.php?t=opendata_tab&id=19
v1.4
David Leoni davidleoni.it
TANTI FOGLI EXCEL
UNA TABELLA
CSV
(Comma Separated Value)
PROBLEMA
Semplice CSV
Programma
Infografica
PERCHE’ I CSV?
TUTTI I PROGRAMMI RIESCONO AD APRIRE I FILE CSV!
STRUMENTI PER FARE UN CSV
OpenOffice CALC
(Foglio di calcolo tipo Excel)
4.1
2013-2014 Iscrizioni primo anno marzo.xls
Il file si chiama 2013-2014 Iscrizioni primo anno marzo.xls
Dall’anteprima,clicca poi la freccina per scaricarlo sul tuo computer...
E’ un file Excel, clicca qui per vedere l’anteprima nei Google docs
… e poi aprilo in CALC
Il file si chiama 2013-2014 Iscrizioni primo anno marzo.xls
2013-2014 Iscrizioni primo anno marzo.xls
2013-2014 Iscrizioni primo anno marzo.xls
Un sacco di tabelle in un solo foglio di calcolo..
PROBLEMA
Il file si chiama 2013-2014 Iscrizioni primo anno marzo.xls
Ma ci servono davvero tutte?
I dati grezzi sono i migliori
Le altre tabelle derivano (quasi) tutte dai dati grezzi
totali, sub-totali, etc non ci interessano
non ci interessano nemmeno le percentuali, SE abbiamo i dati grezzi
Tutti i dati riguardano le modalità ONLINE/CARTACEA tranne questi
Anche i dati grezzi hanno
qualche problema...
Ci sono celle unite!
I totali non ci interessano!
Le formattazioni non servono
Per selezionare, trascinare tenendo premuto Control
Riorganizziamo / 1
Incolliamo i dati dell’ONLINE in un nuovo foglio
OpenOffice automaticamente mette insieme le colonne
Riorganizziamo / 2
Riorganizziamo / 3
Adesso selezioniamo le colonne per il CARTACEO
Riorganizziamo / 4
Incolliamo in fondo
Soluzione in CALC / 1
Niente formattazione
nomi colonna ‘parlanti’
Niente totali
Nuova colonna per la Modalità
PROBLEMA
SE SAPPIAMO IL VALORE
SE NON SAPPIAMO IL VALORE
Mettiamolo nella cella
Lasciamo la cella vuota e scriviamo il significato che conosciamo nei metadati
SOLUZIONE
Cosa vogliono dire le celle vuote?
Le celle vuote nella colonna “Secondaria II grado” significano “Dato non pervenuto”
Selezioniamo Unicode (UTF-8)
Virgole come separatori dei campi
Salviamo come CSV / 1
Selezioniamo il formato csv
nome file in minuscolo, separato da ‘_’ (underscore)
Salviamo come CSV / 2
Se appare questo avviso, clicchiamo
Mantieni il formato corrente
in fondo stiamo semplificando apposta il file!
Soluzione .CSV in blocco note
Il CSV si trova qui: 2013_2014_iscrizioni_primo_anno_marzo.csv
Tabelle nota trimestrale 2 2013.xlsx
Il file si trova qui: Tabelle nota trimestrale 2 2013.xlsx
PROBLEMI
Troppi fogli! Ne vogliamo solo uno.
Tabelle nota trimestrale 2 2013.xlsx
Questi andrebbero nei metadati, fuori dalla tabella
Celle colorate
PROBLEMI
Riga extra con nome di categoria
Celle unite
Tabelle nota trimestrale 2 2013.xlsx
Totale che non serve
Separatore punto per le migliaia non necessario!
PROBLEMI
Tabelle nota trimestrale 2 2013.xlsx
II trimestre 2013 - II trimestre 2012
v.a. = valore assoluto?
Le percentuali si possono ricavare
Il punto viene utilizzato per separare le migliaia
Le percentuali sono visualizzate con solo 2 decimali
Le ultime colonne usano i punti per le migliaia, le virgole e sia ‘+’ che ‘-’ per indicare le variazioni
I numeri sono grezzi?
Anche se non conserveremo le colonne con le percentuali, le usiamo qui come esempio in caso di dati numerici
Vogliamo i numeri grezzi / 1
In questo caso, possiamo risolvere in un colpo solo tutti i problemi numerici visti prima!
Niente punti per le migliaia
Le virgole sono rimaste
Per le variazioni, i ‘+’ sono spariti
Vogliamo i numeri grezzi / 2
Anche se non conserveremo le colonne con le percentuali, le usiamo qui come esempio in caso di dati numerici
Riorganizziamo
Abbiamo creato le colonne Gruppo e Categoria per le righe ‘extra’
Abbiamo tolto le celle unite e le percentuali. Nei metadati specificheremo che pubblichiamo i valori assoluti
“Stranieri” includeva “di cui extracomunitari”, ma è meglio avere insiemi distinti
Il file si trova qui: assunzioni_prov_trento_nota_trimestrale_2_2013.csv
Nome descrittivo, tutto minuscolo, separato da ‘_’ (underscore)
Ecco il CSV!
Problemi di encoding
Hai salvato con Encoding UTF-8?
Per far apparire il pannello a sinistra quando risalvi, spunta
Modifica impostazioni filtro
Vedi caratteri strani quando apri il file CSV con blocco note?
Set di caratteri e UTF-8
Da wikipedia: (http://it.wikipedia.org/wiki/Codifica_di_caratteri )
Una codifica di caratteri, o charset, consiste in un codice che associa un insieme di caratteri (tipicamente rappresentazioni di grafemi così come appaiono in un alfabeto utilizzato per comunicare in un linguaggio naturale) ad un insieme di altri oggetti, come numeri (specialmente nell'informatica) o pulsazioni elettriche, con lo scopo di facilitare la memorizzazione di un testo in un computer o la sua trasmissione attraverso una rete di telecomunicazioni
UTF-8 (Unicode Transformation Format, 8 bit) è una codifica dei caratteri Unicode in sequenze di lunghezza variabile di byte, e permette di rappresentare qualsiasi tipo di carattere di qualsiasi lingua in formato digitale.
La IETF (Internet Engineering Task Force) richiede che tutti i protocolli Internet identifichino la codifica dei caratteri utilizzata, e che siano in grado di utilizzare almeno UTF-8.
UTF-8 è la codifica predefinita per il formato XML.
Grazie!
Per informazioni o supporto, scrivi a info@dati.trentino.it