Excel - dati


Uno strumento semplice e per chiunque

Il primo argomento che affronteremo nell'affacciarsi ad un uso più avanzato di Excel è capire ogni tipo di formato e di dato che Excel è in grado di sopportare poi andremo ad analizzare alcuni strumenti che excel offre per importare dati da diverse risorse, quindi andremo a capire:



Quali formati di file posso apire o salvare (più comuni) con Excel e come?


Questi formati sono suddivisibili (non a livello canonico dell'informatica ma solo per aiutare l'interpretazione) in tre sottocategorie:

Estensioni di Excel

In questa categoria rientrano quei formati creati appositamente da Microsoft Office per Excel

Basati su file di testo

Questi formati sono in grado di contenere solo dei record non funzione o altre formattazioni grafiche per tabelle, la principali qualità di questa tipologia di formati è la loro capacità di "racchiudere tante informazioni occupando uno spazio molto piccolo", infatti in questi formati, ogni riga della tabella (o record della base dati) è normalmente rappresentata da una linea di testo, che a sua volta è divisa in campi (le singole colonne) separati da un apposito carattere separatore, ciascuno dei quali rappresenta un valore.
I formati più comuni in questo ambito sono il .csv, il .txt e il .prn per aprire questi formati in Excel e poterli modificare è necessario eseguire delle operazioni semplici ma senza le quali risulta complicato modifcarli o leggerli, nell'esempio sottostante faremo un esempio con un .csv in quanto risulta tra i tre il formato più usato (non useremo in questa parte lo strumento di importazione automatica dei .csv di Excel per far capire la logica sottostante a questo formato):


Per esempio proviamo a scarire e aprire questo file ,un dataset sui film, che corrisponde ad una matrice con 163 284 elementi divisi in tre colonne dove nella prima colonna c'è il titolo del film, nella seconda il voto assegnato da IMDB e nella terza il numero di persone che hanno votato.
Una volta scaricato e aperto il file dovrebbe comparire cosi:


Come prima cosa è necessario selezionare la prima colonna e andare nella sezione "Dati" e cliccare su "Testo in colonne":


Una volta cliccato "Testo in colonne", si aprirà una schermata nella quale bisogna selezionare su delimitato e poi andare avanti:


Cliccare su tabulazione, virgola e controllare che il delimitatore di testo sia " e poi cliccare avanti:


Cliccare poi su fine:


E i dati sono stati divisi in colonna:


Di lettura non modificabili

Queste tipologie di formati non offrono la possibilità una volta salvati di essere modificati. Tra questi possiamo trovare .html, .htm, .pdf, .xps, .mht.


Quali strumenti di importazione automatica offre Excel e come si utilizzano?



Excel offre molti strumetni automatici per importare automaticamente i dati, i principali e quelli di applicazione più comuni sono 3:


Formati testo/CSV

Questo strumento è semplice, per testarlo si possono utililizzare questi file:

Download file1 formato .csv
Download file2 formato .txt
Download file3 formato .prn

Con questo strumento basta andare nella barra menu in "Dati", poi andare su "Recupera dati", "da file" e infine cliccare "DA testo/CSV" e seguire la procedura di importazione.
Quindi in breve: DATI > RECUPERA DATI > DA FILE > DA testo/CSV
Poi bisogna selezionare il file e i dati vengono caricati correttamente, questo metodo funziona con tutti i formati basati su file di testo (.csv, il .txt e il .prn).




Formati XML

Per testare questo strumento si può utililizzare questo file:

Download file formato .xml

E occorre procedere con: DATI > RECUPERA DATI > DA FILE > DA XML

Il file XML è strutturato nel seguente modo:

            
            
                1
                Rick
                623.3
                1/1/2012
                IT
            
                
            
                2
                Dan
                515.2
                9/23/2013
                Operations
            
            
            
                3
                Michelle
                611
                11/15/2014
                IT
            
            
            
                4
                Ryan
                729
                5/11/2014
                HR
            
            
            
                5
                Gary
                843.25
                3/27/2015
                Finance
            
            
            
                6
                Nina
                578
                5/21/2013
                IT
            
            
            
                7
                Simon
                632.8
                7/30/2013
                Operations
            
            
            
                8
                Guru
                722.5
                6/17/2014
                Finance
            
                
            
        
Per avere altre informazioni su come inportare un file XML visitare questo sito

Dal web (webscraping)

In questa ultima sezione capiamo come importare dati che magari cambiano di settimana in settimana o di giorno in giorno e riuscire a renderlo piu automatico per cercare di perdere il meno tempo possibile.
In particolare ci baseremo su un esempio semplice: vogliamo scaricare i dati delle squadre di Serie A sfruttando gli strumenti di importazione automatica di Excel.
Nell'esempio sottostante per scaricare i dati ci collegheremo al sito: http://www.legaseriea.it/it/serie-a/classifica

Andiamo su "DATI - RECUPERA DATI - DA ALTRE ORIGINI - DA WEB"


Inseriamo il link dal quale vogliamo copiare la tabella:


Una volta che Excel ha analizzato la pagina web ti elenca tutte le tabelle che ci sono nella pagina web (Table 0, Table 1 ...) e occorre selezionare la tabella che ci interessa e poi cliccare su carica:


I dati vengono caricati correttamente: