Docente
|
cozza vittoria
(programma)
La rappresentazione dell’informazione: • la codifica dei dati alfanumerici (ascii, utf-8, etc.) • i formati digitali per la pubblicazione e lo scambio dei dati, formati strutturati (csv, xml, json, xls, etc.) o debolmente o non strutturati (txt, pdf) Architettura del web. I protocolli di rete (HTTP, HTTPS, FTP, etc.). Il linguaggio HTML. Definizione e costruzione dei questionari (CAPI/PAPI, CAWI); come creare form e questionari. Reperimento di Open Data. Cenni su reperimento di dati da Social Media. Gli aspetti legali legati alla pubblicazione e raccolta dei dati su web: • Cenni su Privacy e tutela dei dati personali. • Cenni sulla proprietà intellettuale dei dati. Tecniche di ETL, estrazione e trasformazione dei dati (normalizzazione dei dati eliminando i duplicati, tradurre dati codificati, derivare nuovi dati calcolati, record linkage). Fondamenti di manipolazione dei dati con Python utilizzando la libreria Pandas.
(testi)
Dispense del docente. Al Sweigart. Automate the Boring Stuff with Python. 2015. Free to read under a Creative Commons license. https://automatetheboringstuff.com/
|