SOCIAL MEDIA MINING
(obiettivi)
Nell’epoca della trasformazione digitale, una parte parte importante delle informazioni utilizzabili dalle aziende sono ricavabili da dati non strutturati memorizzati in documenti aziendali (word, power point, e pdf), sul web (siti web, blog e comunità online) o su social media. Questi dati costituiscono un importante bacino informativo per comprendere i fenomeni e le dinamiche ambientali che riguardano la vita delle organizzazioni. Si tratta però di informazioni di carattere prevalentemente testuale, e di formato non strutturato. Inoltre, sono informazioni che hanno tutte le caratteristiche di velocità, varietà e quantità che caratterizzano i big data.
Il corso affronta le sfide tecniche per le organizzazioni e gli strumenti applicativi per identificare, raccogliere, estrarre, ed analizzare in maniera automatica fonti dati non strutturati provenienti da pagine web e social media.
Il corso introduce teoricamente i processi organizzativi fondamentali – sense making, decision making, e knowing – e i fondamenti dell’analisi qualitativa e dell’analisi automatica del testo. Il corso prevede inoltre conoscenze teoriche sui meccanismi di funzionamento delle tecnologie web includendo: protocolli e standard web e html, principali meccanismi di funzionamento dei social media, API per l’accesso ai dati sulle piattaforme social media, principali tecnologie di interscambio dati tra piattaforme diverse (csv, json).
Per finalità applicative nel corso gli studenti svolgeranno attività pratiche di estrazione, manipolazione ed analisi di dati prelevati da social media o da siti web. Le conoscenze, le tecniche e gli strumenti appresi durante il corso possono essere utilizzate anche per l’analisi di altri tipi di dati non strutturati quali ad esempio report, documenti, o fonti documentali provenienti da banche dati.
Durante il corso gli studenti saranno impegnati in attività di apprendimento (sia di tipo teorico che di tipo applicativo) individuale e di gruppo. La partecipazione al corso è volta a stimolare negli studenti lo sviluppo delle seguenti conoscenze e capacità.
Conoscenza e capacità di comprensione Comprendere opportunità e limiti dei big data, dei dati non strutturati, e dell’analisi automatica del testo. Conoscere i processi organizzativi fondamentali e il ruolo che l’informazione ha all’interno degli stessi. Conoscere i fondamenti teorici e le tecniche necessarie per l’estrazione e l’analisi automatica di dati a partire da fonti di testo non strutturate.
Conoscenze e capacità di comprensione applicate Riconoscere ambiti di applicazioni pratiche delle tecniche di estrazione, manipolazione, ed analisi di dati non strutturati. Riconoscere opportunità e rischi dell’utilizzo dell’informazione proveniente da fonti dati non strutturati, dal web, e dai social media.
Autonomia di giudizio Comprendere se e quali dati provenienti da fonti non strutturate (web e social media) possono rispondere al fabbisogno informativo di persone o organizzazioni. Comprendere quali fonti informative strutturate e non strutturate integrare per rispondere al fabbisogno informativo. Saper valutare il contenuto informativo – ed i bias eventualmente presenti – all’interno di dati non strutturati. Saper interpretare in maniera oggettiva l’informazione ottenuta dall’analisi automatica del testo.
Abilità comunicative Durante il corso gli studenti alleneranno la capacità di presentare, argomentare e discutere in pubblico degli strumenti di analisi automatica del testo e dell’interpretazione dei risultati delle analisi effettuate.
Capacità di apprendere Capacità di affrontare il processo di apprendimento in maniera completamente autonoma ed auto-gestita.
|