SOCIAL MEDIA MINING
(obiettivi)
Nell’epoca della trasformazione digitale, una parte parte importante delle informazioni utilizzabili dalle aziende sono ricavabili da dati non strutturati memorizzati in documenti aziendali (word, power point, e pdf), sul web (siti web, blog e comunità online) o su social media. Questi dati costituiscono un importante bacino informativo per comprendere i fenomeni e le dinamiche ambientali che riguardano la vita delle organizzazioni. Si tratta però di informazioni di carattere prevalentemente testuale, e di formato non strutturato. Inoltre, sono informazioni che hanno tutte le caratteristiche di velocità, varietà e quantità che caratterizzano i big data.
Il corso affronta le sfide tecniche per le organizzazioni e gli strumenti applicativi per identificare, raccogliere, estrarre, ed analizzare in maniera automatica fonti dati non strutturati provenienti da pagine web e social media.
Il corso introduce teoricamente i processi organizzativi fondamentali – sense making, decision making, e knowing – e i fondamenti dell’analisi qualitativa e dell’analisi automatica del testo. Il corso prevede inoltre conoscenze teoriche sui meccanismi di funzionamento delle tecnologie web includendo: protocolli e standard web e html, principali meccanismi di funzionamento dei social media, API per l’accesso ai dati sulle piattaforme social media, principali tecnologie di interscambio dati tra piattaforme diverse (csv, json).
Per finalità applicative nel corso gli studenti svolgeranno attività pratiche di estrazione, manipolazione ed analisi di dati prelevati da social media o da siti web. Le conoscenze, le tecniche e gli strumenti appresi durante il corso possono essere utilizzate anche per l’analisi di altri tipi di dati non strutturati quali ad esempio report, documenti, o fonti documentali provenienti da banche dati.
Durante il corso gli studenti saranno impegnati in attività di apprendimento (sia di tipo teorico che di tipo applicativo) individuale e di gruppo. La partecipazione al corso è volta a stimolare negli studenti lo sviluppo delle seguenti conoscenze e capacità.
Conoscenza e capacità di comprensione Comprendere opportunità e limiti dei big data, dei dati non strutturati, e dell’analisi automatica del testo. Conoscere i processi organizzativi fondamentali e il ruolo che l’informazione ha all’interno degli stessi. Conoscere i fondamenti teorici e le tecniche necessarie per l’estrazione e l’analisi automatica di dati a partire da fonti di testo non strutturate.
Conoscenze e capacità di comprensione applicate Riconoscere ambiti di applicazioni pratiche delle tecniche di estrazione, manipolazione, ed analisi di dati non strutturati. Riconoscere opportunità e rischi dell’utilizzo dell’informazione proveniente da fonti dati non strutturati, dal web, e dai social media.
Autonomia di giudizio Comprendere se e quali dati provenienti da fonti non strutturate (web e social media) possono rispondere al fabbisogno informativo di persone o organizzazioni. Comprendere quali fonti informative strutturate e non strutturate integrare per rispondere al fabbisogno informativo. Saper valutare il contenuto informativo – ed i bias eventualmente presenti – all’interno di dati non strutturati. Saper interpretare in maniera oggettiva l’informazione ottenuta dall’analisi automatica del testo.
Abilità comunicative Durante il corso gli studenti alleneranno la capacità di presentare, argomentare e discutere in pubblico degli strumenti di analisi automatica del testo e dell’interpretazione dei risultati delle analisi effettuate.
Capacità di apprendere Capacità di affrontare il processo di apprendimento in maniera completamente autonoma ed auto-gestita.
|
Codice
|
119031 |
Lingua
|
ITA |
Tipo di attestato
|
Attestato di profitto |
Crediti
|
8
|
Settore scientifico disciplinare
|
SECS-P/10
|
Ore Aula
|
48
|
Attività formativa
|
Attività formative affini ed integrative
|
Canale Unico
Docente
|
BRACCINI Alessio maria
(programma)
Il programma del corso è diviso in una parte teorica ed in una parte applicativo/pratica. Nella parte teorica gli studenti approfondiranno i processi organizzativi di sense making, decision making, e knowing. Approfondiranno i problemi tecnici e le potenzialità dell’analisi di dati non strutturati e dell’analisi automatica del testo. Approfondiranno inoltre conoscenze teoriche relative al funzionamento delle tecnologie web e dei social media.
Nella parte applicativo/pratica gli studenti approfondiranno una serie di competenze pratiche che riguardano l’uso di strumenti di raccolta, manipolazione ed analisi dati funzionali ad aumentare il fabbisogno informativo delle organizzazioni. Nella parte applicativo/pratica saranno affrontati i seguenti aspetti: - Web scapring e social media mining - Data manipulation: pulizia, codifica, decodifica e tasformazione di dati - Operazioni di base di text mining: creazione di text crorpora, estrazione di token, lessici, radici, lemmi, n-gram, matrici tdm/dtm; - Operazioni avanzate: annotazione semantica, estrazione di topic, sentiment, emotion dal testo, classificazione
(testi)
In corso di definizione
 |
Date di inizio e termine delle attività didattiche
|
Dal al |
Modalità di erogazione
|
Tradizionale
A distanza
|
Modalità di frequenza
|
Non obbligatoria
|
Metodi di valutazione
|
Prova orale
Valutazione di un progetto
|
Docente
|
Margherita Emanuele Gabriel
(programma)
Il programma del corso è diviso in una parte teorica ed in una parte applicativo/pratica. Nella parte teorica gli studenti approfondiranno i processi organizzativi di sense making, decision making, e knowing. Approfondiranno i problemi tecnici e le potenzialità dell’analisi di dati non strutturati e dell’analisi automatica del testo. Approfondiranno inoltre conoscenze teoriche relative al funzionamento delle tecnologie web e dei social media.
Nella parte applicativo/pratica gli studenti approfondiranno una serie di competenze pratiche che riguardano l’uso di strumenti di raccolta, manipolazione ed analisi dati funzionali ad aumentare il fabbisogno informativo delle organizzazioni. Nella parte applicativo/pratica saranno affrontati i seguenti aspetti: - Web scapring e social media mining - Data manipulation: pulizia, codifica, decodifica e tasformazione di dati - Operazioni di base di text mining: creazione di text crorpora, estrazione di token, lessici, radici, lemmi, n-gram, matrici tdm/dtm; - Operazioni avanzate: annotazione semantica, estrazione di topic, sentiment, emotion dal testo, classificazioni
(testi)
Books: Simon Munzert, Christian Rubba, Peter Meißner, and Dominic Nyhuis Automated data collection with R: A practical guide to web scraping and text mining. John Wiley & Sons, 2014
ISBN 978-1118834817
Bing Liu Sentiment analysis: Mining opinions, sentiments, and emotions Cambridge University Press, 2015
ISBN 978-1107017894
|
Date di inizio e termine delle attività didattiche
|
Dal al |
Modalità di erogazione
|
Tradizionale
A distanza
|
Modalità di frequenza
|
Non obbligatoria
|
Metodi di valutazione
|
Prova orale
Valutazione di un progetto
|
|
|