Mutua da
|
119237 ANALISI STATISTICA MULTIVARIATA E DATA MINING in AMMINISTRAZIONE, FINANZA E CONTROLLO LM-77 cotroneo rossana
(programma)
1. I Dati, la loro organizzazione statistica e il processo di controllo e la correzione • Le strutture statistiche dei dati: • Le strutture informatiche dei dati e loro organizzazione • Controllo e correzione dei dati: errori casuali e sistematici; dati mancanti; dati fuori campo; incongruenze logiche; dati anomali; imputazione dati mancanti.
2. Le sintesi dei dati, le loro trasformazioni 3. Alcune distribuzioni teoriche multivariate dei dati • distribuzione multinormale • distribuzione multinomiale
4. Classificazione non supervisionata (cluster analysis) Le caratteristiche dei clusters sulla base della (dis)similarità e distanza fra unità multivariate: Misure di (dis)similarità e distanza. Misure di Omogeneità ed Isolamento dei clusters. - I metodi non gerarchici: K-medie, Pam e K-medoidi fuzzy - Scelta delle variabili, scelta del numero dei clusters, interpretazione dei risultati; - I metodi gerarchici aggregativi: legame singolo, legame medio, legame completo, centroide, metodo di Ward. Interpretazione del dendrogramma, metodi di scelta di una partizione;
5. Le metodologie di riduzione dimensionale: • analisi delle componenti principali (PCA); • analisi fattoriale • analisi delle corrispondenze e analisi delle corrispondenze multiple
6. Classificazione non supervisionata (cluster), 7. Modelli supervisionati: o Regressione lineare; o Modello lineare generalizzato o Regressione logistica; o Alberi di classificazione o Support vector machine o Random forest (cenni) o Gradient boosting (cenni) o Reti neurali (cenni)
• Valutazione del modello supervisionato e non supervisionato
(testi)
- slide delle lezioni che saranno caricate sulla piattaforma Moodle
|