Docente
|
CASTRIGNANO' TIZIANA
(programma)
Il seguente corso e’ incentrato sullo studio delle tecnologie necessarie per trasformare e manipolare dati biologici. In particolare è focalizzato sugli strumenti che permettono l’analisi di grandi set di dati di sequenziamento con lo scopo di ottenere risultati biologici riproducibili e robusti. Per questo motivo 2 crediti del corso sono dedicati all'introduzione dell’ambiente linux e degli strumenti con esso inclusi per la manipolazione dei dati. La seconda metà del corso (i rimanenti 2 crediti) e’ dedicata ai fondamenti della programmazione illustrati mediante il linguaggio python ed applicati all'analisi delle sequenze.
Linux: - Impostazione e gestione di un progetto di bioinformatica in ambiente linux - Directory di progetto e strutture di directory - Perché utilizziamo Linux in bioinformatica? Modularità e la filosofia di Linux - Le variabili d’ambiente - Lavorare con i flussi e il reindirizzamento - Gestire e interagire con i processi - Lavorare con macchine remote - Recupero di dati bioinformatici - Compressione dei dati e utilizzo dei dati compressi - Quando utilizzare le pipeline unix - Ispezionare e manipolare dei dati con gli strumenti linux - Un'introduzione agli intervalli genomici - Lavorare con i dati di sequenza - Script di base di Bash
Python: - Installazione di Python - Operatori aritmetici - Tipi di dati (numerici, booleani, set, dizionari, sequenze) - Variabili, espressioni, istruzioni - Istruzioni di controllo (if, while, for, break, continue) - Le funzioni - Le librerie biopython
(testi)
Materiale didattico fornito dal docente.
|