Sviluppi di metodologie e tecniche statistiche per l'analisi di microarray data

Progetto: Research project

Dettagli progetto

Description

Il seguente programma di ricerca si pone come obiettivo lo sviluppo di nuove tecniche e metodologie statistiche per l’analisi di dati microarray. La tecnologia microarray permette di monitorare i livelli di espressione per migliaia di geni simultaneamente. Un gene si può ritenere un segmento di DNA che codifica una particolare proteina, che costituisce l’espressione fondamentale dell’informazione genetica. Le applicazioni di dati microarray variano dallo studio dell’espressione genica di raccolti sotto differenti condizioni ambientali al confronto di profili dell’espressione di geni per cellule tumorali di pazienti affetti da cancro, ad esempio. Per quanto riguarda l’aspetto statistico, gli esperimenti basati su microarray sollevano numerose questioni in diversi campi della metodologia statistica, quali, per citarne solamente alcuni, il processo di immagini (image processing), i disegni sperimentali, l’analisi discriminante e l’analisi dei gruppi. In generale, l’analisi statistica di dati microarray viene suddivisa in due parti: analisi di basso livello e analisi di alto livello. L’analisi di basso livello comprende la cosiddetta analisi di preprocessing dei dati che riguarda, detto in maniera molto sintetica, la “pulizia” dei dati provenienti da esperimenti basati su tecnologia microarray. L’analisi di alto livello riguarda invece il tentativo di raggruppare geni che possono essere considerati simili, attraverso ad esempio tecniche di clustering. Il responsabile di questo progetto di ricerca ha già affrontato alcuni problemi inerenti sia l’analisi di basso livello, sia l’analisi di alto livello. La seguente ricerca è quindi dedicata al proseguimento di un lavoro già in parte intrapreso. Nel caso specifico, con la presente ricerca si vuole investigare la possibilità di utilizzare una modellistica parametrica e semi-parametrica per la descrizione del comportamento del livello di espressione genica in esperimenti microarray, affiancandola ad altre tecniche statistiche già ampiamente utilizzate in questo ambito.

Layman's description

Il seguente progetto di ricerca si pone come obiettivo lo sviluppo di nuove tecniche e metodologie statistiche per l’analisi di dati microarray. La tecnologia microarray è parte integrante di una nuova classe di biotecnologie che permette di monitorare i livelli di espressione per migliaia di geni simultaneamente. Un gene si può ritenere un segmento di DNA che codifica una particolare proteina, che costituisce l’espressione fondamentale dell’informazione genetica. Le applicazioni di dati microarray variano dallo studio dell’espressione genica di raccolti sotto differenti condizioni ambientali al confronto di profili dell’espressione di geni per cellule tumorali di pazienti affetti da cancro, ad esempio. Oltre all’enorme potenziale scientifico dei microarray nell’aiutare a comprendere la regolazione dei geni e la loro interazione, i microarray hanno una grossissima importanza nella ricerca clinica e farmaceutica. Per quanto riguarda l’aspetto statistico, gli esperimenti basati su microarray sollevano numerose questioni in diversi campi della metodologia statistica, quali, per citarne solamente alcuni, il processo di immagini (image processing), i disegni sperimentali, l’analisi discriminante e l’analisi dei gruppi. La seguente ricerca è dedicata al proseguimento di un lavoro già in parte intrapreso. Nel caso specifico, con la presente ricerca si vuole investigare la possibilità di utilizzare una modellistica parametrica e semi-parametrica per la descrizione del comportamento del livello di espressione genica in esperimenti microarray, affiancandola ad altre tecniche statistiche già ampiamente utilizzate in questo ambito. Per potere utilizzare tali metodologie è necessario ricorrere a tecniche computazionali molto “costose” in termini di risorse del computer e di tempi di esecuzione; infatti, solitamente l’insieme di dati che si ha a disposizione comprende migliaia di osservazioni e diventa per tale motivo di fondamentale importanza poter disporre di algoritmi efficienti. Parte integrante di questa ricerca sarà quindi anche la messa a punto di algoritmi opportunamente ottimizzati per cercare di risolvere, almeno in parte, i problemi computazionali evidenziati in precedenza. Con la presente ricerca si vuole investigare la possibilità di utilizzare una modellistica parametrica e semi-parametrica per la descrizione del comportamento del livello di espressione genica in esperimenti microarray, affiancandola ad altre tecniche statistiche già ampiamente utilizzate in questo ambito. Per potere utilizzare tali metodologie è necessario ricorrere a tecniche computazionali molto “costose” in termini di risorse del computer e di tempi di esecuzione; infatti, solitamente l’insieme di dati che si ha a disposizione comprende migliaia di osservazioni e diventa per tale motivo di fondamentale importanza poter disporre di algoritmi efficienti. Parte integrante di questa ricerca sarà quindi anche la messa a punto di algoritmi opportunamente ottimizzati per cercare di risolvere, almeno in parte, i problemi computazionali evidenziati in precedenza. Per fare ciò si ricorrerà all’utilizzo del software statistico R che presenta il vantaggio di avere già delle procedure per l’analisi di dati microarray, procedure che possono essere integrate con nuove routine che si intende sviluppare nell’ambito di questa ricerca.
StatoAttivo
Data di inizio/fine effettiva1/1/07 → …

Fingerprint

Esplora i temi di ricerca toccati da questo progetto. Queste etichette sono generate sulla base dei riconoscimenti/sovvenzioni sottostanti. Insieme formano una fingerprint unica.