INDAM GNCS 2016 - Approcci integrativi e computazionali per l’estrazione di conoscenza da reti funzionali

Progetto: Research project

Description

Un approccio che si sta rivelando di successo per la scopertadelle relazioni che intercorrono tra interazioni e/o mutazioni di componenti cellularie la presenza di malattie complesse, come ad esempio il cancro, `e quello di integrareinformazioni di natura diversa, sia microscopica che macroscopica, provenienti anche dadiversi organismi, insieme ad annotazioni di tipo funzionale [2]. Si possono in tal modocostruire delle complesse reti funzionali che hanno dimensioni anche elevate, dell’ordinedelle centinaia di migliaia di interazioni, e che hanno la caratteristica di essere fortementeeterogenee.Tali reti funzionali saranno oggetto di studio nell’ambito della presente propostaprogettuale. In particolare, ci si occuper`a di studiare il problema dell’integrazione didati “omici” (ovvero provenienti da genomica, proteomica, ecc.) per realizzare degliopportuni modelli di rappresentazione per questa tipologia di rete introdotta di recentein letteratura. Tali modelli saranno di supporto ai diversi tipi di analisi computazionaleche si potranno effettuare sulle reti funzionali, come ad esempio degli studi di naturatopologica o la ricerca di pattern significativi. Scopo finale del progetto sar`a quellodi fornire alla comunit`a degli strumenti utili per consentire l’analisi di tali reti, che almomento non risulta di semplice risoluzione data la complessit`a dei dati in questione.Inoltre, i modelli e gli strumenti realizzati saranno utilizzati per estrarre conoscenzautile nell’ambito di specifici contesti applicativi, quali l’individuazione di caratteristichefunzionali che permettano la caratterizzazione di pazienti sani e malati e l’identificazionedel ruolo di alcuni componenti cellulari nello sviluppo di malattie complesse.

Layman's description

Il progetto si propone di realizzare i due principali obiettivi di seguito sintetizzati.2Ob1: Fornire strumenti di analisi per le reti funzionali. Un primo importanteproblema riguarda la scelta di opportuni modelli per la rappresentazione e lo studio direti funzionali. Infatti, tali reti sono composte da dati di natura eterogenea e sono didimensioni particolarmente elevate, richiedendo quindi tecniche di elaborazione efficientiche non sempre `e facile ottenere, data la complessit`a computazionale dei problemi checoinvolgono grafi di grossa taglia. Risulta quindi fondamentale la proposta di strutturecompatte ed efficaci per semplificare/consentire l’analisi di queste tipologie di reti.Ob2: Estrarre conoscenza da reti funzionali. Si proporranno tecniche per l’in-dividuazione di caratteristiche funzionali che consentano di distinguere pazienti sani emalati e di individuare il ruolo di alcune molecole nell’insorgere di malattie complesse enelle possibili terapie. Inoltre, si studier`a la composizione topologica delle reti funzionalie opportuni modelli statistici utili per rappresentarle.Allo scopo di perseguire gli obiettivi del progetto, le corrispondenti attivit`a verrannosuddivise nei work package descritti di seguito, per ciascuno dei quali si richiamanosinteticamente gli obiettivi di riferimento.WP1: Integrazione e rappresentazione dei dati (Ob1). Le reti funzionali ver-ranno costruite integrando dati provenienti da diversi database pubblici che annotanoinformazioni su proteine, geni, RNA, funzioni, espressioni e malattie. Si studieranno op-portune tecniche di compressione, eventualmente basate sull’individuazione di modulicompatti e annotazioni semantiche, per la rappresentazione compatta di tali reti.WP2: Analisi di grafi (Ob1, Ob2).1. Gerarchie su reti. Si studieranno alcune propriet`a delle reti funzionali relative allaloro distribuzione topologica, al fine di individuare informazioni che non si riesconoad estrarre attraverso comuni algoritmi di clustering su grafi.2. Estrazione di pattern da grafi. Si proporranno tecniche di outlier detection e/oestrazione di pattern su grafi allo scopo di individuare anomalie/ripetizioni utiliper caratterizzare le relazioni tra componenti cellulari e malattie complesse.3. Modelli statistici. Si cercheranno dei modelli statistici rappresentativi per le retifunzionali. Ad esempio, il modello statistico pi`u diffuso per molti tipi di retibiologiche `e quello small-world scale-free. Non `e detto che esso sia seguito allostesso modo dalle reti funzionali.WP3: Sviluppo di software e validazione (Ob1, Ob2). Per validare e diffonde-re i risultati del progetto, verranno forniti degli utili prototipi software delle tecnicheproposte.

Key findings

Tecnologie dell'Informazione e delle Comunicazioni (ICT)
StatoFinito
Data di inizio/fine effettiva2/3/162/2/17