GNCS 2018

Progetto: Research project

Description

Questa proposta progettuale si prefigge come obiettivo principale quello di sviluppare delle soluzioni efficienti ed efficaci per problemi, sia generali che specifici di particolari contesti applicativi, nell’ambito di big data modellati attraverso l’uso di grafi, di seguito indicati come big data graphs. In particolare, si studieranno delle caratteristiche di natura strutturale che accomunano le diverse tipologie di grafi in analisi, proponendo delle metodologie efficienti basate su tecnologie di big data per il calcolo di opportune misure di centralità di nodi e/o archi; l’analisi di tecniche di diffusione dell’informazione a partire da specifici nodi del grafo; la modellazione di reti multi-livello. Si prenderanno poi in esame alcune problematiche specifiche dei contesti applicativi di interesse, quali ad esempio la proposta di tecniche innovative per il social advertising, l’analisi delle interazioni tra virus e organismi host, l’estrazione di sottografi discriminativi tra pazienti sani e malati, ed altri. Verr`a prestata particolare attenzione ad aspetti che assumono un certo rilievo nell’ambito dei big data, quali sicurezza e privacy dei dati in esame, riduzione delle dimensioni dei dati attraverso l’uso di insiemi massimali, scelta delle configurazioni più opportune per il setting degli strumenti e framework utilizzati e tuningdei corrispondenti parametri.

Layman's description

Obiettivo 1: Risoluzione di problematiche generali su big data graphs. I grafi che permettono di modellare big data hanno delle caratteristiche strutturali il cui studioè rilevante sia dal punto di vista fondazionale, che per semplificare e rendere più efficiente la risoluzione di problemi specifici. Un obiettivo fondamentale di questa proposta progettuale è dunque quello di gettare le basi per una comprensione più approfondita delle proprietà caratteristiche dei big data graphs.Task 1.1: Centralità e diffusione dell’informazione. Si studierà l’andamento di alcune misure usate per il calcolo di centralit`a di nodi e/o archi di un grafo, fornendose necessario opportune re-implementazioni delle stesse, nell’ambito dei big data graphs. Si analizzer la diffusione dell’informazione a partire dai nodi/archi individuati da tali misure secondo dei modelli ben noti in letteratura.Task 1.2: Misure topologiche su reti multi-livello. L’eterogeneità dei dati a disposizione e delle loro relazioni fa s`ı che in alcuni casi sia necessario modellare ildominio d’interesse attraverso l’utilizzo di reti multi-livello, dove per ciascun livello è possibile individuare archi diversi che incidono sugli stessi insiemi di nodi. Si forniranno opportune estensioni di classiche misure topologiche (es., modularit`a) per tali reti.Obiettivo 2: Risoluzione di problematiche specifiche dei contesti applicativi.I risultati conseguiti grazie al perseguimento dell’Obiettivo 1 consentiranno di avere solide basi per la risoluzione di problematiche più specifiche.Task 2.1: Social advertising. Si proporranno delle metodologie innovative per identificare piccoli gruppi di nodi e/o archi in una rete sociale a cui sia più convenientetrasmettere degli avvisi pubblicitari allo scopo di massimizzarne la diffusione all’interno della rete.Task 2.2: Estrazione di sottografi discriminativi. Si proporranno delle tecniche efficaci per estrarre sottografi con proprietà statistiche particolari al fine di discriminaretra due popolazioni, ad esempio, pazienti sani e malati.Task 2.3: Mining di knowledge graphs. Si proporranno tecniche, basate ad esempio su riduzione e/o navigazione efficiente dei dati, per l’identificazione di archi molto/poco affidabili all’interno di grafi che rappresentano conoscenza estratta dal World Wide Web.Task 2.4: Sicurezza e privacy nei social network. Si studierà lo sviluppo di meccanismi per aumentare la sicurezza e la privacy nell’accesso ai dati da parte degliutenti di un social network. Questo `e particolarmente rilevante per le applicazioni che possono accedere al profilo sociale dell’utente, in genere senza alcuna limitazione (es., nel caso di Twitter la politica di accesso è del tipo on/off).Task 2.5: Interazione tra organismi virus e host. Si analizzeranno delle reti biologiche che rappresentano l’interazione tra organismi virus che hanno attaccato degliorganismi host, e gli organismi host stessi, al fine di comprendere le relazioni tra i componenti cellulari coinvolti nel processo di diffusione dei virus in esame.
StatoFinito
Data di inizio/fine effettiva2/5/182/4/19