Inseguimento non rigido di volti umani in sequenze video

Progetto: Research project

Dettagli progetto

Description

Il problema dell’inseguimento non rigido di volti umani, ossia in presenza di movimenti interni al volto oltre che globali della testa, e’ tuttora oggetto di grande attenzione da parte della comunita’ scientifica. Il motivo di tale interesse e’ dettato sia da considerazioni di carattere pratico che di carattere puramente scientifico. Dal punto di vista pratico le applicazioni del tracking non rigido di volti sono innumerevoli. Ad esempio si pensi al controllo di avatar che replicano i movimenti e le espressioni di attori, all’autenticazione e identificazione robusta basata su riconoscimento facciale in condizioni generiche, alla stima di espressioni facciali per studi comportamentali, alla compressione video a basso o bassissimo bitrate per videocomunicazioni, etc… Dal punto di vista scientifica il problema si inquadra nel contesto piu’ generale del tracking non rigido di oggetti o superfici, contesto in cui non e’ ancora stato definito alcun framework che al rigore e alla corretteza formali faccia corrispondere risultati applicativi sufficientemente generali. Questo programma di ricerca si pone come obiettivo lo sviluppo di un framework che consenta il tracking non rigido di volti umani in maniera sufficentemente precisa per applicazioni di stima di espressioni facciali. In particolare, dopo un’attenta ricognizione sugli ultimi sviluppi nel settore, si sviluppera’ un framework basato sull’analisi di sequenze stereo contenenti volti in ambiente controllato e verra’ implementato un prototipo capace di inseguire il volto in presenza di piccoli e medi spostamenti globali del volto e grandi variazioni interne al volto.

Layman's description

Obiettivo del programma di ricerca e’ lo studio, la definizione e la relativa implementazione prototipale di una tecnica per l’inseguimento non rigido di volti umani a partire da sequenze di immagini stereo contenenti un volto umano in primo piano. In particolare il sistema prototipale dovra’ stimare il flusso ottico tridimensionale della scena ossia una mappa di profondita’ della scena in cui a ciascun punto sia associata la velocita’ istantanea tridimensionale del punto stesso. La tecnica che si intende sviluppare deve avere una complessita’ computazionale tale da renderne possibile il funzionamento in tempo reale su piattaforme hardware convenzionali. La tecnica da sviluppare dovrebbe inoltre essere in grado di fornire risultati soddisfacenti anche in presenza di dati di ingresso rumorosi quali quelli acquisiti con dispositivi di basso costo facilmente reperibili sul mercato. L’inizializzazione del sistema potrebbe anche essere effettuata manualmente in quanto l’inizializzazione automatica del tracker non rientra fra gli obiettivi prioritari del presente programma di ricerca. Il programma di ricerca prevede una prima fase di approfondimento del problema della stima del flusso ottico tridimensionale in casi generali e di tecniche di modellazione tridimensionale di volti umani. In base ai risultati di questo studio verra’ definita una tecnica per la stima del flusso ottico tridimensionale basata su un modello del volto. L’uso di un modello dovrebbe portare a una stima piu’ robusta e precisa rispetto alle tecniche esistenti in letteratura che non prevedono alcuna conoscenza a priori della struttura di massima della superficie non rigida di cui effettuare il tracking. I risultati ottenuti con la tecnica proposta verranno confrontati quantitativamente con quelli ottenibili con altre tecniche esistenti in letteratura utilizzando sia sequenze sintetiche che reali disponibili nella comunita’ scientifica. Per il raggiungimento degli obiettivi si utilizzeranno ambienti di calcolo scientifico quali Matlab per la definizione e prima implementazione degli algoritmi e ambienti di programmazione tradizionali quali il C++ per lo sviluppo del prototipo.
StatoAttivo
Data di inizio/fine effettiva1/1/04 → …

Fingerprint

Esplora i temi di ricerca toccati da questo progetto. Queste etichette sono generate sulla base dei riconoscimenti/sovvenzioni sottostanti. Insieme formano una fingerprint unica.