Alcune proposte per migliorare flessibilità ed applicabilità dei Modelli Lineari Generalizzati e dei Modelli Lineari Generalizzati Misti

Progetto: Research project

Dettagli progetto

Description

I Modelli Lineari Generalizzati (GLM, Generalized Linear Models) costituiscono una classe consolidata di modelli atti ad analizzare relazioni di dipendenza tra variabili. Al loro indubbio successo hanno contribuito anche, da un lato, la disponibilità di algoritmi di stima nei più comuni software statistici, e, dall'altro, le importanti estensioni che ne sono state fatte rispetto all'impianto standard. Fra queste, è rilevante in questo progetto di ricerca la classe dei Modelli Lineari Generalizzati Misti (GLMM, Generalized Linear Mixed Models), che si presta al trattamento delle stesse relazioni di dipendenza in presenza di unità dipendenti o gerarchicamente strutturate.
Seppur in grado di abbracciare differenti situazioni, i GLM e i GLMM, nella loro specificazione standard, risultano a volte troppo rigidi per l'analisi di fenomeni complessi caratterizzati da relazioni multivariate, nonlineari e possibilmente spazio- e/o tempo-dipendenti, e da distribuzioni della variabile risposta non sempre riconducibili alla Classe Esponenziale regolare. La varietà e complessità dei fenomeni è tale da esigere quindi l'introduzione di estensioni che possano migliorare la "performance" dei GLM e dei GLMM, aumentandone la flessibilità e, con essa, il campo di applicazione.
In questo progetto l'attenzione è rivolta sostanzialmente a tre di tali estensioni:
(a) modelli con funzione legame non-specificata;
(b) modelli con componenti nonlineari nel predittore lineare;
(c) modelli per variabili risposta con distribuzioni mistura.
All'interno di questi tre ambiti, il progetto di ricerca si propone due tipi di obbiettivi:
(i) la proposta di soluzioni metodologiche innovative;
(ii) considerato che, in genere, tali soluzioni metodologiche comportano notevoli problemi computazionali, la proposta di algoritmi efficienti per la loro concreta implementazione in problemi applicativi reali.

Layman's description

2.1 Obiettivi

Il progetto di ricerca si concentra su alcune estensioni dei Modelli Lineari Generalizzati e dei Modelli Lineari Generalizzati Misti:
(a) modelli con funzione legame non specificata; in particolare, si indagheranno le potenzialità di approcci semi- e non-parametrici alla specificazione della funzione legame;
(b) modelli con componenti nonlineari nel predittore lineare; in particolare, sarà oggetto di studio il caso di relazioni
lineari-a-tratti in cui i punti-di-svolta (break-points) costituiscono un vettore di parametri ignoti da stimare, che possono anche dipendere da una o più variabili esplicative;
(c) modelli per variabili risposta con distribuzioni mistura; in particolare, l'attenzione si concentrerà sulla modellazione di variabili risposta continue, asimmetriche e bimodali, che frequentemente si presentano in campo biologico ed ecologico.
All'interno di questi tre ambiti, il progetto di ricerca si propone due tipi di obbiettivi:
(i) la proposta di soluzioni metodologiche innovative;
(ii) considerato che, in generale, tali soluzioni metodologiche comportano notevoli problemi computazionali, la proposta di algoritmi efficienti per la loro concreta implementazione in problemi applicativi reali.

2.2 Metodologie

I tre ambiti (a),(b) e (c) descritti al punto 2.1 verranno affrontati sia in un contesto di GLM "classici" che di GLMM, cioè per dati raggruppati o comunque dipendenti.
Per entrambi gli ambiti (a) e (b), la non-linearità sarà modellata attraverso l'uso di spline penalizzate, ma sarà esplorata anche l'efficacia di una versione "pesata" (cioè con penalità non costante), un affinamento che sembra essere poco studiato in letteratura.
Per ciò che riguarda l'ambito (c), si approfondiranno i problemi di identificabilità delle misture e la possibilità di modellare i parametri di mistura in dipendenza di esplicative.
Tutte le metodologie appena illustrate prentano rilevanti problemi computazionali. La modellazione in presenza di break-points risulta essere particolarmente onerosa per la presenza di condizioni di non-regolarità; metodi iterativi basati su approssimazioni lineari potranno essere impiegati anche per affrontare il caso di punti svolta "variabili", ovvero espressi come funzione di variabili esplicative: tale argomento costituisce di per sé un approfondimento stimolante.
Per quel che concerne l'ambito (c), la stima di modelli GLM e GLMM con risposte mistura richiederà il ricorso ad algoritmi del tipo EM, con adattamenti ad hoc per il passo M.

Tutti gli aspetti computazionali verranno affrontati in ambiente R, ed i codici prodotti e collaudati nel corso della ricerca saranno successivamente resi di dominio pubblico.
StatoAttivo
Data di inizio/fine effettiva1/1/05 → …

Fingerprint

Esplora i temi di ricerca toccati da questo progetto. Queste etichette sono generate sulla base dei riconoscimenti/sovvenzioni sottostanti. Insieme formano una fingerprint unica.