Dettagli progetto
Description
La ricerca nel campo della linguistica oggi sempre più spesso manifesta la necessità di essere coadiuvata da sistemi informativi a supporto dei processi di gestione dei dati e delle attività di controllo. I risultati scientifici raggiunti nell'ambito della ricerca sull'Atlante Linguistico Della SIcilia, alla quale questa unità di ricerca collabora sin dal 2003, hanno richiesto infatti l'utilizzo di tecnologie complesse che non possono prescindere dall'ausilio dei moderni strumenti di automazione e di calcolo. Secondo alcuni ricercatori del progetto ALS [1], infatti, l'avvento dell'informatica ed il suo connubio con la linguistica, non solo permette di utilizzare le tecniche moderne per asservirle alle necessità della linguistica, ma di impostare i problemi linguistici secondo una filosofia informatica, così da sviluppare metodologie d’indagine condivise ed ibridate dai due domini.
La tematica oggetto della presente attività consiste principalmente nella costruzione di un laboratorio di ricerca integrato che sfruttando lo stato dell’arte delle tecnologie informatiche nei campi del trattamento, aggregazione e visualizzazione dei dati, proietti i risultati ottenibili con le tecnologie informatiche e le adatti alla specificità del dato linguistico nella sua accezione più ampia.
Si definiranno tutte le componenti per la realizzazione e la fruizione di un laboratorio completo in cui il ricercatore linguista potrà definire e verificare le ipotesi di ricerca e trovare riscontro nelle evidenze empiriche.
Più in particolare, le tecniche da utilizzare riguarderanno i processi di annotazione e trascrizione dei dati in modo da poter riuscire a gestire l’intero processo. Si dovranno definire strumenti e metodologie per il trattamento del dato linguistico inteso come interazione con gli utenti nell’ambito ad esempio di un’intervista resa allo scopo di registrare un insieme di fenomeni linguistici. Tali strumenti consisteranno in strumenti trascrittivi per riportare il testo tradotto, strumenti annotativi per permettere al ricercatore di tenere traccia delle evidenze dei vari fenomeni, strumenti che permettano l’aggregazione e l’analisi del dato linguistico e strumenti di georeferenziazione che permettano la visualizzazione dei fenomeni su base territoriale. L'architettura del sistema informativo nel suo complesso sarà costruita per il trattamento del dato "parlato" (non soltanto "parola") e sarà necessariamente multilivello, per rispondere ad interrogazioni sia sul piano linguistico che etnografico.
Il progetto architetturale complessivo avrà come piattaforma comune la possibilità di sviluppare applicazioni web in cui i processi da sviluppare siano totalmente integrabili ed interconnessi. Il progetto riguarderà quindi i seguenti tre ambiti principali:
1) costruzione del dato “parlato”;
2) aggregazione dei dati e generazione delle informazioni;
3) visualizzazione dei risultati ottenuti e interazione uomo-macchina intelligente.
Nel primo ambito si identificano importanti ambiti di ricerca che si riassumono nella possibilità di integrare dati provenienti da sorgenti informative eterogenee (dati audio, filmici, pittorici) con differenti modelli di memorizzazione (dati strutturati in cui si utilizzano DBMS, relazioni, dati non strutturati o semi-strutturati in cui si utilizza l’XML come linguaggio per la connessione di dati sul web) e che sono prodotti da categorie di utenti diversificate (semplici intervistati, ricercatori linguisti).
Il processo di aggregazione dei dati e di generazione del dato linguistico è la parte centrale nell’ambito di ricerca che si sta proponendo: in tale ambito si definiranno modelli di rappresentazione del dominio basati sulla definizione di ontologie, tecniche di trasformazione e aggregazione dei dati atte a ridurne la dimensionalità, metodologie di estrazione delle informazioni dai dati (data mining) specifiche per l’ambito di trattazione.
La georeferenziaz
Stato | Attivo |
---|---|
Data di inizio/fine effettiva | 1/1/09 → … |
Fingerprint
Esplora i temi di ricerca toccati da questo progetto. Queste etichette sono generate sulla base dei riconoscimenti/sovvenzioni sottostanti. Insieme formano una fingerprint unica.