Il Broad Institute, centro di eccellenza per la genomica computazionale, ha reso disponibile ai suoi ricercatori GenoMetric Query Language, un sistema per l’analisi di big data genomici sviluppato all’interno del Progetto GeCo del Politecnico di Milano.
GeCo (Data-Driven Genomic Computing) è un Advanced Grant ERC, diretto dal prof. Stefano Ceri del DEIB, che ha per obiettivo lo sviluppo di un nuovo approccio all’analisi dei “big data” derivanti dal sequenziamento del genoma per trovare una risposta più precisa ed efficace a tante domande della biologia e della medicina, incluse le modalità di sviluppo dei tumori.
L’equipe del progetto GeCo ha sviluppato il sistema GMQL (GenoMetric Query Language) per interrogare dati genomici scaricati da grandi banche dati prodotte da Consorzi internazionali. Il gruppo di Data Science del Broad Institute è responsabile di FireCloud, una piattaforma aperta per l’analisi dei dati genomici che garantisce sicurezza ed elevate prestazioni. Al termine di un percorso di integrazione del software, anche GMQL è disponibile su FireCloud. Usando una workspace pubblica creata per GMQL, i ricercatori possono vedere GMQL “al lavoro” su tre casi di studio di progressiva complessità, e possono quindi utilizzare il codice sviluppato al Politecnico di Milano per integrare e completare le loro analisi dei dati.
Ulteriori informazioni sono disponibili sul sito