Tecnologia: nei server di google ricerche su milioni di genomi

MeteoWeb

Human_genomeNella massa di dati custoditi nei server di Google si trova gia’ di tutto, dai libri ai video ai documenti caricati dagli utenti, ma c’e’ spazio anche per i genomi. Il nuovo servizio, dedicato almeno per ora solo ai ricercatori, va incontro alla sempre piu’ grande massa di dati prodotta dai moderni metodi di sequenziamento, su cui anche altri big, da Amazon a Microsoft a Ibm, hanno messo gli occhi. Il progetto, ricorda la rivista del Mit Technology Review potrebbe accelerare molto il lavoro degli scienziati dando loro la possibilita’ di confrontare milioni di genomi, cioe’ tutti quelli conservati nel database e non solo quelli ‘depositati’ da un singolo istituto. ‘Big G’ ha iniziato a lavorare al progetto 18 mesi fa, costruendo le interfacce per la migrazione dei dati sui propri server e studiando come adattare gli algoritmi ora usati per le ricerche sul web a questo nuovo materiale. Il costo variera’ da 25 centesimi all’anno per un genoma parziale a 25 dollari per quello completo, piu’ alcuni costi addizionali per le elaborazioni dei dati. ”Abbiamo visto che i biologi non studiano piu’ un genoma alla volta, ma ne vogliono esaminare milioni – spiega David Glazer, l’ingegnere a capo del progetto – l’opportunita’ e’ di applicare le innovazioni nella tecnologia dei dati per aiutare questa transizione”. La quantita’ di dati, sottolinea la rivista, non e’ tale da mettere in crisi i server delle grandi compagnie. Un istituto avanzato produce in due mesi il numero di byte che vengono caricati su Youtube in un giorno. Non tutti gli istituti pero’ si possono permettere supercomputer o server con grandi capacita’ di dati, e anche quelli piu’ grandi possono avere interesse a condividere i propri dati. E’ il caso del National Cancer Institute statunitense, che ha stanziato 6,5 milioni di dollari per la migrazione di 2,6 petabyte di dati, circa un decimo del traffico mensile di Youtube, verso la ‘nuvola’ di Google attraverso il progetto Cancer Genomics Cloud. ”Il progetto democratizzera’ l’accesso a una grande massa di dati genetici legati ai tumori – spiega Ilya Shmulevich, uno degli ideatori -. I ricercatori nel campo dei tumori analizzeranno ed esplireranno intere coorti ricche di dati genomici, senza bisogno di accedere a computer locali. Il Cgc permettera’ anche ricerche collaborative piu’ facili permettendo agli scienziati di lavorare in un ambiente cloud”

Condividi