Entro il 2025, oltre un miliardo di persone potranno vedere sequenziato il proprio Dna. Lo rivela uno studio del Cold Spring Harbor Laboratory di New York, secondo cui la crescita delle analisi del Dna sarebbe molto più veloce di quella di YouTube e Twitter.
Secondo i ricercatori, gli animali più grandi della foresta dei Big Data non sono i social media che comunque divorano una quantità impressionante di larghezza di banda e generano enormi quantità di byte elettronici ogni giorno. E non è l'astronomia o la fisica delle particelle, due delle scienze a più alto contenuto tecnologico. Ma è la genomica, una scienza che non esisteva fino 15 anni fa e solo ora sta cominciando ad emergere fino a generare maggiori quantità di dati rispetto a tutti gli altri campi.
“Per molto tempo, la gente ha usato l'aggettivo 'astronomico' per parlare di cose che sono veramente, veramente grandi”, dice Michael Schatz, professore associato del Cold Spring Harbor Laboratory (CSHL) e co-autore del documento pubblicato su PLoS. “Ma nel sottolineare il ritmo incredibile di crescita di generazione dei dati nel campo delle scienze biologiche, io e i miei colleghi suggeriamo che potrebbe essere necessario iniziare a definire le cose veramente immense 'genomiche' negli anni a venire”.
Se tutti i dati della sequenza umani finora generati fossero messi in un unico posto - circa 250.000 sequenze - richiederebbero circa 25 petabyte di spazio di archiviazione. Un petabyte è un quadrilione di byte, 10 seguito da 15 zeri o ancora 1000 terabyte.
Questo è un problema gestibile, dice Schatz. Ma entro il 2025, il team si aspetta che circa un miliardo di persone possano avere i loro genomi completi sequenziati, soprattutto nei paesi più ricchi. Questo pone un problema di stoccaggio di dati.
YouTube e la genomica. YouTube genera in realtà la maggior parte dei dati in questo momento, circa 100 petabyte all'anno. Ma la genomica non è molto indietro e sta crescendo molto più rapidamente. Al ritmo attuale, la quantità di dati genomici prodotta ogni giorno raddoppia ogni sette mesi. Entro il 2025, tale cifra oscillerà tra 2 e 40 exabyte all'anno, secondo le stime del team. Un exabyte è l'equivalente di 1.000 petabyte, circa un milione di volte più dati rispetto a quelli che oggi è possibile memorizzare sul computer di casa.
Francesca Mancuso
LEGGI anche:
Dna umano: si può sequenziare con 1000 dollari