25 janeiro 2013

Cientistas transformam DNA em dispositivo para armazenar dados

PARIS, France - Cientistas britânicos anunciaram um salto na busca para transformar o DNA em uma forma revolucionária de armazenamento de dados.

Uma seção de DNA criada pelo homem consegue armazenar montanhas de dados que podem ser congeladas a vácuo, transportadas e armazenadas, potencialmente por milhares de anos, afirmaram.

Os conteúdos são "lidos" decifrando-se o código genético - como é feito rotineiramente hoje - e transformando-os em código de computador.

"Nós já sabemos que o DNA é uma forma robusta de armazenar informação porque podemos extrai-lo de ossos de mamutes, que datam de dezenas de milhares de anos, para estudá-lo", afirmou Nick Goldman, do Instituto Europeu de Bioinformática (EBI) em Cambridge.

"Também é incrivelmente pequeno, compacto e não precisa de qualquer energia para armazenamento, além de ser fácil de transportar e manter", acrescentou.

O DNA, molécula da vida, é formada por uma dupla hélice de compostos - uma longa "escada" em espiral molecular, compreendendo quatro degraus químicos: adenina, citosina, guanina e timina, que se combinam aos pares. A citosina (C) combina com a guanina (G), enquanto a timina (T) combina com a adenina (A).

A sequência de letras compõe o genoma ou a estrutura química sobre a qual a vida é criada e sustentada. O DNA humano tem mais de três bilhões de letras, emaranhadas em pacotes de 24 cromossomos.

O projeto consiste em traduzir os dados genéticos para a linguagem binária do computador (0 e 1) e transcrevê-los em um código de "base 3" (ternário), que utiliza zeros, uns e dois.

Os dados são transcritos pela segunda vez como código de DNA, que se baseia em A, C, G e T. Um bloco de cinco letras é usado para um único dígito binário.

As letras são então transformadas em moléculas, usando produtos químicos de laboratório.

Segundo os cientistas, o trabalho não empregou DNA vivo, nem buscou criar qualquer forma de vida e, na verdade, o código feito pelo homem seria inútil para qualquer fim biológico.

"Não temos qualquer intenção de brincar com a vida", disse Goldman.

Apenas trechos curtos de DNA podem ser feitos, o que significa que a mensagem precisa ser cortada em pequenas seções de 117 letras, cada uma aderida a uma pequena etiqueta, como uma "comutação de pacotes" (técnica em que a mensagem é dividida e enviada em pequenos pacotes) na internet, o que permite que os dados sejam reagrupados.

Para provar sua teoria, a equipe codificou uma gravação em MP3 do discurso "Eu tenho um sonho", de Martin Luther King; uma foto digital de seu laboratório; um arquivo PDF do estudo de 1953 que descreveu a estrutura de DNA; um arquivo com todos os sonetos de Shakespeare; e um documento que descreve a técnica de armazenamento de dados.

"Nós baixamos os arquivos da internet e os usamos para sintetizar centenas de milhares de pedaços de DNA. O resultado parece com uma minúscula partícula de poeira", explicou Emily Leproust, da empresa americana de biotecnologia Agilent, que pegou os dados digitais e os utilizou para sintetizar moléculas de DNA no laboratório.

A Agilent enviaram por correio a amostra de volta ao EBI, na Inglaterra, onde os cientistas encharcaram o DNA com água para reconstitui-lo e usaram equipamento padrão de sequenciamento para desvendar o código. Eles recuperaram e leram os arquivos com 100% de exatidão.

O trabalho se segue a um avanço feito no ano passado, quando cientistas da Universidade de Harvard anunciaram ter armazenado 700 terabytes de dados - o suficiente para armazenar cerca de 70.000 filmes - em uma grama de DNA.

O novo método elimina o risco de erro na leitura do DNA, afirmam os cientistas, cujo trabalho foi publicado na edição desta semana da revista Nature.

"Nós pensamos, vamos partir o código em muitos fragmentos sobrepostos indo nas duas direções, com informação indexada indicando onde cada fragmento se encaixa no código geral, e fizemos um esquema codificado que não permite repetições", explicou Ewan Birney, co-autor do estudo.

"Desta forma, você precisaria cometer o mesmo erro em quatro diferentes fragmentos para falhar e isto seria muito incomum", emendou.

A informação se acumula maciçamente no mundo e o armazenamento de tantos dados é uma dor de cabeça. Discos magnéticos e ópticos são volumosos, precisam ser mantidos em ambientes frios e secos e são propensos a se degradar.

"A única limitação (ao armazenamento em DNA) é o custo", disse Birney, ressaltando que estes valores tendem a cair.

O sequenciamento e a leitura do DNA levam umas duas semanas com a tecnologia atual, portanto não seria recomendável para a recuperação instantânea de dados. Mas, seriam apropriados para dados armazenados entre 500 e 5.000 anos, como uma enciclopédia do conhecimento e da cultura humanas, por exemplo

Arquivo INFOTRANSP