Por: Wellington Santos Martins
Veja seu Curriculum Vitae aqui.

A interação entre a Biologia e a Informática não é mais uma novidade, e atualmente vem passando por um impulso renovado. A Biologia inspirou vários modelos computacionais, como, por exemplo, as chamadas redes neurais artificiais, ou os algoritmos genéticos, e mais recentemente os sistemas computacionais baseados no sistema imunológico. Num processo de retro-alimentação, estes modelos computacionais são hoje utilizados para resolver problemas biológicos como a comparação de bioseqüências. No entanto, com o surgimento dos projetos genoma, uma nova frente de interação vem se firmando em termos de pesquisa básica para ambas as áreas.

A descoberta da estrutura do DNA trouxe à tona o aspecto digital da informação armazenada no material genético dos seres vivos. O entendimento do código genético, por sua vez, esclareceu como esta informação, codificada em genes, é lida, copiada e mais tarde transformada em produto (proteína). Estas operações em muito se assemelham àquelas realizadas pelos sistemas computacionais, onde a informação digital, codificada num programa, é lida a partir de uma memória secundária (geralmente discos), e copiada para a memória principal (RAM) onde é finalmente executada pelo processador do computador. Entretanto, assim como na computação, onde o processamento da linguagem de máquina (ao nível de bits) pouco nos diz sobre a semântica da computação sendo realizada, o conhecimento das bases de DNA e seu produto (proteínas) não nos fornece muitas pistas sobre como a linguagem do DNA é capaz de orquestrar tamanha complexidade encontrada nos seres vivos. Uma questão central é que, diferentemente dos sistemas computacionais, nos sistemas biológicos nós não temos acesso ao “código fonte” nem tampouco acesso ao programador! A semelhança entre os processos biológico moleculares e computacional (linguagem digital, códigos, tradução, entre outros aspectos) tem aproximado Biólogos e Cientistas da Computação na busca por um melhor entendimento do funcionamento, ao nível molecular, da vida.

Entretanto, foi o desenvolvimento tecnológico dos equipamentos utilizados hoje nos laboratórios de biologia molecular que acarretou uma maior aproximação entre a Biologia e a Informática. À frente desta revolução estão os seqüenciadores de DNA. Estes equipamentos permitem o levantamento das bases que compõem o DNA de um organismo num tempo cada vez menor. Os seqüenciadores de DNA vêm sendo usados extensivamente tanto para o estudo do genoma estrutural (DNA genômico) quanto para o estudo do genoma funcional (expressão gênica) de vários organismos. A quantidade de dados sendo produzida por estes equipamentos é sem precedentes na história da Biologia e, graças a uma política cooperativa de pesquisa internacional, os trabalhos envolvendo o seqüenciamento de DNA devem submeter suas seqüências para bancos de dados públicos antes da pesquisa ser considerada para publicação. Desta forma, o crescimento das bases de dados de bioseqüências tem sido exponencial, levando-se em média 1,4 anos para dobrar o número de seqüências disponíveis. Dados de 2006 apontam para um número de aproximadamente 60 milhões de seqüências de DNA depositadas no Genbank (http://www.ncbi.nlm.nih.gov/Genbank/), todas acessíveis através da Internet. O trabalho do Biólogo, que até pouco tempo se restringia a análise de algumas poucas dezenas de seqüências, deve hoje considerar milhões delas, o que torna imperativo o uso de sofisticados programas de computadores e sistemas computacionais de alto desempenho (supercomputadores). Aqui surge a chamada Bioinformática que tem como objetivo a aquisição, o armazenamento, o processamento, a visualização e disponibilização de toda espécie de dados genômicos. O acesso a estas bases de dados torna possível operações como: caracterização de novos genes, anotação de proteínas, análise de regiões polimórficas, desenvolvimento de marcadores moleculares, estudo de mutações genéticas entre outras.

Com a avalanche de informação sendo disponibilizada para os biólogos surge uma série de frentes de pesquisa focadas em conjuntos de dados específicos, as chamadas ômicas. A mais tradicional, a genômica, se concentra no conjunto total de genes de um sistema biológico. Já a proteômica visa o estudo da coleção completa de proteínas que são expressas num sistema. Outras frentes mais recentes têm foco no conjunto de RNA transcritos (transcriptoma), nas vias metabólicas (metaboloma), e nas interações entre proteinas (interactoma). Dada a riqueza das informações disponíveis na biologia molecular moderna, esta passa a ser vista em parte como uma ciência informacional onde a bioinformática tem papel central, e integrador, permitindo que experimentos sejam feito in silico (no computador) e que o uso da bancada, para experimentos in vitro ou in vivo, seja adiado até que um foco maior seja dado à pesquisa sendo considerada. Esta tem sido a metodologia utilizada em importantes projetos de pesquisa na área de genética envolvendo o melhoramento de plantas, o aprimoramento de investigações criminais e/ou de parentesco, o desenvolvimento de técnicas de monitoramento ambiental, o uso de diagnósticos e terapias médicas, além do desenvolvimento de novos medicamentos.