
Fonte
Anne Trafton, MIT News
Publicação Original
Áreas
Resumo
Recentemente, pesquisadores criaram uma nova maneira de determinar as estruturas genômicas 3D no núcleo da célula usando Inteligência Artificial (IA) generativa. A nova técnica pode prever milhares de estruturas em apenas alguns minutos, tornando-a muito mais rápida do que os métodos experimentais existentes.
Usando essa técnica, os pesquisadores poderiam estudar mais facilmente como a organização 3D do genoma afeta os padrões e funções de expressão genética de células individuais.
O modelo pode ser usado para explorar diferentes estados de cromatina que podem existir dentro de uma única célula e como essas mudanças afetam a expressão genética.
Foco do Estudo
Por que é importante?
Cada célula do corpo contém a mesma sequência genética, mas deixa ‘ligados’ apenas um subconjunto desses genes. Essa expressão genética específica da célula, que torna as células diferentes dependendo do seu tipo, é também influenciada pela estrutura tridimensional do material genético, que controla a acessibilidade de cada gene.
Dentro do núcleo da célula, o DNA e as proteínas formam um complexo chamado cromatina, que tem vários níveis de organização. Os longos filamentos de DNA se enrolam em proteínas chamadas histonas.
Marcadores químicos conhecidos como modificações epigenéticas podem ser anexados ao DNA em locais específicos, e esses marcadores, que variam de acordo com o tipo de célula, afetam o dobramento da cromatina e a acessibilidade dos genes próximos. Essas diferenças na conformação da cromatina ajudam a determinar quais genes são expressos em diferentes tipos de células ou em momentos diferentes dentro de uma determinada célula.
Algumas técnicas experimentais disponíveis hoje em dia podem ser usadas para determinar as estruturas da cromatina. Uma delas é a técnica Hi-C, que funciona ligando filamentos de DNA vizinhos no núcleo da célula, determinando quais segmentos estão localizados próximos uns dos outros, e então fragmentando e sequenciando o DNA.
Este método pode ser usado em grandes populações de células para calcular uma estrutura média para uma seção de cromatina, ou em células individuais para determinar estruturas dentro dessa célula específica. No entanto, a técnica Hi-C e técnicas semelhantes são trabalhosas, e pode levar cerca de uma semana para gerar dados de uma célula.
Estudo
Para superar as limitações das análises experimentais das estruturas genômicas 3D no núcleo celular, pesquisadores do Instituto de Tecnologia de Massachusetts (MIT) desenvolveram um modelo que aproveita os avanços recentes em Inteligência Artificial (IA) generativa para criar uma maneira rápida e precisa de prever estruturas de cromatina em células individuais.
O novo modelo de IA pode analisar rapidamente sequências de DNA e prever as estruturas de cromatina que essas sequências podem produzir em uma célula.
O Dr. Bin Zhang, professor de Química do MIT, é o autor sênior do artigo publicado na revista Science Advances, que tem Greg Schuette e Zhuohan Lao, doutorandos do MIT, como autores principais.
O novo modelo completo – chamado ChromoGen – é formado por dois componentes. O primeiro componente é um modelo de aprendizado profundo treinado para ‘ler’ o genoma e analisar as informações codificadas na sequência de DNA subjacente e os dados de acessibilidade da cromatina, sendo este último amplamente disponível e específico do tipo de célula.
O segundo componente é um modelo de IA generativo que prevê conformações de cromatina fisicamente precisas, tendo sido treinado em mais de 11 milhões de conformações de cromatina. Esses dados foram gerados a partir de experimentos usando Dip-C (uma variante da técnica Hi-C) em 16 células de uma linha de linfócitos B humanos.
Quando integrado, o primeiro componente informa ao modelo generativo como o ambiente específico do tipo de célula influencia a formação de diferentes estruturas de cromatina. Para cada sequência, os pesquisadores usam o modelo para gerar muitas estruturas possíveis: como o DNA é uma molécula muito desordenada, uma única sequência de DNA pode dar origem a muitas conformações diferentes.
Nosso objetivo era tentar prever a estrutura tridimensional do genoma a partir da sequência de DNA subjacente. Agora que podemos fazer isso, o que coloca essa técnica no mesmo nível das técnicas experimentais de ponta, ela pode realmente abrir muitas oportunidades interessantes
Resultados
Uma vez treinado, o modelo pode gerar previsões em uma escala de tempo muito mais rápida do que a técnica Hi-C ou outras técnicas experimentais.
“Enquanto você pode passar seis meses executando experimentos para obter algumas dezenas de estruturas em um determinado tipo de célula, você pode gerar mil estruturas em uma região específica com nosso modelo em 20 minutos em apenas uma GPU”, destacou Greg Schuette.
Depois de treinar o modelo, os pesquisadores o usaram para gerar previsões de estrutura para mais de 2.000 sequências de DNA e, em seguida, fizeram uma comparação com as estruturas determinadas experimentalmente para essas sequências. Eles descobriram que as estruturas geradas pelo modelo eram as mesmas ou muito semelhantes às vistas nos dados experimentais.
Os pesquisadores também descobriram que o modelo poderia fazer previsões precisas para dados de tipos de células diferentes daquele em que foi treinado. Isso sugere que o modelo poderia ser útil para analisar como as estruturas da cromatina diferem entre os tipos de células e como essas diferenças afetam sua função.
O modelo também poderia ser usado para explorar diferentes estados de cromatina que podem existir dentro de uma única célula e como essas mudanças afetam a expressão genética.
Outra aplicação possível seria explorar como mutações em uma sequência de DNA específica alteram a conformação da cromatina, o que poderia ajudar a esclarecer como tais mutações podem causar doenças.
Os pesquisadores disponibilizaram todos os seus dados e o modelo para que outros pesquisadores também possam usá-lo.
Um grande fator complicador na previsão da estrutura do genoma é que não há uma única solução que estejamos buscando. Há uma distribuição de estruturas, não importa qual parte do genoma você esteja observando. Prever essa distribuição estatística muito complicada e de alta dimensão é algo incrivelmente desafiador
Em suas publicações, o Portal SciAdvances tem o único objetivo de divulgação científica, tecnológica ou de informações comerciais para disseminar conhecimento. Nenhuma publicação do Portal SciAdvances tem o objetivo de aconselhamento, diagnóstico, tratamento médico ou de substituição de qualquer profissional da área da saúde. Consulte sempre um profissional de saúde qualificado para a devida orientação, medicação ou tratamento, que seja compatível com suas necessidades específicas.
Autores/Pesquisadores Citados
Instituições Citadas
Publicação
Acesse o artigo científico completo (em inglês).
Acesse a revista científica Science Advances (em inglês).
Mais Informações
Acesse o modelo ChromoGen completo no GitHub (em inglês).
Acesse a notícia original completa na página do Instituto de Tecnologia de Massachusetts (em inglês).
Leia também:

Escola Politécnica Federal de Lausanne

Universidade Queen Mary de Londres