
BQUB24-Ebahr via Wikimedia Commons
Estrutura tridimensional da proteína PKP1 (placofilina-1) gerada com o software Alphafold3
Fonte
Sean Barton, Universidade de Sheffield
Publicação Original
Áreas
Resumo
Pensando em resolver o problema do enovelamento inverso de proteínas – ou seja, determinar as sequências de aminoácidos que podem se enovelar em uma estrutura proteica tridimensional desejada – cientistas desenvolveram um novo sistema de IA baseada em aprendizado de máquina que pode acelerar o projeto de proteínas-chave necessárias para o desenvolvimento de novas vacinas, terapias genéticas e outras modalidades terapêuticas.
Para obter melhores resultados no processo de enovelamento inverso de proteínas, os cientistas propuseram um modelo probabilístico de difusão discreta que gera iterativamente sequências de aminoácidos com ruído reduzido, condicionadas a uma determinada estrutura proteica.
Foco do Estudo
Por que é importante?
O projeto de proteínas que podem se ligar a alvos específicos no corpo faz parte da ‘engenharia de proteínas’, que pode ser fundamental no desenvolvimento de novos medicamentos.
No entanto, o processo é desafiador devido à complexidade do enovelamento (ou dobramento) de proteínas e à dificuldade em prever como as sequências de aminoácidos – os blocos de construção das proteínas – irão interagir para formar estruturas funcionais.
O processo de enovelamento inverso de proteínas é crítico para a criação de novas proteínas, pois identifica sequências que se enovelam em uma estrutura proteica tridimensional desejada e permitem que a proteína desempenhe funções específicas.
Para ajudar a resolver este problema, cientistas têm recorrido ao aprendizado de máquina para prever com mais precisão quais sequências de aminoácidos irão enovelar-se em estruturas proteicas estáveis e funcionais.
Esses modelos são treinados em grandes conjuntos de dados de sequências e estruturas proteicas conhecidas para aprimorar as previsões do enovelamento inverso.
Estudo
Em um estudo publicado na revista científica Nature Machine Intelligence, cientistas da computação da Universidade de Sheffield, em colaboração com cientistas da AstraZeneca e da Universidade de Southampton, no Reino Unido, desenvolveram uma nova estrutura de aprendizado de máquina que demonstrou potencial para ser mais precisa no enovelamento inverso de proteínas do que os métodos de última geração existentes.
O processo de enovelamento inverso de proteínas tem desafios como a previsão de elementos com alta incerteza estrutural, incluindo regiões desordenadas. Para melhorar essa previsão de resíduos de baixa confiança, os cientistas propuseram uma estrutura de difusão de redução de ruído guiada por máscara prévia – chamada MapDiff – que captura com precisão tanto as informações estruturais quanto as interações de resíduos para o enovelamento inverso de proteínas.
O MapDiff é, portanto, um modelo probabilístico de difusão discreta que gera iterativamente sequências de aminoácidos com ruído reduzido, condicionado a uma determinada estrutura proteica.
O estudo foi resultado de uma colaboração direta com a indústria farmacêutica e se baseia em trabalhos anteriores entre os cientistas da computação de Sheffield e da AstraZeneca, que desenvolveram o DrugBAN, um algoritmo de IA que pode prever se um medicamento candidato se ligará às moléculas de proteína alvo pretendidas dentro do corpo humano, o que poderia acelerar a descoberta de novos medicamentos.
Este trabalho representa um avanço significativo no uso da IA para projetar proteínas com as estruturas desejadas. Ao aprender a gerar sequências de aminoácidos com probabilidade de se dobrarem em estruturas 3D específicas, nosso método abre novas possibilidades para o desenvolvimento de novas proteínas terapêuticas, que podem ser utilizadas em diversas aplicações terapêuticas. É empolgante ver a IA nos ajudando a enfrentar um desafio tão fundamental na biologia.
Resultados
A nova estrutura de aprendizado de máquina – chamada MapDiff – superou a Inteligência Artificial (IA) mais avançada na realização de previsões bem-sucedidas em testes simulados.
Os resultados constituem uma base promissora para o desenvolvimento futuro da tecnologia, que, se bem-sucedida, poderá acelerar o projeto de proteínas-chave necessárias para o desenvolvimento de novas vacinas, terapias genéticas e outras modalidades terapêuticas.
A tecnologia também complementa outros avanços recentes, como o AlphaFold, que prevê a estrutura tridimensional de uma proteína invertendo a abordagem, começando com o enovelamento da proteína e recuperando as potenciais sequências de aminoácidos.
O Dr. Peizhen Bai, cientista sênior de aprendizado de máquina da AstraZeneca, que desenvolveu a IA como parte de seu doutorado na Escola de Ciência da Computação da Universidade de Sheffield, destacou: “Durante meu doutorado, fui motivado pelo potencial da IA para acelerar a descoberta biológica. Tenho orgulho de que nosso método, o MapDiff, ajude a projetar sequências de proteínas com maior probabilidade de se dobrarem em estruturas 3D desejadas — um passo fundamental para o avanço da próxima geração de terapias”.
Em suas publicações, o Portal SciAdvances tem o único objetivo de divulgação científica, tecnológica ou de informações comerciais para disseminar conhecimento. Nenhuma publicação do Portal SciAdvances tem o objetivo de aconselhamento, diagnóstico, tratamento médico ou de substituição de qualquer profissional da área da saúde. Consulte sempre um profissional de saúde qualificado para a devida orientação, medicação ou tratamento, que seja compatível com suas necessidades específicas.
Autores/Pesquisadores Citados
Instituições Citadas
Publicação
Acesse o artigo científico completo (em inglês).
Acesse a revista científica Nature Machine Intelligence (em inglês).
Mais Informações
Acesse a notícia original completa na página da Universidade de Sheffield (em inglês).
Notícias relacionadas

Instituto de Tecnologia de Massachusetts

Universidade de Adelaide
Universidade da Califórnia em San Diego