
Gorodenkoff via Shutterstock
Fonte
Kimm Fesenmaier, Caltech
Publicação Original
Áreas
Compartilhar
Resumo
Em um estudo que envolveu pesquisadores dos EUA, Canadá, China e Alemanha, foi desenvolvido e testado um novo modelo de aprendizado de máquina que incorpora matematicamente restrições físicas de disposição de átomos ao processo de design de fármacos.
Os pesquisadores treinaram o modelo em cerca de 100.000 complexos de ligação proteína-ligante e realizaram testes em 100 desses complexos.
Eles descobriram que o novo modelo superou significativamente os modelos de última geração em termos de afinidade de ligação, ao mesmo tempo em que reduziu o número de colisões atômicas para quase zero.
Foco do Estudo
Estudo
Para limitar resultados que não tenham sentido ‘físico’ no campo do design de fármacos, pesquisadores introduziram um novo modelo de aprendizado de máquina chamado NucleusDiff, que incorpora uma ideia física simples em seu treinamento, melhorando significativamente o desempenho do algoritmo.
O estudo, liderado pela Dra. Anima Anandkumar, professora de Ciências da Computação e Matemática no Instituto de Tecnologia da Califórnia (Caltech), nos EUA, foi publicado na revista científica Proceedings of the National Academy of Sciences (PNAS).
O objetivo do design de fármacos baseado em estrutura é criar pequenas moléculas, chamadas ligantes, que se liguem bem a um alvo biológico, normalmente uma proteína, causando algum tipo de alteração desejada em sua atividade.
Os modelos de Inteligência Artificial (IA) para o design de fármacos são treinados em conjuntos de dados contendo dezenas de milhares de exemplos desses pares proteína-ligante, bem como informações sobre o quão bem eles se ligam um ao outro, uma medida importante chamada afinidade de ligação.
Mas o NucleusDiff vai além: o modelo garante que os átomos permaneçam a uma distância adequada uns dos outros, levando em conta conceitos físicos como forças de repulsão que impedem que os átomos se sobreponham ou colidam.
“Temos uma boa teoria física por trás do algoritmo, mas ele também é intuitivo. Surpreendentemente, sem essas restrições, todos esses modelos de IA tendem a prever que há colisão, que os átomos se aproximam demais. Ao adicionar física simples, aumentamos a precisão do modelo”, explicou a professora.
Em vez de considerar a distância entre cada par de átomos em uma molécula (uma tarefa que teria altíssimo custo computacional), o NucleusDiff estima uma variedade, ou envelope — uma estimativa aproximada da distribuição de átomos e das prováveis localizações dos elétrons na molécula. Nessa variedade, ele então estabelece os principais pontos de ancoragem a serem observados, garantindo que os átomos nunca se aproximem demais uns dos outros.
Participaram do estudo pesquisadores Universidade da Califórnia em Berkeley e da Academia Alibaba DAMO em Washington, nos EUA; Universidade Fudan, na China; Instituto Max Planck para Sistemas Inteligentes, na Alemanha; da Universidade de Toronto e do Conselho Nacional de Pesquisa do Canadá.
Com o aprendizado de máquina, o modelo já está aprendendo muitos dos aspectos que determinam uma boa ligação, e agora adicionamos um pouco de física simples para garantir que descartamos todos os fatores não físicos
Resultados
Os pesquisadores treinaram o modelo NucleusDiff em um conjunto de dados de treinamento chamado CrossDocked2020, que inclui cerca de 100.000 complexos de ligação proteína-ligante.
Em seguida, eles testaram o modelo em 100 desses complexos e descobriram que ele superou significativamente os modelos de última geração em termos de afinidade de ligação, ao mesmo tempo em que reduziu o número de colisões atômicas para quase zero.
Então, os pesquisadores usaram o novo modelo para prever as afinidades de ligação de uma molécula mais recente que não estava incluída no conjunto de dados de treinamento: a protease 3CL, alvo terapêutico da COVID-19. Novamente, o NucleusDiff demonstrou maior precisão e uma redução de colisões atômicas em até dois terços em comparação com outros modelos para design de fármacos.
“Se confiarmos apenas em dados de treinamento, não esperamos que o aprendizado de máquina funcione bem em exemplos significativamente diferentes dos dados de treinamento”, afirmou a professora Anima Anandkumar.
A pesquisadora destacou que é um princípio padrão do aprendizado de máquina que os resultados normalmente se enquadrem nos exemplos fornecidos pelos dados de treinamento. Mas em muitos domínios científicos, como o design de fármacos, os pesquisadores buscam novos resultados (por exemplo, novas moléculas).
Vemos muitas falhas no aprendizado de máquina em gerar resultados precisos com base em novos exemplos diferentes dos dados de treinamento, mas, ao incorporar a física, podemos tornar o aprendizado de máquina mais confiável e também funcionar muito melhor
Em suas publicações, o Portal SciAdvances tem o único objetivo de divulgação científica, tecnológica ou de informações comerciais para disseminar conhecimento. Nenhuma publicação do Portal SciAdvances tem o objetivo de aconselhamento, diagnóstico, tratamento médico ou de substituição de qualquer profissional da área da saúde. Consulte sempre um profissional de saúde qualificado para a devida orientação, medicação ou tratamento, que seja compatível com suas necessidades específicas.
Autores/Pesquisadores Citados
Publicação
Acesse o artigo científico completo (em inglês).
Acesse a revista científica Proceedings of the National Academy of Sciences (PNAS) (em inglês).
Mais Informações
Acesse a notícia original completa na página do Instituto de Tecnologia da Califórnia (em inglês).
Notícias relacionadas
Universidade Federal do Rio Grande do Norte
Universidade Regional do Cariri