
Fonte
Anne-Muriel Brouet e Emmanuel Barraud, EPFL
Publicação Original
Áreas
Resumo
Procurando contornar o uso de IAs Generativas baseadas em LLMs de grandes corporações, treinadas com dados da internet de origem nem sempre confiável para aplicações na área médica, pesquisadores têm desenvolvido modelos treinados com dados muito mais restritos, porém confiáveis: os chamados SLMs (Small Language Models).
Um exemplo de sucesso de um SLM na área médica é o Meditron, desenvolvido em conjunto por pesquisadores na Suíça e nos EUA.
Considerado o modelo de linguagem de código aberto de melhor desempenho para aplicações médicas, o Meditron teve resultados positivos em testes realizados nos EUA.
Por usar uma quantidade relativamente pequena de dados, o que não exige tanto processamento como os LLMs, o modelo Meditron pode ser baixado para um smartphone e operar inclusive em áreas remotas, onde há pouco ou nenhum acesso à Internet.
Atualmente, os modelos de Inteligência Artificial Generativa mais usados para aplicações gerais são aqueles de código fechado e de propriedade de grandes corporações – os chamados Large Language Models, ou LLMs. Com bilhões de parâmetros, estes modelos de linguagem são treinados com gigantescos conjuntos de dados basicamente oriundos de fontes da internet, escolhidas pelas empresas.
“Mas esse método vem com riscos. Uma grande parte do conteúdo disponível on-line é tóxica, perigosa ou simplesmente incorreta. É por isso que os desenvolvedores precisam supervisionar e refinar seus modelos e adicionar vários filtros”, destacou o Dr. Nicolas Flammarion, que lidera o Laboratório de Teoria de Aprendizado de Máquina da Escola Politécnica Federal de Lausanne (EPFL), na Suíça.
Nos últimos anos, os pesquisadores estão explorando maneiras de alavancar o poder dos LLMs e, ao mesmo tempo, torná-los mais eficientes, seguros e econômicos. “Um método é limitar as fontes de dados que são alimentadas ao modelo”, disse o Dr. Martin Rajman, pesquisador em Inteligência Artificial e professor da EPFL. “O resultado serão modelos de linguagem altamente eficazes para uma determinada aplicação e que não tentam ter respostas para tudo.”
Essa é a ideia por trás dos SLMs, ou Small Language Models: a ‘dimensão reduzida’ desses modelos diz respeito ao tamanho dos conjuntos de dados usados para treinamento, que são muito menores.
O Meditron, um SLM para a área médica, é um exemplo de como esse conceito pode ser aplicado na prática: o modelo depende exclusivamente de conjuntos de dados médicos confiáveis e verificados.
Desenvolvido por pesquisadores da EPFL e da Escola de Medicina de Yale, nos EUA, o Meditron é atualmente o modelo de linguagem de código aberto de melhor desempenho para aplicações médicas. Com todos os recursos de execução de chatbots de grandes modelos – o Meditron usa o LLM de acesso aberto Llama da Meta – seu uso implica em consideravelmente menos riscos.
Treinado com dados provenientes de literatura revisada por pares de bancos de dados de acesso aberto, como o PubMed, e uma coleção exclusiva de diretrizes de prática clínica abrangendo vários países, regiões e hospitais, o SLM evita a disseminação de informações incorretas.
“Essa base de acesso aberto é talvez o aspecto mais importante do Meditron”, disse a Dra. Annie Hartley, pesquisadora do Laboratório de Tecnologias Inteligentes de Saúde Global e Resposta Humanitária, mantido em conjunto pela EPFL e pela Universidade Yale.
Outra vantagem importante dos SLMs é que eles funcionam em um sistema fechado, o que significa que as informações que os usuários inserem em um prompt são protegidas
Testado nos EUA para identificar diagnósticos com base em exames médicos, o Meditron respondeu com mais precisão do que os humanos, em média. Embora o Meditron não tenha a intenção de substituir médicos, pode ajudá-los a tomar decisões e confirmar diagnósticos.
Como os SLMs dependem de conjuntos de dados menores, eles não precisam de grandes quantidades de poder de processamento para serem executados. No caso do Meditrom, o SLM pode ser baixado para um smartphone e operar inclusive em áreas remotas onde há pouco ou nenhum acesso à Internet.
Atualmente, outros pesquisadores da EPFL estão buscando melhorar a qualidade dos dados fornecidos aos modelos SLM. O Dr. Emmanuel Abbé, professor da EPFL, está realizando um projeto em conjunto com o Hospital Universitário de Lausanne (CHUV) para ajudar a prevenir ataques cardíacos. O objetivo é desenvolver um sistema de IA que possa analisar imagens de um angiograma e estimar o risco de parada cardíaca de um paciente.
O professor Emmanuel Abbé e seu grupo de pesquisa planejam conduzir um grande estudo de coorte na Suíça envolvendo pelo menos 1.000 participantes nos próximos três anos para coletar dados para treinar seu modelo.
Em última análise, os SLMs podem contribuir significativamente para o avanço da medicina personalizada, considerando dados específicos dos pacientes. “Mas temos que garantir que sistemas robustos estejam em vigor para proteger esses dados altamente sensíveis e garantir que eles sejam usados de forma ética e justa”, concluiu o Dr. Olivier Crochat, diretor executivo do Centro de Confiança Digital da EPFL.
Em suas publicações, o Portal SciAdvances tem o único objetivo de divulgação científica, tecnológica ou de informações comerciais para disseminar conhecimento. Nenhuma publicação do Portal SciAdvances tem o objetivo de aconselhamento, diagnóstico, tratamento médico ou de substituição de qualquer profissional da área da saúde. Consulte sempre um profissional de saúde qualificado para a devida orientação, medicação ou tratamento, que seja compatível com suas necessidades específicas.
Autores/Pesquisadores Citados
Instituições Citadas
Mais Informações
Acesse a notícia completa na página da Escola Politécnica Federal de Lausanne (em inglês).
Leia também:
Universidade Técnica de Munique