
DC Studio via Shutterstock
Fonte
Gregory Wicky, EPFL
Publicação Original
Áreas
Compartilhar
Resumo
Na Suíça, pesquisadores prepararam uma cozinha totalmente instrumentada para a realização de um projeto de captura e estudo de gestos durante o preparo de refeições.
Com essa nova base de dados, os pesquisadores pretendem estudar novos detalhes da biomecânica do movimento humano – incluindo movimento, coordenação e planejamento de ações – para ajudar as pessoas a recuperarem movimentos perdidos.
Os dados foram usados em quatro benchmarks principais, projetados para testar as capacidades de modelos de inteligência artificial (IA): compreensão de linguagem visual, reconhecimento de ações multimodais, segmentação baseada em poses e geração de movimento a partir de texto.
Mas os modelos de IA ainda estão longe de conseguir analisar uma sessão de culinária com o nível de confiabilidade exigido para aplicações clínicas.
Poucos ambientes revelam a mecânica do movimento humano com tanta clareza quanto uma cozinha. Panelas, frigideiras, bancadas, fornos e geladeiras formam o cenário de um novo projeto liderado pelo Dr. Alexander Mathis, neurocientista computacional e professor da Escola Politécnica Federal de Lausanne (EPFL), na Suíça.
Em colaboração com colegas da EPFL, do Instituto Federal de Tecnologia de Zurique (ETH Zurique) e do Centro Conjunto de Pesquisa Suíça da Microsoft, o pesquisador lidera o projeto EPFL-Smart-Kitchen-30 — um registro multiangular e abrangente, exclusivo, de gestos durante o preparo de refeições.
O projeto, apresentado recentemente na Conferência Anual sobre Sistemas de Processamento de Informação Neural, nos EUA, estabelece as bases para o estudo de novos detalhes da biomecânica do movimento humano, o que pode melhorar o monitoramento dos efeitos da neurorreabilitação no cotidiano e ajudar o desenvolvimento de estratégias de tratamento mais eficazes para a reabilitação e assistência da função motora.
O projeto tem como objetivo acompanhar, de forma não invasiva, como as pessoas realizam ações cotidianas em situações próximas da vida real. Ao modelar os componentes motores e cognitivos desses gestos, os pesquisadores pretendem compreender melhor como o movimento, a coordenação e o planejamento de ações são estruturados. As aplicações potenciais são vastas, desde a neurociência básica e translacional até o aprendizado de máquina, incluindo a área médica.
A equipe de pesquisa montou uma cozinha totalmente instrumentada na EPFL. O projeto EPFL-Smart-Kitchen-30 utilizou uma plataforma única de captura de movimento: nove câmeras RGB-D fixas posicionadas ao redor da sala para que as mãos dos participantes estivessem sempre visíveis de vários ângulos; um headset HoloLens 2 gravando em primeira pessoa e rastreando o olhar; unidades de medição inercial capturando os movimentos do corpo e das mãos. “Alguns elementos da própria cozinha também foram instrumentados. Colocamos um acelerômetro na porta da geladeira, o que nos permitiu medir a velocidade de abertura e a suavidade ou hesitação do gesto”, destacou o Dr. Alexander Mathis.
Ao cozinhar, as pessoas realizam uma enorme variedade de movimentos: caminham, ficam na ponta dos pés, abrem armários, manuseiam facas, panelas, embalagens… Podemos observar a coordenação entre os olhos e as mãos, o planejamento (todos os ingredientes precisam estar prontos na hora certa) e até mesmo expressões do estilo pessoal das pessoas. Isso realmente mobiliza todo o corpo e o cérebro
Ao todo, o conjunto de dados compreende quase 30 horas de gravações. Todos os 16 participantes — mulheres e homens com idades entre 20 e 46 anos — prepararam quatro receitas diferentes, cada uma repetida diversas vezes.
Esse cenário permitiu à equipe observar como os gestos evoluem com a prática. No cardápio: omelete com salada, ratatouille ou pad thai. “O pad thai foi uma boa escolha. Como era um prato novo para alguns participantes, especialmente os mais velhos, foi necessário um período de adaptação”, explicou o pesquisador.
Cada prato combinava ações simples com restrições de tempo rigorosas: monitorar uma panela enquanto preparava um molho, antecipar o próximo passo, adaptar-se ao inesperado.
Um dos pontos fortes do projeto reside na precisão de suas anotações. Cada sessão foi analisada por anotadores humanos, que descreveram continuamente as ações dos participantes. Foram definidos cerca de 768 tipos distintos de ações, que variam de gestos muito concretos a categorias mais gerais. Como resultado, mais de 30 segmentos de ação por minuto.
Esses dados alimentaram quatro benchmarks principais, projetados para testar as capacidades de modelos de inteligência artificial: compreensão de linguagem visual, reconhecimento de ações multimodais, segmentação baseada em poses e geração de movimento a partir de texto. Este último consiste em vincular instruções verbais a trajetórias de movimento 3D. Aprender essa conexão entre linguagem e movimento é essencial para que sistemas assistivos ou robôs realmente entendam o que lhes é solicitado.
Atualmente, os resultados mostram que o desafio está longe de ser superado. “Na tarefa de reconhecimento de ações, os melhores modelos de IA atuais atingem cerca de 40% de precisão”, observou o Dr. Alexander Mathis.
Em outras palavras, eles ainda estão longe de conseguir analisar uma sessão de culinária com o nível de confiabilidade exigido para aplicações clínicas. Mas o pesquisador permanece confiante: “Tenho certeza de que, em um ou dois anos, o desempenho será significativamente melhor. A IA está avançando muito rapidamente e marcos como este a ajudarão a alcançar novos patamares”, concluiu.
Por trás do projeto, um objetivo muito concreto: ajudar as pessoas a recuperarem movimentos perdidos. Entre os parceiros de pesquisa, o Dr. Friedhelm Hummel, professor e especialista em Neuroengenharia Clínica e Interação Humano-Máquina da EPFL, concentra-se na recuperação de pacientes que sofreram AVC e em terapias personalizadas. No Laboratório de Engenharia Neural Translacional da EPFL, o neuroengenheiro Solaiman Shokur trabalha em interfaces projetadas para recuperar movimentos mais naturais após lesões graves. Todos contribuíram para o projeto.
Em suas publicações, o Portal SciAdvances tem o único objetivo de divulgação científica, tecnológica ou de informações comerciais para disseminar conhecimento. Nenhuma publicação do Portal SciAdvances tem o objetivo de aconselhamento, diagnóstico, tratamento médico ou de substituição de qualquer profissional da área da saúde. Consulte sempre um profissional de saúde qualificado para a devida orientação, medicação ou tratamento, que seja compatível com suas necessidades específicas.
Autores/Pesquisadores Citados
Mais Informações
Acesse a notícia original completa na página da Escola Politécnica Federal de Lausanne (em inglês).
Notícias relacionadas

Universidade Técnica de Munique

Universidade de Basileia
Universidade Federal de São Paulo
Instituto de Tecnologia de Massachusetts




