Com o olho humano como inspiração, uma equipe de pesquisadores da Universidade de Maryland (UMD), dos Estados Unidos, elaborou um mecanismo de câmera que melhora a forma como os robôs veem e reagem ao mundo ao seu redor. O aprimoramento do maquinário de câmeras de evento permitiu redirecionar a luz e estabilizar a textura, de modo a apresentar potencial para ser adotada para visão de robôs. A aplicabilidade vai de processos industriais e orientação robótica a auxílio na tecnologia de direção autônoma para carros sem motorista.

Câmeras de eventos ou câmeras neuromórficas são tecnologias recentes utilizadas para detectar objetos dinâmicos e reconhecer objetos em movimento, utilizadas em câmeras de segurança e drones. Ainda que inovadoras, não são otimizadas para manter textura estável na visão quando há pouco movimento envolvido. A nova técnica, porém, conseguiu tornar isso possível.

Botao He, estudante de doutorado em ciência da computação na UMD e autor principal do artigo publicado no journal Science Robotics, percebe as limitações como "um grande problema porque robôs e muitas outras tecnologias — como carros autônomos — dependem de imagens precisas e oportunas para reagir corretamente a um ambiente em mudança. Então, nos perguntamos: como humanos e animais garantem que sua visão permaneça focada em um objeto estático?".

A partir da pergunta, o grupo se dedicou a entender as microsaccadas, que são pequenos movimentos rotacionais oculares e rápidos que acontecem involuntariamente quando uma pessoa tenta focar sua visão. Segundo o estudo, é por meio desses movimentos minúsculos, porém contínuos, que o olho humano é capaz de manter o foco em um objeto e suas texturas visuais, como cor, profundidade e sombreamento.

O professor Marcelo Carboni Gomes, mestre em ciências da computação pela Universidade Federal do Rio Grande do Sul (UFRGS) com pesquisas em inteligência artificial, robótica e segurança cibernética, destaca a delicadeza dessa tecnologia e seus efeitos. "São movimentos tão sutis e rápidos que, geralmente, não percebemos que estão acontecendo."

Segundo o especialista, o sistema ajuda os olhos a capturar mais detalhes e a evitar que a imagem que observada fique desfocada ou desapareça do campo de visão. "A câmera faz pequenos ajustes constantes para melhorar a clareza das imagens que captura. Assim como nossos olhos, a câmera evita que as imagens fiquem borradas ou desfocadas, especialmente em cenas estáticas ou com pouca movimentação", acrescenta Carboni.

Testes

Chamado de Artificial Microsaccade-Enhanced Event Camera (AMI-EV), o dispositivo conseguiu capturar e exibir movimentos com precisão em vários contextos, incluindo detecção de pulso humano e identificação de formas em movimento rápido. He comenta que "os pesquisadores também descobriram que o AMI-EV pode capturar movimento em dezenas de milhares de quadros por segundo, superando o desempenho da maioria das câmeras comerciais disponíveis, que capturam em média de 30 a 1.000 quadros por segundo".

Também foi observado que o algoritmo melhora o desempenho da câmera. "Nosso sistema pode manter a vantagem das câmeras de eventos, como alta resolução temporal e alta faixa dinâmica, ao mesmo tempo que mantém a textura estável, assim como fazem as câmeras padrão".

A tecnologia, portanto, possui aplicabilidade em robótica, drones, sistemas de segurança e automação industrial, aprimorando, respectivamente a visão computacional, análise de movimento e sistemas de assistência ao motorista (Adas) em veículos autônomos.

Potencial

Os experimentos a partir do estudo demonstram o potencial do sistema para facilitar a percepção robótica tanto para tarefas de visão de baixo quanto de alto nível, como detecção de características e estimativa de pose humana. Cornelia Fermüller, cientista pesquisadora autora senior do artigo, observa que "o nosso sistema pode manter a vantagem das câmeras de eventos, como alta resolução temporal e alta faixa dinâmica, ao mesmo tempo que mantém a textura estável, assim como fazem as câmeras padrão".

A equipe tem perspectivas de que a câmera encontre aplicações no domínio dos dispositivos vestíveis e no domínio da observação espacial, onde a visão de eventos atraiu recentemente a atenção das agências.

"Imagens mais nítidas e precisas"

professor de engenharia do Centro Universitário de Brasília (Ceub) e especialista em eletrônica analógica, eletrônica digital, eletrônica industrial e teorias de controle.

Como é o funcionamento da câmera que imita o olho humano?

Ao simular movimentos sacádicos, que são pequenos e rápidos movimentos involuntários do olho, a câmera utiliza um prisma rotativo para redirecionar a luz capturada, estabilizando a imagem de forma semelhante à estabilização natural do olho humano. Consegue focar em objetos que se deslocam rapidamente. A câmera aprimorada por movimentos sacádicos artificiais é única; nenhuma outra câmera incorpora um mecanismo de estabilização baseado no movimento do olho humano. Esse dispositivo pode melhorar robôs ao fornecer imagens mais nítidas e precisas em movimento, permitindo reações mais rápidas e eficazes. Ele também melhora o desempenho em condições de iluminação desafiadoras, beneficiando a navegação e a interação com o ambiente.

Em que situações esse sistema pode ser útil?

Resolve problemas de desfoque por movimento e melhora a captura de detalhes em objetos em movimento. É útil em veículos autônomos para identificar pedestres e obstáculos, em realidade aumentada para uma experiência mais fluida, em segurança para monitoramento eficiente e em aplicações científicas para melhor captura de imagens em alta velocidade. O diferencial é a simulação dos movimentos sacádicos do olho para estabilizar e melhorar a qualidade das imagens, oferecendo clareza superior em condições de movimento rápido e iluminação variável, superando as limitações das câmeras tradicionais.

O que é uma câmera de evento ou neuromórfica?"

As câmeras tradicionais que estamos habituados capturam uma série de quadros em taxas constantes. A câmera de eventos ou neuromórfica detecta e registra apenas alguma mudança na cena em tempo real, ou seja, consegue capturar movimentos rápidos e em condições variáveis de luz. Nesse caso, seria uma concorrente da câmera que discutimos ontem. As tecnologias são diferentes mas os resultados são semelhantes.

