Visão por Computador: como ensinamos as máquinas a ler e a interpretar o mundo

É através da visão por computador que conseguimos fazer com que as “máquinas” vejam e interpretem o mundo tal como os humanos reconhecem pessoas e objetos.

Para os humanos, a visão é responsável por cerca de 70% de toda a informação que extraímos do  ambiente envolvente. Assim, a visão por computador surge como uma ciência interdisciplinar focada na recriação deste sentido, não estando contudo, cingida às limitações do mesmo, por exemplo podendo “trabalhar” além da luz visível. 

O que é a visão por computador e como funciona?

A visão por computador é uma área de estudo e aplicação que faz uso de diversos domínios científicos, tais como: física, matemática, ciências da computação, biologia, entre outros, e que se traduz numa tecnologia de construção de sistemas artificiais que obtém informação através de dados multidimensionais, como imagens, num processo de captura e interpretação dos padrões de luz / radiação eletromagnética.

O seu objetivo é descobrir através de imagens o que se passa no mundo, compreendendo padrões, objetos e ações.

Ela pode ser dividida em dois grandes módulos:

  • Aquisição de Imagem – como conseguimos capturar a informação do mundo.
  • Processamento de Imagem – como conseguimos processar essa informação para termos dados que realmente nos interessem e que sejam úteis para as tarefas em mão.

Exemplo de reconhecimento automático de pessoas e objetos no CCG através de visão por computador

Como se faz?

A primeira parte da visão por computador é a aquisição de imagem. Neste capítulo é necessário selecionar:

  • Câmara (Sensor);
  • Tipologia de Iluminação;
  • Lente;
  • Filtros.

A seleção de cada elemento é altamente dependente do objetivo e do contexto para o qual se está a desenhar a solução de visão por computador.

Na segunda parte da equação temos o processamento dos dados adquiridos.

A extração de informação dos dados em bruto é implementada através de programação e recorrendo à matemática, à álgebra, explorando, em especial, relações espaciais e temporais.

Muitas das aplicações da visão por computador pretendem detetar ou classificar algo. Nesse sentido, a visão por computador recorre muitas vezes a algoritmos de machine-learning.

Hoje em dia, e devido à disponibilidade de uma elevada capacidade de processamento e também de dados disponíveis, destaca-se para alguns cenários de aplicação o deep-learning (uma área especifica do machine-learning), o qual faz uso de uma rede neuronal com inúmeras camadas, e que permite extrair padrões e informação de alto de nível diretamente a partir dos dados.

Exemplos de aplicações

 

Exemplo de inspeção ótica automática no CCG do projeto MaxCut4Fish

A visão por computador tem aplicabilidade em múltiplos sectores, da saúde à indústria, do ramo do entretenimento ao campo militar.

Alguns exemplos de aplicação de visão por computador por parte do CCG são:

  • inspeção ótica automática;
  • análise de imagem médica;
  • vigilância eletrónica;
  • reconhecimento de objetos;
  • reconhecimento facial;
  • deteção de defeitos;
  • reconhecimento semântico de cenas.

Exemplos de projetos atuais de referência:

Visão por computador: do fotão à inferência visual

Nesta apresentação pode constatar o que é a visão por computador e como se faz. Conheça as aplicações da visão por computador e muitas das suas especificidades e curiosidades, pela perspetiva de alguém que trabalha na área.

“Visão por Computador – do fotão à Inferência Visual” é uma apresentação de Nelson Alves, investigador CCG, do domínio de investigação aplicada CVIG – Computer Vision Interaction and Graphics.

Esta é uma das grandes áreas científicas que suportam as atividades de investigação e desenvolvimento realizadas no CVIG.