Como funciona o reconhecimento facial?

A maioria das pessoas se sente confortável com o reconhecimento facial para uso em filtros do Instagram e ID Facial. Mas essa tecnologia relativamente nova pode ser um pouco assustadora. Seu rosto é como uma impressão digital e a tecnologia por trás do reconhecimento facial é complexa.

Como acontece com qualquer nova tecnologia, existem desvantagens no reconhecimento facial. Essas desvantagens estão se tornando mais aparentes à medida que os militares, a polícia, anunciantese criadores deepfake, encontram novas maneiras tortuosas de tirar proveito do software de reconhecimento facial.

Agora, mais do que nunca, é essencial que as pessoas entendam como funciona o reconhecimento facial. Também é importante conhecer as limitações do reconhecimento facial e como ele se desenvolverá no futuro.

O reconhecimento facial é surpreendentemente simples

Antes de entrar nos diversos meios de reconhecimento facial, é importante entender como funciona o processo de reconhecimento facial. Aqui estão três aplicativos para software de reconhecimento facial e uma explicação simples de como eles reconhecem ou identificam rostos:

Reconhecimento facial básico: para filtros de Animoji e Instagram, a câmera do telefone “procura” as características definidoras de um rosto, especificamente um par de olhos, nariz e boca. Em seguida, ele usa algoritmos para travar em um rosto e determinar para qual direção ele está olhando, se sua boca está aberta, etc. Vale ressaltar que isso não é uma identificação facial, é apenas um software procurando por rostos.
ID facial e programas semelhantes: ao configurar o ID facial (ou programas semelhantes) em seu telefone, ele tira uma foto de seu rosto e mede a distância entre suas características faciais. Então, toda vez que você vai desbloquear o telefone, ele “olha” pela câmera para medir e confirmar sua identidade.
Identificando um estranho: quando uma organização deseja identificar um rosto para fins de segurança, propaganda ou policiamento, ela usa algoritmos para comparar esse rosto com um extenso banco de dados de rostos. Este processo é quase idêntico ao ID Facial da Apple, mas em uma escala maior. Teoricamente, qualquer banco de dados poderia ser usado (carteiras de identidade, perfis do Facebook), mas um banco de dados de fotos claras e pré-identificadas é o ideal.

Tudo bem, vamos entrar em detalhes. Como o “reconhecimento facial básico” usado para filtros do Instagram é um processo tão simples e inofensivo, vamos nos concentrar inteiramente na identificação facial e nas muitas tecnologias diferentes que podem ser usadas para identificar um rosto.

  Como escolher o melhor

A maior parte do reconhecimento facial se baseia em imagens 2D

Como era de se esperar, a maioria dos softwares de reconhecimento facial depende inteiramente de imagens 2D. Mas isso não é feito porque a imagem facial 2D é superprecisa, é feita por uma questão de conveniência. A esmagadora maioria das câmeras tira fotos sem qualquer profundidade, e as fotos públicas que podem ser usadas para bancos de dados de reconhecimento facial (fotos de perfil do Facebook, por exemplo) são todas em 2D.

Por que as imagens faciais em 2D não são super precisas? Bem, porque uma imagem plana de seu rosto não tem características de identificação, como profundidade. Com uma imagem plana, um computador pode medir a distância pupilar e a largura da boca, entre outras variáveis. Mas não pode dizer o comprimento do seu nariz ou a proeminência da sua testa.

Além disso, a imagem facial 2D depende do espectro de luz visível. Isso significa que a imagem facial 2D não funciona no escuro e pode não ser confiável em condições de iluminação estranhas ou sombreadas.

Claramente, a maneira de contornar algumas dessas deficiências é usar imagens faciais em 3D. Mas como isso é possível? Você precisa de um equipamento especial para ver um rosto em 3D?

Câmeras infravermelhas adicionam profundidade à sua identidade

Embora alguns aplicativos de reconhecimento facial dependam exclusivamente de imagens 2D, não é incomum que o reconhecimento facial dependa também de imagens 3D. Na verdade, sua experiência com reconhecimento facial provavelmente envolve uma pitada de 3D.

Isso é obtido por meio de uma técnica chamada lidar, que é semelhante ao sonar. Essencialmente, os dispositivos de leitura facial, como o seu iPhone, explodem uma matriz de infravermelho inofensiva em seu rosto. Essa matriz (uma parede de lasers) reflete em seu rosto e é captada por uma câmera infravermelha (ou câmera ToF) em seu telefone.

Onde a mágica 3D acontece? A câmera infravermelha do telefone mede quanto tempo leva para cada bit de luz infravermelha ricochetear em seu rosto e retornar ao telefone. Naturalmente, a luz que reflete em seu nariz terá uma jornada mais curta do que a luz que reflete em seus ouvidos, e a câmera infravermelha usa essa informação para criar um mapa de profundidade exclusivo de seu rosto. Quando usado junto com imagens 2D básicas, imagens 3D podem aumentar significativamente a precisão do software de reconhecimento facial.

  Adicionar Detecção de Ok Google a todas as telas do seu dispositivo [No Root]

A imagem Lidar é um conceito estranho que pode ser difícil de entender. Se ajudar, tente imaginar que a malha IR do seu telefone (ou qualquer dispositivo de reconhecimento facial) é um brinquedo de quadro. Como um brinquedo de quadro, seu rosto deixa uma marca na malha de infravermelho, onde seu nariz é visivelmente mais profundo do que, digamos, seus olhos.

A imagem térmica permite que o reconhecimento facial funcione à noite

Uma das deficiências do reconhecimento facial 2D é que ele depende do espectro de luz visível. Em termos leigos, o reconhecimento facial básico não funciona no escuro. Mas isso pode ser contornado usando uma câmera de imagem térmica (sim, como em Tom Clancy).

“Espere um minuto”, você pode dizer, “a imagem térmica não depende de luz infravermelha?” Sim. Mas as câmeras de imagem térmica não enviam rajadas de luz infravermelha; eles simplesmente detectam a luz infravermelha emitida pelos objetos. Objetos quentes emitem uma tonelada de luz infravermelha, enquanto objetos frios emitem uma quantidade insignificante de luz infravermelha. Câmeras de imagem térmica caras podem até detectar diferenças sutis de temperatura em uma superfície, portanto, a tecnologia é ideal para reconhecimento facial.

Uma imagem do espectro de luz visível, uma imagem térmica e uma imagem térmica composta.

Há um punhado de maneiras diferentes para identificar um rosto com imagens térmicas. Todas essas técnicas são incrivelmente complicadas, mas elas compartilham algumas semelhanças fundamentais, então vamos tentar manter as coisas simples com uma lista:

São necessárias várias fotos: uma câmera de imagem térmica tira várias fotos do rosto de uma pessoa. Cada foto foca em um espectro diferente de luz IV (ondas longas, curtas e médias). Normalmente, o espectro de ondas longas fornece a maioria dos detalhes faciais.
Mapas dos vasos sanguíneos são úteis: essas imagens de infravermelho também podem ser usadas para extrair a formação de vasos sanguíneos no rosto de uma pessoa. É assustador, mas os mapas dos vasos sanguíneos podem ser usados ​​como impressões digitais faciais únicas. Eles também podem ser usados ​​para determinar a distância entre os órgãos faciais (se a imagem térmica típica produzir imagens de má qualidade) ou para identificar hematomas e cicatrizes.
O assunto pode ser identificado: uma imagem composta (ou conjunto de dados) é criada usando várias imagens de infravermelho. Essa imagem composta pode então ser comparada a um banco de dados facial para identificar o sujeito.

  Como usar VLOOKUP em uma série de valores

Claro, o reconhecimento facial térmico é geralmente usado pelos militares, não é algo que você encontrará no Khols e não é algo que virá com seu próximo celular. Além disso, a geração de imagens térmicas não funciona bem durante o dia (ou em ambientes geralmente bem iluminados), portanto, não tem muitas aplicações potenciais fora das forças armadas.

Limitações do reconhecimento facial

Passamos muito tempo falando sobre as deficiências do reconhecimento facial. Como vimos por infravermelho e imagens térmicas, é possível superar algumas dessas limitações. Mas ainda existem alguns problemas que ainda não foram resolvidos:

Obstrução: como seria de se esperar, óculos escuros e outros acessórios podem atrapalhar o software de reconhecimento facial.
Poses: o reconhecimento facial funciona melhor com uma imagem neutra voltada para a frente. Uma inclinação ou rotação da cabeça pode dificultar o reconhecimento facial, mesmo para software de reconhecimento baseado em infravermelho. Além disso, um sorriso, bochechas infladas ou qualquer outra pose podem alterar a forma como um computador mede seu rosto.
Luz: todas as formas de reconhecimento facial dependem da luz, seja o espectro visível ou luz infravermelha. Como resultado, condições estranhas de iluminação podem diminuir a precisão da identificação facial. Isso pode mudar, pois os cientistas estão desenvolvendo tecnologia de reconhecimento facial baseada em sonar.
O Banco de Dados: Sem um bom banco de dados, o reconhecimento facial não funciona. Nessa mesma linha, é impossível identificar um rosto que não tenha sido identificado corretamente no passado.
Processamento de dados: dependendo do tamanho e formato de um banco de dados, pode demorar um pouco para os computadores identificarem os rostos corretamente. Em algumas situações, como no policiamento, as limitações no processamento de dados restringem o uso da identificação facial para aplicações cotidianas (o que provavelmente é uma coisa boa).

A partir de agora, a melhor maneira de contornar essas limitações é usar outras formas de identificação em conjunto com o reconhecimento facial. Seu telefone irá pedir uma senha ou uma impressão digital se não conseguir identificar seu rosto, e o Governo chinês usa cartões de identificação e tecnologia de rastreamento para fechar a margem de erro que existe em sua rede de reconhecimento facial.

No futuro, os cientistas certamente encontrarão uma maneira de contornar essas questões. Eles podem usar a tecnologia de sonar junto com lidar para criar mapas faciais em 3D em qualquer ambiente e podem encontrar maneiras de processar dados faciais (e identificar estranhos) em um período de tempo incrivelmente curto. De qualquer forma, essa tecnologia tem muito potencial para abuso, portanto, vale a pena acompanhá-la.

Fontes: A universidade de Rijeka, The Electronic Frontier Foundation