NPUs: O Futuro da IA em Seus Laptops e Smartphones

O panorama tecnológico tem vivenciado uma transformação notável no campo da inteligência artificial nos últimos tempos, impulsionada principalmente pela ascensão das Unidades de Processamento Neural (NPUs). Após o reinado das CPUs e GPUs, as NPUs emergem como a mais recente inovação no setor, com empresas de diversas escalas explorando seu potencial para proporcionar recursos e experiências inovadoras em IA generativa. Estas unidades especializadas têm demonstrado sua eficácia em diversas aplicações, desde laptops e smartphones até sistemas de inteligência artificial de grande porte. Não surpreende, portanto, que sistemas como os PCs Copilot+ venham equipados com processadores de alto desempenho, como o Qualcomm Snapdragon X, que integram NPUs capazes de executar até 45 TOPS (trilhões de operações por segundo). Este artigo tem como objetivo esclarecer o que são as NPUs, como elas se diferenciam das CPUs e GPUs, e quais as suas aplicações nos dispositivos modernos.

O Que Define uma NPU?

Uma NPU, ou Unidade de Processamento Neural, é um componente de hardware projetado especificamente para a execução de tarefas relacionadas à inteligência artificial. Este tipo de unidade é otimizado para o processamento de redes neurais, tarefas de aprendizado de máquina e cargas de trabalho de IA.

As NPUs realizam cálculos matemáticos complexos, com a multiplicação de matrizes (conhecida como ‘matmul’) sendo uma das operações mais comuns. Elas são projetadas para executar essas operações com extrema rapidez e eficiência.

O processamento paralelo é crucial para qualquer tarefa de IA, uma vez que as redes neurais processam muitas operações simultaneamente. As NPUs incorporam aceleradores especializados que liberam o paralelismo em grande escala. Em combinação com memória de alta largura de banda, as NPUs são capazes de executar operações matmul paralelas em múltiplos núcleos de forma rápida e eficiente.

Em resumo, as NPUs são projetadas especificamente para tarefas de IA, focando na maximização do paralelismo, na execução rápida de operações matmul e na escalabilidade. É importante notar que diferentes empresas adotam denominações distintas para suas NPUs: o Google as chama de TPU (Unidade de Processamento Tensorial), enquanto a Apple as identifica como Neural Engine.

Diferenças Cruciais entre NPUs, CPUs e GPUs

Como mencionado anteriormente, as NPUs são dedicadas a tarefas específicas de IA, sendo consideradas unidades de processamento de aplicação específica. Por outro lado, a CPU (Unidade Central de Processamento) é uma unidade de processamento de propósito geral, com capacidade para executar uma vasta gama de tarefas.

As CPUs gerenciam a operação de sistemas operacionais e aplicações gerais. Sua versatilidade permite que elas lidem com qualquer tipo de tarefa. Elas são particularmente eficientes em tarefas de thread única, mas sua eficiência é reduzida em tarefas paralelas.

As GPUs, por sua vez, foram construídas com o propósito de renderizar gráficos, demonstrando grande eficácia em jogos e simulações. As GPUs são as mais semelhantes às NPUs, já que também são capazes de executar tarefas em paralelo e são amplamente utilizadas no treinamento de modelos de IA. No entanto, as NPUs, sendo projetadas exclusivamente para operações relacionadas à IA, se destacam em termos de velocidade e eficiência.

Nos primórdios da computação, quando não havia GPUs ou NPUs, as CPUs gerenciavam os gráficos por meio de renderização de software. Com o avanço tecnológico na década de 1990, as GPUs foram introduzidas para lidar com os gráficos através de hardware dedicado. Atualmente, estamos testemunhando a ascensão da era das NPUs.

Todos esses componentes computacionais foram desenvolvidos para tarefas especializadas, aliviando as CPUs da necessidade de gerenciar todas as operações, o que resulta em maior eficiência e desempenho. Embora as NPUs estejam ganhando popularidade, é importante observar que as GPUs ainda são amplamente utilizadas para o treinamento de modelos de IA, enquanto as NPUs têm se destacado na inferência, com o Google tendo treinado seu modelo Gemini integralmente em sua TPU.

Aplicações das NPUs em Laptops: Transformando a Experiência do Usuário

Inicialmente, as NPUs, ou aceleradores de hardware especializados em IA, eram utilizadas principalmente por grandes corporações para processamento paralelo. No entanto, atualmente, produtos de consumo, como laptops e smartphones, também integram NPUs. Por exemplo, os novos PCs Copilot+ da Microsoft incorporam uma NPU potente, que possibilita recursos como o Recall, que foi adiado, mas deverá ser lançado nos próximos meses.

O Recall captura capturas de tela, processa os dados localmente usando a NPU e cria um índice vetorial. Se o processamento fosse realizado pela CPU ou GPU, haveria um impacto significativo na duração da bateria. No entanto, com uma NPU dedicada, esses processos podem ser realizados de forma eficiente, sem comprometer a vida útil da bateria ou sobrecarregar a CPU ou GPU.

Além disso, as NPUs são responsáveis por impulsionar recursos como o Cocreator no MS Paint, a geração de imagens no aplicativo Fotos, a remoção de fundos de vídeos, a aplicação de efeitos visuais usando o Magic Mask no DaVinci Resolve, o redimensionamento de quadros em jogos, a aplicação de efeitos do Windows Studio, a geração de traduções e transcrições em tempo real, entre muitas outras funcionalidades.

Com o tempo, as aplicações das NPUs deverão se expandir ainda mais, liberando a CPU e a GPU de tarefas que poderiam torná-las mais lentas ou menos eficientes em termos de consumo de bateria.

A Apple, por sua vez, utiliza seu Neural Engine, ou NPU, para alimentar diversos recursos de inteligência artificial no iOS, iPadOS e macOS. O modelo de IA em tempo real utiliza o Neural Engine para resumir e-mails, priorizar notificações, gerar resumos de gravações de chamadas, criar imagens e muito mais. O novo Siri também se beneficia do Neural Engine para realizar uma variedade de tarefas de IA.

Considerações Finais

Em termos simples, a NPU representa um novo acelerador de hardware que abre novas possibilidades na era da inteligência artificial. Este é apenas o começo, e novas aplicações e experiências baseadas em NPUs se tornarão uma realidade no futuro próximo. À medida que a tecnologia continua a evoluir, a integração de NPUs em dispositivos será um marco fundamental, proporcionando melhor desempenho e eficiência energética, ao mesmo tempo em que impulsiona o avanço da inteligência artificial em todas as suas formas.