Descubra o Segredo dos Apps de Identificação Musical: Como o Shazam Funciona?

Aplicativos que reconhecem músicas podem parecer um truque de mágica, mas na verdade utilizam algoritmos sofisticados capazes de encontrar qualquer música em segundos. Vamos explorar como essa tecnologia funciona.

O Enigma da Identificação Musical

Quem nunca passou por isso? Em um restaurante agradável, num café aconchegante ou passeando numa loja, de repente, uma música interessante começa a tocar. Pode ser uma canção já conhecida ou algo inédito. Nesse instante, pegamos o celular, abrimos o Shazam e apontamos para o alto-falante. Rapidamente, o app revela o nome da música, o artista e onde podemos ouvi-la novamente.

Esses aplicativos são rápidos, muito precisos e conseguem identificar até mesmo as músicas mais raras. Basicamente, eles isolam a música de uma gravação e a procuram em um vasto banco de dados. A tecnologia por trás disso é bastante complexa e admirável.

Pode surpreender que o Shazam, como o conhecemos hoje, surgiu em 2002, e o sistema já era quase tão preciso e rápido quanto agora. Isso tudo graças a um algoritmo único que revolucionou o mundo da música.

Além da Letra

Inicialmente, apps como o Shazam parecem ser simples. A impressão é que eles apenas escutam a letra, como um assistente de voz, e fazem uma busca em um banco de dados de letras para encontrar a música.

Contudo, a maioria dos apps de identificação musical consegue identificar tanto músicas instrumentais quanto covers de uma música. Isso ocorre porque, em vez de analisar a letra, eles procuram “impressões digitais” únicas de cada música em seu extenso banco de dados.

A Tecnologia das Impressões Digitais

É provável que você utilize dispositivos que desbloqueiam através da sua impressão digital, que são os padrões das linhas em seu dedo, exclusivos para cada pessoa. De maneira similar, ao gravar um pequeno trecho de uma música, esse clipe é transformado em padrões de dados que o Shazam ou outro aplicativo pode comparar com seu banco de dados.

À primeira vista, este método parece cheio de desafios. Na maioria das vezes que ouvimos música em público, há ruídos e distorções causadas pelos alto-falantes, o que poderia dificultar a identificação ou levar a resultados errados. Além disso, há uma grande quantidade de dados em um pequeno clipe de áudio, o que poderia tornar a busca desses padrões em um banco de dados de milhões de músicas muito lenta.

Em uma entrevista com a Scientific American em 2003, Avery Li-Chun Wang, cientista de dados e cofundador do Shazam, explicou como seu algoritmo soluciona esses problemas. As informações de um clipe de áudio podem ser visualizadas num gráfico 3D, conhecido como espectrograma, que representa a variação das frequências ao longo do tempo. Ele também considera a amplitude, que é o volume do som. Isso é mostrado num espectrograma através da intensidade da cor.

Assim como nós não percebemos um som a não ser que esteja numa determinada frequência, em vez de considerar a música completa na busca, o Shazam foca apenas nos “picos”, que são as partes de maior energia num trecho de áudio. As impressões digitais capturadas utilizam os pontos de frequência mais alta dentro de um período de tempo e, em seguida, os pontos de maior amplitude nessas frequências.

Em um artigo de pesquisa para a Universidade Columbia, Wang afirmou que o método remove a maioria das partes desnecessárias de um clipe de áudio, como o ruído, e limpa a distorção. Isso também torna as impressões digitais pequenas o suficiente para permitir a identificação de uma música em seu enorme banco de dados em apenas alguns milissegundos.

O Impacto do Shazam

Além de serem úteis para pessoas que querem descobrir qual música estão ouvindo, os aplicativos de identificação musical também ajudam a moldar o cenário musical.

Rádios e serviços de streaming usam dados sobre o que as pessoas estão pesquisando no Shazam para entender quais músicas estão sendo mais ouvidas pelo público. Isso mostra o quão cativante e popular uma música pode ser, independentemente do artista. Ao identificar uma música com o app, você vê quantas outras pessoas também tentaram identificá-la.

Desde o sucesso do Shazam, vários concorrentes surgiram. O Soundhound, por exemplo, afirma conseguir identificar uma música apenas ao cantá-la ou murmurá-la, mas com resultados variáveis. Além disso, há identificadores de música integrados a assistentes de voz, como o Google Assistente, que funcionam de maneira muito similar ao Shazam.