A Meta apresentou o MusicGen, mais um sistema de inteligência artificial para a criação de música, capaz de transformar descrições textuais em melodias. Uma demonstração online permite a qualquer pessoa experimentar a ferramenta, utilizando apenas um navegador. Os resultados, embora ainda não impecáveis, revelam o considerável progresso dos modelos de IA na geração musical.
A seguir, exploraremos os detalhes do MusicGen e o processo de geração de música com esta ferramenta.
O Que É o MusicGen?
Em junho de 2023, a Meta lançou o MusicGen, seu modelo de IA para a criação de música. Embora não seja a primeira iniciativa na área – já existem o Jukebox da OpenAI e o MusicLM, que também geram música a partir de texto – a Meta se destaca por disponibilizar o código-fonte do seu modelo. Isso possibilita a execução do software localmente, em computadores equipados com placas gráficas (GPU) com pelo menos 16 GB de memória (embora alguns tenham conseguido rodá-lo com 11 GB).
Quem não possui o hardware necessário pode experimentar o MusicGen gratuitamente através de um aplicativo web. A demonstração online gera trechos de áudio de cerca de 12 segundos em pouco mais de um minuto.
Qual a Qualidade Sonora do MusicGen?
Segundo a Meta, o MusicGen produz amostras musicais de alta qualidade, embora a definição de “alta qualidade” utilizada pelos pesquisadores seja de 32kHz. Essa frequência situa-se entre os padrões de síntese de voz (16kHz) e de música digital (44,1kHz).
O áudio gerado pelo MusicGen pode não atingir os níveis de qualidade habituais nas rádios e plataformas de streaming. Contudo, considerando o estado atual da tecnologia, a qualidade sonora é consideravelmente boa, com baixo nível de ruído, e comparável a outros geradores de música IA.
A fidelidade da música gerada em relação aos prompts é notável. Os exemplos abaixo ilustram essa capacidade. Em geral, o modelo consegue reproduzir gêneros musicais populares, mantendo uma estrutura musical mais coesa em comparação com as soluções anteriores.
Como Gerar Música com o MusicGen
O MusicGen é de fácil utilização, não requerendo cadastro. A interface é intuitiva, tornando a experiência simples e divertida.
Passos para gerar música com o MusicGen:
- Acesse o aplicativo web do MusicGen.
- Na caixa de texto “Descreva sua música”, insira o seu prompt. Pode ser algo simples como “melodia folclórica irlandesa” ou mais detalhado, incluindo instrumentos, andamento, gênero ou emoção.
- Clique no botão “Gerar” para iniciar o processo. Após um ou dois minutos, um reprodutor de áudio surgirá no módulo “Música Gerada”, à direita.
- Passe o cursor sobre o módulo para exibir os controles do reprodutor, ou clique no ícone de download no canto superior direito para salvar o ficheiro no seu computador, que será um ficheiro .mp4.
- Opcionalmente, pode-se condicionar os resultados utilizando uma melodia existente, carregando uma gravação no módulo adjacente à caixa de texto, ou gravando uma melodia com seu microfone através da opção “Mic”.
A utilização de uma melodia como referência, combinada com a descrição textual, permite moldar os resultados obtidos pelo MusicGen, sendo uma ferramenta útil para ajustar a criação musical.
Quais as Restrições de Uso do Áudio Gerado pelo MusicGen?
O código do MusicGen é distribuído sob a licença MIT, com poucas restrições. No entanto, o uso do áudio gerado não possui diretrizes legais claras. A Meta alerta, no aviso sobre o uso do MusicGen, que:
“O modelo não deve ser usado para criar ou divulgar intencionalmente peças musicais que criem ambientes hostis ou alienantes para as pessoas. Isso inclui gerar músicas que as pessoas previsivelmente achariam perturbadoras, angustiantes ou ofensivas; ou conteúdo que propaga estereótipos históricos ou atuais”.
A Meta enfatiza que o MusicGen é destinado a pesquisadores interessados em explorar a geração de música por IA, e não para “usos downstream”, referindo-se a atividades como o upload e distribuição de música gerada por IA em plataformas de streaming.
As considerações éticas sobre a geração de arte por IA são válidas. A obtenção de consentimento para o uso de dados no treino dos modelos e a questão da compensação e crédito a artistas são razões para a Meta ter cautela.
Em resumo, a exploração do modelo para diversão não deve causar problemas, mas o uso comercial do áudio pode ser mais problemático. Questiona-se como será o futuro da música popular com a utilização da IA.
Com a adição do MusicGen ao leque de modelos de criação musical, a Meta disponibiliza uma ferramenta de código aberto capaz de gerar música a partir de descrições textuais. Para quem está curioso em experimentar a tecnologia, uma demonstração está acessível através de um navegador web.