Como fazer música AI com o MusicGen do Meta

A Meta lançou o código do MusicGen, outro gerador de música AI que pode transformar descrições de texto em melodias musicais. A demonstração pode ser encontrada online e você só precisa de um navegador para experimentá-la. Os resultados não são ruins, mas mais do que isso, demonstram o quão longe os modelos de música AI progrediram.

Aqui está o que você precisa saber sobre MusicGen e como gerar música.

O que é o MusicGen?

Em junho de 2023, a Meta lançou seu modelo de geração de música AI chamado MusicGen. Não é a primeira empresa a enfrentar o complexo problema de sintetizar música bruta a partir de uma simples descrição de texto; até agora, você pode criar música com o Jukebox do OpenAI ou gerar trechos de música com o MusicLM.

Mas é a primeira empresa a tornar o código de código aberto, permitindo que você execute o software localmente em seu computador se tiver uma GPU com no mínimo 16 GB de memória – embora tenhamos conseguido fazê-lo funcionar com apenas 11 GB.

Não se preocupe se você não tiver o hardware, porque você pode experimentar o aplicativo da web MusicGen gratuitamente usando um navegador. Na demonstração online, você pode esperar que leve pouco mais de um minuto para gerar um trecho de áudio com cerca de 12 segundos de duração.

  Executando o lançamento do Scrum – da preparação do conteúdo à implantação

Como o MusicGen soa?

De acordo com a Meta, o MusicGen pode produzir amostras de música de alta qualidade, embora tenhamos descoberto que os pesquisadores envolvidos definiram alta qualidade como 32kHz. Isso fica entre os requisitos de síntese de voz (16kHz) e o padrão para música digital (44,1kHz).

Na verdade, o áudio não atende aos padrões mínimos de qualidade que você costuma ouvir nas rádios ou plataformas de streaming. No entanto, em comparação com outros geradores de música AI, e considerando onde a tecnologia está no momento da escrita, a qualidade do áudio é razoavelmente boa com baixo nível de ruído no arquivo.

Quão perto a música se alinha com os prompts? Você pode ter uma noção rápida disso ouvindo os exemplos que geramos abaixo. De maneira geral, consegue aderir aos gêneros musicais populares, mantendo uma estrutura musical mais coerente em comparação com seus antecessores.

Como Gerar Música Usando o MusicGen

O MusicGen é fácil de usar e não requer inscrição. A interface também é direta, facilitando a experiência por diversão.

Veja como gerar música com o MusicGen:

  • Abra o Aplicativo da web MusicGen.
  • Na caixa de texto intitulada Descreva sua música, insira seu prompt. Você pode tentar algo tão simples como “melodia folclórica irlandesa” ou torná-lo mais detalhado, incluindo o instrumento, andamento, gênero ou emoção.
  • Pressione o botão Gerar para iniciar o processo. Depois de um ou dois minutos, um reprodutor de áudio aparecerá no módulo Música Gerada à direita.
  • Passe o mouse sobre o módulo para mostrar os controles do player e ouvir o arquivo ou pressione o ícone de download no canto superior direito para salvar o arquivo em seu computador. Observe que ele só está disponível para download como um arquivo .mp4.
  • Se você quiser tentar condicionar os resultados usando uma melodia existente, você pode carregar uma gravação no módulo ao lado da caixa de texto. Como alternativa, você pode selecionar Mic para gravar uma melodia usando seu microfone.
  •   As 8 principais ferramentas de anotação de vídeo para aprimorar seus dados visuais

    Condicionar uma melodia usará a descrição do texto e a melodia que você fornecer como referência. Esta é uma ferramenta útil para moldar os resultados que você obtém do MusicGen.

    Quais são as restrições ao uso do MusicGen Audio?

    O código do MusicGen é distribuído gratuitamente sob a licença do MIT com poucas restrições. Quanto ao áudio que você gera usando o modelo, não está claro se existem diretrizes legais. Em vez disso, você pode querer prestar atenção Alerta do Meta sobre o uso do MusicGen:

    “O modelo não deve ser usado para criar ou divulgar intencionalmente peças musicais que criem ambientes hostis ou alienantes para as pessoas. Isso inclui gerar músicas que as pessoas previsivelmente achariam perturbadoras, angustiantes ou ofensivas; ou conteúdo que propaga estereótipos históricos ou atuais”.

      5 melhores servidores de hospedagem Left 4 Dead 2 (L4D2) para melhor jogabilidade

    Meta explica ainda que MusicGen é destinado a pesquisadores que desejam explorar a geração de música AI e não para “usos downstream”, que presumimos significar atividades como upload e distribuição de música AI em plataformas de streaming.

    Os prós e contras éticos refletem a geração de arte da IA. Obter consentimento para usar dados para treinar modelos de IA, além do problema de compensar/creditar artistas quando apropriado, são motivos para a Meta jogar pelo seguro.

    Resumindo, é improvável que explorar o modelo por diversão cause danos, mas pode ser uma questão mais espinhosa quando se trata de usar áudio para música comercial. Muitas pessoas ficam se perguntando como será o futuro da música pop com IA.

    Adicionando mais um modelo de geração de música ao que está por aí, a Meta lançou o MusicGen, um modelo de IA de código aberto capaz de gerar música bruta a partir de uma simples descrição de texto. Se você está curioso sobre como testar a tecnologia, você pode dar uma olhada na demonstração usando apenas um navegador da web.