Adicione legendas aos seus vídeos com Python, OpenAI Whisper e FFmpeg!

Foto do autor

By luis

Introdução

Com a expansão do conteúdo em formato de vídeo, a inclusão de legendas se tornou um fator crucial para ampliar a acessibilidade, permitindo que pessoas com deficiência auditiva ou que falam outros idiomas possam desfrutar do conteúdo. A tarefa de gerar e incorporar legendas aos vídeos pode ser complexa e exigir muito tempo, mas com os avanços recentes em aprendizado de máquina e ferramentas de processamento de vídeo, esse processo pode ser automatizado.

Este guia detalhado explicará como usar Python, o modelo OpenAI Whisper e o FFmpeg para criar e adicionar legendas aos seus vídeos de forma eficiente e precisa. Através de exemplos de código claros e instruções passo a passo, você poderá facilmente integrar legendas em seus vídeos, enriquecendo a experiência do público.

Instalação das Dependências

Para iniciar, você necessitará instalar as seguintes ferramentas:

  • Python 3.6 ou versões posteriores
  • OpenAI Whisper
  • FFmpeg
  • Um editor de texto ou IDE (como Visual Studio Code ou PyCharm)

Para instalar o OpenAI Whisper, utilize o seguinte comando no seu terminal:

pip install openai

Geração de Legendas com OpenAI Whisper

O OpenAI Whisper é um modelo de aprendizado profundo de última geração, capaz de gerar transcrições de áudio de alta fidelidade. Para usá-lo na geração de legendas, siga os seguintes passos:

Autenticação com OpenAI

Antes de utilizar o Whisper, você precisa obter uma chave de API no site do OpenAI. Crie uma conta em https://beta.openai.com/account/api-keys e gere sua chave.

Carregando o Modelo Whisper

Importe o módulo Whisper e carregue o modelo de linguagem (LLM):


import openai
openai.api_key = "SUA_CHAVE_DE_API"
model = openai.Model("text-bison-001")

Reconhecimento de Fala no Vídeo

Para reconhecer a fala no seu vídeo, utilize o método recognize:


resultado = model.recognize(video_path, language="pt")

Este comando retornará um dicionário contendo o texto transcrito e os instantes de tempo de cada palavra.

Adicionando Legendas ao Vídeo com FFmpeg

Após a geração das legendas, você pode incorporá-las ao seu vídeo utilizando o FFmpeg, uma ferramenta poderosa para manipulação de vídeo que possibilita a sobreposição de texto em vídeos.

Criação do Arquivo de Legendas

Crie um arquivo de texto com extensão .srt contendo as legendas. Cada linha do arquivo deve seguir o seguinte padrão:


<número_da_legenda>
<horário_inicial> --> <horário_final>
<texto_da_legenda>

Onde:

  • número_da_legenda: um número sequencial para cada legenda.
  • horário_inicial e horário_final: os instantes de início e fim da legenda no formato hh:mm:ss,mmm.
  • texto_da_legenda: o texto da legenda.

Sobrepondo as Legendas no Vídeo

Para sobrepor as legendas no vídeo, execute o seguinte comando:

ffmpeg -i video.mp4 -vf "subtitles=legendas.srt" legendado.mp4

Este comando criará um novo arquivo de vídeo (legendado.mp4) com as legendas inseridas.

Considerações Finais

Com a combinação de Python, OpenAI Whisper e FFmpeg, o processo de gerar e adicionar legendas aos seus vídeos torna-se automatizado e simplificado. Este guia apresentou instruções detalhadas para a instalação das dependências necessárias, a criação de legendas precisas e a sua integração perfeita nos seus vídeos. Ao tornar seus vídeos mais acessíveis e envolventes, você pode atingir um público mais amplo e aprimorar a experiência do espectador.

Perguntas Frequentes

1. Quais são as vantagens de usar o OpenAI Whisper para gerar legendas?

  • Maior precisão e velocidade em comparação com abordagens convencionais.
  • Suporte para diversos idiomas.
  • Modelo treinável e atualizado com dados recentes.

2. O uso do OpenAI Whisper é gratuito?

Não, o OpenAI Whisper é um serviço pago. É necessário criar uma conta e adquirir créditos para utilizar o modelo.

3. É possível usar o FFmpeg para adicionar legendas a vídeos já legendados?

Sim, você pode adicionar legendas adicionais com o FFmpeg, mas será preciso ajustar manualmente os tempos e a numeração das legendas.

4. Qual o formato de arquivo recomendado para legendas?

O formato .srt é o mais comum e com maior compatibilidade para legendas.

5. Há alguma alternativa ao FFmpeg para adicionar legendas a vídeos?

Existem outras ferramentas de manipulação de vídeo, como HandBrake e Avidemux, que também oferecem a funcionalidade de adicionar legendas.

6. Como posso melhorar a precisão das legendas?

  • Utilize arquivos de áudio de alta qualidade com o Whisper.
  • Utilize uma versão mais avançada do modelo Whisper, como o text-bison-002.
  • Realize ajustes manuais nas legendas geradas, se necessário.

7. É possível personalizar a aparência das legendas?

Sim, você pode personalizar a aparência das legendas através do FFmpeg. Consulte a documentação do FFmpeg para mais detalhes.

8. Como solucionar problemas com a geração ou adição de legendas?

  • Verifique se todas as dependências foram instaladas corretamente.
  • Verifique a configuração correta da chave API do OpenAI.
  • Certifique-se de que o arquivo de legendas esteja formatado corretamente.
  • Tente usar uma versão diferente do FFmpeg ou uma ferramenta alternativa de manipulação de vídeo.