Alternativas ao Sora da OpenAI para Geração de Vídeos a Partir de Texto
A ferramenta de texto para vídeo Sora, desenvolvida pela OpenAI, causou grande impacto, comparável ao lançamento do ChatGPT. Sua capacidade de criar vídeos de alta qualidade a partir de descrições textuais é impressionante, embora não seja inédita, e ainda não está totalmente disponível. Caso você esteja buscando alternativas ao Sora, por qualquer motivo, existem diversas opções a considerar.
MAKEUSEOVÍDEO DO DIA
-
Plano Gratuito:
125 créditos -
Plano Padrão:
US$ 15/mês (US$ 12 no plano anual) por 625 créditos mensais
O Gen-2 da Runway se aproxima mais da experiência que se teria com o Sora da OpenAI. Ele utiliza um sistema de IA multimodal para gerar videoclipes a partir de instruções textuais.
Os recursos do Gen-2 da Runway incluem a possibilidade de fazer upload de imagens ou vídeos que sirvam de referência para o videoclipe desejado. Ainda não se sabe se o Sora da OpenAI também oferecerá suporte à criação de vídeos a partir de imagens ou clipes de referência.
Analisando a qualidade dos clipes gerados pelo Sora, divulgados pela OpenAI, o Sora se destaca em relação ao Runway Gen-2 como um gerador de texto para vídeo com IA. No entanto, considerando o rápido avanço na área de IA (e o fato de que o Runway lançou o Gen-2 cerca de um ano antes da prévia do Sora), é claro que tanto o Sora quanto o Runway Gen-2 (e suas futuras versões) competirão pelo título de melhor gerador de IA de texto para vídeo.
-
Plano Gratuito:
250 créditos iniciais (30 créditos gratuitos diariamente após o uso dos créditos iniciais) -
Plano Padrão:
US$ 10/mês (US$ 8 no plano anual) por 700 créditos mensais
O Pika é outro gerador de vídeo com IA que pode criar vídeos e animações 3D a partir de texto e imagens. Ele está disponível tanto em sua plataforma web quanto no Discord. No entanto, a plataforma usada influencia a qualidade do resultado e os recursos adicionais disponíveis.
A plataforma web permite modificar áreas específicas do clipe gerado, expandir a tela do vídeo e adicionar sincronização labial. Esses recursos não estão disponíveis na versão do servidor Discord.
Recomenda-se experimentar as duas opções, web e Discord, para avaliar qual oferece os melhores resultados. O clipe abaixo foi gerado na versão web do Pika, utilizando o mesmo texto do vídeo viral “Lady Walking in Tokyo” do OpenAI Sora:
Uma mulher elegante caminha por uma rua de Tóquio, repleta de luzes de neon e placas animadas. Ela veste uma jaqueta de couro preta, um vestido longo vermelho, botas pretas e carrega uma bolsa preta. Usa óculos de sol e batom vermelho. Sua caminhada é confiante e casual. A rua está úmida e reflexiva, criando um efeito espelho das luzes coloridas. Vários pedestres caminham ao redor.
Usar o mesmo texto (/create + texto) no servidor Discord do Pika gerou o seguinte resultado:
A avaliação de qual é melhor fica a seu critério. No entanto, é evidente que o Pika precisa melhorar em comparação à qualidade dos clipes gerados pelo Sora. Contudo, seus outros recursos, como sincronização labial e animação de imagens, representam uma vantagem sobre o Sora, pelo menos por enquanto.
O Pixverse é mais uma alternativa ao Sora que permite criar vídeos realistas a partir de descrições textuais. Ele também oferece duas plataformas para criação: a web e o servidor Discord.
A plataforma web do Pixverse oferece uma experiência mais completa, permitindo criar, visualizar, filtrar e editar todos os vídeos gerados.
O vídeo acima foi gerado na versão web do Pixverse. Embora seja possível regenerar para obter melhores resultados (e é gratuito!), a versão do servidor Discord tem a vantagem de gerar quatro clipes simultaneamente. Isso oferece a opção de escolher o melhor sem precisar regenerar várias vezes. Abaixo está um exemplo gerado no servidor Discord:
Você pode acessar o Servidor Discord do Pixverse e gerar seus clipes utilizando o comando /create. É possível selecionar a proporção e o aviso negativo (se necessário) para seus vídeos.
Em termos de qualidade, o Pixverse se equipara ao Pika – ficando abaixo do Sora.
-
Plano Gratuito:
100 créditos iniciais -
Plano Explorador:
US$ 5/mês por 300 créditos
O Kaiber é uma ferramenta de geração de vídeo com IA focada em artistas. Ele permite criar vídeos a partir de imagens ou descrições textuais.
O Kaiber também oferece suporte à reatividade de áudio, o que significa que é possível fazer o upload de uma música e a IA gera um vídeo que acompanha o ritmo e o clima da música. Você pode personalizar a duração, as dimensões, os movimentos da câmera e o quadro inicial do seu vídeo. O Kaiber pode ser usado na web ou por meio de seus aplicativos móveis.
O maior diferencial do Kaiber é sua capacidade de gerar clipes que se sincronizam com o ritmo das músicas enviadas. Seus recursos focados em artistas também o ajudam a se destacar em relação ao Sora. No entanto, em termos de realismo do clipe gerado, o Sora ainda é superior.
-
Plano Gratuito:
Vídeo de teste -
Plano Iniciante:
US$ 29/mês (US$ 22 no plano anual) por 10 minutos de vídeo
O Synthesia é um gerador de texto para vídeo com IA que permite criar vídeos falados realistas a partir de roteiros textuais. É possível escolher entre diversos avatares, planos de fundo e idiomas para personalizar seu vídeo.
O Synthesia se diferencia do Sora por não gerar elementos visuais do zero, mas sim por utilizar imagens existentes e modificá-las para acompanhar o texto. O Synthesia também se limita a vídeos falados, enquanto o Sora pode gerar qualquer tipo de vídeo a partir de texto.
O Synthesia é uma boa alternativa ao Sora para criar vídeos atraentes e personalizados para fins educacionais, de marketing ou entretenimento.
-
Plano Gratuito:
1 minuto/dia -
Plano Iniciante:
US$ 19,99 (US$ 14,99 no plano anual) por 10 minutos de vídeos sem marca d’água
O Vidnoz é outro gerador de vídeo com IA que cria vídeos falados a partir de roteiros textuais. Ele utiliza processamento de linguagem natural (PNL) e visão computacional para gerar sincronização labial e expressões faciais realistas para os avatares. Também permite personalizar a aparência, roupas e acessórios dos avatares.
O Vidnoz AI é similar ao Synthesia em termos de funcionalidade, mas oferece mais opções de personalização ao criar seu vídeo de teste gratuito. É possível escolher entre avatares e vozes, algo que o Synthesia não oferece.
Se o que aconteceu após o lançamento do ChatGPT pela OpenAI servir de indicativo, podemos esperar o surgimento de mais plataformas de texto para vídeo com IA. Também é provável que o Lumiere do Google e o Make-A-Video da Meta se tornem acessíveis ao público em geral.