Há um novo campeão em geradores de imagens por IA?

Até agora, o Midjourney foi considerado o melhor gerador de imagens de IA, e com razão. No entanto, um novo modelo de código aberto chamado Flux.1 foi lançado pelo Black Forest Labs e rapidamente se tornou uma sensação para a geração de imagens fotorealistas. Neste comparativo entre Flux e Midjourney, vamos verificar qual ferramenta é melhor na geração de imagens, retratando características humanas e oferecendo resultados bastante surreais. O realismo das fotos geradas é realmente notável.

O que é o gerador de imagens de IA Flux?

Flux.1 é um modelo de IA de código aberto para geração de imagens, desenvolvido por ex-engenheiros e pesquisadores da Stable Diffusion. Sob a nova startup de IA chamada Black Forest Labs, três novos modelos do Flux.1 foram lançados. O modelo Flux.1 [pro] é o modelo de ponta, destinado apenas para uso comercial.

Sem dúvidas, as imagens de IA mais realistas que já vi.

Estamos 99,7% próximos de imagens de IA completamente indistinguíveis da realidade.

(Você ainda pode ver alguns defeitos ao ampliar)

Isso foi feito com o FLUX. Uncanny Valley. pic.twitter.com/5BIRmZey8B— Roberto Nickson (@rpnickson) 8 de agosto de 2024

Os modelos Flux.1 [dev] e Flux.1 [schnell] são de código aberto e a comunidade de IA já melhorou os modelos para a geração de imagens fotorealistas. Com um adaptador Realism LoRA, o modelo Flux.1 [dev] é capaz de gerar imagens visualmente realistas e as mãos são retratadas sem nenhuma distorção ou artefato.

Para testar o modelo de IA Flux.1, o comparamos com o Midjourney v6.1. Utilizamos o modelo FLUX Realism LoRA no fal.ai (visite) para sujeitos humanos e o FLUX.1 [pro] (visite) para imagens cênicas. Aqui está a comparação entre Flux e Midjourney usando os mesmos prompts.

Flux vs Midjourney: Geração de Imagens

1. Uma Mulher Viaja ao Amanhecer

No primeiro conjunto de imagens, você pode notar que a imagem gerada pelo Flux é mais fotorealista. Apesar de usar o parâmetro –style raw no Midjourney, ele produziu uma imagem com aparência de cartoon.

FluxMidjourney

2. Um Casal Idoso em um Parque

Novamente, a saída do Flux é mais realista e crível do que o resultado do Midjourney. A imagem do Midjourney se assemelha a uma pintura, enquanto o Flux gera uma representação vívida.

FluxMidjourney

3. Imagem de um Chef

Neste teste, ambas as imagens geradas pelo Flux e pelo Midjourney não passaram no teste de percepção. Ambas as imagens parecem ter sido geradas por IA, mas o resultado do Midjourney demonstra um melhor manuseio de reflexos e iluminação.

Midjourney

4. Um Castelo Fantástico

Neste caso, eu escolheria a saída do Flux, pois retrata imagens saídas de um conto de fadas. A imagem gerada pelo Midjourney também é bastante detalhada.

Midjourney

5. Uma Cidade Futurista à Noite

Este seria um empate, mas a imagem do Flux é um pouco mais limpa, enquanto o Midjourney gerou uma imagem visualmente mais complexa.

Midjourney

6. Um Jornal com Letras Legíveis

Por fim, na renderização de texto, tanto o Flux quanto o Midjourney se saíram muito bem. Esta é uma área onde os modelos de síntese de imagem enfrentam dificuldades, mas é um bom sinal que um modelo de código aberto possa competir com um modelo fechado como o Midjourney.

Midjourney

Vencedor: Flux

Flux vs Midjourney: Preços

Agora, falando sobre preços, sabemos que o Flux é gratuito e de código aberto, mas para executar o modelo localmente, você precisará de especificações robustas com uma GPU dedicada. Afinal, é um modelo de 12 bilhões de parâmetros. A melhor maneira de executar o Flux em hardware local é através do Pinokio (site). Baixe o aplicativo e comece com o Flux.

Além disso, há muitos provedores de serviços que permitem gerar imagens usando o modelo Flux gratuitamente. No entanto, isso vem com créditos gratuitos limitados ou a geração de imagens pode levar um tempo considerável, dependendo da carga do sistema.

Você pode acessar o HuggingFace (site) para usar o modelo Flux.1 [dev] gratuitamente. Além disso, você pode verificar o fal.ai (site) onde modelos LoRA também estão disponíveis, mas você só recebe créditos no valor de $1 gratuitos. Após isso, será necessário comprar mais créditos com base no seu uso.

Quanto ao Midjourney, é caro e custa $10 por mês quando cobrado mensalmente. Mas a parte boa é que a geração de imagens é bastante rápida e você recebe uma interface muito atrativa.

Vencedor: Flux

Flux vs Midjourney: Recursos

Como o Flux é um novo modelo, ele não oferece muitos recursos de edição de imagem de IA imediatamente. Mas há serviços como o BasedLabs (site) que permitem escalar imagens e definir a proporção. Você também pode escolher quantas imagens deseja gerar de uma só vez. E se você for um usuário técnico, pode brincar com valores de semente, contagem de etapas e configurações de redução de ruído.

O Midjourney, por outro lado, é mais rico em recursos e suporta muitos recursos. Para começar, você pode definir a proporção, escolher sua estética e estilização. Você pode até usar modelos mais antigos do Midjourney e criar imagens com aparência natural usando a opção Raw.

Além disso, após a criação de uma imagem, você pode escolher escalá-la, aumentar o zoom e adicionar mais detalhes, fazer inpainting usando a ferramenta de laço, reformulá-la e muito mais. Basicamente, você pode modificar uma imagem executando novos prompts, o que é incrível. Portanto, para necessidades de inpainting e outpainting, o Midjourney oferece mais ferramentas e controles do que o Flux, até o momento.

Vencedor: Midjourney

Flux vs Midjourney: Credenciais de Conteúdo

Se você é um artista, deve querer que o serviço suporte o padrão de Credenciais de Conteúdo. Isso ajuda a encontrar informações sobre a origem da imagem e se ela foi modificada. Infelizmente, nem o Midjourney nem o Flux suportam o padrão de Credenciais de Conteúdo. Esses serviços não adicionam nenhum tipo de metadados verificáveis às suas imagens geradas por IA.

Vencedor: Nenhum

Assim, concluímos nossa comparação entre Flux e Midjourney. Fiquei muito impressionado com o modelo Flux, que se mostra uma alternativa viável e gratuita ao Midjourney. A comunidade de código aberto pode aprimorá-lo e adicionar recursos como inpainting e outpainting. De qualquer forma, isso é tudo de nós. Se você tiver alguma pergunta, deixe-nos saber nos comentários abaixo.