Até agora, o Midjourney foi considerado o melhor gerador de imagens de IA, e com razão. No entanto, um novo modelo de código aberto chamado Flux.1 foi lançado pelo Black Forest Labs e rapidamente se tornou uma sensação para a geração de imagens fotorealistas. Neste comparativo entre Flux e Midjourney, vamos verificar qual ferramenta é melhor na geração de imagens, retratando características humanas e oferecendo resultados bastante surreais. O realismo das fotos geradas é realmente notável.
últimas postagens
O que é o gerador de imagens de IA Flux?
Flux.1 é um modelo de IA de código aberto para geração de imagens, desenvolvido por ex-engenheiros e pesquisadores da Stable Diffusion. Sob a nova startup de IA chamada Black Forest Labs, três novos modelos do Flux.1 foram lançados. O modelo Flux.1 [pro] é o modelo de ponta, destinado apenas para uso comercial.
Sem dúvidas, as imagens de IA mais realistas que já vi.
Estamos 99,7% próximos de imagens de IA completamente indistinguíveis da realidade.
(Você ainda pode ver alguns defeitos ao ampliar)
Isso foi feito com o FLUX. Uncanny Valley. pic.twitter.com/5BIRmZey8B— Roberto Nickson (@rpnickson) 8 de agosto de 2024
Os modelos Flux.1 [dev] e Flux.1 [schnell] são de código aberto e a comunidade de IA já melhorou os modelos para a geração de imagens fotorealistas. Com um adaptador Realism LoRA, o modelo Flux.1 [dev] é capaz de gerar imagens visualmente realistas e as mãos são retratadas sem nenhuma distorção ou artefato.
Para testar o modelo de IA Flux.1, o comparamos com o Midjourney v6.1. Utilizamos o modelo FLUX Realism LoRA no fal.ai (visite) para sujeitos humanos e o FLUX.1 [pro] (visite) para imagens cênicas. Aqui está a comparação entre Flux e Midjourney usando os mesmos prompts.
Flux vs Midjourney: Geração de Imagens
1. Uma Mulher Viaja ao Amanhecer
No primeiro conjunto de imagens, você pode notar que a imagem gerada pelo Flux é mais fotorealista. Apesar de usar o parâmetro –style raw no Midjourney, ele produziu uma imagem com aparência de cartoon.
FluxMidjourney
2. Um Casal Idoso em um Parque
Novamente, a saída do Flux é mais realista e crível do que o resultado do Midjourney. A imagem do Midjourney se assemelha a uma pintura, enquanto o Flux gera uma representação vívida.
FluxMidjourney
3. Imagem de um Chef
Neste teste, ambas as imagens geradas pelo Flux e pelo Midjourney não passaram no teste de percepção. Ambas as imagens parecem ter sido geradas por IA, mas o resultado do Midjourney demonstra um melhor manuseio de reflexos e iluminação.
Midjourney
4. Um Castelo Fantástico
Neste caso, eu escolheria a saída do Flux, pois retrata imagens saídas de um conto de fadas. A imagem gerada pelo Midjourney também é bastante detalhada.
Midjourney
5. Uma Cidade Futurista à Noite
Este seria um empate, mas a imagem do Flux é um pouco mais limpa, enquanto o Midjourney gerou uma imagem visualmente mais complexa.
Midjourney
6. Um Jornal com Letras Legíveis
Por fim, na renderização de texto, tanto o Flux quanto o Midjourney se saíram muito bem. Esta é uma área onde os modelos de síntese de imagem enfrentam dificuldades, mas é um bom sinal que um modelo de código aberto possa competir com um modelo fechado como o Midjourney.
Midjourney
Vencedor: Flux
Flux vs Midjourney: Preços
Agora, falando sobre preços, sabemos que o Flux é gratuito e de código aberto, mas para executar o modelo localmente, você precisará de especificações robustas com uma GPU dedicada. Afinal, é um modelo de 12 bilhões de parâmetros. A melhor maneira de executar o Flux em hardware local é através do Pinokio (site). Baixe o aplicativo e comece com o Flux.
Além disso, há muitos provedores de serviços que permitem gerar imagens usando o modelo Flux gratuitamente. No entanto, isso vem com créditos gratuitos limitados ou a geração de imagens pode levar um tempo considerável, dependendo da carga do sistema.
Você pode acessar o HuggingFace (site) para usar o modelo Flux.1 [dev] gratuitamente. Além disso, você pode verificar o fal.ai (site) onde modelos LoRA também estão disponíveis, mas você só recebe créditos no valor de $1 gratuitos. Após isso, será necessário comprar mais créditos com base no seu uso.
Quanto ao Midjourney, é caro e custa $10 por mês quando cobrado mensalmente. Mas a parte boa é que a geração de imagens é bastante rápida e você recebe uma interface muito atrativa.
Vencedor: Flux
Flux vs Midjourney: Recursos
Como o Flux é um novo modelo, ele não oferece muitos recursos de edição de imagem de IA imediatamente. Mas há serviços como o BasedLabs (site) que permitem escalar imagens e definir a proporção. Você também pode escolher quantas imagens deseja gerar de uma só vez. E se você for um usuário técnico, pode brincar com valores de semente, contagem de etapas e configurações de redução de ruído.
O Midjourney, por outro lado, é mais rico em recursos e suporta muitos recursos. Para começar, você pode definir a proporção, escolher sua estética e estilização. Você pode até usar modelos mais antigos do Midjourney e criar imagens com aparência natural usando a opção Raw.
Além disso, após a criação de uma imagem, você pode escolher escalá-la, aumentar o zoom e adicionar mais detalhes, fazer inpainting usando a ferramenta de laço, reformulá-la e muito mais. Basicamente, você pode modificar uma imagem executando novos prompts, o que é incrível. Portanto, para necessidades de inpainting e outpainting, o Midjourney oferece mais ferramentas e controles do que o Flux, até o momento.
Vencedor: Midjourney
Flux vs Midjourney: Credenciais de Conteúdo
Se você é um artista, deve querer que o serviço suporte o padrão de Credenciais de Conteúdo. Isso ajuda a encontrar informações sobre a origem da imagem e se ela foi modificada. Infelizmente, nem o Midjourney nem o Flux suportam o padrão de Credenciais de Conteúdo. Esses serviços não adicionam nenhum tipo de metadados verificáveis às suas imagens geradas por IA.
Vencedor: Nenhum
Assim, concluímos nossa comparação entre Flux e Midjourney. Fiquei muito impressionado com o modelo Flux, que se mostra uma alternativa viável e gratuita ao Midjourney. A comunidade de código aberto pode aprimorá-lo e adicionar recursos como inpainting e outpainting. De qualquer forma, isso é tudo de nós. Se você tiver alguma pergunta, deixe-nos saber nos comentários abaixo.