Por muito tempo, o Midjourney reinou como o principal gerador de imagens com IA, e com razão. Contudo, um novo concorrente de código aberto, o Flux.1, desenvolvido pelo Black Forest Labs, emergiu e rapidamente se tornou notável por sua capacidade de criar imagens incrivelmente realistas. Neste comparativo entre o Flux e o Midjourney, analisaremos qual ferramenta se destaca na geração de imagens, na reprodução de detalhes humanos e na produção de resultados surpreendentemente surreais. O nível de realismo nas fotografias criadas é, de fato, impressionante.
O que é o Gerador de Imagens IA Flux?
Flux.1 é um modelo de inteligência artificial de código aberto, voltado para a geração de imagens, desenvolvido por ex-engenheiros e pesquisadores da Stable Diffusion. Sob a nova startup de IA, Black Forest Labs, foram lançados três modelos distintos do Flux.1. O Flux.1 [pro] é o modelo de maior desempenho, destinado ao uso comercial.
Sem dúvida, essas são as imagens de IA mais realistas que já presenciei.
Estamos a apenas 0,3% de alcançar imagens de IA totalmente indistinguíveis da realidade.
(Pequenos defeitos ainda podem ser notados ao ampliar as imagens)
Este resultado foi obtido com o FLUX. Sensação do Vale da Estranheza. pic.twitter.com/5BIRmZey8B— Roberto Nickson (@rpnickson) 8 de agosto de 2024
Os modelos Flux.1 [dev] e Flux.1 [schnell] são de código aberto e a comunidade de IA já realizou melhorias nos modelos, elevando a capacidade de gerar imagens hiper-realistas. Ao integrar um adaptador Realism LoRA, o modelo Flux.1 [dev] consegue criar imagens visualmente convincentes, com representações das mãos sem quaisquer distorções ou imperfeições.
Para testar o potencial do modelo de IA Flux.1, realizamos uma comparação com o Midjourney v6.1. Utilizamos o modelo FLUX Realism LoRA no fal.ai (visite) para retratos humanos, e o FLUX.1 [pro] (visite) para imagens de paisagens. A seguir, apresentamos a comparação entre o Flux e o Midjourney, utilizando os mesmos prompts.
Flux vs Midjourney: Geração de Imagens
1. Uma Mulher se Deslocando ao Amanhecer
No primeiro conjunto de imagens, é notório que a imagem gerada pelo Flux demonstra um maior nível de realismo. Apesar do uso do parâmetro –style raw no Midjourney, ele produziu uma imagem com aparência de desenho animado.
Flux
Midjourney
2. Um Casal Idoso em um Parque
Mais uma vez, a saída do Flux revela-se mais realista e verossímil quando comparada ao resultado do Midjourney. A imagem produzida pelo Midjourney assemelha-se a uma pintura, enquanto o Flux apresenta uma representação mais autêntica.
Flux
Midjourney
3. Imagem de um Chef
Neste teste, ambas as imagens geradas pelo Flux e pelo Midjourney não alcançaram o ideal em termos de percepção. Ambas aparentam ter sido geradas por IA, contudo o resultado do Midjourney demonstra uma melhor gestão de reflexos e iluminação.
Midjourney
4. Um Castelo Fantástico
Neste cenário, a saída do Flux se sobressai, exibindo imagens que parecem extraídas de um conto de fadas. A imagem produzida pelo Midjourney também se destaca por seu elevado nível de detalhe.
Midjourney
5. Uma Cidade Futurista à Noite
Esta comparação resultaria em um empate, embora a imagem do Flux se destaque pela sua nitidez, enquanto o Midjourney gerou uma imagem visualmente mais complexa.
Midjourney
6. Um Jornal com Letras Legíveis
Finalmente, na renderização de texto, tanto o Flux quanto o Midjourney demonstraram bom desempenho. Esta é uma área onde os modelos de síntese de imagem geralmente enfrentam dificuldades, sendo um sinal promissor que um modelo de código aberto consiga competir com um modelo proprietário como o Midjourney.
Midjourney
Vencedor: Flux
Flux vs Midjourney: Custos
No que diz respeito aos custos, o Flux se apresenta como uma opção gratuita e de código aberto. Entretanto, para executar o modelo em nível local, são necessárias especificações avançadas, incluindo uma GPU dedicada, visto que se trata de um modelo de 12 bilhões de parâmetros. A melhor abordagem para rodar o Flux em hardware local é através do Pinokio (site). Baixe o aplicativo e comece a usar o Flux.
Ademais, existem diversos provedores de serviços que oferecem a geração de imagens utilizando o modelo Flux de forma gratuita. No entanto, essas ofertas costumam incluir créditos limitados ou podem apresentar um tempo de espera considerável para a geração das imagens, dependendo do carregamento do sistema.
Você pode acessar o HuggingFace (site) para utilizar o modelo Flux.1 [dev] de forma gratuita. Além disso, pode consultar o fal.ai (site) onde também estão disponíveis modelos LoRA, oferecendo um crédito inicial de $1. Após este valor, será preciso adquirir mais créditos com base na sua utilização.
Por outro lado, o Midjourney tem um custo de $10 por mês quando a cobrança é feita mensalmente, o que o torna uma opção mais dispendiosa. O lado positivo é que a geração de imagens é relativamente rápida, além de oferecer uma interface de usuário muito agradável.
Vencedor: Flux
Flux vs Midjourney: Funcionalidades
Sendo um modelo recente, o Flux não disponibiliza uma variedade de funcionalidades de edição de imagem com IA. Contudo, existem serviços como o BasedLabs (site) que possibilitam ajustar a escala das imagens e definir a proporção. Também é possível escolher quantas imagens gerar de uma só vez. Para utilizadores mais técnicos, é possível explorar valores de semente, contagem de passos e configurações de redução de ruído.
O Midjourney, por outro lado, apresenta uma gama mais ampla de funcionalidades e suporta diversas ferramentas. Para começar, é possível definir a proporção, selecionar a estética e o estilo desejados. Há também a opção de usar modelos mais antigos do Midjourney, criando imagens com aparência natural através da opção Raw.
Além disso, após a geração de uma imagem, é possível escalá-la, aumentar o zoom e detalhamento, aplicar inpainting utilizando a ferramenta de laço, reformulá-la, e muito mais. Em resumo, você pode modificar uma imagem executando novos prompts, o que é uma vantagem notável. Consequentemente, para funcionalidades de inpainting e outpainting, o Midjourney oferece um leque mais vasto de ferramentas e controles do que o Flux, pelo menos até o presente momento.
Vencedor: Midjourney
Flux vs Midjourney: Credenciais de Conteúdo
Se você é um artista, é desejável que o serviço suporte o padrão de Credenciais de Conteúdo. Este recurso possibilita verificar a origem de uma imagem e se ela foi alterada. Infelizmente, tanto o Midjourney quanto o Flux não dão suporte ao padrão de Credenciais de Conteúdo. Estes serviços não adicionam metadados verificáveis às imagens geradas com IA.
Vencedor: Nenhum
Concluímos assim o nosso comparativo entre o Flux e o Midjourney. Fiquei extremamente impressionado com o modelo Flux, que se apresenta como uma alternativa viável e gratuita ao Midjourney. É possível que a comunidade de código aberto o aprimore e adicione funcionalidades como inpainting e outpainting. De qualquer forma, ficamos por aqui. Se tiver alguma pergunta, deixe o seu comentário abaixo.