Midjourney vs. Firefly: Qual IA vence no “Inpainting”?

Uma análise comparativa entre as funcionalidades de pintura do Midjourney e do Adobe Firefly Generative Fill.

Estamos agora na segunda fase da criação de arte por inteligência artificial. Já não se trata apenas de gerar imagens a partir de descrições textuais. A capacidade destas ferramentas em auxiliar na modificação dessas imagens, através do que se conhece como “inpaint”, é o verdadeiro indicador de sucesso nesta área.

Os nossos concorrentes, Adobe e Midjourney, desenvolveram capacidades de pintura interna, e cabe-nos agora analisar e determinar um vencedor.

Para começar, o Midjourney é uma ferramenta premium, enquanto o Adobe Generative Fill pode ser experimentado sem custos.

Subscrevi o Midjourney e estou pronto para o acompanhar neste confronto.

Mas antes disso, vamos analisar como funciona a pintura interna em ambas as plataformas.

Pintura no Midjourney: Uma visão geral

Após a inscrição, aceda à aplicação Discord e escolha qualquer canal. Digite “/settings” no campo de texto e pressione Enter. Selecione o modo “Remix” na janela pop-up.

Agora, peça, refine a sua imagem preferida e clique em “Variar (Região)” para realizar a pintura seletiva.

Por fim, selecione a área desejada e solicite a pintura.

Esta ação irá gerar quatro resultados, que poderão ser aprimorados e refinados.

Preenchimento Generativo do Adobe Photoshop: Uma visão geral

Escolha a ferramenta “Texto para imagem” no Adobe Firefly, na tela inicial, para criar qualquer imagem a partir de texto.

Posteriormente, pode solicitar, selecionar um dos quatro resultados e avançar para o preenchimento generativo.

Pode selecionar a área desejada, pedir a pintura interna e clicar em “Gerar”.

Tal como no Midjourney, são geradas algumas versões que podem ser revistas e modificadas novamente.

Em geral, a interface do Adobe Generative Fill é muito mais intuitiva para iniciantes. Oferece opções de seleção e inversão de fundo com um único clique. Além disso, as opções “Adicionar” e “Subtrair” facilitam o trabalho.

Para esclarecer, “pintura interna” é um termo comum que define a tarefa em si. A terminologia “Preenchimento Generativo” da Adobe refere-se exatamente ao mesmo processo.

Agora que sabemos como utilizá-los, vamos prosseguir com a nossa pequena experiência.

Pintura no Midjourney vs. Preenchimento Generativo do Photoshop

O processo é simples. Usarei os mesmos prompts e selecionarei o melhor resultado para modificação. No final, poderá ver o impacto da pintura interna nas imagens selecionadas. Além disso, atribuirei uma pontuação de pintura a cada rodada para as contabilizar no final.

Solicitação 1

Um guerreiro de armadura no topo de um penhasco, olhando para um vasto exército, com o pôr do sol a lançar luz dourada sobre tudo.

Um ponto negativo para o Midjourney (à esquerda) por ignorar completamente a parte do exército.

Trabalho de pintura: Alterar o fundo para uma floresta exuberante.

Pintura no Midjourney

Surpreendentemente, o Midjourney também incluiu alguns soldados ao fundo. No que diz respeito à parte da floresta, depende de quão bem a ferramenta laço é usada para traçar os limites.

Como é feito manualmente, haverá sempre algumas irregularidades. Mesmo assim, avaliaria este trabalho como acima da média, dado que misturou muito bem a área em torno do guerreiro com o céu.

Pontuação de pintura: 7/10

Adobe Firefly

Descobri que não é possível desfazer a ação na interface do Adobe Generative Fill. Existe uma opção “Limpar”, após a qual se começa do zero. Um grande sinal de reprovação 👎 para a Adobe por esta falha.

O Firefly também realizou um trabalho aceitável ao mudar o fundo para uma floresta verde.

Ainda assim, a criação da Adobe parece menos natural. As árvores (exceto as próximas ao guerreiro) parecem “plantadas”. Além disso, embora a luz do sol venha do canto superior esquerdo, a tonalidade laranja em torno do guerreiro parece deslocada.

Pontuação de pintura: 5/10

Vencedor: Midjourney

Solicitação 2

Um jovem inventor a trabalhar arduamente numa oficina desordenada, rodeado de engenhocas científicas complexas.

De imediato, noto que o Midjourney tende a gerar imagens mais cinematográficas, enquanto o Adobe Firefly cria imagens mais realistas. Além disso, o Adobe Firefly tem dificuldades em retratar o corpo humano e a maioria das imagens parecem deformadas.

Trabalho de pintura: Colocar uma máscara de Homem-Aranha no rosto do cientista.

Pintura no Midjourney

Foi uma tarefa simples e o Midjourney fez um excelente trabalho. A máscara encaixa-se perfeitamente no rosto e parece saída de um filme do Homem-Aranha.

Pontuação de pintura: 10/10.

Adobe Firefly

Claramente, o Firefly não sabe nada sobre o Homem-Aranha e obteve um zero redondo.

Pontuação de pintura: 0/10

Vencedor: Midjourney

Solicitação 3

Uma alcateia de lobos cibernéticos a vaguear por uma densa floresta coberta de neve, com os olhos a brilhar ao luar.

O Midjourney parece perder um pouco o tema “cibernético”, enquanto a criação da Adobe parece caricatural. Ainda assim, esta última retratou claramente a “floresta de neve” e os lobos parecem mais robóticos.

Trabalho de pintura: Substituir os lobos por macacos a comer bananas.

Pintura no Midjourney

Apesar de uma ligeira deformação, a representação dos macacos é aceitável. No entanto, não consigo imaginar a comer as suas bananas, o que deveria ter sido fácil de conseguir.

Pontuação de pintura: 3/10

Adobe Firefly

Embora os macacos pareçam estranhos, pelo menos estão a segurar algo que se assemelha a uma banana. Ainda assim, poderia ter deixado os seus rostos um pouco mais claros.

Portanto, não é perfeito, mas é melhor do que o Midjourney neste caso.

Pontuação de pintura: 4/10

Vencedor: Adobe Firefly

Solicitação 4

Um extraterrestre a tocar guitarra sob um candeeiro de rua, com uma multidão de humanos a ouvir atentamente.

Ambos produziram imagens aceitáveis, com o Midjourney a manter a sua qualidade, que parece extremamente natural. 😀 As criações do Firefly sofreram novamente de distorção no rosto e nas mãos. Apenas ficariam bem se ignorássemos aquela criação absurda (canto inferior esquerdo).

Trabalho de pintura: Mudar o fundo para um dia ensolarado com um arco-íris.

Pintura no Midjourney

Este resultado desapontou. Nenhuma das imagens com pintura interna apresenta um arco-íris. Além disso, não sei por que o Midjourney mudou de cenários realistas para ambientes de desenhos animados.

O único aspeto positivo foi a ilustração do dia ensolarado.

Pontuação de pintura: 4/5

Adobe Firefly

O Firefly, por outro lado, interpretou o pedido literalmente. Até agora, é claro que a maioria dos preenchimentos generativos da Adobe não são visualmente agradáveis.

É um resultado um pouco artificial, que parece falso. Portanto, embora tenha tudo o que solicitei, a imagem final parece claramente “photoshopada”.

Pontuação de pintura: 5/5

Vencedor: Adobe Firefly

Solicitação 5

Um jardim mágico com um lago de chocolate, uma árvore de chocolate e uma flora e fauna encantadoras inspiradas no cacau.

Nenhuma das criações do Midjourney foi muito inspirada em chocolate, o que foi dececionante, visto que era um tema fácil de retratar.

Esta será a primeira vez nesta série de solicitações em que o Adobe Firefly fez tudo perfeitamente. Todas as imagens eram cativantes, dificultando a escolha de apenas uma.

Trabalho de pintura: Incluir uma fonte de baunilha.

Pintura no Midjourney

O Midjourney compensou a sua fraca representação de chocolate com uma profunda fonte de baunilha. Poderia haver muitas outras maneiras de o fazer, mas duvido que uma ferramenta de IA pudesse ter feito melhor.

Pontuação interna: 9/10

Adobe Firefly

Por último, temos uma saída de pintura do Firefly, que se enquadra bem no resto. Ainda assim, o Midjourney está ligeiramente à frente em termos de estética geral.

Pontuação de pintura: 8/10

Vencedor: Midjourney

Declarando o campeão da pintura interna!

O Midjourney (33/50) vence de forma convincente o Adobe Firefly (22/50). A razão que descobri é que a pintura interna do Midjourney é mais eficiente.

Por outro lado, o Firefly enfrenta problemas de mistura. As suas modificações parecem principalmente sobreposições, o que prejudica o objetivo da pintura interna. Além disso, parece que as saídas do Firefly têm algumas ligações com o Adobe Photoshop, o que pode ser bom, mas pode ser desvantajoso noutros casos. Além disso, precisa de melhorar a ilustração do corpo humano, pois a maioria dos casos apresenta algum grau de distorção.

Quanto ao Midjourney, a interface de utilizador não é tão intuitiva e tem o péssimo hábito de não levar as instruções muito a sério. Pode ignorar alguns aspetos da solicitação, especialmente os mencionados no final.

Com isto, deixo a decisão ao seu critério.

PS: Para mais opções, confira estes geradores de arte com IA.