158
Durante muito tempo, a geração de imagens foi uma das poucas áreas onde Gêmeos tinha uma vantagem sobre o ChatGPT. O modelo Imagen do Google gerou imagens mais realistas e seguiu melhor, enquanto o Dall · e costumava produzir imagens que pareciam mais a-i-ish e cartoonish. Mas isso está prestes a mudar.
Agora, o Google e o OpenAI estão lançando geradores de imagens nativas alimentadas por seus modelos multimodais de IA. Enquanto a versão de Gemini ainda está escondida dentro do estúdio de IA – a plataforma de teste beta do Google – o OpenAI lançou seu gerador de imagens nativo diretamente dentro do ChatGPT.
Aqui está a reviravolta. A versão de Gemini está disponível para todos gratuitamente, enquanto o OpenAI atrasou o lançamento para usuários gratuitos devido à demanda excessiva. Eu tentei os dois. E digamos que as mesas podem estar girando.
1. Mudando o estilo de uma imagem
Uma das maiores vantagens da geração de imagens nativas é que não se trata apenas de criar imagens do zero – também é ótimo em editar ou transformar as existentes. Depois do chatgpt, lançou esse recurso, X foi inundado com imagens no estilo de anime inspiradas no Studio Ghibli. Então eu decidi tentar o mesmo. Enviei uma foto de um cara no Chatgpt e Gemini, pedindo que eles a convertem em estilo Ghibli. Aqui está o que eu tenho:

Vamos apenas dizer isso claramente: Gêmeos luta para mudar completamente o estilo. Ele se apega principalmente à imagem original, geralmente apenas aumentando o brilho, independentemente do que você pergunta. Por outro lado, o chatgpt transforma a imagem – estilo anime, arte de pixel, personagens de lego, simpsons, animação no estilo 3D da pixar, você escolhe. Embora mude alguns detalhes, especialmente os rostos, o resultado geral está a quilômetros à frente de outros modelos.
Veredicto: Somente o ChatGPT pode transformar completamente uma imagem em um estilo diferente. Gerador de imagem nativo de Gêmeos atualmente fica aquém
2. Edição de pequenas mudanças no topo da imagem
É aqui que Gêmeos brilha. Enviei a mesma imagem para os dois modelos e pedi que adicionassem óculos. Aqui está o que aconteceu:

Ambos fizeram o trabalho – mas de maneiras diferentes. O chatgpt tende a redesenhar a imagem inteira, às vezes até alterando o rosto da pessoa. Por outro lado, Gêmeos simplesmente adiciona os óculos sem tocar em mais nada. Isso ocorre porque o ChatGPT ainda gera uma nova imagem baseada no original, enquanto Gêmeos pode fazer edições no topo do original. Da mesma forma, você também pode remover objetos, etc. em Gêmeos. As pessoas já estão usando esse recurso para remover marcas d’água e várias coisas loucas.
Veredicto: Gêmeos vence se você quiser edições limpas sem alterar a imagem original.
3. Gerando uma imagem de aparência realista do zero
Isso costumava ser um ponto fraco para o chatgpt – mas não mais. Pedi aos dois modelos que gerassem um close de um homem velho na casa dos 70 anos, vestindo um cardigã de lã macio sobre uma camisa branca. Aqui está o que eles criaram:

Ambos pregaram o prompt e estão praticamente a par. A imagem do ChatGPT é um pouco mais polida, enquanto a versão de Gemini parece mais realista, capturando imperfeições sutis da câmera e uma aparência natural. Chatgpt, por outro lado, se inclina para a perfeição – quase também Perfeito às vezes. No entanto, escolher um sobre o outro pode ser uma preferência pessoal.
Veredicto: Ambos os modelos podem gerar imagens realistas com facilidade.
4. Misturando duas imagens em uma
ChatGPT e Gemini agora permitem que você envie várias fotos de referência para gerar uma nova imagem. Neste teste, enviei uma foto de um homem e uma imagem separada de outro homem vestindo uma camisa verde. Finalmente, pediu aos dois modelos que gerassem uma foto do primeiro homem usando a camisa verde. Aqui está o que eu tenho:

O ChatGPT oferece bons resultados consistentemente bons. Gêmeos, no entanto, às vezes pula a cabeça ou produz uma imagem de baixa qualidade-mas essas falhas geralmente desaparecem com uma tentativa ou duas. Por outro lado, Gêmeos prega a cor da camisa com mais precisão, enquanto o ChatGpt introduz uma pequena variação.
Veredicto: O ChatGPT vence por consistência e qualidade geral. Mas Gêmeos não está muito atrás
5. Gere uma imagem com um ponto de vista diferente
O ChatGPT e Gemini também podem gerar imagens de um ponto de vista diferente. Para este teste, enviei uma foto do interior de um trem e pedi aos dois modelos que recriassem a cena do lado oposto.

Ambos entregaram resultados decentes, mas lutaram com a colocação de objetos, especialmente em imagens complexas com muitos elementos. Dito isto, se seguir esses detalhes não for importante e você está apenas procurando uma nova perspectiva de um assunto – como um carro ou um prédio – os modelos lidam bem com isso.
Veredicto: Ambos os modelos fizeram um trabalho decente, mas mexeram com a colocação de objetos.
6. Gerando um cartão de aniversário
Diz -se também que esses novos modelos são muito melhores na geração de imagens com texto – uma tarefa com a qual os modelos mais antigos costumavam lutar. Então, decidi testar isso gerando um cartão de aniversário com texto específico.

Surpreendentemente, ambos os modelos acertaram. Eles seguiram exatamente o prompt – usando o texto cursivo de “feliz aniversário” e o cercando com designs florais, exatamente como solicitado. O que parece melhor é realmente uma questão de gosto pessoal. Também tentamos gerar menus, cartazes, infográficos e outras imagens pesadas de texto-e os dois modelos os lidaram muito bem.
Veredicto: Gêmeos e ChatGPT agora podem gerar texto preciso e legível dentro das imagens e seguir os avisos de perto.
Gerador de imagem nativa Chatgpt vs Gemini
Em todos os nossos testes, alguns padrões se destacaram. O ChatGPT oferece consistentemente imagens de alta qualidade-detalhes mais nítidos, melhor composição e menos artefatos estranhos. Com Gêmeos, você geralmente precisa se regenerar algumas vezes antes de pousar em algo de bom. Dito isto, Gêmeos é visivelmente mais rápido. Ele pode produzir uma imagem em cerca de 10 segundos, enquanto o ChatGPT às vezes pode levar um minuto ou mais, mesmo para avisos simples.
Quando se trata de gerar visuais realistas, lidar com o texto em imagens ou mudar as perspectivas, ambos os modelos têm desempenho semelhante. Mas a diferença real aparece durante as edições. O ChatGPT é muito melhor em transformar o estilo geral de uma imagem, enquanto Gêmeos brilha quando você deseja adicionar ou remover objetos específicos sem alterar mais nada.
Geral: O ChatGPT oferece qualidade mais consistente e uma melhor experiência geral-se você não se importa com a espera.