¿Quién hace mejores imágenes, ChatGPT o Gemini?
La pelea entre el generador de imágenes de OpenAI y Nano Banana Pro de Google (en serio, así se llama).
En marzo de este año, ChatGPT mejoró muchísimo en creación de imágenes, y desde ese día lo he venido usando con muy buenos resultados (hasta escribí un post sobre eso). De hecho, la mayoría de las imágenes que presento en mis posts son creadas con ChatGPT.
Luego, en agosto Google lanzó su generador de imágenes en Gemini y le puso Nano Banana (gran nombre, Google, gran nombre). Bueno, resulta que nano banana funcionó bastante bien, tanto que de vez en cuando lo uso para crear imágenes. Por ejemplo, todas las imágenes de mi post anterior fueron creadas con esta herramienta de Google.
De hecho pensaba en algún momento hacer un post sobre Nano Banana, pero no estaba demasiado emocionado por hacerlo… Y pensaba que eso se iba a quedar así, hasta que hace 5 días Google lanzó Nano Banana Pro (¿a lo iPhone?) y la gente se volvió loca usándolo. De la nada empece a ver una cantidad gigante de ejemplos alucinantes en Twitter, LinkedIn y aquí mismo en Substack.
La verdad es que yo aún no lo pruebo, así que creo que es la oportunidad perfecta para comparar los dos modelos de creación de imágenes y ver si es verdad tanta maravilla.
Nota: Para acceder a Nano Banana Pro, tienes que activar al modo de pensamiento “thinking” en Gemini y pedirle que cree una imagen. That’s it.
Nano Banana Pro vs. ChatGPT
Lo que voy a hacer es crear prompts que me parezcan interesantes y divertidos, dárselos a ambos modelos y ver qué sale. Así de simple :)
Empecemos!
La prueba de la pizarra (y el texto)
Uno de los grandes problemas de estos generadores siempre fue que los textos no salían bien en las imágenes. ChatGPT hizo una gran mejora al respecto y lo mostró con texto escrito en una pizarra.
Hagamos una prueba así y veamos qué pasa.
El prompt
Foto tomada con un teléfono en horizontal de una pizarra de vidrio en una sala con vista al Malecón de Miraflores. En el encuadre se ve a una mujer escribiendo en la pizarra, usando una camiseta blanca con el logo y robot de Aprendiendo IA impreso (imagen adjunta).
La letra se ve natural y un poco desordenada, y se ve el reflejo del fotógrafo en el vidrio.
En el lado izquierdo de la pizarra se lee, con escritura a mano:
"Ingredientes del cau cau:
- 1½ kilos de mondongo
- 1 cucharada de ajo molido
- 1 taza de cebolla roja picada
- 1 taza de ají amarillo licuado
- Sal
- Pimienta blanca
- Comino
- Palillo
- 2 papas blancas grandes o 4 medianas
- Hierbabuena picada
- 2 cucharadas de ají amarillo crudo licuado"
En el lado derecho de la pizarra se lee:
"Cocina el mondongo hasta que esté muy tierno y córtalo en trozos. Haz un aderezo con ajo, cebolla, ají amarillo, sal, pimienta blanca, comino y palillo. Agrega el mondongo y luego las papas en cubos con hierbabuena picada. Cocina hasta que las papas estén listas. Ajusta la sal y termina con más hierbabuena y el ají amarillo crudo licuado."
En la esquina inferior derecha del pizarrón la mujer termina de escribir:
"I ❤️ cau cau".
Ambiente realista, iluminación natural, vista clara hacia el acantilado y el mar del Malecón de Miraflores.El cau cau de Gemini
La imagen se generó muy rápidamente y me gustó.
Está el texto, pero no parece escrito a mano. También se ve el reflejo del fotógrafo y del malecón de Miraflores (por si te animas a visitar Lima-Perú), también quedó bonito el robot de aprendiendo IA.
Bien jugado, Google…. te doy un 8/10
La receta de cau cau de ChatGPT
Por su parte, nuestro querido ChatGPT se demoró un montón en sacar esta imagen.
Me gusta el texto, lo veo mucho más natural que el de Gemini, el robot del aprendiendo IA está algo cambiado y además le agregó un texto al polo que no le pedi (aunque me gusta, creo que voy a mandar a hacer uno). El malecón de Miraflores se ve bien, aunque el ángulo me parece un poco raro, sobre todo por la posición del fotógrafo.
No está mal, pero le doy un 6.5/10
Infografías
Una de las cosas de las que se jacta Nano Banana Pro es de poder crear muy buenas infografías con un prompt sencillo. Veamos quien hace la mejor…
El prompt
Crea una infografía que muestre cómo preparar cau cauChatGPT y su “infografía”
Creo que no hay mucho que decir, aquí más que… meh!
Sorry ChatGPT, parece que las infografías no son lo tuyo, o al menos no con un prompt tan sencillo. 2/10
La infografía de Gemini
Now we’re talking!
Se nota la diferencia. Aunque hay algunos textos en inglés y no se de donde sacó el perejil, esta infografía está muuuuuucho más completa que la que creó ChatGPT.
Hasta me dijo de qué fuentes había sacado la receta. Me imagino que con un par de ajustes estaría lista para ser compartida.
Muy bien hecho, Nano Banana Pro, la próxima recuerda que el cau cau es mejor si no lleva zanahoria ni arvejas… 8.5/10
Juguemos con retratos
Mi fotógrafo favorito es Yousuf Karsh, un genio del retrato. Karsh es el autor de fotografías icónicas de Albert Einstein, Winston Churchill, Audrey Hepburn, Martin Luther King y un largo etc. De todas formas las has visto.
Me pregunto como podrían estos modelos hacer un retrato al estilo Karsh… probemos!
El prompt
Retrato en blanco y negro de [personaje], en el estilo de Yousuf KarshVoy a elegir algunos personajes y veremos lo que hacen Gemini y ChatGPT con ellos, veamos como les salen…
Mario Baracus, a lo Karsh
Empecemos por Mr. T, o como lo conocemos por aquí los que vimos Las Magníficos, Mario Baracus. (En otros países la serie se llamaba La Brigada A).
La versión de ChatGPT
Interesante, aunque no parece muy “Karshiana”, si me permites decirlo. De alguna manera da la impresión de ser un poco artificial, como plástico.
No es una imagen mala, pero no tiene lo que estoy buscando, 6/10
Aquí Mr. T, por Gemini
Esta sí se acerca más al estilo que estaba buscando, aunque el formato 16:9 de la imagen lo delata.
Buen trabajo, Nano Banana Pro: 8.5/10
¿Y si jugamos con Yoda?
Soy fan de la guerra de las galaxias, así que se me ocurrió hacer un retrato del gran Yoda.
Yoda, by Nano Banana Pro
Me gustó. En palabras del Jedi más poderoso de todos:
Hmmm, la IA buena imitación de Karsh, hace….
– Yoda
Puntaje 9/10, a esta imagen le pongo.
Yoda, by ChatGPT ¿?
No quiso jugar, que dice su mamá que no lo deja hacer imágenes de Yoda.
0/10 ChatGPT una imagen de Yoda no puede hacer
¿Podrán retratarme a mi?
Me entró la duda así que me tomé este selfie y le pedi a ambos asistentes que creen un retrato mio estilo Karsh usando el selfie de referencia.
ChatGPT
Pensé que me iba a pasar lo mismo que con Yoda, ya que falló varias veces con diferentes mensajes de error. Luego de unos 15 intentos, cuando estaba a punto de rendirme, por fin creó la imagen.
Es muy muy muy muy parecida al selfie y además le sigue dando un toque artificial. Parece que le faltó algo de inspiración… 4.5/10
Nano Banana Pro
No tuvo ningún problema en generar la imagen, además con muy buen estilo. Aunque creo que me sumó algunos años. ¿o será que me veo así de viejo y me niego a aceptarlo?
Bueno, por más viejo que me vea, la imagen está buena. le doy un 9/10.
Una última prueba
¿Que más podremos probar?
¿Y si me invento una película y le pido un poster?
Buena idea!
Hagamos que la película sea de acción…
en el espacio, pero con tecnología humana de 1850…
Que los personajes usen ropa de la década de 1970 y…
que todas las peleas sean de kung-fu.
Ahora a ponerle titulo: “La gran aventura retro intergaláctica groovy del kung-fu”
Ni Tarantino!!!! ;)
Prompt
Crea el poster de la película:
“La gran aventura retro intergaláctica groovy del kung-fu”.
Es una película de acción que se desarrolla en el espacio, pero con tecnología humana de 1850.
Los personajes usan ropa de la década de 1970 y todas las peleas son de kung-fu.Veamos qué pasa.
Nano Banana Pro:
Es una película que iría a ver (aunque los posters suelen ser verticales).
ChatGPT:
Me gusta este poster, pero se olvidó de la “I” en “INTERGALÁCTICA”.
¿Quien gana?
Aquí la elección la dejo a tu criterio, ponle puntaje en los comentarios ;)
Suena la campana…
Terminó la pelea, es hora de la decisión de los jueces del juez (o sea yo).
[Léase con voz de presentador del ring]
Damas y caballeros, luego de diez asaltos de combate por el cinturón del campeón del mundo depeso completogeneración de imágenes, vamos a la decisión del juez.El juez Martinez, marca un puntaje 43/50 a 19/50 para el vencedor y… nuevo campeón… Gemini “Nano Banana Pro”!
Y eso concluye la pelea de hoy, seguramente en algún tiempo habrá revancha, o un nuevo retador. Ya veremos.
Abrazo,
G

















Muy bueno el post. Me quedo con el Nano pro, sobre todo por la integración de texto. Pero para el cartel de la película elijo a GPT. Un cartel en horizontal es dañino para la vista! Jajajajajaja.
Buena comparación