ChatGPT vs Gemini, la revancha de los generadores de imágenes
Hace unas semanas, ChatGPT actualizó su modelo de generación de imágenes... así que es hora de la revancha ante Nano Banana Pro, el actual campeón
Hace poco escribí un post comparando las imágenes de ChatGPT con las de Nano Banana Pro, de Gemini. (de verdad así se llama). Esa pelea la ganó Nano Banana Pro por KO.
Bueno, te cuento que luego de eso OpenAI actualizó el generador de imágenes de ChatGPT (deben haber leído mi post). Ahora, como buen promotor de box curioso, no podía dejar de darle la revancha. Así que hoy vamos a volver al ring a comparar estos modelos para ver si Nano Banana se mantiene en la cima o si ChatGPT puede arrebatarle el cinturón.
Nota: Para hacer imágenes con ChatGPT basta con el prompt, en el caso de Nano Banana Pro hay que usar el modo “Thinking” en Gemini.
ChatGPT 5.2 vs. Nano Banana Pro
Como en el post anterior, la idea es darle prompts interesantes (y sobre todo divertidos) y ver quién hace la mejor imagen.
Ahora sí, que empiece la pelea…
Round 1: texto en la imagen
Estos modelos son muy buenos incorporando texto dentro de las imágenes, parece que va a ser un asalto muy duro de juzgar.
El prompt
En la pelea pasada ambos modelos pudieron poner un texto largo en una pizarra, para este round hagamos algo diferente. Un par de chicos escribiendo con graffiti la frase: “Me encanta la carapulcra” en alguna pared del barrio de Barranco, en Lima - Perú
Fotografía realista de dos chicos de aproximadamente 20 años haciendo graffiti en una pared del barrio de Barranco, Lima, Perú. Están pintando la frase “Me encanta la carapulcra” con letras grandes, alegres y muy coloridas. El graffiti incorpora dos personajes de caricatura urbana estilo street art: figuras cool, expresivas, con estética moderna y urbana, similares a personajes de mural contemporáneo (ojos grandes, formas simples, actitud relajada), integrados de forma natural al diseño del graffiti. Colores vibrantes como amarillo, fucsia, celeste y verde. La escena ocurre de día, con luz natural suave. La pared tiene textura envejecida típica de Barranco y un entorno bohemio y artístico. Los chicos visten ropa urbana casual (poleras, zapatillas, jeans), se ven concentrados y sonrientes. Estética de fotografía callejera contemporánea, alta definición, profundidad de campo natural, colores ligeramente saturados. Aspecto completamente fotográfico, no ilustración, no estilo cartoon generalizado: solo los personajes del graffiti son caricaturescosEl graffiti de ChatGPT
La verdad es que ese graffiti parece más una imagen pegada con Photoshop… y encima de eso, mira la gorra del personaje en el graffiti a la izquierda, la pintura está literalmente en el aire. Nah!
El street art de Nano Banana
Me parece más natural, creo que se acomoda mejor al prompt que le di. Aunque tampoco es el graffiti más interesante que he visto… cumple.
Dato: Para los que no saben lo que es la carapulcra, no se preocupen, lo vamos a ver justamente en el siguiente round.
Round 2: las infografías
Durante la última pelea entre estos dos modelos, la infografía de Nano Banana Pro trapeó el piso con la que hizo ChatGPT, veamos si la cosa ha cambiado.
Aprovechemos para explicar qué es la carapulcra (plato peruano en base a papa seca, de mis favoritos).
El prompt
Es hora de plantear una infografía que explique lo que es la carapulcra, incluyendo cómo se prepara.
Hagámoslo con un prompt corto a ver cómo trabajan estos modelos.
Crea una infografía que muestre qué es la carapulcra y cómo prepararlaLa carapulcra de Nano Banana Pro
Creo que la receta va bien, y le puso arroz (lo que lo hace aún más peruano). Eso sí, la ilustración del plato está medio rara.
Puntos extra por incluir las variaciones, sobre todo por la mención al “Manchapecho”. Si no sabes lo que es, no te preocupes, lo vamos a ver en el siguiente round.
ChatGPT y su carapulcra
Esto sí es una gran mejora respecto a la versión anterior del generador de imágenes de ChatGPT. Aquí sí le está haciendo la competencia a la infografía creada en Gemini. Y aunque no mencionó las variaciones, sí le puso arroz; y eso, en mi libro, vale mucho.
OK, ahora como te lo había prometido, en el round 3 vamos a ver qué modelo hace la mejor imagen de un plato de “Manchapecho” (de paso que te enteras qué es eso).
Round 3: el “Manchapecho”
Es un plato que combina carapulcra (ya sabes lo que es eso) con sopa seca, una especie de fideos con un aderezo especial, todo esto servido con yuca sancochada y cerdo.
Lo que quiero hacer es pedirle a Nano Banana Pro y a ChatGPT que creen una imagen de ese plato, sin mayor explicación. Eso además nos servirá para saber qué tan buenos son cuando les ponemos un reto fuera de lo ordinario (dudo que hayan muchas imágenes de carapulcra con sopa seca en su set de entrenamiento).
Antes de pedirles la imagen, mejor te enseño cómo es ese plato, así tú también puedes juzgar:
Te presento la foto del manchapecho original, servido como se debe, saliéndose del plato. Admito que no es el plato más “aesthetic”, pero como alguna vez le escuché decir a alguien: “está recontra buenazo”.
Ahora que ya sabes cómo se ve el plato original, hagamos el prompt. Mantengámoslo plain and simple. Quiero la foto desde arriba de un plato de “Manchapecho” en una mesa de madera.
El prompt
Fotografía en formato 4:3, tomada desde arriba de un plato de manchapecho (plato tradicional peruano) servido en una mesa de madera.Nano Banana Pro
Estuvo cerca, y tiene algunos de los ingredientes. No se parece tanto al plato original, pero se nota que Gemini se esforzó (no como otros).
ChatGPT
WTF! Eso es arroz amarillo con frejoles, huevo frito y rodajas de limón!
El asistente de OpenAI acaba de insultar la gastronomía peruana… y ni siquiera me dio la foto en formato 4:3. Todo es culpa de Sam Altman.
Claramente nuestros asistentes tienen pequeños problemas cuando entran en contextos multiculturales (pero eso es otro post).
Es hora de pasar al siguiente asalto!
Round 4: retratos al estilo de Yousuf Karsh
Como te contaba en la pelea anterior, Yousuf Karsh es mi fotógrafo favorito. Su trabajo retrata personajes como Albert Einstein, Winston Churchill, Brigitte Bardot, Isaac Asimov, Martin Luther King Jr., Muhammad Ali, Audrey Hepburn, etc, etc.
En este asalto veremos si nuestros asistentes pueden imitar su estilo.
El prompt
Retrato en blanco y negro de [personaje], en el estilo de Yousuf KarshAhora es momento de elegir algunos personajes y ver qué tan buenos “fotógrafos” son.
Empecemos con…
David Hasselhoff
Personaje querido de la niñez, yo lo vi de chico en el Auto fantástico y luego como Mitch Buchannon en Baywatch.
Aquí están los retratos estilo Karsh de este ídolo de los 80s-90s.
El Hasselhoff de ChatGPT
Hasselhoff de Nano Banana Pro
hmmmm, está parecido… probemos con…
Dirk Benedict
¿No sabes quién es Dirk Benedict? Tal vez lo conozcas como Templeton Peck, “Face” o “Faz” de los Magníficos (la Brigada A, en España).
Faz era el guapo de los Magníficos, admito que siempre quise ser como él, pero nunca me salió 😅 (qué te puedo decir)
El de Nano Banana
Cool, creo que logra captar la esencia del personaje, se siente una foto real.
El de ChatGPT
Puede que estéticamente se vea bien, pero hay algo en esta foto que no me cuadra, no lo sé, pero si tuviera que elegir cuál de estas dos fotos fue hecha por un robot elegiría esta.
No puede faltar Tom Selleck (y su bigote)
Ya que estamos usando personajes de series de los 80s, no puede faltar Magnum. ¿Cuántas personas se habrán dejado el bigote por causa de Tom?
Creo que no hay mucho más que decir, ¿no?
El Magnum de Nano Banana Pro
Es un buen retrato, aunque no lo recordaba con el pelo tan lacio (tampoco recordaba que fumara, pero ¿quién no lo hacía en los 80s?). Buen intento de Gemini.
El bigote Magnum de ChatGPT
Este es el bigote, perdón, el Magnum que recordaba. Muy buen trabajo de ChatGPT en esta imagen.
Me acabo de dar cuenta que todas las poses que genera Nano Banana Pro son iguales, sobre todo eso de poner una mano sobre otra. Es algo raro, ¿no crees?
Bueno, luego de pasar por retratos al estilo Karsh de artistas de series de los 80s, suena la campana y es hora de pasar al último asalto.
Round 5: La gran aventura retro intergaláctica groovy del kung-fu
En la comparación pasada me inventé una película y les pedí a Gemini y a ChatGPT que creen el póster promocional.
El prompt
Crea el póster de la película: “La gran aventura retro intergaláctica groovy del kung-fu”. Es una película de acción que se desarrolla en el espacio, pero con tecnología humana de 1850. Los personajes usan ropa de la década de 1970 y todas las peleas son de kung-fu. Veamos cómo lo interpretan nuestros robots…
Nano Banana Pro:
ChatGPT:
¡Groovy! Y con eso se termina el quinto y último round de esta revancha, es hora de pasar a…
La decisión de los jueces
Como toda pelea de box, tres jueces deben dar el puntaje de cada round y así veremos cómo terminó la pelea.
Pues hoy somos sólo dos jueces (este es un substack low budget 😅) me acompaña mi amigo Diego García, un capo en ciencia de datos y amante del boxeo (y de Pokemón).
[Léase con voz de anunciador de ring]
Damas y caballeros, después de cinco rounds de pura adrenalina, vamos a las tarjetas de los jueces…
El juez García anotó 43/47…
Y el juez Martínez anotó 47/49…
Para el ganador por decisión unánime y… aún campeón… Nano “Banana” Pro.
[/Léase con voz de anunciador de ring]
Y esa fue la pelea de hoy, el creador de imágenes de Gemini sigue siendo un poquito mejor, aunque ChatGPT mejoró un montón con este update.
Nada más de mi lado, espero que te haya gustado el post.
Abrazo,
G
Nota: Un agradecimiento especial para Diego García Rieckhof por ayudarme a puntuar esta pelea. Si aún no lo lees, te recomiendo su Substack The Data Chronicles.



















Valió la pena la espera! Que buen post y tan didáctico! Pero ahora me dieron ganas de un pisco y de una causa limeña!
Y que nostalgia, Brigada A y Kit el auto fantástico. Excelente German!
Eh probado mucho tanto chatgpt como nano banana, pero hay momentos de ambos, cada quien tiene un estilo demasiado bueno, yo uso las dos y combinó resultados