Si bien Gemini es excelente para realizar inmersiones profundas en temas aleatorios y ayudar a dar sentido a su bandeja de entrada de Gmail desordenada, no tiene que verse mucho más allá si también desea usarlo como un generador de imágenes AI líder.
Impulsado por el modelo Imagen 3 de Google, uno de los mejores generadores de imágenes de IA, Gemini promete detalles ricos y imágenes impresionantes basadas en sus indicaciones de texto. Desde la creación de imágenes fotorrealistas hasta diseños intrincados, no hay muchas indicaciones que Gemini no pueda manejar.
Saber lo que Gemini maneja bien puede ayudarlo a crear mejores imágenes para sus presentaciones, sitio web o uso personal. Tiende a funcionar mejor con imágenes fotorrealistas y indicaciones que son más largas y más detalladas.
Para obtener los mejores resultados, aquí hay cinco ejemplos de inmediato con los que puede comenzar.
1. El instructor de yoga
(Imagen: © Guía de Tom)
Si bien la mayoría de las imágenes que cree en Géminis probablemente tendrán un tema principal, es importante incluir suficientes detalles en sus indicaciones para describir claramente lo que está haciendo el tema y dónde se encuentran.
Comencé mi aviso con una descripción general de la escena, luego agregué detalles como el atuendo del instructor de yoga y una descripción general de la configuración al aire libre.
Este es el aviso que usé: “Cree una imagen de un instructor de yoga al aire libre. El instructor de yoga lleva una parte superior blanca y de fondo verde y está parado en el borde de un acantilado rocoso. El instructor está en la pose de la lámpara creciente. El sol se pone sobre un océano vasto y tranquilo. Vemos un tiro medio de ancho con un lente de 35 mm”.
El resultado alcanzó todas las notas correctas, aunque el zoom revela algunos problemas con los ojos y los pies del instructor.
2. Robot diorama
(Imagen: © Guía de Tom)
A continuación, quería probar los límites de longitud rápida y complejidad. Me propuse crear una escena de diorama de títeres de fieltro de una oficina, incluidos varios elementos clave.
Usé el siguiente mensaje: “Cree una imagen de una escena de diorama de títeres de fieltro de un edificio de oficinas abarrotada. Una vista de pasajero del espacio de la oficina revela un lindo robot caminando. El robot está sosteniendo una pila de papeles. Una taza de café está encima de la pila de papeles.
El robot se mueve de un lado de la habitación forrada con monitores de computadora al otro lado de la habitación que alberga una larga mesa de madera. Hay cajas de pizza abiertas en esta mesa de madera. El piso alfombrado tiene un diseño de zigzag. Varias pinturas de diferentes animales adornan las paredes “.
El personaje principal era un robot que balanceaba una taza de café en una pila de papeles. Un lado de la oficina presentaba computadoras, mientras que el otro tenía una mesa con pizzas. Para colmo, también solicité que el piso alfombrado tenga un patrón en zigzag.
En cuestión de segundos, Gemini generó exactamente lo que describí. En esta prueba, la limitación principal fue mi propia imaginación: no estaba completamente seguro de cómo quería que se viera la escena. Pero Géminis entregó y llenó los huecos para mí.
Incluso agregó un par de sillas de oficina, algunas plantas y una basura para completar el aspecto de la oficina. ¿Qué tan genial es eso?
3. Iluminación del estado de ánimo
(Imagen: © Guía de Tom)
Una de las características generadoras de imágenes de Gemini que destaca Google es su capacidad para retratar una iluminación más rica. Entonces, por supuesto, tuve que probar este reclamo con el aviso a continuación:
“Crear una imagen de un estudiante está estudiando dentro de su apartamento de Tokio. Un joven estudiante está sentado en un escritorio y está estudiando desde un libro de texto abierto. El libro está iluminado por una sola lámpara de escritorio de estilo industrial.
El escritorio se empuja contra una gran ventana que domina una concurrida calle Tokio iluminada por coloridas luces de neón. Las gotas de lluvia están salpicadas por la ventana, brillando en las luces de neón. Use un estilo fotográfico realista “.
Para esta imagen generada por la IA, quería que el aviso creara una escena de un estudiante sentado dentro de su apartamento de Tokio. Me concentré en tres elementos de iluminación principales: iluminación interior y exterior y la interacción de la luz con las gotas de lluvia.
La lámpara de mesa está claramente iluminando el libro y la cara del estudiante, ya que el resto de la habitación permanece oscura. Afuera bajo la lluvia, las luces de neón emiten un ligero brillo mientras establecen la escena de la ciudad.
Las gotas de lluvia en la ventana se toman diferentes tonos de púrpura y azul mientras reflejan la luz que viene del exterior.
Géminis también agregó un toque extra, con dos vigas de los faros de un automóvil apuntando directamente a la ventana.
4. Generación de texto
(Imagen: © Guía de Tom)
Imagen 3, la generación de imágenes que alimenta el modelo AI en Gemini, también ofrece representación de texto mejorada en las imágenes, una característica útil que puede ahorrarle el paso adicional de edición en otra aplicación solo para agregar texto básico.
Para este aviso, su objetivo era crear un póster de película que fuera estéticamente atractivo e incluía el título de la película:
“Cree un póster de película al estilo de Hollywood. El póster presenta una toma fotorrealista de un detective masculino y femenino que se queja detrás de un automóvil deportivo de lujo. El estilo de la imagen es el cine negro.
Asegúrese de que el único texto en el póster sea el título de la película y los nombres de los actores. El título de la película es “AI Legends”. Los actores de la película se llaman “Jane Smith” y “John Doe”. El título de la película está en la parte inferior del póster. Los nombres de los actores están en la cima “.
Impresionantes detectives? Controlar. ¿Coche elegante? Controlar. ¿Correcto ortografía? Erm. no exactamente. Estaba más o menos allí, por lo que con un par de intentos adicionales podrías obtener un mejor resultado de Géminis.
Intentar ser lo más claro posible con el texto que desea que presente y dónde debe colocarse en el póster parece ayudar. Pero como puede ver en nuestra prueba, el resultado no siempre es perfecto.
5. Paisaje
(Imagen: © Guía de Tom)
Por último, quería crear una escena impresionante que pudiera usar como papel tapiz de escritorio. ¿Qué mejor imagen para crear que nuestro propio cielo nocturno estrellado?
Le pedí a Géminis una larga foto de exposición de la Vía Láctea y el chatbot no decepcionó. La solicitud de foto de larga exposición significó que las estrellas parecían animadas y vibrantes revelando el brillo de la galaxia.
Este fue el aviso que usé: Crea una imagen de un paisaje HD. Es una larga foto de exposición de la Vía Láctea en un cielo nocturno estrellado. La foto está tomada desde el medio del Gran Cañón. Filmado en una cámara profesional con alto contraste y una composición cinematográfica.
La Vía Láctea contiene alrededor de 100 mil millones de estrellas, un número tanto Géminis como yo no podemos comprender. Pero Géminis logró crear un paisaje impresionante y tranquilo.
Al jugar con el aviso a continuación, puede personalizar aún más la escena. Podría, por ejemplo, elegir una ubicación diferente para que la foto de IA se tome o juegue con diferentes lentes y configuraciones de cámara.
Ahora que has aprendido sobre estas indicaciones para Gemini, ¿por qué no revisar nuestros otros artículos de IA?
Asegúrese de consultar la investigación Gemini Deep de Google ahora es gratuita: 7 consejos rápidos para comenzar a usarla ahora. Y si eres un usuario de ChatGPT, no te pierdas estos 11 consejos para obtener mejores resultados y no me vendieron en ChatGPT, hasta que probé estas 5 indicaciones.