Noticias

Gemini Robotics: A new era of AI-Powered Robots

Published

6 días ago

25 marzo, 2025

Introduction

In March 2025, Google DeepMind introduced Gemini Robotics, a groundbreaking technology set to revolutionize how robots interact with humans in both industrial and domestic environments.

Until now, robots commonly used in factories have been designed with a primary focus on task efficiency, executing specific jobs as quickly and precisely as possible. These machines operate much like the mechanical components of a car, where every action is carefully timed and optimized for efficiency. However, traditional industrial robots assume a static environment, meaning they do not monitor or adapt to changes around them. They are unable to detect obstacles, such as a person crossing their path, which is why they are typically enclosed within safety cages to prevent accidents.

Gemini Robotics aims to change this paradigm by integrating advanced AI, enabling robots to perceive, adapt, and interact dynamically with their surroundings, making them safer and more versatile for real-world applications.

However, the nature of work is changing rapidly. For example, in the automotive industry, vehicle models are evolving in increasingly shorter cycles. This means that production chains must adapt quickly, making highly specialized machines less cost-effective in the long run.

Additionally, challenges arise when robots need to share a workspace with other similar robots. When relying on a basic approach based on predefined task lists and rigid workarounds, coordination and efficiency can become major obstacles.

In a factory, machines are not the only ones at work. Not all tasks can be fully automated due to cost constraints or the need for flexibility. This is where the concept of Cobots (Collaborative Robots) comes into play. A Cobot is a type of robot specifically designed to work alongside humans in a shared workspace, rather than operating autonomously or in isolation like traditional industrial robots.

However, designing Cobots presents new challenges, particularly in ensuring human safety. These robots must be capable of detecting collisions with both humans and other machines within their environment. As a result, they need to dynamically adjust their movements based on real-time conditions. For example, it is common for a Cobot to reduce its working speed when a human approaches too closely, minimizing the risk of accidental contact.

How Gemini Robotics differs from previous approaches

Google DeepMind aims to leverage its most advanced AI models, such as Gemini 2.0, to help robots better understand the physical world. The goal is to develop generalist robots capable of executing various tasks with the same programming while ensuring safety when working alongside humans in dynamic environments.

According to DeepMind, Gemini Robotics has been tested on a wide range of tasks and has demonstrated the ability to tackle challenges it had never encountered during training. For instance, previous robots AI trained only to stack blocks would struggle if asked to arrange items in a fridge. In contrast, Gemini Robotics harnesses the broad reasoning capabilities of Gemini 2.0, enabling it to process novel instructions. In technical evaluations, it more than doubled performance on a comprehensive generalization benchmark, surpassing other state-of-the-art models in adapting to new situations.

Another key differentiator is real-time interactivity. Built on a powerful language model, Gemini can understand instructions given in everyday language and even follow along in a conversation. If a user interrupts a robot mid-task and says, “Actually, place that item on the top shelf instead,” the Gemini system can adjust on the fly. It continuously monitors both its environment and instructions, ensuring it doesn’t blindly execute a plan if conditions change.

Earlier robots were often rigid once a task began, any unexpected change could cause failure (for example, a cleaning robot might repeatedly bump into a chair that had been moved after it mapped the room). In contrast, Gemini’s AI brings a human-like adaptability, it is always “thinking” and re-planning when necessary. This adaptability is possible because the model doesn’t just react reflexively; it actively reasons through situations, thanks to Gemini 2.0’s deep contextual and intent-based understanding.

The secret under the hood

In recent years, AI models have evolved from simply processing text inputs and generating text-based responses to more advanced architectures capable of handling multiple types of inputs and outputs within the same model.

Google DeepMind has built upon this evolution by using Gemini 2.0 as the foundation for a new AI model that can process various types of input data, including text (natural language), images, audio, and video. This model goes beyond traditional AI by generating action outputs that can be executed directly by a robot. It is a Vision-Language-Action (VLA) model, serving as the “brain” for robots and enabling them to interpret complex commands and perform tasks in human environments.

A crucial innovation in this system is the integration of an intermediate reasoning layer between input and output. This layer is designed to analyze physical space and enforce safety protocols, ensuring that every action is evaluated in real-time before execution. The most groundbreaking aspect of this technology is that its outputs are generated as a continuous stream, dynamically adjusting based on real-time input data.

This concept is incredibly powerful and represents the key breakthrough behind the success of this new technology, allowing robots to adapt on the fly and operate more safely and efficiently in unpredictable environments.

Gemini Robotics highlights

Google DeepMind highlights three core capabilities that define the advancements in Gemini Robotics: generality, interactivity, and dexterity.

Generality: Adapting to the Unexpected

Generality refers to the ability of a robot to adapt to new and unforeseen situations. Gemini Robotics leverages the extensive world knowledge embedded within the Gemini model to handle novel objects, diverse instructions, and unfamiliar environments. This capability is crucial for robots to move beyond highly specific, pre-programmed tasks and operate effectively in the dynamic real world. Google reports that Gemini Robotics demonstrates a significant improvement in this area, more than doubling the performance on a comprehensive generalization benchmark compared to other leading vision-language-action models. This focus on generality indicates a broader trend in robotics towards creating more versatile machines. Unlike traditional industrial robots designed for very specific and repetitive actions, Gemini Robotics aims to enable robots that can be more readily adapted and deployed across a wider variety of tasks and settings.

Interactivity: Understanding and Responding Naturally

Interactivity describes the robot’s ability to understand and respond to commands and changes in its environment in a seamless and intuitive way. Gemini Robotics can understand and respond to everyday, conversational language and react to sudden changes in instructions or its surroundings, often continuing tasks without needing further input. This includes the ability to understand and respond to natural language instructions in multiple languages. Furthermore, if a robot happens to drop an object or if someone in the environment moves something, the system can replan its actions and adjust accordingly without requiring explicit reprogramming. This level of real-time adaptability is crucial for robots to be truly useful in dynamic, human-centric environments. The advanced language understanding capabilities derived from Gemini 2.0 directly contribute to this seamless interaction. Instead of requiring users to learn specific robotic commands, they can communicate with Gemini-powered robots using natural language, making the technology more accessible and fostering more intuitive human-robot collaboration.

Dexterity: Mastering Fine Motor Skills

Dexterity refers to the robot’s ability to perform complex tasks that require fine motor skills and precise manipulation. Gemini Robotics demonstrates significant advancements in this area, enabling robots to perform tasks such as folding origami, packing a lunch box, or preparing a salad. Demonstrations of this capability include robots picking fruits and snacks, placing glasses in cases, tying shoelaces, and even attempting to slam dunk a basketball. Many everyday tasks that humans perform effortlessly rely on a high degree of dexterity, and progress in this area significantly expands the potential utility of robots in real-world scenarios. While robots have traditionally excelled at tasks involving large, repetitive movements, fine manipulation has been a persistent challenge. Gemini Robotics’ advancements in dexterity open possibilities for robots to assist in more nuanced and human-oriented tasks.

Gemini robotics model family

Google DeepMind has introduced two AI models under the Gemini Robotics initiative:

Gemini Robotics: Gemini Robotics is the general AI model for robotics built on top of DeepMind’s Gemini 2.0. It extends the foundation model’s multimodal capabilities, text, vision, and audio by adding robotic control as a new output. This means that instead of just processing and responding to information in the digital realm (as Gemini 2.0 does with text and images), Gemini Robotics can generate motor actions and control robotic systems in real-world environments.
Gemini Robotics-ER: Gemini Robotics-ER is a specialized model for embodied reasoning that works alongside or enhances the Gemini Robotics model. It focuses on spatial awareness, object interactions, and physics-based reasoning.

Comparison table:

Business Adoption

The advancements brought by Gemini Robotics open a vast range of real-world applications across multiple industries. These include the development of more capable general-purpose robots and next-generation humanoid robots designed to assist in homes, workplaces, and beyond.

A key collaboration in this effort is Google DeepMind’s partnership with Apptronik, a robotics company, to integrate Gemini Robotics into their Apollo humanoid robot for logistics automation. This partnership highlights the practical implementation of Gemini Robotics in advancing humanoid robots for real-world tasks.

Furthermore, Gemini Robotics-ER is currently being evaluated by a select group of trusted partners, including Agile Robots, Agility Robotics, Boston Dynamics, and Enchanted Tools. This strong industry interest underscores the technology’s potential and its validation by leading robotics companies.

The potential applications span a broad spectrum of tasks, from everyday household chores like meal preparation to complex industrial operations such as warehouse automation. Additionally, Gemini Robotics could play a crucial role in elder care and medical assistance, providing support for healthcare professionals.

These collaborations between Google DeepMind and various robotics companies are crucial for translating cutting-edge AI research into practical, real-world solutions. They also facilitate continuous improvement by gathering valuable feedback to further refine and enhance the technology.

In Summary

Gemini Robotics has made a significant impact by demonstrating that a single AI model can equip robots with a wide range of capabilities from understanding human commands to adapting to new tasks and manipulating objects with precision. Unlike previous approaches, Gemini Robotics is designed to be more general, integrated, and adaptable, introducing groundbreaking technologies that could shape the future of robotics AI.

The potential applications are vast, spanning business automation, industrial efficiency, and personal assistance in daily life. However, transforming this prototype into a widely adopted reality will require overcoming challenges in safety, business integration, and ethical considerations. The coming years will serve as a crucial testing phase for Gemini Robotics, determining whether it can successfully transition from an experimental breakthrough to a mainstream solution.

If all goes well, this moment could be remembered as the turning point when robots moved beyond the assembly line and began seamlessly assisting in the real world, a world they can finally understand. With Gemini Robotics, the vision of intelligent, helpful robots is no longer confined to science fiction but is becoming a tangible reality, ushering in a new era where AI and robotics work together to enhance human potential.

Sources

– Gemini Robotics – Google DeepMind

– Gemini Robotics brings AI into the physical world – Google DeepMind

– storage.googleapis.com/deepmind-media/gemini-robotics/gemini_robotics_report.pdf

Noticias

¿Qué es el estudio de Chatgpt? Cómo funciona y cómo usarlo gratis

Published

16 minutos ago

31 marzo, 2025

Sergio Villanueva

Studio Ghibli es un famoso estudio de animación japonés celebrado por sus películas dibujadas a mano con ricas visuales de acuarela y acrílico.

Su estilo de arte se caracteriza por entornos cálidos y de color suave que evocan una sensación de cosines, a menudo empleando una paleta pastel con texturas de acuarela.

Estamos lanzando una cosa nueva hoy: ¡las imágenes en ChatGPT!

Dos cosas que decir al respecto:

1. Es una tecnología/producto increíble. Recuerdo haber visto algunas de las primeras imágenes salir de este modelo y pasar un mal rato las que realmente las hará. Creemos que a la gente le encantará, y nosotros …

– Sam Altman (@sama) 25 de marzo de 2025

Recientemente, ChatGPT introdujo una nueva característica que permite a los usuarios generar imágenes en el estilo distintivo de Studio Ghibli. Esta herramienta permite la transformación de fotos regulares en obras de arte inspiradas en Ghibli, capturando la estética exclusiva del estudio.

En este artículo, exploraremos la esencia del arte de Ghibli, analizaremos la historia del estudio Ghibli y proporcionaremos una guía paso a paso sobre cómo usar el generador de imágenes de estilo Gibli de Chatgpt.

¿Qué es el arte de Ghibli? Una mirada a Studio Ghibli, su estilo de arte único, fundador y más

Hoy es un gran día de Internet pic.twitter.com/ipwl2yfvdq

– Zeneca.xyz (@zeneca) 26 de marzo de 2025

Ghibli Art es el estilo único utilizado por Studio Ghibli, un famoso estudio de animación japonés. Cuenta con colores suaves y pastel, fondos detallados y una sensación mágica. La obra de arte a menudo incluye hermosos paisajes y escenas cuidadosamente diseñadas que hacen que el mundo se vea rico y animado.

Studio Ghibli: Fundadores e Historia

Studio Ghibli fue fundado el 15 de junio de 1985 por Hayao Miyazaki, Isao Takahata y Toshio Suzuki. El nombre del estudio, “Ghibli”, proviene de la palabra árabe libia para un viento del desierto caliente y también era el nombre de un avión italiano, el Caproni ca.309 Ghibli.

Contribuciones de los fundadores:

Hayao Miyazaki: Conocido por su imaginativa narración y películas icónicas como Spirited Away y la Princesa Mononoke.
Isao Takahata: Contribuido con películas emocionalmente profundas como Grave of the Fireflies y The Tale of the Princess Kaguya.
Toshio Suzuki: Jugó un papel crucial en la producción de muchas de las exitosas películas de Gibli y garantizó el alcance global del estudio.

Estilo de arte único

El estilo Gibli se caracteriza por:

Animación dibujada a mano: Un compromiso con las técnicas tradicionales que le dan a sus películas una calidad tangible y orgánica.
Mundos ricamente elaborados: Fondo y entornos detallados que sumergen a los espectadores en reinos fantásticos.
Narración de narración emocionalmente resonante: Las películas a menudo exploran temas universales como la naturaleza, la identidad y las conexiones humanas.

Películas populares de Ghibli

Algunas de las películas más famosas del estudio incluyen:

Spirited Away (2001)
Princesa Mononoke (1997)
Howl’s Moving Castle (2004)
Mi vecino Totoro (1988)
Grave de las Fireflies (1988)

¿Cómo funciona el generador de imágenes AI Studio Ghibli Studio Ghibli de Chatgpt?

Fuente: x

El generador de imágenes Studio Ghibli de Chatgpt es una característica del modelo GPT-4O de Opensei, que permite a los usuarios transformar las imágenes en un estilo que recuerda a la animación icónica de Studio Ghibli.

Esta característica ha ganado una atención significativa en las plataformas de redes sociales, con usuarios que crean y comparten retratos y escenas inspirados en Gibli.

Cómo funciona

Acceder a la función: La función de generación de imágenes está disponible para los usuarios en varios niveles de suscripción de ChatGPT, incluidos Free, Plus, Pro y Team.
Usando la función: Los usuarios pueden acceder a la función abriendo chatgpt y haciendo clic en los tres puntos en la barra de inmediato, que abre un cajón con opciones de imagen y lienzo.
Para las transformaciones de imagen a imagen, los usuarios pueden cargar una foto y proporcionar una solicitud para convertirla en una imagen de estilo Gibli.

Indicaciones para el estilo Ghibli:

Las indicaciones populares incluyen “Transformar fotos en los personajes inspirados en Studio Ghibli”, “Show Me in Studio Ghibli Style” y “¿Cómo me vería como un personaje de Ghibli?”
Los usuarios también pueden especificar detalles como relación de aspecto, colores y fondos para personalizar la salida.

Aspectos técnicos:

El modelo GPT-4O es capaz de generar imágenes ultra precisas y fotorrealistas, pero se destaca particularmente por capturar la calidad suave y de ensueño del estilo de Gibli.
Los tiempos de representación pueden variar, potencialmente tomando hasta un minuto debido a la complejidad del modelo.

Limitaciones y actualizaciones

Restricciones de contenido: Operai ha implementado restricciones para evitar generar imágenes en el estilo de artistas vivos, aunque todavía se permiten estilos de estudio más amplios como Ghibli.
Problemas técnicos: Algunos usuarios, particularmente en el nivel gratuito, han informado problemas con las indicaciones fallidas debido a las restricciones de la política de contenido.

Guía paso a paso para crear imágenes de estilo Gibli con chatgpt gratis

Fuente: x

Actualmente, los usuarios gratuitos de ChatGPT no pueden acceder a esta función, ya que solo está disponible para suscriptores de Plus, Pro y Team. Sin embargo, los usuarios pueden probar alternativas como Grok o Gemini para crear imágenes similares.

Para generar una imagen de estilo ghibli:

Abra una nueva ventana de chat.
Ingrese su mensaje e incluya “en el estilo Ghibli” para el efecto deseado.
Descargue la imagen y úsela según sea necesario.

Sin embargo, si tienes ChatGpt Pro, puedes generar la imagen de estilo Studio Ghibli. ¿Pero cómo? Aquí están los pasos:

Para generar una imagen, haga clic en el icono de tres puntos en la barra de solicitud y seleccione la opción “Imagen”, que aparecerá junto con la opción “Canvas”. Ingrese un mensaje de texto detallado que describe la imagen deseada, luego continúe con la generación.
Una vez que se crea la imagen, descárguela y compártala en sus plataformas de redes sociales. Operai también ha mejorado las capacidades de representación de texto de GPT-4O capacitando sus modelos en un amplio conjunto de datos de imágenes y texto en línea.
Este enfoque ayuda al modelo a comprender no solo la relación entre imágenes y lenguaje, sino también cómo las imágenes se conectan entre sí.
Con el riguroso posterior al entrenamiento, GPT-4O ha logrado una notable fluidez visual, lo que le permite generar imágenes que sean contextualmente conscientes, consistentes y muy útiles.

Noticias

La solicitud de preferencia de OpenAI destaca las inconvenientes de las leyes estatales

Published

2 horas ago

31 marzo, 2025

Sergio Villanueva

Las propuestas de políticas de Operai Inc. para el plan de acción de inteligencia artificial del presidente Donald Trump, introducen un tema preparado para desencadenar el debate sobre la política de IA más fundamental del año. La compañía instó al gobierno federal a proteger a los desarrolladores de IA al evitar las leyes estatales de IA que corren el riesgo de “atascar la innovación y, en el caso de la IA, socavando la posición de liderazgo de Estados Unidos”.

Hay más de 781 proyectos de ley de IA actualmente pendientes en las legislaturas estatales y una floreciente industria de $ 227 millones en el gobierno de IA. La preferencia federal podría eliminarlos al instante.

La preferencia federal de las leyes estatales de IA es fundamentalmente un debate sobre la seguridad nacional, el dominio económico y el federalismo. Si Estados Unidos sofoca a su industria de IA con un mosaico fragmentado de leyes de IA estatales restrictivas, corre el riesgo de perder el liderazgo de la industria a China, que está cerrando rápidamente la brecha con avances en Deepseek y Manus.

Aunque audaz, la propuesta de OpenAI para la preferencia federal no es sorprendente en su sustancia o momento. La propuesta se produjo después de una orden ejecutiva de enero que requería la creación de un plan de acción de IA centrado en mantener el liderazgo de los Estados Unidos en el desarrollo de la IA y eliminar las cargas en el sector privado.

La Oficina de Política de Ciencia y Tecnología de la Casa Blanca emitió una solicitud que busca información sobre las políticas que deberían incorporarse. Openai presentó varias recomendaciones, sobre todo la preferencia federal de las leyes estatales de IA.

A cambio del intercambio de datos voluntarios con el gobierno federal, OpenAI solicitó que el sector privado recibiera “alivio del 781 y contando proyectos de ley relacionados con la IA ya presentados este año en los estados de EE. UU.”.

La preferencia federal ha estado en el radar del Congreso desde el año pasado. En diciembre, la Fuerza de Tarea de la Casa Bipartidista sobre Inteligencia Artificial emitió un informe integral sobre políticas y hallazgos relacionados con la IA. El informe observó que “[p]La resención de las leyes estatales de IA por legislación federal es una herramienta que el Congreso podría usar “.

Las preocupaciones sobre un marco regulatorio estatal de IA fragmentado están bien fundados desde un punto de vista práctico. No hay regulaciones federales integrales que actualmente rigan el desarrollo o el uso de la IA, dejando un vacío regulatorio que los estados individuales han comenzado a llenarse con diferentes políticas de IA.

En mayo de 2024, Colorado se convirtió en el primer estado en aprobar un proyecto de ley de IA integral que imponga regulaciones sobre desarrolladores y despliegadores de sistemas de “IA de alto riesgo”. La Legislatura de Virginia aprobó un proyecto de ley AI similar el mes pasado, mientras que un representante del estado de Texas recientemente presentó un proyecto de ley de inteligencia artificial integral que estaría entre los más restrictivos del país. Mientras tanto, California promulgó 18 nuevas leyes de IA que entraron en vigencia este año, enfocándose, como muchos otros estados, en una regulación de IA específica de dominio.

El mosaico de la regulación estatal de IA ya se ha desarrollado. En los varios cientos de facturas estatales separadas, las compañías de IA (y tal vez incluso las compañías que simplemente usan IA) podrían estar sujetas a 50 estándares de seguridad de IA diferentes, requisitos de informes y agencias de informes. Esto aumentaría los costos de cumplimiento y obstaculizaría la inversión y el crecimiento.

Las regulaciones de IA estatales establecidas en California, el hogar para las principales compañías de IA como OpenAI, Google LLC, Meta Platforms Inc. y PBC antrópico, podrían dictar efectivamente la política de IA para el resto del país. Y el estado ya ha demostrado una propensión a avanzar en la regulación de IA desaconsejada, como se ve en SB 1047, que aprobó ambas cámaras legislativas, pero fue vetado por el gobernador Gavin Newsom (D).

El proyecto de ley habría impuesto responsabilidad a los desarrolladores de grandes modelos de IA basados en estándares de prueba ambiguos y subdesarrollados, potencialmente sofocando la innovación. Demostrando aún más la desconexión entre las prioridades estatales y federales, ocho miembros democráticos del Congreso escribieron una carta a Newsom instándolo a vetar el proyecto de ley.

Los estados están mal equipados para regular una tecnología de rápida evolución y compleja, particularmente cuando se cruza con la seguridad nacional y los asuntos exteriores.

Dada la adopción e integración generalizada de la IA en la sociedad, junto con su papel crítico en la economía y la seguridad nacional, se ha vuelto análogo a la infraestructura esencial, como la red eléctrica o Internet. El gobierno federal no puede permitir que vacilara bajo un mosaico fragmentado de las regulaciones estatales de IA.

Pero la decisión de evitar las leyes estatales de IA es solo el primer paso: el mayor desafío radica en redactar la legislación habilitadora.

El poder de la preferencia federal proviene del Artículo VI, Cláusula 2 de la Constitución, también conocida como la Cláusula Supremacía. Para evitar las leyes estatales de IA, el Congreso debe aprobar legislación que proporcione la preferencia federal, lo que puede ser más desafiante de lo que parece.

Primero, el término “AI” no está definido universal o constantemente. Una definición que es demasiado amplia o estrecha podría conducir a regulaciones involuntarias de las tecnologías tradicionales o no evitar regulaciones sobre otras tecnologías de IA previstas.

En segundo lugar, el alcance de la preferencia federal será tan polémica como la cuestión fundamental de si se debe permitir la preferencia. Por ejemplo, surgirán debates sobre si todas las leyes de IA estatales deben ser preventadas o solo aquellos que afectan aspectos específicos, como el desarrollo del modelo, la capa de aplicación o las interacciones del usuario final.

Un enfoque posible es una forma más específica de preferencia, centrándose específicamente en las regulaciones estatales que rigen la capacitación, el despliegue y las pruebas de los modelos de IA fronteriza. Según este marco, el gobierno federal podría establecer estándares y regulaciones exclusivamente para los modelos fronterizos (o simplemente evitar que los estados lo hagan sin ningún estándar federal), mientras que los estados podrían retener la autoridad sobre los usos de la capa de aplicación de la IA y las interacciones de los usuarios, como restringir el uso de herramientas de IA en las entrevistas de trabajo. Pero en la práctica, incluso estas categorías pueden ser difíciles de definir cuidadosamente.

El desarrollo de la IA exige un progreso rápido y una inversión a largo plazo, y la incertidumbre a nivel estatal corre el riesgo de obstaculizar el avance de los Estados Unidos.

Este artículo no refleja necesariamente la opinión de Bloomberg Industry Group, Inc., el editor de Bloomberg Law y Bloomberg Tax, o sus propietarios.

Información del autor

Oliver Roberts es profesor adjunto de derecho en la Universidad de Washington en la Facultad de Derecho de St. Louis, co-cabeza del Grupo de Práctica AI de Holtzman Vogel, y fundador y CEO de Wickard.ai.

Escribe para nosotros: Directrices del autor

Noticias

Cómo convertir sus deseos Eid en imágenes gratuitas de estilo ghibli usando chatgpt y grok: aquí hay una guía paso a paso

Published

3 horas ago

31 marzo, 2025

Sergio Villanueva

OpenAI desbloqueó las capacidades de generación de imágenes nativas en GPT-4O la semana pasada, y desde entonces los usuarios han estado utilizando la nueva herramienta para generar imágenes de IA al estilo Studio Gibli usando ChatGPT, que Sam Altman dice que está “derritiendo” las GPU de la compañía. Esto, y algunas otras solicitudes del CEO de Operai, no han detenido la furiosa tendencia de las redes sociales, que ahora se está combinando con celebraciones de Eid para generar deseos personalizados. Si desea agregar algo de talento a sus deseos de Eid agregando un efecto de estilo de estudio de estudio personalizado, aquí hay una guía detallada sobre cómo hacer exactamente eso, usando no solo chatgpt sino también el chatbot grok de Xai.

Lea también | Cómo crear imágenes de IA de estilo Gibli gratuitas usando Grok con ayuda de Chatgpt

El límite de ChatGPT en la generación de imágenes:

ChatGPT inicialmente solo dio acceso a su nueva función nativa de generación de imágenes, responsable de crear imágenes de estilo Ghibli, a sus miembros que pagan. Pero recientemente la característica también se ha implementado a los usuarios gratuitos de la compañía.

Sin embargo, aquí está el truco: la carga de imagen nativa de ChatGPT está limitada a 3 por día para los usuarios gratuitos, mientras que los miembros profesionales y del equipo de la inicio de IA tienen un límite de uso ligeramente más alto.

Mientras tanto, se puede acceder a Grok a través de la aplicación X o su aplicación independiente. El chatbot propiedad de XAI tiene un nivel Premier, pero los usuarios gratuitos también tienen la capacidad de crear y editar imágenes, con un cierto límite en el proceso de uso.

3 formas en que puede cambiar Personalizar sus deseos de Eid en Studio Ghibli Style con Grok y Chatgpt:

1) Transforme su propia imagen en estilo Ghibli con deseos Eid:

Puede subir una foto de usted o de su familia celebrando Eid y pedirle al chatbot que lo convierta en una animación al estilo de Studio Gibli con las letras Happy Eid o Eid Mubarak.

Aquí hay un aviso de muestra generado directamente por ChatGPT:

“Convierta mi imagen en una ilustración de estilo Gibli Studio. Agregue un texto sutil ‘feliz’ ‘en un estilo suave y escrito a mano que combina naturalmente con la escena”.

Si desea hacer la misma tarea a través de las capacidades de edición de imágenes de Grok, aquí hay un mensaje de muestra:

“Transforme mi imagen en una obra de arte estilo Studio Gibli y agregue un pequeño mensaje de ‘feliz eid’ que se ajuste naturalmente a la escena”.

Imágenes inspiradas en Studio Ghibli

2) Crear una escena de celebración de Eid de estilo Gibli genérico:

También puede crear un escenario genérico de EID de estilo Gibli usando Grok o ChatGPT y agregar su propio toque personal agregando una cita o mensaje que esté cerca de su corazón.

Para crear esta imagen usando chatgpt, aquí hay un mensaje de muestra:

“Generar una obra de arte de estilo Gibli de estudio de una celebración de Eid en un pueblo vibrante. Las familias se reúnen alrededor de un patio bellamente decorado, disfrutando de la comida tradicional, intercambiando regalos y ver tocar a los niños. La escena está bañada en cálidos tonos atenuados, con hadas de hadas y un cepillo de luna creciente de arriba. Iluminación y personajes expresivos.

Para crear una imagen similar a través de Grok, este aviso se puede usar:

“Cree una ilustración al estilo de Studio Ghibli de una alegre celebración de Eid. La escena se desarrolla en una animada plaza de la aldea al atardecer, donde las familias y los niños con ropa festiva tradicional están celebrando. Algunos comparten dulces, otros son linternas de iluminación y los niños están tocando alegremente. La atmósfera es cálida y mágica, con mentiras brillantes colgando de los árboles de luna dorada y un creso de la luna de la luna arriba. sutilmente en un estilo artístico escrito a mano en una pancarta o que brilla suavemente en el cielo “.

Imagen de celebración de Eid en Studio Ghibli Style

3) Inserte su imagen en una celebración de Eid de estilo Gibli:

Si está lejos de su familia, puede cargar su foto junto con los miembros de su familia en ChatGPT y pedirle al chatbot que los agregue a todos en una celebración personalizada de estilo Eid.

Otra idea podría unirse a la celebración de Eid de una familia ficticia (o famosa) cargando su imagen para chatgpt y solicitándole al chatbot que cree una imagen de su configuración preferida en el estilo de estudio de Ghibli.

Aquí hay un mensaje de muestra de ChatGPT para personalizar su imagen de esta manera:

“Tome mi imagen y mezcle a la perfección en una celebración festiva de Eid de estilo ghibli. Estilo natural y escrito a mano en una pancarta o suavemente brillante en el cielo “.

Para generar una imagen a través de Grok, puede usar un aviso como este:

“Combine mi foto en una ilustración al estilo de Studio Ghibli de una celebración de Eid. La escena debe ser cálida y festiva, con familias reunidas, niños que juegan con linternas y personas que comparten dulces. Asegúrese de que mi imagen se vea natural en el entorno, con iluminación y colores ajustados para que coincidan con la estética de Ghibli. Agregue un suave ‘Eid Mubarak’ en un estilo de ranura o un banner en el cielo o el cielo en el cielo.

Imagen inspirada en Studio Ghibli

¿Qué es Studio Ghibli? ¿Por qué está en tendencia?

Studio Ghibli es un estudio de cine de animación japonés fundado en 1985 por Miyazaki Hayao, Takahata Isao y Suzuki Toshio. La compañía es conocida por su cine de alta calidad con animación dibujada a mano y narración rica.

Algunas de las películas animadas más notables de la compañía incluyen al vecino Totoro, Spirited Away, Howl’s Moving Castle, Kiki’s Delivery Service y Princess Mononoke.

Imagen de estilo Studio Ghibli generada con Grok

Imagen de estilo Studio Ghibli creada con chatgpt (izquierda) y Grok 3 (izquierda)

El estudio ha ganado una fama generalizada después de que los usuarios en las redes sociales probaron diferentes estilos de convertir sus imágenes utilizando la nueva herramienta de generación de imágenes de ChatGPT, pero el popular anime japonés golpeó un cable.

El famoso estudio japonés ganó atención renovada en las redes sociales después de que los usuarios de las redes sociales usaron la nueva herramienta de generación de imágenes de Chatgpt para transformar sus imágenes en varios estilos de arte como LEGO, The Simpsons, Southpark y Pixar. Entre ellos, sin embargo, la estética de anime japonesa de Studio Ghibli resonó más con los usuarios.

Vea todas las noticias y actualizaciones de tecnología en Live Mint. Descargue la aplicación Mint News para obtener actualizaciones del mercado diario y noticias comerciales en vivo.

Business NewStechnologyNeWShow para convertir sus deseos de Eid en imágenes de estilo Gibli gratuitas usando chatgpt y grok: aquí hay una guía paso a paso

MásMenos