Noticias
La nueva generación de imágenes de Chatgpt se siente como un acceso telefónico de nuevo

Resumen
-
La generación de imágenes 4O es una actualización significativa para ChatGPT.
-
Las imágenes aparecen lentamente de arriba hacia abajo, al igual que las imágenes descargadas a través de las conexiones de acceso telefónico.
-
Esperar imágenes es un cambio bienvenido de la gratificación instantánea de la mayoría de la tecnología moderna.
En marzo de este año, Operai lanzó una característica llamada 4O Image Generation. Esta es una actualización de las capacidades de generación de imágenes de ChatGPT que provoca una serie de mejoras, como texto más preciso, mejor adherencia de instrucciones y un mejor fotorrealismo.
Sin embargo, el proceso no es instantáneo. La forma en que puede ver las imágenes que aparecen en tiempo real me lleva de regreso a los buenos viejos tiempos de acceso telefónico.
Imágenes de chatgpt y la revelación lenta
Muchas imágenes de IA se generan comenzando con un ruido aleatorio, como la estática que ves en los espectáculos de introducción a HBO. El modelo AI luego refina ese ruido en función del aviso, con cada iteración se vuelve menos como ruido aleatorio y más como la imagen prevista. Finalmente, después de suficientes iteraciones, la imagen debería parecerse al aviso.
Esto significa que generar una imagen lleva tiempo. Con algunos modelos de IA, puede ver que el proceso ocurre, viendo que la imagen va de la estática difusa a una imagen terminada. Cada paso muestra el estado de la imagen completa antes de que tenga lugar la próxima iteración.
Sin embargo, la generación de imágenes 4O es un poco diferente. Primero mostrará una representación muy borrosa de cómo sería la imagen final, pero luego la imagen aclara gradualmente. Sin embargo, en lugar de que esto le suceda a toda la imagen a la vez, sucede de arriba hacia abajo.
La parte superior de la imagen está terminada primero, mientras que el resto sigue siendo un desenfoque. El límite entre la imagen completa y difusa se mueve lentamente por la imagen para que no vea la imagen completa hasta que llegue al fondo.
Un flashback a los días de acceso telefónico
La primera vez que vi que esto sucedió, inmediatamente me devolvieron 30 años a los días de Internet de acceso telefónico. En aquel entonces, las velocidades más rápidas que podías obtener eran 56 kbps, y la realidad generalmente era mucho más lenta. Estas velocidades fueron tan lentas que descargar una imagen de 100 kb podría tomar fácilmente 30 segundos o más.
Relacionado
7 Cosas nostgalicas sobre Internet de acceso telefónico que realmente no nos perdemos
Marque “m” para “recuerdos”.
La forma en que las imágenes descargadas a través de Dial-Up son muy similar a cómo aparecen las nuevas imágenes de ChatGPT. Cada fila de píxeles se cargaría de arriba hacia abajo, lo que significa que vería la parte superior de la imagen y primero tendrá que esperar a que se cargue el resto de la imagen antes de que pueda verla.
¿Por qué la desaceleración?
No está del todo claro por qué la nueva función de generación de imágenes de ChatGPT utiliza este nuevo método de arriba hacia abajo. Dall-E, el modelo anterior de generación de imágenes de OpenAI, no se comportó de la misma manera.
Las imágenes generadas con la generación de imágenes 4O son ciertamente muy superiores a las generadas usando Dall-E, y es probable que producir mejores imágenes tome más tiempo. Según un tweet del CEO de OpenAi, Sam Altman, parece que muchos usuarios de ChatGPT están utilizando la función bastante, hasta el punto de que la compañía está considerando limitar su uso temporalmente. Si las GPU de OpenAI se están “derritiendo”, entonces es probable que la generación de imágenes tome más tiempo de lo que podría de otra manera.
Esto explicaría por qué las imágenes se están cargando lentamente, pero no la forma en que las imágenes se refinan de arriba hacia abajo. No está claro si esto es una consecuencia de la forma en que se generan las imágenes o porque alguien en OpenAI realmente pierde los días de acceso telefónico.
Hay algo que decir por tener que esperar
Vivimos en un mundo de gratificación instantánea. Tiene acceso a la suma total de todos los conocimientos humanos en su bolsillo trasero, y la mayoría lo damos por sentado. Ya nunca tenemos que esperar las cosas, excepto cuando compañías como Apple cruelmente repartir episodios de indemnización a una tasa de una por semana.
Relacionado
¿Deberías esperar toda una temporada o ver programas semanalmente?
¿Boring o no atracones?
Odio el hecho de que si tengo que esperar 30 segundos para un ascensor o para que los comerciales terminen, mi mano alcanzará automáticamente mi teléfono, para llenar esos segundos con un desplazamiento sin sentido. Tengo que hacer todo lo posible para detenerme de los juicios en todas las oportunidades disponibles.
Relacionado
10 maneras de detener a las doomscalias en su iPhone
Obtenga ayuda para escapar del ciclo para que pueda tocar un poco de hierba.
Pero hay algo que decir por tener que esperar algo bueno. La carga lenta de imágenes en los días de acceso telefónico fue frustrante, especialmente si la información que necesitaba (o el bit de la imagen que más quería ver) era en la parte inferior y era lo último que se cargaba.
Sin embargo, había algo bastante mágico en ver que la imagen aparecía ante tus ojos, y no me di cuenta de cuánto me perdí hasta que Chatgpt me recordó.
La generación lenta puede no estar cerca por mucho tiempo
Si bien realmente estoy disfrutando la experiencia de ver mis imágenes aparecer lentamente ante mis ojos, es posible que no pueda disfrutarla por mucho tiempo. El ritmo de los desarrollos de IA no muestra signos de desaceleración. No hace mucho tiempo que las imágenes de IA fueran hilarantemente fáciles de detectar simplemente mirando las manos destrozadas, pero las imágenes generadas actuales de IA se están volviendo seriamente difíciles de detectar.
A medida que esta tecnología mejora, es probable que la generación de imágenes se vuelva aún más rápida, y la revelación lenta desaparecerá para siempre. Planeo disfrutarlo mientras pueda, porque no sabes lo que tienes hasta que se haya ido.