Connect with us

Noticias

Cinco tendencias de IA a tener en cuenta en 2025: agentes, IA 3D, datos sintéticos y más

Published

on

Las empresas de inteligencia artificial como ChatGPT aumentaron su valor en 2024. Sebastien Bozón/AFP vía Getty Images

En los primeros ocho meses de 2024, Microsoft (MSFT), Meta (META), Google (GOOGL) y Amazon (AMZN) registraron colectivamente la asombrosa cifra de 125 mil millones de dólares en gastos de capital (CapEx) y costos operativos relacionados con la IA, según un informe de septiembre. Informe JPMorgan. Se espera que el CapEx acumulado de estos cuatro gigantes tecnológicos por sí solo supere la marca de los 200 mil millones de dólares para todo 2024.

Mientras tanto, las nuevas empresas de IA recibieron cantidades sin precedentes de financiación de inversores deseosos de sacar provecho del potencial lucrativo de la tecnología. OpenAI terminará 2024 como la empresa de IA mejor financiada, valorada más recientemente en 157 mil millones de dólares. Su rival Anthropic se está preparando para una nueva recaudación de fondos que la valora en 40 mil millones de dólares.

Llenas de efectivo, las principales empresas de inteligencia artificial ahora tienen la tarea de demostrar a los inversionistas (y al público) que sus costosas apuestas en la nueva tecnología darán sus frutos. Desde un giro continuo hacia la “IA agencia” hasta nuevas leyes de escalamiento emergentes y exploraciones de amplio alcance de las innumerables capacidades de la IA, he aquí un vistazo a lo que traerá el 2025 al mundo de la IA:

La IA agente será “el próximo gran avance”

La palabra de moda se refiere a asistentes autónomos de IA capaces de completar tareas sin supervisión humana. El potencial de los agentes de IA para mejorar los lugares de trabajo y la vida cotidiana rápidamente llamó la atención en Silicon Valley, y empresas como Salesforce adoptaron a los agentes como su próximo producto importante.

Microsoft también ha implementado una gran cantidad de agentes de inteligencia artificial en los últimos meses. En noviembre, presentó varios asistentes de inteligencia artificial personalizados para su suite Microsoft 365, incluido un agente capaz de proporcionar traducción en nueve idiomas diferentes.

OpenAI también está en el tren de la “IA agente”, y se espera que un próximo modelo pueda realizar tareas como reservar viajes y escribir código. Los agentes de IA son “lo que se sentirá como el próximo gran avance”, dijo Sam Altman, director ejecutivo de OpenAI, durante una reciente AMA en Reddit.

El mercado global de agentes de IA está valorado actualmente en más de 5 mil millones de dólares, según la firma de investigación MarketsandMarkets. Para finales de la década, se espera que esta cifra se dispare a 47 mil millones de dólares, impulsada en parte por la demanda de agentes entre los clientes empresariales.

La computación en tiempo de prueba podría ser una solución a la crisis de datos de entrenamiento de la IA

Uno de los componentes clave del éxito de la IA en los últimos años ha sido la gran cantidad de datos introducidos en los modelos de IA. Pero sólo hay una cantidad finita de texto, imágenes y vídeos en Internet. Para evitar un estancamiento en el desarrollo de la tecnología, las empresas de IA están recurriendo a formas alternativas de entrenar sus modelos. Una de las soluciones más prometedoras es la computación en tiempo de prueba, donde los modelos de IA mejoran al razonar y tomar más tiempo para pensar en posibles respuestas antes de responder, una teoría demostrada más recientemente por el modelo o1 de OpenAI.

En una conferencia telefónica sobre resultados en noviembre, el CEO de Nvidia (NVDA), Jensen Huang, describió el nuevo modelo de OpenAI como “uno de los desarrollos más emocionantes” en escalamiento y señaló que “cuanto más piense, mejor y de mayor calidad producirá la respuesta”.

Huang no está solo en su optimismo. El director ejecutivo de Microsoft, Satya Nadella, también señaló la computación en tiempo de prueba como una nueva ley de escalamiento en noviembre, mientras que el cofundador de OpenAI, Ilya Sutskever, a principios de este mes la destacó como una progresión de la era previa al entrenamiento de la IA.

Los datos sintéticos son otra solución prometedora

Otra solución a la crisis de datos de la IA es reemplazar los datos tradicionales con información generada por la propia tecnología. Se espera que el mercado de datos sintéticos se dispare a 2.100 millones de dólares para 2028, lo que representa un aumento de más del 450 por ciento desde 2022, según BCC Research.

Altman insinuó el potencial de los datos sintéticos hace un año cuando habló sobre el suministro cada vez menor de datos de la IA, y comentó en una entrevista que “siempre que se pueda superar el horizonte de eventos de los datos sintéticos, donde el modelo es lo suficientemente inteligente como para generar buenos datos sintéticos, Creo que todo debería estar bien”. Según se informa, OpenAI, junto con competidores como Anthropic, Meta, Microsoft y Google, han comenzado a utilizar datos sintéticos de alguna manera para entrenar y ajustar modelos.

En octubre, la startup de IA Writer dio a conocer un nuevo modelo de IA entrenado íntegramente con datos generados por IA. Este enfoque permitió a la empresa reducir costes significativos en el desarrollo del modelo, que ascendieron a apenas 700.000 dólares en comparación con los millones repartidos por otras empresas. Entrenar el modelo GPT-4 de OpenAI, por ejemplo, costó más de 100 millones de dólares.

Los “grandes modelos de mundos” crearán mundos de IA en 3D

Hasta ahora, gran parte de los resultados visuales de la IA han permanecido bidimensionales, algo que los pioneros de la tecnología buscan cambiar en los próximos años. Los “grandes modelos de mundos” son una forma emergente de IA que tiene como objetivo construir escenas tridimensionales interactivas que avancen en los mundos de las películas, los juegos y los simuladores.

Uno de los actores más importantes en este espacio es World Labs, una nueva startup establecida por el pionero de la IA de Stanford, Fei-Fei Li, que recaudó 230 millones de dólares a principios de este año. La empresa busca construir grandes modelos mundiales con “inteligencia espacial”, una forma de inteligencia que comprenda el mundo real e interactúe con él. Para demostrar este concepto, Li ha utilizado anteriormente el ejemplo de un gato que se esfuerza por caer sobre un vaso de leche y la capacidad de los humanos para predecir las consecuencias de este evento y, por lo tanto, tomar medidas para evitar que el vaso se caiga.

A principios de diciembre, Google DeepMind lanzó su propio gran modelo mundial en forma de Genie 2, que simula entornos virtuales que se utilizarán para entrenar y evaluar agentes de IA. El área probablemente será un foco clave para el laboratorio en el futuro, como lo demuestra la reciente contratación de Tim Brooks, un ex investigador de OpenAI que supervisa su generador de video Sora. En una publicación de X dando la bienvenida a Brooks a su equipo, el director ejecutivo de Google DeepMind, Demis Hassabis, destacó su entusiasmo por “trabajar juntos para hacer realidad el sueño de larga data de un simulador mundial”.

Los motores de búsqueda con IA remodelarán la búsqueda en línea

Google ha tenido durante mucho tiempo un dominio aparentemente intocable en el mercado de búsquedas. Pero con la llegada de la IA, una proliferación de motores de búsqueda impulsados ​​por ella busca sacudir el punto de apoyo del gigante tecnológico.

No es que Google no haya adoptado la tecnología en sí. En 2024, lanzó AI Overviews, una función que proporciona a los usuarios resúmenes generados por AI en lugar de enlaces. El director ejecutivo, Sundar Pichai, predice que la función atraerá a más de mil millones de usuarios mensuales y ya está “aumentando el uso general de búsqueda y la satisfacción del usuario”, dijo a los analistas de Wall Street en octubre.

Pero Google tendrá que lidiar con una industria cada vez más concurrida de herramientas de búsqueda, a medida que empresas como OpenAI y Microsoft se expandan en el campo con la ayuda de la IA.

Según se informa, Meta también se está preparando para lanzar su propio motor de búsqueda impulsado por IA, mientras que la startup Perplexity AI se ha convertido en un jugador especialmente formidable. Valoradas recientemente en 9 mil millones de dólares, sus herramientas de búsqueda de inteligencia artificial ya procesan alrededor de 20 millones de consultas diariamente, frente a los 2,5 millones de principios de 2024.

Cinco tendencias de IA a tener en cuenta en 2025: IA agente, modelos 3D, datos sintéticos y más

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

Cómo Project Gemini cambió de vuelo espacial

Published

on

Hace sesenta años, una flota de pequeñas naves espaciales elegantes allanó el camino para que Estados Unidos aterrizara a un hombre en la luna. Project Gemini fue una serie de misiones de dos hombres y orbitales que fueron pioneros en cita, acoplamiento y maniobras en el espacio, así como el sauce espacial, todos los cuales tuvieron que ser perfeccionados antes de que hubiera ninguna posibilidad de viajar a la luna.

Creando Géminis

Project Mercury, el primer programa espacial humano de Estados Unidos, tenía sistemas que estaban en gran medida automatizados. Géminis era diferente, por primera vez poniendo a los pilotos en control.

Menos dependiente de la electrónica propensa a fallas, Gemini era más simple de volar, realmente una nave espacial de un piloto. También era pequeño, dando a sus ocupantes un escaso 80 pies cúbicos (2.27 metros cúbicos) de espacio presurizado para misiones de varios días. El astronauta John Young lo comparó con sentarse de lado en una cabina telefónica. Esa compacidad le valió el apodo Gusmobile, después de que el comandante de Géminis 3 Virgil “Gus” Grissom, cuya diminuta estatura de 5 pies (1.7 m) lo convirtió en el único astronauta que podía caber en la cabina y cerrar la escotilla sin golpear su cabeza. Esto resultó problemático para el Tom Stafford de 6 pies de altura (1.8 m), que pilotó a Gemini 6. Stafford finalmente persuadió a los ingenieros para que eliminaran el aislamiento dentro de la escotilla, produciendo un ligero bulto que podría acomodar astronautas más altos.

Stafford también presionó para controladores de doble mano para comandantes y pilotos para realizar maniobras. La influencia de los astronautas en el control de estas minucias del diseño operativo de Géminis fue “mucho más allá … el piloto de prueba normal en la determinación de lo que se haría y cuándo”, escriba Barton Hacker y James Grimwood en la historia oficial de Gemini del proyecto de la NASA, Sobre los hombros de los titanes.

Prepararse para volar Géminis también significaba un intenso horario de entrenamiento. “Los días parecían tener 48 horas, las semanas 14 días y aún así nunca hubo suficiente tiempo”, dijo Grissom a un entrevistador. “Vimos a nuestras familias lo suficiente como para asegurar a nuestros jóvenes que todavía tenían padres”.

De los 16 hombres que volaron las 12 misiones de Géminis entre marzo de 1965 y noviembre de 1966, todos menos cinco más tarde visitaron la luna y seis caminaron sobre su superficie. La mayoría eran pilotos de prueba, un tercio sostenido títulos de maestría, y Buzz Aldrin de Gemini 12 tenía un doctorado.

Sus conjuntos de habilidades eclécticas los atrajeron como polillas a la llama fascinante de las demandas de misión únicas de Géminis. Ed White, Dave Scott y Gene Cernan Drew Spacewalk Tarsments. Frank Borman comandó el vuelo Gemini 7 de larga duración. Y Wally Schirra, junto con Stafford, ganó asientos en Gemini 6, el primer scentezvous.

Reunión en órbita

Una cita es un intrincado ballet de mecánica celestial para unir dos naves espaciales en diferentes planos orbitales. Era esencial para Project Apollo, cuando el módulo lunar, (lm) ascendiendo desde la superficie de la luna, se atracaba hasta el módulo de comando/servicio de órbita (CSM). Si surgieron emergencias, Rendezvous tenía que suceder rápidamente. Y Géminis dominaría su arte por primera vez.

Pero los esfuerzos de los primeros equipos de Géminis para mantener la estación con las etapas superiores descartadas de sus cohetes Titan II en órbita arrojaron resultados mixtos. Los astronautas lucharon por juzgar distancias solo por vista. Las luces de seguimiento eran difíciles de ver contra el resplandor de la Tierra. En junio de 1965, cuando el comandante de Gemini 4, Jim McDivitt, maniobró hacia su objetivo, estaba perplejo cuando el refuerzo lentamente caída parecía alejarse de él.

Fue una lección importante: agregar velocidad eleva la altitud, que llevó a Géminis a una órbita más alta que el objetivo. Pero paradójicamente, también les hizo caer detrás del objetivo a medida que su período orbital (una función directa de su distancia desde el centro de gravedad de la Tierra) también aumentó. Para obtener una cita, los astronautas tuvieron que caer a una órbita más baja, avanzar al objetivo y luego volver a subir para cumplirlo.

Para los pilotos acostumbrados a volar en formaciones estrictas con aviones a reacción, fue contra el grano de su experiencia profesional. “Es algo difícil de aprender”, escribió el astronauta Deke Slayton en sus memorias, Repentir con“Dado que es un poco atrasado de cualquier cosa que conoces como piloto”.

Los planes para que Géminis 5 se ponga en cita con una pequeña cápsula desplegable en agosto de 1965 fueron frustrados por una falla de pila de combustible. Pero Gordon Cooper y Charles “Pete” Conrad simularon esta reunión con una cita “fantasma”, en su lugar, maniobrando con éxito su barco en el mismo plano orbital que su objetivo imaginario.

La primera cita verdadera debía ser realizada por Gemini 6 en octubre de 1965, pero casi no sucedió. La nave espacial Target Agena-D de la misión, destinada a lanzarse antes de la cápsula de los astronautas, explotó poco después del lanzamiento. En cambio, la NASA decidió volar Géminis 6 junto con Géminis 7, usando este último como la nave espacial objetivo. En diciembre de 1965, Schirra y Stafford maniobraron triunfalmente Géminis 6 en 12 pulgadas (30 centímetros) de Géminis 7 y mantuvieron ese puesto durante cinco horas. La nave estaba tan cerca que las dos tripulaciones podían saludarse entre sí.

Schirra informó que Gemini manejó con crisis y precisamente, lo que le permitió hacer entradas de velocidad de solo 1.2 pulgadas por segundo (3 cm/s), lo suficientemente bueno para un acoplamiento de cita y física controlada. Pero fue muy implacable de los errores en términos de tiempo y desperdicio de propulsores.

La computadora Mark One Cranium

Aunque los astronautas de Géminis utilizaron una combinación de radar, plataformas de orientación inercial y computadoras para ayudarlos, los hombres siguieron siendo parte de la ecuación. Durante la cita de Gemini 6, Stafford empleó una regla de diapositivas circular y traza de trazado para verificar los datos de radar.

En marzo de 1966, Neil Armstrong de Géminis 8 y Dave Scott se encontraron y atracaron con un Agena-D por primera vez sin incidentes. Pero pronto, un cortocircuito de propulsores arrojó la nave espacial combinada a un rollo incontrolable que alcanzó su punto máximo a 60 revoluciones por minuto. Solo las acciones rápidas de los astronautas que activan los retrorockets de Géminis detuvieron el rollo y le salvaron la vida, pero su misión planeada de tres días fue abortada después de solo 10 horas.

“Con nuestra visión comenzando a difuminar, localizar el interruptor correcto no fue simple”, escribió Scott en sus memorias, Dos lados de la luna. “Neil sabía exactamente dónde estaba ese interruptor sin tener que verlo. Alcanzar sobre su cabeza … al mismo tiempo lidiar con el controlador de mano … fue una hazaña extraordinaria”.

En julio de 1966, John Young y Mike Collins utilizaron una memoria de computadora ampliada y un sextante portátil para calcular maniobras independientemente del control de la misión de la NASA durante Géminis 10. Cuando una falla de una computadora casi les hizo perder su objetivo Agena-D, Young tomó el control manual e hizo una cita exitosa y acoplamiento. “Realmente tuvieron que entrar en la mirada”, escribió un admirador Slayton.

Poco después, Géminis 11 en septiembre de 1966 logró un acoplamiento de Agena-D en su primera órbita, 85 minutos después del lanzamiento, simulando una cita de emergencia entre un Apolo LM y CSM. Los astronautas también aumentaron su órbita a 850 millas (1,370 km) sobre la Tierra, la altitud más alta de cualquier misión tripulada no lunar hasta Polaris Dawn en septiembre de 2024.

Finalmente, en Géminis 12 en noviembre de 1966, una insuficiencia de radar obligó a Jim Lovell y Buzz Aldrin a también ceñirse manualmente con su Agena-D. Cuando Lovell voló en la nave, Aldrin estalló en los gráficos y examinó las líneas de datos muy espaciadas, acercando a Gemini al demostrar una vez más el valor del cerebro humano, la “computadora de cráneo”, a las complejas operaciones de vuelo espacial.

Tocando

A pesar de los hipo mientras probaban piñones y atractivos, los astronautas de Géminis siempre regresaban a la Tierra. La computadora de la nave espacial podría predecir el punto de salpicaduras de fin de misión, permitiendo al comandante dirigirse hacia el objetivo en el océano. Aunque los datos incorrectos del túnel de viento provocaron que dos misiones estuvieran por debajo de su punto previsto, los vuelos posteriores salpicaron impresionantemente cerca del objetivo. En particular, Géminis 9 en junio de 1966 aterrizó a solo 2,300 pies (700 m) de su lugar previsto, tan cerca que los astronautas ofrecieron señales de pulgares a la tripulación del barco de recuperación.

El ritmo del Proyecto Géminis fue igualado solo por el fervor de la nación para lograr botas en la luna en 1970. “Nos habíamos estado corriendo con adrenalina”, escribió Dave Scott sobre su experiencia de Gemini 8, una frase adecuada que podría aplicarse bien a todo el programa: un esfuerzo que no solo trajo a Estados Unidos a un aterrizaje lunar, sino también demostró la concentración de la concentración de la concentración de la astronautación en el rendimiento.

Continue Reading

Noticias

AI para el diseño de interiores: cómo utilicé chatgpt para elegir el color de pintura perfecto

Published

on

Si está pensando en redecorar su hogar, el nuevo generador de imágenes de ChatGPT es una forma fantástica de dar vida a sus ideas, especialmente cuando se trata de elegir pintura.

ChatGPT puede atraer colores de toda la web, desde Benjamin Moore y Sherwin-Williams hasta nuevas marcas como Clare, para mostrarle cómo se verían en su habitación. Es como poner las muestras de pintura y el tablero de Pinterest en una licuadora.

No me malinterpreten, me encanta obsesionarme con las opciones de pintura y navegar por los “colores del año”, pero la IA puede ayudar a enfocar sus esfuerzos y desarrollar sus ideas más rápido. Así es como lo hice.


¿Cuántas opciones ‘blancas’ puede haber realmente?

El nuevo generador de imágenes de ChatGPT está abierto a usuarios gratuitos, pero utilicé una cuenta más de $ 20 por mes y el modelo “GPT-4O”. (Otros generadores de imágenes de IA ofrecen características similares).

Comenzando con lo básico, le pedí a ChatGPT que creara una habitación con los dos colores neutros que estaba considerando para los adornos, las paredes y el techo: Sherwin Williams “Alabaster” y Sherwin-Williams “cremosa”. Le pedí que pusiera alabastro en el borde y el techo, y cremosa en las paredes. No le envié los enlaces ni especificé los códigos de color únicos; Los sacó por su cuenta de la web y creó esta imagen.

(Crédito: CHATGPT)

“Obtendrás un Contrast suave Eso se ve intencional y elegante, no demasiado agudo, pero aún pulido “, dice Chatgpt.” Es perfecto para interiores clásicos, de transición o de estilo cabañas “.

Si aún no ha elegido sus colores, ChatGPT también puede ofrecer sugerencias. Mencionó que la “villa griega” de Sherwin-Williams podría ser una alternativa. Los tres son colores blancos populares en este momento.

¿Cómo elegiría? Le pedí a ChatGPT que me diera más información sobre por qué hay tantas opciones de color blanco y cómo elegir entre ellas. Sintetizó información de blogs y sitios web y explicó el llamado valor reflexivo de luz, o LRV, de cada uno. Esto me ayudó a descartar villa griega, que es técnicamente más blanco que los otros dos, así que me sentí seguro de mis elecciones originales.

LRV para blancos

(Crédito: CHATGPT)


Mezcla de mezcla: ideas de paleta de colores

Pasando los blancos y hacia los colores, le envié a Chatgpt la paleta completa de lo que estaba considerando ordenar a Samplize, una compañía que fabrica réplicas de pegatinas de colores de pintura específicos. Copié y pegé una captura de pantalla de mi carrito en la ventana de chat y solicité ideas combinadas.

“Tienes un Hermoso y terrenal romántico Paleta aquí: neutros cálidos, verduras apagadas, rosas suaves y un azul malhumorado “, me dijo.” Hay toneladas de formas versátiles de agruparlosdependiendo del estado de ánimo que desee en cada habitación. Aquí hay algunas ideas “.

ChatGPT puede ser un poco un hombre “sí” (wo), lo que lleva a un redditor a tener en cuenta que podría ser también lindo. Tal vez sea la luz de la luna como un representante de ventas de muestras, pero lo tomaré.

paleta de colores

(Crédito: CHATGPT)

¡Obtenga nuestras mejores historias!


Ícono del boletín


¿Qué hay de nuevo ahora?

Matricularse en ¿Qué hay de nuevo ahora?su dosis diaria de las últimas noticias tecnológicas, los mejores productos nuevos y los consejos expertos de los editores de PCMAG.

Al hacer clic en Registrarme, confirma que tiene más de 16 años y acepta nuestros Términos de uso y Política de privacidad.

¡Gracias por registrarse!

Su suscripción ha sido confirmada. ¡Esté atento a su bandeja de entrada!

Sugirió combinaciones de colores para todas las áreas de la casa, como una oficina, cocina y baño. Llamó a su idea de la oficina como un “retiro terroso”, con blanco y verde sabio. Intrigado por esa opción, le pedí que “se burle del #3, el retiro terroso”. Tenga en cuenta que puede mantener la conversación incluso con respuestas muy cortas como esta. La agonización sobre la elaboración del “aviso perfecto” a menudo es innecesario.

Eligió hacer la mitad de la pared de un color, y la mitad en otro, lo cual fue un error. Probablemente me recordó preguntar sobre ese concepto antes, pero no quise decir que lo quería en esta imagen específica. Aún así, me dio una idea de cómo podría verse.

maqueta de retiro terroso

Maqueta “Retiro terrenal” (Crédito: CHATGPT)

También probé una versión azul con este aviso: “¿Azurita cremosa y ahumada se combinan bien? Me burla de una pared que sea 3/4 cremosa, con el último 1/4 en la azurita ahumada superior. Alabaster para molduras y techos”. Jugué con dos opciones de iluminación diferentes, una habitación más oscura y clara. Como una ventaja adicional, seleccionó los colores del piso de madera por sí solo, lo que podría ser parte del diseño para que yo lo considere más tarde.

opción de pared azul 3/4

(Crédito: CHATGPT)

“Cree una foto de dormitorio principal con Rojo Rust como la pared de acento detrás de la cama, cremosa en las paredes y el techo/ajuste de alabastro”, pregunté a continuación.

Recomendado por nuestros editores

La pared de acento parecía un poco de rojo oscuro para mí, así que cambié en un color más claro. Puede hacer estos ajustes fácilmente, pero las imágenes tardan unos minutos en cargarse, posiblemente debido a la abrumadora demanda que el CEO Sam Altman dice que está sobrecargando los servidores de OpenAi. También traté de no volver a entrenarme con las solicitudes de imagen, sabiendo cuánta energía computacional requiere.

Ajustes de la pared de acento

(Crédito: CHATGPT)

Consideré eliminar el rojo más oscuro de mi carrito, pero pensé que la versión de Chatgpt se veía más oscura que el color en el sitio web de Sherwin-Williams, así que lo mantuve. Como con todas las cosas de IA, siempre verifica dos veces y nunca tome su salida al pie de la letra.

Cuando la muestra llegó a la vida real, el color parecía más o menos rojo dependiendo de la luz de la habitación. A veces parecía la imagen de Chatgpt y a veces se parecía al sitio web de Sherwin-Williams. Puede pedirle a ChatGPT que ajuste la iluminación en la habitación para simular mejor sus condiciones de la vida real, pero siempre es mejor verla en persona.


Su Miguel Ángel digital de guardia

Lamentablemente, ChatGPT no recogerá un pincel o un rodillo y hará el trabajo por usted (todavía), pero es una herramienta de ideación útil para tomar decisiones informadas a lo largo de sus proyectos de renovación.

Puede llevar este concepto al siguiente nivel subiendo fotos de su propia casa, como lo hizo un Redditor para obtener ideas de redecoración para una sala de estar anticuada.

¿ChatGPT va a reemplazar a los diseñadores de interiores? Esa es la versión actual de las redes sociales. Si bien hay un grano de verdad ya que ChatGPT es una herramienta tan útil, es un poco exagerado. Dado que está raspando la Web para opiniones y materiales sobre los que otros han escrito, puede crear un aspecto suave y diseños genéricos, orientados a una audiencia de mercado masivo.

Un verdadero diseñador puede ofrecer una personalización más profunda, con una dosis de realidad (precios), tal vez inspirada en las imágenes que crea en ChatGPT para poner en marcha la conversación.

Sobre Emily Forlini

Reportero senior

Emily Forlini

Soy el experto en PCMAG para todo lo relacionado con los vehículos eléctricos y la IA. He escrito cientos de artículos sobre estos temas, incluidas las revisiones de productos, las noticias diarias, las entrevistas de CEO y las características profundamente reportadas. También cubro otros temas dentro de la industria tecnológica, manteniendo un pulso sobre qué tecnologías están bajando por la tubería que podría dar forma a la forma en que vivimos y trabajamos.

Lea la biografía completa de Emily

Lea lo último de Emily Forlini

Continue Reading

Noticias

10 mejores publicaciones en x

Published

on

Ha pasado menos de un día desde que Operai actualizó GPT-4O con capacidades avanzadas de generación de imágenes, e Internet ya está en un frenesí. Muchos usuarios han inundado las redes sociales con sus creaciones utilizando GPT-4O. La última oferta de OpenAI se ve como un salto tecnológico hacia adelante, y algunas salidas son notablemente impresionantes.

La nueva característica, denominada “Imágenes en ChatGPT”, difiere de Dall-E porque las imágenes se generan dentro de GPT-4O. Además, el modelo se ha descrito como “omnimodal”, lo que significa que puede generar varios tipos de datos, incluidas imágenes, texto, audio y video. Esto marca un cambio en el desarrollo de IA, donde los modelos obtienen la capacidad de integrar múltiples formas de datos sin problemas.

Si eres fanático de Ghibli Films, el último modelo GPT-4O de OpenAI puede generar algunas de las imágenes más importantes de Ghibli. Los usuarios simplemente necesitan cargar una imagen y pedirle al modelo que la transforme en el estilo de anime Ghibli. Dado que esta característica se hizo ampliamente conocida, numerosos usuarios han llevado a la plataforma para mostrar su creatividad.

La historia continúa debajo de este anuncio

Aquí hay un vistazo a algunas publicaciones notables en X:

Algunas películas legendarias de Bollywood como se ven en estilo Gibli.

El salto de Elon Musk a uno de los manifestantes del presidente Donald Trump antes de las elecciones presidenciales de los Estados Unidos de 2024.

Memes populares en estilo Gibli.

Más allá de las imágenes al estilo de Ghibli

La función de generación de imágenes muestra una versatilidad extraordinaria en los dominios creativos. Ofrece a los usuarios capacidades artísticas refinadas que les permiten transformar sus fotos en una variedad de estilos, incluidos South Park, Minecraft, LEGO, Voxel, acuarela, marioneta y animación de manguera de goma. Además, es excelente cuando se trata de diseño creativo, especialmente en la generación de infografías, maquetas de productos, logotipos, carteles, otros campos visuales, etc.

La representación de texto, que ha sido un desafío para los modelos de IA, es particularmente precisa con esta nueva característica, ya que ofrece elementos de texto detallados y precisos dentro de las salidas. Produce imágenes fotorrealistas con detalles excepcionales con iluminación realista, profundidad de campo, texturas complejas, etc. Estas capacidades también se extienden a la creación de imágenes hiperrealistas de animales, personas y varios escenarios del mundo real.

La parte más impresionante es el control que tiene sobre detalles sutiles, como expresiones faciales, accesorios, textura de la piel en una imagen. Incluso se puede agregar o eliminar elementos de fondo, editar imágenes existentes y transformar fotografías. Además, el generador de imágenes también puede realizar indicaciones complejas de generación de imágenes de varias partes, produciendo escenas surrealistas. El aspecto más notable del generador es su comprensión contextual y su flexibilidad creativa. Desde Polaroid hasta DSLR de alta resolución, el generador es capaz de crear varios estilos fotográficos.

La capacidad de generación de imágenes mejorada en ChatGPT, impulsada por GPT-4O, está disponible para usuarios Plus, Pro, Team y Free Free, también a través de API. A diferencia de Dall-E, las imágenes creadas con la versión actualizada no tienen una marca de agua visual.

¿Qué son las películas de Ghibli?

La historia continúa debajo de este anuncio

Las películas de Ghibli son largometrajes animados producidos por el estudio japonés del mismo nombre. Estas películas son conocidas por su estética distintiva, que complementan su narración de cuentos de vida. Mientras está profundamente arraigado en la cultura japonesa, exploran temas universales.

Studio Ghibli fue fundado en 1985 por el cineasta Hayao Miyazaki, junto con Isao Takahata y Toshio Suzuki. Miyazaki es uno de los nombres más reconocidos en la animación, con múltiples honores a su crédito. Aunque las películas de Ghibli son anime, el estudio se destaca por su romanticización de la vida cotidiana.

Algunas de las películas de Ghibli más populares incluyen a la princesa Mononoke (1997), Spirited Away (2001), Grave of the Fireflies (1988), Howl’s Moving Castle (2004), Porco Rosso (1992) y mi vecino Totoro (1988), entre otros. Su narración lúcida, configuraciones idílicas y personajes afables han fomentado un fandom devoto y duradero.

Con las capacidades avanzadas de generación de imágenes de Chatgpt, muchos fanáticos de las películas de Ghibli tienen la oportunidad de reinventar sus fotos en la estética similar a Gibli.

Continue Reading

Trending