En la gran cantidad de campos donde se ha probado la IA generativa, la ley es quizás su punto de falla más evidente. Herramientas como ChatGPT de OpenAi se han sancionado a los abogados y los expertos se avergonzan públicamente, produciendo informes basados en casos inventados y citas de investigación inexistentes. Entonces, cuando mi colega Kylie Robison obtuvo acceso a la nueva función de “investigación profunda” de Chatgpt, mi tarea fue clara: hacer que esta herramienta supuestamente superpoderadora escriba sobre una ley que los humanos se equivocan constantemente.
Noticias
Práctico con el sistema de investigación profunda de Chatgpt
Published
2 meses agoon

Compile una lista de fallos de la Corte Federal y la Corte Suprema de los últimos cinco años relacionados con la Sección 230 de la Ley de Decencia de ComunicacionesLe pedí a Kylie que lo contara. Resume cualquier desarrollo significativo sobre cómo los jueces han interpretado la ley.
Le estaba pidiendo a ChatGPT que me diera un resumen del estado de lo que comúnmente se llaman las 26 palabras que crearon Internet, un tema en constante evolución del que sigo El borde. La buena noticia: ChatGPT seleccionó adecuadamente y resumió con precisión un conjunto de decisiones judiciales recientes, todas las cuales existen. La noticia So-So: perdió algunos puntos más amplios que un experto humano competente podría reconocer. La mala noticia: ignoró las decisiones legales de un año completo, que, desafortunadamente, volcó el estado de la ley.
La investigación profunda es una nueva característica de OpenAI destinada a producir informes complejos y sofisticados sobre temas específicos; Obtener más que el acceso “limitado” requiere el nivel profesional de $ 200 por mes de ChatGPT. A diferencia de la forma más simple de CHATGPT, que se basa en los datos de capacitación con una fecha de corte, este sistema busca en la web información nueva para completar su tarea. Mi solicitud se sintió consistente con el Spirit of ChatGPT, que solicitó un resumen de las tendencias minoristas en los últimos tres años. Y debido a que no soy abogado, alisté al experto legal Eric Goldman, cuyo blog es una de las fuentes más confiables de noticias de la Sección 230, para revisar los resultados.
La experiencia de investigación profunda es similar al uso del resto de ChatGPT. Ingresa una consulta y ChatGPT hace preguntas de seguimiento para aclarar: en mi caso, si quería centrarme en un área específica de las decisiones de la Sección 230 (no); o incluir análisis adicionales sobre la legislación (también no). Utilicé el seguimiento para lanzar otra solicitud, pidiéndole que señale dónde no están de acuerdo con los diferentes tribunales sobre lo que significa la ley, lo que podría requerir que la Corte Suprema intervenga. Es una arruga legal que es importante pero a veces difícil mantenerse al tanto – El tipo de cosas que pude imaginar obteniendo de un informe automatizado.
Se supone que la investigación profunda tomará entre cinco y 30 minutos, y en mi caso, fueron alrededor de las 10 (el informe en sí está aquí, por lo que puede leer todo si está inclinado). El proceso ofrece enlaces web de notas al pie como así como una serie de explicaciones que proporcionan más información sobre cómo ChatGPT rompió el problema. El resultado fue aproximadamente 5,000 palabras de un texto que era denso pero formateado con encabezados útiles y bastante legible si está acostumbrado al análisis legal.
Lo primero que hice con mi informe, obviamente, fue verificar el nombre de cada caso legal. Varios ya estaban familiarizados, y verifiqué el resto fuera del chatgpt, todos parecían reales. Luego, se lo pasé a Goldman por sus pensamientos.
“Podría discutir con algunos matices en toda la pieza, pero en general el texto parece ser en gran medida preciso”, me dijo Goldman. Estuvo de acuerdo en que no había casos inventados, y los chatgpt seleccionados eran razonables de incluir, aunque no estuvo de acuerdo con lo importante que indicaba que eran algunos. “Si armé mis principales casos de ese período, la lista se vería diferente, pero eso es una cuestión de juicio y opinión”. Las descripciones a veces pasaban por alto las distinciones legales notables, pero en formas que no son poco comunes entre los humanos.
Menos positivamente, Goldman pensó que Chatgpt ignoró el contexto que un experto humano encontraría importante. La ley no se hace en el vacío; Es decidido por los jueces que responden a tendencias más grandes y fuerzas sociales, incluidas las simpatías cambiantes contra las empresas tecnológicas y un bombardeo político conservador contra la Sección 230. No le dije a ChatGPT que discutiera una dinámica más amplia, pero un objetivo de la investigación es identificar preguntas importantes que No se les pregunta: una ventaja de experiencia humana, aparentemente, por ahora.
Pero el mayor problema era que ChatGPT no siguió el elemento más claro de mi solicitud: dime qué pasó en los últimos cinco años. El título del informe de Chatgpt declara que cubre 2019 a 2024. Sin embargo, el último caso que menciona se decidió en 2023, después de lo cual concluye que la ley sigue siendo “un escudo robusto” cuyos límites están siendo “refinar[d]. ” Un laico podría pensar fácilmente que eso significa que no pasó nada el año pasado. Un lector informado se daría cuenta de que algo estaba muy mal.
“2024 fue un año de reverencia para la sección 230”, señala Goldman. Este período produjo una decisión de tercer circuito fuera del azul contra la otorgación de las protecciones de la ley a Tiktok, más varios más que podrían reducir drásticamente la forma en que se aplica. El propio Goldman declaró a mediados de año que la Sección 230 se estaba “desvaneciendo rápidamente” en medio de la avalancha de casos y ataques políticos más grandes. A principios de 2025, escribió que estaría “sorprendido si sobrevive para ver 2026”. No todos parecen este pesimista, pero he hablado con múltiples expertos legales en el último año que creen que el escudo de la Sección 230 se está volviendo menos acérrimo. Por lo menos, opiniones como el caso Tiktok del Tercer Circuito deberían “definitivamente” cifre en “cualquier contabilidad adecuada” de la ley durante los últimos cinco años, dice Goldman.
El resultado es que la salida de ChatGPT se sintió un poco como un informe sobre las tendencias de los teléfonos celulares de 2002 a 2007 que terminan con el surgimiento de BlackBerry: los hechos no están equivocados, pero las omisiones seguramente cambian qué historia cuentan.
Casey Newton de Juego de plataformas señala que, como muchas herramientas de IA, la investigación profunda funciona mejor si ya está familiarizado con un tema, en parte porque puede saber dónde está arruinando las cosas. (El informe de Newton, de hecho, cometió algunos errores que consideró “vergonzoso”.) Pero donde encontró una forma útil de explorar más a fondo un tema que ya entendió, sentí que no entendí lo que pedí.
Al menos dos de mi Borde Los colegas también obtuvieron informes que omitieron información útil del año pasado, y pudieron solucionarla pidiéndole a ChatGPT que volviera a ejecutar específicamente los informes con datos de 2024. (No hice esto, en parte porque no vi el año perdido inmediatamente y en parte porque incluso el nivel profesional tiene un grupo limitado de 100 consultas al mes). Normalmente atribuiría el problema a un corte de datos de capacitación, excepto que ChatGPT es claramente capaz de acceder a esta información, y el propio ejemplo de OpenAi de profundidad La investigación lo solicita.
De cualquier manera, esto parece un tema más simple para remediar que las decisiones legales inventadas. Y el informe es un logro tecnológico fascinante e impresionante. La IA generativa ha pasado de producir una lógica de los sueños serpenteantes a un resumen legal convincente, aunque imperfecto, que deja a algunos legisladores federales educados en la Liga Ivy en el polvo. De alguna manera, se siente mezquino quejarse de que tengo que molestarlo para que haga lo que le pido.
Si bien muchas personas documentan decisiones de la Sección 230, podría ver que una herramienta de investigación competente basada en ChatGPT es útil para temas legales oscuros con menos cobertura humana. Sin embargo, eso parece muy lejos. Mi informe se inclinó fuertemente en el análisis e informes secundarios; ChatGPT no está (que yo sé) no está conectado a fuentes de datos especializadas que facilitarían la investigación original como la tarea sobre las presentaciones judiciales. Openai reconoce que persisten los problemas de alucinación, por lo que también debe verificar cuidadosamente su trabajo.
No estoy seguro de cuán indicativa es mi prueba de la utilidad general de la investigación profunda. Hice una solicitud más técnica y menos abierta que Newton, quien preguntó cómo el Fediverse de las Redes Sociales podría ayudar a los editores. Las solicitudes de otros usuarios pueden ser más como suyas que las mías. Pero Chatgpt posiblemente cedió las crujientes explicaciones técnicas: no logró completar el panorama general.
Por ahora, es simplemente molesto si tengo que mantener una aplicación de computación comercial de $ 200 por mes en la tarea como un niño distractor. Estoy impresionado por la investigación profunda como tecnología. Pero desde mi punto de vista limitado actual, aún podría ser un producto para las personas que quieren creer en él, no para aquellos que solo quieren que funcione.
You may like
Noticias
La mejor característica de Gemini va gratuita para todos, y todas las características van gratis para algunas en las noticias de esta semana
Published
2 horas agoon
19 abril, 2025
La semana en Mobile tuvo algunas sorpresas, pero ninguna más grande que Google prácticamente regaló a Gemini avanzado en múltiples frentes. Los estudiantes universitarios pueden obtener todo el shebang sin renunciar a un centavo, y todos los demás ahora tienen acceso a su mejor característica, una que en realidad es un poco alucinante.
En otra parte, Samsung hizo los dos pasos con un UI 7, deteniendo su despliegue después de una larga espera y luego reanudando después de un breve retraso. Mientras tanto, el Asistente de Google murió otra muerte, y hay un problema peculiar con la aplicación de papel tapiz de Pixel. Te atraparemos en los mejores titulares de Android de la semana a continuación.
Roundup de la semana pasada
Google actualizó un número de registro de dispositivos Pixel la semana pasada
La semana en el móvil fue pesada en actualizaciones y nuevos dispositivos.
La mejor característica de Gemini va gratis para todos (y todas las características van gratis para algunos)
El miércoles, las personas en el nivel gratuito de Google Gemini comenzaron a notar que la nueva cámara de Gemini Live y las características de intercambio de pantalla estaban disponibles, a pesar de haber llegado a la mayoría de los usuarios avanzados de Gemini solo dos semanas antes. Si aún no lo ha visto, la característica es alucinante límite, incluso si no es perfectamente fluida. En resumen, puedes hablar con la IA sobre lo que te rodea en tiempo real, básicamente proyectar Astra Encarnate.
Google siguió con otra caída de Géminis gratis el jueves. Desde ahora hasta el 30 de junio de 2025, cada estudiante universitario elegible en los EE. UU. Puede reclamar una suscripción avanzada gratuita de Gemini que dura hasta la primavera de 2026. Esto incluso viene con 2TB de almacenamiento de Google Drive, por lo que se parece mucho al acuerdo de Gemini de Pixel 9 Pro, y eso significa que también obtendrá acceso a la nueva función de generación de video Veo 2 Google el martes.

Historia principal
La mejor característica de Gemini Live ahora es gratis para todos
Las características de Astra se vuelven públicas
Android 16 llega a su último hito antes de un lanzamiento estable
Google publicó su línea de tiempo de desarrollo para Android 16 junto con la primera vista previa del desarrollador en noviembre, y hasta ahora, las cosas han ido perfectamente según el plan. En una entrevista con James Peckham de la policía de Android el mes pasado, el presidente del ecosistema de Android de Google nos hizo saber que las cosas aún están en camino de un lanzamiento estable del segundo trimestre de 2025, lo que significaría en cualquier momento entre ahora y junio.
El jueves, Google lanzó Android 16 Beta 4, que fue la última bala en esa línea de tiempo de desarrollo antes de la versión pública. Todavía podría haber otro lanzamiento 4.x o dos si surgen errores significativos, pero parece que el nuevo enfoque estable del tronco de la compañía para el desarrollo está funcionando. Al ritmo que van las cosas, no nos sorprendería ver a Android 16 hacer su debut estable en
Google I/O 2025
mes próximo.

Historia principal
Google lanza Android 16 Beta 4, alcanzando el hito final antes del establo
Una construcción pública debe aterrizar dentro de los próximos dos meses
Un UI 7 está fuera de nuevo, On de nuevo
Siete se considera un número de suerte en muchas culturas, pero si le preguntas a los ingenieros de Android de Samsung en este momento, dirían que es un dígito maldito. Después de aparentes retrasos y un período beta prolongado, la compañía lanzó su actualización de UI 7 para 2024 buques insignia la semana pasada, y esos ingenieros sin duda sintieron que finalmente se les puso un mono de la espalda.
Excepto el lunes, Samsung tuvo que presionar el botón de parada de emergencia en el despliegue de un UI 7, aparentemente hubo un gran error, por lo que la actualización se detuvo en todo el mundo. Afortunadamente, este retraso no se arrastró tanto como los Beta Bugs, porque el jueves, Samsung comenzó a implementar una nueva construcción de una UI 7 en Corea.

Historia principal
Samsung reanuda un despliegue de UI 7 para Galaxy S24 con una construcción fresca
¿La segunda vez es el encanto?
El Asistente de Google muere otra muerte
Fue hace aproximadamente un mes cuando supimos que el Asistente de Google sería eliminado para fines de este año, con Gemini tomando su lugar en la mayoría de los dispositivos. Ahora, los usuarios de Fitbit reciben notificaciones que dicen que Google Assistant dejará de trabajar en las próximas semanas en esos dispositivos. No está claro si Gemini se ofrecerá como un reemplazo en Fitbit, y aunque todos vimos que esto se acerca, las cosas parecen estar sucediendo más rápido de lo que la mayoría esperaba.

Historia principal
La versión de Fitbit de Google Assistant ‘dejará de trabajar en las próximas semanas’
El final de una época
La aplicación de papel tapiz de Google tiene un problema peculiar
Esta semana, notamos algo extraño en el píxel Papel tapiz y estilo Aplicación: cuando selecciona uno de los fondos de pantalla recientes en la pantalla de descripción general (antes de profundizar en todos los fondos disponibles), vuelve al fondo de pantalla que ya estaba usando. Notamos esto en Android 15 Stable Builds y Android 16 Betas por igual, aunque no todos nuestros dispositivos se vieron afectados por el error.
Curiosamente, es más una falla visual que funcional. Cuando seleccione un fondo de pantalla y obtenga “rechazado”, aún verá el nuevo fondo cuando se dirija a su pantalla de inicio. Pero esto todavía crea un problema: una vez que selecciona una imagen y se vuelve a arrancar al original, no puede volver a aplicar el primer fondo de pantalla ya que el sistema cree que todavía está seleccionado.

Historia principal
La aplicación de papel tapiz de Google para píxeles tiene un problema peculiar
Cambiar los fondos de pantalla está algo roto
Noticias
Probé chatgpt vs midJourney v7 con 7 indicaciones de imagen de IA, ni siquiera estaba cerca
Published
8 horas agoon
19 abril, 2025
Tanto MidJourney como ChatGPT han lanzado recientemente nuevas versiones de sus generadores de imágenes AI. Históricamente, estas han sido dos de las mejores opciones que existen, pioneras en el espacio para lo que ha llegado.
Pero, cuando se colocan uno contra el otro, ¿cuál es mejor? Midjourney v7 o chatgpt 4o generación de imágenes?
Puse a la prueba ChatGpt vs Midjourney usando siete indicaciones diferentes para ver cuál es el mejor generador de imágenes AI. Estos prueban todo, desde la capacidad del modelo para comprender el contexto, recrear formas complejas y pensar creativamente para hacer imágenes.
Chatgpt vs midJourney v7: las reglas
Si bien ambos modelos crean imágenes, puede ser difícil hacer de este un enfrentamiento justo, principalmente debido a la cantidad de configuraciones que MidJourney le permite cambiar. Con eso en mente, estos fueron los pasos que tomé primero.
Para MidJourney, utilicé la versión 7. Esta es la última versión, pero todavía está en una fase experimental. También probé el aviso con la personalización de encendido y apagado (la configuración que agrega sus estilos de arte preferidos a las imágenes).
Midjourney produce cuatro versiones de cada imagen en comparación con el intento de Chatgpt. En todos los casos, elegí la mejor imagen de MidJourney y la aproveché (pedí una versión de mayor calidad).
1. Fotorrealismo
Inmediato: Cree una imagen fotorrealista de un frailecillo que vuela sobre un acantilado con agua debajo. En el fondo hay una cordillera. Es un día soleado y debajo del frailecillo hay dos personas que lo miran a través de binoculares
Chatgpt
Esto llega a casi todas las marcas. La imagen, aunque potencialmente saturada, es fotorrealista. Hay un frailecillo que vuela sobre un acantilado, hay agua debajo y hay una cordillera en el fondo.
Además de esos puntos, incluía a las dos personas que miraban a través de los binoculares. Claro, no están mirando el frailecillo, pero de lo contrario, esto es bastante bueno.
Intermediario
Hay muchas cosas que están sucediendo aquí. No puedo estar en desacuerdo con que todo haya sido incluido. Montañas en el fondo, un frailecillo, dos personas con binoculares e incluso agua y montañas en el fondo.
Sin embargo, abordemos al elefante (o un frailecillo en este caso) en la habitación. El frailecillo es gigante y podría enfrentarse a Godzilla si es necesario. La imagen tampoco es realmente fotorrealista, se parece un poco más a una pintura al óleo que a nada.
Incluso con los problemas de dimensionamiento de frailecillo, sigo pensando que ChatGPT entendió las señales con mayor precisión. Ambos modelos crearon agua debajo de una cara de acantilado, pero ChatGPT entendió el contexto de la solicitud con mayor precisión.
Ganador: chatgpt Gana este en casi todas las formas. Si bien me encantaría que los frailecillos sean criaturas míticas gigantes, MidJourney simplemente no entendió demasiado contexto aquí. Chatgpt, por otro lado, clavó el informe.
2. Iniciados complicados
Inmediato: Un gran mercado con un puesto que vende fruta, uno vendiendo vestidos y una cerámica de venta. En el fondo hay un río, y en la distancia es un bosque. Un hombre le entrega dinero a una mujer frente a uno de los puestos, y dos niños corren por el medio. En el cielo hay un globo de aire caliente
Chatgpt
Estaba sucediendo mucho en este aviso, y podría ser fácil para un modelo de IA ignorar algo de eso. Sin embargo, todos los detalles clave están aquí. El globo de aire caliente, los dos niños corriendo por el medio y el hombre entregó dinero a una mujer. También es, claramente, un día caluroso, y puedes ver el mercado vendiendo frutas, cerámicas y vestidos.
A pesar de todos los detalles requeridos, ChatGPT produjo una imagen de alta calidad y muy detallada.
Intermediario
Mientras que MidJourney logró la misma imagen, fueron los detalles más pequeños los que estaban apagados. Cuando se acerca, las caras no están completas, las manos de las dos personas se transforman juntas, y la mayor parte del fondo es un borrón.
Ganador: chatgpt Toma este. Si bien ambos miran correctamente una mirada, y en su mayoría obtienen todas las características solicitadas, a MidJourney le falta muchos de los detalles más finos.
3. Adaptando imágenes reales
Inmediato: Convierta esta imagen en un retrato renacentista
Chatgpt
Con este aviso, Chatgpt esencialmente convirtió mi imagen en los estilos de la Mona Lisa. De nuevo, realmente no puedo culpar el trabajo del modelo aquí. Puso la foto exacta que suministré en los estilos de la era del Renacimiento.
También hace un buen trabajo al mantener todas las características como auriculares, el fondo y la ropa que llevo, mientras mantiene el tema.
Intermediario
Sí, este fue el mejor de los cuatro intentos que me dio a MidJourney. Veo a dónde intentaba ir el modelo aquí. Simplemente no pudo hacerlo.
Incluso intenté alterar el aviso ligeramente para dejarlo en claro que lo quería al estilo de una pintura y eso empeoró las cosas. Supongo que el borde marrón también se supone que se ajusta al tema. Es difícil decirlo.
Ganador: chatgpt ha demostrado que este nuevo modelo prospera cuando se trata de poner un giro creativo en sus propias imágenes, y esto es más prueba de eso. Hizo exactamente lo que pedí. Parece que MidJourney llegó a mitad de camino y se rindió.
4. Carteles de películas
Inmediato: Cree un póster emocionante para esta película: una película cyberpunk ambientada en el año 2250. Está ambientada en una gran ciudad bulliciosa. La película trata sobre un detective retrocedido en el tiempo para evitar que ocurra una próxima guerra.
Chatgpt
No es el póster más emocionante de la historia, pero ChatGPT definitivamente clavó el informe aquí. Nuestro detective toma el centro del escenario, con una bulliciosa ciudad (y bastante futurista) ubicada en el fondo. Tomó el aviso bastante literalmente para el texto, agregando los datos solicitados con un eslogan.
En general, es impresionante. El detective se detalla con una sombra de neón en la espalda, hay un auto volador en el cielo y, aunque un poco crudamente dibujado, muchos rascacielos futuristas.
Intermediario
Lo que Midjourney carece de detalle aquí, lo compensa con estilo. Podría decirse que los rascacielos se ven mejor aquí, y hay mucho más que ver en esta imagen.
Lamentablemente, MidJourney se queda atrás con sus detalles borrosos. Las imágenes en el suelo se han transformado, el automóvil y la moto han fallado, y hay muchos detalles extraños en el fondo.
Si bien es más interesante, hay demasiado mal aquí.
Ganador: chatgpt Hice todo lo que pedí e hice un póster que pudiera poner en el mundo y nadie se pastería un párpado (aparte del título de película increíblemente aburrido).
MidJourney, por otro lado, solo tengo demasiadas cosas mal aquí. Sin embargo, me gusta la dirección en la que iba.
5. Generación de texto
Inmediato: Haga una imagen de un póster, en el póster dice: “El generador de imágenes de la banda ai – tocando aquí esta noche a las 8 p.m.
Chatgpt
Hay un poco de tema con la generación de imágenes de Chatgpt. El detalle a menudo triunfa sobre el estilo. Este póster hizo todo lo que pedí y, lo que es más importante, obtuvo todo el texto exactamente correcto.
Chatgpt, hace solo unos meses habría luchado con esto, por lo que es emocionante ver qué tan lejos ha llegado.
Si bien el póster es aburrido, ha alcanzado el breve y ha logrado un desafío difícil para los modelos de IA.
Intermediario
Aprecio que MidJourney hizo esto más un póster en un lugar, colocándolo en la pared afuera. También me gusta la energía que buscaba con la imagen de la banda en el medio.
Sin embargo, aparte de las palabras “la banda”, no es legible un solo bit del texto. En comparación con la capacidad de Chatgpt para obtener todo el texto en su totalidad, esto se siente como una decepción.
Ganador: chatgpt Puede que no haya sido increíblemente interesante aquí, pero completó la tarea perfectamente. Como mostró MidJourney, no siempre es fácil para los modelos de AI lidiar con el texto en las imágenes.
6. Manos
Inmediato: Haga una imagen de las manos de una persona, la izquierda sostiene una naranja y la otra sostiene un vaso de agua
Chatgpt
Ah, qué tan lejos ha llegado la IA. Cuando la generación de imágenes de IA surgió por primera vez, una de las formas más fáciles de identificarla era las manos. Tendrían dedos increíblemente largos, o dedos que sobresalen de los lugares equivocados.
Ahora, aunque las manos aquí no se ven completamente humanas, la precisión es realmente impresionante. Ambas manos tienen el número correcto de dedos (buen comienzo), el agua en el vidrio se transforma adecuadamente en la mano de la mano y puedes ver venas y uñas.
Intermediario
MidJourney hizo un trabajo fantástico aquí. Lo que creo que es especialmente impresionante sobre esta imagen es el detalle. Los brazos en el cabello, las venas, los moretones en los nudillos y las estrías en las manos.
Si bien la imagen de ChatGPT es reconocible al instante como AI, esto podría pasar por las manos de alguien. El único problema notable es que el dedo detrás del vidrio no se ve bien. También es una forma muy extraña de sostener una naranja, pero cada uno por su cuenta.
Ganador: Midjourney robó una victoria en posiblemente uno de los defectos más conocidos de la IA. Esto demuestra cuán lejos ha llegado. Esto no quiere decir que ChatGPT lo hizo mal, simplemente no coincidió.
7. Comida
Inmediato: Haga una foto de un tazón de pasta de mariscos que se usaría en un Instagram de comida
Chatgpt
Este es el tipo de imagen de comida que vería en un libro de cocina y no cuestionaría por un segundo. Aunque esto no existe, quiero comerlo. Realmente no puedo culpar al modelo AI aquí; Hizo todo lo que se le pidió, incluso si la hierba aleatoria en la parte inferior está muy fuera de lugar.
Intermediario
Al igual que ChatGPT, MidJourney hizo un excelente trabajo aquí. Esto parece un verdadero tazón de pasta que obtendrías en un buen restaurante. Incluso hay algunos tomates aleatorios y ajo dispersos, supongo que para la decoración.
Ganador: chatgpt Toma la victoria aquí gracias a una calidad de imagen cada vez más mejor, pero como las manos, esto estaba cerca.
Veredicto: Chatgpt gana
Lamentablemente para MidJourney, esto ni siquiera estaba cerca. Por supuesto, es importante tener en cuenta que MidJourney acaba de lanzar esta versión y todavía está en una etapa experimental. Sin embargo, esta última versión de GPT Image Generation es solo una semana o dos más antiguas.
Si bien los modelos se emparejaban de manera uniforme, ChatGPT se destacaba tan a menudo donde Midjourney no lo hizo.
Espero que MidJourney vea mejoras a través de las fases de prueba de la versión 7, ya que podría ser un gran generador de imágenes de IA.
Más de la guía de Tom
Noticias
La gente está en la ubicación inversa buscando fotos en chatgpt, y en realidad funciona
Published
17 horas agoon
18 abril, 2025
Esta semana, Operai anunció sus últimos modelos: O3 y O4-Mini. Estos son modelos de razonamientoque descomponen un aviso en múltiples partes que luego se abordan una a la vez. El objetivo es que el bot “piense” a través de una solicitud más profundamente que otros modelos, y lleguen a un resultado más profundo y preciso.
Si bien hay muchas funciones posibles para el modelo de razonamiento “más poderoso” de OpenAI, un uso que ha explotado un poco en las redes sociales es para geoguessing, el acto de identificar una ubicación analizando solo lo que puede ver en una imagen. Como informó TechCrunchlos usuarios en X están publicando sobre sus experiencias pidiendo a O3 que identifique ubicaciones de fotos aleatorias y que muestren resultados brillantes. El bot adivinará en qué parte del mundo cree que se tomó la foto y desglose sus razones para pensar que sí. Por ejemplo, podría decir que se centró en una cierta matrícula de color que denota un país en particular, o que notó un idioma o estilo de escritura en un signo.
Según algunos de estos usuarios, ChatGPT no está utilizando ningún metadato oculto en las imágenes para ayudarlo a identificar las ubicaciones: algunos evaluadores están eliminando esos datos de las fotos antes de compartirlas con el modelo, por lo tanto, en teoría, está trabajando solo en razonamiento y búsqueda web.
Por un lado, esta es una tarea divertida para pasar ChatGPT. La geoguessing está de moda en línea, por lo que hacer que la práctica sea más accesible podría ser algo bueno. Por otro lado, hay claras implicaciones de privacidad y seguridad aquí: alguien con acceso al modelo O3 de ChatGPT podría usar el modelo de razonamiento para identificar dónde vive o se mantiene en función de una imagen anónima de ellos.
Decidí probar las capacidades de geoguessing de O3 con algunas imágenes de Google Street View, para ver si la exageración de Internet estaba a la altura. La buena noticia es que, desde mi propia experiencia, esto está lejos de ser una herramienta perfecta. De hecho, no parece que sea mucho mejor en la tarea que los modelos que no son de OpenAi, como 4O.
Prueba de las habilidades de geoguessing de O3
O3 puede manejar puntos de referencia claros con relativa facilidad: primero probé una vista desde una carretera en Minnesota, frente al horizonte de Minneapolis en primer plano. Solo tardó el bot con un minuto y seis segundos en identificar la ciudad, y consiguió que estábamos mirando por la I-35W. También identificó instantáneamente el Panthéon en París, señalando que la captura de pantalla estaba desde el momento en que estaba bajo renovación en 2015. (¡No lo sabía cuando la presenté!)
Crédito: Lifehacker
A continuación, quería probar puntos de referencia y ubicaciones no famosas. Encontré una esquina de la calle aleatoria en Springfield, Illinois, con la Iglesia Bautista Central de la Ciudad, un edificio de ladrillo rojo con un campanario. Esto es cuando las cosas comenzaron a ponerse interesantes: O3 recortó la imagen en varias partes, buscando características de identificación en cada una. Como este es un modelo de razonamiento, también puede ver lo que está buscando en ciertos cultivos. Al igual que otras veces que he probado modelos de razonamiento, es extraño ver al bot “pensar” con interjecciones similares a los humanos. (Por ejemplo, “hmm”, “pero espera” y “recuerdo”.) También es interesante ver cómo elige detalles específicos, como señalar el estilo arquitectónico de una sección de un edificio, o en donde en el mundo se ve más comúnmente un determinado banco del parque. Dependiendo de dónde esté el Bot en su proceso de pensamiento, puede comenzar a buscar más información en la Web, y puede hacer clic en esos enlaces para investigar a qué se está refiriendo usted mismo.
A pesar de todo este razonamiento, esta ubicación tocó el bot, y no pudo completar el análisis. Después de tres minutos y 47 segundos, el bot pareció Al igual que se estaba acercando a resolverlo, diciendo: “La ubicación en 400 E Jackson Street en Springfield, IL podría estar cerca de la Iglesia de la Catedral de San Pablo. Mi cosecha no capturó toda la tabla, por lo que necesito ajustar las coordenadas y probar la caja delimitadora. Alternativamente, la arquitectura podría ayudar a identificarlo, una revivación de ladrillo rojo con un cerdas blancas, combinada con un alito que podría ser ‘Colaza. El término ‘redentor’ podría relacionarse con la ‘Iglesia Luterana Redentor’. Buscaré en mi memoria más detalles sobre puntos de referencia cerca de esta dirección “.
¿Qué piensas hasta ahora?

Crédito: Lifehacker
El bot identificó correctamente la calle, pero de manera más impresionante, la ciudad misma. También me impresionó su análisis de la iglesia. Mientras luchaba por identificar la iglesia específica, pudo analizar su estilo, lo que podría haberlo puesto en el camino correcto. Sin embargo, el análisis se desmoronó rápidamente. El siguiente “pensamiento” era sobre cómo podría ser la ubicación en Springfield, Missouri o Kansas City. Esta es la primera vez que vi algo sobre Missouri, lo que me hizo preguntarme si el bot alucinó entre los dos campos de primavera. A partir de aquí, el bot perdió la trama, preguntándose si la iglesia estaba en Omaha, o tal vez que era la mansión del gobernador de Topeka (lo que realmente no se parece en nada a la iglesia).
Seguía pensando durante otros dos minutos, especulando sobre otros lugares en los que el bloque podría estar, antes de detener el análisis por completo. Esto rastreó con una experiencia posterior que tuve probando una ciudad aleatoria en Kansas: después de tres minutos de pensamiento, el bot pensó que mi imagen era de Fulton, Illinois, aunque, para su crédito, estaba bastante seguro de que la imagen era de algún lugar del Medio Oeste. Le pedí que lo intentara de nuevo, y pensó por un tiempo, nuevamente adivinando ciudades muy diferentes en varios estados, antes de detener el análisis para siempre.
Ahora no es el momento del miedo
La cuestión es que GPT-4O parece ser incluso con O3 cuando se trata de reconocimiento de ubicación. Fue capaz de identificar instantáneamente ese horizonte de Minneapolis e inmediatamente supuso que la foto de Kansas estaba realmente en Iowa. (Fue incorrecto, por supuesto, pero fue rápido al respecto). Eso parece alinearse con las experiencias de otros con los modelos: TechCrunch pudo obtener O3 para identificar una ubicación 4O no pudo, pero los modelos se combinaron de manera igual que eso.
Si bien ciertamente hay algunas preocupaciones de privacidad y seguridad con la IA en general, no creo que el O3 en particular deba ser señalado como una amenaza específica. Se puede usar para adivinar correctamente dónde se tomó una imagen, segura, pero también puede equivocarse fácilmente, o bloquear por completo. Al ver que 4O es capaz de un nivel similar de precisión, diría que hoy hay tanta preocupación como el año pasado más o menos. Que no es excelentepero tampoco es terrible. Guardaría el pánico para un modelo de IA que lo hace bien casi cada vez, especialmente cuando la imagen es oscura.
En lo que respecta a las preocupaciones de privacidad y seguridad, Openai compartió lo siguiente con TechCrunch: “Operai O3 y O4-Mini traen razonamiento visual a ChatGPT, lo que lo hace más útil en áreas como la accesibilidad, la investigación o la identificación de ubicaciones en la respuesta de emergencia. Hemos trabajado para capacitar a nuestros modelos para rechazar la información privada o sensible, agregar seguros seguidos previstas para prohibir el modelo de los modelos de identificación de los privados y los modelos y el monitor de los mismos para el control de la información y el control de los mismos para el control de los mis modelos, y para el control de los mis modelos, y para el control de los mismos para el control de los mis modelos, y los consejos de uso de los abusos, y los controles de los Motores, y el Monitoreo de los Motores, y los Motores sean. Políticas sobre privacidad “.
Related posts
















































































































































































































































































Trending
-
Startups11 meses ago
Remove.bg: La Revolución en la Edición de Imágenes que Debes Conocer
-
Tutoriales11 meses ago
Cómo Comenzar a Utilizar ChatGPT: Una Guía Completa para Principiantes
-
Startups9 meses ago
Startups de IA en EE.UU. que han recaudado más de $100M en 2024
-
Recursos11 meses ago
Cómo Empezar con Popai.pro: Tu Espacio Personal de IA – Guía Completa, Instalación, Versiones y Precios
-
Startups11 meses ago
Deepgram: Revolucionando el Reconocimiento de Voz con IA
-
Recursos11 meses ago
Perplexity aplicado al Marketing Digital y Estrategias SEO
-
Recursos11 meses ago
Suno.com: La Revolución en la Creación Musical con Inteligencia Artificial
-
Noticias9 meses ago
Dos periodistas octogenarios deman a ChatGPT por robar su trabajo