Connect with us

Noticias

Cómo ChatGPT está abriendo el enclave digital ‘Galápagos’ de Corea

Published

on

Una ilustración del logotipos de aplicaciones de Chatgpt, Naver, Daum, Kakao, Papago, A. y WRTN [KOREA JOONGANG DAILY]

Antes de la llegada de CHATGPT, eran foros o blogs impulsados ​​por el usuario administrados por portales nacionales Naver o Daum, donde los coreanos buscaban información sobre una amplia gama de temas, desde el trivial, como el mejor restaurante de un vecindario, hasta lo significativo, incluidos los hechos sobre las relaciones inter-koreanas.

El traductor en línea de los coreanos solía ser Papago, un servicio de traducción automática desarrollado por Naver, antes del surgimiento del chatbot de OpenAi.

El dominio de los servicios de Internet de cosecha propia le valió al país un apodo, “Galápagos”, en comparación con otros mercados dominados por Google, pero más usuarios ahora se están volviendo hacia servicios relativamente nuevos como ChatGPT para sus consultas, debido a la reputación de chatbots por proporcionar respuestas más precisas que las búsquedas tradicionales basadas en palabras clave a menudo.

Como resultado, los usuarios activos mensuales de ChatGPT (MAU) han aumentado unos 6,180 por ciento a 3.14 millones entre mayo de 2023 y enero de 2025, mientras que Naver y Kakao, al tiempo que dominan en la búsqueda y el chat, están perdiendo el tiempo de pantalla, lo que los lleva a conducir hacia adelante con sus negocios de AI para bloquear a los usuarios.

Esta edición de Explicador explora la cultura en línea cambiante de Corea y su impacto en la industria tecnológica.



P. ¿Qué tan dominantes son Naver y Kakao en Corea?

A. Las dos plataformas coreanas se destacan en un mercado de búsqueda del cual Google posee un 89 por ciento, según datos de la plataforma de análisis web Statcounter. Combinados, Naver y Kakao convirtieron una participación comparable en el mercado de Corea en 2015.

Ese dominio sobre la búsqueda se ha retirado en 2024, pero las dos compañías aún ven una buena cantidad de uso en sus diversos servicios. Los usuarios activos mensuales (MAU) de las aplicaciones de Naver para Android e iOS numeraron 43.92 millones en enero de 2025, lo que significa que una gran mayoría de la población de 51.75 millones de Corea todavía usa la aplicación.

Aunque Naver y Kakao mantienen bases de usuarios significativas, el tiempo de pantalla promedio mensual para Naver ha caído en comparación con el pasado, según el Índice Mobile del Tracker de Market. El promedio de Naver promedió 472.62 minutos, una disminución del 11.14 por ciento a partir de noviembre de 2022, cuando ChatGPT tomó por asalto la escena de IA.

Kakao ha intentado diversificarse más allá de Kakaotalk, haciendo varios esfuerzos para convertir el servicio de mensajería líder de Corea en una plataforma de redes sociales más amplias. Esos aún no han valido la pena: Kakaotalk tuvo 45.69 millones de usuarios en enero de 2025, pero su tiempo de pantalla promedio se redujo 9.42 por ciento a 675.98 minutos, por enero de 2025 y noviembre de 2022.

Por otro lado, el MAUS de ChatGPT y WRTN, una plataforma de IA-Tailored de Corea que incorpora varios modelos, incluido el chatGPT4, aumentó 6,180 por ciento y 45,600 por ciento entre 2023 y 2025. El tiempo de pantalla promedio también aumentó el 703.9 por ciento y el 1,478 por ciento, respectivamente, durante el mismo período hasta alcanzar 63.75 y 297.67 minutos por usuario.


¿Por qué las empresas coreanas no están produciendo IA generativa?


Bueno, lo han hecho, pero su entrada fue bastante tarde, y las capacidades de sus modelos no están a la altura de los competidores más exitosos del mundo.

Sin embargo, Naver y Kakao están posicionando 2025 como el año de su transformación de IA, prometiendo lanzar nuevos servicios impulsados ​​por la IA para bloquear a los usuarios.

Lo que inicialmente distinguió a estas dos compañías fue su capacidad de proporcionar un archivo en línea adaptado específicamente al idioma coreano, un desafío que inicialmente estancó la búsqueda en Google, que luchó para procesar los datos coreanos de manera efectiva.

Con los datos de los usuarios que han acumulado, ampliaron sus ofertas para incluir servicios de construcción de la comunidad y diversificados en áreas como publicidad, comercio electrónico, entretenimiento, fintech y movilidad.

Los chatbots de IA ahora se destacan en la redacción de correos electrónicos, informes y ensayos, practicando conversaciones, generando ideas, planificar contenido e incluso proporcionar sugerencias de codificación.

Mientras tanto, las empresas están integrando modelos similares a ChatGPT en el servicio al cliente para automatizar consultas básicas y agilizar la recuperación y el análisis de datos.

Sin embargo, Naver y Kakao ahora enfrentan un paisaje más complejo, debido no solo al surgimiento de R1 de Deepseek, O3 O3 y DeepResearch, sino también a medida que el mercado de motores de búsqueda evoluciona rápidamente hacia uno impulsado por IA.

Las dos compañías están adoptando enfoques opuestos. Naver está expandiendo la tecnología externa, desarrollando y de marketing patentado, mientras que Kakao está integrando modelos externos en los servicios existentes.

gg

gg

Naver ahora enfrenta el desafío de expandir sus capacidades de búsqueda más allá de su propio conjunto de datos, lo que requiere modelos de inferencia de alta calidad que puedan razonar, resumir y proporcionar respuestas conscientes de contexto en lugar de simplemente recuperar contenido indexado.

Por el contrario, Kakao está doblando la IA en interacciones de los clientes, transacciones financieras y recomendaciones en sus servicios. Deepseek y Openai son, por lo tanto, socios más factibles para Kakao. En lugar de centrarse en la investigación, que es financieramente exigente debido a las altas demandas monetarias y computacionales de la capacitación de los modelos de IA, puede centrarse en la implementación.

La asociación de Kakao con OpenAI formaliza este enfoque, ya que el gigante coreano integra la API de la organización estadounidense en sus servicios.

El CEO de Kakao, Chung Shin-A, a la izquierda, y el fundador de Operai, Sam Altman, pose para una foto en el evento de prensa de Kakao para anunciar la asociación de la compañía coreana con OpenAi celebrada en el centro de Seúl el 4 de febrero. [NEWS1]

El CEO de Kakao, Chung Shin-A, a la izquierda, y el fundador de Operai, Sam Altman, pose para una foto en el evento de prensa de Kakao para anunciar la asociación de la compañía coreana con OpenAi celebrada en el centro de Seúl el 4 de febrero. [NEWS1]

Sin embargo, incluso las grandes empresas tecnológicas aún no han establecido una estrategia de monetización clara para la IA.

Naver y Kakao están presionando para integrar la búsqueda y recomendaciones de IA en el comercio electrónico como un controlador de ingresos, ya que sigue siendo la forma más viable de beneficiarse de las aplicaciones de IA, al menos por ahora.



¿Qué cambios vienen?


Naver, el sitio de portal más grande de Corea, hizo el anuncio sorpresa del regreso de su fundador, Lee Hae-Jin, como director interno a través de la divulgación electrónica a principios de este mes. La reincorporación de Lee, que se finalizará por votación en la reunión de accionistas en marzo, es significativo en el sentido de que el empresario ha permanecido en gran medida ausente de las operaciones nacionales durante siete años desde que renunció como presidente de la junta en 2017.

Su regreso indica la determinación del emprendedor solitario de impulsar el negocio de IA del sitio del portal.

El fundador de Naver, Lee Hae-Jin, de extrema izquierda, y el CEO Choi Soo-yeon, a la derecha, posan con el CEO de Nvidia, Jensen Huang, en la sede de Nvidia en California el 25 de junio de 2024. [NAVER]

El fundador de Naver, Lee Hae-Jin, de extrema izquierda, y el CEO Choi Soo-yeon, a la derecha, posan con el CEO de Nvidia, Jensen Huang, en la sede de Nvidia en California el 25 de junio de 2024. [NAVER]

Se espera que Naver publique múltiples servicios impulsados ​​por la IA este año. En la primera mitad de 2025, Naver lanzará una función informativa de IA, similar a las descripciones de IA de Google, que proporciona resúmenes generados por IA en la parte superior de los resultados de búsqueda. La plataforma de comercio electrónico de Naver, la tienda Naver Plus, implementará AI para hacer recomendaciones de productos a medida en una aplicación independiente.

Una plataforma publicitaria impulsada por IA para proveedores de comercio electrónico, en la que AI calcula los costos publicitarios de un producto, la base de consumo objetivo y las palabras clave para ofrecer anuncios personalizados a los usuarios, también se implementará.

Kakao, el operador del servicio de mensajería dominante de la nación, destacó su hoja de ruta AI al anunciar su asociación con OpenAI.

Kakao planea lanzar un chatbot, Kanana, aprovechando los servicios de API de OpenAi, como una versión beta cerrada en la primera mitad de este año. Kanana actualmente está experimentando pruebas internas.

Kakao ve la ventaja competitiva de Kanana en su potencial de uso en chats grupales, a diferencia de otros servicios similares que se centran en las conversaciones individuales, lo que la hace particularmente valiosa para fines empresariales.

Kakao y OpenAi planean codificar conjuntamente un agente que hará recomendaciones y ayudará a los usuarios a través de servicios como Kakaotalk, Kakao Map y Kakao T.

Similar al movimiento de Naver para integrar la IA en el comercio electrónico, Kakao está configurado para lanzar una función, AI Mate, que ofrecerá recomendaciones con el contexto de compras y navegación al seleccionar productos o destinos.

Una captura de pantalla del servicio de traducción de Naver, papago [SCREEN CAPTURE]

Una captura de pantalla del servicio de traducción de Naver, papago [SCREEN CAPTURE]

¿Qué pasa con las aplicaciones específicas de la traducción, como el papa de Naver? ¿Todavía tendrán demanda cuando la IA generativa parece hacer un mejor trabajo?


Es probable que aún habrá demanda de IA específica para el propósito en el espacio de empresa a empresa (B2B). Tomemos, por ejemplo, el éxito de la compañía alemana Deepl.

El éxito de Deepl es inusual porque cuando llegó a la escena, el mercado de traducción ya había sido dominado por el traductor de Google y, en Corea, el papago de Naver. Sin embargo, la compañía logró crear una participación de mercado significativa al final del juego.

Uno de los aspectos más innovadores del enfoque de DeepL fue su capacidad para ajustar el tono y la formalidad en las traducciones.

Más del 82 por ciento de las empresas de servicios de idiomas utilizan los servicios de DeepL, según la encuesta de la Asociación de Empresas de Lenguas publicada en octubre de 2024.

Las industrias como la ley, la fabricación y la medicina requieren traducciones altamente especializadas y precisas, lo que significa que los motores de traducción de IA deben estar capacitados con conjuntos de datos específicos del dominio.

Muchos consumidores se quejan de la mala calidad de traducción de los servicios de empresa a consumidor como Papago, pero tales quejas son casi inevitables, ya que tales modelos amplios no están específicamente capacitados para las tareas que se les ha pedido que realicen. Sin embargo, los traductores B2B a menudo se adaptan a las necesidades específicas de la industria.

La traducción automatizada aún no ha alcanzado el nivel necesario para reemplazar completamente los traductores humanos, particularmente en los campos donde la precisión, el tono y los matices contextuales son críticos. Sin embargo, a medida que crece más especializado, es probable que crezca la demanda empresarial.


Con las búsquedas basadas en palabras clave que se caen de moda, ¿cómo evolucionarán las búsquedas de IA?


Las personas que anteriormente hicieron un uso intenso de Google pueden confiar en la IA generativa no solo en las búsquedas web, sino también en procesos de toma de decisiones – De una manera mucho más personal.


Por ejemplo, si un usuario pregunta: “Necesito reservar un vuelo a Jeju mañana, pero tengo una reunión matutina. ¿Puedes reservar un vuelo que funcione? Pueden esperar un LLM no solo para Google esa frase, sino también para verificar los horarios de vuelo con horarios de metro y autobús para optimizar su tiempo de transporte al aeropuerto, así como en última instancia reservar el vuelo y el transporte al aeropuerto. Un agente futuro podría incluso Ordene los resultados basados ​​en preferencias pasadas, como las aerolíneas preferidas de los usuarios o las opciones de asientos.

Pero para que esto suceda, una LLM necesitaría acceso a los datos personales de los usuarios, similar a la forma en que Apple permite diferentes aplicaciones, como calendario, mapas, SIRI, para compartir información de los usuarios, evolucionando, en última instancia, de un simple retriever a un asistente de IA personalizado pero altamente invasivo.

El Prof. Billy Choi del Laboratorio de Investigación de IA de IA inspirado en Human de la Universidad de Corea y el Prof. Choo Jae-Gul en la Escuela de Graduados de Inteligencia Artificial en Kaist contribuyeron a este informe.

Por Lee Jae-Lim [[email protected]]

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

La mejor característica de Gemini va gratuita para todos, y todas las características van gratis para algunas en las noticias de esta semana

Published

on

La semana en Mobile tuvo algunas sorpresas, pero ninguna más grande que Google prácticamente regaló a Gemini avanzado en múltiples frentes. Los estudiantes universitarios pueden obtener todo el shebang sin renunciar a un centavo, y todos los demás ahora tienen acceso a su mejor característica, una que en realidad es un poco alucinante.

En otra parte, Samsung hizo los dos pasos con un UI 7, deteniendo su despliegue después de una larga espera y luego reanudando después de un breve retraso. Mientras tanto, el Asistente de Google murió otra muerte, y hay un problema peculiar con la aplicación de papel tapiz de Pixel. Te atraparemos en los mejores titulares de Android de la semana a continuación.

Roundup de la semana pasada

Google actualizó un número de registro de dispositivos Pixel la semana pasada

La semana en el móvil fue pesada en actualizaciones y nuevos dispositivos.

La mejor característica de Gemini va gratis para todos (y todas las características van gratis para algunos)

El miércoles, las personas en el nivel gratuito de Google Gemini comenzaron a notar que la nueva cámara de Gemini Live y las características de intercambio de pantalla estaban disponibles, a pesar de haber llegado a la mayoría de los usuarios avanzados de Gemini solo dos semanas antes. Si aún no lo ha visto, la característica es alucinante límite, incluso si no es perfectamente fluida. En resumen, puedes hablar con la IA sobre lo que te rodea en tiempo real, básicamente proyectar Astra Encarnate.

Google siguió con otra caída de Géminis gratis el jueves. Desde ahora hasta el 30 de junio de 2025, cada estudiante universitario elegible en los EE. UU. Puede reclamar una suscripción avanzada gratuita de Gemini que dura hasta la primavera de 2026. Esto incluso viene con 2TB de almacenamiento de Google Drive, por lo que se parece mucho al acuerdo de Gemini de Pixel 9 Pro, y eso significa que también obtendrá acceso a la nueva función de generación de video Veo 2 Google el martes.

Historia principal

La mejor característica de Gemini Live ahora es gratis para todos

Las características de Astra se vuelven públicas

Android 16 llega a su último hito antes de un lanzamiento estable

Google publicó su línea de tiempo de desarrollo para Android 16 junto con la primera vista previa del desarrollador en noviembre, y hasta ahora, las cosas han ido perfectamente según el plan. En una entrevista con James Peckham de la policía de Android el mes pasado, el presidente del ecosistema de Android de Google nos hizo saber que las cosas aún están en camino de un lanzamiento estable del segundo trimestre de 2025, lo que significaría en cualquier momento entre ahora y junio.

El jueves, Google lanzó Android 16 Beta 4, que fue la última bala en esa línea de tiempo de desarrollo antes de la versión pública. Todavía podría haber otro lanzamiento 4.x o dos si surgen errores significativos, pero parece que el nuevo enfoque estable del tronco de la compañía para el desarrollo está funcionando. Al ritmo que van las cosas, no nos sorprendería ver a Android 16 hacer su debut estable en

Google I/O 2025
mes próximo.

Historia principal

Google lanza Android 16 Beta 4, alcanzando el hito final antes del establo

Una construcción pública debe aterrizar dentro de los próximos dos meses

Un UI 7 está fuera de nuevo, On de nuevo

Siete se considera un número de suerte en muchas culturas, pero si le preguntas a los ingenieros de Android de Samsung en este momento, dirían que es un dígito maldito. Después de aparentes retrasos y un período beta prolongado, la compañía lanzó su actualización de UI 7 para 2024 buques insignia la semana pasada, y esos ingenieros sin duda sintieron que finalmente se les puso un mono de la espalda.

Excepto el lunes, Samsung tuvo que presionar el botón de parada de emergencia en el despliegue de un UI 7, aparentemente hubo un gran error, por lo que la actualización se detuvo en todo el mundo. Afortunadamente, este retraso no se arrastró tanto como los Beta Bugs, porque el jueves, Samsung comenzó a implementar una nueva construcción de una UI 7 en Corea.

Historia principal

Samsung reanuda un despliegue de UI 7 para Galaxy S24 con una construcción fresca

¿La segunda vez es el encanto?

El Asistente de Google muere otra muerte

Fue hace aproximadamente un mes cuando supimos que el Asistente de Google sería eliminado para fines de este año, con Gemini tomando su lugar en la mayoría de los dispositivos. Ahora, los usuarios de Fitbit reciben notificaciones que dicen que Google Assistant dejará de trabajar en las próximas semanas en esos dispositivos. No está claro si Gemini se ofrecerá como un reemplazo en Fitbit, y aunque todos vimos que esto se acerca, las cosas parecen estar sucediendo más rápido de lo que la mayoría esperaba.

Historia principal

La versión de Fitbit de Google Assistant ‘dejará de trabajar en las próximas semanas’

El final de una época

La aplicación de papel tapiz de Google tiene un problema peculiar

Esta semana, notamos algo extraño en el píxel Papel tapiz y estilo Aplicación: cuando selecciona uno de los fondos de pantalla recientes en la pantalla de descripción general (antes de profundizar en todos los fondos disponibles), vuelve al fondo de pantalla que ya estaba usando. Notamos esto en Android 15 Stable Builds y Android 16 Betas por igual, aunque no todos nuestros dispositivos se vieron afectados por el error.

Curiosamente, es más una falla visual que funcional. Cuando seleccione un fondo de pantalla y obtenga “rechazado”, aún verá el nuevo fondo cuando se dirija a su pantalla de inicio. Pero esto todavía crea un problema: una vez que selecciona una imagen y se vuelve a arrancar al original, no puede volver a aplicar el primer fondo de pantalla ya que el sistema cree que todavía está seleccionado.

Historia principal

La aplicación de papel tapiz de Google para píxeles tiene un problema peculiar

Cambiar los fondos de pantalla está algo roto

Continue Reading

Noticias

Probé chatgpt vs midJourney v7 con 7 indicaciones de imagen de IA, ni siquiera estaba cerca

Published

on

Tanto MidJourney como ChatGPT han lanzado recientemente nuevas versiones de sus generadores de imágenes AI. Históricamente, estas han sido dos de las mejores opciones que existen, pioneras en el espacio para lo que ha llegado.

Pero, cuando se colocan uno contra el otro, ¿cuál es mejor? Midjourney v7 o chatgpt 4o generación de imágenes?

Continue Reading

Noticias

La gente está en la ubicación inversa buscando fotos en chatgpt, y en realidad funciona

Published

on


Esta semana, Operai anunció sus últimos modelos: O3 y O4-Mini. Estos son modelos de razonamientoque descomponen un aviso en múltiples partes que luego se abordan una a la vez. El objetivo es que el bot “piense” a través de una solicitud más profundamente que otros modelos, y lleguen a un resultado más profundo y preciso.

Si bien hay muchas funciones posibles para el modelo de razonamiento “más poderoso” de OpenAI, un uso que ha explotado un poco en las redes sociales es para geoguessing, el acto de identificar una ubicación analizando solo lo que puede ver en una imagen. Como informó TechCrunchlos usuarios en X están publicando sobre sus experiencias pidiendo a O3 que identifique ubicaciones de fotos aleatorias y que muestren resultados brillantes. El bot adivinará en qué parte del mundo cree que se tomó la foto y desglose sus razones para pensar que sí. Por ejemplo, podría decir que se centró en una cierta matrícula de color que denota un país en particular, o que notó un idioma o estilo de escritura en un signo.

Según algunos de estos usuarios, ChatGPT no está utilizando ningún metadato oculto en las imágenes para ayudarlo a identificar las ubicaciones: algunos evaluadores están eliminando esos datos de las fotos antes de compartirlas con el modelo, por lo tanto, en teoría, está trabajando solo en razonamiento y búsqueda web.

Por un lado, esta es una tarea divertida para pasar ChatGPT. La geoguessing está de moda en línea, por lo que hacer que la práctica sea más accesible podría ser algo bueno. Por otro lado, hay claras implicaciones de privacidad y seguridad aquí: alguien con acceso al modelo O3 de ChatGPT podría usar el modelo de razonamiento para identificar dónde vive o se mantiene en función de una imagen anónima de ellos.

Decidí probar las capacidades de geoguessing de O3 con algunas imágenes de Google Street View, para ver si la exageración de Internet estaba a la altura. La buena noticia es que, desde mi propia experiencia, esto está lejos de ser una herramienta perfecta. De hecho, no parece que sea mucho mejor en la tarea que los modelos que no son de OpenAi, como 4O.

Prueba de las habilidades de geoguessing de O3

O3 puede manejar puntos de referencia claros con relativa facilidad: primero probé una vista desde una carretera en Minnesota, frente al horizonte de Minneapolis en primer plano. Solo tardó el bot con un minuto y seis segundos en identificar la ciudad, y consiguió que estábamos mirando por la I-35W. También identificó instantáneamente el Panthéon en París, señalando que la captura de pantalla estaba desde el momento en que estaba bajo renovación en 2015. (¡No lo sabía cuando la presenté!)


Crédito: Lifehacker

A continuación, quería probar puntos de referencia y ubicaciones no famosas. Encontré una esquina de la calle aleatoria en Springfield, Illinois, con la Iglesia Bautista Central de la Ciudad, un edificio de ladrillo rojo con un campanario. Esto es cuando las cosas comenzaron a ponerse interesantes: O3 recortó la imagen en varias partes, buscando características de identificación en cada una. Como este es un modelo de razonamiento, también puede ver lo que está buscando en ciertos cultivos. Al igual que otras veces que he probado modelos de razonamiento, es extraño ver al bot “pensar” con interjecciones similares a los humanos. (Por ejemplo, “hmm”, “pero espera” y “recuerdo”.) También es interesante ver cómo elige detalles específicos, como señalar el estilo arquitectónico de una sección de un edificio, o en donde en el mundo se ve más comúnmente un determinado banco del parque. Dependiendo de dónde esté el Bot en su proceso de pensamiento, puede comenzar a buscar más información en la Web, y puede hacer clic en esos enlaces para investigar a qué se está refiriendo usted mismo.

A pesar de todo este razonamiento, esta ubicación tocó el bot, y no pudo completar el análisis. Después de tres minutos y 47 segundos, el bot pareció Al igual que se estaba acercando a resolverlo, diciendo: “La ubicación en 400 E Jackson Street en Springfield, IL podría estar cerca de la Iglesia de la Catedral de San Pablo. Mi cosecha no capturó toda la tabla, por lo que necesito ajustar las coordenadas y probar la caja delimitadora. Alternativamente, la arquitectura podría ayudar a identificarlo, una revivación de ladrillo rojo con un cerdas blancas, combinada con un alito que podría ser ‘Colaza. El término ‘redentor’ podría relacionarse con la ‘Iglesia Luterana Redentor’. Buscaré en mi memoria más detalles sobre puntos de referencia cerca de esta dirección “.

¿Qué piensas hasta ahora?

O3 Tener problemas para identificar una ubicación


Crédito: Lifehacker

El bot identificó correctamente la calle, pero de manera más impresionante, la ciudad misma. También me impresionó su análisis de la iglesia. Mientras luchaba por identificar la iglesia específica, pudo analizar su estilo, lo que podría haberlo puesto en el camino correcto. Sin embargo, el análisis se desmoronó rápidamente. El siguiente “pensamiento” era sobre cómo podría ser la ubicación en Springfield, Missouri o Kansas City. Esta es la primera vez que vi algo sobre Missouri, lo que me hizo preguntarme si el bot alucinó entre los dos campos de primavera. A partir de aquí, el bot perdió la trama, preguntándose si la iglesia estaba en Omaha, o tal vez que era la mansión del gobernador de Topeka (lo que realmente no se parece en nada a la iglesia).

Seguía pensando durante otros dos minutos, especulando sobre otros lugares en los que el bloque podría estar, antes de detener el análisis por completo. Esto rastreó con una experiencia posterior que tuve probando una ciudad aleatoria en Kansas: después de tres minutos de pensamiento, el bot pensó que mi imagen era de Fulton, Illinois, aunque, para su crédito, estaba bastante seguro de que la imagen era de algún lugar del Medio Oeste. Le pedí que lo intentara de nuevo, y pensó por un tiempo, nuevamente adivinando ciudades muy diferentes en varios estados, antes de detener el análisis para siempre.

Ahora no es el momento del miedo

La cuestión es que GPT-4O parece ser incluso con O3 cuando se trata de reconocimiento de ubicación. Fue capaz de identificar instantáneamente ese horizonte de Minneapolis e inmediatamente supuso que la foto de Kansas estaba realmente en Iowa. (Fue incorrecto, por supuesto, pero fue rápido al respecto). Eso parece alinearse con las experiencias de otros con los modelos: TechCrunch pudo obtener O3 para identificar una ubicación 4O no pudo, pero los modelos se combinaron de manera igual que eso.

Si bien ciertamente hay algunas preocupaciones de privacidad y seguridad con la IA en general, no creo que el O3 en particular deba ser señalado como una amenaza específica. Se puede usar para adivinar correctamente dónde se tomó una imagen, segura, pero también puede equivocarse fácilmente, o bloquear por completo. Al ver que 4O es capaz de un nivel similar de precisión, diría que hoy hay tanta preocupación como el año pasado más o menos. Que no es excelentepero tampoco es terrible. Guardaría el pánico para un modelo de IA que lo hace bien casi cada vez, especialmente cuando la imagen es oscura.

En lo que respecta a las preocupaciones de privacidad y seguridad, Openai compartió lo siguiente con TechCrunch: “Operai O3 y O4-Mini traen razonamiento visual a ChatGPT, lo que lo hace más útil en áreas como la accesibilidad, la investigación o la identificación de ubicaciones en la respuesta de emergencia. Hemos trabajado para capacitar a nuestros modelos para rechazar la información privada o sensible, agregar seguros seguidos previstas para prohibir el modelo de los modelos de identificación de los privados y los modelos y el monitor de los mismos para el control de la información y el control de los mismos para el control de los mis modelos, y para el control de los mis modelos, y para el control de los mismos para el control de los mis modelos, y los consejos de uso de los abusos, y los controles de los Motores, y el Monitoreo de los Motores, y los Motores sean. Políticas sobre privacidad “.

Continue Reading

Trending