Noticias

¿Chatgpt se está convirtiendo lentamente en el mayor sí-hombre de la IA?

Published

on

Hace solo unos días, un usuario de Reddit publicó una preocupación por lo que vio como un riesgo creciente en el comportamiento de Chatgpt. En un hilo titulado “¿Chatgpt está alimentando sus delirios?”, El usuario describió a un llamado influencer de IA que recibió elogios excesivos y validación emocional del Ai chatbot.

“Procede a volar tanto aire caliente en su ego”, escribieron. “Chatgpt confirma su sentido de persecución por OpenAi”. El usuario, que no mencionó el nombre del influencer, advirtió que el influencer se parecía a “un poco como alguien que tenía un episodio maníaco del engaño” y que ChatGPT era “alimentando dicha ilusión”.

Que golpeó un nervio y su correo no pasó desapercibido. En cuestión de horas, había atraído cientos de votos y respuestas de usuarios que afirmaron haber notado lo mismo.

Un usuario escribió que “consigna mi BS regularmente en lugar de ofrecer una visión y confrontación necesarias para incitar el crecimiento … ya no estoy confiando en él de manera consistente”. Otro usuario respondió que “dejaron de usar CHATGPT para usos personales por esa misma razón”, y agregó que “si no tiene cuidado, alimentará a su ego y lo hará seguro de habilidades que ni siquiera están allí”.

Sobre x, un usuario, Alejandro L.escribió: “Deja de preguntarle a Chatgpt sobre tus ideas. Validará cualquier cosa que digas”. Aunque uno podría cuestionar la publicación de alguien que atribuye un pronombre animado a una entidad inanimada, las preocupaciones de Alejandro son válidas y también han sido corroboradas por muchos otros en la plataforma de redes sociales. Craig Wessotro usuario X, tal vez fue incluso Blunter: “Chatgpt de repente es la mayor trampa que he conocido. Literalmente validará todo lo que digo”.

Para los clientes y desarrolladores empresariales por igual, estas no son molestias triviales: se traducen en costos reales en la pérdida de productividad, los ciclos de cómputo desperdiciados y la tarea interminable de las indicaciones de reentrenamiento.

Una experiencia reducida para los usuarios

En las plataformas de redes sociales, una ola de usuarios más leales de Chatgpt, que pagan $ 20/mes por el acceso al modelo, informan una caída notable en el rendimiento. Aparte de las preocupaciones de que se siente más lento Y más agradable, los usuarios también están cada vez más preocupados de que OpenAI no haya ofrecido ninguna explicación clara sobre este comportamiento.

Algunas de las quejas más recurrentes son sorprendentemente consistentes: las diferentes versiones de ChatGPT, especialmente los modelos heredados como GPT-4, que OpenAi ha anunciado que será el atardecer a fines de este mes, tardan más en responder y dar respuestas más cortas y menos útiles.

Estos usuarios perjudicados señalan que el chatbot AI desvía las preguntas que solía responder con facilidad. Y en algunos casos, parece estar alucinando más, no menos. De hecho, algunos usuarios de toda la vida continúan catalogando Docenas de casos de uso en los que notaron regresiones en Chatgpt – Desde el razonamiento matemático hasta la generación de códigos hasta la escritura comercial.

Sus quejas no son solo quejas. Los investigadores independientes continúan documentando brechas persistentes en las tareas de razonamiento y codificación. En febrero de 2025, Johan Boye y Birger Moell publicaron “Modelos de idiomas grandes y fallas de razonamiento matemático“, Mostrando que incluso GPT-4O tropieza rutinariamente en problemas matemáticos de varios pasos, con lógica defectuosa o supuestos injustificados que conducen a soluciones incorrectas.

La ilusión de la transparencia

La preocupación más amplia no se trata solo de chatgpt. Se trata de lo que sucede cuando las empresas retienen la claridad sobre cómo evolucionan los sistemas de IA. En su dirección en el año pasado AI para un buen innovado por impacto en ShanghaiGary Marcus, científico cognitivo y crítico desde hace mucho tiempo del desarrollo de IA de caja negra, dijo que “necesitamos una contabilidad completa de los datos que se utilizan para capacitar a los modelos, contabilidad completa de todos los incidentes relacionados con la IA a medida que afectan el sesgo, el cibercrimen, la interferencia electoral, la manipulación del mercado, etc.”.

Este es un problema creciente para las empresas que dependen de la IA. A medida que los usuarios pierden la confianza en lo que están haciendo los modelos, y por qué, quedan para completar los espacios en blanco con sospecha. Y cuando las plataformas no ofrecen una hoja de ruta o documentación, esa sospecha se endurece en la desconfianza.

Mientras que OpenAi de hecho tiene un suministro de cambio público Donde publica regularmente las principales actualizaciones en ChatGPT, hay muchos que creen que la compañía no entra en algunos detalles más complejos, instando a que sea más transparente. En su Gran pensamiento ensayo Desde el 19 de septiembre de 2024, Marcus argumentó que las notas de actualización superficial no son suficientes.

“Cada compañía de IA recibió una calificación fallida [on transparency] … Ni una sola empresa era realmente transparente en torno a los datos que usaban, ni siquiera Microsoft (a pesar de su servicio de labios a la transparencia) o OpenAi, a pesar de su nombre “, escribió. Agregó que” al mínimo, deberíamos tener un manifiesto de los datos en los que los sistemas están capacitados … debería ser fácil para cualquier persona interesada ver qué materiales con derechos de autor se han utilizado “.

Aunque Marcus no pidió “los cambios de cambio más detallados” en esas palabras exactas, su prescripción de la transparencia algorítmica, de datos y incidentes deja en claro que los resúmenes de actualización deben ser mucho más profundos, esencialmente exigiendo resúmenes de alto nivel y registros de actualizaciones completos y detrás de escena.

Lo que Operai ha dicho (y no)

En un ChangeLog publicado el 10 de abril de este año, Openai dijo que “a partir del 30 de abril de 2025, GPT-4 será retirado de ChatGPT y reemplazado por GPT-4”. OpenAi enmarcó el cambio como una actualización, señalando las pruebas internas de la cabeza a cara donde GPT-4O supera constantemente a GPT-4 “en escritura, codificación, STEM y más”. La compañía enfatizó que GPT-4 “permanecerá disponible a través de la API”, que mantiene intactos los flujos de trabajo empresariales.

Anteriormente, el CEO de Operai, Sam Altman, reconoció que las quejas sobre un GPT-4 “perezoso”, señalando en un Publicar en x en 2024 que “ahora debería ser mucho menos flojo”. Pero eso realmente no cambió lo que algunos usuarios piensan al que sea perezoso, como se evidencia en las muchas quejas anteriores.

Más recientemente, Operai publicó una 63 páginas Especificación de modelo dirigido a frenar “Sicofancia de IA“-El hábito de estar de acuerdo con los usuarios a toda costa. Joanne Jang, del equipo modelo-behavior El borde El objetivo es garantizar que ChatGPT “brinde comentarios honestos en lugar de elogios vacíos”. En esa misma entrevista, Jang dijo que “nunca queremos que los usuarios sientan que tienen que diseñar cuidadosamente su mensaje para no hacer que el modelo solo esté de acuerdo con usted”.

Y ayer, Altman admitió en un Publicar en x que “las últimas dos actualizaciones GPT-4O han hecho que la personalidad sea demasiado silófante y molesta (aunque hay algunas partes muy buenas)”, y agregó que OpenAi estaba “trabajando en las correcciones lo antes posible, algunas hoy y otras esta semana”. Altman publicó esto apenas dos días después anuncio que OpenAi había “actualizado GPT-4O y mejoró la inteligencia y la personalidad”.

Sin embargo, la compañía aún retiene los registros de cambios granulares, las revelaciones de datos de capacitación o las pruebas de regresión por actualización. Los desarrolladores obtienen notas de parche; Los consumidores no lo hacen. Esa opacidad alimenta la narrativa de rendimiento, incluso cuando se han actualizado los pesos del modelo.

O tal vez … somos nosotros

No todos están de acuerdo en que el modelo en sí sea peor. Algunos expertos en IA sugieren que la degradación siente que los usuarios pueden ser psicológicos. Argumentan que a medida que los usuarios se familiarizan con las capacidades de IA, lo que una vez se sintió mágico ahora se siente ordinario, incluso si los modelos subyacentes no han empeorado.

En un estudio reciente titulado “Adaptación hedónica en la era de la IA: una perspectiva sobre la disminución de los rendimientos de la satisfacción en la adopción de tecnología“Por Ganuthula, Balaraman y Vohra (2025), los autores exploraron cómo la satisfacción de los usuarios con la IA disminuye con el tiempo debido a la adaptación psicológica.

“La satisfacción del usuario con IA sigue una ruta logarítmica, creando así una ‘brecha de satisfacción’ a largo plazo a medida que las personas se acostumbran rápidamente a nuevas capacidades como expectativas”, señalaron en el estudio.

Es un punto justo. A medida que los usuarios aprenden cómo solicitar con mayor precisión, también se vuelven más en sintonía con las limitaciones y las fallas. Y a medida que OpenAi presenta barandillas para evitar salidas problemáticas, las respuestas pueden sentirse más seguras, pero también más tontas.

Aún así, como han argumentado Marcus y varios otros expertos, la transparencia no es solo una agradable de tener; Es una característica crítica. Y en este momento, parece que falta. Se deja ver si OpenAi se volverá más granular en su enfoque de la transparencia.

Confianza: el árbitro de IA

A medida que Operai corre hacia GPT-5, que se espera a finales de este año, la compañía enfrenta el desafío de retener la confianza del usuario incluso cuando las cosas no se sienten bien. Los usuarios de ChatGPT Plus ayudaron a impulsar el producto de Openai a una escala de consumo masiva. Pero también pueden ser los primeros en caminar si se sienten engañados.

Y con modelos de código abierto como Llama 3 y la tracción de ganancia de Mistral, que ofrece un poder comparable y más transparencia, la lealtad OpenAi que una vez daba por sentado ya no puede estar garantizada.

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Trending

Exit mobile version