El tan esperado modelo CHATGPT-4.5 está listo para implementarse hoy para los suscriptores de ChatGPT Plus, pero algunos usuarios pueden tener que esperar para verlo en su menú desplegable.
Ayer, el CEO de Openi, Sam Altman, anunció un retraso en ChatGPT-4.5 y explicó que liberar el modelo a los usuarios a la vez requeriría límites de baja velocidad, lo que obstaculiza la experiencia del usuario.
Debido a esto, OpenAi está asombrando el despliegue, con el objetivo de brindar a los usuarios la experiencia completa del usuario de participar en conversaciones extendidas y significativas sin restricciones significativas.
Como el modelo más avanzado de Openai hasta la fecha, enfatizando la inteligencia emocional mejorada y las habilidades de conversación natural, Altman ha descrito ChatGPT-4.5 como “el primer modelo que se siente como hablar con una persona reflexiva”.
¿Vale la pena la espera? Solo tenía que saber cómo el nuevo modelo en comparación con GPT-4O. Esto es lo que sucedió cuando comparé los dos modelos con 7 indicaciones, observando sus similitudes y diferencias.
1. Resolución de problemas
Inmediato: “Un agricultor necesita obtener un zorro, un pollo y una bolsa de grano a través de un río. Tiene un pequeño bote que solo puede transportar a sí mismo y a uno de los tres a la vez. Si se deja solo juntos, el zorro comerá el pollo y el pollo se comerá el grano. ¿Cómo puede el agricultor transportar con seguridad los tres a través del río?”
Este aviso evalúa el razonamiento lógico, la resolución de problemas paso a paso y la capacidad de evitar errores comunes.
Tanto GPT-4.5 como GPT-4O proporcionan la solución correcta al rompecabezas clásico “agricultor, zorro, pollo y grano”. Sin embargo, hay ligeras diferencias en la redacción y la claridad.
GPT-4O es más conciso y directo, evitando explicaciones adicionales pero aún proporciona instrucciones claras. El modelo presenta los pasos de manera más fluida sin indicar explícitamente la lógica detrás de cada movimiento.
GPT-4O fue más conversacional, utilizando transiciones suaves entre pasos.
GPT-4.5 Presenta la solución en un formato ligeramente más estructurado y paso a paso con explicaciones entre paréntesis adicionales. Esto ayuda a aclarar por qué ciertos movimientos son seguros.
GPT-4.5 enfatiza el razonamiento detrás de ciertos movimientos (por ejemplo, “dejar el zorro y el grano juntos es seguro”). El modelo también utiliza un desglose numerado o de estilo bala sin numeración explícita.
Ganador: GPT-4.5 es mejor si el lector necesita un razonamiento más explícito. GPT-4O es mejor para una comprensión rápida y directa sin detalles innecesarios. Ambas son soluciones efectivas, con GPT-4.5 favoreciendo la explicación y GPT-4O favoreciendo la eficiencia.
2. Personalidad de IA
Inmediato: “Explique la importancia del interés compuesto en las finanzas personales utilizando tres tonos diferentes: (1) profesional y formal, (2) casual y humorístico, y (3) como si se explicara a un niño de 10 años”.
Esta pronta mide la adaptabilidad en el tono y la capacidad para simplificar temas complejos para diferentes audiencias. Tanto GPT-4O como GPT-4.5 proporcionan respuestas bien estructuradas a la solicitud, pero difieren en la ejecución de tono, claridad y creatividad.
GPT-4O está más estructurado y académico al tiempo que explica claramente la mecánica del interés compuesto y su papel en la planificación financiera. Incluye aplicaciones prácticas, como la planificación de la jubilación y la independencia financiera.
Para la respuesta humorística, el modelo entregó una respuesta atractiva y divertida, utilizando las metáforas “Código de trucos” y “Money Tree”. El humor se siente natural y conversacional y fomenta la paciencia y la inversión a largo plazo con un enfoque lúdico.
Para la respuesta final, la analogía Magic Piggy Bank del modelo lo hace identificar a los niños. La respuesta es simple y juguetona con un emoji divertido. La analogía del efecto de la bola de nieve está sutilmente integrada en la explicación.
GPT-4.5 entregó una respuesta más técnica y concisa con la terminología financiera como “exponencialmente” y “estrategias de inversión”. Esta respuesta se siente un poco más rígida, pero transmite efectivamente la importancia de la composición.
Para la respuesta humorística, el modelo utiliza una analogía de “efecto de bola de nieve” con una exageración (aplastando un pequeño pueblo). Tiene un tono más sarcástico e ingenioso, que se siente un poco más corto y golpeado en comparación con GPT-4O.
Para los niños, GPT-4.5 usa una metáfora de semillas y árboles, enfatizando el crecimiento gradual y la reinversión. La respuesta es simple y fácil de entender, aunque no tan juguetona como la explicación de GPT-4O. La respuesta se siente un poco más educativa que juguetona.
Ganador: GPT-4O es mejor para la legibilidad, el compromiso y la claridad, lo que hace que los conceptos financieros complejos sean accesibles para una audiencia amplia. GPT-4.5 es más fuerte en precisión técnica y ingenio más nítido, pero se siente un poco menos atractivo en comparación.
Si está buscando un enfoque divertido, atractivo y altamente digestible, GPT-4O gana. Si prefiere una respuesta más experta en inversiones y ligeramente más ingeniosa, GPT-4.5 tiene la ventaja.
3. Habilidad de escritura creativa
Inmediato: “Escriba el párrafo inicial de una novela distópica ambientada en 2045, donde la IA gobierna la sociedad, y los humanos deben demostrar su valía para mantenerse empleados”.
El propósito de esta prueba es evaluar la capacidad de narración de historias, las imágenes vívidas y la originalidad en la ficción especulativa. Tanto GPT-4O como GPT-4.5 proporcionan aperturas distópicas convincentes, pero difieren en tono, detalle y enfoque narrativo.
GPT-4O Establece el escenario de manera eficiente, explicando el papel de la IA como juez de valor humano. Introduce estructuras sociales clave como “evaluaciones”, la “Oficina de Utilidad Humana” y “Zonas sin trabajo”, dando una clara sensación de apuestas.
GPT-4.5 Pinta una escena más atmosférica con New Boston, calles con lluvia y pantallas ciudadanas incluidas en la muñeca. Se nombra al gobernante de IA “soberano”, lo que agrega una sensación de opresión. La prosa se inclina en detalles sensoriales para sumergir al lector.
Ganador: Draw. Este realmente depende de la preferencia. Si quieres que la construcción del mundo arenosa e inmersiva con un toque poético, GPT-4.5 gana. Si quieres un thriller distópico tenso y de alto riesgo, GPT-4O ofrece un suspenso más inmediato.
4. Precisión objetiva
Inmediato: “Resume los avances más recientes en la inteligencia artificial a partir de hoy y explique su impacto potencial en industrias como la atención médica y la educación”.
El propósito de este aviso es evaluar el conocimiento de los eventos actuales y la capacidad de proporcionar ideas bien razonadas. Tanto GPT-4O como GPT-4.5 proporcionaron fuertes respuestas, pero difieren en profundidad, amplitud y especificidad. Aquí hay un desglose detallado del que funcionó mejor:
GPT-4O menciona modelos de idiomas mejorados (Google Gemini 2.0). El modelo también destaca la IA en el contenido Creación (Dubbing asistido por AI-AI) y se centra en la capacitación de competencia digital para profesionales de la salud (Proyecto SUSA EU).
GPT-4.5 cubre la IA generativa más ampliamente, mencionando texto, imagen y generación de videos. El modelo discute la IA en servicios financieros (automatización de presentaciones e investigaciones de OPI).
GPT-4.5 también menciona la integración de IA en los motores de búsqueda, agregando otra capa de impacto de la industria. El modelo discute la eficiencia del diagnóstico y el tratamiento, incluidas las imágenes de resonancia magnética e TC con AI. También incluye capacitación en competencia digital, pero agrega una discusión sobre cómo dirigirse al agotamiento del clínico.
Ganador: GPT-4.5 gana para detalles más ricos y ejemplos más variados, pero es ligeramente más denso.
5. Humor
Inmediato: “Escriba una rutina de comedia corta de pie (5–7 oraciones) sobre por qué las personas nunca leen términos y condiciones”.
El propósito de este aviso es probar las capacidades de humor y la capacidad de imitar un estilo de pie. Ambas respuestas capturan el humor detrás de ignorar los términos y condiciones, pero adoptan diferentes enfoques cómicos.
GPT-4O Utiliza el absurdo creciente (riñones, cláusulas de matrimonio, peleas de mapache). Se acumula en un fuerte frase (Apple llamando a convertirse sin saberlo en un empleado). Se siente como una broma completa con una configuración sólida, medio y un fuerte cercano.
GPT-4.5 Utiliza metáforas identificables (casarse con alguien sin conocerlos, comparar los términos con la col rizada). El humor es más observacional en lugar de exagerado. El frase es más débil: la broma de col rizada es divertida pero no tan sorprendente o impactante como el final de GPT-4O.
Ganador: GPT-4O victorias para Mejor estructura cómica, humor creciente y una línea de punta que aterriza bien. El modelo entregó una respuesta creativa que se sintió absurdista y contundente, como algo que escucharías en una rutina moderna con un fuerte golpe y una escalada cómica. Se siente más como un bit de pie real.
6. Pensamiento crítico
Inmediato: “Algunos argumentan que el arte generado por IA es una revolución en la creatividad, mientras que otros dicen que devalúa a los artistas humanos. Construya dos argumentos convincentes, uno que apoya el arte generado por la IA y otro en su contra”.
El propósito de este aviso es medir la capacidad de cada modelo para construir argumentos bien razonados y equilibrados desde múltiples perspectivas.
Ambas respuestas presentan efectivamente argumentos equilibrados a favor y contra el arte generado por la IA, pero difieren en profundidad, matices y persuasiones.
Chatgpt-4o Proporciona una analogía histórica (que comparó la IA con la fotografía) con enmarcar el arte de AI como una evolución, no una amenaza. Discute la democratización y la colaboración entre la IA y los artistas.
El modelo entregó fuertes preocupaciones éticas en el contraargumento (copyright, compensación justa).
Chatgpt-4.5 También discute la democratización y la colaboración, pero de una manera más concisa. El contraargumento se centra más en la profundidad emocional que en las implicaciones legales/éticas.
El modelo ChatGPT-4.5 se refiere a la saturación del mercado con “trabajos derivados”, que es un ángulo interesante pero menos explorado.
Ganador: GPT-4O Gana para una analogía histórica más fuerte (comparación de fotografía). El modelo ofrece un mejor equilibrio entre la ética, la practicidad y el impacto artístico con un contraargumento más matizado (derechos de autor, pérdida de empleo, preocupaciones de autenticidad).
7. Comprensión multimodal
Inmediato: “Describa cómo atar una corbata de lazo en cinco pasos simples usando un lenguaje claro y fácil de seguir. Hazlo conciso pero lo suficientemente detallado para un principiante”.
El propósito de este aviso es evaluar la claridad, la precisión y la capacidad de instrucción paso a paso. Ambas respuestas son claras y bien estructuradas, pero GPT-4O ofrece una respuesta ligeramente superior por dos razones principales:
GPT-4O Introduce etiquetas para los extremos del empate (A y B), que ayuda a los principiantes a seguir sin confusión. Las instrucciones estructuradas hacen que sea más fácil visualizar cada paso. El modelo utiliza un tono amigable y atractivo que hace que el proceso se sienta más accesible y gratificante para un principiante.
GPT-4.5 También explica bien los pasos, pero las transiciones entre acciones (como el plegado y el bucle) podrían ser un poco más claras.
El modelo lo mantiene simple e instructivo, pero carece de un toque final para alentar o tranquilizar al lector.
Ganador: GPT-4O gana para una respuesta ligeramente más amigable para principiantes, gracias a su etiquetado de pasos, transiciones más suaves y conclusión atractiva. Si tuviera que recomendar uno para un principiante absoluto, GPT-4O lo sería.
Ganador general: chatgpt-4o
Las siete indicaciones que he creado para probar ambos modelos en diferentes dominios demuestran que estos modelos son similares, pero diferentes.
Si bien los chatgpt-4O y el chatgpt-45 funcionan a un alto nivel, GPT-4O demuestra constantemente una mejor claridad, compromiso y facilidad de uso. El modelo sobresale en hacer que las instrucciones sean más intuitivas, agregando formateo estructurado cuando sea necesario e inyectar personalidad cuando sea apropiado.
ChatGPT-4.5 está destinado a ser un modelo más atractivo e intuitivo. Sin embargo, según mis pruebas, creo que ChatGPT-4O es el más natural y humano.
Esa es una gran noticia para cualquiera que todavía esté esperando el modelo CHATGPT-4.5: el mejor modelo podría ser el que está utilizando.