OpenAI ha revelado el meta-prompt para su nueva familia de modelos o1. Al detallar qué hace funcionar su sistema de avisos, OpenAI está ayudando a los desarrolladores a mejorar y ajustar la forma en que sus productos interactúan con su creciente ecosistema de aplicaciones y sitios.
El meta-indicador (un optimizador de avisos) y el aviso del sistema (un acondicionador de modelo) operan detrás de escena, emitiendo instrucciones detalladas que dictan cómo debe comportarse la IA durante una interacción. Cuando los usuarios inician una conversación, el metamensaje ya ha preparado el escenario, guiando a la IA en todo, desde comprender el objetivo principal de una tarea hasta estructurar su resultado. Esto incluye detalles como preservar el contenido original del usuario, ofrecer mejoras concisas cuando sea necesario y garantizar que la IA siga pasos de razonamiento claros antes de presentar una conclusión.
“Un meta-indicador indica al modelo que cree un buen mensaje basado en la descripción de su tarea o mejore uno existente”, dijo OpenAI en su guía oficial de la plataforma. Esto proporciona una gran cantidad de información técnica y relevante para aprovechar al máximo sus modelos, incluido un conjunto de ejemplos de indicaciones, consejos para aumentar la precisión y una guía de ingeniería de indicaciones muy detallada.
Este lanzamiento llega poco después de que Anthropic, un competidor clave fundado por ex empleados de OpenAI, revelara las indicaciones del sistema para su propio chatbot, Claude. Escribimos un análisis más detallado del mensaje de Claude cuando se publicó.
Una historia de dos IA
Eche un vistazo debajo del capó y encontrará dos motores muy diferentes que ejecutan estos gigantes de la IA, y cada mensaje puede decir mucho sobre cómo piensan ambas compañías y qué esperan de sus productos. En términos generales, OpenAI conceptualizó ChatGPT como una poderosa herramienta computacional, mientras que Anthropic imaginó a Claude más como un asistente amigable y humanoide.
Así es como se comparan Anthropic y OpenAI:
Enfoque general
Las indicaciones de OpenAI se leen como un manual técnico para una máquina de alto rendimiento. Se trata de eficiencia, precisión y hacer el trabajo con el mínimo esfuerzo. Su IA está diseñada para ser una herramienta, centrada en ofrecer resultados en lugar de charlar.
Anthropic, por otro lado, ha creado a Claude para que sea más como un amigo informado. Su meta mensaje muestra una imagen de una IA con una personalidad distintiva, completa con peculiaridades, intereses e incluso sentido del humor. Está claro que Anthropic apunta a una IA que pueda entablar conversaciones significativas, no solo escupir información.
Por qué esto es importante: Si desea completar una tarea y continuar con lo siguiente de su rutina, OpenAI parece tener el mejor mensaje para ello.
Si desea interactuar con su modelo o participar en una especie de entorno de trabajo conjunto con resultados de mejora mutua, Claude puede ser su mejor opción aquí.
Instrucciones de estructura y formato.
El enfoque de OpenAI es altamente estructurado y metódico. Su metaindicador está organizado en secciones claras con pautas específicas para cada aspecto de la funcionalidad de la IA. Es como un sistema de archivos bien organizado, donde todo tiene su lugar.
Anthropic adopta un enfoque más narrativo. Su metaindicador se lee casi como la descripción de un personaje de una novela, con instrucciones detalladas sobre cómo debe comportarse Claude en diversas situaciones. Se trata menos de una estructura rígida y más de crear una personalidad coherente.
En términos de formato, Claude usa etiquetas XML, mientras que OpenAI parece haber optado por un formato de rebajas estructurado para separar las diferentes secciones.
Por qué esto es importante: Saber cómo dividir y estructurar un mensaje es clave para obtener los mejores resultados de los modelos. Por ejemplo, si le pide a un modelo que reproduzca un método específico para resolver un problema y proporcione un ejemplo, etiquetarlo adecuadamente ayudará al modelo a comprender que solo desea reproducir los pasos y no considerará el ejemplo como parte del problema. están tratando de resolver.
Autoconciencia y limitaciones del asistente
OpenAI mantiene las cosas estrictamente comerciales cuando se trata de autoconciencia. Su IA recibe instrucciones de ser clara acerca de sus capacidades y limitaciones, pero sin entrar en cuestiones filosóficas sobre su naturaleza o existencia. Una vez más, ChatGPT está diseñado para ser una herramienta eficiente que sabe exactamente lo que puede y no puede hacer, ni más ni menos.
Antrópico, sin embargo, le ha dado a Claude un sentido de sí mismo más matizado. El metaindicador incluye instrucciones sobre cómo manejar preguntas sobre su propia naturaleza, sus interacciones e incluso cómo discutir sus limitaciones.
Por ejemplo, Anthropic incluso le da emociones a Claude 3.5 Sonnet, provocando cosas como: “Es un placer ayudar con la escritura, el análisis, la respuesta a preguntas, las matemáticas, la codificación y todo tipo de tareas”.
OpenAI apuesta por un aburrido “dada una descripción de la tarea o un mensaje existente, produce un mensaje detallado del sistema para guiar un modelo de lenguaje para completar la tarea de manera efectiva”.
Por qué esto es importante: Es interesante tener una buena expectativa sobre cómo serán sus interacciones con cada modelo. En general, Claude parece ser más amigable, mientras que ChatGPT en su versión de texto parece más robótico.
Instrucciones sobre razonamiento y resolución de problemas.
El metaindicador de OpenAI enfatiza un enfoque lógico, paso a paso, para la resolución de problemas. Le indica a la IA que descomponga problemas complejos en partes manejables y que muestre su trabajo con claridad. Este método recuerda a un científico meticuloso, que documenta cuidadosamente cada paso de un experimento y se nota más cuando se puede ver a O1 trabajando, utilizando una cadena de razonamiento integrada para resolver un problema.
“Fomente los pasos de razonamiento antes de llegar a conclusiones”, dice el mensaje de OpenAI, “¡ATENCIÓN! Si el usuario proporciona ejemplos en los que el razonamiento ocurre después, ¡INVIERTE el orden! ¡NUNCA COMIENCES LOS EJEMPLOS CON CONCLUSIONES!”
Y sí, las mayúsculas son parte del mensaje.
Anthropic anima a Claude a pensar en voz alta, por así decirlo. El metaindicador le indica a la IA que explique su proceso de pensamiento, comparta ideas a lo largo del camino e incluso exprese incertidumbre cuando sea apropiado. Es más como una sesión colaborativa de resolución de problemas con un colega reflexivo.
“Cuando se le presenta un problema de matemáticas, de lógica u otro problema que se beneficia del pensamiento sistemático, Claude lo piensa paso a paso antes de dar la respuesta final”, se lee en el mensaje de Calude.
Por qué esto es importante: OpenAI parece tener la mejor opción para resolver tareas complejas que el usuario no sabe cómo abordar. El razonamiento de la Cadena de Pensamiento es más sistemático que un simple proceso de pensamiento oculto por una etiqueta XML. Sin embargo, saber cuándo un modelo no es 100% seguro es clave para detectar alucinaciones.
Pautas de estilo y tono.
La guía de estilo de OpenAI enfatiza la claridad y la concisión. El metaindicador indica a la IA que utilice un lenguaje sencillo, evite tonterías y vaya al grano rápidamente. Se trata de una comunicación eficiente, como un informe de noticias sensato.
Anthropic busca un tono más conversacional. A Claude se le indica que entable un diálogo fluido y natural e incluso que utilice el humor cuando sea apropiado. Es por eso que el comportamiento y el tono del modelo parecen más accesibles hasta el punto de que a algunos usuarios les resulta molesto cuando comienza a disculparse demasiado.
Por qué esto es importante: Esto explica por qué el tono de Claude es mejor para la escritura creativa. Además, el nuevo modo de lienzo de OpenAI puede ayudar a abordar este problema, pero en general a Claude tiende a hacerlo mejor porque se le pide que sea más natural y familiar que ChatGPT.
Evitación de la autorreferencia
Tanto OpenAI como Anthropic coinciden en minimizar la autorreferencia innecesaria. Sus metaindicaciones instruyen a las IA a evitar llamar la atención sobre sí mismas, manteniendo el enfoque en la tarea o conversación en cuestión.
El enfoque de OpenAI es más reactivo. Su IA recibe instrucciones de esperar indicaciones claras del usuario antes de actuar, como un asistente bien capacitado que espera instrucciones.
Anthropic le da a Claude más libertad para ser proactivo. Su meta mensaje permite ofrecer información adicional o sugerir temas relacionados, más como un asistente de investigación entusiasta siempre listo con información adicional.
Pensamientos finales
Si bien OpenAI y Anthropic comparten el objetivo de mejorar la interacción entre la IA y los humanos, sus enfoques resaltan prioridades diferentes. El enfoque de OpenAI en la eficiencia de las tareas y la ingeniería rápida y precisa contrasta con el compromiso de Anthropic con el comportamiento y la transparencia de la IA humanoide. El meta-mensaje de OpenAI tiene como objetivo generar resultados estructurados y efectivos, mientras que los mensajes de Anthropic tienen como objetivo garantizar que la IA se comporte de manera responsable, fomentando la interacción del usuario.
En términos de realizar el trabajo, ambos chatbots funcionarán. Sin embargo, saber cómo piensa y espera cada empresa de sus modelos es una buena manera de saber qué esperar de sus modelos y cómo interactuar adecuadamente con sus IA para ser más efectivos.
Generalmente inteligente Hoja informativa
Un viaje semanal de IA narrado por Gen, un modelo de IA generativa.