Noticias
Operai debuts Operator, un agente de IA con aplicaciones de comercio electrónico

Los minoristas en línea serán algunos de los primeros socios como OpenAI presenta al operador, su agente de inteligencia artificial (IA) diseñada para manejar tareas basadas en la web, incluido el comercio electrónico, en nombre de los usuarios. Los ejemplos de esas tareas incluyen productos de navegación, compras y pedidos.
Lanzado en una vista previa temprana para ciertos usuarios de los EE. UU., El operador es la primera herramienta oficial de “AI de Agente” de OpenAI. A diferencia de los chatbots que solo proporcionan respuestas, el operador actúa como un asistente virtual. Sus habilidades incluyen hacer clic, desplazarse y escribir para completar tareas en línea con una entrada mínima del usuario.
Para probar la herramienta en escenarios del mundo real, OpenAI dijo que se está asociando con grandes marcas de comercio electrónico, incluidas eBay, Instacart y Etsy. En estos escenarios, los usuarios solicitarían al operador que ordenara comestibles, encuentre un regalo o reserve un boleto en el sitio web de un socio. Si es necesario, los usuarios pueden intervenir en cualquier momento para ajustar un pedido o hacer ajustes, según OpenAI.
¿Cómo funciona el operador de OpenAI en contextos de comercio electrónico?
“El operador transforma la IA de una herramienta pasiva a un participante activo en el ecosistema digital”, escribió Operai en una publicación de blog anunciando la herramienta. “Redacción de las tareas para los usuarios y traerá los beneficios de los agentes a las empresas que desean experiencias innovadoras de los clientes y desean tasas de conversión más altas”.
El uso del operador es similar a ChatGPT. Los usuarios pueden iniciar sesión en operador.chatgpt.com. Luego, se les solicita que escriban la tarea que desean realizarse, como “ordenar comestibles” o “encontrar un hotel para mi viaje”. A partir de ahí, el operador lanza su propio navegador web virtual en la nube para completar la tarea.
La alimentación de la herramienta es el nuevo modelo de agente de uso informático (CUA) de OpenAI. La tecnología AI está capacitada para trabajar con interfaces gráficas de usuarios, permitiendo al operador “ver” sitios web e interactuar haciendo clic en botones, completando formularios y navegando por menús, según OpenAI.
Interacción humana con el operador
Además, el operador permite a los usuarios guardar flujos de trabajo, esencialmente, instrucciones paso a paso para las tareas que realizan a menudo. Por ejemplo, los usuarios tienen la opción de crear una solicitud personalizada para reordenar elementos específicos en Instacart. Alternativamente, podrían reservar vuelos en una aerolínea específica. Operai dijo que el operador también maneja múltiples tareas a la vez, como “ordenar una taza de esmalte personalizada en Etsy mientras reserva un campamento en Hipcamp”.
Aún así, hay momentos en que todavía se requiere la entrada humana. Por ejemplo, los usuarios deben ingresar manualmente información confidencial, como los detalles de pago o inicio de sesión, dijo OpenAI.
Actualmente, el operador se encuentra en una “vista previa de investigación” limitada y solo está disponible para los usuarios de EE. UU. Suscritos al plan Pro de $ 200 a mes de Openi. A medida que refina la herramienta en función de los comentarios, Openai dijo que planea expandir el operador a otros planes pagados, países y, finalmente, la versión gratuita de ChatGPT.
“Todavía tenemos mucho trabajo que hacer para mejorarlo, pero realmente queremos ponerlo en manos de las personas”, dijo el CEO de Openi, Sam Altman, durante una demostración de transmisión en vivo de la tecnología. “También tendremos más agentes para lanzar en las próximas semanas y meses”.
Las asociaciones minoristas traen casos de uso del mundo real al operador
Para mostrar el potencial del operador, Operai se ha asociado con las principales compañías como eBay, Etsy e Instacart.
Rangos de eBay No. 6, y Etsy es el número 20 en la base de datos global de mercados en línea de Commerce 360. La base de datos clasifica los 100 mercados más grandes de este tipo por valor de mercancía bruta de terceros (GMV).
Para Instacart, el operador puede hacer que las compras de comestibles sean más rápidas y simples. En una demostración durante la transmisión en vivo, un usuario subió una foto de una lista de comestibles escritas a mano. El operador luego tomó la lista, construyó el pedido y programó la entrega.
“El operador de Openi es un avance tecnológico que hace que los procesos como ordenar comestibles sean increíblemente fáciles”, dijo Daniel Danker, director de productos de Instacart, en un comunicado.
Mientras tanto, Etsy dijo que ve al operador como una forma para que los compradores encuentren más rápidamente artículos únicos de sus millones de pequeños vendedores. “En un mundo cada vez más automatizado, Etsy se centra en implementar la IA de manera que mejore la conexión humana en el corazón de nuestro mercado”, compartió la compañía en una publicación de LinkedIn.
En eBay, la colaboración con OpenAI es un paso importante en la estrategia de IA de la plataforma, escribió Nitzan Mekel-Bobrov, director de IA de eBay, en una publicación de blog corporativo.
“Nuestra colaboración con OpenAI presentará un nuevo paradigma de descubrimiento y compras en línea”, dijo, y agregó que el operador puede dirigir a los usuarios a eBay para encontrar artículos únicos. “Anticipamos que a través de esta colaboración, ampliaremos el alcance de nuestros vendedores, dando a más exposición a los compradores al inventario único de eBay”, dijo.
Seguridad, privacidad y desafíos
Openai reconoció los riesgos involucrados en la creación de una herramienta de IA que puede actuar en nombre de alguien.
Para abordar las preocupaciones de seguridad, compartió algunas salvaguardas que ha incorporado al operador:
- Modo de adquisición: Los usuarios deben ingresar información confidencial, como los detalles de pago, ellos mismos. El operador no guarda estos datos, dijo.
- Pasos de aprobación: La IA se detiene para la confirmación del usuario antes de completar acciones importantes, como colocar pedidos.
- Límites de tarea: El operador está capacitado para rechazar tareas riesgosas, como la gestión de cuentas bancarias.
- Monitoreo en tiempo real: En sitios confidenciales como correo electrónico o servicios financieros, el operador requiere una estrecha supervisión de sus acciones, lo que permite a los usuarios captar directamente cualquier error.
El operador también incluye herramientas de privacidad. Por ejemplo, tendrá la capacidad de eliminar el historial de navegación, borrar los inicios de sesión guardados y optar por no participar en el intercambio de datos. Operai dice que actualiza continuamente sus salvaguardas para evitar el mal uso y garantizar la seguridad del usuario.
Dicho esto, el operador aún no es perfecto. Lucha con tareas más complejas, como la gestión de calendarios o la creación de presentaciones de diapositivas, dijo Openai.
A largo plazo, Operai espera ofrecer su modelo de agente de uso de la computadora a los desarrolladores a través de una interfaz de programación de aplicaciones (API). Esto permitiría a las empresas construir sus propios agentes con IA para diferentes tareas.
El operador ingresa a la creciente carrera de agentes de IA
El operador está entrando en un campo lleno de gente donde los gigantes tecnológicos ya están construyendo agentes de IA similares.
Empresas, incluidas Google y Salesforce, han lanzado sus propias herramientas de agente. Se comercializan para manejar tareas, como responder las preguntas de los clientes, programar citas y completar formularios. Bytedance, la empresa matriz de Tiktok, también ingresó a la refriega en enero con su agente de IA de código abierto, UI-Tars. Su agente realiza tareas paso a paso similares a lo que el operador está diseñado para hacer.
En el sector minorista, Nvidia presentó recientemente su plan de IA para asistentes de compras. El flujo de trabajo de referencia de IA generativo ayuda a los desarrolladores a construir asistentes digitales de IA que trabajan junto con los trabajadores humanos. Los asistentes pueden procesar el texto y las indicaciones de imagen. También pueden buscar múltiples artículos a la vez y responder preguntas como si un producto es impermeable, dijo Nvidia.
“Los agentes de IA con capacidades avanzadas como estas están diseñados para mejorar las experiencias del cliente, generar tasas de conversión más altas, más bajas tasas de retorno del producto y aumentar el tamaño promedio de los pedidos a través de sugerencias altamente inteligentes y personalizadas de productos o actualizaciones complementarias”, dijo Nvidia.
Mientras tanto, Mekel-Bobrov de eBay dijo que la evolución de los grandes modelos de idiomas a los sistemas de agente está “sucediendo más rápido de lo que la mayoría de nosotros habría predicho hace solo un año”. Él cree que las interacciones basadas en agentes probablemente “jugarán un papel importante en el futuro del comercio electrónico en los próximos años y de la economía digital en general”.
“Este es solo el comienzo”, dijo Mekel-Bobrov. “A medida que continuamos evolucionando nuestras capacidades de agentes de IA internos y profundizamos nuestras asociaciones estratégicas, estamos aprendiendo cómo estas tecnologías pueden capacitar mejor a los compradores para descubrir más de las cosas que aman y permitir a los vendedores hacer crecer sus negocios con éxito”.
¿Se clasifica en nuestras bases de datos?
Envíe sus datos y veremos dónde encaja en nuestra próxima actualización de clasificación.
Inscribirse
Manténgase al tanto de los últimos desarrollos en la industria minorista en línea. Regístrese para obtener una suscripción de cortesía a Digital Commerce 360 Retail News. Síguenos en LinkedIn, X (anteriormente Twitter)Facebook y YouTube. Sea el primero en saber cuándo Digital Commerce 360 publica contenido de noticias.
Favorito
Noticias
5 gemas simples de Géminis que solía permanecer en la tarea

Hay algo poderoso en tener la persona adecuada a la que recurrir en el momento adecuado. Es por eso que uso Gemini Gems cuando quiero ser productivo en mi teléfono, tableta o Chromebook. Piense en ellos como compañeros de trabajo digital, cada uno excelente en algo único. Confío en ellos durante los maratones de codificación nocturnos, los períodos de examen y la preparación de la entrevista de último minuto. En este artículo, discuto las gemas que uso regularmente, para qué están diseñados y cómo uso la inteligencia artificial para seguir siendo productivo.
Relacionado
10 maneras en que uso IA para simplificar mi vida diaria
Aprenda nuevas formas de hacer trabajo, estudios y pasatiempos
5
Encontrar nuevas ideas con lluvia de ideas
Esta gema saca ideas creativas de la nada
No puedo contar la frecuencia con la que me siento frente a una página en blanco, tratando de escribir algo que valga la pena, o se me ocurra una idea medio decente, solo para sentirme completamente atascado. Ahí es cuando recurro a la gema de Brainstormer. Te ayuda a superar el bloqueo del escritor, pensar fuera de la caja y mantener tu impulso.
Omita el pensamiento excesivo, navegue por sugerencias, elija y refine lo que funciona, y avanza. El mismo impulso creativo también resulta útil fuera del mundo digital. La compra de regalos me estresa, especialmente cuando no tengo idea de qué conseguir a alguien que lo tenga todo. Brainstormer me ayuda a encontrar ideas de regalos originales basadas en los intereses de mis amigos, los pasatiempos y nuestros chistes internos.
4
Permanecer en el flujo de codificación con la depuración asistida
Esta joya me salva del desplazamiento interminable a través de la documentación
Coding Partner Gem es un asistente de programación que lo ayuda a escribir código, solucionar errores y comprender conceptos de codificación desconocidos sin interrumpir su flujo. Viene a mi rescate cuando estoy en una sesión de codificación y algo se rompe, o cuando quiero verificar la sintaxis de algo en Python.
Puedo preguntar cualquier cosa, por ejemplo, “¿Por qué se muestra este error y cómo puedo solucionarlo?” o “¿Puedes guiarme a través de cómo funciona este fragmento de código?” Y me muestra cómo. Puede usar su compañero de codificación en cualquier nivel de habilidad, independientemente de su nivel de habilidad. No tendrá que cavar a través de los foros o la documentación de Stack Overflow cuando tenga un problema.
3
Estudiar Smarter con el entrenador de aprendizaje a mi lado
Esta gema desglosa temas en trozos fáciles de aprender
Learning Coach Gem es un tutor que divide información compleja en segmentos digeribles para ayudarlo a aprender nuevos temas. El entrenador de aprendizaje también puede construir un plan de estudio personalizado basado en sus objetivos, lo cuestiona sobre lo que aprendió y lo guiará a través de temas paso a paso. Un camino claro y respuestas inmediatas reducen la procrastinación y evitan la deriva del sujeto. No más cavar a través de información dispersa cuando su tiempo de estudio es estructurado y eficiente.
Con cuestionarios rápidos y preguntas de seguimiento, el aprendizaje se vuelve activo, no pasivo. El entrenador de aprendizaje Gema se convierte en mi amigo de estudio cuando se prepara para los exámenes. Alimento el esquema de contenido desde mis diapositivas de conferencias y le pido que explique las partes donde me perdí la clase. A veces voy un paso más allá y lo doy más del examen, luego le pido a Gemini que genere preguntas similares basadas en el material que estoy estudiando.

Relacionado
5 razones por las cuales Google dominará la carrera armamentista de IA con soluciones como Gemini y Notebooklm
Google está bien posicionado para ganar con su IA
2
El editor de escritura arregla mi escritura sin romper el flujo
Escribo mejor, más rápido y con menos dudas.
Escribir es una cosa, editar es otra. Es fácil quedarse atascado relevando el mismo párrafo, adivinar las opciones de sus palabras o buscar reglas de gramática en Google. Ahí es donde ayuda la gema del editor de escritura. Esta joya verifica su gramática, ortografía y puntuación mientras ofrece comentarios útiles sobre el estilo, el tono y la estructura. Marca las oraciones de ejecución, sugiere una mejor frase y recomienda elecciones de palabras más fuertes, haciendo que su mensaje sea limpio y seguro.
No más de ida y vuelta sobre encontrar algo que suene bien. En lugar de romper su flujo de escritura para arreglar una oración, continúa y el editor de escritura se encarga de los detalles. Entre esto y Grammarly, tengo una red de seguridad de edición sólida para mis tareas de ensayo.
1
Uso de la guía de carrera para prepararse para los movimientos de carrera
Esta joya es mi opción para la redacción y entrevistas de reanudación.
Descubrir su próximo movimiento de carrera puede ser estresante. La gema de la guía profesional lo ayuda a mapear sus objetivos y mejorar sus habilidades. Lo uso para actualizar mi currículum, prepararme para entrevistas y explorar nuevas direcciones basadas en mis intereses y fortalezas. Una de las cosas más útiles ha sido practicar preguntas comunes de la entrevista y ensayar mis respuestas. También lo uso para generar currículums personalizados de acuerdo con descripciones de trabajo específicas, lo que ayuda a que mis aplicaciones se destaquen.
Ese enfoque me dio una pasantía. Pregunte a la guía profesional un plan claro y paso a paso. Puede ayudarlo a priorizar las tareas, como repasar una habilidad, actualizar su perfil de LinkedIn o aplicar roles que coincidan con sus objetivos. No se detiene en la búsqueda de empleo. También le ayuda a desarrollar un impulso a largo plazo con redes prácticas, estrategias de crecimiento y desarrollo de habilidades.

Relacionado
7 formas de usar Gemini como asistente de búsqueda de empleo
Hacer la búsqueda de empleo más fácil con Géminis
Resolver problemas de nicho construyendo su propia gema
En lugar de tratar de hacer todo de forma independiente (y potencialmente atascado o distraído), puede confiar en estos ayudantes de IA. No tiene que conformarse si tiene un problema o flujo de trabajo único. Cree una gema personalizada que se adapte a su nicho.
Noticias
¿Qué modelo de chatgpt es el mejor? Una guía sobre qué modelo usar y cuándo.
Chatgpt no es un monolito.
Desde que Operai lanzó por primera vez el Buzzy Chatbot en 2022, ha implementado lo que parece un nuevo modelo cada pocos meses, utilizando una panoplia confusa de nombres.
Varios competidores de Operai tienen populares Alternativas de chatgptcomo Claude, Géminis y perplejidad. Pero los modelos de Openai se encuentran entre los más reconocibles de la industria. Algunos son buenos para tareas cuantitativas, como la codificación. Otros son mejores para hacer una lluvia de ideas sobre nuevas ideas.
Si está buscando una guía sobre qué modelo usar y cuándo, está en el lugar correcto.
GPT-4 y GPT-4O
Openai lanzó por primera vez GPT-4 en 2023 como su modelo de lenguaje grande. El CEO Sam Altman dijo en un podcast de abril que la modelo tomó “cientos de personas, casi todo el esfuerzo de Openi” para construir.
Desde entonces, ha actualizado su modelo insignia a GPT-4O, que lanzó por primera vez el año pasado. Es tan inteligente como GPT-4, que es capaz de acumular el SAT, el GRE y pasar la barra, pero es significativamente más rápido y mejora sus “capacidades entre el texto, la voz y la visión”, dice Openii. El “O” significa Omni.
4O puede traducir rápidamente el habla y ayudar con el álgebra lineal básica, y tiene las capacidades visuales más avanzadas.
Sus imágenes de estilo Studio Ghibli tocaron la emoción en línea. Sin embargo, también planteó preguntas de derechos de autor cuando los críticos argumentaron que Operai se está beneficiando injustamente del contenido de los artistas.
Operai dice que 4O “se destaca en las tareas cotidianas”, como hacer una lluvia de ideas, resumir, escribir correos electrónicos y revisar informes.
GPT-4.5
Altman describió a GPT-4.5 en una publicación sobre X como “el primer modelo que se siente como hablar con una persona reflexiva”.
Es el último avance en el paradigma de “aprendizaje sin supervisión” de OpenAI, que se centra en ampliar los modelos en el “conocimiento de las palabras, la intuición y la reducción de las alucinaciones”, dijo la miembro del personal técnico de Operai, Amelia Glaese, durante su presentación en febrero.
Entonces, si está teniendo una conversación difícil con un colega, GPT-4.5 podría ayudarlo a replantear esas conversaciones en un tono más profesional y tacto.
Operai dice que GPT-4.5 es “ideal para tareas creativas”, como proyectos de colaboración y lluvia de ideas.
O1 y O1-Mini
Openai lanzó una mini versión de O1, su modelo de razonamiento, en septiembre del año pasado y la versión completa en diciembre.
Los investigadores de la compañía dijeron que es el primer modelo capacitado para “pensar” antes de que responda y se adapte bien a las tareas cuantitativas, de ahí el “modelo de razonamiento” del apodo. Esa es una función de su técnica de entrenamiento, conocida como cadena de pensamiento, que alienta a los modelos a razonar a través de problemas descomponiéndolos paso a paso.
En un artículo publicado en la capacitación de seguridad del modelo, la compañía dijo que “los modelos de capacitación para incorporar una cadena de pensamiento antes de responder tienen el potencial de desbloquear beneficios sustanciales, al tiempo que aumentan los riesgos potenciales que provienen de una inteligencia aumentada”.
En un video de una presentación interna de Operai en los mejores casos de uso para O1, Joe Casson, un ingeniero de soluciones en OpenAI, demostró cómo O1-Mini podría resultar útil para analizar el máximo beneficio en una llamada cubierta, una estrategia de negociación financiera. Casson también mostró cómo la versión de vista previa de O1 podría ayudar a alguien razonar a través de cómo crear un plan de expansión de la oficina.
Operai dice que el modo Pro de O1, una “versión de O1 que utiliza más cómputo para pensar más y proporcionar respuestas aún mejores a los problemas más difíciles”, es mejor para un razonamiento complejo, como crear un algoritmo para el pronóstico financiero utilizando modelos teóricos o generar un resumen de investigación de varias páginas en tecnologías emergentes.
O3 y O3-Mini
Los modelos pequeños han estado ganando tracción en la industria durante un tiempo como una alternativa más rápida y rentable a los modelos de base más grandes. Operai lanzó su primer modelo pequeño, O3 Mini, en enero, solo semanas después de que la startup de la startup china Butterfly Effect debutó el R1 de Deepseek, que conmocionó a Silicon Valley, y los mercados, con sus precios asequibles.
Openai dijo que 03 Mini es el “modelo más rentable” en su serie de razonamiento. Está destinado a manejar preguntas complejas, y Openai dijo que es particularmente fuerte en ciencias, matemáticas y codificación.
Julian Goldie, un influencer de las redes sociales que se centra en la estrategia de SEO, dijo en una publicación sobre el medio que O3 “brilla en tareas de desarrollo rápido” y es ideal para tareas de programación básicas en HTML y CSS, funciones simples de JavaScript y la construcción de prototipos rápidos. También hay una versión “mini alta” del modelo que, según él, es mejor para la “codificación y lógica compleja”, aunque tenía algunos problemas de control.
En abril, Openai lanzó una versión completa de O3, que llama “nuestro modelo de razonamiento más poderoso que empuja la frontera a través de la codificación, matemáticas, ciencias, percepción visual y más”.
Operai dice que el O3 se usa mejor para “tareas complejas o de múltiples pasos”, como la planificación estratégica, la codificación extensa y las matemáticas avanzadas.
O4 mini
Operai lanzó otro modelo más pequeño, el O4 Mini, en abril. Dijo que está “optimizado para un razonamiento rápido y rentable”.
La compañía dijo que logra un rendimiento notable para el costo, especialmente en “Matemáticas, codificación y tareas visuales”. Fue el modelo de referencia con mejor rendimiento en el examen de matemáticas de invitación estadounidense en 2024 y 2025.
O4 Mini, y su mini versión, son excelentes para un razonamiento rápido y más sencillo. Son buenos para acelerar cualquier tarea de razonamiento cuantitativo que encuentre durante su día. Si está buscando un trabajo más profundo, opte por O3.
Scott Swingle, alumbre de DeepMind y fundador de la compañía de herramientas de desarrolladores con IA Abante AI, probó O4 con un problema de Euler, una serie de problemas computacionales desafiantes lanzados cada semana más o menos. Dijo en una publicación sobre X que O4 resolvió el problema en 2 minutos y 55 segundos, “Mucho más rápido que cualquier solucionador humano. Solo 15 personas pudieron resolverlo en menos de 30 minutos”.
Operai dice que el O4 Mini se usa mejor para “tareas técnicas rápidas”, como consultas rápidas relacionadas con STEM. Dice que también es ideal para el razonamiento visual, como extraer puntos de datos clave de un archivo CSV o proporcionar un resumen rápido de un artículo científico.