Connect with us

Noticias

5 cosas increíbles que puedes hacer con el nuevo modo de operador de ChatGPT?

Published

on

El nuevo modo de operador de ChatGPT es su primer paso para convertirse en un agente de IA: un nuevo tipo de herramienta de IA que lleva a cabo tareas mucho más complejas sin la necesidad de intervención humana.

Pero, ¿qué puede hacer exactamente?

Actualmente, en modo de vista previa, la última actualización para ChatGPT funciona combinando el modelo de razonamiento GPT4O con capacidades de visión por computadora. Esto lo permite “ver” e interactuar con cualquier cosa en una pantalla.

Lo hace con la ayuda de un navegador web incorporado, y después de decirle lo que queremos que haga, puede sentarse y mirar mientras mueve el mouse, presiona los botones y el texto de las entradas.

Entonces, ¿qué puede hacer? Bueno, solo de jugar con él, es evidente que todavía está en una etapa temprana de desarrollo. Sin embargo, tiene algunos trucos impresionantes bajo la manga.

Aquí hay una descripción general de algunas de las tareas que he visto funcionar hasta ahora, así como una mirada a la que esto podría significar para el futuro de la IA “agente”.

¿Cómo acceder al operador de chatgpt?

En primer lugar, el operador de ChatGPT solo está disponible en los EE. UU. En este momento y solo para usuarios que han sacado la suscripción Pro de $ 200 por mes.

Probablemente este no siempre sea el caso: los creadores de chatgpt OpenAi tienden a implementar nuevas características a pequeños grupos como los usuarios profesionales primero antes de abrirlos a una audiencia más amplia.

Pero si tienes la suerte de cumplir con esos criterios, entonces deberías estar listo para ir. Simplemente diríjase a operador.chatgpt.com para comenzar.

Cosas que hacer con el operador

El operador está diseñado para llevar a cabo tareas más complejas y de varios pasos de lo que es posible utilizando el chatGPT estándar. Es capaz de llevar a cabo hasta tres de estas tareas al mismo tiempo.

Si bien está diseñado para ser autónomo, hay momentos en los que tendrá que controlar a mano hacia usted, por ejemplo, para iniciar sesión en sitios web o para resolver los desafíos de Captcha.

Una característica realmente útil son las integraciones. Estas son instrucciones sobre el uso de sitios o servicios específicos, como Airbnb u OpenTable, por lo que el operador no tiene que aprender cómo usarlos desde cero cada vez que los encuentra. Dado que estas integraciones se crean utilizando indicaciones de lenguaje natural, las empresas pueden desarrollar y compartir fácilmente los suyos con los clientes.

Estas son algunas de las cosas que ya puede hacer:

Encontrar y reservar alojamiento a través de Airbnb

Dígale que se dirija a Airbnb para encontrar una habitación basada en sus preferencias, y buscará opciones, verificará las reseñas y se asegurará de que esté satisfecho con su elección antes de continuar con la reserva.

Muestra de muestra: “Encuentra una habitación de Airbnb en [destination] de [check-in date] a [check-out date] para [number of guests]. Priorizar propiedades con buenas críticas, Wi-Fi y servicios como [list preferred amenities, e.g., kitchen, balcony, pet-friendly]. Asegúrese de que la ubicación esté cerca de [landmarks or areas, if important]. Confirme la disponibilidad y los detalles antes de la reserva “.

Hacer reservas de restaurantes

El operador se integra con OpenTable y puede escanear servicios como TripAdvisor para investigar y reservar reservas de restaurantes.

Muestra de muestra: “Encuentra un restaurante altamente calificado cerca [location or city name] que sirve [preferred cuisine or dietary preferences, e.g., Italian, vegan-friendly]. Reserve una mesa para [number of people] en [date] en [time]. Asegúrese de que el restaurante tenga buenas críticas y confirme la reserva antes de finalizar “.

Bolsa de reserva para un evento

¿Quieres ver música o deportes en vivo o tomar un programa? El operador navegará por los directorios de eventos e se integrará directamente con StubHub para encontrar los mejores asientos a los mejores precios.

Muestra de muestra: “Buscar eventos que ocurran cerca [your location] en [specific date or date range, e.g., February 10th or next weekend]. Incluya conciertos, espectáculos de teatro, festivales o cualquier cosa única e interesante. Lista de opciones con detalles del evento, tiempos y precios de entradas. Una vez que elija uno, reserve los boletos para [number of people] y confirmar la reserva “.

Planificar y comprar comidas

El operador no solo planificará su menú, sino que se integrará con Instacart para pedir los ingredientes y les entregará a su puerta.

Muestra de muestra: “Planifique las comidas para una familia de [number of people] Por una semana (desayuno, almuerzo, cena). Tenga en cuenta los siguientes requisitos dietéticos: [list requirements, e.g., gluten-free, vegetarian, nut-free, low-carb]. Incluya una mezcla de recetas saludables y familiares. Una vez planeado, ordene los ingredientes en línea y asegúrese de que la entrega esté programada para [preferred delivery date and time]. Ya tengo [insert staples, e.g., milk, sugar, flour]por lo que no necesitas pedirlos “.

Actualizar o realizar cambios en un sitio web

¿Qué tal algo más desafiante? Desde cargar páginas de blog hasta cambiar elementos de diseño y generar contenido completamente nuevo, el operador puede integrarse con plataformas de construcción sin código como WIX para hacer el trabajo. Si bien construir un sitio completo desde cero puede ser un poco exigente (en este momento), puede llevar a cabo mantenimiento de rutina, ajustes de diseño y actualizaciones con relativa facilidad.

Solicitud de muestra: “Edite el sitio web [website URL or description of the page] Para actualizar lo siguiente: [describe what you want to be changed]. Iniciar sesión [insert no-code service, e.g., Wix] Para hacer los cambios. Asegúrese de que el diseño permanezca consistente y fácil de usar. Una vez que se realizan las ediciones, muéstreme el resultado final para su revisión “.

El comienzo de algo grande?

Aunque son los primeros días, creo que el operador podría marcar el comienzo de un nuevo capítulo en la historia de la IA. Posiblemente incluso un cambio en la relación fundamental entre humanos y máquinas.

La IA Agentic es el primer paso hacia la creación de máquinas de pensamiento verdaderamente autónomas que pueden actuar como asistentes para nosotros en todos los campos de la vida.

Algunos creen que es un paso hacia la inteligencia general artificial (AGI): el “santo grial” de la IA donde las máquinas pueden aprender tal como lo hacemos para realizar tareas más allá de las que han sido programadas.

La llegada de Chatgpt hace solo dos años marcó un momento decisivo para la IA. Ahora, la llegada de la IA de agente marca otra, y estoy tan seguro de que va a cambiar el mundo de manera difícil de imaginar hoy.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

Creé una presentación completa usando Gemini en Google Diaides, así es como fue

Published

on

Google Slides es una herramienta poderosa, pero crear una presentación completa puede llevar mucho tiempo. Recientemente, Google introdujo la integración de Gemini en diapositivas y todas las aplicaciones del espacio de trabajo. Ahora, solo necesita indicaciones de texto para crear presentaciones atractivas e imágenes de alta calidad para sus diapositivas. Tuve que verlo yo mismo, y decidí experimentar con Géminis y lo encargué con la construcción de una presentación completa.

En esta publicación, comparto mi viaje y revelo cómo Gemini manejó el desafío y si ofrece la promesa de presentaciones sin esfuerzo.

Relacionado

Google Gemini: Todo lo que necesita saber sobre la IA multimodal de próxima generación de Google

Google Gemini está aquí, con un enfoque completamente nuevo para la IA multimodal

Acceso a Géminis en las diapositivas de Google: requisitos

Usando Géminis en las diapositivas de Google

Antes de encender las hojas de Google en la web, repasemos los requisitos. Si bien varios modelos Gemini son gratuitos de descargar y usar, pagará más para desbloquear el asistente de IA en las aplicaciones de productividad de Google.

Debe comprar el plan avanzado de Gemini a $ 20 por mes. Después de eso, la opción Géminis aparece en Docs, Hojas, Gmail, Google Drive y Slides. Google también ofrece un mes de prueba gratuita para usuarios elegibles.

Dado que Google Slides es una solución web, puede explorar la integración de Gemini en escritorios de Windows, Mac y Chromebooks.

Explorando Géminis en las diapositivas de Google

Genere diapositivas utilizando un mensaje de texto

Después de habilitar Gemini en Google Slides, es hora de verificarlo en acción. En el siguiente ejemplo, crearé una presentación sobre los beneficios de un estilo de vida saludable. Mi objetivo es cubrir los beneficios de la nutrición, el ejercicio regular, el bienestar mental y el manejo del estrés. Siga los pasos a continuación.

  1. Inicie las diapositivas de Google en la web e inicie sesión con los detalles de su cuenta de Google. Comience con una presentación en blanco.

  2. Abra Géminis desde la esquina superior derecha y escriba un aviso.

Escribir un aviso es una parte crucial de su proceso de presentación. Dado que es un tema amplio y adaptable, sea lo más descriptivo posible. En nuestro caso, escribiré un aviso a continuación para mi diapositiva de introducción.

Genere una diapositiva con el título “Los beneficios de un estilo de vida saludable”. Agregue una definición breve de un estilo de vida saludable, enfatizando el equilibrio del bienestar físico, mental y nutricional.

Esto es lo que se le ocurrió a Géminis. Puede volver a intentarlo si no está satisfecho con los resultados y haga clic en Insertar para agregarlo.

Géminis creando diapositivas en las diapositivas de Google

Ahora, haga clic + + Para agregar una nueva diapositiva y continuar escribiendo indicaciones para generar nuevas diapositivas para su presentación.

Cree una diapositiva titulada “Nutrición: alimentar su cuerpo”. Agregue información sobre la importancia de las frutas y verduras.

Géminis creando una diapositiva nutritiva

A diferencia de Copilot en PowerPoint, no puede crear múltiples diapositivas a la vez. Debes describir cada diapositiva por separado. Por lo tanto, asegúrese de planificar el esquema de su presentación.

Después de eso, creé cuatro diapositivas nuevas utilizando las indicaciones de texto a continuación.

Cree una diapositiva titulada, “Ejercicio: moverse para un usted más saludable”. Agregue información sobre la cantidad recomendada de ejercicio por semana.

Usar Géminis para crear una presentación

Crea una diapositiva titulada, “Bienestar mental: encontrar tu paz interior”. Agregue puntos de bala en buenos hábitos de sueño.

Diapositiva de bienestar mental para diapositivas de Google

Genere una diapositiva que enumere los beneficios de un estilo de vida saludable, que incluye un aumento de la energía, un mejor estado de ánimo y un mejor sueño.

Beneficios de la diapositiva de estilo de vida saludable

Cree una diapositiva de conclusión con pasos prácticos para adoptar un estilo de vida más saludable. Incluir puntos de bala orientados a la acción.

Use Géminis para crear conclusión diapositiva

Hubo algunos casos en los que no estaba satisfecho con los resultados. Entonces, le pedí a Gemini que recreara esas diapositivas. Además, no te sorprenderá con diseños de diapositivas llamativas y animaciones. Debe agregarlos manualmente y completar su presentación.

En cualquier momento, puede escribir @Nombre del archivo Y solicite a Gemini que se refiera a un documento de su cuenta de Google Drive. Por ejemplo, si escribió una dieta vegetariana en un documento, puede pedirle a Gemini que se refiera a ella para sus diapositivas de presentación.

Estás usando diapositivas generadas por AI. La precisión puede recibir un éxito cuando se trata de temas complejos como IA, fotografía computacional, aprendizaje automático y más. Compruebe dos veces antes de compartir la presentación con otros.

Relacionado

Google Gemini: 5 maneras de usar el asistente a día a día de Google con IA

Puede hacer que muchas tareas cotidianas sean mucho más fáciles

Crear e insertar imágenes con Gemini

No tenía idea de que Géminis podía crear imágenes basadas en indicaciones de texto. Es un gran ahorro de tiempo, ya que no necesita buscar imágenes en la web para obtener imágenes adecuadas para su presentación. Generé un par de imágenes relevantes utilizando las indicaciones de texto a continuación.

Una imagen de una placa equilibrada con proteína magra, granos integrales y verduras.

Generar una imagen con Géminis

Una fotografía de primer plano de un vaso de agua con rebanadas de limón y pepino.

Cree una imagen usando Gemini en Google Diagras

Gemini le ofrece cuatro opciones de imagen para sus diapositivas. Puede verlos e insertarlos en sus diapositivas.

Géminis hizo mis diapositivas

Géminis en Google Slides abrió mis ojos al potencial de la IA en la creación de presentación. Si bien no es un reemplazo perfecto para la creatividad humana y el pensamiento estratégico, es una herramienta poderosa para racionalizar el proceso, especialmente para elaborar borradores iniciales y imágenes llamativas.

Aún así, la supervisión humana es crucial, pero si tiene plazos ajustados o desea explorar nuevas formas de crear diapositivas atractivas, pruebe a Gemini. Gemini Advanced desbloquea el asistente de IA de Google en otras aplicaciones de productividad como Google Sheets. Así es como puedes aumentar tus hojas de cálculo con Gemini.

Continue Reading

Noticias

Google Assistant Transitions a Gemini: cambios clave por delante

Published

on

Google Assistant está evolucionando a Géminis, trayendo potentes nuevas capacidades de IA pero también descontinuando algunas características favoritas. Si usa el Asistente de Google para establecer temporizadores, reproducir música o controlar su hogar inteligente, prepárese para algunas interrupciones significativas a medida que la compañía comienza a reemplazar al asistente de nueve años con su chatbot Gemini más nuevo, más potente y alimentado por IA. Este artículo describirá los cambios clave que puede esperar, ayudándole a prepararse para la transición y comprender lo que será diferente.

Gemini representa un salto gigante en la capacidad en comparación con el Asistente de Google. Podrá chatear con Gemini de manera similar a la forma en que hablas con Google Assistant ahora, pero como se basa en modelos de lenguaje grande (LLM) con AI, Gemini puede ser mucho más conversacional y útil, capaz de realizar tareas más desafiantes y capaz de adaptarle sus respuestas específicamente a usted. Google ya ha comenzado la transición a Gemini. Los teléfonos inteligentes son los primeros en cambiar y serán seguidos por altavoces inteligentes, televisores, otros dispositivos domésticos, dispositivos portátiles y automóviles en los próximos meses. Los teléfonos inteligentes, con algunas excepciones importantes, se habrán mudado a Gemini por completo a fines de 2025, ya que “el asistente clásico de Google ya no se puede acceder en la mayoría de los dispositivos móviles o disponible para nuevas descargas en tiendas de aplicaciones móviles”, según Google.

Continue Reading

Noticias

Cómo se puede mejorar la investigación profunda de Chatgpt con 8 características clave

Published

on

La herramienta de investigación profunda de Chatgpt es fantástica para profundizar en casi cualquier tema que elija, pero aún necesita algunas mejoras para ser realmente útiles. Utilizo investigaciones profundas todo el tiempo y creo que sería mucho mejor con estas características adicionales.

1

Parámetros personalizables

Cuando uso la investigación de chatgpt profunda, normalmente respondo preguntas de seguimiento para darle a la herramienta más contexto. Sin embargo, desearía poder usar parámetros personalizables en su lugar.

Imaginaría que esta característica funcione como filtros al comprar en línea. Me encantaría elegir cuántos recursos quiero que se analice ChatGPT, junto con los plazos publicados. Además, sería genial si pudiera buscar en función de diferentes palabras clave.

Los parámetros personalizables mantendrían mi investigación mucho más organizada. Siento que los resultados valdrían la pena el tiempo que lleva a ChatGPT realizar investigaciones profundas también. Hasta que esto suceda, hay al menos formas en que puede obligar a ChatGPT a usar fuentes de alta calidad.

2

Opciones de diseño de investigación

La función de investigación profunda de ChatGPT puede establecer información de múltiples maneras. Por ejemplo, utilizará tablas al comparar estadísticas u otros aspectos. En otros casos, la herramienta establecerá información en subsecciones integrales.

Si bien varias opciones de diseño son buenas, desearía que ChatGPT me permita elegir cómo quiero que presente información. A veces, veo contenido presentado en forma de oración cuando prefiero usar tablas.

A veces uso las indicaciones para pedirle a ChatGPT que presente información en mi formato preferido, pero desafortunadamente, no siempre escucha.

3

Una asignación mensual más grande

Quizás mi mayor queja con la herramienta de investigación profunda de Chatgpt es lo fácil que es usar sus créditos mensuales. Aunque esto está bien para los usuarios casuales, 10 consultas mensuales no son suficientes para las personas que regularmente necesitan realizar una investigación integral. Revisé mis consultas en dos días.

Podía entender diez consultas mensuales para usuarios gratuitos; En estos casos, en realidad creo que sería un buen valor. Sin embargo, como alguien que paga $ 20 por mes por ChatGPT, no puedo evitar sentir que no me dan el mejor servicio posible.

Quedarse sin solicitudes en chatgpt

Por lo menos, creo que 15-20 consultas mensuales son justas para un plan positivo. Aumentaría aún más estas asignaciones para suscripciones de nivel superior. Operai podría incentivar a las personas a registrarse para estos planes al hacerlo, lo que resulta en una mejor experiencia del usuario y un aumento de los ingresos.

4

Una sección separada en chatgpt

Utilizo ChatGPT para múltiples conversaciones, ya sea que esté planeando una nueva parte de mi vida o quiero trabajar a través de mis pensamientos actuales. A medida que creo más chats, la interfaz se vuelve torpe y desorganizada. Molesto, no tengo forma de diferenciar entre conversaciones y discusiones ordinarias en las que he usado investigaciones profundas.

Si bien puedo crear nuevos proyectos a través de la barra lateral, prefiero que ChatGPT organice automáticamente mis conversaciones con una investigación profunda. Esta sería una mejora efectiva para la interfaz de usuario de ChatGPT, y no sería particularmente difícil de implementar.

Incluso si la aplicación no tuviera una sección separada, un diferenciador, como un ícono, sería útil.

5

Integración con GPTS personalizados

Los GPT personalizados son la función más subestimada de ChatGPT. Me encanta lo fácil que son para obtener el tipo de respuesta exacto que estaba buscando, y hay útiles GPT personalizados para todo tipo de intereses. Pero desafortunadamente, actualmente no puede integrarlos con la función de investigación profunda.

Siento que las respuestas serían mucho más precisas si tuvieran el contexto de GPT personalizados. Esto es particularmente cierto, considerando que algunos de mis chats normales tienen múltiples temas.

GPT personalizado como asistente de programación

No sé cómo sería posible porque imagino que los dos programas entrarían en conflicto. Pero si hubiera una manera de integrar investigaciones profundas y GPT personalizados, no veo cómo cualquier otra herramienta de IA podría competir en esta área.

6

La capacidad de dividir el texto en trozos más pequeños

He comparado la investigación profunda de ChatGPT con herramientas similares, como el equivalente de Microsoft Copilot. Cuando se trata de respuestas detalladas, la investigación profunda se encuentra en la cabeza y los hombros por encima de su competencia. Pero al mismo tiempo, a veces veo enormes párrafos una vez que la investigación ha concluido.

Encontrar información de la dieta en Chatgpt Investigación profunda

La lectura de Skim en una pantalla es mucho más difícil que con un libro, y a veces pierdo los puntos clave en la investigación. Cuando esto sucede, la investigación tarda más de lo que debería. Romper el texto en trozos más pequeños sería una solución simple pero efectiva.

Si todo el texto es realmente importante, ChatGPT podría dividirlo en más subsecciones. De esa manera, podría identificar la información más esencial fácilmente.

7

La opción de excluir sitios web específicos

La información inexacta es uno de los muchos grandes problemas con ChatGPT, y lamentablemente, esto se extiende a la función de investigación profunda. Puedo examinar ciertos sitios web al investigar a través de motores de búsqueda, pero este no es el caso cuando se utiliza una investigación profunda, lo que significa que debo tener mucho cuidado para verificar los recursos.

He visto características similares en otros tipos de aplicaciones, como bloqueadores de sitios web. La forma en que veo esto, los usuarios podrían ingresar a la URL para excluir un sitio de la búsqueda. Me imagino que esto aumentaría el tiempo que lleva completar estas tareas, pero sería un gran éxito.

8

Audio

ChatGPT tiene algunas características de voz geniales, pero ninguna se aplica a una investigación profunda. Tengo que escribir indicaciones de texto y recibo respuestas escritas. Si bien normalmente estoy contento con estas búsquedas, a veces me gustaría usar audio.

Cambiar la voz del altavoz en el modo de voz en chatgpt.

Además de hablar por una investigación profunda, agradecería las respuestas escritas. Me encantaría que la herramienta me cuente sobre sus hallazgos y proporcione una transcripción más tarde. Esto sería interactivo y beneficioso para las personas que aprenden mejor a través de la escucha que la lectura.

Operai inevitablemente agregará nuevas características a la herramienta de investigación profunda de ChatGPT a su debido tiempo, y creo que debería priorizar algunas adiciones simples pero efectivas. Los parámetros personalizables conducirían a hallazgos más precisos, y tener más control sobre el diseño de información también sería bueno.

Continue Reading

Trending