Connect with us

Noticias

Probé la nueva función de Gemini y funciona tal como esperaba

Published

on

Edgar Cervantes / Autoridad Android

Gemini 2.0 se lanzó ayer y Google anunció una función adicional junto con él. Llamado Deep Research, técnicamente es parte del modelo 1.5 Pro y le ayuda a realizar una investigación sobre un tema específico en minutos en lugar de las horas que normalmente necesitaría.

Es la función que estaba esperando porque tengo muchos intereses y Deep Research podría ayudarme a aprender más sobre ellos más rápido. Lo probé para ver qué tan bien funciona y tengo sentimientos encontrados al respecto.

¿Ya has probado la nueva función de investigación profunda de Gemini?

22 votos

Cómo utilizar la investigación profunda

Antes de pasar a la parte práctica y mi experiencia con la nueva herramienta Deep Research, hablemos sobre cómo usarla. Primero, las malas noticias: Deep Research es parte de la suscripción Gemini Advanced, por lo que deberás desembolsar $20 por mes para usarla. Google generalmente ofrece funciones pagas a los usuarios gratuitos con el tiempo, como lo hizo con su generador de imágenes de IA, pero la compañía no ha compartido ningún detalle al respecto hasta ahora. Además, Deep Research solo está disponible en la web en este momento, pero pronto llegará a las aplicaciones móviles.

Investigación profunda de Géminis

Mitja Rutnik / Autoridad de Android

Si tiene una suscripción a Gemini Advanced, abra el chatbot y seleccione la opción “1.5 Pro con investigación profunda” en el menú desplegable de la parte superior, como se muestra en la captura de pantalla anterior.

Entonces comienza la parte divertida. Puede comenzar con un mensaje muy simple como “Ayúdame a investigar tendencias de vehículos autónomos para mi ensayo”, o podría ser mucho más preciso con su solicitud. Una vez que ingrese su mensaje, Gemini creará un plan y le mostrará un resumen exacto del informe que creará a partir de la investigación. Puedes seguir adelante y estar de acuerdo con él o decirle a Géminis que lo cambie, ya sea agregándole algo o deshaciéndote de partes de él.

Luego tendrás que esperar unos minutos hasta que Deep Research haga su trabajo. Una vez que se complete la investigación, el informe completo estará disponible. Si necesita más información, puede hacer preguntas de seguimiento. También puede abrir el informe en Google Docs. Como todos los chats de Gemini, se guardará en tu historial para su uso posterior.

Práctica con la investigación profunda de Géminis

Plan de investigación profunda Géminis

Mitja Rutnik / Autoridad de Android

Así es como funciona Deep Research en el papel, pero ahora es el momento de ver qué tan bien funciona en la vida real.

Quería empezar con algo un poco más complejo. Soy un nerd de las finanzas y amo el mercado de valores. Intento estar al día de las últimas novedades a diario, pero no siempre es fácil. Algunas fuentes en línea me brindan una breve descripción de lo que sucedió en el mercado el día anterior, y si tengo preguntas adicionales o quiero datos más detallados, tengo que visitar numerosos sitios web para obtener todo lo que necesito.

Decidí probar si Deep Research podía brindarme todos los datos que quiero ver en una página y luego puedo hacer un seguimiento con preguntas adicionales si tengo alguna. Aquí está el mensaje que utilicé:

Bríndeme una descripción general completa del desempeño del mercado de valores de ayer, que incluya:

  • Variaciones porcentuales en los principales índices del mercado.
  • Acciones de alto y bajo rendimiento dentro del S&P 500.
  • Desempeño de las 10 principales empresas del S&P 500 por capitalización de mercado.
  • Noticias y eventos clave que influyeron en la actividad del mercado.
  • Análisis experto de la negociación del día.
  • Una vista previa de los factores que se espera afecten al mercado hoy

Gemini se apresuró a mostrarme el plan según mi mensaje y también incluyó más detalles, como la fecha exacta; vea la captura de pantalla anterior. Después de hacer clic en “Iniciar investigación”, tuve que esperar cuatro minutos y medio antes de que se completara la investigación. Esto puede parecer mucho tiempo ya que estamos acostumbrados a recibir comentarios de Gemini más o menos instantáneamente, pero debemos tener en cuenta que la IA extrajo datos de 73 sitios web; imagínese cuánto tiempo le llevaría hacerlo. por tu cuenta.

El informe creado parece fantástico a primera vista. No es muy largo y no es necesario que lo sea, ya que sólo debería ser una descripción general. Incluye un par de tablas y hay fuentes debajo de cada párrafo de las cuales puede verificar de dónde sacó Gemini los datos. Hasta ahora, todo bien. Sin embargo, una vez que comencé a leer el informe en detalle, las limitaciones de Deep Research se hicieron evidentes.

Informe de investigación profunda de Géminis

Mitja Rutnik / Autoridad de Android

Pero comencemos con lo positivo. La descripción general básica del mercado, junto con los cambios porcentuales de los principales índices, es excelente. La sección sobre noticias y eventos que impactaron el mercado también es sólida, aparte de algunos contratiempos, y vale la pena leer la conclusión.

Sin embargo, hay problemas en casi todas las secciones. La tabla que enumera el desempeño de las 10 principales empresas del S&P 500 por capitalización de mercado en realidad no incluye las 10 principales empresas por capitalización de mercado. Solo muestra nueve empresas, y ninguna de ellas se encuentra entre las 10 más grandes de EE. UU. Es más, no muestra el cambio porcentual de cuatro de las empresas que enumera y simplemente dice: “No disponible”.

El texto adjunto es aún más confuso, ya que habla de datos del año hasta la fecha en lugar de datos del día específico como solicité, lo que lo hace inútil para mí. Y lo que me pareció particularmente extraño es la frase: “Una empresa desconocida lideró el S&P 500 con un rendimiento en lo que va del año del 308,05%”. Este tipo de datos en el mercado de valores suele ser transparente, por lo que no estaba seguro de por qué Gemini no mencionaba el nombre de la empresa. ¿Qué pasa con todo el secreto, Google?

Sin embargo, todo quedó claro al mirar la fuente. La fuente no incluye los nombres de las empresas para los usuarios gratuitos, ya que es necesario tener una cuenta para verlas. Gemini no tuvo esto en cuenta, por lo que simplemente dijo “una empresa desconocida”. También había muchos otros datos sin importancia en varias secciones que parecían fuera de lugar y que realmente no aportaban mucho valor.

A Géminis le fue mejor en su segundo y tercer intento.

Sin embargo, intenté darle a Géminis una segunda y una tercera oportunidad. Primero le pedí que investigara diferentes estilos de diseño de interiores y combinaciones de colores y cuál era el más adecuado para un apartamento pequeño en un edificio moderno. La tarea fue mucho más fácil para Gemini que la relacionada con las acciones, y hizo un buen trabajo. Esta vez no hubo errores estúpidos, pero podría argumentar que el informe proporcionado fue un poco básico y no incluyó ninguna imagen, lo cual es importante cuando se habla de diseño. Cuando se le pidió que proporcionara imágenes, Gemini dijo que no podía hacerlo.

Luego le pedí que investigara el tema de los chatbots de IA y me dijera cuáles existen, qué pueden y qué no pueden hacer, cuánto cuestan y qué les depara el futuro. Salió similar al de diseño de interiores. No hubo errores importantes, pero la investigación fue un poco insulsa y se leyó como una publicación estándar en un sitio web. La introducción del informe incluso incluía una frase que decía: “Este artículo profundiza en el mundo de los chatbots de IA”. lo cual parece algo que Gemini acaba de sacar de un sitio que investigó.

el veredicto

Aplicación Géminis para iOS

Robert Triggs / Autoridad de Android

Según mi experiencia con las extensiones de Gemini, no esperaba que Deep Research funcionara exactamente como se anunciaba. Y tenía razón. Su uso para la investigación del mercado de valores para un día específico resultó ser más o menos inútil en general. Si bien me proporcionó muchos datos interesantes, se equivocó en suficientes cosas como para convencerme de no volver a usarlo. No me proporcionó los datos que solicité y parte de la información que contenía el informe era inútil y no debería incluirse en el informe.

Cuando se trata de temas más amplios (y sencillos) como los chatbots de IA y el diseño de interiores, la historia fue un poco diferente. Si bien los informes proporcionados fueron un poco insulsos y no muy detallados, no hubo errores importantes en ellos que se destacaran e hicieran que todo fuera inútil. Siempre puedes hacer preguntas de seguimiento si deseas obtener información adicional, y esa parte de Deep Research funciona bastante bien.

En general, Deep Research es un éxito y un fracaso.

Entonces, en general, Deep Research es un éxito y un fracaso. Pero aquí tenemos que ser realistas y tener en cuenta el hecho de que la IA aún se encuentra en una etapa temprana de su desarrollo. La idea detrás de esta herramienta Gemini es brillante y, aunque no funciona perfectamente por el momento, sigue siendo bastante útil en ciertos casos. Sólo tienes que ser selectivo en el uso que le darás.

Pero lo que me entusiasma es el futuro en el que Google solucione los problemas con Deep Research. Una vez que la mejore, la herramienta será invaluable en la vida de muchas personas cuando necesiten realizar una investigación en profundidad y no quieran pasar horas clasificando varias fuentes.

¿Qué opinas de la nueva herramienta de investigación profunda de Gemini? ¿Te ves usándolo?

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

¿Qué modelo de chatgpt es el mejor? Una guía sobre qué modelo usar y cuándo.

Published

on

Chatgpt no es un monolito.

Desde que Operai lanzó por primera vez el Buzzy Chatbot en 2022, ha implementado lo que parece un nuevo modelo cada pocos meses, utilizando una panoplia confusa de nombres.

Varios competidores de Operai tienen populares Alternativas de chatgptcomo Claude, Géminis y perplejidad. Pero los modelos de Openai se encuentran entre los más reconocibles de la industria. Algunos son buenos para tareas cuantitativas, como la codificación. Otros son mejores para hacer una lluvia de ideas sobre nuevas ideas.

Si está buscando una guía sobre qué modelo usar y cuándo, está en el lugar correcto.

GPT-4 y GPT-4O

Openai lanzó por primera vez GPT-4 en 2023 como su modelo de lenguaje grande. El CEO Sam Altman dijo en un podcast de abril que la modelo tomó “cientos de personas, casi todo el esfuerzo de Openi” para construir.

Desde entonces, ha actualizado su modelo insignia a GPT-4O, que lanzó por primera vez el año pasado. Es tan inteligente como GPT-4, que es capaz de acumular el SAT, el GRE y pasar la barra, pero es significativamente más rápido y mejora sus “capacidades entre el texto, la voz y la visión”, dice Openii. El “O” significa Omni.

4O puede traducir rápidamente el habla y ayudar con el álgebra lineal básica, y tiene las capacidades visuales más avanzadas.

Sus imágenes de estilo Studio Ghibli tocaron la emoción en línea. Sin embargo, también planteó preguntas de derechos de autor cuando los críticos argumentaron que Operai se está beneficiando injustamente del contenido de los artistas.

Operai dice que 4O “se destaca en las tareas cotidianas”, como hacer una lluvia de ideas, resumir, escribir correos electrónicos y revisar informes.

GPT-4.5

Altman describió a GPT-4.5 en una publicación sobre X como “el primer modelo que se siente como hablar con una persona reflexiva”.

Es el último avance en el paradigma de “aprendizaje sin supervisión” de OpenAI, que se centra en ampliar los modelos en el “conocimiento de las palabras, la intuición y la reducción de las alucinaciones”, dijo la miembro del personal técnico de Operai, Amelia Glaese, durante su presentación en febrero.

Entonces, si está teniendo una conversación difícil con un colega, GPT-4.5 podría ayudarlo a replantear esas conversaciones en un tono más profesional y tacto.

Operai dice que GPT-4.5 es “ideal para tareas creativas”, como proyectos de colaboración y lluvia de ideas.

O1 y O1-Mini

Openai lanzó una mini versión de O1, su modelo de razonamiento, en septiembre del año pasado y la versión completa en diciembre.

Los investigadores de la compañía dijeron que es el primer modelo capacitado para “pensar” antes de que responda y se adapte bien a las tareas cuantitativas, de ahí el “modelo de razonamiento” del apodo. Esa es una función de su técnica de entrenamiento, conocida como cadena de pensamiento, que alienta a los modelos a razonar a través de problemas descomponiéndolos paso a paso.

En un artículo publicado en la capacitación de seguridad del modelo, la compañía dijo que “los modelos de capacitación para incorporar una cadena de pensamiento antes de responder tienen el potencial de desbloquear beneficios sustanciales, al tiempo que aumentan los riesgos potenciales que provienen de una inteligencia aumentada”.

En un video de una presentación interna de Operai en los mejores casos de uso para O1, Joe Casson, un ingeniero de soluciones en OpenAI, demostró cómo O1-Mini podría resultar útil para analizar el máximo beneficio en una llamada cubierta, una estrategia de negociación financiera. Casson también mostró cómo la versión de vista previa de O1 podría ayudar a alguien razonar a través de cómo crear un plan de expansión de la oficina.

Operai dice que el modo Pro de O1, una “versión de O1 que utiliza más cómputo para pensar más y proporcionar respuestas aún mejores a los problemas más difíciles”, es mejor para un razonamiento complejo, como crear un algoritmo para el pronóstico financiero utilizando modelos teóricos o generar un resumen de investigación de varias páginas en tecnologías emergentes.

O3 y O3-Mini

Los modelos pequeños han estado ganando tracción en la industria durante un tiempo como una alternativa más rápida y rentable a los modelos de base más grandes. Operai lanzó su primer modelo pequeño, O3 Mini, en enero, solo semanas después de que la startup de la startup china Butterfly Effect debutó el R1 de Deepseek, que conmocionó a Silicon Valley, y los mercados, con sus precios asequibles.

Openai dijo que 03 Mini es el “modelo más rentable” en su serie de razonamiento. Está destinado a manejar preguntas complejas, y Openai dijo que es particularmente fuerte en ciencias, matemáticas y codificación.

Julian Goldie, un influencer de las redes sociales que se centra en la estrategia de SEO, dijo en una publicación sobre el medio que O3 “brilla en tareas de desarrollo rápido” y es ideal para tareas de programación básicas en HTML y CSS, funciones simples de JavaScript y la construcción de prototipos rápidos. También hay una versión “mini alta” del modelo que, según él, es mejor para la “codificación y lógica compleja”, aunque tenía algunos problemas de control.

En abril, Openai lanzó una versión completa de O3, que llama “nuestro modelo de razonamiento más poderoso que empuja la frontera a través de la codificación, matemáticas, ciencias, percepción visual y más”.

Operai dice que el O3 se usa mejor para “tareas complejas o de múltiples pasos”, como la planificación estratégica, la codificación extensa y las matemáticas avanzadas.

O4 mini

Operai lanzó otro modelo más pequeño, el O4 Mini, en abril. Dijo que está “optimizado para un razonamiento rápido y rentable”.

La compañía dijo que logra un rendimiento notable para el costo, especialmente en “Matemáticas, codificación y tareas visuales”. Fue el modelo de referencia con mejor rendimiento en el examen de matemáticas de invitación estadounidense en 2024 y 2025.

O4 Mini, y su mini versión, son excelentes para un razonamiento rápido y más sencillo. Son buenos para acelerar cualquier tarea de razonamiento cuantitativo que encuentre durante su día. Si está buscando un trabajo más profundo, opte por O3.

Scott Swingle, alumbre de DeepMind y fundador de la compañía de herramientas de desarrolladores con IA Abante AI, probó O4 con un problema de Euler, una serie de problemas computacionales desafiantes lanzados cada semana más o menos. Dijo en una publicación sobre X que O4 resolvió el problema en 2 minutos y 55 segundos, “Mucho más rápido que cualquier solucionador humano. Solo 15 personas pudieron resolverlo en menos de 30 minutos”.

Operai dice que el O4 Mini se usa mejor para “tareas técnicas rápidas”, como consultas rápidas relacionadas con STEM. Dice que también es ideal para el razonamiento visual, como extraer puntos de datos clave de un archivo CSV o proporcionar un resumen rápido de un artículo científico.