Connect with us

Noticias

Gems Gemini presenta una nueva función de carga de archivos

Published

on

Google ha potenciado sus chatbots Gemini AI con una nueva función de carga de archivos. Los usuarios de Gemini Advanced ahora pueden cargar documentos, hojas de cálculo y archivos PDF directamente a sus Gems, dándoles acceso a una gran cantidad de información para mejorar la precisión y relevancia. Esta actualización desbloquea un nuevo nivel de personalización, lo que permite a Gems ayudar con la creación de contenido, la investigación y diversas tareas comerciales. Este artículo explora los beneficios y aplicaciones de esta nueva y poderosa característica, destacando cómo puede mejorar la productividad y desbloquear todo el potencial de las capacidades de IA de Gemini.

Gemini Gems obtiene poder de carga de archivos

Google anunció recientemente una actualización importante de Gemini Advanced. Los suscriptores ahora pueden cargar archivos en sus “Gems”, que son chatbots de IA personalizados diseñados para tareas específicas. Esta nueva característica permite a Gems acceder y procesar información de varios tipos de archivos, incluidos documentos, hojas de cálculo y archivos PDF. Esto significa que sus Gems ahora pueden brindar respuestas más precisas y relevantes según la información que usted proporcione.

Cómo la carga de archivos mejora las gemas

Al cargar archivos, le brindas a tus gemas una base de conocimientos para aprovechar. Esto puede resultar increíblemente útil para tareas como:

  • Creación de contenido: Una gema puede ayudarle a escribir artículos, publicaciones de blog o materiales de marketing haciendo referencia a la información de sus documentos cargados.
  • Investigación: Gems puede analizar artículos de investigación, informes o conjuntos de datos para proporcionar resúmenes, conocimientos y respuestas a sus preguntas.
  • Aplicaciones comerciales: Gems puede acceder a las pautas de la empresa, especificaciones de productos o datos de clientes para ayudar con diversas tareas relacionadas con el negocio.

Tipos de archivos admitidos

Gemini actualmente admite la carga de una amplia gama de tipos de archivos, que incluyen:

  • Archivos de documentos/texto: Documentos de Google, TXT, DOC, DOCX, PDF, RTF
  • Archivos de datos: Hojas de cálculo de Google, XLS, XLSX, CSV, TSV

Esta amplia compatibilidad garantiza que pueda utilizar una variedad de recursos para mejorar el conocimiento de su gema.

Subir archivos a tus gemas

Cargar archivos es un proceso simple:

  1. Crea o edita una gema.
  2. En la sección “Conocimiento”, seleccione “Subir archivos”.
  3. Elige los archivos desea cargar desde su almacenamiento local o Google Drive.
  4. Sube hasta 10 archivos por gema.

Gemini reconocerá automáticamente las últimas actualizaciones de Google Docs y Sheets, lo que garantizará que su Gem siempre tenga la información más actualizada.

Beneficios de utilizar la carga de archivos

  • Precisión mejorada: Gems puede proporcionar respuestas más precisas al hacer referencia a información específica de sus archivos.
  • Mayor relevancia: Gems puede adaptar las respuestas a sus necesidades y contexto específicos.
  • Productividad mejorada: Las gemas pueden ayudarlo a completar tareas de manera más eficiente al brindarle acceso rápido a información relevante.

Esta nueva función de carga de archivos hace que Gemini Gems sea aún más potente y versátil. Al proporcionar a tus gemas la información correcta, puedes crear asistentes de IA realmente útiles para una amplia gama de tareas.

Las crecientes capacidades de Géminis

La incorporación de la carga de archivos a Gems es sólo un ejemplo de cómo Google continúa mejorando Gemini. Con actualizaciones continuas y nuevas funciones, Gemini se está convirtiendo en una herramienta cada vez más poderosa para la comunicación, la creatividad y la resolución de problemas. A medida que Google continúa desarrollando Gemini, podemos esperar características aún más innovadoras que cambiarán la forma en que interactuamos con la IA.

Avances clave en Gemini Advanced

Gemini Advanced, la plataforma de inteligencia artificial de vanguardia de Google, ha introducido varias actualizaciones notables. Los usuarios ahora pueden crear asistentes de IA personalizados llamados Gems, diseñados para tareas específicas. Estas gemas se han convertido rápidamente en una característica popular entre los suscriptores.

Una mejora significativa permite a los usuarios cargar hasta 10 archivos al crear gemas. Los formatos admitidos incluyen Google Docs, PDF y hojas de cálculo. Esta función permite a Gems proporcionar respuestas más precisas y contextuales basadas en la información cargada.

La integración de archivos resulta especialmente útil en entornos profesionales. Por ejemplo, las empresas pueden cargar guías de estilo para generar contenido alineado con la marca. Los gerentes de proyectos pueden crear asistentes específicos del proyecto incorporando documentos relevantes. Los equipos de recursos humanos pueden utilizar políticas internas para responder las preguntas de los empleados de manera más eficiente.

Google también ha presentado seis Gems prefabricados para suscriptores de Workspace:

  1. Información de marketing
  2. Ideador de argumentos de venta
  3. Consultor de contratación
  4. Especialista en extensión
  5. Copiar creador
  6. Analizador de sentimiento

Estas gemas especializadas tienen como objetivo optimizar las tareas comerciales comunes y mejorar la productividad en diferentes departamentos.

Gemini Advanced está ampliando su alcance a dispositivos móviles. Los usuarios de Android con cuentas de Workspace pronto accederán a la aplicación Gemini. Esta integración móvil permite funciones innovadoras como convertir notas escritas a mano en texto digital o transformar bocetos de pizarra en visualizaciones listas para presentaciones.

La plataforma continúa evolucionando y Google promete acceso a sus últimas innovaciones en inteligencia artificial a medida que estén disponibles. Esto incluye el próximo modelo Gemini 1.5 Pro, que se espera que ofrezca capacidades mejoradas y una ventana de contexto más amplia para tareas más complejas.

A medida que avanza la tecnología de IA, Gemini Advanced se posiciona como una herramienta versátil tanto para usuarios individuales como empresariales. Su capacidad para manejar diversas tareas, desde análisis de datos hasta escritura creativa, lo convierte en un activo valioso en diversas industrias.

Preguntas frecuentes

Capacidades mejoradas de Gemini Advanced

Gemini Advanced ofrece una comprensión y generación de idiomas más sofisticada en comparación con los chatbots estándar. Puede manejar consultas complejas, proporcionar explicaciones detalladas y participar en conversaciones más matizadas sobre una amplia gama de temas.

Funciones clave para la interacción del usuario

Gemini Advanced incluye asistentes de IA personalizables llamados Gems. Los usuarios pueden crear gemas especializadas para tareas como traducción, tutoría de matemáticas y redacción publicitaria. La plataforma también admite la carga de archivos, lo que permite a Gems hacer referencia a hasta 10 documentos para obtener respuestas más informadas.

Funcionalidades relacionadas con la imagen

Las capacidades de imagen de Gemini Advanced no se detallan explícitamente en la información proporcionada. El enfoque de la plataforma parece estar en las interacciones y la personalización basadas en texto en lugar de la generación o manipulación de imágenes.

Integración de plataforma

Google ha integrado Gemini Advanced con su plan Google One AI Premium. Esta integración brinda a los usuarios acceso a funciones avanzadas de inteligencia artificial junto con otros servicios de Google, aunque no se mencionan detalles específicos sobre integraciones de terceros.

Comparación de rendimiento

Si bien Gemini Advanced se describe como el modelo de IA más capaz de Google, la información disponible no proporciona comparaciones directas de rendimiento con otros modelos de lenguaje de IA líderes. Es probable que su eficacia varíe según el caso de uso y la tarea específicos.

Privacidad y seguridad de datos

Los resultados de la búsqueda no proporcionan información específica sobre las medidas de seguridad de Gemini Advanced. Como producto de Google, es probable que cumpla con las prácticas estándar de protección de datos, pero los usuarios deben consultar la política de privacidad de Google para obtener información detallada sobre el manejo de datos y los protocolos de seguridad.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

Cómo indicar el nuevo chatgpt, según OpenAi

Published

on

La última versión de ChatGPT es significativamente más poderosa, pero requiere nuevas técnicas de indicación. El modelo ahora sigue las instrucciones más literalmente y hace menos suposiciones sobre lo que está pidiendo. Esto es importante para los empresarios que usan la herramienta.

No seas consejos anticuados. No indique usando palabras deficientes. Eres mejor que eso.

Las indicaciones mal construidas desperdician su tiempo y dinero. Hazlo bien y desbloqueas una IA significativamente más capaz. Los miembros del equipo de Operai, Noah MacCallum y Julian Lee, han publicado una amplia documentación sobre cómo provocar sus nuevos modelos.

Aquí hay un resumen de su orientación, para que pueda aprovechar al máximo la herramienta.

Las reglas de indicación han cambiado

La provisión de técnicas que funcionaron para modelos anteriores en realidad podrían obstaculizar sus resultados con las últimas versiones. ChatGPT-4.1 sigue las instrucciones más literalmente que sus predecesores, que solían inferir la intención liberalmente. Esto es bueno y malo. La buena noticia es que ChatGPT ahora es altamente orientable y responde a las indicaciones bien especificadas. La mala noticia es que sus viejas indicaciones necesitan una revisión.

La mayoría de las personas todavía usan indicaciones básicas que apenas rascan la superficie de lo que es posible. Escriben preguntas o solicitudes simples, luego se preguntan por qué sus resultados se sienten genéricos. Operai ahora ha revelado cómo entrenaron el modelo para responder, ayudándole a obtener exactamente lo que desea de sus modelos más avanzados.

Optimice sus indicaciones con la guía de información privilegiada de Openai

Estructura tus indicaciones estratégicamente

Comience organizando sus indicaciones con secciones claras. OpenAI recomienda una estructura básica con componentes específicos:

• Rol y objetivo: dígale a ChatGPT a quién debe actuar y qué está tratando de lograr

• Instrucciones: proporcionar pautas específicas para la tarea

• Pasos de razonamiento: indique cómo desea que aborde el problema

• Formato de salida: especifique exactamente cómo desea la respuesta estructurada

• Ejemplos: Muestre muestras de lo que espera

• Contexto: proporcionar información de fondo necesaria

• Instrucciones finales: incluya los últimos recordatorios o criterios

No necesita todas estas secciones para cada aviso, pero un enfoque estructurado ofrece mejores resultados que una pared de texto.

Para tareas más complejas, la documentación de OpenAI sugiere usar reducción para separar sus secciones. También aconsejan el uso de caracteres de formato especial alrededor del código (como Backticks, que se ven así: `) para ayudar a ChatGPT a distinguir el código del texto regular y el uso de listas numeradas o balas estándar para organizar información.

Dominar el arte de delimitar información

La separación de la información afecta adecuadamente sus resultados significativamente. Las pruebas de Openai encontraron que Etiquetas XML Realice excepcionalmente bien con los nuevos modelos. Le permiten envolver las secciones con precisión con etiquetas de inicio y extremo, agregar metadatos a las etiquetas y habilitar la anidación.

El formato JSON funciona mal con contextos largos (que proporcionan los nuevos modelos), particularmente al proporcionar múltiples documentos. En su lugar, intente formatos como ID: 1 | Título: El zorro | Contenido: El Fox Brown rápido salta sobre el perro perezoso que Openai encontró que funcionó bien en las pruebas.

Construir agentes de IA autónomos

Chatgpt ahora puede funcionar como un “agente” Eso funciona de manera más independiente en su nombre, abordando tareas complejas con una supervisión mínima. Lleve sus indicaciones al siguiente nivel construyendo estos agentes.

Un agente de IA está esencialmente ChatGPT configurado para trabajar a través de problemas de forma autónoma en lugar de solo responder a sus preguntas. Puede recordar el contexto en una conversación, usar herramientas como navegación web o ejecución de código, y resolver problemas de varios pasos.

OpenAI recomienda incluir tres recordatorios clave en todas las indicaciones del agente: persistencia (continuar hasta la resolución), callarse de herramientas (usando herramientas disponibles en lugar de adivinar) y planificar (pensar antes de actuar).

“Estas tres instrucciones transforman el modelo de un estado de chatbot en un agente mucho más ‘ansioso’, impulsando la interacción de forma autónoma e independiente”, explica el equipo. Sus pruebas mostraron un aumento del rendimiento del 20% en las tareas de ingeniería de software con estas simples adiciones.

Maximizar el poder de los contextos largos

El último chatGPT puede manejar una impresionante ventana de contexto de 1 millón de tokens. Las capacidades son emocionantes. Según OpenAi, el rendimiento sigue siendo fuerte incluso con miles de páginas de contenido. Sin embargo, el rendimiento del contexto largo se degrada cuando se requiere un razonamiento complejo en todo el contexto.

Para obtener los mejores resultados con documentos largos, coloque sus instrucciones tanto al principio como al final del contexto proporcionado. Hasta ahora, esto ha sido más seguro de fallas en lugar de una característica requerida de su aviso.

Cuando use el nuevo modelo con un contexto extenso, sea explícito sobre si debe confiar únicamente en la información proporcionada o combinarlo con su propio conocimiento. Para respuestas estrictamente basadas en documentos, OpenAI sugiere instruir explícitamente: “Solo use los documentos en el contexto externo proporcionado para responder a la consulta del usuario”.

Implementar la solicitud de la cadena de pensamiento

Si bien GPT-4.1 no está diseñado como un modelo de razonamiento, puede solicitar que muestre su trabajo como podría los modelos más antiguos. “Pedirle al modelo que piense paso a paso (llamada ‘cadena de pensamiento’) puede ser una forma efectiva de dividir los problemas en piezas más manejables”, señala el equipo de OpenAI. Esto viene con un mayor uso de tokens pero ofrece una mejor calidad.

Una instrucción simple como “Primero, piense cuidadosamente paso a paso sobre qué información o recursos se necesitan para responder a la consulta” puede mejorar drásticamente los resultados. Esto es especialmente útil cuando se trabaja con archivos cargados o cuando CHATGPT necesita analizar múltiples fuentes de información.

Haga que el nuevo chatgpt funcione para ti

Operai ha compartido información más extensa sobre cómo aprovechar al máximo sus últimos modelos. Las técnicas representan objetivos de capacitación reales para los modelos, no solo conjeturas de la comunidad. Al implementar su orientación sobre una estructura rápida, delimitar información, creación de agentes, manejo de contexto largo y suministro de cadena de pensamiento, verá mejoras dramáticas en sus resultados.

El éxito con ChatGPT proviene de tratarlo como un compañero de pensamientono solo un generador de texto. Siga la guía directamente de la fuente para obtener mejores resultados del mismo modelo que todos los demás están utilizando.

Acceder a todos mis Las mejores indicaciones de contenido de chatgpt.

Continue Reading

Noticias

Una nueva estrategia de Google AI podría interrumpir el dominio de Openai

Published

on

Hay tantos trabajos de investigación de IA en estos días que es difícil destacarse. Pero un artículo ha programado mucha discusión en toda la industria tecnológica en los últimos días.

“Esto es lo más inspirador que he leído en IA en los últimos dos años”, escribió el fundador de inicio Suhail Doshi en X este fin de semana. Jack Clark, cofundador de Anthrope, presentó el periódico en la edición del lunes de su boletín de importación AI, que es leída de cerca por miles de investigadores de la industria.

Escrito por el investigador de Google David Silver y el científico informático canadiense Rich Sutton, el documento anuncia audazmente una nueva era de AI.

Los autores identifican dos épocas de IA modernas anteriores. El primero fue personificado por Alphago, un modelo de Google AI que aprendió a jugar el juego de mesa “Go” mejor que los humanos en 2015. El segundo es el que estamos en este momento, definido por ChatGPT de Opensei.

Silver y Sutton dicen que ahora estamos entrando en un nuevo período llamado “La era de la experiencia”.


Un gráfico del trabajo de investigación "Bienvenido a la era de la experiencia, 'por David Silver y Richard Sutton

Un gráfico del documento de investigación “Bienvenido a la Era of Experience”, de David Silver y Richard Sutton

David Silver, Richard Sutton



Para mí, esto representa un nuevo intento de Google de abordar uno de los problemas más persistentes de la IA, la escasez de datos de entrenamiento, al tiempo que va más allá de un enfoque tecnológico que OpenAi básicamente ganó.

La era de la simulación

Comencemos con la primera época, que, según los autores, era la “era de la simulación”.

En este período, aproximadamente a mediados de la década de 2010, los investigadores utilizaron simulaciones digitales para que los modelos de IA jueguen repetidamente para aprender a actuar como humanos. Estamos hablando de millones y millones de juegos, como ajedrez, póker, atari y “gran turismo”, jugados una y otra vez, con recompensas colgadas por buenos resultados, enseñando así a las máquinas lo que es bueno versus malo e incentivándolos para seguir mejor estrategias.

Este método de aprendizaje de refuerzo, o RL, produjo Alphago de Google. Y también ayudó a crear otro modelo de Google llamado Alphazero, que descubrió nuevas estrategias para el ajedrez y “ir”, y cambió la forma en que los humanos juegan estos juegos.

El problema con este enfoque: las máquinas entrenadas de esta manera funcionaban bien en problemas específicos con recompensas definidas con precisión, pero no podían abordar problemas más generales y abiertos con pagos vagos, según los autores. Entonces, probablemente no sea realmente completo.

La era de los datos humanos

La siguiente área fue lanzada por otro artículo de investigación de Google publicado en 2017. “La atención es todo lo que necesita” propuesta que los modelos de IA deben ser entrenados en montañas de datos creados por humanos de Internet. Simplemente permitiendo que las máquinas presten “atención” a toda esta información, aprenderían a comportarse como los humanos y desempeñarse tan bien como nosotros en una amplia variedad de tareas diferentes.

Esta es la era en la que estamos ahora, y ha producido ChatGPT y la mayoría de los otros potentes modelos y herramientas de IA generativos que se utilizan cada vez más para automatizar tareas como el diseño gráfico, la creación de contenido y la codificación de software.

La clave de esta época ha sido acumular la mayor calidad posible de datos generados por los humanos, y usar eso en el entrenamiento masivo y intensivo de cómputo se extiende a los modelos IMBue AI con una comprensión del mundo.

Mientras que los investigadores de Google iniciaron esta era de datos humanos, la mayoría de estas personas abandonaron la empresa y comenzaron sus propias cosas. Muchos fueron a OpenAI y trabajaron en tecnología que Ultimate produjo ChatGPT, que es, con mucho, el producto de IA generativo más exitoso de la historia. Otros comenzaron Anthrope, otra startup de IA generativa líder que ejecuta Claude, un poderoso agente de chatbot y IA.

¿Un google dis?

Muchos expertos en la industria de la IA, y algunos inversores y analistas en Wall Street, piensan que Google puede haber dejado caer la pelota aquí. Se le ocurrió este enfoque de IA, pero OpenAi y Chatgpt se han escapado con la mayoría de los botines hasta ahora.

Creo que el jurado todavía está fuera. Sin embargo, no puede evitar pensar en esta situación cuando los autores parecen estar disgustando la era de los datos humanos.

“Se podría argumentar que el cambio en el paradigma ha tirado al bebé con el agua del baño”, escribieron. “Si bien RL centrado en el ser humano ha permitido una amplitud de comportamientos sin precedentes, también ha impuesto un nuevo techo al rendimiento del agente: los agentes no pueden ir más allá del conocimiento humano existente”.

Silver y Sutton tienen razón sobre un aspecto de esto. La oferta de datos humanos de alta calidad ha sido superado por la demanda insaciable de los laboratorios de IA y las grandes compañías tecnológicas que necesitan contenido fresco para capacitar nuevos modelos y hacer avanzar sus habilidades. Como escribí el año pasado, se ha vuelto mucho más difícil y más costoso hacer grandes saltos en la frontera de IA.

La era de la experiencia

Los autores tienen una solución bastante radical para esto, y está en el corazón de la nueva era de la experiencia que proponen en este documento.

Sugieren que los modelos y los agentes deberían salir y crear sus propios datos nuevos a través de interacciones con el mundo real.

Esto resolverá el problema de suministro de datos persistente, argumentan, mientras ayudan al campo a alcanzar AGI, o inteligencia general artificial, un santo grial técnico donde las máquinas superan a los humanos en la mayoría de las actividades útiles.

“En última instancia, los datos experimentales eclipsarán la escala y la calidad de los datos generados por los humanos”, escriben Silver y Sutton. “Este cambio de paradigma, acompañado de avances algorítmicos en RL, desbloqueará en muchos dominios nuevas capacidades que superan a las que poseen cualquier humano”.

Cualquier padre moderno puede pensar en esto como el equivalente a decirle a su hijo que salga del sofá, deje de mirar su teléfono y salga afuera y juegue con sus amigos. Hay experiencias mucho más ricas, satisfactorias y más valiosas para aprender.

Clark, el cofundador antrópico, quedó impresionado por la chutzpah de esta propuesta.

“Documentos como este son emblemáticos de la confianza que se encuentra en la industria de la IA”, escribió en su boletín el lunes, citando “el sentido común de dar a estos agentes la independencia y la latitud suficientes para que puedan interactuar con el mundo y generar sus propios datos”.

Ejemplos y un posible disco final

Los autores flotan algunos ejemplos teóricos de cómo esto podría funcionar en la nueva era de la experiencia.

Un asistente de salud de IA podría fundamentar los objetivos de salud de una persona en una recompensa basada en una combinación de señales como su frecuencia cardíaca en reposo, duración del sueño y niveles de actividad. (Una recompensa en la IA es una forma común de incentivar a los modelos y agentes para que funcionen mejor. Al igual que podrías molestar a tu pareja para hacer más ejercicio diciendo que se fortalecerán y se verán mejor si van al gimnasio).

Un asistente educativo podría usar los resultados del examen para proporcionar un incentivo o recompensa, basado en una recompensa fundamentada por el aprendizaje de idiomas de un usuario.

Un agente científico con el objetivo de reducir el calentamiento global podría usar una recompensa basada en observaciones empíricas de los niveles de dióxido de carbono, sugiere Silver y Sutton.

En cierto modo, este es un retorno a la era anterior de simulación, que Google podría liderar. Excepto esta vez, los modelos y agentes de IA están aprendiendo del mundo real y recopilando sus propios datos, en lugar de existir en un videojuego u otro ámbito digital.

La clave es que, a diferencia de la era de los datos humanos, puede no haber límite para la información que se puede generar y recopilar para esta nueva fase de desarrollo de IA.

En nuestro período de datos humanos actuales, se perdió algo, argumentan los autores: la capacidad de un agente para autodescubrir su propio conocimiento.

“Sin esta base, un agente, sin importar cuán sofisticado, se convertirá en una cámara de eco del conocimiento humano existente”, escribieron Silver y Sutton, en una posible final final para OpenAi.