Connect with us

Noticias

Confluencia para 3.2.2025 – por CRA

Published

on

MidJourney Aviso: Mural mexicano de Prometeo que alcanza hacia arriba hacia la llama digital por encima de los edificios corporativos, contornos audaces, composición poderosa, inspirada en el río —Ar 4: 3

Bienvenido a Confluence. Ha estado muy ocupado en el mundo de la IA generativa, con nuevos modelos sustantivos de Operai, Anthrope y XAI en las últimas semanas. Tenemos mucho de qué hablar, más de lo que podemos llegar a todos a la vez. Dicho esto, esto es lo que tiene nuestra atención esta semana en la intersección de la IA generativa y la comunicación corporativa:

  • Chatgpt Deep Investigación ahora disponible para usuarios más

  • Amazon anuncia Alexa+, impulsado por Claude

  • Cómo un INSIDER AI usa LLMS

  • Nuestra pila de modelos actual

La frontera continúa siendo más barata y más accesible.

Hace menos de un mes, escribimos sobre la investigación profunda de Chatgpt. Nos sorprendió. Sentimos que habíamos cruzado otro umbral en las capacidades generativas de IA, ya que ahora teníamos “un agente que [we] Puede asignar a la investigación e informar sobre un tema, dejar por un tiempo y volver a tener un trabajo que sea igual o superior a la mayoría de los estándares humanos “. La única investigación para una investigación profunda fue que solo estaba disponible para los usuarios de ChatGPT Pro que pagaron $ 200 por mes.

Este ya no es el caso. Esta semana, Openai hizo una investigación profunda a disposición de todos los usuarios de ChatGpt Plus, Team, Enterprise y EDU. Los usuarios de estos niveles reciben 10 consultas por usuario por mes, lo cual es suficiente para tener una idea de cuán poderosa puede ser esta herramienta. Lo pensamos de esta manera: por $ 20 por mes, puede obtener 10 informes de investigación personalizados que están en o superiores al nivel que muchos humanos producirían, y solo tomará aproximadamente 10 minutos generar cada uno. Aún mejor, puede solicitar estos informes cuando lo desee, sobre cualquier tema que atraiga su interés, sin alejar a nadie de su otro trabajo. Hace que sea mucho más fácil y menos costoso, en términos de tiempo, energía y atención, explorar los temas que elija, incluso si es un interés pasajero.

Si es escéptico sobre exactamente cuán inteligente es la investigación profunda, Timothy Lee realizó un experimento que vale la pena su tiempo para leer. Le pidió a 19 de sus lectores, que trabajan como maestros, abogados, ingenieros y más, que usen investigaciones profundas y evalúen su producción. De estos 19 profesionales, 17 creía que la producción se comparaba favorablemente con al menos Los trabajadores de nivel de entrada en su campo con siete lo comparan favorablemente con el trabajo de profesionales experimentados. Y produce estas salidas en minutos, en lugar de horas o días.

Hacemos nuestro mejor esfuerzo en Confluencia para señalarlo a los desarrollos en IA generativa que tienen nuestra atención (y creemos que deberían tener el suyo). Si aún no ha utilizado investigaciones profundas, sugerimos probarlo ahora. Creemos que estarás atónito, como hemos estado.

Una nueva oportunidad para la adopción masiva de IA generativa.

Esta semana, Amazon dio a conocer Alexa+, su asistente virtual de próxima generación impulsado por IA generativo a través de una asociación con antrópico y basado en el modelo de lenguaje grande Claude muy poderoso de Anthrope (el modelo que usamos más día a día). Amazon pronostica que el nuevo Alexa participará en conversaciones “expansivas y naturales”, y que será más capaz de ayudar a los usuarios a realizar tareas diarias. Amazon planea desplegar Alexa+ en los Estados Unidos en las próximas semanas durante un período de acceso temprano (Puede solicitar ser considerado para el acceso temprano aquí), priorizando a los propietarios de dispositivos Alexa más sofisticados. El servicio será gratuito para todos los miembros de Amazon Prime, y costará a los no miembros $ 19.99/mes. El despliegue planificado potencialmente traerá capacidades de IA avanzadas a millones de hogares en un futuro muy cercano.

Esta integración podría fomentar un nuevo nivel de comprensión pública del valor práctico de la IA. Cuando Amazon lanzó Alexa por primera vez en 2014, creó una nueva categoría de productos que rápidamente ingresó a millones de casas. Hoy, más de 600 millones de dispositivos Alexa operan en todo el mundo, con muchos usuarios que los incorporan a las rutinas diarias: verificar el clima, tocar música, controlar otros dispositivos inteligentes en todo el hogar. La presencia establecida y la familiaridad de Alexa proporcionan una plataforma única para la adopción de IA que requiere un cambio de comportamiento mínimo o el aprendizaje de interfaz de los usuarios. Si Anthrope y Amazon se ejecutan bien, esta asociación podría demostrar las capacidades de IA de una manera accesible que resuena más allá de la multitud experta en tecnología.

Pero ese es un considerable “si”. Escribimos el año pasado con optimismo Sobre la inteligencia de Apple de Apple poniendo el poder de la IA en los bolsillos en todo el mundo, pero la tecnología se ha decepcionado. Una búsqueda rápida de Google para “¿Por qué la inteligencia de Apple es tan mala?“Produce páginas de explicadores tratando de responder esa pregunta.

No asumimos que Alexa+ revolucionará inmediatamente la adopción generativa de IA. Dicho esto, el desarrollo merece atención. Amazon afirma haber creado avances técnicos, incluidos “expertos” (sistemas, capacidades e instrucciones para tareas específicas) y “capacidades de agente”, permitiendo que Alexa naveguen de Internet de forma independiente para completar las tareas. La verdadera prueba para Alexa+ no se encuentra en la ambiciosa presentación de Amazon, sino en si ofrece utilidad genuina en salas de estar cuando el centro de atención de marketing se desvanece. Estaremos mirando con interés.

El nuevo video fundador de Operai, Andrej Karpathy, proporciona una valiosa descripción general del estado actual de herramientas y capacidades.

Primero señalamos Confluencia lectores de uno de Andrej Karpathyvideos en Noviembre de 2023. El video en ese caso fue su charla de “Introducción a modelos de idiomas grandes”, que mostró la capacidad de Karpathy para traducir su profunda experiencia en explicaciones accesibles para los no tecnólogos. En las últimas semanas, ha publicado dos nuevos videos, nuevamente dirigidos a una audiencia general no técnica. Esta semana vimos a uno de ellos “Cómo uso LLM”y recomiende que cualquier persona que quiera ponerse al día o profundice en el estado actual de las herramientas y capacidades de LLM hagan lo mismo. Es largo, a poco más de dos horas, pero si lo divides en trozos (como lo hicimos), es manejable.

Quizás la mayor fuerza del video es su enfoque práctico. Es “un tutorial práctico y impulsado por el ejemplo de modelos de idiomas grandes y su creciente lista de características relacionadas”. Al igual que lo hacemos en nuestros seminarios y en sesiones con clientes, Karpathy gasta casi todo el video demostrando estas herramientas y capacidades en lugar de explicarlas. Igualmente valioso es la cobertura de Karpathy de una amplia gama de herramientas, incluidos ChatGPT, Claude, Gemini, Grok, Perpleity, NotebookLM y Cursor. Muchos videos de descripción general como este se centran en una herramienta específica, por lo que ver la karpathy trabajar a través de todos estos y demostrar sus similitudes y diferencias en tiempo real es particularmente valioso.

Para proporcionar una sensación de cuánto cubre, en términos de herramientas y características, esta es la lista de segmentos con estampado de tiempo en el video:

Los “capítulos” que se muestran arriba se mueven de más simples a más complejos y sofisticados a medida que avanza el video, que es otra fuerza del enfoque de Karpathy. En el transcurso del video, Karpathy construye una visualización del estado actual de LLMS, lo que finalmente resulta en la imagen a continuación. Al principio, el lienzo está en blanco. En cada capítulo, Karpathy agrega una nueva pieza a esto, proporcionando descripciones y demostraciones accesibles de cada uno como él.

Para cualquiera que quiera ponerse al día, no solo en las últimas herramientas y capacidades, sino en cómo funcionan y cómo se comparan entre sí, el video de Karpathy sería dos horas bien gastadas. Este video seguramente tendrá una vida útil limitada; de hecho, Claude 3.7 fue lanzado mientras Karpathy estaba filmando el videoy GPT-4.5 fue lanzado el día después de su publicación. Por ahora, sin embargo, podría decirse que es la descripción general más completa y accesible del panorama actual que conocemos. Y hablando de lo rápido que se mueven las cosas …

Las cosas están cambiando rápidamente, pero esto es lo que estamos usando y para lo que, en los principales modelos generativos de IA generativos de hoy.

En las últimas semanas, parece que los poderosos nuevos modelos de IA generativos han estado volando de los estantes como … lo que sea que salga de los estantes en su parte del mundo. Incluso tenemos dificultades para mantenernos al día, y tenemos mucho trabajo por hacer para descubrir dónde sobresale cada modelo. Dicho esto, aquí está la pila actual de modelos que usamos diariamente para fines particulares, en caso de que sea de ayuda. Su uso puede variar.

  • Nuestro controlador diario: Claude Sonnet 3.7 (antrópico). Esta es nuestra opción. Lo usamos para análisis, escritura, asociación de pensamiento, codificación, casi todo lo que no sean los casos de uso específicos a continuación. Hemos preferido a Claude durante más de un año, y Sonnet 3.7 sigue siendo nuestra mejor opción para la mayor parte de nuestro trabajo. Encender su opción de “pensamiento” trae razonamiento a sus respuestas, lo que las hace aún más poderosas. Sonnet 3.7 es increíble.

  • Informes de investigación: Investigación profunda de Openai. Esta herramienta crea largos documentos informativos o informes de investigación (de cinco a 20 páginas o más, a menudo con más de 100 citas) en temas específicos. Todavía no es realmente confiable en la revisión de la literatura académica, ya que gran parte de la literatura permanece detrás de los paredes de pago, y a veces puede superar sobre algunas fuentes, pero si desea ser razonablemente inteligente sobre algo en poco tiempo, esta herramienta es increíble. Asegúrese de verificar cualquier hecho que pueda causar un riesgo de reputación si están equivocados, y solicite a otro modelo que critique el resultado para asegurarse de tener una perspectiva equilibrada. Consulta de ejemplo:

    Research the concept of resilience. Consider what the published academic literature has to say about resilience in organizations, teams, communities, and individuals. Apply those findings to a leadership context, extrapolating reasonable conclusions that leaders should draw about fostering resilience in the people they lead in organizations and professional settings. Avoid cliches, tropes, and consultant mythology. Ground your search in what the literature has to say about the best ways to foster resilience in organizations, teams, and people. Pay particular attention to specific behaviors, routines, and actions that leaders can incorporate into their daily practice to foster resilience in others.
  • Pensamiento profundo de un colega brillante: OpenAi O1. Usamos este modelo cuando queremos un pensamiento muy profundo y particular sobre un tema. ¿Por qué “en particular”? ” Hemos llegado a la opinión de que los modelos de idiomas grandes son una forma de inteligencia alienígena. No estamos diciendo que sean sensibles, pero claramente piensan de manera diferente a lo que hacemos (de hecho, nadie sabe realmente cómo piensan), y son claramente inteligentes. O1 es “muy” en ambas dimensiones. Así que lo consideramos como un colega brillante que ve las cosas de manera diferente a lo que hacemos. No le damos muchas consultas, pero cuando tenemos un problema sobre el cual nos gustaría una perspectiva inteligente y diferente con mucho razonamiento detrás de esto, O1 es nuestra opción. Consultas de ejemplo:

    Research the time management practice of time boxing or time blocking. Consider how Cal Newport and Oliver Burkeman use this strategy. Offer specific strategies for how to apply it in my life, knowing that my calendar is often pre-planned in advance by my Executive Assistant. Consider the effects of the planning fallacy. Consider how I could best implement this knowing that my primary planning tools are Outlook Calendar and a remarkable 2 digital notebook. Make your thinking practical. As context, note that I lack deep work time, and I sense that I don't focus as much as I should on priorities and big rocks day-to-day. Ideal outcome is better throughput of priority items at work and home. I have blocks of time I can protect. I use the remarkable for notes and reflection, but can also use it for planning. Tasks are kept in a set of next action categories in a to-do app (for now at least).
    Write your best case study to create a conversation about judgement among a group of mid-career strategic communication consultants in our firm. Don’t be beholden to popular forms like that of Harvard B School. Use your own intellect to create the content and design however you see fit with the goal of fostering a credible dialogue in which our consultants develop their professional judgment.
  • Generación de imágenes: Midjourney. Hay otras herramientas de generación de imágenes, pero para nosotros, MidJourney sigue siendo la mejor herramienta. Lo usamos para crear las imágenes de encabezado en Confluenciay ahora que puede usarlo como sitio web y no a través de Discord, no hay razón para no usar MidJourney. Al igual que cualquier herramienta de IA generativa, lo que obtienes depende mucho de cómo se indique, por lo que es útil pasar un tiempo para aprender sus entresijos. Incluso hemos creado un proyecto de Claude que hemos hecho una lluvia de ideas de ideas e indicaciones para nosotros. Ejemplo de indica (y la salida):

    Mark Rothko-inspired abstract expressionist painting, horizontal rectangular color fields transitioning from earth browns at bottom to vibrant reds and oranges at top, subtle digital texture embedded in the color transitions, corporate silhouettes at bottom edge, 4:3 aspect ratio, oil painting texture --ar 4:3 --v 6
  • Actualizaciones sobre eventos actuales: Grok 3. No mucha gente está hablando de eso, pero Grok 3 es un modelo sorprendentemente bueno, y es sorprendente si consideras que X lo desarrolló en meses. Definitivamente es diferente de los otros modelos, en parte porque casi cualquier cosa sucede en Grok. Puede ser divertido, extraño, crudo … y muy efectivo, especialmente para resumir los eventos actuales, ya que es un modelo de razonamiento que busca tanto la web como X. Nuevamente, verifique cualquier hecho que planifique citar. Consulta de ejemplo (y en este caso, salida, ya que no hemos escrito mucho sobre Grok; al crear su respuesta, Grok pensó durante 18 segundos y leí 11 x publicaciones y 15 páginas web):

    Us:
    The NASCAR race at COTA is today. Bring me up to speed on what's new with it over the past 24 hours.
    
    Grok:
    The NASCAR Cup Series race at the Circuit of the Americas (COTA) is happening today, Sunday, March 2, 2025, at 3:30 p.m. ET. Here’s a rundown of what’s new and noteworthy over the past 24 hours as you get ready for the event.
    
    New Track Layout and Race Format
    
    This year, NASCAR has switched to a shorter version of the COTA circuit, dubbed the "National" circuit. It’s 2.4 miles long with 20 turns, a big shift from the full 3.4-mile layout used in previous years. The new design eliminates the long straightaways and introduces a sharp, acute left-hander at Turn 6A, which should open up more passing zones—and potentially lead to some on-track chaos. To adjust for the shorter track, the race has been extended to 95 laps, up from 68 laps in prior years. This means more racing action for fans and a fresh strategic challenge for teams.
    
    Key Driver and Team Updates
    
    William Byron, last year’s winner, is chasing consecutive victories at COTA but will start from 15th today.
    
    Tyler Reddick, the 2023 COTA winner, grabbed pole position and looks like a top contender.
    
    Shane van Gisbergen, a road course ace and three-time Supercars champion, has been fast in practice and is pegged as a favorite.
    
    Connor Zilisch, an 18-year-old phenom, is making his NASCAR Cup Series debut. He’s already won big races like the Rolex 24 at Daytona and the 12 Hours of Sebring, so all eyes are on him.
    
    On the team front, 23XI Racing dominated qualifying, locking out the front row, while Trackhouse Racing has three cars in the top 10, promising a fierce fight up front.
    
    Technical Changes to Watch
    
    Repaved Track Surface: Sections of the track, particularly Turns 2-8, have been freshly paved. This could shake up grip levels and tire wear, making adaptability key.
    
    New Goodyear Tires: A new tire compound is in play this year, adding another layer of intrigue to race strategy. Teams will likely lean toward a three-stop strategy, though some might risk a two-stop gamble with the longer race.
    
    Fan Experience and Weather
    
    NASCAR’s keeping fans entertained with extras like dance troops from America’s Got Talent and pig races.
    
    Weather’s looking ideal: sunny skies, 70s temperatures, and just a 5% chance of rain.
    
    Future Uncertainty
    
    There’s a question mark hanging over COTA’s NASCAR future. The rental deal between Speedway Motorsports and COTA expires this year, and while a 2026 return is anticipated, nothing’s locked in yet.
    
    With a revamped track, a longer race, and a stacked field of veterans and rising stars, today’s event is gearing up to be a wild one. Enjoy the show!

Hay otros modelos que son buenos en la generación de videos (VEO 2 de Google) y la música (Suno AI), pero no los usamos mucho día a día. No sabemos mucho sobre a dónde va todo esto, pero sí lo sabemos: nuestra lista será diferente en seis meses. Así que continuaremos publicando esta lista de vez en cuando.

Te dejaremos con algo genial: más allá de los puntos de referencia técnicos, hay algunos en Anthrope que miden las capacidades de Claude de una manera diferente … ¿Qué tan lejos puede llegar a jugar Pokémon Red?. Incluso puedes ver una transmisión en vivo de Claude jugando el juego en Twitch.

Compartir

AI Disclosure: We used generative AI in creating imagery for this post. We also used it selectively as a creator and summarizer of content and as an editor and proofreader.
Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

4 de mis características favoritas de Google Gemini Gemini AI que deberías usar

Published

on

Resumen

  • Las gemas Gemini personalizadas pueden ahorrar mucho trabajo ocupado para las solicitudes que ejecuta regularmente.
  • La investigación profunda es un gran punto de partida para proyectos serios, aunque siempre debe verificar las fuentes de Gemini.
  • También puede preguntarle a Gemini sobre una sorprendente variedad de filetipos cargados, como PDF, archivos de código y presentaciones de PowerPoint.



Lo entiendo, por lo general, no paso mucho tiempo profundizando en las características adicionales de IA generativa plataformas tampoco. Si bien es asunto mío saber sobre ellos, en el día a día, sobre todo solo quiero que sean lo más convenientes posible. Entonces, si los uso de ellos, generalmente es para una pregunta rápida aquí o allá: investigar ideas de historias, decir o tratar de calcular algo que está más allá de mis habilidades matemáticas atrofiadas. Para eso, me alegro herramientas como Google Géminis, Chatgpty Copiloto de Microsoft están preinstalados en mis dispositivos.

Gemini está disponible en cualquier lugar donde pueda desearlo, por lo que vale la pena aprender sobre algunas de sus opciones más matizadas. Quizás exagere un poco llamarlos “ocultos”, pero Google tampoco parece hacer todo lo posible para que el público sepa de ellos.

Relacionado

Cómo descargar aplicaciones de Android fuera de Google Play Store

Por lo general, es mejor atenerse a las tiendas de aplicaciones conocidas, pero hay razones legítimas para omitir Google.

1 Asistentes personalizados para tareas específicas

Azul profundo, come tu corazón

Gemini está listo para manejar muchas solicitudes fuera de la puerta, pero si hay una tarea particular a la que sigue volviendo, por ejemplo, ayuda con la codificación, la lluvia de ideas de historias o haciendo pronósticos comerciales, puede generar una “joya” que recordará los parámetros que establece. Es muy preferible tener que explicar esas cosas cada vez. Google tiene algunas gemas preestablecidas, incluida una para el ajedrez basado en chat.


Para crear una gema personalizada, necesitará la versión web de Gemini, independientemente del dispositivo que esté utilizando. Sigue estos pasos:

  1. Vaya a gemini.google.com en un navegador web.
  2. Abrir el Gemer. Es posible que deba expandir un menú de barra lateral para verlo, dependiendo de su plataforma.
  3. Hacer clic Nueva gema.
  4. Llenar el Nombre campo con un título descriptivo.
  5. Bajo InstruccionesExplique lo que desea que haga Gemini, incluidas cosas como fuentes de conocimiento, producción esperada y/o tono. Después de haber escrito algunas palabras, puede intentarlo Use Géminis para reescribir las instrucciones a parámetros de generación automática.
  6. Opcionalmente, puede tocar el más icono bajo Conocimiento Para agregar archivos de referencia. Esto le permitirá cargar material desde su dispositivo o Google Drive, hasta un límite de 10 archivos.
  7. Cuando esté listo, haga clic Ahorrar.

Una vez que haya creado una gema, puede acceder a ella usando el Gemas o Chats y gemas Menús, dependiendo de si está utilizando la versión web o de la aplicación de Gemini. En ese momento, estás listo para comenzar a correr, con mi guía de equitación de fin de semana, por ejemplo, puedo comenzar con “¿Qué sendero debo probar este sábado?” Sin tener que especificar lo que estoy montando, dónde vivo o el hecho de que necesito condiciones climáticas.

Relacionado

Todo lo que necesita saber sobre PEV o vehículos eléctricos personales

Puede usar PEVS para explorar, hacer mandados o acelerar su viaje.

2 Investigación profunda para proyectos avanzados

Una mejor opción cuando cuentan los detalles


Por defecto, Gemini ya puede responder preguntas elaboradas sin hacer nada especial. Sin embargo, si desea garantizar la confiabilidad y obtener más detalles de lo habitual, ahí es donde entra en juego una investigación profunda. La función genera un plan de análisis basado en su aviso, luego produce un informe integral, citando docenas o cientos de fuentes web que puede verificar. Realmente está destinado a investigaciones serias: los informes son largos y formales, y puede tardar fácilmente varios minutos o más en terminar de generar.

En la versión web de Gemini:

  1. Haga clic en el Géminis Menú desplegable en la parte superior izquierda, luego seleccione Investigación profunda de modelos disponibles.
  2. En el chat, ingrese un mensaje de investigación. Sea lo más específico posible para los mejores resultados.
  3. Revise el plan de investigación de Gemini. Si tiene alguna objeción, ahora es el momento de hacer clic Plan de edición.
  4. Una vez que el plan se ve sólido, haga clic Investigar la investigación.
  5. Espera mientras se genera un informe. Esto podría llevar mucho tiempo, relativamente hablando, posiblemente hasta 15 minutos. Se le notificará una vez que el informe esté listo.
  6. Hacer clic Exportar a los documentos Para guardar una copia en Google Docs. Puedes hacer clic en el flecha hacia abajo Junto a ese botón para copiar todo el texto para pegar o generar una descripción general de audio.

Relacionado

El precio de IA escalonado corre el riesgo de empeorar la brecha entre los que tienen y los que no tienen

¿Qué sucederá cuando la IA se convierta en su principal medio de interactuar con el mundo?

3 Descifrar libros complicados, hojas de cálculo y archivos de código

Haz que esos ensayos escolares y las hojas de cálculo de Excel sean fácilmente

Google no hace todo lo posible para explicar esto, pero si toca el más icono En la barra de chat, puede cargar una sorprendente variedad de archivos si desea hacer preguntas sobre ellos. Actualmente, estos incluyen:


  • Archivos de código: C, CPP, PY, Java, PHP, SQL y HTML
  • Documentos: DOC, DOCX, PDF, RTF, DOT, DOTX, HWP, HWPX, TXT y Google Docs
  • Presentaciones: PPTX y Diapositivas de Google
  • Hojas de cálculo: Hojas de XLS, XLSX y Google
  • Archivos de datos tabulares: CSV, TSV

Tenga en cuenta que si bien los archivos de datos y datos tabulares requieren pagar por Gemini Advanced (a través de los más caros Google uno Plan), todo lo demás es gratis. Entonces, si desea resumir un informe médico complejo o visualizar una hoja de cálculo, puede hacerlo en unos segundos.

Los estudiantes pueden usar la función para resumir cosas como documentos académicos, notas de clase o incluso libros completos, suponiendo que pueda encontrar un libro en formato PDF.

Relacionado

4 Secretos de Kindle que uso para obtener libros a barato o gratis

Puede aumentar su biblioteca de libros electrónicos Kindle sin vender un riñón en el proceso; estos son algunos de los mejores métodos menos conocidos.

4 Respuestas basadas en la búsqueda utilizando personalización

Las preocupaciones de privacidad pueden estar en juego

Google

Una adición relativamente reciente a Géminis es algo que Google llama “personalización”. Esto puede ser confuso, dado que ha podido conectar Gemini con otros servicios de Google. Lo que la compañía realmente significa es que ahora puede vincular Gemini con sus resultados de búsqueda de Google, lo que hace que sea más probable que obtenga resultados basados ​​en consultas recientes. Si solicita recomendaciones de viaje, por ejemplo, podría hacer referencia a las veces que buscó Berlín, Vancouver y Kilkenny. Si no ha buscado algo últimamente, Gemini aún puede inferir cosas basadas en hábitos pasados.


No querrá que AI le recomiende un viaje a Corea del Norte porque estaba investigando algo para una clase de ciencias políticas.

Para probar esto, abra el menú desplegable de selección de modelo Gemini y elija Personalización (experimental). Solo recuerde volver a un modo diferente más tarde si le preocupa la privacidad, o Gemini produce resultados impares basados ​​en búsquedas únicas. No querrá que AI le recomiende un viaje a Corea del Norte porque estaba investigando algo para una clase de ciencias políticas. Si regresa a Géminis con personalización, debería ver una opción para Desconecte su historial de búsqueda.

Relacionado

No estoy conteniendo la respiración para el M5 iPad Pro, aquí está por qué

Los problemas para justificar la existencia del iPad Pro solo se intensificarán.

Continue Reading

Noticias

6 mejores características de Géminis para probar su Google Pixel 9

Published

on

Si es un usuario de Google Pixel 9, tiene acceso a varias funciones habilitadas para AI en su teléfono. Desde editar sus fotos “mágicamente” hasta traducir el texto en pantalla, permítame mostrarle de lo que su teléfono es capaz, gracias a la IA.

Edite sus fotos con Magic Editor en Google Photos

En la aplicación Google Photos en su Pixel 9, tiene acceso a una función llamada Magic Editor. Esta característica habilitada para AI le permite mover, cambiar el tamaño, reinventar y eliminar objetos de sus fotos. A diferencia de otras aplicaciones de edición, esta función reconoce inteligentemente qué objeto desea seleccionar en sus fotos.

Para usarlo, inicie Google Photos en su teléfono. Toque una foto para que se abra en su tamaño completo. Desde la barra inferior, seleccione “Editar”. En la esquina inferior izquierda, toque el ícono del editor Magic para acceder a la función.

Ahora puede usar varias opciones en pantalla para editar su foto. Por ejemplo, para jugar con un objeto en su foto, toque y aguanta, o dibuje un círculo a su alrededor. Ahora puede moverse y cambiar el tamaño de este objeto. También puede eliminar este objeto de su foto tocando “borrar”.

Resumir grabaciones de audio largas en la aplicación de grabadora

Si tiene grabaciones largas guardadas en la aplicación de grabadora de su teléfono, puede usar una función AI para obtener un resumen de texto de todas esas grabaciones. Esto le permite resumir sus largas reuniones, entrevistas y otro contenido.

Relacionado

Cómo uso AI para transcribir y organizar mis notas de voz

Nunca vuelva a perder sus pensamientos espontáneos al azar.

Para hacer eso, abra la aplicación de grabadora en su teléfono. Debe habilitar la copia de seguridad de la nube para que la función funcione. Para hacer eso, en la esquina superior derecha de la aplicación, toque su icono de perfil y elija “Encender la copia de seguridad”.

En la pantalla principal, seleccione la grabación para resumir. En la pantalla de reproducción, acceda a la pestaña “Transcripción”. En la parte superior de la pestaña, toque “Resumir”. Verá un resumen de texto de su grabación en su pantalla.

Si su grabación seleccionada es demasiado corta, la aplicación dirá que no puede resumirla.

Identificar y obtener más información sobre cualquier objeto en la pantalla de su Pixel 9

Pixel 9 ofrece una función de círculo a búsqueda que le permite identificar y obtener más información sobre cualquier objeto en pantalla. Por ejemplo, si ve una foto de una planta en su pantalla, pero no sabe qué planta es, el círculo a la búsqueda puede darle más información al respecto.

Para usar esa función, acceda a la pantalla donde se encuentra su objeto. Toque y mantenga presionado el botón de inicio en su teléfono. Luego, toque el objeto en la pantalla o dibuje un círculo que cubra el objeto.

En la mitad inferior de su pantalla, Google mostrará más información sobre su objeto seleccionado. Todavía puede ver el objeto original en la mitad superior de la pantalla.

Traducir texto de un idioma a otro en cualquier pantalla

Si bien puede usar la aplicación Google Translate para realizar traducciones de texto, eso requiere que copie el texto y lo pegue en esa aplicación. Afortunadamente, los usuarios de Pixel 9 pueden usar una función de traducción en pantalla. Esta característica traduce automáticamente el texto en pantalla al inglés (o el idioma de su elección) directamente en la pantalla en la que se encuentra, sin necesidad de abrir ninguna aplicación.

Relacionado

¿Chatgpt es un mejor traductor que el traductor de Google?

¿ChatGPT ha superado a Google Translate en su propio trabajo?

Para usar esa función, en su teléfono, diríjase a Configuración> Sistema> Traducir en vivo. Encienda la alternancia “Use Live Translate”. Seleccione “Traducir a” y elija el idioma al que desee que se traduzca el texto.

Abra una aplicación donde tenga texto en el idioma extranjero. En la parte superior de la pantalla, verá un aviso que le permite traducir el texto en su pantalla.

Use la carga adaptativa para reducir el desgaste de la batería

La función de carga adaptativa permite que la batería de su Pixel 9 dure más al reducir la velocidad de carga. La forma en que funciona es que cuando carga su teléfono durante la noche, la función ralentiza la carga y solo lleva su teléfono al 100% cuando está a punto de despertarse (aprende del uso de su teléfono cuando se despierta). Esto reduce el desgaste de la batería de su teléfono.

Para usar esa función, Configuración de acceso> Batería> Optimización de carga y habilite “Use la optimización de carga”. Luego, encienda “carga adaptativa”.

Otra opción que puede usar es “Límite al 80%”, que, como su nombre lo indica, solo cobra su teléfono al 80%.

Identifique cualquier canción que te toque justo en tu pantalla de bloqueo

Pixel 9 ofrece una función de reproducción que te muestra los nombres de las canciones que te rodean. Reconoce automáticamente esas canciones y muestra sus nombres directamente en la pantalla de bloqueo de su teléfono, sin exigirle que haga nada.

Relacionado

Cómo hacer una lista de reproducción de la historia de “Now Playing” de tu píxel

Ahora puede agregar canciones identificadas por “ahora tocando” en los teléfonos de Google Pixel a una lista de reproducción. Aquí le mostramos cómo hacerlo.

Para habilitar la función, diríjase a Configuración> Sound & Vibration> ahora tocando y enciende “Identifique canciones tocando cerca”. Luego, para ver las canciones que esta característica ha identificado hasta ahora, toque “ahora tocando la historia”.


Y así es como utiliza sus diversas funciones de IA incorporadas en su Pixel 9 para facilitar su vida. Hay otras características de píxeles que debe consultar para aprovechar al máximo su dispositivo.

Continue Reading

Noticias

Hidock H1 Chatgpt con altavoz y un muelle con transcripción de IA

Published

on

A medida que más usamos reuniones de video y llamadas telefónicas en lugar de reuniones cara a cara, existe una creciente demanda de teléfonos de altavoces inteligentes y estaciones de acoplamiento que pueden proporcionar un centro de comunicaciones para grabar llamadas y transcribirlas en mensajes de texto y resúmenes de entrevistas y reuniones. Los periodistas aprecian particularmente este tipo de tecnología porque puede liberarlos de la tiranía de la notificación, lo que les permite centrarse en la conversación.

Escondite es una compañía que fue fundada en 2014 y ha desarrollado tecnología Audio DSP avanzada que se aplicó a más de 500,000 dispositivos en varios sectores, que van desde electrodomésticos inteligentes hasta automóviles y dispositivos de teleconferencia.

El Hidock H1 es la combinación de una estación avanzada de altavoces y acoplamiento que compite con el muelle logi de Logitech. Ha sido diseñado para impulsar la productividad en forma de un muelle compacto 11 en 1 por ChatGPT. El H1 puede transformar conversaciones grabadas en transcripciones completamente estructuradas y también puede capturar ideas, notas y resúmenes de reuniones de cualquier fuente de audio utilizando el poder de la inteligencia artificial.

El nuevo Hidock H1 ha sido diseñado específicamente para profesionales de negocios, creadores de contenido y estudiantes que podrían asistir a conferencias en línea. Es adecuado para cualquier persona que necesite tomar notas o transcribir una conversación. El H1 utiliza la última tecnología AI para aumentar la productividad, eliminando la necesidad de notas de papel desaliñadas.

Sin embargo, el H1 afirma ser más que un altavoz avanzado. También es una personalización personal inteligente que puede aprovechar la tecnología CHATGPT para hacer transcripciones y resúmenes inteligentes de IA. Al presionar un botón, los usuarios pueden capturar conversaciones importantes y el audio puede transcribirse automáticamente y resumir utilizando software patentado llamado Hinotes.

La combinación de ChatGPT y Hinotes permite a los usuarios mantenerse enfocados en reuniones y conversaciones importantes en lugar de distraerse con la necesidad de tomar notas. El contenido y los detalles importantes se capturan fielmente para un escrutinio más cercano después de que la llamada haya terminado. Las conversaciones se almacenan en el almacenamiento flash interno del H1. Cada grabación puede durar hasta cuatro horas.

El H1 también tiene la tecnología de Hidock llamada cancelación de ruido bidireccional que minimiza los sonidos de distracción de ambos extremos de una conversación. En otras palabras, cancela el ruido en la habitación donde se realiza la llamada y limpia la calidad de la llamada de la persona en el otro extremo de la llamada. La tecnología es un paso adelante de las tecnologías de cancelación de ruido activas estándar a las que nos hemos acostumbrado porque proporciona una claridad mejorada tanto para el altavoz como para el oyente.

El Hidock H1 también puede aumentar la productividad más allá de la sala de conferencias. Al usar la última tecnología Bluetooth 5.2, el H1 puede conectarse con teléfonos inteligentes, permitiendo a los usuarios grabar sus conversaciones telefónicas, podcasts y otros audio, como una conferencia o reunión. Esta característica proporciona otra capa de conveniencia con el audio transcrito en un conjunto de notas bien estructuradas.

La segunda característica de este altavoz de alta gama es su capacidad para funcionar como un centro. El Hidock H1 es una estación de acoplamiento 11 en 1 con cuatro puertos USB-C, un puerto USB 3.2, un puerto USB 3.0, dos puertos HDMI, Ethernet de 2.5 Gbps y dos ranuras para tarjetas de memoria que se pueden usar para obtener archivos de audio de una grabadora digital u otro dispositivo de grabación.

El diseño de las características de acoplamiento del H1 permite que los dispositivos y periféricos esenciales se conecten a una computadora portátil para la productividad simplificada. El Hidock H1 también incluye un auricular con clip que se conecta al H1 a través de un protocolo patentado que mejora la seguridad de las llamadas y garantiza la privacidad cuando el altavoz del H1 podría distraer a los colegas o si la privacidad es esencial para las llamadas personales. El auricular permite a los usuarios tomar breves descansos durante las largas reuniones mientras siempre están conectados.

El Hidock H1 es lo suficientemente compacto como para ser portátil y llevado a cualquier parte. Puede convertir un escritorio caliente o una cápsula de oficina en un centro de comunicaciones. Con su diseño fácil de usar y ergonómico, así como la integración revolucionaria de ChatGPT, el Hidock H1 es una aplicación útil de IA que puede ahorrar tiempo y aumentar la productividad.

El secreto del poder del H1 es Hinotes, el software con alimentación de chatgpt que utiliza IA para convertir las llamadas y las reuniones en texto editable. Cualquiera que compre el Hidock obtendrá minutos ilimitados de transcripción, cuatro plantillas de resumen, múltiples opciones de motor de IA, marca de voz, transcripción de exportación y resumen en formato TXT, integración de calendario y soporte para 75 idiomas.

Para los usuarios pesados ​​del servicio de transcripción, también hay un nivel de membresía profesional de Hinotes que cuesta $ 12.99 por 1,200 minutos de transcripción de audio o un pago anual de $ 199 proporciona una transcripción ilimitada de un año. La membresía Pro también proporciona identificación de altavoces, plantillas de resumen de IA ilimitadas y personalización. Las transcripciones se pueden exportar en formatos TXT, CSV, SRT, Markdown, Word y PDF y el Servicio también se integra con Google Docs, OneNote y el software de traducción de resumen de nociones.

Precios y disponibilidad:

El Hidock H1 está disponible ahora y los precios comienzan en $ 269.

Características:

  • Estación de acoplamiento 11 en 1.
  • 100% de registro automático, transcribir, resumen.
  • Resumen de la reunión de IA impulsado por GPT-4.
  • Cancelación de ruido bidireccional.
  • 118W PD Cargo rápido.
  • Aplicación complementaria gratuita y compatible con OTA.
  • Auricular inalámbrico incluido.

Especificaciones tecnológicas:

  • Compatibilidad: Windows, MacOS, Linux, iOS, iPados, Android, Zoom, equipos de Microsoft, Google Meet, Discord, FaceTime, WhatsApp.
  • Conectividad: potencia para una computadora portátil hasta una carga de 100W.
  • Video: 2 x HDMI V 2.0 (4K @ 60Hz HDR).
  • Ethernet: 2.5 Gigabit.
  • Tarjetas de memoria: SD 4.0 y MicroSD 4.0 (UHD-II).
  • USB-A x 2.
  • USB 3.2 Gen2 (10Gbps) x 1
  • USB 3.1 Genl (5Gbps) x 1
  • Potencia al teléfono celular: carga de hasta 18 vatios.
  • USB-C x 2.
  • USB 3.2 Gen2 (10Gbps) x 1.
  • USB 3.2 Gen2 (10Gbps) x 1 con una carga de hasta 18 W.
  • USB-C Upstream X1.
  • DC Power (20V, 7.5a).
  • Cancelación de ruido bidireccional basado en audio Al para micrófono y altavoz.
  • Tipo de cancelina de ruido: mecanografía de teclado, ladridos de perros, ruido de la calle, ruido de fondo de la oficina, ruido del viento.
  • Conductores: Tweeter 5W, controlador de banda completa de 7W y radiador pasivo.
  • Dimensión (H x W x D): 72.4 x 178 x 93.5 mm.
  • Peso: 480 g.
  • Acabados: pizarra gris/gris platino.
Continue Reading

Trending