Connect with us

Noticias

Funciones clave de ChatGPT lanzadas en 2024

Published

on

El año está llegando a su fin, por lo que es el momento perfecto para realizar una revisión anual. Muchos creadores siguen de cerca productos como ChatGPT, Claude y Perplexity, generando resúmenes anuales interesantes. Me complace compartir estas reseñas en nuestro sitio web, junto con enlaces relevantes para brindar más contexto.

Comenzando con ChatGPT, podemos explorar una infografía preparada por Tibor que destaca las características clave desarrolladas a lo largo del año. Curiosamente, junio resultó ser el mes con menos lanzamientos de funciones, después de los anuncios importantes en mayo. Por el contrario, en diciembre se produjo la mayor cantidad de actualizaciones, muchas de las cuales se dieron a conocer durante la iniciativa “12 días de OpenAI” de OpenAI.

Profundicemos en cada característica y sus detalles.

Enero

El año comenzó con el lanzamiento de GPT-Store, donde había muchas esperanzas, promesas y expectativas de que OpenAI se convirtiera en una plataforma donde los usuarios podrán crear agentes de IA. Muchos constructores empezaron a experimentar con lo que era posible. Algunos de los GPT realmente recibieron muy buena atención y una base de usuarios como Grimoire, por ejemplo, y otros.

Creo que muchos de ellos todavía se utilizan hasta ese día, aunque a la larga, quedó claro que la mayoría de la gente usa sus propios GPT con sus indicaciones personalizadas para sus propios casos de uso, en lugar de depender de los GPT creados por otras personas. GPT-Store siguió obteniendo nuevas funciones durante la primera mitad del año, mientras que el desarrollo en torno a GPT-Store se estancó posteriormente. En realidad, no obtuvimos muchas características nuevas en la segunda mitad.

  • Tienda GPT 🔥
  • Herramienta “guardián” (elecciones)
  • Etiquetado en línea de GPT
  • Opción “Leer en voz alta” para respuestas (aplicaciones móviles)
  • Proceso de apelación de autoservicio para GPT
  • plan de equipo
ChatGPT

Febrero

En febrero, además de pulir la tienda GPT, recibimos un anuncio de Sora que no se lanzó hasta diciembre. Curiosamente, este anuncio elevó el precio de WorldCoinlo cual fue una correlación interesante de observar. Además de eso, también recibimos un anuncio de la función Memoria que tardó algún tiempo en lanzarse, especialmente en la UE.

  • La versión beta de los complementos ChatGPT está descontinuada
  • Anuncio de memoria (“Sunshine”) 🔥
  • Nueva apariencia (“Hedgehog”)
  • Reseñas y comentarios sobre GPT
  • Verificación social para perfiles de constructor GPT
  • anuncio de sora
  • charla temporal
  • Modo oscuro y claro actualizado
  • Historial de versiones de GPT
ChatGPT

Marzo

En marzo, OpenAI introdujo nuevas herramientas para la creación y edición de imágenes, incluido el lanzamiento de un editor de imágenes integrado. Además, OpenAI anunció un programa de reparto de ingresos para los creadores de GPT. Sin embargo, esta fue probablemente la última vez que escuchamos sobre un programa de este tipo, ya que parece que la iniciativa nunca despegó ni ganó fuerza.

  • Instrucciones personalizadas
  • Capacidades GPT-4
  • Controles DALL-E 3 (estilo y relación de aspecto), edición y pintura 🔥
  • Opción “Leer en voz alta” para respuestas (web)
  • Ganancias GPT basadas en el uso
  • Atribuciones web
  • Inédito/Trabajo en progreso:
    • GPT personalizados
    • Herramienta de intención V2
    • Bloques de instrucciones y estado guardado
ChatGPT

Abril

En abril, OpenAI lanzó la versión 2 de análisis de datos, que permite a los usuarios crear gráficos y trabajar con datos de una manera más eficiente y fácil de usar. La función Memoria finalmente también se implementó ampliamente durante este tiempo. Además, Se detectaron los primeros signos de capacidades de visión en la aplicación de iOS.incluso antes del anuncio oficial, que se produjo en mayo.

  • Fuga de ChatGPT Vision 🔥
  • Acceder sin cuenta
  • Controles de datos v2
  • Migración de dominio a chatgpt.com
  • Huevo de Pascua “DvdPlayer”
  • GPT-4 Turbo
  • Memoria para usuarios Plus
  • Compartir chats actualizado
ChatGPT

Puede

En mayo, OpenAI organizó su famoso Demo Day, que tuvo lugar justo un día antes del Google I/O. Durante el evento, mostraron capacidades de visión, modo de voz avanzado tanto para dispositivos móviles como de escritorio, y presentaron la muy esperada aplicación de escritorio. La aplicación de escritorio estuvo disponible inmediatamente después de la conferencia.

Poco después, Los ingenieros inversos descubrieron y accedieron a la versión alfa. de la aplicación macOS al detectar un enlace de descarga para una compilación alfa separada. Esta versión filtrada incluía herramientas de desarrollador, lo que permitía a los usuarios alternar varios indicadores de funciones y obtener una vista previa de la interfaz de usuario del modo de voz avanzado. Si bien aún no estaba en funcionamiento, proporcionó una visión emocionante de lo que estaba por venir.

Desafortunadamente, Mayo también marcó la pérdida de Sky Voice.una voz favorita de muchos usuarios. En una nota más brillante, GPT-4o fue lanzado oficialmenteconsolidándose como uno de los modelos de mayor rendimiento en LM Arena.

  • Selección de modelo automática (dinámica) para usuarios gratuitos
  • Aplicaciones conectadas (Google Drive y Microsoft OneDrive)
  • Análisis de datos V2 (“grafito”: gpt-4-da-v2)
  • Aplicación de escritorio para macOS (Sidekick) 🔥
  • GPT-4o (“Netptune”/“Cebolleta”)
  • Nueva apariencia (“Jugo de frutas”)
  • Regenerar la respuesta usando un modelo diferente
  • Se eliminó la voz “Cielo”
  • Cambiar de modelo en la misma conversación
  • Herramientas y GPT para usuarios gratuitos
ChatGPT

Junio

En junio, Apple anunció una asociación con OpenAI, presentando “Apple Intelligence”. Casi al mismo tiempo, OpenAI envió varias actualizaciones a su aplicación de escritorio macOS, poniéndola a disposición de todos los usuarios. En ese momento, había grandes expectativas de que OpenAI lanzara pronto el modo de voz avanzado, ya que numerosos indicios apuntaban en esa dirección.

Sin embargo, OpenAI anunció más tarde que el lanzamiento del modo de voz avanzado se retrasaría, probablemente debido a requisitos de cumplimiento normativo. Además, es posible que la estabilidad de la función no haya estado en un nivel adecuado para su lanzamiento público.

Como resultado, el modo de voz avanzado no se lanzó hasta septiembre, y las capacidades de visión para dispositivos móviles le siguieron en diciembre. Mientras tanto, la funcionalidad de visión para usuarios de escritorio sigue sin estar disponible hasta el día de hoy.

  • Anuncio de integración de Apple Intelligence
  • Aplicación de escritorio para macOS (“Sidekick”) para todos los usuarios 🔥
BuscarGPT

Julio

En julio, la interfaz de usuario de ChatGPT experimentó una renovación completa. Además, OpenAI anunció su prototipo SearchGPTlo que marcó su entrada en el espacio de los motores de búsqueda y los posicionó como un competidor potencial de herramientas como Google Search o Perplexity. Este prototipo fue inicialmente muy limitado, disponible sólo para un pequeño grupo de usuarios, y la lista de espera se cerró poco después.

Posteriormente, este prototipo se integró directamente en el producto principal ChatGPT, ampliando su funcionalidad y accesibilidad.

  • Desuso de GPT-3.5
  • GPT-4o mini (“cebollino”)
  • Nueva apariencia (“Jugo de fruta”) predeterminada para todos
  • Prototipo de SearchGPT 🔥
ChatGPT

Agosto

En agosto, el tan esperado modo de voz avanzado comenzó a implementarse para un grupo limitado de usuarios, y en septiembre se lanzó un lanzamiento más amplio. Durante el mismo período, la página de inicio de ChatGPT fue rediseñada para adoptar una apariencia más alineada con un producto de búsqueda, lo que refleja la dirección cambiante de OpenAI.

  • Se inició el lanzamiento de voz avanzada (gpt-4o-s2s)
  • DALL-E 3 para usuarios gratuitos 🔥
  • Los tokens de memoria máxima aumentaron a 8k
  • Nueva apariencia (página de inicio v2, mensajes de inicio v2, nuevo compositor de mensajes)
  • GPT-4o actualizado
  • Inédito/Trabajo en progreso:
    • Conectores de sincronización (Google Drive (nuevo) y Slack)
ChatGPT

Septiembre

En septiembre, el modo de voz avanzado finalmente estuvo disponible para una audiencia más amplia. OpenAI también presentó O1 Preview y O1 Minipresentando nuevos modelos que respaldaban el razonamiento de la Cadena de Pensamiento. Junto con estos lanzamientos, OpenAI lanzó evaluaciones que evaluaron el desempeño de todos los modelos y planes existentes.

Inicialmente, estas nuevas ofertas venían con límites de uso estrictos, que se incrementaron ligeramente poco después para adaptarse a los comentarios y la demanda de los usuarios.

  • Voz avanzada (gpt-4o-s2s) con nuevas voces, memoria e instrucciones personalizadas
  • Memoria disponible para todos
  • Migración de Next.js a Remix
  • o1-preview y o1-mini (y herramienta CoT “A8KM123”)
  • Sugerencias del sistema (Imagen, Búsqueda)
  • GPT-4o actualizado
ChatGPT

Octubre

En octubre, Los usuarios de Windows obtuvieron acceso a la aplicación de escritorio basada en Electron de OpenAI. Además, OpenAI presentó Canvassu versión de Artifacts, que permite a ChatGPT mostrar código o texto específico en una hoja lateral separada para una mejor organización. También se integró la funcionalidad de búsqueda en tiempo real. directamente en el producto principal ChatGPT, mejorando su usabilidad.

  • Voz avanzada para aplicaciones de escritorio de macOS y Windows
  • Lienzo (“CanMore”)
  • Aplicación de escritorio para Windows (“Sidetron”)
  • GPT-4o con lona (gpt-4o-canmore)
  • Buscar (“Sonic”)
  • Buscar en el historial de chat (“Fanny Pack”)
ChatGPT

Noviembre

En noviembre, muchas funciones existentes se pusieron a disposición de una base de usuarios más amplia. Además, el rendimiento de ChatGPT recibió una actualización que culminó con el lanzamiento de la última versión de GPT-4o. La aplicación de escritorio macOS introdujo el Función Trabajar con aplicaciones en versión betalo que permite una integración mejorada con aplicaciones externas. Además, finalmente se lanzó el modo de voz avanzado para su uso en la web, ampliando su accesibilidad.

  • Voz avanzada en la web
  • Aplicación de escritorio para Windows (“Sidetron”) para todos los usuarios
  • Nueva apariencia (barra lateral, experiencia web/móvil renovada)
  • GPT-4o actualizado
  • GPT-4o mini actualizado
  • Trabajar con aplicaciones en macOS
  • Inédito/Trabajo en progreso:
    • Lienzo – zona de pruebas de código
    • Aplicaciones conectadas: Jira y Confluence
ChatGPT

Diciembre

Diciembre fue uno de los meses más emocionantes para OpenAI, gracias a su 12 días de OpenAI evento, donde tenían como objetivo lanzar o anunciar nuevas funciones, grandes y pequeñas, cada día durante el evento. Curiosamente, a finales de noviembre, justo antes de que comenzara el evento, algunos usuarios descubrieron accidentalmente una forma de acceder a la versión sin vista previa de 01que estuvo disponible brevemente durante unas horas.

El primer día de diciembre, los usuarios también detectaron rastros de GPT-4.5aunque nunca fue anunciado oficialmente. Además, el Plan profesional Hizo su primera aparición el mismo día. El evento trajo una serie de anuncios importantes, incluido el lanzamiento del sorafunción AVM Vision, la introducción de Proyectosel anuncio de 03y muchas otras mejoras.

Una característica muy esperada, Tareastambién fue visto en desarrollo. Esta característica permitiría a los usuarios programar avisos o crear automatizaciones. Se esperaba que fuera lanzado durante el 12 días de OpenAIpero por razones desconocidas su lanzamiento fue pospuesto. Ahora es probable que veamos esta función lanzada en algún momento de 2025.

  • 1-800-CHATGPT y WhatsApp
  • Modo avanzado con vídeo, capturas de pantalla y modo Santa 🔥
  • Integración de inteligencia de Apple
  • Mejoras en el lienzo (GPT personalizados, ejecución de código Python, accesos directos, caja de herramientas)
  • Vista previa de o3 y o3-mini, convocatoria de investigadores de seguridad
  • plan profesional
  • Proyectos (“Snorlax”)
  • Mejoras en la búsqueda y acceso gratuito
  • Sora Turbo
  • Mejoras en Trabajar con aplicaciones en macOS (más aplicaciones, vínculo con aplicaciones)
  • Inédito/Trabajo en progreso:
    • Canvas – Acciones rápidas “Transformar”
    • Aplicaciones conectadas – Noción
    • “Jawbone”: Tareas (automatización)
    • Memoria en búsqueda
    • “Moonshine”: la memoria en la configuración es más inteligente, recuerda más conversaciones pasadas (Beta)
    • “Nimbus”: configuración de notificaciones
    • Plan de quórum

¿Olvidaste algunos de estos? Puede encontrar un registro de cambios detallado para ChatGPT en TestingCatalog. ¿Qué característica ha sido tu favorita?

Deja tus pensamientos a continuación en los comentarios 👇

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

La guerra de redes sociales de IA ha comenzado

Published

on

Suscríbase a Freethink en Susmack de forma gratuita

Obtenga nuestras nuevas historias favoritas directamente a su bandeja de entrada todas las semanas

La carne de res de Sam Altman versus Elon Musk ahora es todo menos cortés. En febrero, Musk lanzó una granada de adquisición de $ 97.4 mil millones en Operai, a la que Altman respondió en X con un “No gracias, pero compraremos Twitter por $ 9.74 mil millones si lo desea”.

X no fue comprado, pero Altman está construyendo su competidor.

Operai ha estado dibujando su propio patio de recreo de estilo X durante meses, lo suficiente como para que los expertos ahora hablen sobre el lanzamiento de la nueva red social en términos de cuandono si.

En febrero, después de que Meta anunció planes para construir una aplicación independiente para que su asistente de IA rivalice con la aplicación Chatgpt, Altman volvió a disparar en X: “Está bien, tal vez hagamos una aplicación social”.

Luego se filtró el 15 de abril de que un prototipo interno de Operai que combina un feed social con las capacidades de generación de imágenes de Chatgpt estaba en revisión. Más fuentes fueron tan lejos como para confirmar que, más allá de este prototipo, Operai ahora estaba “considerando” un rival completo de X.

Esta red social empuja las tierras en un momento crucial cuando los modelos de IA se están volviendo comerciales, el monopolio de las redes sociales de Meta muestra signos de vulnerabilidad, y la integración de hardware está surgiendo como un diferenciador clave.

Al combinar tres elementos, una plataforma social construida de forma nativa para la IA, el diseñador tecnológico de clase mundial Jony Ive y los dispositivos complementarios especialmente diseñados, OpenAi se está posicionando en la intersección de las tres tendencias poderosas.

Si la compañía logra este juego de redes sociales con éxito, atrapará a otros gigantes tecnológicos de pie plano, tanto que estoy convencido de que estamos presenciando las primeras salvas de una revolución de las redes sociales en toda regla.

AI-First Social Media

En lugar de simplemente conectar a los usuarios para compartir contenido, el prototipo de red social de OpenAI aparece diseñado para aprovechar la IA para mejorar el proceso de creación de contenido en sí. En lugar de “compartir y luego desplazarse”, la IA salta en el minuto uno para ayudar hacer el post.

Esto es similar a la integración de Grok de X: si lo ha usado, notará rápidamente que a la gente le encanta que la IA diga algo estúpido para que puedan compartir la salida y ver que su publicación se vuelve viral.

El equivalente aquí para OpenAI es aprovechar sus capacidades de generación de imágenes favoritas de los fanáticos en un entorno social. En la primera semana de la disponibilidad de la herramienta, más de 130 millones de usuarios de ChatGPT crearon más de 700 millones de imágenes. Esta adopción masiva indica un interés significativo de los usuarios en compartir contenido visual generado por IA, de la misma manera que las personas ya comparten contenido escrito generado por IA en X.

Sin embargo, lejos de ser otro clon X, la red social de OpenAi se perfila como algo completamente nuevo. Esto es lo que he reconstruido hasta ahora:

  • La creación de contenido asistida por AI-AI-AI-Capacidades de generación de imágenes de Chatgpt
  • Un feed social para compartir e interactuar con contenido generado por IA
  • Integración con las capacidades de IA existentes de OpenAI y potencialmente su base de usuarios
  • Guardacas de seguridad similares a las utilizadas en la generación de imágenes de Chatgpt

También es probable que haya un componente de hardware para la red.

El 21 de mayo, Openai anunció su adquisición de IO, una compañía de hardware fundada por el ex jefe de diseño de Apple, Jony Ive. El acuerdo, valorado en casi $ 6.5 mil millones en una transacción de todo el stock, lleva aproximadamente 55 ingenieros de hardware, desarrolladores de software y expertos en fabricación al redil OpenAI.

Los primeros dispositivos después de la adquisición se lanzarán en 2026, pero no serán reemplazos de teléfonos inteligentes. Se mencionaron algunos detalles sobre la tecnología, incluido que será de bolsillo, contextualmente consciente, sin pantalla y no un par de gafas inteligentes, en una llamada interna de OpenAI.

La conexión entre esta iniciativa de hardware y las ambiciones de redes sociales de OpenAI es estratégicamente significativa. Estoy convencido de que al desarrollar una plataforma social y dispositivos complementarios, OpenAi se está posicionando para crear un ecosistema totalmente integrado donde las experiencias sociales con IA se optimizan para el hardware especialmente diseñado.

Es el clásico libro de jugadas de Apple, solo esta vez el principio de organización es pura IA.

Además, si bien IVE no se unirá a OpenAi directamente, su firma de diseño, LoveFrom, continuará siendo independiente, la asociación verá Love de “Take Onge para todos los OpenAi, incluido su software”. La experiencia estética y de usuario de la red social de OpenAI, sin duda, se beneficiará de la reconocida sensibilidad de diseño de Ive.

“La IA es una tecnología increíble, pero las grandes herramientas requieren trabajo en la intersección de la tecnología, el diseño y la comprensión de las personas y el mundo”, dijo Altman en un comunicado anunciando la adquisición de IO.

El contramardo de IO de Google

Google es, sin duda, uno de los mayores competidores de Openai en el espacio de IA, y en I/O 2025 (casualmente celebrado el mismo día que OpenAI anunció la adquisición de IO), el gigante de la búsqueda presentó actualizaciones de IA significativas e impresionantes.

Dos grandes fueron la integración de Gemini en Chrome para los usuarios de escritorio y el anuncio del “modo de agente”, una característica experimental donde los usuarios simplemente pueden describir su objetivo final y Gemini puede trabajar de manera autónoma para lograrlo. Esta capacidad refleja el tipo de experiencia asistida por AI-AI que las fuentes dicen que OpenAi se está incorporando a su red social.

Según la publicación oficial de blog de E/S 2025 de Google, Gemini 2.5 Pro es ahora el modelo líder mundial en las tablas de clasificación Webdev Arena y Lmarena, y en base a mi experiencia personal utilizando los modelos de Google con puntos de referencia de rendimiento específicamente en la mente, están liderando en muchos aspectos. La publicación también señala que la aplicación Gemini ahora tiene más de 400 millones de usuarios activos mensuales, una base de usuarios lo suficientemente masiva como para ponerla en competencia directa con ChatGPT.

Sin embargo, si bien estos avances posicionan a Google como una amenaza para el creciente ecosistema de inteligencia artificial de Openii, también sugieren que la estrategia de la compañía es continuar mejorando sus productos existentes con IA en lugar de tratar de competir directamente en el espacio de redes sociales.

Un imperio debilitante

En cuanto al rey de ese espacio, meta, está avanzando con los esfuerzos para defender su territorio contra los avances de OpenAi.

Durante una llamada de ganancias del primer trimestre de 2025 el 30 de abril, el CEO Mark Zuckerberg describió una estrategia integral de IA. “Estamos haciendo un buen progreso en las gafas de IA y la meta ai, que ahora tiene casi mil millones de activos mensuales”, dijo Zuck a los inversores, según la transcripción de la llamada. Este hito pone al asistente de IA de Meta a la par de Géminis de Google en términos de adopción del usuario, y potencialmente antes de ChatGPT.

La familia de modelos de Meta’s Llama 4 ha visto una notable adopción, y Meta dijo en marzo de 2025 que Llama había alcanzado las 1 mil millones de descargas. El día antes de la llamada de ganancias, la compañía lanzó una aplicación Meta AI dedicada construida con Llama 4, llamándola “un primer paso para construir una IA más personal”. Esta aplicación independiente representa un desafío directo a ChatGPT y, por extensión, los planes de redes sociales de OpenAI.

Operai puede posicionarse como una alternativa fresca y nativa de AI a las experiencias sociales existentes de Meta.

Sin embargo, aunque sigue siendo dominante en el espacio de redes sociales, Meta muestra signos de vulnerabilidad.

La compañía parece firme en su creencia de que las experiencias sociales en última instancia abarcarán tanto los asistentes de IA como los mundos virtuales inmersivos, como lo demuestran su continua inversión en los mundos de horizonte. Esta visión de la realidad virtual social pronto puede competir directamente con las iniciativas de hardware y redes de hardware de Openai, pero la inversión aún no ha producido rendimientos significativos: en el primer trimestre de 2025, la División de Laboratorios VR de Meta informó otras pérdidas de $ 4.2 mil millones.

El pivote de Meta a la IA también sugiere una postura defensiva contra las amenazas emergentes, como OpenAi y Anthrope. Esto crea una apertura estratégica para la nueva red social de Openai: puede posicionarse como una alternativa nueva y nativa de AI a las plataformas heredadas de Meta y las experiencias sociales existentes, que se están modificando con capacidades de IA.

Antrópico como el retador

Hablando de antrópico, el día después de la salpicadura de Altman, el paisaje de IA se volvió aún más competitivo con la inauguración de la startup de Claude 4 y la introducción de dos nuevos modelos: Claude Opus 4 y Claude Sonnet 4.

“Claude Opus 4 es el mejor modelo de codificación del mundo, con un rendimiento sostenido en tareas complejas y de larga duración y flujos de trabajo de agentes”, compartió Anthrope en su anuncio de lanzamiento. La compañía respaldó este reclamo con impresionantes puntos de referencia: 72.5% de precisión en el punto de referencia de ingeniería de software y 43.2% en el banco terminal. He revisado los puntos de referencia y ya he usado Claude 4 en mi IDE para tareas de codificación compleja y estoy convencido de que estamos en un punto de inflexión para los modelos de codificación de IA.

Lo que hace que Claude 4 sea particularmente relevante para las ambiciones de las redes sociales de OpenAi es su capacidad mejorada de trabajar continuamente durante varias horas, una capacidad que podría permitir agentes de IA más sofisticados dentro de las plataformas sociales. Según Anthrope, Claude Opus 4 puede mantener el enfoque en las tareas que requieren “miles de pasos”, superando drásticamente los modelos anteriores.

Este lanzamiento de Claude 4 subraya una realidad estratégica crítica para OpenAI: los modelos de IA en sí mismos se están volviendo rápidamente comerciantes.

Con múltiples compañías que ahora ofrecen potentes capacidades de IA de última generación, la tecnología subyacente por sí sola ya no es un diferenciador suficiente. Esta mercantilización hace que el juego de red social de OpenAI sea cada vez más importante como una forma de crear una posición de mercado única y defendible. Controlando ambos modelos de IA y La plataforma social donde los usuarios interactúan con ellos, OpenAi puede crear un valor que va más allá de lo que es posible solo con los modelos.

Las apuestas sociales

Y luego están los datos. Siempre los datos.

Las interacciones de los usuarios en tiempo real son invaluables para capacitar a los futuros modelos de IA: son como el oro digital en un mundo ahora invadido por AI SLOP. Una red social proporciona a su propietario un suministro constante de estos datos, que solo se volverán más valiosos a medida que las capacidades del modelo base converjan entre los competidores.

X y Meta ya están obteniendo estos datos de capacitación únicos en tiempo real de sus redes. Operai lo necesita, y la adquisición de IO de Ive podría agregar un diseño de clase mundial y hardware dedicado a sus ofertas de redes sociales, ayudando a atraer a los usuarios.

A medida que los principales jugadores de inteligencia artificial, OpenAi, Google, Meta y Anthrope, continúan evolucionando sus estrategias y capacidades, las líneas entre asistentes de IA, redes sociales y dispositivos de hardware son cada vez más borrosos. Creo que estamos presenciando no solo mejoras incrementales en la tecnología de IA, sino también la aparición de una categoría completamente nueva de productos y experiencias que podrían remodelar fundamentalmente la forma en que interactuamos con las redes sociales.

Nos guste o no, los ojos de IA ahora están en nuestros feeds.

¡Nos encantaría saber de ti! Si tiene un comentario sobre este artículo o si tiene un consejo para una futura historia de Freethink, envíenos un correo electrónico a tips@freethink.com.

Suscríbase a Freethink en Susmack de forma gratuita

Obtenga nuestras nuevas historias favoritas directamente a su bandeja de entrada todas las semanas

Continue Reading

Noticias

Acabo de probar las versiones más recientes de Claude, Gemini, Deepseek y Chatgpt, y el ganador me sorprendió por completo

Published

on

Los chatbots de IA están evolucionando rápidamente con actualizaciones que ocurren constantemente de los nombres más familiares en Big Tech. Una vez más, Deepseek de China se encuentra entre los últimos en unirse a la carrera de primer nivel con un contexto de 128k, lo que significa que puede manejar conversaciones más largas y documentos más complejos.

Con la reciente actualización de su modelo R1, Deepseek se está posicionando como un competidor serio para Chatgpt, Claude y Gemini.

Continue Reading

Noticias

Sora de OpenAI ahora está disponible de forma gratuita para todos los usuarios a través de Microsoft Bing Video Creator en Mobile

Published

on

Únase a nuestros boletines diarios y semanales para obtener las últimas actualizaciones y contenido exclusivo sobre la cobertura de IA líder de la industria. Obtenga más información


El Sora de Openai fue uno de los lanzamientos más exagerados de la era de la IA, que se lanzará en diciembre de 2024, casi 10 meses después de que se previse por primera vez a reacciones asombrosas debido a que, al menos, al menos, un nivel de realismo sin precedentes, dinamismo de la cámara y adherencia rápida y clips de generación larga de 60 segundos.

Sin embargo, gran parte del brillo se ha desgastado como muchos otros generadores de videos de IA, desde startups de EE. UU. Hasta la pista de Luma y los competidores chinos Kling, Hailuo Minimax e Israel’s LTX Studio están ofreciendo modelos generativos de video de IA y aplicaciones para consumidores y usuarios empresariales que rivalizan o ya han superado la oferta de Openi. Además, todavía no hemos obtenido generaciones de 60 segundos de un solo mensaje SORA (que yo sepa, el máximo parece ser de 20 segundos).

Pero ahora Openai y su aliado/inversor/frenemy Microsoft están buscando llevar a Sora a muchos más usuarios, de forma gratuita (al menos durante algunas generaciones). Hoy, Microsoft anunció que Sora ahora se ofrece a través de su función Bing Video Creator en la aplicación móvil gratuita de Bing para iOS (Apple iPhone y App Store) y Android (Google Play Store).

Ese es un valor increíble, dado que para obtenerlo a través de ChatGPT y OpenAI, deberá pagar una suscripción CHATGPT Plus ($ 20 mensual) o Pro ($ 200 mensual).

Bing Video Creator con Sora es el último de una serie de ofertas impulsadas por la IA de Microsoft, después del lanzamiento de Bing Image Creator y Copilot.

https://www.youtube.com/watch?v=poxwxmja224

Como Microsoft Corporate Vicepresident (CVP) y Jefe de Search Jordi Ribas escribieron en X: “Hace dos años, Bing fue el primer producto en enviar creación de imágenes de forma gratuita para nuestros usuarios. Hoy, estoy emocionado de compartir que Bing Video Creator ahora está disponible en la aplicación Mobile de Bing, en todas partes que Bing Image Creator está disponible. Ven a la vida “.

Para presentar Bing Video Creator, Microsoft ha lanzado un anuncio de video promocional (incrustado arriba) que muestra cómo la herramienta da vida a ideas creativas.

El anuncio demuestra que los usuarios escriben indicaciones como “Crear un colibrí que aletea sus alas en cámara ultra lenta”, “una tortuga que se desplaza lentamente a través de un cañón de coral de neón” y “un pequeño astronauta que explora un planeta de hongos gigantes”. La IA luego genera videoclips cortos y vibrantes basados ​​en estas indicaciones.

El video enfatiza lo fácil que es crear y compartir estos videos, incluido un ejemplo del video de astronauta que se comparte en un chat y recibe reacciones positivas.

Creaciones de video verticales de 5 segundos gratis en dispositivos móviles, con videos horizontales próximamente

Bing Video Creator convierte las indicaciones de texto en videos generados por IA de cinco segundos. Todavía no es compatible con las generaciones de texto a video o video a video (que muchos otros generadores de videos de IA rivales, incluida la implementación de SORA de OpenAI).

Para usar la herramienta, los usuarios pueden abrir la aplicación móvil Bing, toque el menú en la esquina inferior derecha y seleccione “Video Creator”.

Alternativamente, puede iniciar el proceso de creación de video escribiendo una solicitud directamente en la barra de búsqueda de Bing en la aplicación, lo que es lo que es “crear un video de …”

Una vez que se ingresa el mensaje, Bing Video Creator genera un video corto basado en la descripción.

Por ejemplo, un aviso como “En un concurrido restaurante de pizza italiano, una pequeña nutria funciona como chef y usa un sombrero de chef y un delantal. Amasa la masa con sus patas y está rodeado de otros ingredientes de pizza”, resultaría en un video de cinco segundos de cinco segundos atractivo.

Actualmente, los videos están disponibles en 9:16 Formato de retrato, es decir, vertical, perfecto para los pantalones cortos de Tiktok y YouTube, aunque Microsoft lo dice en su publicación de blog de anuncios que una opción de relación de aspecto de 16: 9 también conocida como paisaje u horizontal está “llegando pronto”.

Los usuarios pueden hacer cola hasta tres generaciones de video a la vez, y cada creación se almacena por hasta 90 días. Una vez que un video está listo, se puede descargar, compartir por correo electrónico o redes sociales, o acceder a través de un enlace directo.

Bing Video Creator estará disponible en todo el mundo hoy, excepto China y Rusia. Ahora está disponible en la aplicación móvil de Bing, y también se dice que la búsqueda de escritorio y copilotos se lanzarán “pronto”.

Gratis para usar para 10 generaciones rápidas, generaciones lentas ilimitadas

Bing Video Creator es gratuito para todos los usuarios.

A cada usuario se le permiten diez generaciones de video “rápidas”, que pueden crear videos en segundos.

Después de usarlos, los usuarios pueden continuar con las generaciones de velocidad estándar, lo que lleva minutos, sin costo, o canjea 100 puntos de recompensas de Microsoft por cada creación rápida adicional.

Esos puntos de recompensa provienen del programa gratuito de opción de Microsoft que permite a los usuarios ganar puntos para las actividades cotidianas, como buscar con Bing, comprar en la tienda de Microsoft o jugar con Xbox Game Pass.

Para participar, los usuarios deben iniciar sesión con una cuenta de Microsoft y activar su tablero de recompensas aquí.

Más allá de los divertidos videos y publicaciones en redes sociales, Bing Video Creator se posiciona como una herramienta para mejorar la comunicación cotidiana y la creatividad. El anuncio de Bing alienta a los usuarios a crear videos para celebrar momentos especiales, probar ideas creativas y comunicarse de manera más efectiva.

Para ayudar a los usuarios a obtener los mejores resultados, Bing sugiere proporcionar indicaciones descriptivas, incorporar un lenguaje orientado a la acción y experimentar con tono y estilo, como la estética cinematográfica o juguetona.

AI y seguridad responsables, incorporado

Microsoft dice que Bing Video Creator está diseñado de acuerdo con sus principios de IA responsables, aprovechando los estándares C2PA para las credenciales de contenido para ayudar a identificar contenido generado por AI.

La herramienta también incluye características de moderación que bloquean automáticamente las indicaciones que podrían generar videos dañinos o inseguros.

Implicaciones para empresas y tomadores de decisiones técnicas

Aunque Bing Video Creator se enmarca actualmente como una herramienta centrada en el consumidor, su tecnología y capacidades subyacentes podrían tener implicaciones interesantes para los usuarios empresariales, particularmente aquellos involucrados en la orquestación de IA, la ingeniería de datos y el despliegue del modelo de IA.

Para los ingenieros de IA responsables de implementar y ajustar modelos de idiomas grandes, Bing Video Creator destaca la creciente madurez del video de IA generativo más allá de los modelos basados ​​en texto. Si bien no es un producto empresarial en sí, la tecnología detrás de este podría inspirar nuevas formas de incorporar la generación de videos en los flujos de trabajo comerciales, como crear resúmenes de video automatizados, contenido de capacitación o materiales de marketing.

Para los profesionales que orquestan tuberías de IA escalables, Bing Video Creator muestra una aplicación práctica de video generativo que podría influir en cómo las empresas piensan sobre la implementación de estos modelos a escala. La facilidad de uso y la capacidad de respuesta rápida de la herramienta sugieren posibles aplicaciones futuras dentro de los flujos de trabajo empresariales, ya sea para capacitación interna, ideación creativa o participación del cliente.

Los ingenieros de datos pueden ver la simplicidad y la compartimiento del creador de video de Bing como una demostración de cómo la IA puede hacer que las ideas complejas basadas en datos sean más accesibles. Si bien estos videos de grado de consumo son breves y enfocados visualmente, se podría adaptar tecnología similar en el futuro para convertir conjuntos de datos complejos o resultados del proyecto en narraciones de video cortas y atractivas que resuenan con audiencias no técnicas.

Bing Video Creator es parte del impulso continuo de Bing para democratizar la creatividad de la IA. Si bien aún no se sabe sobre las características más allá del soporte de video de paisajes, Bing dice que continuará refinando y expandiendo la experiencia a medida que más usuarios comiencen a explorar la generación de videos.

Para aquellos listos para probarlo, Bing invita a los usuarios a descargar la aplicación móvil Bing y comenzar a crear videos hoy.

Para obtener más información sobre Bing Video Creator y cómo comenzar a obtener puntos de recompensas de Microsoft para una creación de video aún más rápida, visite aquí.

Continue Reading

Trending