Connect with us

Noticias

Anunciando las respuestas API y agente de uso de la computadora en Azure Ai Foundry

Published

on

Estamos entusiasmados de presentar dos poderosas innovaciones en Azure Ai Foundry.

Los agentes de IA están transformando las industrias automatizando los flujos de trabajo, mejorando la productividad y permitiendo la toma de decisiones inteligentes. Las empresas están aprovechando a los agentes de IA para procesar reclamos de seguro, administrar escritorios de servicios de TI, optimizar la logística de la cadena de suministro e incluso ayudar a los profesionales de la salud a analizar los registros médicos. El potencial es vasto, y estamos entusiasmados de introducir dos innovaciones poderosas en Azure Ai Foundry:

  • Respuestas API: Una potente API que permite aplicaciones con IA para recuperar información, procesar datos y tomar medidas sin problemas.
  • Agente de uso de la computadora (CUA): Un modelo AI innovador que navega por las interfaces de software, ejecuta tareas y automatiza los flujos de trabajo.

Juntas, estas capacidades capacitan a las empresas para reinventar la IA no solo como asistente, sino como una fuerza laboral digital activa. Los clientes empresariales pronto obtendrán acceso a estas innovaciones que impulsan la automatización, la eficiencia y la inteligencia a escala.

Mejora de los agentes de IA con la API de respuestas

La API de las respuestas es la clave para desbloquear la IA agente en la fundición de Azure Ai, transformando cómo las empresas aprovechan la IA para el impacto del mundo real. Es la nueva base para aprovechar las potentes herramientas incorporadas del Servicio OpenAi, que combina la simplicidad de la API de finalización de chat con las capacidades avanzadas disponibles a través de la API de asistentes y el servicio de agentes de AI Azure. La API de respuestas permite una interacción perfecta con herramientas como CUA, intérprete de código, llamadas de funciones y búsqueda de archivos, todo en una sola llamada API. Esta API permite a los sistemas de IA recuperar datos, información del proceso y tomar medidas, conectando a la corriente AI de agente con flujos de trabajo empresariales.

Cómo funcionan las respuestas API

La API de respuestas proporciona un formato de respuesta estructurado que permite a la IA interactuar con múltiples herramientas mientras mantiene el contexto a través de las interacciones. Es compatible:

  • Llamadas de herramientas en una simple llamada de API: Ahora, los desarrolladores pueden integrar sin problemas las herramientas de IA, haciendo que la ejecución sea más eficiente.
  • Uso de la computadora: Use la herramienta de uso de la computadora dentro de la API de respuestas para impulsar la automatización y ejecutar interacciones de software.
  • Búsqueda de archivos: Interactuar con los datos empresariales dinámicamente y extraer información relevante.
  • Intérprete de código: Cree y ejecute el código Python sin esfuerzo dentro de las aplicaciones con AI.
  • Funciones llamadas: Desarrollar e invocar funciones personalizadas para mejorar las capacidades de IA.
  • Encadenamiento de respuestas en conversaciones: Realice un seguimiento de las interacciones vinculando las respuestas juntas utilizando ID de respuesta únicos, asegurando la continuidad en los diálogos impulsados ​​por la IA.
  • Privacidad de datos de grado empresarial: Construido con los estándares de seguridad y cumplimiento confiables de Azure, asegurando la protección de datos para las organizaciones.

Al consolidar la recuperación, el razonamiento y la ejecución de la acción en una sola API, la API de respuestas simplifica el desarrollo del agente de IA, reduciendo la complejidad de orquestar múltiples herramientas de IA dentro de una tubería de automatización.

Esta escalabilidad lo hace bien adecuado para los casos de uso empresarial en todas las industrias, como el servicio al cliente, las operaciones de TI, las finanzas y la gestión de la cadena de suministro, donde la automatización con IA puede optimizar los flujos de trabajo y mejorar la eficiencia. Para una flexibilidad y control aún mayor, las organizaciones pueden explorar el servicio de agentes de AI Azure, que ofrece herramientas y modelos adicionales para desarrollar y escalar agentes de IA. El servicio de agente Azure AI se integra con el núcleo semántico y el autógeno, lo que permite una orquestación múltiple sin problemas para escenarios más complejos que requieren múltiples agentes que colaboren en las tareas.

Empoderar a los agentes de IA con el agente que usa la computadora

El agente de uso de la computadora (CUA) es un modelo de IA especializado en el servicio Azure OpenAI que permite a la IA interactuar con interfaces gráficas de usuario (GUI), navegar aplicaciones y automatizar tareas de varios pasos, todo a través de instrucciones de lenguaje natural. A diferencia de las herramientas de automatización tradicionales que se basan en scripts predefinidos o integraciones basadas en API, CUA puede interpretar elementos visuales, adaptarse dinámicamente y tomar medidas basadas en el contenido en pantalla.

¿Qué hace que el agente de uso de la computadora sea único?

  • Navegación de interfaz de usuario autónoma: Puede abrir aplicaciones, hacer clic en botones, completar formularios y navegar en flujos de trabajo de varias páginas.
  • Adaptación dinámica: Interpreta los cambios en la interfaz de usuario y ajusta las acciones en consecuencia, reduciendo la dependencia de los scripts rígidos de automatización.
  • Ejecución de tareas de aplicación cruzada: Opera en aplicaciones basadas en la web y de escritorio, integrando sistemas dispares sin dependencias de API.
  • Interfaz de comando del lenguaje natural: Los usuarios pueden describir una tarea en lenguaje sencillo, y el CUA determina las interacciones de interfaz de usuario correctas para ejecutar.

Con el anuncio de hoy, los desarrolladores pueden comenzar a construir capacidades de agente adicionales de inmediato con CUA. A medida que las empresas buscan implementar esta tecnología a escala, estamos evaluando la integración con Windows 365 y el escritorio virtual de Azure para permitir que la automatización de CUA se ejecute perfectamente en un entorno de host administrado en PC en la nube o máquinas virtuales (VM), asegurando un rendimiento constante mientras mantiene el cumplimiento empresarial y los estándares de seguridad.

Garantizar la automatización de IA segura y confiable

A medida que los sistemas de IA se vuelven más autónomos, garantizar la seguridad, la confiabilidad y la alineación con la intención humana es fundamental. El modelo CUA es uno de los primeros modelos de IA de agentes capaces de interactuar directamente con entornos de software, trayendo nuevos desafíos en la prevención de uso indebido, acciones no deseadas y riesgos adversos. Para abordarlos, Microsoft y OpenAI han implementado un enfoque de seguridad de varias capas que abarca el modelo, el sistema y los niveles de implementación.

El modelo CUA se desarrolla con salvaguardas para rechazar tareas dañinas, rechazar acciones no autorizadas y evitar el mal uso. A nivel del sistema, Microsoft implementa el filtrado de contenido de grado empresarial y el monitoreo de la ejecución para ayudar a detectar y prevenir violaciones de políticas. Para minimizar las acciones no deseadas, CUA está diseñado para solicitar confirmaciones del usuario antes de ejecutar tareas irreversibles y restringir acciones de alto riesgo, como transacciones financieras.

El confiable marco de IA de Microsoft garantiza aún más la observabilidad en tiempo real, la registro y la auditoría de cumplimiento para las implementaciones empresariales. Los sistemas de detección automatizados y humanos en el bucle controlan patrones de ejecución, identificando comportamientos anómalos y aplicando políticas de gobernanza. Estas salvaguardas se refinan continuamente en función de la marcha roja interna, las auditorías externas y las pruebas del mundo real para fortalecer la protección contra inyecciones inmediatas, manipulaciones adversas y acceso no autorizado. Dado el nivel de confiabilidad actual del modelo CUA, particularmente en entornos no artificiales, la supervisión humana sigue siendo muy recomendable para operaciones sensibles.

A medida que evolucionan los agentes de IA, Microsoft está comprometido con la transparencia, la seguridad y la mitigación continua de riesgos. Al combinar las salvaguardas incorporadas de CUA con las herramientas empresariales de cumplimiento y gobierno de Azure, las organizaciones pueden implementar la automatización con confianza con confianza, asegurando la adopción de IA segura y responsable a escala.

Comenzando con CUA y respuestas API

Azure Ai Foundry continúa empujando los límites de la automatización con AI. Los clientes empresariales obtendrán acceso a las respuestas API y CUA en el servicio Azure OpenAI en las próximas semanas.

Estamos emocionados de ver cómo los desarrolladores y las empresas innovan con estas nuevas capacidades.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

La guerra de redes sociales de IA ha comenzado

Published

on

Suscríbase a Freethink en Susmack de forma gratuita

Obtenga nuestras nuevas historias favoritas directamente a su bandeja de entrada todas las semanas

La carne de res de Sam Altman versus Elon Musk ahora es todo menos cortés. En febrero, Musk lanzó una granada de adquisición de $ 97.4 mil millones en Operai, a la que Altman respondió en X con un “No gracias, pero compraremos Twitter por $ 9.74 mil millones si lo desea”.

X no fue comprado, pero Altman está construyendo su competidor.

Operai ha estado dibujando su propio patio de recreo de estilo X durante meses, lo suficiente como para que los expertos ahora hablen sobre el lanzamiento de la nueva red social en términos de cuandono si.

En febrero, después de que Meta anunció planes para construir una aplicación independiente para que su asistente de IA rivalice con la aplicación Chatgpt, Altman volvió a disparar en X: “Está bien, tal vez hagamos una aplicación social”.

Luego se filtró el 15 de abril de que un prototipo interno de Operai que combina un feed social con las capacidades de generación de imágenes de Chatgpt estaba en revisión. Más fuentes fueron tan lejos como para confirmar que, más allá de este prototipo, Operai ahora estaba “considerando” un rival completo de X.

Esta red social empuja las tierras en un momento crucial cuando los modelos de IA se están volviendo comerciales, el monopolio de las redes sociales de Meta muestra signos de vulnerabilidad, y la integración de hardware está surgiendo como un diferenciador clave.

Al combinar tres elementos, una plataforma social construida de forma nativa para la IA, el diseñador tecnológico de clase mundial Jony Ive y los dispositivos complementarios especialmente diseñados, OpenAi se está posicionando en la intersección de las tres tendencias poderosas.

Si la compañía logra este juego de redes sociales con éxito, atrapará a otros gigantes tecnológicos de pie plano, tanto que estoy convencido de que estamos presenciando las primeras salvas de una revolución de las redes sociales en toda regla.

AI-First Social Media

En lugar de simplemente conectar a los usuarios para compartir contenido, el prototipo de red social de OpenAI aparece diseñado para aprovechar la IA para mejorar el proceso de creación de contenido en sí. En lugar de “compartir y luego desplazarse”, la IA salta en el minuto uno para ayudar hacer el post.

Esto es similar a la integración de Grok de X: si lo ha usado, notará rápidamente que a la gente le encanta que la IA diga algo estúpido para que puedan compartir la salida y ver que su publicación se vuelve viral.

El equivalente aquí para OpenAI es aprovechar sus capacidades de generación de imágenes favoritas de los fanáticos en un entorno social. En la primera semana de la disponibilidad de la herramienta, más de 130 millones de usuarios de ChatGPT crearon más de 700 millones de imágenes. Esta adopción masiva indica un interés significativo de los usuarios en compartir contenido visual generado por IA, de la misma manera que las personas ya comparten contenido escrito generado por IA en X.

Sin embargo, lejos de ser otro clon X, la red social de OpenAi se perfila como algo completamente nuevo. Esto es lo que he reconstruido hasta ahora:

  • La creación de contenido asistida por AI-AI-AI-Capacidades de generación de imágenes de Chatgpt
  • Un feed social para compartir e interactuar con contenido generado por IA
  • Integración con las capacidades de IA existentes de OpenAI y potencialmente su base de usuarios
  • Guardacas de seguridad similares a las utilizadas en la generación de imágenes de Chatgpt

También es probable que haya un componente de hardware para la red.

El 21 de mayo, Openai anunció su adquisición de IO, una compañía de hardware fundada por el ex jefe de diseño de Apple, Jony Ive. El acuerdo, valorado en casi $ 6.5 mil millones en una transacción de todo el stock, lleva aproximadamente 55 ingenieros de hardware, desarrolladores de software y expertos en fabricación al redil OpenAI.

Los primeros dispositivos después de la adquisición se lanzarán en 2026, pero no serán reemplazos de teléfonos inteligentes. Se mencionaron algunos detalles sobre la tecnología, incluido que será de bolsillo, contextualmente consciente, sin pantalla y no un par de gafas inteligentes, en una llamada interna de OpenAI.

La conexión entre esta iniciativa de hardware y las ambiciones de redes sociales de OpenAI es estratégicamente significativa. Estoy convencido de que al desarrollar una plataforma social y dispositivos complementarios, OpenAi se está posicionando para crear un ecosistema totalmente integrado donde las experiencias sociales con IA se optimizan para el hardware especialmente diseñado.

Es el clásico libro de jugadas de Apple, solo esta vez el principio de organización es pura IA.

Además, si bien IVE no se unirá a OpenAi directamente, su firma de diseño, LoveFrom, continuará siendo independiente, la asociación verá Love de “Take Onge para todos los OpenAi, incluido su software”. La experiencia estética y de usuario de la red social de OpenAI, sin duda, se beneficiará de la reconocida sensibilidad de diseño de Ive.

“La IA es una tecnología increíble, pero las grandes herramientas requieren trabajo en la intersección de la tecnología, el diseño y la comprensión de las personas y el mundo”, dijo Altman en un comunicado anunciando la adquisición de IO.

El contramardo de IO de Google

Google es, sin duda, uno de los mayores competidores de Openai en el espacio de IA, y en I/O 2025 (casualmente celebrado el mismo día que OpenAI anunció la adquisición de IO), el gigante de la búsqueda presentó actualizaciones de IA significativas e impresionantes.

Dos grandes fueron la integración de Gemini en Chrome para los usuarios de escritorio y el anuncio del “modo de agente”, una característica experimental donde los usuarios simplemente pueden describir su objetivo final y Gemini puede trabajar de manera autónoma para lograrlo. Esta capacidad refleja el tipo de experiencia asistida por AI-AI que las fuentes dicen que OpenAi se está incorporando a su red social.

Según la publicación oficial de blog de E/S 2025 de Google, Gemini 2.5 Pro es ahora el modelo líder mundial en las tablas de clasificación Webdev Arena y Lmarena, y en base a mi experiencia personal utilizando los modelos de Google con puntos de referencia de rendimiento específicamente en la mente, están liderando en muchos aspectos. La publicación también señala que la aplicación Gemini ahora tiene más de 400 millones de usuarios activos mensuales, una base de usuarios lo suficientemente masiva como para ponerla en competencia directa con ChatGPT.

Sin embargo, si bien estos avances posicionan a Google como una amenaza para el creciente ecosistema de inteligencia artificial de Openii, también sugieren que la estrategia de la compañía es continuar mejorando sus productos existentes con IA en lugar de tratar de competir directamente en el espacio de redes sociales.

Un imperio debilitante

En cuanto al rey de ese espacio, meta, está avanzando con los esfuerzos para defender su territorio contra los avances de OpenAi.

Durante una llamada de ganancias del primer trimestre de 2025 el 30 de abril, el CEO Mark Zuckerberg describió una estrategia integral de IA. “Estamos haciendo un buen progreso en las gafas de IA y la meta ai, que ahora tiene casi mil millones de activos mensuales”, dijo Zuck a los inversores, según la transcripción de la llamada. Este hito pone al asistente de IA de Meta a la par de Géminis de Google en términos de adopción del usuario, y potencialmente antes de ChatGPT.

La familia de modelos de Meta’s Llama 4 ha visto una notable adopción, y Meta dijo en marzo de 2025 que Llama había alcanzado las 1 mil millones de descargas. El día antes de la llamada de ganancias, la compañía lanzó una aplicación Meta AI dedicada construida con Llama 4, llamándola “un primer paso para construir una IA más personal”. Esta aplicación independiente representa un desafío directo a ChatGPT y, por extensión, los planes de redes sociales de OpenAI.

Operai puede posicionarse como una alternativa fresca y nativa de AI a las experiencias sociales existentes de Meta.

Sin embargo, aunque sigue siendo dominante en el espacio de redes sociales, Meta muestra signos de vulnerabilidad.

La compañía parece firme en su creencia de que las experiencias sociales en última instancia abarcarán tanto los asistentes de IA como los mundos virtuales inmersivos, como lo demuestran su continua inversión en los mundos de horizonte. Esta visión de la realidad virtual social pronto puede competir directamente con las iniciativas de hardware y redes de hardware de Openai, pero la inversión aún no ha producido rendimientos significativos: en el primer trimestre de 2025, la División de Laboratorios VR de Meta informó otras pérdidas de $ 4.2 mil millones.

El pivote de Meta a la IA también sugiere una postura defensiva contra las amenazas emergentes, como OpenAi y Anthrope. Esto crea una apertura estratégica para la nueva red social de Openai: puede posicionarse como una alternativa nueva y nativa de AI a las plataformas heredadas de Meta y las experiencias sociales existentes, que se están modificando con capacidades de IA.

Antrópico como el retador

Hablando de antrópico, el día después de la salpicadura de Altman, el paisaje de IA se volvió aún más competitivo con la inauguración de la startup de Claude 4 y la introducción de dos nuevos modelos: Claude Opus 4 y Claude Sonnet 4.

“Claude Opus 4 es el mejor modelo de codificación del mundo, con un rendimiento sostenido en tareas complejas y de larga duración y flujos de trabajo de agentes”, compartió Anthrope en su anuncio de lanzamiento. La compañía respaldó este reclamo con impresionantes puntos de referencia: 72.5% de precisión en el punto de referencia de ingeniería de software y 43.2% en el banco terminal. He revisado los puntos de referencia y ya he usado Claude 4 en mi IDE para tareas de codificación compleja y estoy convencido de que estamos en un punto de inflexión para los modelos de codificación de IA.

Lo que hace que Claude 4 sea particularmente relevante para las ambiciones de las redes sociales de OpenAi es su capacidad mejorada de trabajar continuamente durante varias horas, una capacidad que podría permitir agentes de IA más sofisticados dentro de las plataformas sociales. Según Anthrope, Claude Opus 4 puede mantener el enfoque en las tareas que requieren “miles de pasos”, superando drásticamente los modelos anteriores.

Este lanzamiento de Claude 4 subraya una realidad estratégica crítica para OpenAI: los modelos de IA en sí mismos se están volviendo rápidamente comerciantes.

Con múltiples compañías que ahora ofrecen potentes capacidades de IA de última generación, la tecnología subyacente por sí sola ya no es un diferenciador suficiente. Esta mercantilización hace que el juego de red social de OpenAI sea cada vez más importante como una forma de crear una posición de mercado única y defendible. Controlando ambos modelos de IA y La plataforma social donde los usuarios interactúan con ellos, OpenAi puede crear un valor que va más allá de lo que es posible solo con los modelos.

Las apuestas sociales

Y luego están los datos. Siempre los datos.

Las interacciones de los usuarios en tiempo real son invaluables para capacitar a los futuros modelos de IA: son como el oro digital en un mundo ahora invadido por AI SLOP. Una red social proporciona a su propietario un suministro constante de estos datos, que solo se volverán más valiosos a medida que las capacidades del modelo base converjan entre los competidores.

X y Meta ya están obteniendo estos datos de capacitación únicos en tiempo real de sus redes. Operai lo necesita, y la adquisición de IO de Ive podría agregar un diseño de clase mundial y hardware dedicado a sus ofertas de redes sociales, ayudando a atraer a los usuarios.

A medida que los principales jugadores de inteligencia artificial, OpenAi, Google, Meta y Anthrope, continúan evolucionando sus estrategias y capacidades, las líneas entre asistentes de IA, redes sociales y dispositivos de hardware son cada vez más borrosos. Creo que estamos presenciando no solo mejoras incrementales en la tecnología de IA, sino también la aparición de una categoría completamente nueva de productos y experiencias que podrían remodelar fundamentalmente la forma en que interactuamos con las redes sociales.

Nos guste o no, los ojos de IA ahora están en nuestros feeds.

¡Nos encantaría saber de ti! Si tiene un comentario sobre este artículo o si tiene un consejo para una futura historia de Freethink, envíenos un correo electrónico a tips@freethink.com.

Suscríbase a Freethink en Susmack de forma gratuita

Obtenga nuestras nuevas historias favoritas directamente a su bandeja de entrada todas las semanas

Continue Reading

Noticias

Acabo de probar las versiones más recientes de Claude, Gemini, Deepseek y Chatgpt, y el ganador me sorprendió por completo

Published

on

Los chatbots de IA están evolucionando rápidamente con actualizaciones que ocurren constantemente de los nombres más familiares en Big Tech. Una vez más, Deepseek de China se encuentra entre los últimos en unirse a la carrera de primer nivel con un contexto de 128k, lo que significa que puede manejar conversaciones más largas y documentos más complejos.

Con la reciente actualización de su modelo R1, Deepseek se está posicionando como un competidor serio para Chatgpt, Claude y Gemini.

Continue Reading

Noticias

Sora de OpenAI ahora está disponible de forma gratuita para todos los usuarios a través de Microsoft Bing Video Creator en Mobile

Published

on

Únase a nuestros boletines diarios y semanales para obtener las últimas actualizaciones y contenido exclusivo sobre la cobertura de IA líder de la industria. Obtenga más información


El Sora de Openai fue uno de los lanzamientos más exagerados de la era de la IA, que se lanzará en diciembre de 2024, casi 10 meses después de que se previse por primera vez a reacciones asombrosas debido a que, al menos, al menos, un nivel de realismo sin precedentes, dinamismo de la cámara y adherencia rápida y clips de generación larga de 60 segundos.

Sin embargo, gran parte del brillo se ha desgastado como muchos otros generadores de videos de IA, desde startups de EE. UU. Hasta la pista de Luma y los competidores chinos Kling, Hailuo Minimax e Israel’s LTX Studio están ofreciendo modelos generativos de video de IA y aplicaciones para consumidores y usuarios empresariales que rivalizan o ya han superado la oferta de Openi. Además, todavía no hemos obtenido generaciones de 60 segundos de un solo mensaje SORA (que yo sepa, el máximo parece ser de 20 segundos).

Pero ahora Openai y su aliado/inversor/frenemy Microsoft están buscando llevar a Sora a muchos más usuarios, de forma gratuita (al menos durante algunas generaciones). Hoy, Microsoft anunció que Sora ahora se ofrece a través de su función Bing Video Creator en la aplicación móvil gratuita de Bing para iOS (Apple iPhone y App Store) y Android (Google Play Store).

Ese es un valor increíble, dado que para obtenerlo a través de ChatGPT y OpenAI, deberá pagar una suscripción CHATGPT Plus ($ 20 mensual) o Pro ($ 200 mensual).

Bing Video Creator con Sora es el último de una serie de ofertas impulsadas por la IA de Microsoft, después del lanzamiento de Bing Image Creator y Copilot.

https://www.youtube.com/watch?v=poxwxmja224

Como Microsoft Corporate Vicepresident (CVP) y Jefe de Search Jordi Ribas escribieron en X: “Hace dos años, Bing fue el primer producto en enviar creación de imágenes de forma gratuita para nuestros usuarios. Hoy, estoy emocionado de compartir que Bing Video Creator ahora está disponible en la aplicación Mobile de Bing, en todas partes que Bing Image Creator está disponible. Ven a la vida “.

Para presentar Bing Video Creator, Microsoft ha lanzado un anuncio de video promocional (incrustado arriba) que muestra cómo la herramienta da vida a ideas creativas.

El anuncio demuestra que los usuarios escriben indicaciones como “Crear un colibrí que aletea sus alas en cámara ultra lenta”, “una tortuga que se desplaza lentamente a través de un cañón de coral de neón” y “un pequeño astronauta que explora un planeta de hongos gigantes”. La IA luego genera videoclips cortos y vibrantes basados ​​en estas indicaciones.

El video enfatiza lo fácil que es crear y compartir estos videos, incluido un ejemplo del video de astronauta que se comparte en un chat y recibe reacciones positivas.

Creaciones de video verticales de 5 segundos gratis en dispositivos móviles, con videos horizontales próximamente

Bing Video Creator convierte las indicaciones de texto en videos generados por IA de cinco segundos. Todavía no es compatible con las generaciones de texto a video o video a video (que muchos otros generadores de videos de IA rivales, incluida la implementación de SORA de OpenAI).

Para usar la herramienta, los usuarios pueden abrir la aplicación móvil Bing, toque el menú en la esquina inferior derecha y seleccione “Video Creator”.

Alternativamente, puede iniciar el proceso de creación de video escribiendo una solicitud directamente en la barra de búsqueda de Bing en la aplicación, lo que es lo que es “crear un video de …”

Una vez que se ingresa el mensaje, Bing Video Creator genera un video corto basado en la descripción.

Por ejemplo, un aviso como “En un concurrido restaurante de pizza italiano, una pequeña nutria funciona como chef y usa un sombrero de chef y un delantal. Amasa la masa con sus patas y está rodeado de otros ingredientes de pizza”, resultaría en un video de cinco segundos de cinco segundos atractivo.

Actualmente, los videos están disponibles en 9:16 Formato de retrato, es decir, vertical, perfecto para los pantalones cortos de Tiktok y YouTube, aunque Microsoft lo dice en su publicación de blog de anuncios que una opción de relación de aspecto de 16: 9 también conocida como paisaje u horizontal está “llegando pronto”.

Los usuarios pueden hacer cola hasta tres generaciones de video a la vez, y cada creación se almacena por hasta 90 días. Una vez que un video está listo, se puede descargar, compartir por correo electrónico o redes sociales, o acceder a través de un enlace directo.

Bing Video Creator estará disponible en todo el mundo hoy, excepto China y Rusia. Ahora está disponible en la aplicación móvil de Bing, y también se dice que la búsqueda de escritorio y copilotos se lanzarán “pronto”.

Gratis para usar para 10 generaciones rápidas, generaciones lentas ilimitadas

Bing Video Creator es gratuito para todos los usuarios.

A cada usuario se le permiten diez generaciones de video “rápidas”, que pueden crear videos en segundos.

Después de usarlos, los usuarios pueden continuar con las generaciones de velocidad estándar, lo que lleva minutos, sin costo, o canjea 100 puntos de recompensas de Microsoft por cada creación rápida adicional.

Esos puntos de recompensa provienen del programa gratuito de opción de Microsoft que permite a los usuarios ganar puntos para las actividades cotidianas, como buscar con Bing, comprar en la tienda de Microsoft o jugar con Xbox Game Pass.

Para participar, los usuarios deben iniciar sesión con una cuenta de Microsoft y activar su tablero de recompensas aquí.

Más allá de los divertidos videos y publicaciones en redes sociales, Bing Video Creator se posiciona como una herramienta para mejorar la comunicación cotidiana y la creatividad. El anuncio de Bing alienta a los usuarios a crear videos para celebrar momentos especiales, probar ideas creativas y comunicarse de manera más efectiva.

Para ayudar a los usuarios a obtener los mejores resultados, Bing sugiere proporcionar indicaciones descriptivas, incorporar un lenguaje orientado a la acción y experimentar con tono y estilo, como la estética cinematográfica o juguetona.

AI y seguridad responsables, incorporado

Microsoft dice que Bing Video Creator está diseñado de acuerdo con sus principios de IA responsables, aprovechando los estándares C2PA para las credenciales de contenido para ayudar a identificar contenido generado por AI.

La herramienta también incluye características de moderación que bloquean automáticamente las indicaciones que podrían generar videos dañinos o inseguros.

Implicaciones para empresas y tomadores de decisiones técnicas

Aunque Bing Video Creator se enmarca actualmente como una herramienta centrada en el consumidor, su tecnología y capacidades subyacentes podrían tener implicaciones interesantes para los usuarios empresariales, particularmente aquellos involucrados en la orquestación de IA, la ingeniería de datos y el despliegue del modelo de IA.

Para los ingenieros de IA responsables de implementar y ajustar modelos de idiomas grandes, Bing Video Creator destaca la creciente madurez del video de IA generativo más allá de los modelos basados ​​en texto. Si bien no es un producto empresarial en sí, la tecnología detrás de este podría inspirar nuevas formas de incorporar la generación de videos en los flujos de trabajo comerciales, como crear resúmenes de video automatizados, contenido de capacitación o materiales de marketing.

Para los profesionales que orquestan tuberías de IA escalables, Bing Video Creator muestra una aplicación práctica de video generativo que podría influir en cómo las empresas piensan sobre la implementación de estos modelos a escala. La facilidad de uso y la capacidad de respuesta rápida de la herramienta sugieren posibles aplicaciones futuras dentro de los flujos de trabajo empresariales, ya sea para capacitación interna, ideación creativa o participación del cliente.

Los ingenieros de datos pueden ver la simplicidad y la compartimiento del creador de video de Bing como una demostración de cómo la IA puede hacer que las ideas complejas basadas en datos sean más accesibles. Si bien estos videos de grado de consumo son breves y enfocados visualmente, se podría adaptar tecnología similar en el futuro para convertir conjuntos de datos complejos o resultados del proyecto en narraciones de video cortas y atractivas que resuenan con audiencias no técnicas.

Bing Video Creator es parte del impulso continuo de Bing para democratizar la creatividad de la IA. Si bien aún no se sabe sobre las características más allá del soporte de video de paisajes, Bing dice que continuará refinando y expandiendo la experiencia a medida que más usuarios comiencen a explorar la generación de videos.

Para aquellos listos para probarlo, Bing invita a los usuarios a descargar la aplicación móvil Bing y comenzar a crear videos hoy.

Para obtener más información sobre Bing Video Creator y cómo comenzar a obtener puntos de recompensas de Microsoft para una creación de video aún más rápida, visite aquí.

Continue Reading

Trending