Noticias
OpenAI lanza Sora; X libera a Grok
La semana pasada, OpenAI lanzó su herramienta de inteligencia artificial (IA) generativa de texto a video, “Sora”. La compañía presentó una vista previa de esta herramienta por primera vez en febrero de 2024, pero dijo que las capacidades de Sora han evolucionado desde entonces, por lo que llamaron a la última versión “Sora Turbo”. Sora está actualmente disponible para usuarios de ChatGPT Plus y Pro; sin embargo, OpenAI está restringiendo fuertemente el acceso, lo que impide que muchas personas (incluyéndome a mí) puedan probar la herramienta inmediatamente después de su lanzamiento.
Para aquellos con acceso, Sora Turbo permite a los usuarios crear hasta 50 videos por mes con una resolución de 480p para los suscriptores de GPT Plus, mientras que los suscriptores de GPT Pro pueden crear hasta 10 veces más videos con resoluciones más altas, incluido 1080p. Actualmente, los videos tienen una duración máxima de 20 segundos y los usuarios pueden combinar sus recursos con elementos generados por IA o crear contenido completamente nuevo a partir de mensajes de texto.
El lanzamiento de herramientas de conversión de texto a vídeo como Sora marca un momento crucial para la industria creativa. Es probable que las empresas aprovechen estas herramientas para producir materiales de marketing de alta calidad rápidamente y a una fracción del costo de los métodos de producción tradicionales. De manera similar, los creadores independientes pueden crear videos para proyectos personales o incluso películas independientes que rivalizan con la producción de estudios profesionales. Estas herramientas tienen el potencial de nivelar el campo en la producción de videos y permitir que cualquier persona con una visión creativa haga realidad sus ideas.
Sin embargo, la IA de texto a vídeo también introduce nuevos riesgos, incluido un posible uso indebido en la creación de deepfakes. A medida que estas herramientas se vuelvan más accesibles, los malos actores y los trolls intentarán explotar esta tecnología para engañar a otros. Ya hemos visto problemas similares que surgen con la IA de texto a imagen y de texto a audio, y el texto a video está a punto de convertirse en el próximo vector de ataque.
Google lanza Gemini 2.0 y entra en la era de agentes de IA
La semana pasada, Google (NASDAQ: GOOGL) anunció su última innovación en inteligencia artificial: Gemini 2.0, que la compañía describe como su modelo multimodal más avanzado hasta el momento. En su anuncio oficial, llegan incluso a decir que Gemini 2.0 marcará el comienzo de una nueva era de IA “agente”, que permitirá la creación de agentes autónomos diseñados para simplificar las tareas cotidianas.
Una de las primeras aplicaciones del agente de inteligencia artificial de Google impulsado por Gemini es Project Mariner, una extensión de Google Chrome actualmente en prueba beta. Mariner actúa como un asistente virtual impulsado por inteligencia artificial, capaz de ejecutar tareas de forma autónoma como agregar artículos a los carritos de compras, recopilar información de múltiples sitios web y asesorar a los usuarios sobre estrategias óptimas en los juegos. Sin embargo, para garantizar la seguridad y el uso responsable, Google dice que Mariner requerirá un ser humano en algún lugar del circuito operativo en este momento, lo que requerirá la confirmación del usuario antes de que el agente de IA tome una acción final en cosas como realizar compras.
El anuncio de Google indica que los agentes de IA se están convirtiendo en un foco importante para la industria. A diferencia de los chatbots, que sirven como motores de búsqueda mejorados, los agentes de IA introducen un caso de uso completamente nuevo. Estas herramientas pueden realizar tareas complejas de forma autónoma, pero su adopción puede requerir reeducación para los usuarios que no están familiarizados con este tipo de tecnología. Si bien los chatbots como ChatGPT se han convertido en algo natural para muchos y eran bastante intuitivos para la mayoría, los agentes de IA son algo completamente diferente. No existe un sustituto digital directo para su funcionalidad y esa brecha puede hacer que la adopción sea más lenta de lo esperado.
Considero que la accesibilidad y la facilidad de uso son uno de los mayores desafíos para el usuario promedio de IA. Siento que los flujos de trabajo de los agentes de IA serán tan desconocidos para este grupo que necesitarán algún tipo de capacitación o educación antes de poder sumergirse en estos sistemas.
X hace que Grok sea gratuito y agrega funciones de análisis de Tweets
Mientras tanto, X (anteriormente Twitter) amplió el acceso a su chatbot interno de IA, Grok, haciéndolo gratuito para todos los usuarios. Grok, que anteriormente estaba disponible solo para suscriptores de X Premium, también recibió dos actualizaciones más notables, incluida una generación mejorada de texto a imagen y una nueva función para analizar tweets.
Si bien sus capacidades de generación de imágenes son impresionantes, sus resultados de texto a texto no cumplen con los estándares de la industria. Dicho esto, la herramienta Grok Analysis es la característica más destacada. Permite a los usuarios dividir los tweets en resúmenes digeribles con contexto y enlaces a noticias relacionadas o información general.
Si bien esta herramienta me parece útil, todavía la encuentro defectuosa. Por ejemplo, cuando hice una pregunta de seguimiento sobre un tweet analizado, Grok pareció “olvidar” el contexto inicial, lo que llevó a conversaciones fragmentadas en lugar de un diálogo continuo desde el primer mensaje enviado.
A pesar de integrarse en el ecosistema de X, Grok todavía está por detrás de los principales chatbots de IA como GPT-4, Claude 3.5 y Gemini 2.0 de Google.
Sin embargo, Grok tiene una audiencia masiva incorporada con 500 millones de usuarios activos mensuales en X. Este acceso le da una ventaja sobre las plataformas de chatbot independientes, que a veces pueden tener dificultades para atraer nuevos usuarios. A pesar de esta ventaja, el éxito a largo plazo de Grok depende de su capacidad para ofrecer una funcionalidad única y superior sobre sus competidores y no sólo de su distribución integrada a los 500 millones de usuarios mensuales de X.
Para que la inteligencia artificial (IA) funcione dentro de la ley y prospere frente a los crecientes desafíos, necesita integrar un sistema blockchain empresarial que garantice la calidad y la propiedad de la entrada de datos, lo que le permitirá mantener los datos seguros y al mismo tiempo garantizar la inmutabilidad. de datos. Consulte la cobertura de CoinGeek sobre esta tecnología emergente para obtener más información Por qué la cadena de bloques empresarial será la columna vertebral de la IA.
Ver: IA y blockchain: por qué los inversores deberían buscar esta combinación en las startups