Connect with us

Noticias

O3 de OpenAI aún no es AGI, pero simplemente hizo algo que ninguna otra IA ha hecho

Published

on

Sam Altman y los diputados de OpenAI analizan el rendimiento del nuevo modelo o3 en la prueba ARC-AGI.

OpenAI/ZDNET

El último modelo de lenguaje grande de OpenAI aún no está disponible, pero ya tenemos algunas formas de saber qué puede y qué no puede hacer.

El lanzamiento “o3” de OpenAI se dio a conocer el 20 de diciembre en forma de un video infomercial, lo que significa que la mayoría de las personas ajenas a la empresa no tienen idea de lo que realmente es capaz de hacer. (Se está dando acceso anticipado a los grupos externos de pruebas de seguridad).

Además: 15 formas en que la IA me ahorró tiempo en el trabajo en 2024

Aunque el video presentó mucha discusión sobre varios logros de referencia, el mensaje del cofundador y director ejecutivo de OpenAI, Sam Altman, en el video fue muy breve. Su afirmación más importante, y además vaga, fue que o3 “es un modelo increíblemente inteligente”.

ARC-AGI puso a prueba o3

OpenAI planea lanzar la versión “mini” de o3 a finales de enero y la versión completa algún tiempo después, dijo Altman.

Un outsider, sin embargo, ha tenido la oportunidad de poner a prueba a o3, en cierto sentido.

La prueba, en este caso, se llama “Corpus de Abstracción y Razonamiento para la Inteligencia General Artificial” o ARC-AGI. Es una colección de “desafíos para los sistemas inteligentes”, un nuevo punto de referencia. El ARC-AGI se anuncia como “el único punto de referencia diseñado específicamente para medir la adaptabilidad a la novedad”. Eso significa que está destinado a evaluar la adquisición de nuevas habilidades, no sólo el uso de conocimientos memorizados.

Además: ¿Por qué la ética se está convirtiendo en el mayor desafío de la IA?

Algunos consideran la AGI, inteligencia artificial general, como el Santo Grial: el logro de un nivel de inteligencia artificial que podría igualar o superar la inteligencia humana. La idea de ARC-AGI es guiar la IA hacia “sistemas artificiales más inteligentes y más parecidos a los humanos”.

El modelo o3 obtuvo una precisión del 76% en ARC-AGI en una evaluación coordinada formalmente por OpenAI y el autor de ARC-AGI, François Chollet, científico de la unidad de inteligencia artificial de Google.

Un cambio en las capacidades de la IA

En el sitio web de ARC-AGI, Chollet escribió la semana pasada que la puntuación del 76% es la primera vez que la IA supera la puntuación de un humano en el examen, como lo ejemplifican las respuestas de los trabajadores humanos de Mechanical Turk que tomaron la prueba y quienes, en promedio, obtuvo una puntuación ligeramente superior al 75% de aciertos.

francois-chollet.jpg

François Chollet

Chollet escribió que la puntuación alta es “un aumento sorprendente e importante de la función escalonada en las capacidades de la IA, que muestra una capacidad novedosa de adaptación a tareas nunca antes vista en los modelos de la familia GPT”. Y añadió: “Toda la intuición sobre las capacidades de la IA deberá actualizarse para o3”.

El logro marca “un verdadero avance” y “un cambio cualitativo en las capacidades de la IA”, declaró Chollet. Chollet predice que la capacidad de o3 para “adaptarse a tareas que nunca antes había enfrentado” significa que “debe planificar que estas capacidades sean competitivas con el trabajo humano en un plazo bastante corto”.

Los comentarios de Chollet son dignos de mención porque nunca ha sido un defensor de la IA. En 2019, cuando creó ARC-AGI, me dijo en una entrevista que tuvimos para ZDNET que el flujo constante de “artículos de prensa grandilocuentes” de empresas de IA “sugieren engañosamente que la IA a nivel humano quizás esté a unos años de distancia”, mientras que consideraba tal hipérbole “una ilusión”.

Las preguntas ARC-AGI son fáciles de entender para las personas y bastante fáciles de resolver. Cada desafío muestra de tres a cinco ejemplos de la pregunta y la respuesta correcta, y luego al examinado se le presenta una pregunta similar y se le pide que proporcione la respuesta que falta.

muestra-2 de competencia-arc-agi

La forma básica de ARC-AGI es tener de tres a cinco ejemplos de entrada y salida, que representan la pregunta y su respuesta, y luego un ejemplo final de entrada para el cual se debe proporcionar la respuesta proporcionando la imagen de salida correcta. Es bastante fácil para un humano descubrir qué imagen producir tocando píxeles de colores, incluso si no puede articular la regla per se.

Premio ARCP

Las preguntas no están basadas en texto sino en imágenes. Primero se muestra una cuadrícula de píxeles con formas coloreadas, seguida de una segunda versión que ha sido modificada de alguna manera. La pregunta es: ¿Cuál es la regla que cambia la imagen inicial en la segunda imagen?

En otras palabras, el desafío no depende directamente del lenguaje natural, el área célebre de los grandes modelos de lenguaje. En cambio, prueba la formulación de patrones abstractos en el dominio visual.

Pruebe ARC-AGI usted mismo

Puede probar ARC-AGI usted mismo en el sitio web del desafío de Chollet. Respondes al desafío “dibujando” en una cuadrícula vacía, completando cada píxel con el color correcto para crear la cuadrícula correcta de píxeles de colores como “respuesta”.

Es divertido, como jugar al Sudoku o al Tetris. Lo más probable es que, incluso si no puedes articular verbalmente cuál es la regla, descubrirás rápidamente qué cuadros deben colorearse para producir la solución. La parte que lleva más tiempo es tocar cada píxel de la cuadrícula para asignar su color.

Además: Por qué el avance cuántico de Google es “realmente notable” y qué sucederá después

Una respuesta correcta produce una animación de lanzamiento de confeti en la página web y el mensaje: “Has resuelto el rompecabezas diario del premio ARC. Aún eres más (generalmente) inteligente que la IA”.

Tenga en cuenta que cuando o3 o cualquier otro modelo realiza la prueba, no actúa directamente sobre los píxeles. En cambio, el equivalente se introduce en la máquina como una matriz de filas y columnas de números que deben transformarse en una matriz diferente como respuesta. Por lo tanto, los modelos de IA no “ven” la prueba de la misma manera que lo hace un humano.

Lo que aún no está claro

A pesar de los logros de o3, es difícil hacer declaraciones definitivas sobre las capacidades de o3. Debido a que el modelo de OpenAI es de código cerrado, todavía no está claro exactamente cómo el modelo resuelve el desafío.

Al no ser parte de OpenAI, Chollet tiene que especular sobre cómo o3 está haciendo lo que está haciendo.

Conjetura que el logro es el resultado de que OpenAI cambió la “arquitectura” de o3 con respecto a la de sus predecesores. Una arquitectura en IA se refiere a la disposición y relación de los elementos funcionales que dan estructura al código.

Además: si ChatGPT produce código generado por IA para tu aplicación, ¿a quién pertenece realmente?

Chollet especula en el blog que “en el momento de la prueba, el modelo busca en el espacio de posibles Cadenas de Pensamiento (CoT) que describen los pasos necesarios para resolver la tarea, de una manera tal vez no muy diferente a la búsqueda en árbol de Monte Carlo al estilo AlphaZero”.

El término cadena de pensamiento se refiere a un enfoque cada vez más popular en la IA generativa en el que el modelo de IA puede detallar la secuencia de cálculos que realiza en busca de la respuesta final. AlphaZero es el famoso programa de inteligencia artificial de la unidad DeepMind de Google que venció a los humanos en el ajedrez en 2016. Una búsqueda de árboles de Monte Carlo es un enfoque informático que existe desde hace décadas.

En un intercambio de correo electrónico, Chollet me contó un poco más sobre su pensamiento. Le pregunté cómo llegó a esa idea de una búsqueda de cadenas de pensamiento. “Claramente, cuando el modelo está ‘pensando’ durante horas y generando millones de tokens en el proceso de resolver un único rompecabezas, debe estar haciendo algún tipo de búsqueda”, respondió Chollet.

Chollet añadió:

Es completamente obvio por las características de latencia/coste del modelo que está haciendo algo completamente diferente a la serie GPT. No es la misma arquitectura, ni nada remotamente parecido. El factor definitorio del nuevo sistema es una gran cantidad de búsquedas en el momento de la prueba. Anteriormente, 4 años de ampliación de la misma arquitectura (la serie GPT) no habían producido ningún progreso en ARC, y ahora este sistema, que claramente tiene una nueva arquitectura, está creando un cambio funcional gradual en las capacidades, por lo que la arquitectura lo es todo.

Hay una serie de advertencias aquí. OpenAI no reveló cuánto dinero se gastó en una de sus versiones de o3 para resolver ARC-AGI. Esa es una omisión significativa porque un criterio de ARC-AGI es el costo en dólares reales de usar chips GPU como proxy de la “eficiencia” del modelo de IA.

Chollet me dijo en un correo electrónico que el enfoque de o3 no equivale a un enfoque de “fuerza bruta”, pero bromeó: “Por supuesto, también se podría definir la fuerza bruta como ‘lanzar una cantidad excesiva de cómputo a un problema simple’. ‘ en cuyo caso se podría decir que es fuerza bruta”.

Además, Chollet señala que o3 fue entrenado para realizar la prueba ARC-AGI utilizando el conjunto de datos de entrenamiento de la competencia. Eso significa que aún no está claro cómo abordaría el examen una versión limpia de o3, sin preparación para el examen.

También: El generador de vídeo Sora AI de OpenAI ya está aquí: cómo probarlo

Chollet me dijo en un correo electrónico: “Será interesante ver qué puntuación obtiene el sistema base sin información relacionada con ARC, pero en cualquier caso, el hecho de que el sistema esté ajustado para ARC a través del conjunto de entrenamiento no invalida su rendimiento”. “Para eso está el conjunto de entrenamiento. Hasta ahora nadie había podido lograr puntuaciones similares, incluso después de entrenar en millones de tareas ARC generadas”.

o3 todavía falla en algunas tareas fáciles

A pesar de la incertidumbre, una cosa parece muy clara: quienes anhelan AGI se sentirán decepcionados. Chollet enfatiza que la prueba ARC-AGI es “una herramienta de investigación” y que “aprobar ARC-AGI no equivale a alcanzar AGI”.

“De hecho, no creo que o3 sea AGI todavía”, escribe Chollet en el blog ARC-AGI. “O3 todavía falla en algunas tareas muy fáciles, lo que indica diferencias fundamentales con la inteligencia humana”.

Para demostrar que todavía no estamos al nivel de inteligencia humana, Chollet señala algunos de los problemas simples en ARC-AGI que o3 no puede resolver. Uno de esos problemas implica simplemente mover un cuadrado de color en una cantidad determinada, un patrón que rápidamente se vuelve claro para un ser humano.

ejemplo-de-falla-de-arc-agi-2024

Un problema de ejemplo de ARC-AGI donde falló el modelo o3.

Premio ARCP

Chollet planea presentar una nueva versión de ARC-AGI en enero. Predice que reducirá drásticamente los resultados de o3. “Sabrás que AGI está aquí cuando el ejercicio de crear tareas que sean fáciles para los humanos comunes pero difíciles para la IA se vuelva simplemente imposible”, concluye.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

Cinco tendencias de IA a tener en cuenta en 2025: agentes, IA 3D, datos sintéticos y más

Published

on

Las empresas de inteligencia artificial como ChatGPT aumentaron su valor en 2024. Sebastien Bozón/AFP vía Getty Images

En los primeros ocho meses de 2024, Microsoft (MSFT), Meta (META), Google (GOOGL) y Amazon (AMZN) registraron colectivamente la asombrosa cifra de 125 mil millones de dólares en gastos de capital (CapEx) y costos operativos relacionados con la IA, según un informe de septiembre. Informe JPMorgan. Se espera que el CapEx acumulado de estos cuatro gigantes tecnológicos por sí solo supere la marca de los 200 mil millones de dólares para todo 2024.

Mientras tanto, las nuevas empresas de IA recibieron cantidades sin precedentes de financiación de inversores deseosos de sacar provecho del potencial lucrativo de la tecnología. OpenAI terminará 2024 como la empresa de IA mejor financiada, valorada más recientemente en 157 mil millones de dólares. Su rival Anthropic se está preparando para una nueva recaudación de fondos que la valora en 40 mil millones de dólares.

Llenas de efectivo, las principales empresas de inteligencia artificial ahora tienen la tarea de demostrar a los inversionistas (y al público) que sus costosas apuestas en la nueva tecnología darán sus frutos. Desde un giro continuo hacia la “IA agencia” hasta nuevas leyes de escalamiento emergentes y exploraciones de amplio alcance de las innumerables capacidades de la IA, he aquí un vistazo a lo que traerá el 2025 al mundo de la IA:

La IA agente será “el próximo gran avance”

La palabra de moda se refiere a asistentes autónomos de IA capaces de completar tareas sin supervisión humana. El potencial de los agentes de IA para mejorar los lugares de trabajo y la vida cotidiana rápidamente llamó la atención en Silicon Valley, y empresas como Salesforce adoptaron a los agentes como su próximo producto importante.

Microsoft también ha implementado una gran cantidad de agentes de inteligencia artificial en los últimos meses. En noviembre, presentó varios asistentes de inteligencia artificial personalizados para su suite Microsoft 365, incluido un agente capaz de proporcionar traducción en nueve idiomas diferentes.

OpenAI también está en el tren de la “IA agente”, y se espera que un próximo modelo pueda realizar tareas como reservar viajes y escribir código. Los agentes de IA son “lo que se sentirá como el próximo gran avance”, dijo Sam Altman, director ejecutivo de OpenAI, durante una reciente AMA en Reddit.

El mercado global de agentes de IA está valorado actualmente en más de 5 mil millones de dólares, según la firma de investigación MarketsandMarkets. Para finales de la década, se espera que esta cifra se dispare a 47 mil millones de dólares, impulsada en parte por la demanda de agentes entre los clientes empresariales.

La computación en tiempo de prueba podría ser una solución a la crisis de datos de entrenamiento de la IA

Uno de los componentes clave del éxito de la IA en los últimos años ha sido la gran cantidad de datos introducidos en los modelos de IA. Pero sólo hay una cantidad finita de texto, imágenes y vídeos en Internet. Para evitar un estancamiento en el desarrollo de la tecnología, las empresas de IA están recurriendo a formas alternativas de entrenar sus modelos. Una de las soluciones más prometedoras es la computación en tiempo de prueba, donde los modelos de IA mejoran al razonar y tomar más tiempo para pensar en posibles respuestas antes de responder, una teoría demostrada más recientemente por el modelo o1 de OpenAI.

En una conferencia telefónica sobre resultados en noviembre, el CEO de Nvidia (NVDA), Jensen Huang, describió el nuevo modelo de OpenAI como “uno de los desarrollos más emocionantes” en escalamiento y señaló que “cuanto más piense, mejor y de mayor calidad producirá la respuesta”.

Huang no está solo en su optimismo. El director ejecutivo de Microsoft, Satya Nadella, también señaló la computación en tiempo de prueba como una nueva ley de escalamiento en noviembre, mientras que el cofundador de OpenAI, Ilya Sutskever, a principios de este mes la destacó como una progresión de la era previa al entrenamiento de la IA.

Los datos sintéticos son otra solución prometedora

Otra solución a la crisis de datos de la IA es reemplazar los datos tradicionales con información generada por la propia tecnología. Se espera que el mercado de datos sintéticos se dispare a 2.100 millones de dólares para 2028, lo que representa un aumento de más del 450 por ciento desde 2022, según BCC Research.

Altman insinuó el potencial de los datos sintéticos hace un año cuando habló sobre el suministro cada vez menor de datos de la IA, y comentó en una entrevista que “siempre que se pueda superar el horizonte de eventos de los datos sintéticos, donde el modelo es lo suficientemente inteligente como para generar buenos datos sintéticos, Creo que todo debería estar bien”. Según se informa, OpenAI, junto con competidores como Anthropic, Meta, Microsoft y Google, han comenzado a utilizar datos sintéticos de alguna manera para entrenar y ajustar modelos.

En octubre, la startup de IA Writer dio a conocer un nuevo modelo de IA entrenado íntegramente con datos generados por IA. Este enfoque permitió a la empresa reducir costes significativos en el desarrollo del modelo, que ascendieron a apenas 700.000 dólares en comparación con los millones repartidos por otras empresas. Entrenar el modelo GPT-4 de OpenAI, por ejemplo, costó más de 100 millones de dólares.

Los “grandes modelos de mundos” crearán mundos de IA en 3D

Hasta ahora, gran parte de los resultados visuales de la IA han permanecido bidimensionales, algo que los pioneros de la tecnología buscan cambiar en los próximos años. Los “grandes modelos de mundos” son una forma emergente de IA que tiene como objetivo construir escenas tridimensionales interactivas que avancen en los mundos de las películas, los juegos y los simuladores.

Uno de los actores más importantes en este espacio es World Labs, una nueva startup establecida por el pionero de la IA de Stanford, Fei-Fei Li, que recaudó 230 millones de dólares a principios de este año. La empresa busca construir grandes modelos mundiales con “inteligencia espacial”, una forma de inteligencia que comprenda el mundo real e interactúe con él. Para demostrar este concepto, Li ha utilizado anteriormente el ejemplo de un gato que se esfuerza por caer sobre un vaso de leche y la capacidad de los humanos para predecir las consecuencias de este evento y, por lo tanto, tomar medidas para evitar que el vaso se caiga.

A principios de diciembre, Google DeepMind lanzó su propio gran modelo mundial en forma de Genie 2, que simula entornos virtuales que se utilizarán para entrenar y evaluar agentes de IA. El área probablemente será un foco clave para el laboratorio en el futuro, como lo demuestra la reciente contratación de Tim Brooks, un ex investigador de OpenAI que supervisa su generador de video Sora. En una publicación de X dando la bienvenida a Brooks a su equipo, el director ejecutivo de Google DeepMind, Demis Hassabis, destacó su entusiasmo por “trabajar juntos para hacer realidad el sueño de larga data de un simulador mundial”.

Los motores de búsqueda con IA remodelarán la búsqueda en línea

Google ha tenido durante mucho tiempo un dominio aparentemente intocable en el mercado de búsquedas. Pero con la llegada de la IA, una proliferación de motores de búsqueda impulsados ​​por ella busca sacudir el punto de apoyo del gigante tecnológico.

No es que Google no haya adoptado la tecnología en sí. En 2024, lanzó AI Overviews, una función que proporciona a los usuarios resúmenes generados por AI en lugar de enlaces. El director ejecutivo, Sundar Pichai, predice que la función atraerá a más de mil millones de usuarios mensuales y ya está “aumentando el uso general de búsqueda y la satisfacción del usuario”, dijo a los analistas de Wall Street en octubre.

Pero Google tendrá que lidiar con una industria cada vez más concurrida de herramientas de búsqueda, a medida que empresas como OpenAI y Microsoft se expandan en el campo con la ayuda de la IA.

Según se informa, Meta también se está preparando para lanzar su propio motor de búsqueda impulsado por IA, mientras que la startup Perplexity AI se ha convertido en un jugador especialmente formidable. Valoradas recientemente en 9 mil millones de dólares, sus herramientas de búsqueda de inteligencia artificial ya procesan alrededor de 20 millones de consultas diariamente, frente a los 2,5 millones de principios de 2024.

Cinco tendencias de IA a tener en cuenta en 2025: IA agente, modelos 3D, datos sintéticos y más

Continue Reading

Noticias

A mitad del viaje: qué es y qué debe saber sobre el generador de imágenes con IA

Published

on

Midjourney es un generador de imágenes con inteligencia artificial, utilizado por diseñadores gráficos y artistas o cualquier persona curiosa sobre el arte generado por IA. Disponible como un bot de conversión de texto a imagen en Discord, la popular plataforma social para jugadores, es útil ya sea que estés pensando en conceptos para un proyecto, necesites ideas visuales rápidas o simplemente quieras jugar. Además, es divertido ver lo que se le ocurre a la herramienta de IA en función de la idea que tienes en la cabeza.

Probablemente haya oído hablar o haya probado sus competidores, como Dall-E, Adobe Firefly, Stable Diffusion y Leonardo. Probamos Midjourney antes de su última actualización hace unos meses y puedes leer nuestra reseña aquí. Veredicto de CNET: “Aunque no siempre son del todo correctas, las imágenes de Midjourney son divertidas, detalladas y vívidas”.

También comparamos Midjourney con otras herramientas de generación de imágenes de IA que probamos en 2024. Si bien esta herramienta tiene muchas características excelentes, hay algunas cosas a considerar: está disponible solo en Discord, requiere una suscripción paga y, a veces, no se alinea bien con indicaciones.

Dicho esto, es una gran herramienta, especialmente para personas con gran imaginación pero sin muchos conocimientos prácticos. Según los 20,77 millones de miembros de Midjourney en agosto de 2024, ciertamente hay muchas personas que lo prueban.

Versiones de Midjorney

Desde refrigeradores parlantes hasta iPhones, nuestros expertos están aquí para ayudar a que el mundo sea un poco menos complicado.

Desde su lanzamiento en julio de 2022, Midjourney ha tenido varias actualizaciones de versión, incluida la 6.1, que es el modelo predeterminado actual. Cada nueva versión mejora la calidad de las imágenes generadas, agregando más detalles, mejor iluminación y más flexibilidad de estilo. La versión 6.1 parece haber solucionado finalmente el problema de las “manos y dedos extraños” que aparece con la mayoría de los generadores de imágenes de IA.

Una característica interesante de Midjourney es que puede cambiar a uno de sus modelos heredados (1, 2, 3, 4, 5, 5.0, 5.1, 5.2 o 6) usando el comando –version o –v parámetro para cambiar el modelo.

Captura de pantalla de Barbara Pazur/CNET

Las diferentes versiones generan diferentes estilos de imágenes. Después de la versión 5, Midjourney produce más imágenes fotográficas y de la vida real con mayor precisión de detalle y textura, mientras que las versiones anteriores son mejores para imágenes artísticas y estilizadas.

A mitad del viaje/Captura de pantalla de Barbara Pazur/CNET

A mitad del viaje Niji Modelo 6 Es tu momento de brillar si te gusta el anime. Fue desarrollado en colaboración con Spellbrush y ajustado específicamente para la estética del anime, tomas de acción y composiciones centradas en los personajes. Para activar este modo, simplemente agregue –niji 6 a su mensaje, o selecciónelo de la configuración usando el /ajustes dominio.

Desde refrigeradores parlantes hasta iPhones, nuestros expertos están aquí para ayudar a que el mundo sea un poco menos complicado.

Cómo utilizar Midjourney: configuración

Midjourney no se ejecuta en una aplicación como otros generadores de imágenes de IA, por lo que primero deberás tener una cuenta en Discord. Luego deberás suscribirte a un plan Midjourney y unirte al servidor Midjourney en Discord. Después de eso, tendrás que unirte a un canal. Se recomiendan #General y #Novato si recién estás comenzando.

En cuanto a cómo ocurre la magia, como ocurre con cualquier otra herramienta de inteligencia artificial que existe, se trata de escribir el mejor mensaje. Describes la imagen que quieres ver y la IA se pone a trabajar.

Midjourney utiliza modelos de aprendizaje automático entrenados con una gran cantidad de datos para descubrir lo que estás pidiendo. Luego crea imágenes basadas en eso. Es importante tener en cuenta que todas las imágenes que cree pasan a ser de dominio público y son visibles para los usuarios en el servidor Midjourney a menos que se creen en modo oculto, pero hablaremos de eso más adelante.

Los resultados pueden ser salvajes, desde paisajes o rostros realistas hasta cosas más abstractas y artísticas.

A mitad del viaje/Captura de pantalla de Barbara Pazur/CNET

Cada acción que envías a un bot de Midjoruney se denomina “trabajo”. Esto incluye solicitudes de imágenes, ampliación y creación de variaciones de imágenes basadas en la entrada de un usuario después de /imagine.

Midjourney te da control sobre los resultados con dos características clave: U para exclusivo y V para variaciones. Después de crear un conjunto de imágenes, puedes elegir una y usar la opción “U” para mejorarla, como mejorar la resolución para hacerla más limpia y detallada.

Si no está totalmente satisfecho con los resultados pero le gusta su dirección, puede presionar “V” para Variaciones. Esto hace que la herramienta cree nuevas imágenes basadas en las seleccionadas, manteniendo el estilo o la vibra pero cambiando algunos detalles. Es una excelente manera de modificar su producción sin comenzar desde cero porque puede resultar molesto.

Estas opciones le brindan flexibilidad y le permiten ajustar las imágenes a su gusto. Otras opciones para mejorar o modificar su imagen incluyen reglas y métodos de solicitud específicos para obtener resultados óptimos. Algunos de estos parámetros son –no, –shorten, –remix, –remaster y –stop. Puede parecer demasiado complicado al principio, pero es fácil dominarlo después de un poco de prueba y error.

Impulsar la mitad del viaje

La recomendación general para indicaciones básicas es mantener las indicaciones breves y concisas con instrucciones simples en lugar de descriptivas.

Por ejemplo, no dé instrucciones con algo como: “Crea una imagen de una acogedora cabaña en las montañas rodeada de pinos, con nieve cayendo suavemente y humo saliendo de la chimenea. Haz que se sienta cálido y tranquilo”. En su lugar, escriba: “Acogedora cabaña de montaña con nieve, pinos y un ambiente cálido y tranquilo”.

Indicaciones avanzadaspor otro lado, puede incluir una o más URL de imágenes, varias frases de texto y uno o más parámetros. Los parámetros ajustan cómo se genera una imagen modificando cosas como relaciones de aspecto, modelos y escaladores. Van al final del mensaje.

A mitad del viaje/Captura de pantalla de Barbara Pazur/CNET

Precios a mitad de viaje

A diferencia de algunos generadores de imágenes de IA de generación gratuita, al menos para pruebas de modelos o capacidad parcial, necesitará una suscripción para acceder a Midjourney. Aquí hay un desglose rápido de los precios actuales:

  • Plan Básico: $10 por mes (incluye 3,3 horas de tiempo rápido de GPU).
  • Plan estándar: $30 por mes (incluye 15 horas de GPU rápida, modo Relajado ilimitado).
  • Plan profesional: $60 por mes (incluye 30 horas de GPU rápida, modo Relajado ilimitado y modo Sigiloso).
  • Mega Plan: $120 por mes (incluye 60 horas de GPU rápida, modo relajado ilimitado y modo sigiloso).

Los planes anuales también están disponibles con un 20% de descuento en todos los niveles.

Pero aquí es donde las cosas se vuelven más complejas: si una empresa genera más de $1 millón en ingresos brutos por año, deberá optar por el plan Pro o Mega para acceder a todos los derechos de uso comercial de Midjourney.

Midjourney también tiene otras opciones de pago extrañas, como aceptar solo métodos de pago compatibles con Stripe.

Funciones, modos y más

Midjourney se basa en potentes unidades de procesamiento de gráficos para procesar y crear imágenes según sus indicaciones. Cuando te suscribes a Midjourney, básicamente estás pagando por el acceso a estas GPU para generar tus imágenes.

Elegir uno de estos modos para gestionar la rapidez con la que se generan las imágenes dependerá de tu nivel de paciencia:

  • Modo rápido: Las imágenes se generan rápidamente, pero consumen las horas de GPU asignadas.
  • Modo Relajarse: Genera imágenes más lentamente pero no utiliza el tiempo de su GPU, ofreciendo generación ilimitada.
  • Modo turbo: La opción más rápida, pero consume el doble de tiempo de GPU que el modo rápido.
  • Modo sigiloso: una característica adicional disponible en los planes Pro y Mega de Midjourney. Te permite generar imágenes de forma privada, lo que significa que tus creaciones no serán visibles para otros usuarios en la galería pública.

Vale la pena mencionar que los suscriptores pueden incluso ganar una hora de GPU rápida gratuita diariamente al clasificar imágenes. Los 2000 mejores participantes cada día reciben una hora rápida adicional como recompensa.

Referencias de estilo

En enero de 2024, se lanzó Midjourney Referencia de estilo (–sref). Esta función te permite tomar el estilo visual de cualquier imagen y aplicarlo a tus propias creaciones. Cada estilo tiene un código único, que puede reutilizar para obtener resultados consistentes.

Si te sientes aventurero, puedes usar el comando aleatorio –sref y Midjourney elegirá un estilo aleatorio entre miles de millones de posibilidades.

Incluso hay sitios web dedicados con miles de códigos SERF que puedes utilizar. Como el mensaje /imagine: Surreal Neon Dreamscapes –sref 698401885

A medida que crezca el arte generado por IA, plataformas como esta serán aún más útiles para artistas, diseñadores y cualquiera que busque superar los límites de la creatividad. Pero todavía les queda un largo camino por recorrer antes de reemplazar a los artistas reales.

Continue Reading

Noticias

Cinco formas de utilizar ChatGPT para marketing y correo electrónico de pequeñas empresas

Published

on

La frase “pequeña empresa” es un nombre inapropiado. La mayoría de los propietarios de pequeñas empresas o emprendedores tienen objetivos y ambiciones que no son nada pequeñas: simplemente prefieren mantener el control sobre su negocio. Puede resultar complicado competir con nuevas empresas financiadas por capital de riesgo que tienen más recursos a su disposición. Pero hoy en día, herramientas como ChatGPT están nivelando el campo de juego para empresas grandes y pequeñas, comenzando con la redacción de correos electrónicos y el marketing.

Como propietario de un negocio iniciado, utilizo regularmente herramientas de inteligencia artificial como ChatGPT para mejorar la comunicación, ahorrar tiempo e impulsar el alcance de mi negocio, lo que me deja más energía para concentrarme en las tareas que realmente mueven la aguja de mi empresa. A continuación le mostramos cómo puede utilizar ChatGPT para correos electrónicos de pequeñas empresas.

Cómo escribir correos electrónicos con ChatGPT

Si eres nuevo en los modelos de lenguajes grandes (LLM), quizás te preguntes: ¿Puede ChatGPT escribir correos electrónicos profesionales y realistas? Respuesta corta: sí. ChatGPT puede actuar como su asistente personal de IA, generando borradores que suenan profesionales, ya sea que necesite una presentación fría a clientes potenciales o respuestas repetitivas fuera de la oficina. Todo comienza con el “mensaje”: las instrucciones que le das a ChatGPT.

Cuando elabore un mensaje, actúe como periodista y considere las preguntas: quién, qué, dónde, cuándo, por qué y cómo. Especifique el formato (por ejemplo, una plantilla versus un mensaje único), el tono, la audiencia, el momento, los detalles clave a incluir y por qué está escribiendo en primer lugar. El contexto del mensaje ayuda a ChatGPT a alcanzar sus objetivos. Afortunadamente, ChatGPT es una herramienta conversacional, por lo que puedes entablar un diálogo de ida y vuelta para asegurarte de que un borrador de correo electrónico cumpla con tus expectativas.

Aproveche ChatGPT para correos electrónicos de pequeñas empresas

ChatGPT puede ayudarle con los correos electrónicos comerciales y el marketing relacionado de varias maneras. Con ChatGPT, puede generar rápidamente plantillas y primeros borradores. Puede actuar como un editor de textos, un lector sensible o un editor de desarrollo, enfocándose en los aspectos generales de la escritura, como el tono y la estructura. Puede filtrar comunicaciones no esenciales. Puede ayudarle a realizar investigaciones rápidamente para que pueda incluir datos persuasivos y dirigir sus correos electrónicos a la audiencia donde puede generar el mayor impacto.

Las mayores ventajas de utilizar ChatGPT para estas tareas son ahorrarle tiempo y energía. Al delegar tareas tediosas a ChatGPT, como primeros borradores, investigaciones y administración de la bandeja de entrada, puedes dedicar más atención a tareas que solo tú puedes hacer: perfeccionar el tono de un correo electrónico o establecer una conexión personal con el destinatario. En la otra cara de la moneda, no siempre se puede confiar en ChatGPT: se sabe que plagia o inventa cosas. Las investigaciones han descubierto que al resumir hechos, la tecnología ChatGPT “alucina” aproximadamente el 3 por ciento de las veces.

Delegar la redacción de correos electrónicos a ChatGPT no significa entregar las riendas por completo. Debes ser un editor diligente.

A continuación, presentamos un vistazo más de cerca a cinco formas en que puede utilizar ChatGPT para correos electrónicos de pequeñas empresas.

1. Cree filtros de correo electrónico

Revisar el desorden de correos electrónicos puede suponer una gran pérdida de energía y productividad. ChatGPT puede ayudarlo a configurar filtros de correo electrónico y concentrarse en los correos electrónicos esenciales, sin perder tiempo eliminando cada “**Oferta especial navideña**” que llega a su bandeja de entrada. Mi bandeja de entrada de alta prioridad resalta los mensajes importantes y filtra las distracciones.

Para las pequeñas empresas, esto significa ahorrar tiempo, aumentar la productividad y mejorar la capacidad de respuesta, algo crucial para seguir siendo competitivos. Si bien las instrucciones técnicas para configurar filtros están disponibles en línea, ChatGPT puede guiarlo a través del proceso. Con un mensaje simple como “¿Cómo configuro un filtro de Gmail para eliminar automáticamente los correos electrónicos con el asunto ‘Oferta de spam’?” ChatGPT generará guía paso a paso para plataformas como Gmail, Outlook, Apple Mail y Thunderbird.

Al eliminar el ruido, ChatGPT ayuda a las pequeñas empresas a priorizar las comunicaciones esenciales.

2. Revisar el borrador de la estructura del correo electrónico

Escribir correos electrónicos es fácil, pero escribir correos electrónicos de forma eficaz es un arte. Para crear correos electrónicos impactantes que logren sus objetivos, Harvard Business Review sugiere la siguiente fórmula de correo electrónico: comience con la acción que desea que realice el destinatario, siga con el contexto de por qué necesita esa acción y luego termine haciéndole saber que usted es el destinatario. Estamos disponibles para preguntas.

ChatGPT puede ayudarlo a maximizar la efectividad de sus correos electrónicos revisando su estructura y ofreciendo consejos para mejorar. Por ejemplo, puede compartir la fórmula anterior con ChatGPT, pegar su correo electrónico en la conversación y preguntar si el correo electrónico refleja la estructura. Un correo electrónico bien estructurado ahorra tiempo tanto al remitente como al destinatario. También puede mejorar la participación del cliente, generar confianza y aumentar las tasas de respuesta, todo lo cual puede tener un impacto positivo en su pequeña empresa.

3. Edite los correos electrónicos con un peine de dientes finos

En mi empresa, animo a los miembros del equipo a utilizar herramientas de inteligencia artificial como ChatGPT para editar correos electrónicos. ChatGPT puede revisar rápidamente los correos electrónicos en busca de errores tipográficos, gramaticales y claridad, asegurándose de que estén pulidos antes de presionar enviar.

¿Por qué esto importa? Incluso el correo electrónico mejor estructurado y atractivo pierde su impacto si se escapa un error tipográfico tonto. Errores aparentemente menores pueden terminar dañando su credibilidad y socavando la confianza en su negocio.

Usar ChatGPT es simple: copie el borrador de su correo electrónico en la herramienta, pídale que lo revise en busca de errores y realice los ajustes necesarios. Esta pequeña inversión de tiempo puede evitarle situaciones embarazosas y fortalecer la reputación de su pequeña empresa.

4. Borradores de correos electrónicos promocionales

Para los propietarios de pequeñas empresas, adquirir listas de suscriptores de correo electrónico lleva tiempo, pero son una parte esencial de cualquier estrategia de marketing. ChatGPT puede ayudarlo a aprovechar los contactos de clientes y clientes potenciales que tanto le costó ganar al redactar correos electrónicos para promocionar nuevos productos y ofertas.

Digamos que tienes una oferta navideña. Puede utilizar ChatGPT para crear un mensaje atractivo utilizando las mejores prácticas de marketing por correo electrónico. Simplemente proporcione los detalles esenciales, especifique el tono que busca, agregue las especificaciones de estructura y proporcione cualquier contexto adicional para refinar el correo electrónico y satisfacer sus necesidades.

5. Cree plantillas para las preguntas frecuentes sobre el campo

Cuando comencé mi negocio, rápidamente me di cuenta de que recibía las mismas consultas de los clientes. Creé plantillas para responder a las preguntas frecuentes sin tener que redactar un nuevo correo electrónico cada vez. ChatGPT puede generar borradores de plantillas, lo que le deja más tiempo para concentrarse en perfeccionar el mensaje.

Comience por hacer una lista de los tipos de correo electrónico y las preguntas que recibe con frecuencia. Agrupe la lista completa en categorías y luego toque ChatGPT para ayudarlo a preparar un borrador de plantilla para cada categoría. Edite los borradores según sea necesario y guarde las plantillas en su programa de correo electrónico con etiquetas fáciles de reconocer. Siempre que reciba una consulta que coincida con una categoría, actualice la información del destinatario en la plantilla y envíe el correo electrónico. Es posible que se sorprenda de la cantidad de tiempo que ahorra, lo que le permitirá pensar en cuestiones de nivel superior, como la estrategia empresarial y el crecimiento.

Conclusión

Si el tiempo es dinero, los propietarios de pequeñas empresas que no aprovechan las herramientas de inteligencia artificial como ChatGPT están dejando dinero sobre la mesa. Con las indicaciones adecuadas, puede automatizar los primeros pasos del proceso de redacción, realizar investigaciones rápidamente, generar borradores de correo electrónico con sonido profesional y, en última instancia, aumentar el alcance de su empresa. ChatGPT puede liberarte para que puedas concentrarte en tareas más impactantes.

Preguntas frecuentes (FAQ)

¿Cuáles son algunas indicaciones de ChatGPT para pequeñas empresas?

El uso eficaz de ChatGPT comienza con el mensaje. Tener borradores de plantillas de correo electrónico de ChatGPT para preguntas frecuentes puede permitirle concentrarse en preguntas más amplias: como, ¿cuáles son los puntos débiles actuales del negocio? ¿Hay algo que la empresa pueda hacer para resolver algunos de esos puntos débiles y evitar que los clientes tengan que hacer esas preguntas?

Para redactar plantillas de correo electrónico, puede utilizar el siguiente mensaje:

“Me gustaría que redactaras una plantilla de correo electrónico que pueda usar para responder a los clientes que preguntan sobre [specific FAQ topic]. El correo electrónico debe ser [insert tone: friendly, professional, informal, etc.]incluya una respuesta concisa a su pregunta y ofrézcase a brindar más ayuda si es necesario. Aquí hay algo de contexto sobre mi negocio: Vendemos [products/services]. El tema de las preguntas frecuentes es [e.g., shipping times, return policy, product usage]. Detalles a incluir en la respuesta: [insert details]. El correo electrónico también debe terminar con una despedida amistosa”.

Si desea que ChatGPT redacte un correo electrónico promocional, puede utilizar el siguiente mensaje:

“Me gustaría que escribieras un [insert tone: upbeat, friendly, professional, etc.] correo electrónico anunciando [briefly describe the promotion]. El correo electrónico debe terminar con un sentido de urgencia para [describe the call to action: purchase, subscribe, etc.] antes de que termine la promoción”.

¿Cuáles son las alternativas de ChatGPT para pequeñas empresas?

De acuerdo a McKinsey La investigación, el marketing y las ventas es una de las cuatro áreas que generarán el 75 por ciento del valor del uso de la IA generativa. Para las pequeñas empresas, ChatGPT es una herramienta accesible para comenzar a utilizar la IA para marketing y ventas. Dicho esto, existen un par de potentes alternativas a ChatGPT en el mercado.

Google Bard es una alternativa. Al utilizar IA conservacionista, Bard es excelente para generar respuestas detalladas y vincularlas a recursos externos. Los usuarios leales de Google estarán felices de saber que se integra perfectamente con herramientas de Google como Docs y Sheets. Bard puede generar varios tipos de contenido, incluidos (lo adivinaste) correos electrónicos y materiales de marketing para pequeñas empresas.

Otra alternativa es Claude de Anthropic. Claude se destaca por su enfoque en interacciones de IA éticas y seguras, minimizando las preocupaciones comunes de los chatbots de IA, como la producción sesgada. Se puede utilizar para tareas como redactar respuestas de correo electrónico y se puede integrar fácilmente en su sistema de correo electrónico para agilizar la comunicación.

¿Cuáles son las mejores prácticas de marketing por correo electrónico?

Para las pequeñas empresas, una estrategia de marketing por correo electrónico es vital para un crecimiento continuo. Si bien la estrategia en sí evolucionará continuamente, existen ciertas mejores prácticas a tener en cuenta.

Para empezar, es esencial revisar periódicamente sus objetivos de marketing por correo electrónico. Establecer metas es fundamental: si no sabes lo que te propones lograr, tus esfuerzos estarán desenfocados en el mejor de los casos y, en el peor, infructuosos. Está bien establecido que las personas que articulan claramente sus objetivos tienen más probabilidades de alcanzarlos. La misma lógica se aplica a las empresas. Tome lápiz y papel (o su aplicación para tomar notas favorita) y describa sus objetivos, como aumentar la participación del cliente o impulsar conversiones y ventas.

A nivel micro, el establecimiento de objetivos también es fundamental. Cada correo electrónico debe tener un objetivo claramente definido, de lo contrario, puedes dañar la credibilidad de tu negocio. Evite sobrecargar sus correos electrónicos con múltiples objetivos: cada comunicación debe tener un único llamado a la acción. De lo contrario, corre el riesgo de diluir su mensaje y perder clientes potenciales.

Adoptar herramientas de inteligencia artificial como ChatGPT puede cambiar las reglas del juego para las pequeñas empresas, no solo ahorrando tiempo y esfuerzo, sino también permitiendo a los emprendedores concentrarse en las tareas que mueven la aguja de sus empresas.

Continue Reading

Trending