Noticias
El o1 de OpenAI que usó “búsqueda” fue una operación psicológica
Published
6 meses agoon

Un poco de limpieza: planeo aumentar el precio de Interconnects en el nuevo año. Estoy produciendo mucho más contenido del que esperaba y el servidor de Discord está funcionando fantástico. Es un buen momento para actualizar a una suscripción anual; en realidad, se trata de un gran descuento navideño hasta que el precio suba en 2025. O siempre puedes Regala Interconexiones! Recordatorio: ofrezco 80% de descuento en descuentos para estudiantes.
Administrar suscripción
Y este es un último recordatorio de que estaré en NeurIPS en Vancouver la próxima semana. Comuníquese si está en la ciudad.
El lanzamiento de o1 de OpenAI se comunicó para hacer pensar a la gente que utilizaba activamente algún tipo de búsqueda (aparte del aprendizaje por refuerzo ingenuo), tanto en el momento del entrenamiento como en el de las pruebas. Se habían dicho muchas cosas antes de esto: el “autojuego” en Q*, Noam Brown liderando un equipo para trabajar en la búsqueda en OpenAI y muchos otros humo y espejos.
En mi primera publicación en o1, traté de tomar las comunicaciones corporativas de OpenAI y los medios de sus empleados al pie de la letra para descubrir qué está pasando: ¿Qué significaría para o1 de OpenAI utilizar la búsqueda?
Ingeniería inversa o1 de OpenAI
Hoy hago lo contrario… ¿Qué significaría para sistemas similares a o1 utilizar exclusivamente aprendizaje por refuerzo a gran escala sin recompensas intermedias o de proceso? Esto no incluye ninguna expansión de los pasos actuales en la cadena de razonamiento como un “árbol” o representaciones similares. Este es el argumento de que toda la “búsqueda” en o1 de OpenAI (y algunas de las replicaciones) está dentro del comportamiento de entrenamiento de aprendizaje por refuerzo. Los algoritmos de aprendizaje por refuerzo “buscan” para maximizar sus funciones de valor interno y recompensas extrínsecas en el entorno, pero es mucho menos intuitivo cómo se hace que algo como Monte Carlo Tree Search (MCTS).
El resumen de la publicación original fue que vi o1 de OpenAI como:
-
Procesar recompensas en el entrenamiento, proporcionando señales de recompensa por paso de razonamiento (basándose en mi Q* Hipótesis).
-
Búsqueda de profundidad 1 en el momento de la prueba con un verificador por paso de razonamiento como cabezal de valor independiente o incorporado (por ejemplo, un verificador generativo).
¿Por dónde empezamos en el otro camino? ¿Qué suposición es incorrecta?
Estaba viendo la gran conferencia de la profesora Sasha Rush, Especulaciones sobre la escala del tiempo de prueba (diapositivas aquí), y era obvio que nos encontramos en una encrucijada con respecto a los tipos de sistemas de IA que podemos construir con modelos de lenguaje. Los modelos o1 de OpenAI son los primeros de una nueva generación. Sasha explora 4 áreas que podrían estar involucradas en sistemas de capacitación como o1 de OpenAI, catalogadas como “Los sospechosos”:
Adivina + Comprobar
Recompensas del proceso
Buscar / AlfaZero
Aprendiendo a corregir
En particular, para ir en contra de mi primera publicación, necesito explicar cómo se puede construir o1 de OpenAI sin ninguno de los siguientes:
-
Búsqueda en línea en el momento de la prueba que controla la cantidad de computación gastada, es decir eliminando Search/AlpaZero de los sospechosos.
-
Recompensas intermedias que supervisan el proceso de formación, es decir eliminar las recompensas del proceso de los sospechosos.
Esto deja a los sospechosos como “Adivina + Verifica” y “Aprende a corregir”. Estas son las ideas más simples entre las cuatro.
Como todas las discusiones sobre o1, para hacer esto, tenemos que comenzar con el gráfico de cálculo fundamental en el momento de la prueba para ver dónde encajan las ideas.
Lo que implica el gráfico de cálculo en el momento de la prueba es que de alguna manera la cantidad de cálculo gastado se puede controlar como un parámetro de generación. Esto se debe a que el equipo de modelado definitivamente puede controlar el gráfico de la izquierda, el cálculo del tiempo de entrenamiento. Emparejarlos juntos, donde la izquierda es un régimen controlable y la derecha pueden ser simplemente puntos muestreados del comportamiento natural, está empujando la narrativa en la dirección de un cómputo controlable en el tiempo de prueba.
La versión más intuitiva de esto sería un factor de ramificación en la búsqueda superficial, pero una alternativa podría ser un mensaje que simplemente le indique al modelo cuánto tiempo puede generar. Para este último, es importante recordar que OpenAI enfatizó que este tipo de modelo solo podría haberse realizado una vez que se lograron avances en el contexto a largo plazo.
La otra forma en que se podría crear el gráfico de cálculo en el momento de la prueba es muestreando generaciones y trazando la tasa de ganancias versus la cantidad de tokens que usó el modelo en su propia decodificación autorregresiva estándar. Lo que esto parece es que, para los conjuntos de evaluación, se toman muestras del modelo varias veces, no necesariamente solo una vez por mensaje, como es tradicional. Luego, agruparemos las respuestas en las regiones informáticas específicas del momento de la prueba en las que terminaron las finalizaciones.
A continuación se muestra un diagrama que muestra el escenario hipotético con múltiples finalizaciones por mensaje de evaluación.
A continuación, agrupe las ejecuciones de evaluación por cálculo gastado por el modelo y califique las respuestas. Asegúrese de que para cada mensaje haya suficientes evaluaciones representativas.
Finalmente, agregue las puntuaciones. Convierta los contenedores de cálculo en el momento de la prueba en puntuaciones y luego ordene los contenedores por cálculo gastado.
Luego, puedes convertir esto en una ley de escala de inferencia, sin utilizar ninguna búsqueda.
Incluso si este es el caso, sospecho que OpenAI eventualmente desarrollará la capacidad de controlar la duración de su generación por sí solo. Incluso solo la mitad izquierda del gráfico original de OpenAI, escalar el entrenamiento de RL, es potencialmente un cambio radical en la forma en que se entrenan los modelos de lenguaje.
Compartir
En segundo lugar, con una arquitectura más simple, es más importante controlar los datos de entrenamiento.. Hay dos cosas que creo que son importantes aquí: verificaciones y continuaciones. Primero, recordemos la terminología básica en la publicación del blog OpenAI o1:
Nuestro algoritmo de aprendizaje por refuerzo a gran escala enseña al modelo cómo pensar productivamente usando su cadena de pensamiento en un proceso de formación altamente eficiente en datos.
La pregunta clave que surge una y otra vez en el aprendizaje por refuerzo de los círculos de retroalimentación humana en estos días es “¿Qué datos se utilizan realmente para RLHF?”. El RLHF estándar, tal como lo conocíamos por modelos como InstructGPT y Llama 3.1, en realidad se trata principalmente de controlar el estilo y, al mismo tiempo, mejorar marginalmente el rendimiento en algunas capacidades. La señal es muy débil, como se ve en el 80% de los datos de preferencia de Llama 3.1 que son “chat general”.
Lo que hace o1, y hacia lo que se dirigen otros proyectos, es obtener su señal de recompensa explícitamente a partir de resultados mensurables: verificaciones. O1 de OpenAI se entrena en una gran variedad de mensajes en los que hay una respuesta verificable. Pueden ser problemas matemáticos, errores de código con pruebas unitarias, instrucciones con restricciones y otras cosas. Sospecho que una gran proporción de los datos de entrenamiento de o1 son estos, lo que permite la “eficiencia de datos” mencionada anteriormente.
OpenAI sigue entrenando sobre estas indicaciones, a veces el modelo lo hace bien y aprende de eso, y a veces necesita ayuda. Aquí es donde continuaciones entra. Nuevamente, citando la publicación del blog, como lo destaca Sasha Rush:
o1 aprende a perfeccionar su cadena de pensamiento y refinar las estrategias que utiliza. Aprende a reconocer y corregir sus errores. Aprende a dividir los pasos complicados en otros más simples. Aprende a probar un enfoque diferente cuando el actual no funciona.
Todos los datos que mencioné anteriormente son recompensas basadas en resultados. Para llegar allí, OpenAI utiliza una amplia retroalimentación de LLM como juez sobre cadenas de razonamiento intermedias. Los modelos de lenguaje existentes pueden identificar fácilmente dónde falla una cadena de pensamiento y pueden generar un siguiente paso para que el modelo intente completarla correctamente.
Las correcciones y continuaciones están en espíritu muy cerca de las recompensas del proceso. La diferencia clave es que la supervisión que estoy analizando en esta propuesta para o1 no necesita ocurrir en cada paso; puede haber algún conjunto de pasos que se verifican sólo cuando se llega a una respuesta final incorrecta.
Además, es probable que OpenAI tenga otros verificadores generativos (aprendidos) que van más allá de dominios simples como las matemáticas y el código, pero esta área es mucho más confusa. Podría ser un modelo de recompensa muy avanzado, podría ser algo completamente nuevo, no lo sabemos. Aún así, la última cita del blog de OpenAI que destaca Sasha Rush nos mostró lo importante que era el ciclo de retroalimentación de las continuaciones y la RL:
Al entrenar un modelo para el razonamiento, una cosa que inmediatamente me viene a la mente es hacer que los humanos escriban su proceso de pensamiento y se entrenen en él. Cuando vimos que si entrenas el modelo usando RL para generar y perfeccionar su propia cadena de pensamientos, puede hacerlo incluso mejor que si los humanos escribieran cadenas de pensamiento para él. Ese fue el “¡Ajá!” momento en el que realmente podrías escalar esto.
Este es un bucle de datos sintéticos prolongado y prolongado. La parte RL es necesaria para inducir comportamientos creativos, eso realmente creo, y todo el andamiaje que la rodea tiene como objetivo guiar la señal de aprendizaje hacia adelante.
La mejor parte de este punto de vista, que conlleva un conjunto completamente diferente de preguntas de investigación, es que encaja mejor con la famosa frase de Rich Sutton. amarga lección. Al limitar realmente el dominio y la estructura del problema, OpenAI pudo ampliar el cálculo de entrenamiento que gastaron en la etapa de aprendizaje por refuerzo. Sasha Rush destaca esta cita en su charla:
La amarga lección se basa en las observaciones históricas de que 1) los investigadores de IA a menudo han intentado incorporar conocimiento a sus agentes, 2) esto siempre ayuda a corto plazo y es personalmente satisfactorio para el investigador, pero 3) a largo plazo se estanca e incluso inhibe un mayor progreso, y 4) el progreso revolucionario eventualmente llega mediante un enfoque opuesto basado en escalar el cálculo mediante búsqueda y aprendizaje.
Nuevamente volvemos a la búsqueda. Lo que hay que recordar es que los métodos de aprendizaje por refuerzo utilizados durante el entrenamiento son una versión de la exploración de búsqueda para maximizar la recompensa. Dada la diversidad de comportamientos, parece como si OpenAI hiciera que RL pudiera funcionar por más tiempo sin sufrir degradación. Esto indica que tienen una regularización sólida (lo que podría dificultar el aprendizaje) o un conjunto de capacitación amplio y diverso (o, probablemente, ambas cosas).
Con RL, no es necesario que haya una estructura explícita para la búsqueda. tener algo Estilo AlphaZero para una tarea de generación de lenguaje sería muy complicado: no está nada claro cómo un modelo de lenguaje puede generar de manera confiable un paso de razonamiento a la vez mientras se bifurca y obtiene verificación. El lenguaje es confuso, y si lo aceptamos, tal vez lo correcto sea usar solo un modelo y muchas RL. Entonces, para responder Las preguntas de Rush:
¿Crees que están haciendo MCTS durante el entrenamiento?
No.
¿Esa parte surge de forma natural?
Sí, dependiendo de cómo definas “natural”.
Vimos algunos comportamientos RL muy extraños en Tulú 3 dejando nuestro entrenamiento RLVR (otro método que se ajusta solo a partir de las recompensas de resultados) funcionando por más tiempo del útil para el uso general. En concreto, vimos la comportamientos como “espera, déjame comprobar eso” varias veces en una expansión de cadena de pensamiento. Lo que necesitamos es mantener este tipo de entrenamiento manteniendo el comportamiento coherente en una variedad más amplia de tareas.
Tengo la intención de publicar más sobre o1 en los próximos meses; ahora tenemos una larga lista de compañeros, desde Fuegos artificiales F1, Nosotros Forja, DeepSeek R1 Lite, Qwen QwQy otras versiones menores. Estos están mostrando el rango potencial en estos modelos, aunque sigo pensando que la versión de OpenAI es la más robusta con diferencia.
Más allá de esto, abordaré temas como: cómo lo reproduciría (¿lo reproduciré?), cómo veo la literatura, qué esconde OpenAI, cómo las versiones abiertas deberían y serán diferentes, y todos los gustos. Asegúrate de suscribirte y darme tu opinión sobre lo que es más interesante.
Gracias a Hamish Ivison y Dylan Patel por solidificarme la idea de “muestreo” del cálculo del tiempo de prueba. Crédito a Sasha Rush por su excelente charla e intercambios en Twitter.
You may like

Es hora de Géminis, y la vida es fácil. Ya sea que lo consciente o no, las cosas deberían sentirse más fáciles y más fluidas esta semana. Las nubes no se han ido, pero ¿esos estratos bajos amenazan con llover en su fiesta en la azotea? Mágicamente derritiéndose. En su lugar, luces de hadas, gafas llenas y una sensación de optimismo.
Si bien una nueva historia de tres años recién comienza en la parte de Aries de su gráfico (gracias a Saturno), otra parte es concluir a medida que Venus se muda a Tauro (viernes Aest y GMT).
Además de esa ligereza están los últimos días de Júpiter en Géminis, inspirando la espontaneidad, una conversación brillante y una generosidad de espíritu que dice: “¡Déjame obtener la próxima ronda!” Y con Venus ahora en Tauro, no beberás la casa de blanco.
Aries y Aries se elevan
No hay escasez de diversión esta semana, ya que la temporada de Géminis aumenta el ritmo. Pero a pesar del ambiente más ligero, hay mucho reajuste en su propia vida.
Con tanto cambio, su mayor desafío será tratar de mantenerse presente con los problemas frente a usted en este momento. Mientras Venus ofrece su firma de despedida (viernes Aest y GMT), tómese el tiempo para reflexionar sobre cualquier relación o actualización de estilo que haya realizado en los últimos meses.
Tauro y Tauro Rising
Prepárese, estarás de humor para que llove esta semana. Como Géminis inspira un a Hell-with-it Enfoque para su gasto, cualquier cita minorista podría salir de control muy rápidamente. Además de las vibraciones de gastos, su planeta gobernante, Venus, se muda a su letrero de casa.
En términos simples, eso te hará sentir aún más inclinado a invertir en ti … porque vale la pena. Disfruta de la diversión de todo, pero asegúrate de no escribir cheques que no puedas cobrar.
Géminis y Géminis Rising
Hay una gran energía de “sí” que hace ping esta semana, y usted es el 100 por ciento aquí para ello. Con Júpiter y Mercury ayudándote a lanzar, conectar o articular un sueño imposible, te sentirás como una fuerza de la naturaleza. Implente, completamente inspirado y totalmente listo para lo que se te presente.
Da el salto y disfruta de esta última ráfaga de confianza para hacer lo que has estado percolando durante la mayor parte de un año. Ahora es tiempo.
Cáncer y Cáncer Rising
Con mucha acción que se desarrolla en el trabajo, podría sentir que hay espacio para poco más. Por intenso que sea, hay más en la vida esta semana que apagar incendios, lidiar con jefes de alto mantenimiento y manejar egos XL.
Esta energía de Géminis es un antídoto divertido y tal vez incluso un poco tonto. Asegúrese de hacer espacio para priorizar el autocuidado de una manera juguetona y afirmativa de la vida. Asegúrese de hacerlo, es exactamente lo que necesita para equilibrar el drama en el trabajo.
Leo y Leo Rising
¿Picaza para avanzar en el trabajo? Con una dulzura en su esfera profesional hacia el final de la semana, deje de enviar correos electrónicos/solicitando un aumento salarial o haciendo cualquier red importante si puede. Después del viernes, las cosas fluirán 1000 veces más fácil.
Si puedes, haz espacio para jugar con amigos. The Going es excelente para cenas grupales improvisadas, bromas primas o incluso un viaje de chicas de última hora. Ponte entre él.
Virgo y Virgo aumentando
Amo esta semana para ti, especialmente en el frente de trabajo. Con Júpiter, el planeta que trae confianza, carisma y buenas noticias, trabajando doble tiempo (ahora Saturno está fuera del camino, escondido en la parte Aries del cielo), estás en un rollo. Una última explosión de casualidad está en las cartas para su vida profesional esta semana.
Entre entre cualquier red, mezcla o invita a LinkedIn en las que has estado pensando … pero tal vez no te habías sentido lo suficientemente valiente como para la acción. ¡Podría llevar a algo grande!
Libra y Libra Rising
A medida que nos instalamos en su nueva normalidad, hay mucho enfoque en su otra mitad esta semana, ya sea que esté en una relación o no. Mejores compañeros, socios comerciales: vale la pena prestar atención a cualquier bono importante.
Mientras tanto, su mojo de viaje está fuera de las listas. El viaje, el pasaje aéreo, el Airbnb perfecto, lo que sea que haya estado rondado, esta es su semana para bloquearlo. Vaya a planificar algo increíble.
Scorpio y Scorpio Rising
Hay una calma ligera y brillante para esta semana de la que no puedes no ser un poco zumbado. A medida que Venus se prepara para pasar al reino de sus relaciones más importantes, está entrando en una temporada de suntuosa y encarnada belleza. Pero antes de llegar allí, ¿por qué no dar su salud y bienestar un brillo final: los nuevos pantalones de yoga tal vez? Luego, el fin de semana, bloquee algún tiempo para hacer algo que se vea, sabe y huele bien con alguien que le importa.
Si estás en blanco, la indulgencia en solitario hará el truco.
Sagitario Rising
Es otra semana rosada para ti con la temporada de Géminis entregando los productos. Reducciones, gestionar o simplemente planificar una rodilla en el último minuto, todo está bien. La parte posterior de la semana se ve especialmente bien.
En otro lugar, hay un ambiente más tranquilo y medido para su día de trabajo; Un cambio de vibra que sentirá un millón de dólares. Si ha sido un arrastre, prepárese para que las cosas se sientan un poco menos de Ick.
Capricornio y Capricornio Rising
La gran evolución continúa esta semana en torno a su hogar y familia mientras Saturno se acomoda para su primer interludio dentro de su esfera doméstica. Podría sentirse más pesado o más grave de lo que tiene, pero ese es un paseo por el parque para el poderoso Seagoat. En otra parte, la temporada de Géminis trae la ligereza, inspirando un estado de ánimo juguetón y expansivo, especialmente en el trabajo.
Del mismo modo, su salud y bienestar están preparados para un pequeño brillo, por lo que si necesita una excusa para comprar el Nagnata, considere esta su señal de las estrellas.
Acuario y Acuario Rising
Si aún no ha recibido el mensaje, está oficialmente en su era divertida. La temporada de Géminis siempre es un buen momento para tipos aireados como tú, ¿y esta semana? Es uno de los mejores del mes. Venus se desliza en la esfera de su hogar, inspirándote a separarse de repente con efectivo ganado con tanto esfuerzo para zhush.
El fin de semana, una última explosión de Júpiter en la belleza de Géminis aparece el factor de coqueteo y te da un poco más je ne sais quoi Para trabajar la habitación … o reavivar una conexión.
Piscis y Piscis Rising
La gratitud está en gruesa y rápida para los piscanos esta semana, ya que uno de sus planetas gobernantes disfruta de los momentos finales de éxtasis en Géminis. Esa es una excelente noticia si está planeando una fiesta, renovación o cualquier cosa que involucre a la familia. Mientras tanto, Venus se muda a Tauro, inspirando mucho embellecimiento del tipo creativo.
No se sorprenda si se produce un difusor de automóvil Diptyque o una actualización de puntos por capricho. Es la temporada para viajar con estilo. Considérate advertido.
Noticias
Google Gemini puede tener éxito donde las tareas de chatgpt se caen planas
Published
7 horas agoon
1 junio, 2025
AI cambiará la forma en que usamos nuestros dispositivos, aceleramos las tareas y haciendo algunas en nuestro nombre. ChatGPT y Gemini ofrecen un vistazo a este futuro, con tareas de ChatGPT que llevan las cosas al siguiente nivel creando tareas programadas para que ChatGPT funcione automáticamente.
Mientras que las tareas de ChatGPT se destacan en ciertas áreas, hay espacio para mejorar. Aún así, las tareas de ChatGPT me entusiasman con lo que Google podría hacer con una característica de Géminis similar, dada su profunda integración en los productos, servicios y teléfonos de Google Pixel.
Relacionado
10 estilos de imagen de chatgpt que querrás probar ahora mismo
AI Art es el nuevo patio de recreo
¿Qué son las tareas de chatgpt?
Pon a Ai a trabajar para ti
Las tareas de ChatGPT no obtienen la mayor cantidad de atención de los medios como se merecen. Puede pensar que esta es una función de lista de tareas pendientes con IA en ChatGPT. En muchos sentidos, lo es. Sin embargo, es más inteligente y más capaz. Piense en las tareas de ChatGPT como una forma de programar tareas que AI puede hacer en su nombre o con usted en un momento programado.
Si bien puede crear tareas y recordatorios programados básicos, como pedirle a ChatGPT que le recuerde su aniversario a finales de este año, esto solo está rascando la superficie. Puede instruir a ChatGPT para escanear la web y resumir importantes noticias tecnológicas todos los días a las 9 a.m. También puede pedirle que lo ayude a practicar un nuevo idioma o habilidad diariamente, y crea tareas programadas para esto.
Eso no es todo. Puede pedirle a ChatGPT que le dé un resumen de una reunión importante 15 minutos antes de que comience, y lo hace en consecuencia.
Me estoy recuperando de una lesión en la rodilla, por lo que mis sesiones de gimnasio actualmente se centran en los ejercicios que minimizan la tensión en esa rodilla. Configuré una tarea en ChatGPT para compartir una rutina de entrenamiento de empuje a las 6 pm todos los días, con ejercicios que no se forjan la rodilla. Sin tareas, este habría sido un proceso de varios pasos que habría tenido que repetir a diario.
Otro uso útil que configuré implica hacer clic en una imagen del medicamento que toma mi esposa para proporcionar un contexto relevante, como la cantidad de cápsulas que toma diariamente. Luego, le pido a ChatGPT que configure un recordatorio tres días antes de que termine el medicamento para que pueda ordenar más.
A veces, necesito proporcionar detalles sobre cuántas cápsulas quedan, ya que ChatGPT no puede identificar esta información con precisión de la imagen. Sin embargo, todo el proceso todavía funciona.
Ninguna de las mejores aplicaciones de tareas pendientes en Android puede hacer lo anterior porque carecen de una integración de IA tan profunda.
Las tareas de ChatGPT solo son compatibles con los modelos O3 y O4-Mini. También está limitado a 10 tareas activas.
Géminis puede eclipsar las tareas de chatgpt aprendiendo de sus limitaciones
Donde Géminis puede hacerlo mejor

Si bien es impresionante, después de utilizar ampliamente las tareas de ChatGPT durante algunas semanas, me di cuenta de que la característica tiene deficiencias importantes. Para comenzar, no puede usar tareas de chatGPT en Android o iPhone para cambiar la configuración del sistema.
No puedo establecer una tarea recurrente usando ChatGpt en Android que apaga 5G en mi teléfono todas las noches cuando me voy a dormir. Del mismo modo, ChatGPT en Android no puede interactuar con otras aplicaciones, limitando lo que puede hacer con las tareas de ChatGPT.
Las tareas de CHATGPT solo operan dentro del entorno CHATGPT, limitando su alcance. Aquí es donde Géminis tiene la oportunidad de brillar.
Gemini carece de una función como las tareas de chatgpt. Si le pide que establezca un recordatorio o cree un horario, agrega el elemento a las tareas de Google. No hay forma de que Gemini tome medidas en su nombre en un momento programado automáticamente.
Google tiene la oportunidad de aprender de las limitaciones de las tareas de ChatGPT y, con su profunda integración de Android, ofrecer una experiencia perfecta y poderosa cuando lanza una característica similar.
Gemini puede interactuar con otras aplicaciones de Android y la configuración del sistema de control. Google debería aprovechar esta integración para Gemini para entregar una característica superior de tareas. Por ejemplo, en mi tarea de rutina de entrenamiento, puedo pedirle a Gemini que comparta la rutina de entrenamiento solo cuando estoy en el gimnasio. Esto no es posible con las tareas de ChatGPT, ya que no puede crear recordatorios o tareas basados en la ubicación.
Imagine poder establecer una tarea recurrente en Gemini que utiliza su integración de Gmail para enviar un correo electrónico a los miembros de su equipo todos los viernes por la tarde, proporcionándoles una visión general de las reuniones programadas para la próxima semana.
Del mismo modo, Google puede utilizar la integración de Google Home de Gemini para configurar tareas de hogar inteligentes programadas, como encender las luces al aire libre todos los días a las 5 p.m. Ahora, solo puede pedirle a Gemini que controle su hogar inteligente, no configure una tarea recurrente. Debe crear una automatización para esto.

Relacionado
Géminis 2.0: Cinco cambios principales que necesitas saber
Gemini 2.0 aporta nuevas capacidades de IA al ecosistema de Google
Géminis puede hacerlo mejor, pero no cuente OpenAi todavía
Ambas partes tienen espacio para crecer

Con Gemini integrado profundamente con Android y otros servicios de Google, Google puede ofrecer una característica superior de tareas de ChatGPT con su chatbot de IA. Esto puede explicar por qué la compañía no ha implementado una opción similar en Géminis.
Implementar una característica tan compleja, incluso con la ayuda de la IA, es una tarea desafiante y puede tomar un tiempo considerable. Espero que Google no apresure la implementación para sacarla por la puerta.
Además, sería una tontería contar OpenAi fuera de la carrera con tareas de chatgpt. Esta es solo la primera iteración de la característica, y la compañía puede vincularla a mayores cambios en el futuro para mejorar sus capacidades.

P. Quiero llevar mi uso de chatgpt a un nuevo nivel. ¿Cuáles son algunas cosas que puedo hacer?
A. Más de 2 años y medio después de debutar, ChatGPT sigue siendo una de las mejores herramientas generativas de IA actualmente disponibles. Aquí hay cinco consejos útiles que utilizo para hacerme más eficiente al usar ChatGPT.
Instale la aplicación de escritorio
ChatGPT no es solo una aplicación web. También es una aplicación de escritorio que puede descargar. La instalación se puede encontrar aquí: Descargar chatgpt | OpenAi.
Algunas características son específicas de la aplicación de escritorio. Por ejemplo, la aplicación de escritorio puede acceder a la herramienta de recorte de Windows de forma nativa. Para agregar una captura de pantalla, haga clic en el + + icono por la entrada de inmediato y seleccione “Tomar captura de pantalla”.
Aquí hay una forma en que uso esta función. Llamo a un estado de cuenta de tarjeta de crédito en mi pantalla y hago clic en el + + Botón en la aplicación CHATGPT, como se muestra arriba. Esto cambia mi computadora al modo de recorte y, de manera predeterminada, puedo tomar una instantánea del estado de la tarjeta de crédito en la pantalla, y ChatGPT lo adjunta a mi ventana de inmediato. Ahora quiero convertir el estado de la tarjeta de crédito en una tabla de datos con la que pueda trabajar en Excel. Para hacer esto, solicito chatgpt con “Esta es una imagen de un extracto de banco de tarjetas de crédito. Genere un archivo de Excel”. Esta es una operación compleja, por lo que ChatGPT tarda aproximadamente dos minutos en analizar el estado de la tarjeta de crédito y luego proporcionar los datos en un formato de tabla con un botón para descargar, como se muestra a continuación.

Podría lograr lo mismo cargando una captura de pantalla de mi declaración de tarjeta de crédito en la versión web de ChatGPT, pero encuentro que la aplicación de escritorio es un poco más conveniente.
Otra característica disponible solo en la aplicación de escritorio es el modo de voz, que utilizo para hablar con CHATGPT directamente en lugar de escribir. Para acceder al modo de voz, inicie una nueva sesión de chat, pero haga clic en el Usar el modo de voz icono, que se muestra en la parte inferior derecha de la captura de pantalla a continuación.

Utilizo el modo de voz (que se muestra en la captura de pantalla a continuación) cuando quiero tener una conversación sobre un tema y escribir es demasiado ineficiente. Me gusta especialmente cuando quiero hablar de una idea. Aquí está el aviso que recientemente dicté: “Así que soy un CPA que ejecuta una práctica fiscal, y estoy pensando en cambiar mi software de gestión de proyectos que he usado durante los últimos 10 años en un producto más nuevo y robusto, pero realmente necesito saber en qué necesito pensar y preocuparme en esa transición”.
Cuando hablé el aviso, tuve algunas pausas y “umms”. ChatGPT los reconoce y trabaja a su alrededor.

ChatGPT respondió a mi aviso y me dijo audiblemente para estar al tanto de cuatro puntos: migración de datos, capacitación, integración y continuidad de transición. Seguí con: “Vamos a sumergirnos en ese plan de transición porque ese es el más preocupado”. ChatGPT continuó y me dio más detalles sobre qué tener en cuenta al hacer la transición, como priorizar qué datos la transición, mantener al equipo en el ciclo y tener un plan de respaldo en caso de que algo salga mal. Expliqué una preocupación: “También estoy realmente preocupado por el rechazo de mi personal existente en cambiar los productos”. ChatGPT se centró en la importancia de una comunicación clara con el equipo. Una vez que terminé, hice clic en el botón X y me llevó a una transcripción de la conversación.
Recuerde, la IA generativa no puede replicar o reemplazar el asesoramiento de expertos (las alucinaciones siguen siendo un problema), pero hablar sobre el tema me ayuda a sentirme más cómodo antes de tener esa conversación con un humano.

Un último consejo con respecto a la aplicación CHATGPT Desktop. Lo supo a mi barra de tareas y Comenzar menú. Esto ayuda a recordarme que tengo esta herramienta fácilmente disponible.
Agrupe sus conversaciones en proyectos
Tengo muchas conversaciones con chatgpt. A veces, esas conversaciones están relacionadas entre sí, y quiero salvarlas juntas. Esto se llama proyecto.
Un buen ejemplo del proyecto sería hacer publicaciones de trabajo y descripciones de trabajo. Supongamos que tengo cuatro puestos que necesito (o puede necesitar) para llenar pronto: un analista de negocios, un miembro del equipo de operaciones, un gerente de impuestos y un miembro del equipo de auditoría. Crearía una conversación para cada trabajo y luego quiero que se guarden juntos.
Para crear este nuevo proyecto, hice clic en el + + Firme junto a los proyectos en la columna izquierda de la ventana CHATGPT (vea la captura de pantalla a continuación). En este ejemplo, nombré el proyecto “descripciones de trabajo”.

Cualquier conversación que comience aquí se asociará con el proyecto que he creado. Agregué instrucciones al proyecto para darle a ChatGPT una comprensión base del propósito del proyecto. Ingresé: “Las conversaciones en el proyecto son para publicaciones de trabajo y descripciones de trabajo para mi firma de contabilidad”. como un conjunto de instrucciones. También puedo agregar archivos como los materiales de marketing proporcionados por los equipos de ventas para diferentes gerentes de práctica.
Reducir el desorden con chat temporal
ChatGPT muestra un historial de todos los chats en el lado izquierdo de la ventana. Utilizo chatgpt casi todos los días, por lo que esta lista es muy larga. Muchas veces, en lo que necesito trabajar no necesita ser salvado en la historia. Aquí es donde los chats temporales son útiles. Encender Chat temporalhaga clic en el Temporario Botón en la parte superior derecha de la ventana Chatgpt. Lo uso más comúnmente cuando necesito respuestas rápidas a las preguntas. Un ejemplo sería “Tengo una celda en Excel que tiene lo siguiente: 24p: 123452: V1. Suponiendo que este valor esté en A1, dame una fórmula que obtendrá solo el valor entre los 2 colons”. ChatGPT respondería con la fórmula relevante. No necesito mantener esto en la historia principal.
Seleccione un modelo de chatgpt específico
ChatGPT tiene múltiples modelos, y puede haber momentos en los que quiero usar uno sobre los demás. ChatGPT generalmente elige el modelo que es mejor para el aviso que se solicita, pero puedo seleccionar un modelo específico haciendo clic en el nombre del modelo en la esquina superior izquierda de la ventana ChatGPT. Esto desplegará un menú para mostrar las opciones. Aquí está la lista de modelos que creo que son más relevantes y para lo que los uso:
- GPT-4O: Uso esto para muchas tareas simples o preguntas simples. Por ejemplo, “Haré una presentación sobre ChatGPT a los contadores en una conferencia. Dame algunos títulos de muestra”.
- GPT-4.5: Esto es para una investigación compleja. Lo uso si quiero que ChatGPT se sumerja en los detalles. El modelo puede regresar con una respuesta muy grande y entrar en los matices de los temas.
- O3-Mini-High: uso la mayoría de mis indicaciones aquí. Este modelo es bueno para la lógica y la elaboración de datos.
Vea una lista de modelos ChatGPT en la captura de pantalla a continuación.

Cambie su perspectiva de chatgpt con lienzo
Canvas es una característica que le permite a ChatGPT y a mí colaborar en una tarea de manera más eficiente. Antes de Canvas, cuando pidió ayudar a escribir una carta, ChatGPT reimprimiría toda la carta nuevamente cada vez que solicitaba un ajuste. En el lienzo, muestra el indicador de la izquierda y la letra a la derecha. Puedo escribir en la carta, y puedo pedirle a ChatGPT que haga ajustes en la carta también. Veamos un ejemplo.
Para iniciar un lienzo, haga clic en los puntos y seleccione “lienzo”, como se muestra a continuación.

En mi ejemplo, ingreso el mensaje: “Necesito ayuda para escribir una carta al cliente. Han tenido su declaración de impuestos durante 3 semanas y quiero recordarles que firmen”. ChatGPT responde cambiando el diseño a la vista de lado a lado que se muestra en la página siguiente. Luego agrego información adicional al indicador para pedir que se cambie la letra.
Una vez que esté satisfecho con la carta, puedo copiarla y pegarla en un correo electrónico para enviar o en mi sistema de correo electrónico de explosión.

Espero que estos consejos lo ayuden a llevar su uso de chatgpt al siguiente nivel.
Wesley Hartman es el fundador de Automata Practice Development.
¿Tiene preguntas de tecnología para esta columna? O, después de leer una respuesta, ¿tiene una mejor solución? Enviarlos a jofatech@aicpa.org.
Related posts
































































































































































































































































































































Trending
-
Startups1 año ago
Remove.bg: La Revolución en la Edición de Imágenes que Debes Conocer
-
Tutoriales1 año ago
Cómo Comenzar a Utilizar ChatGPT: Una Guía Completa para Principiantes
-
Startups11 meses ago
Startups de IA en EE.UU. que han recaudado más de $100M en 2024
-
Recursos1 año ago
Cómo Empezar con Popai.pro: Tu Espacio Personal de IA – Guía Completa, Instalación, Versiones y Precios
-
Startups1 año ago
Deepgram: Revolucionando el Reconocimiento de Voz con IA
-
Recursos1 año ago
Perplexity aplicado al Marketing Digital y Estrategias SEO
-
Estudiar IA1 año ago
Curso de Inteligencia Artificial de UC Berkeley estratégico para negocios
-
Eventos1 año ago
La nueva era de la inteligencia artificial por el Washington Post – Mayo 2024