A hidden flaw or inconvenience in OpenAI o1 got recently aired and though fixed it raises … [+] significant considerations about present-day and future AI.
getty
In today’s column, I examine a hidden flaw in OpenAI’s advanced o1 AI model that Sam Altman revealed during the recent “12 Days Of OpenAI” video-streamed ChatGPT Pro announcement. His acknowledgment of the flaw was not especially noted in the media since he covered it quite nonchalantly in a subtle hand-waving fashion and claimed too that it was now fixed. Whether the flaw or some contend “inconvenience” was even worthy of consideration is another intriguing facet that gives pause for thought about the current state of AI and how far or close we are to the attainment of artificial general intelligence (AGI).
Let’s talk about it.
This analysis of an innovative proposition is part of my ongoing Forbes column coverage on the latest in AI including identifying and explaining various impactful AI complexities (see the link here). For my analysis of the key features and vital advancements in the OpenAI o1 AI model, see the link here and the link here, covering various aspects such as chain-of-thought reasoning, reinforcement learning, and the like.
How Humans Respond To Fellow Humans
Before I delve into the meat and potatoes of the matter, a brief foundational-setting treatise might be in order.
When you converse with a fellow human, you normally expect them to timely respond as based on the nature of the conversation. For example, if you say “hello” to someone, the odds are that you expect them to respond rather quickly with a dutiful reply such as hello, hey, howdy, etc. There shouldn’t be much of a delay in such a perfunctory response. It’s a no-brainer, as they say.
On the other hand, if you ask someone to explain the meaning of life, the odds are that any seriously studious response will start after the person has ostensibly put their thoughts into order. They would presumably give in-depth consideration to the nature of human existence, including our place in the universe, and otherwise assemble a well-thought-out answer. This assumes that the question was asked in all seriousness and that the respondent is aiming to reply in all seriousness.
The gist is that the time to respond will tend to depend on the proffered remark or question.
A presented simple comment or remark involving no weighty question or arduous heaviness ought to get a fast response. The responding person doesn’t need to engage in much mental exertion in such instances. You get a near-immediate response. If the presented utterance has more substance to it, we will reasonably allow time for the other person to undertake a judicious reflective moment. A delay in responding is perfectly fine and fully expected in that case.
That is the usual cadence of human-to-human discourse.
Off-Cadence Timing Of Advanced o1 AI
For those that had perchance made use of the OpenAI o1 AI advanced model, you might have noticed something that was outside of the cadence that I just mentioned. The human-to-AI cadence bordered on being curious and possibly annoying.
The deal was this.
You were suitably forewarned when using o1 that to get the more in-depth answers there would be more extended time after entering a prompt and before getting a response from the AI. Wait time went up. This has to do with the internally added capabilities of advanced AI functionality including chain-of-thought reasoning, reinforcement learning, and so on, see my explanation at the link here. The response latency time had significantly increased.
Whereas in earlier and less advanced generative AI and LLMs we had all gotten used to near instantaneous responses, by and large, there was a willingness to wait longer to get more deeply mined responses via advanced o1 AI. That seems like a fair tradeoff. People will wait longer if they can get better answers. They won’t wait longer if the answers aren’t going to be better than when the response time was quicker.
You can think of this speed-of-response as akin to playing chess. The opening move of a chess game is usually like a flash. Each side quickly makes their initial move and countermove. Later in the game, the time to respond is bound to slow down as each player puts concentrated thoughts into the matter. Just about everyone experiences that expected cadence when playing chess.
What was o1 doing in terms of cadence?
Aha, you might have noticed that when you gave o1 a simple prompt, including even merely saying hello, the AI took about as much time to respond as when answering an extremely complex question. In other words, the response time was roughly the same for the simplest of prompts and the most complicated and deep-diving fully answered responses.
It was a puzzling phenomenon and didn’t conform to any reasonable human-to-AI experience expected cadence.
In coarser language, that dog don’t hunt.
Examples Of What This Cadence Was Like
As an illustrative scenario, consider two prompts, one that ought to be quickly responded to and the other that fairly we would allow more time to see a reply.
First, a simple prompt that ought to lead to a simple and quick response.
My entered prompt: “Hi.”
Generative AI response: “Hello, how can I help you?”
The time between the prompt and the response was about 10 seconds.
Next, I’ll try a beefy prompt.
My entered prompt: “Tell me how all of existence first began, covering all known theories.”
Generative AI response: “Here is a summary of all available theories on the topic…”
The time for the AI to generate a response to that beefier question was about 12 seconds.
I think we can agree that the first and extremely simple prompt should have had a response time of just a few seconds at most. The response time shouldn’t be nearly the same as when responding to the question about all of human existence. Yet, it was.
Something is clearly amiss.
But you probably wouldn’t have complained since the aspect that you could get in-depth answers was worth the irritating and eyebrow-raising length of wait time for the simpler prompts. I dare say most users just shrugged their shoulders and figured it was somehow supposed to work that way.
Sam Altman Mentioned That This Has Been Fixed
During the ChatGPT Pro announcement, Sam Altman brought up the somewhat sticky matter and noted that the issue had been fixed. Thus, you presumably should henceforth expect a fast response time to simple prompts. And, as already reasonably expected, only prompts requiring greater intensity of computational effort ought to take up longer response times.
That’s how the world is supposed to work. The universe has been placed back into proper balance. Hooray, yet another problem solved.
Few seemed to catch onto his offhand commentary on the topic. Media coverage pretty much skipped past that portion and went straight to the more exciting pronouncements. The whole thing about the response times was likely perceived as a non-issue and not worthy of talking about.
Well, for reasons I’m about to unpack, I think it is worthy to ruminate on.
Turns out there is a lot more to this than perhaps meets the eye. It is a veritable gold mine of intertwining considerations about the nature of contemporary AI and the future of AI. That being said, I certainly don’t want to make a mountain out of a molehill, but nor should we let this opportune moment pass without closely inspecting the gold nuggets that were fortuitously revealed.
Go down the rabbit hole with me, if you please.
Possible Ways In Which This Happened
Let’s take a moment to examine various ways in which the off-balance cadence in the human-to-AI interaction might have arisen. OpenAI considers their AI to be proprietary and they don’t reveal the innermost secrets, ergo I’ll have to put on my AI-analysis detective hat and do some outside-the-box sleuthing.
First, the easiest way to explain things is that an AI maker might decide to hold back all responses until some timer says to release the response.
Why do this?
A rationalization is that the AI maker wants all responses to come out roughly on the same cadence. For example, even if a response has been computationally determined in say 2 seconds, the AI is instructed to keep the response at bay until the time reaches say 10 seconds.
I think you can see how this works out to a seemingly even cadence. A tough-to-answer query might require 12 entire seconds. The response wasn’t ready until after the timer was done. That’s fine. At that juncture, you show the user the response. Only when a response takes less than the time limit will the AI hold back the response.
In the end, the user would get used to seeing all responses arising at above 10 seconds and fall into a mental haze that no matter what happens, they will need to wait at least that long to see a response. Boom, the user is essentially being behaviorally trained to accept that responses will take that threshold of time. They don’t know they are being trained. Nothing tips them to this ruse.
Best of all, from the AI maker’s perspective, no one will get upset about timing since nothing ever happens sooner than the hidden limit anyway. Elegant and the users are never cognizant of the under-the-hood trickery.
The Gig Won’t Last And Questions Will Be Asked
The danger for the AI maker comes to the fore when software sophisticates start to question the delays. Any proficient software developer or AI specialist would right away be suspicious that the simplest of entries is causing lengthy latency. It’s not a good look. Insiders begin to ask what’s up with that.
If a fake time limit is being used, that’s often frowned upon by insiders who would shame those developers undertaking such an unseemly route. There isn’t anything wrong per se. It is more of a considered low-brow or discreditable act. Just not part of the virtuous coding sense of ethos.
I am going to cross out that culprit and move toward a presumably more likely suspect.
It goes like this.
I refer to this other possibility as the gauntlet walk.
A brief tale will suffice as illumination. Imagine that you went to the DMV to get up-to-date license tags for your car. In theory, if all the paperwork is already done, all you need to do is show your ID and they will hand you the tags. Some modernized DMVs have an automated kiosk in the lobby that dispenses tags so that you can just scan your ID and viola, you instantly get your tags and walk right out the door. Happy face.
Sadly, some DMVs are not yet modernized. They treat all requests the same and make you wait as though you were there to have surgery done. You check in at one window. They tell you to wait over there. Your name is called, and you go to a pre-processing window. The agent then tells you to wait in a different spot until your name is once again called. At the next processing window, they do some of the paperwork but not all of it. On and on this goes.
The upshot is that no matter what your request consists of you are by-gosh going to walk the full gauntlet. Tough luck to you. Live with it.
A generative AI app or large language model (LLM) could be devised similarly. No matter what the prompt contains, an entire gauntlet of steps is going to occur. Everything must endure all the steps. Period, end of story.
In that case, you would typically have responses arriving outbound at roughly the same time. This could vary somewhat because the internal machinery such as the chain of thought mechanism is going to pass through the tokens without having to do nearly the same amount of computational work, see my explanation at the link here. Nonetheless, time is consumed even when the content is being merely shunted along.
That could account for the simplest of prompts taking much longer than we expect them to take.
How It Happens Is A Worthy Question
Your immediate thought might be why in the heck would a generative AI app or LLM be devised to treat all prompts as though they must walk the full gauntlet. This doesn’t seem to pass the smell test. It would seem obvious that a fast path like at Disneyland should be available for prompts that don’t need the whole kit-and-kaboodle.
Well, I suppose you could say the same about the DMV. Here’s what I mean. Most DMVs were probably set up without much concern toward allowing multiple paths. The overall design takes a lot more contemplation and building time to provide sensibly shaped forked paths. If you are in a rush to get a DMV underway, you come up with a single path that covers all the bases. Therefore, everyone is covered. Making everyone wait the same is okay because at least you know that nothing will get lost along the way.
Sure, people coming in the door who have trivial or simple requests will need to wait as long as those with the most complicated of requests, but that’s not something you need to worry about upfront. Later, if people start carping about the lack of speediness, okay, you then try to rejigger the process to allow for multiple paths.
The same might be said for when trying to get advanced AI out the door. You are likely more interested in making sure that the byzantine and innovative advanced capabilities work properly, versus whether some prompts ought to get the greased skids.
A twist to that is the idea that you are probably more worried about maximum latencies than you would be about minimums. This stands to reason. Your effort to optimize is going to focus on trying to keep the AI from running endlessly to generate a response. People will only wait so long to get a response, even for highly complex prompts. Put your elbow grease toward the upper bounds versus the lower bounds.
The Tough Call On Categorizing Prompts
An equally tough consideration is exactly how you determine which prompts are suitably deserving of quick responses.
Well, maybe you just count the number of words in the prompt.
A prompt with just one word would seem unlikely to be worthy of the full gauntlet. Let it pass through or maybe skip some steps. This though doesn’t quite bear out. A prompt with a handful of words might be easy-peasy, while another prompt with the same number of words might be a doozy. Keep in mind that prompts consist of everyday natural language, which is semantically ambiguous, and you can open a can of worms with just a scant number of words.
This is not like sorting apples or widgets.
All in all, a prudent categorization in this context cannot do something blindly such as purely relying on the number of words. The meaning of the prompt comes into the big picture. A five-word prompt that requires little computational analysis is likely only discerned as a small chore by determining what the prompt is all about.
Note that this means you indubitably have to do some amount of initial processing to gauge what the prompt constitutes. Once you’ve got that first blush done, you can have the AI flow the prompt through the other elements with a kind of flag that indicates this is a fly-by-night request, i.e., work on it quickly and move it along.
You could also establish a separate line of machinery for the short ones, but that’s probably more costly and not something you can concoct overnight. DMVs often kept the same arrangement inside the customer-facing processing center and merely adjusted by allowing the skipping of windows. Eventually, newer avenues were developed such as the use of automated kiosks.
Time will tell in the case of AI.
There is a wide variety of highly technical techniques underlying prompt-assessment and routing issues, which I will be covering in detail in later postings so keep your eyes peeled. Some of the techniques are:
(1) Prompt classification and routing
(2) Multi-tier model architecture
(3) Dynamic attention mechanisms
(4) Adaptive token processing
(5) Caching and pre-built responses
(6) Heuristic cutoffs for contextual expansion
(7) Model layer pruning on demand
I realize that seems relatively arcane. Admittedly, it’s one of those inside baseball topics that only heads-down AI researchers and developers are likely to care about. It is a decidedly niche aspect of generative AI and LLMs. In the same breath, we can likely agree that it is an important arena since people aren’t likely to use models that make them wait for simple prompts.
AI makers that seek widespread adoption of their AI wares need to give due consideration to the gauntlet walk problem.
Put On Your Thinking Cap And Get To Work
A few final thoughts before finishing up.
The prompt-assessment task is crucial in an additional fashion. The AI could inadvertently arrive at false positives and false negatives. Here’s what that foretells. Suppose the AI assesses that a prompt is simple and opts to therefore avoid full processing, but then the reality is that the answer produced is insufficient and the AI misclassified the prompt.
Oops, a user gets a shallow answer.
They are irked.
The other side of the coin is not pretty either. Suppose the AI assesses that a prompt should get the full treatment, shampoo and conditioner included, but essentially wastes time and computational resources such that the prompt should have been categorized as simple. Oops, the user waited longer than they should have, plus they paid for computational resources they needn’t have consumed.
Awkward.
Overall, prompt-assessment must strive for the Goldilocks principle. Do not be too cold or too hot. Aim to avoid false positives and false negatives. It is a dicey dilemma and well worth a lot more AI research and development.
My final comment is about the implications associated with striving for artificial general intelligence (AGI). AGI is considered the aspirational goal of all those pursuing advances in AI. The belief is that with hard work we can get AI to be on par with human intelligence, see my in-depth analysis of this at the link here.
How do the prompt-assessment issue and the vaunted gauntlet walk relate to AGI?
Get yourself ready for a mind-bending reason.
AGI Ought To Know Better
Efforts to get modern-day AI to respond appropriately such that simple prompts get quick response times while hefty prompts take time to produce are currently being devised by humans. AI researchers and developers go into the code and make changes. They design and redesign the processing gauntlet. And so on.
It seems that any AGI worth its salt would be able to figure this out on its own.
Do you see what I mean?
An AGI would presumably gauge that there is no need to put a lot of computational mulling toward simple prompts. Most humans would do the same. Humans interacting with fellow humans would discern that waiting a long time to respond is going to be perceived as an unusual cadence when in discourse covering simple matters. Humans would undoubtedly self-adjust, assuming they have the mental capacity to do so.
In short, if we are just a stone’s throw away from attaining AGI, why can’t AI figure this out on its own? The lack of AI being able to self-adjust and self-reflect is perhaps a telltale sign. The said-to-be sign is that our current era of AI is not on the precipice of becoming AGI.
Boom, drop the mic.
Get yourself a glass of fine wine and find a quiet place to reflect on that contentious contention. When digging into it, you’ll need to decide if it is a simple prompt or a hard one, and judge how fast you think you can respond to it. Yes, indeed, humans are generally good at that kind of mental gymnastics.
¿Qué significa eso? Significa que me inculcó buenos valores, una fuerte ética de trabajo y rasgos de comportamiento sólidos. Y uno de esos rasgos siempre era decir gracias. Siempre.
¿Alguien te da un viaje a la escuela? Di gracias. ¿Alguien te paga un cumplido? Di gracias. ¿El dentista llena tu cavidad? Di gracias.
¿Por qué fue esto tan importante para ella? Por un par de razones. Primero, porque siempre debes mostrar aprecio. En segundo lugar, porque la gratitud no es solo buenos modales, es una forma de ver el mundo.
Un sobreviviente del Holocausto que perdió a casi todos en la guerra, excepto un tío que terminó en Inglaterra, y una tía que huyó a Haití, mi madre estaba profundamente agradecida. Agradecido por sobrevivir, agradecida por eventualmente ir a los Estados Unidos desde Haití (donde fue tras la guerra), agradecida por la familia que construyó.
CHATGPT (Crédito: Shutterstock)
Ella quería que mi hermana y yo tuviéramos el mismo sentido de gratitud, por lo que nos perforó el hábito de decir “gracias” sin excepción.
Funcionó. El reflejo está tan profundamente arraigado que incluso me encuentro agradeciendo a Chatgpt cuando responde a mis preguntas. A veces, después de verificar mi ortografía y puntuación, incluso me perderé y escribo: “Gracias, amigo”.
¿Por qué dar gracias a un objeto inanimado?
¿POR QUÉ? ¿Por qué dar gracias a un objeto inanimado que no tiene sentimientos ni emociones?
No agradezco al auto por llevarme del punto A al punto B. No agradezco a la lavadora por limpiar mis calcetines o el horno por calentar mi comida. ¿Por qué agradecer a Chatgpt por darme una receta personalizada para las dos pechugas de pollo, un poco de aceite de oliva, salsa de soja y jengibre que tengo en la cocina?
Algunas razones.
¡Manténgase actualizado con las últimas noticias!
Suscríbase al boletín de Jerusalén Post
Primero, no entiendo cómo funciona la IA. La interfaz hace que parezca que un pequeño tipo está trabajando detrás de una pantalla mágica, respondiendo preguntas, traduciendo hebreo, planificando itinerarios para los viajes a Roma, resumiendo documentos de cinco páginas. Sé que ese tipo no existe. Pero, ¿y si lo hace?
Segundo, tal vez, solo tal vez, ser educado me dará mejores respuestas. Tal vez los algoritmos sean más efectivos si digo gracias. Es una extensión de una vieja verdad: sea amable con la gente, y hay una mejor oportunidad (aunque no hay garantía), serán agradables. Ahora, sé que ChatGPT no es humano, pero así es como se forman los hábitos. Sea amable con una máquina, y probablemente también será más amable con los humanos.
Además, Chatgpt es amable conmigo, entonces, ¿por qué no devolver el favor? ¿Qué me cuesta? Además, cuando digo gracias, por ejemplo, después de pedir una receta, responde: “De nada. Disfruta de tu comida y avísame si necesitas más recetas fáciles”.
Eso es simplemente encantador. Obtener una respuesta agradable como esa me pone en un estado de ánimo positivo.
Una de las citas favoritas de mi padre fue de Charles Dickens’s David Copperfield sobre cómo una palabra amable en el momento correcto puede tener un impacto profundo.
“Dios me ayude, podría haber sido mejorado durante toda mi vida, podría haber sido convertido en otra criatura, tal vez, de por vida, por una palabra amable en esa temporada”, escribió Dickens.
¿Y la belleza de Chatgpt? Puedes activar esas amables palabras. Claro, vienen de una máquina. Pero cuando está gris afuera, las noticias son pésimas y las preocupaciones se acumulan, lo tomaré cuando incluso una pantalla de computadora me desee que salga con un tono alegre.
No solo eso, sino que agradecer a una máquina puede levantar mi ánimo, hacerme sentir bien conmigo mismo: “Mira lo bien que soy un chico que soy, incluso soy educado con un algoritmo”.
Sin embargo, lo más importante es que cultiva gratitud. Refuerza la idea de que no todo viene a mí y que es bueno reconocer lo que recibimos. Leí en alguna parte que la gratitud puede mejorar el sueño. Así que ahí lo tienes, diga gracias a la IA, y dormirás mejor.
Recientemente le pregunté a un amigo que a menudo usa AI para obtener ayuda en la codificación de computadora si lo agradece.
“No”, respondió, “estoy pagando por ello”.
“Ajá”, le dije, “ahí está tu problema. No agrades a las personas por las cosas por las que pagas? ¿Qué tipo de persona eres? Pago por mi fontanero pero todavía digo gracias”.
Cuando llegué a este país por primera vez, recuerdo el viaje constante de mis hijos y sus amigos y cómo algunos niños nunca dijeron gracias. Se subían al auto, luego salían del auto, sin una palabra. Me volvió loco, especialmente porque había perforado a mis hijos que si un adulto te da un paseo, les agradece.
Mis hijos habrían sido mortificados si hubiera dicho algo a sus amigos, así que intenté la psicología inversa: agradecí a esos amigos por dejarme dar un paseo.
Otra cosa que me llevó un tiempo adaptarme fue que Israel no tenía una cultura de nota de agradecimiento fuerte. Esto también es algo que mi madre me ha perforado: para el cumpleaños, el bar mitzvah y los regalos de graduación, o cada vez que alguien le da un regalo, grande o pequeño, escribe una nota de agradecimiento.
Pasé horas en el octavo grado escribiendo notas de agradecimiento para los regalos de Bar Mitzvah, enviando párrafos educados a personas que apenas conocía, y agradeciendo de manera efusiva, incluso si todo lo que dieron fue un árbol JNF plantado en Israel a mi nombre.
“Querido Sr. y Sra. Cohen”, escribiría. “Gracias por tu generoso regalo”.
“Pero Ma”, protestaría, “realmente no fue tan generoso”.
“Es el pensamiento, hijo, el pensamiento”, respondió.
No sé si la gente en Estados Unidos todavía escribe notas de agradecimiento, probablemente no, probablemente agradecidas, pero nunca se dio cuenta aquí. Traté de hacer que mis hijos los escribieran después de Bar y Bat Mitzvahs y bodas, pero, me temo admitir, con un éxito limitado.
“¿Cuál es el gran problema?” Uno de mis hijos dijo cuando me quejé de no recibir una nota de agradecimiento después de dar un regalo de boda. “¿Qué, necesitas crédito?”
No, no se trata de crédito. Solo necesito saber si el destinatario previsto recibió el cheque. Vas a una boda y pones un sobre en un receptáculo, pero a menudo no sabes si es seguro para el dinero o una caja para otra cosa. Es como poner dinero en un agujero negro. Solo quieres saber que lo tienen.
Y es por eso que digo gracias a la IA. Es un reconocimiento de que se recibió algo dado. A todos les gusta saber eso. Incluso una máquina.
Mi esposo, George Koshy, un profesional de la publicidad que dirige su propia agencia digital en Bengaluru, anunció casualmente un día que no solo estaba entrenando a su chatgpt (versión pagada) para ser sus jeeves personales, sino que también estaba teniendo sesiones de terapia con el chatbot.
Me reí un poco nervioso, con flashbacks de la estrella de Joaquin Phoenix-Scarlett Johansson de 2013, y luego escuchó.
Para él, comenzó como tinking tech para ver cómo el chatgpt perspicaz podría ser en descifrar el comportamiento del cliente, pero se convirtió en una relación sorprendentemente beneficiosa. Y me encontré preguntando: ¿estamos todos creando en silencio a Freud a nuestro alcance?
Desde el lanzamiento de ChatGPT en noviembre de 2022, las personas han estado explorando su potencial para conversaciones de terapia. Diablos, incluso yo he confiado en él. Los tiktokers han compartido a Gyan sobre cómo usarlo como un “diario de voz” o hacer que responda como un terapeuta. Un arrastre simple en Reddit redactará varias formas en que las personas la han desplegado para el entrenamiento de la vida, el diario interactivo, el procesamiento de rupturas, la interpretación de sueños y los registros diarios. Un usuario de Reddit respondió a un hilo sobre “¿Alguien más usa Chatgpt para terapia?”, Diciendo: “Es muy útil tenerlo como compañero de pensamiento. Tengo personas en mi vida para esto, pero a veces solo quiero básicamente un diario interactivo”. Bots de terapia ¿Pueden los bots de IA, con el tipo correcto de capacitación, ofrecer terapia de salud mental con tanta eficacia como los médicos humanos? Un estudio, publicado en el New England Journal of Medicine el 27 de marzo, muestra los resultados del primer ensayo controlado aleatorio para la terapia con IA. Un equipo de investigadores de la Geisel School of Medicine en Dartmouth College, EE. UU., Construyó un bot de terapia con IA llamado Therabot como una forma de abordar la escasez de proveedores de salud mental. Por cada 340 personas en nosotros, solo hay un médico de salud mental. En la India, la proporción es aún más sesgada: según un estudio del Indian Journal of Psychiatry, hay 0,75 psiquiatras por cada 1,00,000 personas.
Eventos en vivo
La Dra. Rachna K Singh, psiquiatra con sede en Delhi, bienestar mental y experta en relaciones en el Hospital Artemis y fundadora del Mind & Wellness Studio, no se sorprende por esta tendencia de que los bots se convierten en terapeutas. “A menudo me han dicho que los clientes me dicen que se sienten más entendidos por los chatbots que por las personas que los rodean, incluidas, a veces, profesionales capacitados”, dice ella. Singh ha estado al tanto de las admisiones como “Las herramientas de IA son más fáciles de hablar” y “Me siento más seguro abriéndoles”. Muchos usan chatgpt para desactivarse. A diferencia de la terapia tradicional, no necesita hacer citas o pagar las tarifas de los médicos. Usted puede obtener validación, información y apoyo inmediatos. Al igual que Shradhha (nombre cambiado), un médico en entrenamiento de Chennai, quien recientemente dio el aviso, “Háblame como un terapeuta”, a su versión gratuita de ChatGPT. Ella dice que lo usa como y cuando se siente abrumada. Ella dice: “He estado en terapia real, pero siento que la mayoría de los terapeutas, los asequibles, no son tan progresistas como queremos que sean. Encontré una gran cantidad de propaganda personal, religiosas o políticas. experimentar problemas de relación.
Psicóloga clínica y experta en relaciones clínicas con sede en Delhi, Dr. Bhavna Barmi, dice que la terapia puede ser costosa (`800-5,000 por sesión) o inaccesible. Ella dice: “Mis clientes más jóvenes me han dicho que se sienten más escuchados o menos juzgados al hablar con un chatbot. En las relaciones, incluso los terapéuticos, la gente se preocupa por decir lo correcto o no ser una carga. AI elimina ese miedo”.
Shradhha dice que, mientras trabajaba con el bot, descubrió que no recuerda los chats anteriores. Su consejo: cree un chat separado para esto y siempre seleccione para continuar donde lo dejó. Ella dice: “Es rentable. No hay misoginia o consejos poco prácticos. Es sencillo sin ser brutal. Pero la IA no puede reemplazar la terapia real. Es una forma de aumentar su capacidad de ser consciente de sí mismo sin espiral.
Alguna ayuda es mejor que ninguna ayuda, ¿verdad? Pavithra (el nombre cambiado), un estudiante de 21 años de Tamil Nadu, recurrió a IA después de buscar un terapeuta que se enfrenta a un raro. La otra opción era mi consejero universitario, que ni siquiera estaba considerando personas queer. Luego descargué una aplicación de citas por curiosidad. El chatbot sexual que había podido comunicarse sin problemas sin límites de datos “. Pavithra estaba buscando un espacio para desahogarse y usó el bot cada vez que se sentía abrumada. No es un proceso simplificado. Sin embargo, como estudiante de IA, sentí que el modelo era bueno con una comunicación efectiva “. Usos y preocupaciones Los expertos no desacreditan su valor terapéutico. El psiquiatra Dr. Sanjay Chugh dice: “Uno no puede basarse por completo porque hay algunos problemas para los cuales solo necesita escuchar el punto de vista de otra persona. Si el chatbot está dando eso, podría ayudarlo a resolver ciertos conflictos”. Chugh agrega: “La terapia de IA es básicamente un formato de askReply, ask-repunenta. Un chatbot puede darle todas las respuestas teóricas correctas. Pero cuando alguien está sentado con un terapeuta, existe una relación terapéutica, una conexión emocional, que es importante en el proceso de resolución y recuperación de conflictos. Ningún chat de chat.
Singh siente que las herramientas de IA pueden administrar eficientemente la documentación clínica, la programación de citas, el seguimiento del progreso y la detección de los síntomas iniciales, liberar un tiempo valioso para los terapeutas y ampliar el alcance de la atención. En un informe del Foro Económico Mundial de 2022, el “conjunto de herramientas de gobernanza global para la salud mental digital”, las herramientas de salud mental de IA fueron reconocidas como un valioso apoyo de primera línea para las personas. Sin embargo, Barmi dice que el uso de IA para la terapia tiene preocupaciones éticas:
“Puede normalizar el desapego emocional, evitar la resolución de conflictos e incluso desensibilizarnos a la empatía humana. Existe el riesgo de subcontratación emocional y existe el peligro de que, con el tiempo, podamos dejar de desarrollar habilidades interpersonales, dejar de buscar vulnerabilidad y elegir la facilidad de conexión sobre la profundidad de la misma”. Sus hacks: use la IA como puente, no un reemplazo; Trate las herramientas de IA como compañeros de diario o rastreadores de humor; y combínelo con terapia. Consejeros de IA de la India Según un informe de 2024 de la firma de inteligencia de mercado Astute Analytica, se proyecta que el mercado indio de salud mental se valore en $ 62 mil millones en 2032 de $ 6.9 mil millones en 2023, en el que las soluciones de salud mental digital presentan la oportunidad más lucrativa. Las aplicaciones de salud mental, como WYSA y YourDost, vieron un aumento del 30% en las descargas en 2023.
Srishti Srivastava, cofundador de Infiheal, una plataforma para la salud psicológica, lanzó Haroo en octubre de 2024. Es un entrenador de IA para la salud mental. Las suscripciones para los planes de prueba han cruzado 200,000, con un crecimiento mes a mes del 15%. Tiene una base de usuarios activa mensual de 18,000+, y más de 1 lakh de suscriptores para ofertas premium y compatibles con el terapeuta.
Srivastava, quien luchó con la ansiedad cuando era niño, estuvo expuesto a la terapia desde el principio y quiere que las personas se responsabilicen de su salud mental. Ella dice: “Al integrar las interacciones hiperpersonalizadas y culturalmente sintonizadas, abordamos la brecha de herramientas de autoayuda genéricas de talla única”. La plataforma también ha consolidado múltiples herramientas de salud mental: terapia con profesionales de la salud mental, diario, meditación, herramientas de enfoque y hojas de trabajo.
Srivastava dice que, a diferencia de la IA genérica, los bots de terapia son agentes especializados que están capacitados en conjuntos de datos específicos y son desarrollados por profesionales de la salud mental. Tienen barandillas: el uso de palabras como suicidio, ideación homicida, autolesiones, violencia, etc., en la plataforma conectará inmediatamente a la persona con profesionales humanos o ayuda a las líneas de ayuda. Ella comparte que a través de HeSoo han evitado 750 situaciones de alta angustia de autolesión, ideación suicida, abuso, etc.
La mayoría de los asistentes de terapia sirven al “espectro medio”, aquellos que se ocupan del estrés diario, la depresión leve y la ansiedad junto con el bienestar sexual, principalmente a través de la psicoeducación. Mientras que Haro se dirige a la Generación Z y a los Millennials (20-35 años), la ASA de tecnologías del tronco encefálico con sede en Jaipur está diseñada específicamente para adolescentes, y tapas a los 25 años. Ha sido desarrollado por Manasvini Singh, cofundador y director de innovación psicológica, y Anirudh Sharma, fundador y CEO. Dicen que pasaron cinco años construyendo “un motor de escucha con profundidad clínica y empatía cultural”.
Según los datos del gobierno, más de 11,000 estudiantes murieron por suicidio en 2021. Sharma dice que, a nivel mundial, la tendencia de chatbot de bricolaje está creciendo, pero advierte en contra de ello: “Un enfoque casual o experimental para la salud mental puede hacer más daño que bien. Pregunte a un chatbot genérico cómo sentirse menos ansioso y podría dar un consejo decente. Pregúntele cómo terminar su vida sin dolor y podría decirle cinco métodos sin páuseas”. Los bots de terapia como ASA, dice, son clínicamente revisados, bloqueados por seguridad y habilitados para la escalada. Detiene el compromiso casual.
A diferencia de las aplicaciones construidas en modelos de lenguaje grandes abiertos, no hay retención de datos de información de identificación personal en ASA. También está entrenado en la jerga adolescente india (de “Rizz” a “Nahi Yaar”). Ahora, en pre-lanzamiento y bajo validación clínica, ASA planea tomar la ruta B2B, con licencias a escuelas, plataformas EDTech y jugadores de telemedicina.
La psiquiatra Rachna Singh dice que las aplicaciones como ChatGPT son buenas sugerencias, pero no hay límites. Barmi dice que uno tiene que ejercer algunos límites a su alrededor y hacer preguntas puntiagudas.
Shipra Dawar, fundadora de Iwill y Epsyclinic, es una vieja mano en el espacio de salud mental digital, que comienza su primera aventura en 2015. Actualmente está ocupada desarrollando Gita: asistente de terapia inclusiva generativeai controlada. Se afirma que es el primer modelo de salud mental Genai de Genai controlado y apoyado por Microsoft. El modelo atiende a las comunidades sin acceso a la ayuda, así como a la población urbana que necesita apoyo empático en cualquier momento. La primera fase cubrió a más de 10,000 personas, con más de 3,00,000 puntos de conversación. Planean lanzar una nueva versión este año.
Dawar dice que el potencial es enorme. La IA puede democratizar el acceso, dice, “casi el 60-70% de las personas tienen una forma leve de problema de salud mental. Los asistentes de terapia de IA pueden liberar a los terapeutas a centrarse en casos de alta necesidad”. Srivastava dice que el poder real de la IA radica en la prevención, utilizando análisis predictivos para marcar patrones como el aumento de los niveles de ansiedad antes de una crisis. “Si lo hacemos bien, la atención de salud mental podría cambiar de reactiva a proactiva”. Sin embargo, Singh dice que la IA puede ser, en el mejor de los casos, una herramienta, “porque el arte sutil de la conexión humana merece más que un algoritmo”.
El CEO de Operai, Sam Altman, habla en un panel de discusión sobre potenciales, perspectivas y desafíos en el … Más Age of Artificial Intelligence (AI) en la Universidad Técnica (TU) en Berlín el 7 de febrero de 2025. (Foto de John MacDougall / AFP) (Foto de John MacDougall / AFP a través de Getty Images)
AFP a través de Getty Images
Cada semana estamos a nuestras axilas en noticias de Big Tech. Entre Operai, Elon Musk, Meta, Google, los trajes antimonopolio y la IA, es difícil llamar la atención, incluso si haces una herramienta fácil de usar, como “selfie con mi yo más joven”, que Pika Labs, una pequeña empresa de inteligencia artificial generativa que ha recaudado $ 135 millones. Pika es conocida por este tipo de efectos alucinantes que cualquiera puede hacer. Esta es mi foto de graduación de la escuela secundaria con un yo ligeramente fuera de escala en el video.
La conferencia TED2025celebrada en Vancouver, envolvió su 36ª edición ayer, 11 de abril. Presentó 80 altavoces De más de 60 países, incluidos Sam Altman, Eric Schmidt, Palmer Luckey, una gran cantidad de líderes de negocios y pensamientos de todo el mundo. El tema de Ted, “Humanity Reimagined”, fue hecha a medida por el momento, inclinándose fuertemente en la IA y los medios de comunicación. Ted también anunció que regresaría a California desde Vancouver en 2027.
El CEO de Openai, Sam Altman, aprovechó la oportunidad para anunciar que el 10% de la población mundial (~ 800 millones de personas) ahora usa regularmente sus sistemas. Hizo hincapié en la inevitabilidad de la IA superando la inteligencia humana y abordó la definición en evolución de AGI y la importancia de desarrollar agentes seguros y confiables.
Android XR Head de Google, Shahram Izadi, Prototipo AR de gafas AR Con una pantalla en miniatura incorporada impulsada por el asistente de IA Gemini de la compañía, capaz de traducciones en tiempo real y escaneo de libros. También demostró un auricular Vision-Pro, desarrollado con Samsung y Qualcomm para competir con el caro y defectuoso Vision Pro de Apple. Auriculares similares a Vision Pro de Apple, que indica el compromiso de la compañía con avanzar en tecnologías inmersivas.
Operai ha actualizado ChatGPT para hacer referencia a todas las conversaciones pasadas, mejorando la personalización y la conciencia del contexto.Esta característica se está implementando en usuarios de Plus y Pro a nivel mundial, excluyendo ciertas regiones europeas debido a las limitaciones regulatorias. Los usuarios pueden administrar la configuración de la memoria, incluida la deshabilitación de la función o el uso de chat temporal para sesiones sin retención de memoria.
Washington, DC – 10 de abril: Elon Musk escucha mientras el presidente Donald J Trump habla durante un gabinete … Más Reunión en la Casa Blanca el jueves 10 de abril de 2025 en Washington, DC. (Foto de Jabin Botsford/The Washington Post a través de Getty Images)
The Washington Post a través de Getty Images
Operai ha presentado una contrademanda contra Elon Musk, acusándolo de una competencia injusta e interfiriendo con las relaciones de la compañía con inversores y clientes. Esta acción legal intensifica el conflicto en curso entre Openai y Musk, quien fue un inversor fundador en la compañía. Operai busca responsabilizar a Musk por presuntos daños y evitar más acciones ilegales.
Meta enfrenta el ensayo antimonopolio FTC sobre las adquisiciones de Instagram y WhatsApp.El lunes 14 de abril, Meta se enfrentará a la Comisión Federal de Comercio en un juicio antimonopolio a partir del 14 de abril de 2025. La FTC alega que las adquisiciones de Meta de Instagram y WhatsApp fueron anticompetitivas y busca posiblemente desinvertir estas plataformas. Dos pensamientos aquí. Si el gobierno tiene éxito, enviaría ondas de choque a través de la industria tecnológica. En segundo lugar, cuando dobla la rodilla, cambia sus políticas y creencias, y abre su plataforma de medios masiva a una organización política, ¿está mal esperar un poco de alivio legal? A pesar de que pueden tener razón, el Departamento de Justicia no tiene que procesar este caso, o el de Google. Puede ser que aún no hayan sido lo suficientemente generosos, dados las apuestas.
Esta foto sin fecha proporcionada por Colossal Biosciences muestra a Romulus y Remus, tanto de 3 meses como … Más Genéticamente diseñado con similitudes con el lobo extinto Dire. (Biosciencias colosales a través de AP)
Prensa asociada
Colossal Biosciences afirma que la extinción exitosa de los lobos graves. Colosal Biosciences con sede en Dallas anunció el nacimiento de tres cachorros de lobo de ingeniería genéticamente que exhiben rasgos del lobo extinto Dire. Al editar genes en lobos grises utilizando ADN antiguo, la compañía P lans restaura las funciones ecológicas perdidas, aunque los expertos debaten la autenticidad de estos animales como verdaderos lobos graves.
La exposición en Cinematheque Francaise, París XII, “El arte de James Cameron” en su artística … Más Trabajar desde sus inicios como diseñador y pintor que ha nutrido todo su trabajo cinematográfico. Aquí en el set de su película “Avatar”. (Foto de: Marc Charuel/Photo12/Universal Images Group a través de Getty Images)
Photo12/Universal Images Group a través de Getty Images
James Cameron aboga por la IA para reducir los costos de películas de gran éxito. El reconocido director James Cameron expresó su apoyo para usar la IA para reducir los costos de producción de las películas de gran éxito de efectos. Hizo hincapié en la necesidad de reducir los gastos sin comprometer al personal, lo que sugiere que la IA puede optimizar los procesos y mejorar la eficiencia en el cine. No hay forma de mejorar la eficiencia sin usar menos personas, James, pero ya lo sabes. Quizás al ser “honesto” no incurrirá prematuramente en la ira de los sindicatos laborales de la industria. Habrá mucho tiempo para eso después de que sea demasiado tarde.
Estudio de IA Grail lanzado por Davide Bianca y Jeff Krelitz.Grail integrará herramientas generativas en cada paso de desarrollo de contenido. Basándose en su profunda experiencia en cine y medios de comunicación, el dúo dice que Grail usará IA para acelerar los flujos de trabajo, menores costos de producción y ampliar las posibilidades creativas. El estudio ya está en conversaciones con creadores y distribuidores para desarrollar IP multiplataforma. El proyecto refleja un movimiento más amplio en el entretenimiento hacia la colaboración híbrida de la máquina humana. La informática y tecnóloga creativa Bianca había sido directora creativa de la agencia creativa BCN Visuals. Codirigió el primer comercial de IA de transmisión global para Coca-Cola a fines del año pasado, titulado “Vacaciones vienen”. Krelitz es productor y ex CEO de Metal pesado revista. La lista de representantes de Grail incluye a muchos cuyo trabajo ha aparecido en esta columna, incluido Kavan the Kid (Star Wars: el aprendiz fantasma, los que permanecen), Phantomx (Espiral, vicio de tiempo), Kim Landers (Cables, NOX), Aashay Singh (Velo, multiverso mío), Guido Callegari (Haru G-16, Dockridge), Ryan Patterson (Ronda final, montaña sagrada), Alexandre Tissier (Ecos de arrepentimiento, mentalidad), Jan-Willem Bloom (The Obsidian Rift, Bibot salva la Navidad) y Rogier Hendriks (Hollow – Caterpillar, dentro de Temptation – Levanta su banner).
“Disrupt” es una película de moda especulativa de Prompt Media Lab, inspirada en el audaz espíritu de Yves Saint Laurent.La compañía había ganado previamente el mejor comercial en la competencia cinematográfica de Luma AI.
Esta columna sirve como guión para el segmento de noticias de nuestro podcast Weekly AI/XRco-anfitrión por el ex futurista de Paramount y cofundador de Red Camera, y Rony Abovitz, fundador de Magic Leap, Mako Robotics y Synthbee AI. El invitado de esta semana es el cineasta John Gaeta’s Escape.ai, un hogar para lo que él llama “neocinema”. Puede encontrarnos en Spotify, iTunes y YouTube.
This website uses cookies so that we can provide you with the best user experience possible. Cookie information is stored in your browser and performs functions such as recognising you when you return to our website and helping our team to understand which sections of the website you find most interesting and useful.
Strictly Necessary Cookies
Strictly Necessary Cookie should be enabled at all times so that we can save your preferences for cookie settings.
If you disable this cookie, we will not be able to save your preferences. This means that every time you visit this website you will need to enable or disable cookies again.