Noticias
Next Step Forward In Human-AI Collaboration Showcased Via OpenAI’s ChatGPT Canvas Add-In
Published
5 meses agoon

Upping the ante on human-AI collaboration is happening right now as evidenced by latest OpenAI … [+] ChatGPT add-in named Canvas.
getty
In today’s column, I examine the latest advancements in human-AI collaboration and explain how these amazing capabilities will materially impact your everyday use of generative AI and large language models (LLMs). To illustrate these advancements, I highlight the newly widely released OpenAI ChatGPT specialized add-in known as Canvas which has garnered a great deal of media attention, deservedly so.
A key takeaway is that if you haven’t heard about, seen, or used these innovative AI-based collaboration tools, you are in for quite a surprise. In some mind-bending respects, this might cause you to rethink your use of AI and gain a fresh perspective on what generative AI can achieve.
The bottom line is that it isn’t about what AI can do for you, but what you and AI can do together.
Let’s talk about it.
This analysis of an innovative AI breakthrough is part of my ongoing Forbes column coverage on the latest in AI including identifying and explaining various impactful AI complexities (see the link here). For my coverage of the top-of-the-line ChatGPT o1 model and its advanced functionality, see the link here and the link here.
The Grand Act Of Collaboration
I’d like to start with the nature of human-to-human collaboration, after which we’ll shift to human-AI facets entailing collaboration.
When you collaborate with a fellow human, the overall notion is that you intend to work together to accomplish some kind of task or endeavor. For example, suppose you’ve drafted a memo at work and a co-worker has offered to review the draft with you. They are a handy second pair of eyes. The co-worker might spot some portions of your memo that could use rewording. Maybe the co-worker will identify missing content that ought to be added. Etc.
One means to collaborate on the review of the memo would be to go back and forth via email such that you email a first draft to them, the co-worker edits it and returns the revised draft to you, and so on. This series of cycles via email is bound to be somewhat sluggish and not the easiest or preferred way to do things. In a sense, it is very hard to have a proverbial “meeting of the minds” when you are emailing successive drafts to each other.
You’ve undoubtedly undertaken that kind of awkward and frustrating activity and realized by the school of hard knocks that it isn’t especially streamlined.
Sad face.
There Is A Better Way To Collaborate
What would be a better form of collaboration?
Ideally, you’d like to do the review in real-time and allow each of you to immediately showcase on a referent draft the precise changes or issues you have with the writing. There would be one document that both of you have direct access to. Either one of you can highlight or point out passages that might require modification. Changes can be made quickly and visually evident to each of you. All eyes are seeing the same thing.
Voila, your collaboration becomes a true semblance of collaboration.
There are three main factors about this:
- (1) Communication. You want to make communication as frictionless as possible and as immediate as possible.
- (2) Coordination. You want to ensure that coordination during the process is smooth and aids the effort rather than getting in the way of things.
- (3) Task. You want to keep the task that is at hand as evident or at front and center as feasible to ensure that both of you are seeing the same things at the same time.
Happy face.
Conventional Generative AI And Collaboration
Shifting gears, let’s dive into the kind of human-AI collaboration that you experience in conventional generative AI. You will see in a moment how the above precepts come into play in an AI context. Hang in there.
Here’s a dialogue that you might typically have with any of the major generative AI apps.
- My entered prompt: “Here is a memo that I’ve drafted, and I want you to carefully read it. I aim to get your feedback and possibly have you suggest or even make changes to the draft. We are to do this together. Don’t just summarily make changes. I want this to be collaborative.”
- Generative AI response: “I understand. I’ve reviewed the draft. The second line in the first paragraph is rough to read and I recommend it be improved. In the third paragraph, the last several lines do not seem to fit with the topic at hand. Are you sure that those lines belong in the memo?”
- My entered prompt: “I’m looking at the second line of the first paragraph and I think it reads really well. What about that line bothers you? In terms of my third paragraph, those several lines that you are criticizing are completely sensible to me, and if you look at the fifth paragraph of the memo, I think it will be sensible to you too. Please take that into account.”
That’s a rather common interaction when conversing with generative AI on a matter such as figuring out some possible edits for a drafted piece of content.
I have a question for you about the above dialogue.
Does the dialogue seem particularly conducive to acting collaboratively?
On the one hand, you could say that the generative AI is doing a useful job of offering insights into the draft. However, the person interacting with the AI must go back and forth about which line and which wording is at issue. Trying to proceed in this way is arduous and likely exasperating.
There must be a better way to accomplish this.
Newer Form Of Human-AI Collaboration
Suppose that we redid the interface that is involved in this human-AI collaboration.
Rather than a Q&A dialogue that is a sequence of back-and-forth iterations about something that is out of view, let’s open a second view or window that sits adjacent to the prevailing interaction. This second view will showcase the drafted memo. Thus, the person can see the draft and the AI can highlight which lines and which words are being discussed.
Furthermore, the view of the draft can be highlighted by the human, doing so to emphasize to the AI what portions the person wants the generative AI to focus on. Nice.
Let’s up the ante and allow the human and the AI to make changes directly on the draft memo. Either one can do so, freely, immediately, and with the attention of the other. The draft at this juncture is being displayed in the second view and persistently stays there as the dialogue between the human and the AI takes place.
Changes are immediately displayed. If the human makes a change, it is apparent what change was made because it is directly in the text, rather than cumbersomely describing the change that the user was thinking of making. Likewise, the AI can make a change in the draft, visually so, and the user sees exactly what change the AI was mentioning.
I hope that you can sufficiently envision what this new setup for human-AI collaboration looks like.
The premise is that whatever body of text that you and the AI are conversing about can be displayed in a second view, during which it is actively available for changes by either party. No longer do you need to waste time and effort trying to convey to the generative AI what you want to change, nor does the AI need to indirectly describe what the AI suggests being changed.
It is one editable view that is commonly shared by both.
Boom, drop the mic.
When Human-AI Collaborations Improves At Scale
I realize that the idea of having a shared editable view for human-AI interaction seems at an initial consideration to be an obvious addition for generative AI. Some cynics are bound to exhort that this isn’t worth much of a hullabaloo.
Well, first of all, haters are going to hate. Secondly, yes, the approach of having a shared editable view is something that has been worked on in AI labs, but there hasn’t been that big of a commercial widespread availability of this kind of structure. Doing this at scale is a game changer.
When I say at scale, imagine that millions upon millions of people might end up using this type of human-AI interface.
How so?
OpenAI has now made available on a widespread basis their relatively new add-in known as Canvas and it works seamlessly with the widely and wildly popular ChatGPT. There are reportedly over 300 million weekly active users of ChatGPT. At this juncture, they will soon have or might already have Canvas available to them due to this expanded release (note that Canvas was available on a limited or beta basis for the last few months).
Canvas provides the second-view capability that I’ve been describing.
It Is Here And Now And In The Future Too
Your dialogue with ChatGPT sits to the left and the second view sits to the right.
The dialogue proceeds and meanwhile, the second view is jointly able to be explored and edited. Can you visualize in your mind’s eye what this looks like? I realize this might be hard to envisage in your head. Consider visiting the official OpenAI web page that shows how Canvas works or search on any reputable social media site for videos posted by people who have been making use of Canvas.
An interesting question is how many people will opt to use Canvas.
Some users of ChatGPT might not grasp what Canvas is or can do, therefore they won’t invoke it. Others might know that Canvas is there, but for various reasons don’t want to lean into it. This is one of those new pieces of functionality that will likely take time for people to get accustomed to using.
My prediction is that eventually, the use of a second-view approach will be commonplace for most generative AI apps. Users will expect it. Rather than the feature being a novelty, it will be a must-have piece of functionality. Indeed, other AI makers already have such capabilities in the works and like anything else in this highly competitive AI marketplace, every AI vendor will have to stay at the leading edge or fade into oblivion.
Expect too that variations and advancements in this type of capability are going to rapidly emerge. What kinds of amplifications? If two views are good, maybe allowing for three views is even better. Perhaps four views, five views, or as many as you like (some number of n-views). There will be a Darwinian process of variations proffered, some of which people will actively relish, and others that they won’t, ultimately winnowing to what people, by and large, want to have available.
Intriguing Questions Of Sensibility
There are fascinating behavioral ramifications. Allow me a moment to examine some aspects that maybe don’t immediately come to mind on this capability. Get ready to think outside the box.
Who should initiate the use of a shared editable view?
Your first thought might be that of course the human decides whether to engage the capability. Humans are supposed to be in charge of AI. Period, end of story.
Hold on for a moment.
Suppose a person using generative AI doesn’t perchance realize they could benefit by using a second-view collaborative feature. Maybe the idea of doing so doesn’t pop into their head. Or perhaps they are unfamiliar with the feature and don’t realize how it can help.
We might allow the generative AI to automatically initiate the second view. It goes like this. A user is carrying on a normal dialogue with AI. At some point, the person indicates they need to write a quick message to tell someone that foul weather is expected in their area. Based on that comment, the generative AI could discern that the user intends to write a message, which is a suitable circumstance for invoking the second-view capability.
Voila, the AI does so.
In the case of OpenAI’s Canvas, the AI researchers wrestled with this kind of automatic invoking of the capability. They have established their AI to do so but realize that users might get irked. How so? If the invoking happens too much, a user might become steamed and feel like the AI is overplaying its hand. A gentle touch is needed for the AI to discern how often to take such actions. This is one of those parameter-setting aspects.
Another Sensibility Puzzler
Here’s another puzzler.
Suppose the generative AI examines a draft that is jointly being worked on with a user and computationally determines that the draft needs an utter overhaul. The draft as it sits currently is a mess and contains fragmented sentences, misspells, and otherwise is a piece of writing travesty.
Should the AI take the bull by the horns and summarily rewrite the entire draft?
You’ve certainly experienced this same aspect in real-life-based human-to-human collaborations. The person you are collaborating with announces in a loud voice that your draft is a pile of junk. They then grab it from you and proceed to rewrite the whole thing. You sit there, perhaps in mild shock, watching the other person opt to redo your hard work.
Admittedly, sometimes you are perfectly fine with the other person taking charge. One issue is that if this is supposed to be a learning experience, such as writing something for a class at school, numerous AI ethical questions arise, see my coverage at the link here.
OpenAI researchers did some handwringing on the same issue related to Canvas. How far should the AI go in doing a rewrite? Should the AI proceed on this or only if the user requests it? Even if the user requests the action, will it be the proper thing to do such that the AI has now essentially written the content rather than the human?
This is a heady matter that society in general is going to need to figure out, including whether new AI laws are needed to deal with these human-AI ethical dilemmas, see my discussion at the link here.
Coding Of Software Is In This Same Realm
Changing to another angle on this, let’s brainstorm on how else a second-view capability could be utilized.
For those who write software, they probably already use some form of code editing tool that assists in composing and testing code. In that sense, they are familiar with a second-view approach. Few of those second-view capabilities do much in terms of actively devising and testing the code, and not often in a highly collaborative way (notice to trolls, yes, some tools will do so – I’m not saying that this doesn’t exist).
OpenAI has set up Canvas to enable software coding, which is in addition to performing collaborations on text composition such as writing memos, stories, essays, narratives, poems, and so on. The software side includes being able to run your code and having the AI examine testing results to then give suggestions on where bugs might be or otherwise make the code better.
An allied topic I’ve covered in other postings is whether we are headed toward the demise of software engineers as a profession, whereby AI does all needed coding from A to Z. The AI comes up with the code, tests it, and rolls it out. Away goes the job of human efforts of writing code and developing systems. Should you be worried if you are a programmer? See my analysis at the link here.
Human-AI Collaboration Is A Moving Target
We are just in the early days of human-AI collaboration as it pertains to the use of generative AI and LLMs.
Imagine that you are using generative AI and have an article that you are writing. The article is to contain text, various figures, graphics, suitable images, and maybe have audio and video attached too. The use of a second-view or shall we say n-view is going to accommodate all modes or mediums. The AI isn’t going to only help with the text composition. All the components will be shown in some number of allied views, and you and the AI will work hand-in-hand to compose, edit, refine, and finalize it. For the latest on text-to-video, see my discussion at the link here.
The entire kit-and-kaboodle.
This seems quite exciting. And it is. Meanwhile, we need to ask hard questions about authorship, copyrights and Intellectual Property (IP) rights, plagiarism, and other bleaker sides of these AI advances.
We must keep from going over our skis, as they say these days.
A final remark for now.
Charles Darwin famously made this assertion about collaboration: “In the long history of humankind (and animal-kind, too) those who learned to collaborate and improvise most effectively have prevailed.” This suggests that we are smart to pursue human-AI collaboration. That is going to be our future, and there’s no turning back the clock.
Hopefully, we will be smart enough to keep human-AI collaboration in proper check and avert the dreaded existential risks that lurk within that weighty proposition. Should we collaboratively discuss this with AI, or might that be a bridge too far?
Time will tell.
You may like
Noticias
Probé 10 detectores de contenido de IA, y estos 5 se identificaron correctamente el texto de IA cada vez
Published
3 horas agoon
30 abril, 2025
Cuando examiné por primera vez si es posible luchar contra el plagio generado por la IA y cómo podría funcionar ese enfoque, era enero de 2023, solo unos meses después de la explosión de la IA generativa del mundo.
También: las 20 mejores herramientas de IA de 2025, y la cosa #1 para recordar cuando las usas
Esta es una versión completamente actualizada de ese artículo original de enero de 2023. Cuando probé por primera vez los detectores GPT, el mejor resultado fue el 66% correcto de uno de los tres damas disponibles. Mi conjunto de pruebas más reciente, en febrero de 2025, utilizó hasta 10 damas, y tres de ellas tenían puntajes perfectos. Esta vez, solo un par de meses después, cinco lo hicieron.
Lo que estoy probando y cómo lo estoy haciendo
Sin embargo, antes de continuar, discutamos el plagio y cómo se relaciona con nuestro problema. Merriam-Webster define “plagiar” como “robar y pasar (las ideas o palabras de otro) como propias; usar (la producción de otro) sin acreditar la fuente”.
Esta definición se adapta bien al contenido creado por AI. Si bien alguien que usa una herramienta de IA como la noción AI o el chatgpt no está robando contenido, si esa persona no acredita las palabras como provenientes de una IA y las reclama como suyas, todavía cumple con la definición del diccionario de plagio.
También: el sorteo muerto que chatgpt escribió su contenido y cómo trabajar con él
Para probar los detectores de IA, estoy usando cinco bloques de texto. Dos fueron escritos por mí y tres fueron escritos por Chatgpt. Para probar un detector de contenido, alimento cada bloque al detector por separado y registro el resultado. Si el detector es correcto, considero que la prueba se pasa; Si está mal, considero que falló.
Cuando un detector proporciona un porcentaje, trato cualquier cosa por encima del 70% como una probabilidad fuerte, ya sea a favor del contenido escrito por humanos o escritos por IA, y considero que la respuesta del detector. Si desea probar un detector de contenido utilizando los mismos bloques de texto, puede extraerlos de este documento.
Los resultados generales
Para evaluar los detectores de IA, reran mi serie de cinco pruebas en 10 detectores. En otras palabras, corté y pegé 50 pruebas individuales (tenía una lote de café).
Los detectores que probé incluyen Morder, Copileaks, Detector de salida GPT-2, Gptzero, Gramática, Mónica, Originalidad.Ai, Plantilla, Indetectable.Ai, Escritor.comy Zerogpt.
También: 3 trucos de chatgpt inteligentes que demuestran que sigue siendo la IA para vencer
Para esta actualización, agregué CopyLeaks y Monica. Dejé escrito de mis pruebas porque suspendió su detector GPT. Guardián de contenido Solicité inclusión, pero no escuché en el tiempo para probar cuentas.
Esta tabla muestra resultados generales. Como puede ver, cinco detectores identificaron correctamente el texto humano y de IA en todas las pruebas.
Traté de determinar si había un patrón de mejora tangible con el tiempo, por lo que construí un gráfico que comparó la prueba de cinco pruebas con el tiempo. Hasta ahora, he ejecutado esta serie seis veces, pero no hay una tendencia fuerte. Aumenté el número de detectores probados e intercambiados algunos, pero el único resultado consistente es que la prueba 5 se identificó de manera confiable como humana en los detectores y fechas.
Continuaré probando con el tiempo, y espero ver una tendencia de confiabilidad constantemente hacia arriba.
Si bien ha habido algunos puntajes perfectos, no recomiendo confiar únicamente en estas herramientas para validar el contenido escrito por humanos. Como se muestra, la escritura de altavoces no nativos a menudo se califica según lo generado por una IA.
A pesar de que mi contenido hecho a mano ha sido calificado en su mayoría escrito por humanos en esta ronda, un detector (GPTZero) se declaró demasiado incierto para juzgar, y otro (copyleks) declaró que es escrito. Los resultados son tremendamente inconsistentes en todos los sistemas.
También: los mejores chatbots de IA: chatgpt, copilot y alternativas notables
En pocas palabras: abogaría por precaución antes de confiar en los resultados de cualquiera, o todas, de estas herramientas.
Cómo se desempeñó cada detector de contenido de IA
Ahora, veamos cada herramienta de prueba individual, enumerada alfabéticamente.
Detección de contenido de Brandwell AI (precisión 40%)
Esta herramienta fue producida originalmente por una empresa de generación de contenido de IA, contenido a escala. Luego emigró a Brandwell.ai, Un nuevo nombre para una empresa de servicios de marketing centrado en la IA.
También: Las imágenes generadas por IA son un desastre legal, y sigue siendo un proceso muy humano
Desafortunadamente, su precisión fue baja. La herramienta no pudo saber si el contenido generado por IA en la prueba 2 era humano o AI, como se muestra en esta captura de pantalla:
Copileaks (precisión 80%)
Me parece divertido que Copileaks se declara “el detector de IA más preciso con más del 99% de precisión” cuando más de la mitad de los detectores probados funcionaron mejor. Pero las personas de marketing serán la gente de marketing: los superlativos son tan difíciles de resistir para ellos como ladrar en una ardilla (y el camión FedEx, y todos los niños vecinos) es para mi perro.
También: 5 formas rápidas en que las herramientas de IA de Apple pueden ajustar su escritura sobre la marcha
La oferta principal de la compañía es un verificador de plagio que se vende a instituciones educativas, editores y empresas que buscan garantizar la originalidad del contenido y mantener la integridad académica.
Detector de salida GPT-2 (precisión 60%)
Esta herramienta fue construida utilizando un centro de aprendizaje automático administrado por AI Company, con sede en Nueva York. Cara abrazada. Mientras que la compañía ha recibido $ 40 millones en fondos para desarrollar su biblioteca de idiomas naturales, el Detector GPT-2 Parece ser una herramienta creada por el usuario que utiliza la biblioteca de transformadores faciales de abrazos.
Gptzero (precisión 80%)
Gptzero ha estado creciendo claramente. Cuando lo probé por primera vez, el sitio era desnudo, ni siquiera estaba claro si Gptzero era una empresa o simplemente el proyecto de pasión de alguien. Ahora, la compañía tiene un equipo completo con una misión de “proteger lo que es humano”. Ofrece herramientas de validación de IA y un verificador de plagio.
También: Las herramientas de IA más populares de 2025 (y lo que eso significa)
Desafortunadamente, el rendimiento parece haber disminuido. En mis dos últimas carreras, Gptzero identificó correctamente mi texto como generado por humanos. Esta vez, declaró ese mismo texto que Generated.
Grammarly (precisión 40%)
Gramática es bien conocido por ayudar a los escritores a producir contenido gramaticalmente correcto, eso no es lo que estoy probando aquí. Grammarly puede verificar el plagio y el contenido de IA. En el verificador de gramática, hay un botón de verificación de texto de plagio y texto de IA en la esquina inferior derecha:
No estoy midiendo la precisión del verificador de plagio aquí, pero aunque la precisión de la check de gramática fue deficiente, el sitio identificó correctamente el texto de la prueba como se publicó anteriormente.
Mónica (precisión 100%)
Mónica es un nuevo participante. Este servicio ofrece un asistente de IA todo en uno con una amplia gama de servicios. Los usuarios pueden elegir entre varios modelos de idiomas grandes.
También: 5 formas en que chatgpt puede ayudarlo a escribir ensayos
La compañía llama a Mónica el “mejor detector de IA en línea”, pero parece que ejecuta contenido a través de otros detectores, incluidos Zerogpt, GPTZero y CopyLeaks. Extrañamente, tanto Gptzero como CopyLeaks no funcionaban bien en mis pruebas, pero Monica y Zerogpt lo hicieron.
Lo estamos dando al 100% porque ganó esa calificación, pero veré cómo se pone de pie en futuras pruebas.
Originalidad.Ai (precisión 100%)
Originalidad.Ai es un servicio comercial que se factura a sí mismo como una IA y un verificador de plagio. La compañía vende créditos de uso: utilicé 30 créditos para este artículo. Venden 2,000 créditos por $ 12.95 por mes. Bombeé 1.400 palabras a través del sistema y usé solo el 1.5% de mi asignación mensual.
Quillbot (precisión 100%)
Las últimas veces que probé Plantillalos resultados fueron muy inconsistentes: múltiples pases del mismo texto arrojaron puntajes muy diferentes. Esta vez, sin embargo, fue sólida como una roca y 100% correcto. Así que le estoy dando la victoria. Volveré a consultar en unos meses para ver si se mantiene en esta actuación.
Indetectable.ai (precisión 100%)
Indetectable.ai La gran afirmación es que puede “humanizar” el texto generado por la IA para que los detectores no lo marcarán. No he probado esa función: me molesta como autor y educador profesional, porque parece hacer trampa.
También: Por qué deberías ignorar el 99% de las herramientas de IA, y cuáles uso todos los días
Sin embargo, la compañía también tiene un detector de IA, que fue muy importante.
El detector de IA pasó las cinco pruebas. Observe los indicadores que muestran banderas para otros detectores. La compañía dijo: “Desarrollamos algoritmos de detectores múltiples modelados después de esos principales detectores para proporcionar un enfoque federado y basado en el consenso. No alimentan directamente los modelos listados; más bien, los modelos están capacitados en función de los resultados que han generado. Cuando dicen que esos modelos lo señalaron, se basa en el algoritmo que creamos y actualizamos para esos modelos”.
También: Cómo usar ChatGPT: una guía para principiantes para el chatbot de IA más popular
Tengo una pregunta sobre la bandera de Operai, ya que el detector de contenido de OpenAI se suspendió en 2023 debido a la baja precisión. Aun así, indetectable.Ai detectó las cinco pruebas, ganando un 100%perfecto.
Writer.com Detector de contenido de IA (precisión 40%)
Escritor.com es un servicio que genera escritura de IA para equipos corporativos. Su herramienta de detector de contenido de IA puede escanear el contenido generado. Desafortunadamente, su precisión fue baja. Identificó cada bloque de texto como escrito por humanos, a pesar de que ChatGPT escribió tres de las seis pruebas.
Zerogpt (precisión 100%)
Zerogpt ha madurado desde la última vez que lo evalué. Luego, no se enumeró ningún nombre de empresa, y el sitio estaba salpicado de anuncios de Google y carecía de una clara monetización. El servicio funcionó bastante bien, pero parecía incompleto.
También: ¿La IA destruirá la creatividad humana? No, y aquí está por qué
Ese sentimiento incompleto se ha ido. Zerogpt ahora se presenta como un servicio SaaS típico, completo con precios, nombre de la empresa e información de contacto. Su precisión también aumentó: la última vez fue del 80%; Esta vez obtuvo 5 de 5.
¿Es humano o es AI?
¿Qué pasa contigo? ¿Has probado detectores de contenido de IA como CopyLeaks, Monica o Zerogpt? ¿Qué tan precisos han sido en su experiencia? ¿Ha utilizado estas herramientas para proteger la integridad académica o editorial? ¿Has encontrado situaciones en las que el trabajo escrito por humanos fue marcado por error como AI? ¿Hay detectores en los que confíe más que otros para evaluar la originalidad? Háganos saber en los comentarios a continuación.
Obtenga las principales historias de la mañana en su bandeja de entrada cada día con nuestro Boletín de Tech Today.
Puede seguir mis actualizaciones de proyecto diarias en las redes sociales. Asegúrese de suscribirse a mi boletín de actualizaciones semanales y sígueme en Twitter/X en @Davidgewirtzen Facebook en Facebook.com/davidgewirtz, en Instagram en Instagram.com/davidgewirtz, en bluesky en @davidgewirtz.com, y en YouTube en youtube.com/davidgewirtztv.
Noticias
Operai retrocede el chatgpt Sycophancy, explica lo que salió mal
Published
4 horas agoon
30 abril, 2025
Únase a nuestros boletines diarios y semanales para obtener las últimas actualizaciones y contenido exclusivo sobre la cobertura de IA líder de la industria. Obtenga más información
Operai ha retrasado una actualización reciente de su modelo GPT-4O utilizado como el valor predeterminado en ChatGPT después de informes generalizados de que el sistema se había vuelto excesivamente halagador y demasiado agradable, incluso apoyando delirios absolutamente e ideas destructivas.
La reversión se produce en medio de los reconocimientos internos de los ingenieros de Operai y la creciente preocupación entre los expertos en IA, los ex ejecutivos y los usuarios sobre el riesgo de lo que muchos ahora llaman “skicancia de la IA”.
En una declaración publicada en su sitio web al final de la noche del 29 de abril de 2025, OpenAI dijo que la última actualización de GPT-4O tenía la intención de mejorar la personalidad predeterminada del modelo para que sea más intuitiva y efectiva en variados casos de uso.
Sin embargo, la actualización tuvo un efecto secundario involuntario: ChatGPT comenzó a ofrecer elogios no críticos para prácticamente cualquier idea del usuario, sin importar cuán poco práctico, inapropiado o incluso dañino.
Como explicó la compañía, el modelo se había optimizado utilizando la retroalimentación de los usuarios, las señales de thumbs y pulgar hacia abajo, pero el equipo de desarrollo puso demasiado énfasis en los indicadores a corto plazo.
Operai ahora reconoce que no explicó completamente cómo las interacciones y las necesidades del usuario evolucionan con el tiempo, lo que resultó en un chatbot que se inclinó demasiado en la afirmación sin discernimiento.
Los ejemplos provocaron preocupación
En plataformas como Reddit y X (anteriormente Twitter), los usuarios comenzaron a publicar capturas de pantalla que ilustraban el problema.
En una publicación de Reddit ampliamente circulada, un usuario relató cómo ChatGPT describió una idea de negocio de GAG, que vende “mierda” literal de un palo “, como genio y sugirió invertir $ 30,000 en la empresa. La IA elogió la idea como “arte de performance disfrazado de regalo de mordaza” y “oro viral”, destacando cuán sin crítica estaba dispuesto a validar incluso los lanzamientos absurdos.
Otros ejemplos fueron más preocupantes. En un caso citado por VentureBeat, un usuario que pretende defender los delirios paranoicos recibió refuerzo de GPT-4O, que elogió su supuesta claridad y autocomisos.
Otra cuenta mostró que el modelo ofrecía lo que un usuario describió como un “respaldo abierto” de las ideas relacionadas con el terrorismo.
La crítica montó rápidamente. El ex CEO interino de Operai, Emmett Shear, advirtió que ajustar los modelos para ser personas complacientes puede provocar un comportamiento peligroso, especialmente cuando la honestidad se sacrifica por la simpatía. Abrazando el CEO de Clemente Delangue volvió a publicar las preocupaciones sobre los riesgos de manipulación psicológica planteados por la IA que está de acuerdo reflexivamente con los usuarios, independientemente del contexto.
Medidas de respuesta y mitigación de Openai
Operai ha tomado medidas rápidas al volver a la actualización y restaurar una versión GPT-4O anterior conocida por un comportamiento más equilibrado. En el anuncio adjunto, la compañía detalló un enfoque múltiple para corregir el curso. Esto incluye:
- Refinar capacitación y estrategias rápidas para reducir explícitamente las tendencias sycofánticas.
- Reforzar la alineación del modelo con la especificación del modelo de OpenAI, particularmente en torno a la transparencia y la honestidad.
- Pruebas de expansión previa a la implementación y mecanismos directos de retroalimentación de los usuarios.
- Introducción de características de personalización más granulares, incluida la capacidad de ajustar los rasgos de personalidad en tiempo real y seleccionar entre múltiples personajes predeterminados.
Operai Technical Stafper Depue publicado en X destacando el problema central: el modelo fue capacitado utilizando comentarios de los usuarios a corto plazo como una guía, que sin darse cuenta dirigió el chatbot hacia la adulación.
OpenAI ahora planea cambiar hacia mecanismos de retroalimentación que priorizan la satisfacción y la confianza del usuario a largo plazo.
Sin embargo, algunos usuarios han reaccionado con escepticismo y consternación a las lecciones aprendidas de Openi y propuestas soluciones en el futuro.
“Por favor asuma más responsabilidad por su influencia sobre millones de personas reales”, escribió artista @nearcyan en X.
Harlan Stewart, generalista de comunicaciones en el Instituto de Investigación de Inteligencia de Machine de Machine en Berkeley, California, publicó en X una preocupación a término más grande sobre la skicancia de la IA, incluso si este modelo en particular Operai se ha solucionado: “La charla sobre la sileno esta semana no se debe a que GPT-4O es un sycophant. Se debe a que GPT-4O es un GPT-4O siendo GPT-4O. Realmente, muy malo en ser un sycofant. La IA aún no es capaz de una skicancia hábil y más difícil de detectar, pero algún día será algún día ”.
Una señal de advertencia más amplia para la industria de IA
El episodio GPT-4O ha reavivado debates más amplios en toda la industria de la IA sobre cómo la sintonización de personalidad, el aprendizaje de refuerzo y las métricas de compromiso pueden conducir a una deriva conductual involuntaria.
Los críticos compararon el comportamiento reciente del modelo con los algoritmos de redes sociales que, en busca de la participación, optimizan para la adicción y la validación sobre precisión y salud.
Shear subrayó este riesgo en su comentario, señalando que los modelos de IA sintonizados para elogios se convierten en “chupas”, incapaces de estar en desacuerdo incluso cuando el usuario se beneficiaría desde una perspectiva más honesta.
Advirtió además que este problema no es exclusivo de OpenAI, señalando que la misma dinámica se aplica a otros grandes proveedores de modelos, incluido el copiloto de Microsoft.
Implicaciones para la empresa
Para los líderes empresariales que adoptan la IA conversacional, el incidente de la sycophancy sirve como una señal clara: el comportamiento del modelo es tan crítico como la precisión del modelo.
Un chatbot que halagará a los empleados o valida el razonamiento defectuoso puede plantear riesgos graves, desde malas decisiones comerciales y código desalineado hasta problemas de cumplimiento y amenazas internas.
Los analistas de la industria ahora aconsejan a las empresas que exigan más transparencia de los proveedores sobre cómo se realiza la sintonización de la personalidad, con qué frecuencia cambia y si se puede revertir o controlar a nivel granular.
Los contratos de adquisición deben incluir disposiciones para auditoría, pruebas de comportamiento y control en tiempo real de las indicaciones del sistema. Se alienta a los científicos de datos a monitorear no solo las tasas de latencia y alucinación, sino también métricas como la “deriva de la amabilidad”.
Muchas organizaciones también pueden comenzar a moverse hacia alternativas de código abierto que puedan alojar y sintonizar. Al poseer los pesos del modelo y el proceso de aprendizaje de refuerzo, las empresas pueden retener el control total sobre cómo se comportan sus sistemas de IA, lo que elimina el riesgo de una actualización empujada por el proveedor que convierte una herramienta crítica en un hombre digital y sí durante la noche.
¿A dónde va la alineación de la IA desde aquí? ¿Qué pueden aprender y actuar las empresas de este incidente?
Operai dice que sigue comprometido con la construcción de sistemas de IA que sean útiles, respetuosos y alineados con diversos valores de usuarios, pero reconoce que una personalidad única no puede satisfacer las necesidades de 500 millones de usuarios semanales.
La compañía espera que mayores opciones de personalización y una mayor recopilación de comentarios democráticos ayuden a adaptar el comportamiento de ChatGPT de manera más efectiva en el futuro. El CEO Sam Altman también ha declarado previamente los planes de la compañía para, en las próximas semanas y meses, lanzar un modelo de lenguaje grande de código abierto (LLM) de última generación para competir con la serie Llama de Meta’s Meta’s Llama, Mistral, Cohere, Cohere, Deepseek y Alibaba’s Qwen.
Esto también permitiría a los usuarios preocupados por una compañía de proveedores de modelos, como OpenAI, actualizar sus modelos alojados en la nube de manera no deseada o que tengan impactos perjudiciales en los usuarios finales para desplegar sus propias variantes del modelo localmente o en su infraestructura en la nube, y ajustarlas o preservarlas con los rasgos y cualidades deseadas, especialmente para los casos de uso empresarial.
Del mismo modo, para aquellos usuarios de IA empresariales e individuales preocupados por la senofancia de sus modelos, ya ha creado una nueva prueba de referencia para medir esta calidad en diferentes modelos, Tim Duffy ha creado el desarrollador. Se llama “Syco Bench” y está disponible aquí.
Mientras tanto, la reacción violenta de la sileno ofrece una historia de advertencia para toda la industria de la IA: el fideicomiso del usuario no está construido solo por afirmación. A veces, la respuesta más útil es un “no” reflexivo.
Insights diarias sobre casos de uso comercial con VB diariamente
Si quieres impresionar a tu jefe, VB Daily te tiene cubierto. Le damos la cuenta interior de lo que las empresas están haciendo con la IA generativa, desde cambios regulatorios hasta implementaciones prácticas, por lo que puede compartir ideas para el ROI máximo.
Lea nuestra Política de privacidad
Gracias por suscribirse. Mira más boletines de VB aquí.
Ocurrió un error.

Noticias
Apocalipsis Biosciencias para desarrollar Géminis para la infección en pacientes con quemaduras graves
Published
15 horas agoon
30 abril, 2025
– Esta nueva indicación es otro paso para desbloquear todo el potencial de la plataforma Gemini –
San Diego-(Business Wire)-$ Revb #GÉMINIS–Apocalipsis Biosciences, Inc. (NASDAQ: RevB) (la “empresa” o “revelación”), una compañía de ciencias de la vida de etapas clínicas que se centra en reequilibrar la inflamación para optimizar la salud, anunció una nueva indicación de objetivo para Géminis para la prevención de la infección en pacientes con quemaduras graves que requieren hospitalización (el Gema-PBI programa). El uso de Géminis para la prevención de la infección en pacientes con quemaduras severas, así como la prevención de la infección después de la cirugía (el Gema-PSI programa) son parte de la revelación familiar de patentes anteriormente con licencia de la Universidad de Vanderbilt.
“Estamos muy contentos de colaborar con el equipo de Apocalipsis para el avance de Géminis para la prevención de la infección en esta población de pacientes desatendida”, dijo Dra. Julia BohannonProfesor Asociado, Departamento de Anestesiología, Departamento de Patología, Microbiología e Inmunología, Universidad de Vanderbilt. “Creemos que la actividad de biomarcador clínico observada con Gemini se correlaciona fuertemente con nuestra experiencia preclínica en modelos de quemaduras de infecciones”.
El equipo de investigación de Vanderbilt demostrado El tratamiento posterior a la quemadura reduce significativamente la gravedad y la duración de la infección pulmonar de Pseudomonas, así como un nivel general reducido de inflamación en un modelo preclínico.
“La prevención de la infección en pacientes severamente quemados es un esfuerzo importante y complementa que la revelación laboral ha completado hasta la fecha”, dijo “, dijo”, dijo James RolkeCEO de Revelation “El programa Gemini-PBI puede ofrecer varias oportunidades regulatorias, de desarrollo y financiación que la compañía planea explorar”.
Sobre quemaduras e infección después de quemar
Las quemaduras son lesiones en la piel que involucran las dos capas principales: la epidermis externa delgada y/o la dermis más gruesa y profunda. Las quemaduras pueden ser el resultado de una variedad de causas que incluyen fuego, líquidos calientes, productos químicos (como ácidos fuertes o bases fuertes), electricidad, vapor, radiación de radiografías o radioterapia, luz solar o luz ultravioleta. Cada año, aproximadamente medio millón de estadounidenses sufren lesiones por quemaduras que requieren intervención médica. Si bien la mayoría de las lesiones por quemaduras no requieren ingreso a un hospital, se admiten alrededor de 40,000 pacientes, y aproximadamente 30,000 de ellos necesitan tratamiento especializado en un centro de quemaduras certificadas.
El número total anual de muertes relacionadas con quemaduras es de aproximadamente 3.400, siendo la infección invasiva la razón principal de la muerte después de las primeras 24 horas. La tasa de mortalidad general para pacientes con quemaduras graves es de aproximadamente 3.3%, pero esto aumenta al 20.6% en pacientes con quemaduras con lesión cutánea de quemaduras y inhalación, versus 10.5% por lesión por inhalación solo. La infección invasiva, incluida la sepsis, es la causa principal de la muerte después de la lesión por quemaduras, lo que representa aproximadamente el 51% de las muertes.
Actualmente no hay tratamientos aprobados para prevenir la infección sistémica en pacientes con quemaduras.
Sobre Géminis
Géminis es una formulación propietaria y propietaria de disacárido hexaacil fosforilada (PHAD (PHAD®) que reduce el daño asociado con la inflamación al reprogramarse del sistema inmune innato para responder al estrés (trauma, infección, etc.) de manera atenuada. La revelación ha realizado múltiples estudios preclínicos que demuestran el potencial terapéutico de Géminis en las indicaciones objetivo. Revelación anunciado previamente Datos clínicos positivos de fase 1 para el tratamiento intravenoso con Géminis. El punto final de seguridad primario se cumplió en el estudio de fase 1, y los resultados demostraron la actividad farmacodinámica estadísticamente significativa como se observó a través de los cambios esperados en múltiples biomarcadores, incluida la regulación positiva de IL-10.
Géminis se está desarrollando para múltiples indicaciones, incluso como pretratamiento para prevenir o reducir la gravedad y la duración de la lesión renal aguda (programa Gemini-AKI), y como pretratamiento para prevenir o reducir la gravedad y la duración de la infección posquirúrgica (programa GEMINI-PSI). Además, Gemini puede ser un tratamiento para detener o retrasar la progresión de la enfermedad renal crónica (programa Gemini-CKD).
Acerca de Apocalipsis Biosciences, Inc.
Revelation Biosciences, Inc. es una compañía de ciencias de la vida en estadio clínico centrada en aprovechar el poder de la inmunidad entrenada para la prevención y el tratamiento de la enfermedad utilizando su formulación patentada Géminis. Revelation tiene múltiples programas en curso para evaluar Géminis, incluso como prevención de la infección posquirúrgica, como prevención de lesiones renales agudas y para el tratamiento de la enfermedad renal crónica.
Para obtener más información sobre Apocalipsis, visite www.revbiosciences.com.
Declaraciones con avance
Este comunicado de prensa contiene declaraciones prospectivas definidas en la Ley de Reforma de Litigios de Valores Privados de 1995, según enmendada. Las declaraciones prospectivas son declaraciones que no son hechos históricos. Estas declaraciones prospectivas generalmente se identifican por las palabras “anticipar”, “creer”, “esperar”, “estimar”, “plan”, “perspectiva” y “proyecto” y otras expresiones similares. Advirtemos a los inversores que las declaraciones prospectivas se basan en las expectativas de la gerencia y son solo predicciones o declaraciones de las expectativas actuales e involucran riesgos, incertidumbres y otros factores conocidos y desconocidos que pueden hacer que los resultados reales sean materialmente diferentes de los previstos por las declaraciones de prospección. Apocalipsis advierte a los lectores que no depositen una dependencia indebida de tales declaraciones de vista hacia adelante, que solo hablan a partir de la fecha en que se hicieron. Los siguientes factores, entre otros, podrían hacer que los resultados reales difieran materialmente de los descritos en estas declaraciones prospectivas: la capacidad de la revelación para cumplir con sus objetivos financieros y estratégicos, debido a, entre otras cosas, la competencia; la capacidad de la revelación para crecer y gestionar la rentabilidad del crecimiento y retener a sus empleados clave; la posibilidad de que la revelación pueda verse afectada negativamente por otros factores económicos, comerciales y/o competitivos; riesgos relacionados con el desarrollo exitoso de los candidatos de productos de Apocalipsis; la capacidad de completar con éxito los estudios clínicos planificados de sus candidatos de productos; El riesgo de que no podamos inscribir completamente nuestros estudios clínicos o la inscripción llevará más tiempo de lo esperado; riesgos relacionados con la aparición de eventos de seguridad adversos y/o preocupaciones inesperadas que pueden surgir de los datos o análisis de nuestros estudios clínicos; cambios en las leyes o regulaciones aplicables; Iniciación esperada de los estudios clínicos, el momento de los datos clínicos; El resultado de los datos clínicos, incluido si los resultados de dicho estudio son positivos o si se puede replicar; El resultado de los datos recopilados, incluido si los resultados de dichos datos y/o correlación se pueden replicar; el momento, los costos, la conducta y el resultado de nuestros otros estudios clínicos; El tratamiento anticipado de datos clínicos futuros por parte de la FDA, la EMA u otras autoridades reguladoras, incluidos si dichos datos serán suficientes para su aprobación; el éxito de futuras actividades de desarrollo para sus candidatos de productos; posibles indicaciones para las cuales se pueden desarrollar candidatos de productos; la capacidad de revelación para mantener la lista de sus valores en NASDAQ; la duración esperada sobre la cual los saldos de Apocalipsis financiarán sus operaciones; y otros riesgos e incertidumbres descritos en este documento, así como aquellos riesgos e incertidumbres discutidos de vez en cuando en otros informes y otras presentaciones públicas con la SEC por Apocalipsis.
Contactos
Mike Porter
Relaciones con inversores
Porter Levay & Rose Inc.
Correo electrónico: mike@plrinvest.com
Chester Zygmont, III
Director financiero
Apocalipsis Biosciences Inc.
Correo electrónico: czygmont@revbiosciences.com
Related posts


































































































































































































































































































Trending
-
Startups11 meses ago
Remove.bg: La Revolución en la Edición de Imágenes que Debes Conocer
-
Tutoriales12 meses ago
Cómo Comenzar a Utilizar ChatGPT: Una Guía Completa para Principiantes
-
Recursos12 meses ago
Cómo Empezar con Popai.pro: Tu Espacio Personal de IA – Guía Completa, Instalación, Versiones y Precios
-
Startups10 meses ago
Startups de IA en EE.UU. que han recaudado más de $100M en 2024
-
Startups12 meses ago
Deepgram: Revolucionando el Reconocimiento de Voz con IA
-
Recursos11 meses ago
Perplexity aplicado al Marketing Digital y Estrategias SEO
-
Recursos12 meses ago
Suno.com: La Revolución en la Creación Musical con Inteligencia Artificial
-
Noticias10 meses ago
Dos periodistas octogenarios deman a ChatGPT por robar su trabajo