Noticias
Can Otter and ChatGPT produce a good-enough account of a podcast interview? – Media Nation
This post will no doubt have limited appeal, but a few readers might find it interesting. I’ve been thinking about how to produce summaries and news stories based on the podcast that Ellen Clegg and I host, “What Works: The Future of Local News.” The best way would be to pay a student to write it up. But is it also a task that could be turned over to AI?
Purely as an experiment, I took our most recent podcast — an interview with Scott Brodbeck, founder and CEO of Local News Now, in the Virginia suburbs of Washington, D.C. — and turned it over to the robots.
I started by downloading the audio and feeding it into Otter, a web-based transcription service that uses AI to guess at what the speaker might actually be saying. Once I had a transcript, I took a part of it — our conversation with Brodbeck, eliminating the introduction and other features — and fed it into ChatGPT twice, once asking it to produce a 600-word summary and then again to produce a 600-word news story. Important caveat: I did very little to clean up the transcript and did not edit what ChatGPT spit out.
The results were pretty good. I’m guessing it would have been better if I had been using a paid version of ChatGPT, but that would require, you know, money. I’d say that what AI produced would be publishable if some human-powered editing were employed to fix it up. Anyway, here are the results.
The transcript
Q: Scott, so many of the projects that we have looked at are nonprofit, and that trend seems to be accelerating. In fact, we love nonprofit news, but we also worry that there are limits to how much community journalism can be supported by philanthropy. So your project is for profit. How have you made that work? Dan, do you think for profit? Digital only, local news can thrive in other parts of the country as well.
A: I’m agnostic in terms of the future of both business models. I think there are nonprofits doing absolutely fantastic work. I think there are for profits that are doing great work in serving their communities. It is largely a business model distinction, and the thing that the nonprofit lets you do is raise some of that those larger philanthropic dollars or go after large donors in a community block club Chicago is one of the local operations that I respect the most. They’re amazing. The way they do their fundraising and the editorial output and how they serve their readers, absolutely amazing, and that works for them. But if I were to take the same model and try to apply it in Arlington, I don’t necessarily think it would work. It’s a smaller community. The donors who might get excited about serving Chicago, as you know, a city might. There’s just going to be a lot fewer of them, if I’m just talking about Arlington County, here, outside of DC. So for us, the for profit works we’ve had been fortunate to get lots of advertising support from local businesses. We do have some memberships, but it’s less than 10% of our revenue, maybe even less than 5% even with a recent influx when we put out the call. It’s meaningful, but it’s far from the main source of support for. Business model, and that’s what works here each community. What I’ve learned over time, because I’ve looked at potentially expanding to other other areas in years past, for the record, we are pretty firmly ensconced here in the DC area for now, but when I’ve looked at that the difference in each community and just the dynamics, and are you going to get support from advertisers? Are you going to get support from donors or philanthropy. It’s different. This is going back to local. Doesn’t scale. It’s very hard to take what works in one area and just clone, stamp it and apply it somewhere else. That’s a long way of saying that. I think both of these types of models are going to going to coexist, and they’re going to do there’s probably advantages and disadvantages, but as long as you’re serving your readers and as long as you have a viable business or a viable organization in terms of your financials, I think that’s great. I think all should be supported all the above.
Q: When we had Howard Owens of the Batavian on the podcast, he told us that he thinks for profits can actually act more independently than nonprofits, because it’s less harmful to offend one advertiser out of many than to offend one major funder who might be crucial to the whole enterprise. Do you agree with his take?
A: You know, I do, and it’s, I think it’s more of a question of revenue diversification for us. No one advertiser has more than 1% of our revenue as a result. I that’s not something I have to care about. Is what a specific advertiser thinks of a specific, you know, type of coverage we’re doing. We just, we call our own shots and approach, you know, our news coverage the way we we want to do it, without regard of what anybody external thinks. That’s the way to go here. That’s the way you serve readers, is by being independent and being a authentic voice for the community, and not being beholden to what a, you know, specific large donor thinks. Now on the nonprofit side, you know, if they’re relatively, you know, well diversified in terms of no one philanthropy or no one large donor holds too much sway, then I very much think they could be independent. But you know, if there is a situation where a particular nonprofit has a dependency on a single source, you know, I do think that calls into question, to what degree is that affecting editorial judgment? You know, not necessarily a bad thing, but I do think that, you know, you can make ask some questions there about how that’s affecting things.
Q: Scott, I’m looking at your video feed, and that is one of the most impressive mics I’ve ever seen in my life. And it leads me to think that there must be some multimedia aspects to what you’re doing that I’m not aware of. So could you talk about that a little bit?
A: We’ve tried some podcasts here and there. Over the years, there have been two main attempts at making it work. And you know, I think what we’ve found is that for us, what we have done in the past, or newsmaker interviews. We’ve also done a just kind of news discussion amongst some of our journalists, and we found an audience, but it wasn’t a it wasn’t a large audience in relation to our overall readership on the site. You know one thing about local is, especially when you’re online, only is, you are limited. You are limited in what you can do and what your resources are, and you know how much time you can spend on things. And we just ended up, after the last attempt, sunsetted the podcast. Now I the feeds are live. We could bring it back, but in the end, I decided to that we should prioritize reporting, you know, and telling stories that are of relevance to the community. So I still like multimedia. We’re going to try we’re going to be trying some stuff. We’ve been trying some stuff on social media, multimedia wise, we are going to be trying some new things, hopefully in the months to come. I do think that experimentation is important. Try things, see what works, but also don’t be afraid to make the decision if it’s not working, to pull back on it and reprioritize.
Q: Now in looking at one of your sites, ARL, now I see a pretty eclectic mix of pose it’s laid out like an old school blog in reverse chronological order. When I was looking the other day, I saw a restaurant opening an update on towing regulations, a morning Notes feature that aggregates content from other sites, some sponsored content police news and a high school football game. So what makes a local news now? Story are you are you seeking to be the news source of record in the towns that you’re in, or are you a supplement to something else?
A: I think we are. I think we are the most comprehensive local news outlets for each of the communities we serve here in Northern Virginia, and that is certainly the goal within the bounds of the resource. As we have available to us at this point, we have a newsroom of nine in the office behind me. We have about four people who work three days a week, but everybody else is remote. So newsroom is taken as a more conceptual term here. But yeah, we so it’s essentially about three people per community, and we are able to do a lot of coverage because we are able to focus, you know, our energy on reporting, and we don’t have to lay out a paper. We have a lot of automations on the back end of our of our systems where, you know, for social media, the social media posts go out automatically. Nobody has to do that. The newsletter goes out automatically. And so our reporters and editors are able to focus on just reporting the news, breaking stories you know that are of relevance to people in our community, doing the kind of service journalism around everything from what restaurant is opening down the street to, you know, where can I go and buy Christmas trees this year? We try to do everything that anybody in the community might want to know about, or at least, you know, a critical mass of people in the community might want to know about. And this approach, where you kind of mix some of the hard news, the government reporting, the elections, with what some might see as softer news. You know, local business, restaurant openings, development is in there somewhere, policing, public safety. This approach, I see it more and more working in different communities. You know, rough draft Atlanta, community impact in Texas, a number of online those are all kind of digital. You have the paper and the website. I kind of consider them peers and like minded in terms of the approach of coverage to coverage. And you see it elsewhere, with online only outlets. You know, it’s not the only model out there, but for serving a community like ours, which our communities are essentially sub markets of the DC metro area, I think it works pretty well.
Q: Your towns are pretty large, and yet, even so, I have to say three people per community sounds like a luxury in this day.
A: And we achieved this level of staffing thanks to an acquisition. We just acquired the Gazette leader, which was the weekly newspaper serving Arlington County and Fairfax County. So I before, I referenced a newspaper that was only going to the the more well, to do parts of town, and that was the sun Gazette, which was later supplanted by the Gazette leader. We were able to acquire it and the core news team of a news editor and a sports editor, which has really enhanced our coverage since that acquisition. This has been a dream to get to this level. And I do think three people, while by newsrooms, of your standards, might not seem like a lot for a place that would otherwise be served by, you know, a weekly paper. I think we are able to have a lot of impact locally and do a lot of really great reporting and telling stories that would otherwise go untold.
Q: Well, you jumped the gun on the GazetteLeader. So let me ask you about that. Back in September, you acquired a print newspaper, converted it to digital only and said you would be expanding coverage. In fact, you quoted me when I was looking at your website, I did not see the GazetteLeader listed as one of your offerings.
A: What’s going on with that is the print paper has gotten more expensive to print and produce and to distribute, rather at the same time, there’s been softening of demand for print advertising, as I understand it now, it still works in many communities, but for whatever reason, it wasn’t working here. So as a result, this was not a we just acquired the assets, the digital assets, of the Z leader, and we’re able to hire over the team, which is fantastic for our coverage, but it does mean that, unfortunately, it’s no longer in print. Now, I’ve been in talks to potentially partner with someone to put out a print publication locally. I’ve been in some talks about that. It’s far from a done deal. So there might be a revival of print in some form or fashion somewhere in our coverage area down the road. We’ll have to see how that plays out. It’s not a business that I want to have to learn a lot about and get into. You know, I think the future is clearly online. And so my goal in all this has been to figure out a enduring model for online only local news. I think we’ve figured out a lot, but I don’t have all the answers, and we’re since the acquisition and some of the additional costs we took on, we’re right about at our monthly average revenue, in terms of our expenses, we need to continue to grow from a business standpoint, and that’s what I’m focused on in the months to come. None of this is easy. You know, print, online, it’s all hard.
Q: It’s definitely not easy. But my my question was, I didn’t see the GazetteLeader offered. As a digital offering, either is the coverage area that was served by the GazetteLeader still being covered by by your network?
A: So it covered there were separate additions at one point for Arlington and for Fairfax County, and it was mostly focused on specific parts of Fairfax County, as opposed to the entire county. Long story short, we we were already covering those, and so essentially, we just absorbed the staff and the reporting they were doing, which was, you know, somewhat different than ours. Scott McCaffrey, the editor, the news editor, who came over as part of the deal, he goes to, like every single government meeting there is in Arlington, Fairfax County, and now he’s doing more in Falls Church, which is a little, little tiny city in between. Before I had been content, you know, you made note of our morning notes, where we link out to other news outlets covering news of interest to Arlington and Fairfax County. We do that from from both sides, and I was content to link to his coverage for a long time, while he was doing it. And I do think it’s important to do, but I’m like, as long as Scott’s there, he’s gonna be he’s gonna be on this, like, we can link to his coverage and focus more on, you know, what we can do uniquely well. And now we have both. We have what we were doing before, and we have Scott’s coverage, which was, you know, there was some overlap, but was differentiated. We have his coverage on both our Arlington and Fairfax site. So essentially, all the journalism that they were producing that was unique to that paper, we are now doing online on our sites.
Q: I see on your website that you offer what could be called B to B services, client services to other news outlets. What can you tell us about that?
A: So this is the services that we’re providing to pop fill and to moco show. And one thing that’s pretty clear from from the 15 years of doing this is that every part of this is hard. You know, as the the news side is hard, the sales and advertising side is hard, the membership side is hard, but also the technology bit is not easy, particularly if you have a lot of readership. Now, if you, if you’re just, you know, doing 100,000 page views or less per month, then you can probably, you know, have a bog standard WordPress site on shared hosting and be fine. But our sites, you know, our Arlington site, pop, fill, moco show, they have one, one and a half to 2 million page views per month each. And at that level, you’re talking about enterprise grade hosting, you’re talking about all sorts of little problems that come up that someone needs to fix. And while local news doesn’t scale from an editorial standpoint and sometimes a business standpoint, the technology side certainly scales. And so being on the same WordPress installation, and we have our own custom built WordPress theme that is a little more chronological feed style, as opposed to the more you know, newspaper style home page that’s been in vogue for a while. Being on the same theme allows us to also find some efficiencies in terms of our sales, so that we can go to a regional advertiser and put the same ad unit or the same type of sponsored content with the same call to action button at the at the bottom on any of the sites that we serve.
600-word summary
In a recent conversation, Scott discussed the viability and challenges of for-profit digital-only local news outlets, sharing insights into his business model and how it has evolved. Scott’s project, a for-profit news outlet serving the Northern Virginia region, provides a stark contrast to the growing trend of nonprofit local journalism. While some worry about the sustainability of community journalism funded by philanthropy, Scott believes both nonprofit and for-profit models can coexist, each with their own strengths.
He emphasizes that a for-profit model works well for his community, particularly because it allows for advertising support from local businesses. Despite having some membership revenue, it is a minor part of the income stream. He notes that the dynamics of each community vary, making it difficult to replicate successful models from one area to another. A model that works in a large city like Chicago may not be feasible in a smaller town like Arlington, Virginia, where local donors and advertisers are fewer.
Scott also agrees with Howard Owens’ view that for-profit outlets can sometimes be more independent than nonprofits. He points out that, in his model, no single advertiser makes up a significant portion of the revenue, allowing the news team to operate without undue influence. While nonprofit outlets can be independent as long as they maintain revenue diversification, Scott highlights that dependence on a single donor can raise concerns about editorial independence.
Regarding multimedia efforts, Scott mentions that his team has experimented with podcasts and social media content. While they initially found success with these formats, they decided to focus on reporting, recognizing the limitations of resources in a local, digital-only newsroom. However, they continue to experiment with new formats as part of their strategy to engage their audience.
Scott’s outlet covers a broad range of local news, from restaurant openings to public safety, government meetings, and high school sports. He aims to be the most comprehensive local news source for his community, focusing on stories that are of relevance to the area. This includes a mix of hard news, community updates, and “softer” content like local events. Despite being a small team, Scott believes they have a significant impact because they focus on local reporting and use technology to streamline operations, such as automating social media posts and newsletters.
A significant recent development for Scott’s outlet was the acquisition of the Gazette Leader, a former print newspaper. After absorbing the paper’s staff and digital assets, Scott transitioned it to a fully digital operation. Although the print version was discontinued due to rising costs and declining demand for print ads, the acquired team has greatly enhanced their coverage of Arlington and Fairfax counties. Scott notes that while the Gazette Leader is no longer in print, the expanded team continues to produce local reporting for the digital platforms, filling gaps in coverage.
Scott also touched on his outlet’s B2B services, where they provide technological and advertising solutions to other local news organizations like Popville and MoCo Show. [Note: ChatGPT actually got these two names right, although “Popville” should be rendered as “PoPville.”] With each site receiving over a million page views per month, the technical demands are high, and Scott’s team has developed a custom-built WordPress theme to handle the scale. This collaboration not only enhances the editorial content across these sites but also enables efficiencies in sales and advertising, allowing regional advertisers to reach multiple local outlets through a unified platform.
Overall, Scott’s approach underscores the importance of adaptability and experimentation in the local news space. While the business of local journalism is undoubtedly challenging, he remains focused on creating a sustainable model that balances quality reporting with financial viability, leveraging both innovative technology and a strong connection to the community.
600-word news story
Local Digital News Model Finds Success Amid Nonprofit vs. For-Profit Debate
As community journalism faces financial challenges across the U.S., a growing debate between nonprofit and for-profit business models continues to shape the future of local news. Scott, the owner of a digital-only news outlet in Northern Virginia, offers a unique perspective, arguing that both models can coexist, each with distinct advantages. His outlet, which covers multiple communities in the D.C. metro area, blends news with a revenue-driven approach, demonstrating how for-profit digital journalism can thrive in an increasingly competitive landscape.
While nonprofit news organizations have gained traction in recent years, especially with the backing of philanthropic donations, Scott points out that there are limits to what these sources can achieve, especially in smaller communities. His outlet, which primarily relies on local advertising, has found success by catering to a specific audience and fostering deep local engagement. “The key is understanding your community,” he says. “What works in Arlington, Virginia, won’t necessarily work in other places. That’s why for-profit can thrive in certain areas.”
Scott stresses that the for-profit model allows for greater independence in editorial decisions, citing a perspective shared by Howard Owens of The Batavian. Owens argued that for-profit outlets, with a diversified advertiser base, can maintain editorial freedom by not being beholden to large donors, a concern for nonprofit outlets reliant on a few major philanthropists. “No single advertiser represents more than 1% of our revenue,” Scott notes, explaining that this independence allows them to cover stories without external pressure.
This freedom to cover diverse topics—from hard news like local elections and government meetings to more community-centric stories like restaurant openings and high school football games—is central to Scott’s approach. His site is a digital blend of old-school blogging and comprehensive reporting. With nine full-time staffers and a dedicated crew working remotely, his outlet has managed to serve multiple Northern Virginia communities, despite having a modest newsroom by traditional standards. “We try to be the most comprehensive local news outlet we can be within our resource constraints,” Scott explains.
The outlet has expanded recently through the acquisition of the Gazette Leader, a weekly print publication. After absorbing the editorial team, Scott converted the paper’s content into a digital format, enhancing coverage of Arlington and Fairfax Counties. While the Gazette Leader is no longer printed, Scott sees the acquisition as a step forward for local digital journalism. The transition has allowed his team to bolster coverage with more in-depth reporting from veteran journalists like Scott McCaffrey, who previously covered local government meetings. This has strengthened the outlet’s position as a key player in local news.
In addition to growing coverage, Scott’s outlet offers a unique business model by providing technology services to other news outlets. With a digital infrastructure capable of handling millions of page views, the site helps smaller outlets like Popville and MoCo Show streamline their technology and advertising operations. This collaboration allows for shared advertising and technical resources, creating efficiencies for smaller outlets that might otherwise struggle with the challenges of scaling their digital operations. “As the technology side of digital journalism scales, we can pass on some of those efficiencies to others,” Scott explains.
While Scott’s outlet has proven that digital-only, for-profit local news can succeed, he remains cautious about the future. He is keenly aware of the financial hurdles facing the industry, especially after the costs of acquiring the Gazette Leader. Despite this, he maintains that both nonprofit and for-profit outlets play essential roles in serving their communities. “The most important thing is to keep experimenting, adapting, and making sure you’re meeting the needs of your readers,” he says.
In an era where local news outlets are disappearing, Scott’s model offers a potential path forward, demonstrating that while the challenges are significant, innovation and community focus can still make local, for-profit digital journalism a viable and impactful business.
Discover more from Media Nation
Subscribe to get the latest posts sent to your email.
Noticias
O3 de OpenAI aún no es AGI, pero simplemente hizo algo que ninguna otra IA ha hecho
El último modelo de lenguaje grande de OpenAI aún no está disponible, pero ya tenemos algunas formas de saber qué puede y qué no puede hacer.
El lanzamiento “o3” de OpenAI se dio a conocer el 20 de diciembre en forma de un video infomercial, lo que significa que la mayoría de las personas ajenas a la empresa no tienen idea de lo que realmente es capaz de hacer. (Se está dando acceso anticipado a los grupos externos de pruebas de seguridad).
Además: 15 formas en que la IA me ahorró tiempo en el trabajo en 2024
Aunque el video presentó mucha discusión sobre varios logros de referencia, el mensaje del cofundador y director ejecutivo de OpenAI, Sam Altman, en el video fue muy breve. Su afirmación más importante, y además vaga, fue que o3 “es un modelo increíblemente inteligente”.
ARC-AGI puso a prueba o3
OpenAI planea lanzar la versión “mini” de o3 a finales de enero y la versión completa algún tiempo después, dijo Altman.
Un outsider, sin embargo, ha tenido la oportunidad de poner a prueba a o3, en cierto sentido.
La prueba, en este caso, se llama “Corpus de Abstracción y Razonamiento para la Inteligencia General Artificial” o ARC-AGI. Es una colección de “desafíos para los sistemas inteligentes”, un nuevo punto de referencia. El ARC-AGI se anuncia como “el único punto de referencia diseñado específicamente para medir la adaptabilidad a la novedad”. Eso significa que está destinado a evaluar la adquisición de nuevas habilidades, no sólo el uso de conocimientos memorizados.
Además: ¿Por qué la ética se está convirtiendo en el mayor desafío de la IA?
Algunos consideran la AGI, inteligencia artificial general, como el Santo Grial: el logro de un nivel de inteligencia artificial que podría igualar o superar la inteligencia humana. La idea de ARC-AGI es guiar la IA hacia “sistemas artificiales más inteligentes y más parecidos a los humanos”.
El modelo o3 obtuvo una precisión del 76% en ARC-AGI en una evaluación coordinada formalmente por OpenAI y el autor de ARC-AGI, François Chollet, científico de la unidad de inteligencia artificial de Google.
Un cambio en las capacidades de la IA
En el sitio web de ARC-AGI, Chollet escribió la semana pasada que la puntuación del 76% es la primera vez que la IA supera la puntuación de un humano en el examen, como lo ejemplifican las respuestas de los trabajadores humanos de Mechanical Turk que tomaron la prueba y quienes, en promedio, obtuvo una puntuación ligeramente superior al 75% de aciertos.
Chollet escribió que la puntuación alta es “un aumento sorprendente e importante de la función escalonada en las capacidades de la IA, que muestra una capacidad novedosa de adaptación a tareas nunca antes vista en los modelos de la familia GPT”. Y añadió: “Toda la intuición sobre las capacidades de la IA deberá actualizarse para o3”.
El logro marca “un verdadero avance” y “un cambio cualitativo en las capacidades de la IA”, declaró Chollet. Chollet predice que la capacidad de o3 para “adaptarse a tareas que nunca antes había enfrentado” significa que “debe planificar que estas capacidades sean competitivas con el trabajo humano en un plazo bastante corto”.
Los comentarios de Chollet son dignos de mención porque nunca ha sido un defensor de la IA. En 2019, cuando creó ARC-AGI, me dijo en una entrevista que tuvimos para ZDNET que el flujo constante de “artículos de prensa grandilocuentes” de empresas de IA “sugieren engañosamente que la IA a nivel humano quizás esté a unos años de distancia”, mientras que consideraba tal hipérbole “una ilusión”.
Las preguntas ARC-AGI son fáciles de entender para las personas y bastante fáciles de resolver. Cada desafío muestra de tres a cinco ejemplos de la pregunta y la respuesta correcta, y luego al examinado se le presenta una pregunta similar y se le pide que proporcione la respuesta que falta.
Las preguntas no están basadas en texto sino en imágenes. Primero se muestra una cuadrícula de píxeles con formas coloreadas, seguida de una segunda versión que ha sido modificada de alguna manera. La pregunta es: ¿Cuál es la regla que cambia la imagen inicial en la segunda imagen?
En otras palabras, el desafío no depende directamente del lenguaje natural, el área célebre de los grandes modelos de lenguaje. En cambio, prueba la formulación de patrones abstractos en el dominio visual.
Pruebe ARC-AGI usted mismo
Puede probar ARC-AGI usted mismo en el sitio web del desafío de Chollet. Respondes al desafío “dibujando” en una cuadrícula vacía, completando cada píxel con el color correcto para crear la cuadrícula correcta de píxeles de colores como “respuesta”.
Es divertido, como jugar al Sudoku o al Tetris. Lo más probable es que, incluso si no puedes articular verbalmente cuál es la regla, descubrirás rápidamente qué cuadros deben colorearse para producir la solución. La parte que lleva más tiempo es tocar cada píxel de la cuadrícula para asignar su color.
Además: Por qué el avance cuántico de Google es “realmente notable” y qué sucederá después
Una respuesta correcta produce una animación de lanzamiento de confeti en la página web y el mensaje: “Has resuelto el rompecabezas diario del premio ARC. Aún eres más (generalmente) inteligente que la IA”.
Tenga en cuenta que cuando o3 o cualquier otro modelo realiza la prueba, no actúa directamente sobre los píxeles. En cambio, el equivalente se introduce en la máquina como una matriz de filas y columnas de números que deben transformarse en una matriz diferente como respuesta. Por lo tanto, los modelos de IA no “ven” la prueba de la misma manera que lo hace un humano.
Lo que aún no está claro
A pesar de los logros de o3, es difícil hacer declaraciones definitivas sobre las capacidades de o3. Debido a que el modelo de OpenAI es de código cerrado, todavía no está claro exactamente cómo el modelo resuelve el desafío.
Al no ser parte de OpenAI, Chollet tiene que especular sobre cómo o3 está haciendo lo que está haciendo.
Conjetura que el logro es el resultado de que OpenAI cambió la “arquitectura” de o3 con respecto a la de sus predecesores. Una arquitectura en IA se refiere a la disposición y relación de los elementos funcionales que dan estructura al código.
Además: si ChatGPT produce código generado por IA para tu aplicación, ¿a quién pertenece realmente?
Chollet especula en el blog que “en el momento de la prueba, el modelo busca en el espacio de posibles Cadenas de Pensamiento (CoT) que describen los pasos necesarios para resolver la tarea, de una manera tal vez no muy diferente a la búsqueda en árbol de Monte Carlo al estilo AlphaZero”.
El término cadena de pensamiento se refiere a un enfoque cada vez más popular en la IA generativa en el que el modelo de IA puede detallar la secuencia de cálculos que realiza en busca de la respuesta final. AlphaZero es el famoso programa de inteligencia artificial de la unidad DeepMind de Google que venció a los humanos en el ajedrez en 2016. Una búsqueda de árboles de Monte Carlo es un enfoque informático que existe desde hace décadas.
En un intercambio de correo electrónico, Chollet me contó un poco más sobre su pensamiento. Le pregunté cómo llegó a esa idea de una búsqueda de cadenas de pensamiento. “Claramente, cuando el modelo está ‘pensando’ durante horas y generando millones de tokens en el proceso de resolver un único rompecabezas, debe estar haciendo algún tipo de búsqueda”, respondió Chollet.
Chollet añadió:
Es completamente obvio por las características de latencia/coste del modelo que está haciendo algo completamente diferente a la serie GPT. No es la misma arquitectura, ni nada remotamente parecido. El factor definitorio del nuevo sistema es una gran cantidad de búsquedas en el momento de la prueba. Anteriormente, 4 años de ampliación de la misma arquitectura (la serie GPT) no habían producido ningún progreso en ARC, y ahora este sistema, que claramente tiene una nueva arquitectura, está creando un cambio funcional gradual en las capacidades, por lo que la arquitectura lo es todo.
Hay una serie de advertencias aquí. OpenAI no reveló cuánto dinero se gastó en una de sus versiones de o3 para resolver ARC-AGI. Esa es una omisión significativa porque un criterio de ARC-AGI es el costo en dólares reales de usar chips GPU como proxy de la “eficiencia” del modelo de IA.
Chollet me dijo en un correo electrónico que el enfoque de o3 no equivale a un enfoque de “fuerza bruta”, pero bromeó: “Por supuesto, también se podría definir la fuerza bruta como ‘lanzar una cantidad excesiva de cómputo a un problema simple’. ‘ en cuyo caso se podría decir que es fuerza bruta”.
Además, Chollet señala que o3 fue entrenado para realizar la prueba ARC-AGI utilizando el conjunto de datos de entrenamiento de la competencia. Eso significa que aún no está claro cómo abordaría el examen una versión limpia de o3, sin preparación para el examen.
También: El generador de vídeo Sora AI de OpenAI ya está aquí: cómo probarlo
Chollet me dijo en un correo electrónico: “Será interesante ver qué puntuación obtiene el sistema base sin información relacionada con ARC, pero en cualquier caso, el hecho de que el sistema esté ajustado para ARC a través del conjunto de entrenamiento no invalida su rendimiento”. “Para eso está el conjunto de entrenamiento. Hasta ahora nadie había podido lograr puntuaciones similares, incluso después de entrenar en millones de tareas ARC generadas”.
o3 todavía falla en algunas tareas fáciles
A pesar de la incertidumbre, una cosa parece muy clara: quienes anhelan AGI se sentirán decepcionados. Chollet enfatiza que la prueba ARC-AGI es “una herramienta de investigación” y que “aprobar ARC-AGI no equivale a alcanzar AGI”.
“De hecho, no creo que o3 sea AGI todavía”, escribe Chollet en el blog ARC-AGI. “O3 todavía falla en algunas tareas muy fáciles, lo que indica diferencias fundamentales con la inteligencia humana”.
Para demostrar que todavía no estamos al nivel de inteligencia humana, Chollet señala algunos de los problemas simples en ARC-AGI que o3 no puede resolver. Uno de esos problemas implica simplemente mover un cuadrado de color en una cantidad determinada, un patrón que rápidamente se vuelve claro para un ser humano.
Chollet planea presentar una nueva versión de ARC-AGI en enero. Predice que reducirá drásticamente los resultados de o3. “Sabrás que AGI está aquí cuando el ejercicio de crear tareas que sean fáciles para los humanos comunes pero difíciles para la IA se vuelva simplemente imposible”, concluye.
Noticias
Prueba de manejo del modelo Gemini-Exp-1206 de Google en análisis de datos y visualizaciones
Únase a nuestros boletines diarios y semanales para obtener las últimas actualizaciones y contenido exclusivo sobre la cobertura de IA líder en la industria. Más información
Uno de los últimos modelos experimentales de Google, Gemini-Exp-1206, muestra el potencial de aliviar uno de los aspectos más agotadores del trabajo de cualquier analista: lograr que sus datos y visualizaciones se sincronicen perfectamente y proporcionen una narrativa convincente, sin tener que trabajar toda la noche. .
Los analistas de inversiones, los banqueros junior y los miembros de equipos de consultoría que aspiran a puestos de socios asumen sus roles sabiendo que largas horas de trabajo, fines de semana y pasar toda la noche ocasionalmente podrían darles una ventaja interna en un ascenso.
Lo que consume gran parte de su tiempo es realizar análisis de datos avanzados y al mismo tiempo crear visualizaciones que refuercen una historia convincente. Lo que hace que esto sea más desafiante es que cada firma bancaria, fintech y consultora, como JP Morgan, McKinsey y PwC, tiene formatos y convenciones únicos para el análisis y visualización de datos.
VentureBeat entrevistó a miembros de equipos de proyectos internos cuyos empleadores habían contratado a estas empresas y las habían asignado al proyecto. Los empleados que trabajan en equipos dirigidos por consultores dijeron que producir imágenes que condensen y consoliden la enorme cantidad de datos es un desafío persistente. Uno dijo que era común que los equipos de consultores trabajaran durante la noche y hicieran un mínimo de tres o cuatro iteraciones de las visualizaciones de una presentación antes de decidirse por una y prepararla para las actualizaciones a nivel de tablero.
Un caso de uso convincente para probar el último modelo de Google
El proceso en el que confían los analistas para crear presentaciones que respalden una historia con visualizaciones y gráficos sólidos tiene tantos pasos manuales y repeticiones que resultó ser un caso de uso convincente para probar el último modelo de Google.
Al lanzar el modelo a principios de diciembre, Patrick Kane de Google escribió: “Ya sea que esté enfrentando desafíos complejos de codificación, resolviendo problemas matemáticos para proyectos escolares o personales, o brindando instrucciones detalladas de varios pasos para elaborar un plan de negocios personalizado, Gemini-Exp-1206 le ayudará a navegar tareas complejas con mayor facilidad”. Google notó el rendimiento mejorado del modelo en tareas más complejas, incluido el razonamiento matemático, la codificación y el seguimiento de una serie de instrucciones.
VentureBeat llevó el modelo Exp-1206 de Google a una prueba exhaustiva esta semana. Creamos y probamos más de 50 scripts de Python en un intento de automatizar e integrar análisis y visualizaciones intuitivas y fáciles de entender que pudieran simplificar los datos complejos que se analizan. Dado que los hiperescaladores dominan los ciclos de noticias actuales, nuestro objetivo específico era crear un análisis de un mercado tecnológico determinado y al mismo tiempo crear tablas de apoyo y gráficos avanzados.
A través de más de 50 iteraciones diferentes de scripts de Python verificados, nuestros hallazgos incluyeron:
- Cuanto mayor es la complejidad de una solicitud de código Python, más “piensa” el modelo e intenta anticipar el resultado deseado. Exp-1206 intenta anticipar lo que se necesita a partir de un mensaje complejo determinado y variará lo que produce incluso con el más mínimo cambio de matiz en un mensaje. Vimos esto en cómo el modelo alternaría entre formatos de tipos de tablas colocadas directamente encima del gráfico de araña del análisis de mercado de hiperescalador que creamos para la prueba.
- Obligar al modelo a intentar realizar análisis y visualización de datos complejos y producir un archivo Excel genera una hoja de cálculo con varias pestañas. Sin que nunca le pidieran una hoja de cálculo de Excel con varias pestañas, Exp-1206 creó una. El análisis tabular principal solicitado estaba en una pestaña, las visualizaciones en otra y una tabla auxiliar en la tercera.
- Decirle al modelo que repita los datos y recomiende las 10 visualizaciones que decida que mejor se ajustan a los datos ofrece resultados beneficiosos y reveladores. Con el objetivo de reducir el tiempo que supone tener que crear tres o cuatro iteraciones de presentaciones de diapositivas antes de una revisión por parte de la junta, obligamos al modelo a producir múltiples iteraciones conceptuales de imágenes. Estos podrían limpiarse e integrarse fácilmente en una presentación, ahorrando muchas horas de trabajo manual creando diagramas en diapositivas.
Impulsando a Exp-1206 hacia tareas complejas y en capas
El objetivo de VentureBeat era ver hasta dónde se podía llevar el modelo en términos de complejidad y tareas en capas. Su desempeño en la creación, ejecución, edición y ajuste de 50 scripts de Python diferentes mostró cuán rápido el modelo intenta captar matices en el código y reaccionar de inmediato. El modelo se flexiona y se adapta según el historial de indicaciones.
El resultado de ejecutar el código Python creado con Exp-1206 en Google Colab mostró que la granularidad matizada se extendía al sombreado y la translucidez de las capas en un gráfico de araña de ocho puntos que fue diseñado para mostrar cómo se comparan seis competidores hiperescaladores. Los ocho atributos que le pedimos a Exp-1206 que identificara en todos los hiperescaladores y que anclara el gráfico de araña se mantuvieron consistentes, mientras que las representaciones gráficas variaron.
Batalla de los hiperescaladores
Elegimos los siguientes hiperescaladores para comparar en nuestra prueba: Alibaba Cloud, Amazon Web Services (AWS), Digital Realty, Equinix, Google Cloud Platform (GCP), Huawei, IBM Cloud, Meta Platforms (Facebook), Microsoft Azure, NTT Global Data. Centros, Oracle Cloud y Tencent Cloud.
A continuación, escribimos un mensaje de 11 pasos de más de 450 palabras. El objetivo era ver qué tan bien Exp-1206 puede manejar la lógica secuencial y no perder su lugar en un proceso complejo de varios pasos. (Puede leer el mensaje en el apéndice al final de este artículo).
Luego enviamos el mensaje en Google AI Studio, seleccionando el modelo Gemini Experimental 1206, como se muestra en la siguiente figura.
A continuación, copiamos el código en Google Colab y lo guardamos en un cuaderno Jupyter (Comparación de Hyperscaler – Gemini Experimental 1206.ipynb), luego ejecutamos el script de Python. El script se ejecutó sin problemas y creó tres archivos (indicados con las flechas rojas en la parte superior izquierda).
Análisis comparativo de Hyperscaler y un gráfico, en menos de un minuto
La primera serie de instrucciones en el mensaje pedía a Exp-1206 que creara un script de Python que comparara 12 hiperescaladores diferentes por su nombre de producto, características y diferenciadores únicos y ubicaciones de centros de datos. A continuación se muestra cómo resultó el archivo de Excel que se solicitó en el script. Me llevó menos de un minuto formatear la hoja de cálculo para reducirla y ajustarla a las columnas.
La siguiente serie de comandos solicitó una tabla de los seis principales hiperescaladores comparados en la parte superior de una página y el gráfico de araña a continuación. Exp-1206 eligió por sí solo representar los datos en formato HTML, creando la siguiente página.
La secuencia final de comandos se centró en la creación de un gráfico de araña para comparar los seis hiperescaladores principales. Le asignamos a Exp-1206 la tarea de seleccionar los ocho criterios para la comparación y completar el gráfico. Esa serie de comandos se tradujo a Python y el modelo creó el archivo y lo proporcionó en la sesión de Google Colab.
Un modelo diseñado específicamente para ahorrar tiempo a los analistas
VentureBeat ha aprendido que en su trabajo diario, los analistas continúan creando, compartiendo y ajustando bibliotecas de indicaciones para modelos de IA específicos con el objetivo de optimizar los informes, el análisis y la visualización en todos sus equipos.
Los equipos asignados a proyectos de consultoría a gran escala deben considerar cómo modelos como Gemini-Exp-1206 pueden mejorar enormemente la productividad y aliviar la necesidad de semanas laborales de más de 60 horas y noches ocasionales en vela. Una serie de indicaciones automatizadas pueden realizar el trabajo exploratorio de observar las relaciones en los datos, lo que permite a los analistas producir imágenes con mucha mayor certeza sin tener que dedicar una cantidad excesiva de tiempo a llegar allí.
Apéndice:
Prueba rápida de Google Gemini Experimental 1206
Escriba un script de Python para analizar los siguientes hiperescaladores que han anunciado una presencia de centro de datos e infraestructura global para sus plataformas y cree una tabla comparándolos que capture las diferencias significativas en cada enfoque en presencia de centro de datos e infraestructura global.
Haga que la primera columna de la tabla sea el nombre de la empresa, la segunda columna sean los nombres de cada uno de los hiperescaladores de la empresa que tienen presencia de centro de datos e infraestructura global, la tercera columna sea lo que hace que sus hiperescaladores sean únicos y una inmersión profunda en los más diferenciados. características, y la cuarta columna son las ubicaciones de los centros de datos para cada hiperescalador a nivel de ciudad, estado y país. Incluya los 12 hiperescaladores en el archivo de Excel. No hagas web scraping. Genere un archivo de Excel del resultado y formatee el texto en el archivo de Excel para que no contenga corchetes ({}), comillas (‘), asteriscos dobles (**) ni ningún código HTML para mejorar la legibilidad. Nombra el archivo de Excel, Gemini_Experimental_1206_test.xlsx.
A continuación, cree una tabla de tres columnas de ancho y siete columnas de profundidad. La primera columna se titula Hiperescalador, la segunda Características únicas y diferenciadores y la tercera, Infraestructura y ubicaciones de centros de datos. Pon en negrita los títulos de las columnas y céntralos. Los títulos de los hiperescaladores también están en negrita. Verifique dos veces para asegurarse de que el texto dentro de cada celda de esta tabla se ajuste y no pase a la siguiente celda. Ajuste la altura de cada fila para asegurarse de que todo el texto quepa en la celda deseada. Esta tabla compara Amazon Web Services (AWS), Google Cloud Platform (GCP), IBM Cloud, Meta Platforms (Facebook), Microsoft Azure y Oracle Cloud. Centre la tabla en la parte superior de la página de resultados.
A continuación, tomemos Amazon Web Services (AWS), Google Cloud Platform (GCP), IBM Cloud, Meta Platforms (Facebook), Microsoft Azure y Oracle Cloud y defina los ocho aspectos más diferenciadores del grupo. Utilice esos ocho aspectos diferenciadores para crear un gráfico de araña que compare estos seis hiperescaladores. Cree un único gráfico de araña grande que muestre claramente las diferencias en estos seis hiperescaladores, utilizando diferentes colores para mejorar su legibilidad y la capacidad de ver los contornos o huellas de diferentes hiperescaladores. Asegúrese de titular el análisis, Lo que más diferencia a los hiperescaladores, diciembre de 2024. Asegúrese de que la leyenda sea completamente visible y no esté encima del gráfico.
Agregue el gráfico de la araña en la parte inferior de la página. Centre el gráfico de araña debajo de la tabla en la página de salida.
Estos son los hiperescaladores que se incluirán en el script Python: Alibaba Cloud, Amazon Web Services (AWS), Digital Realty, Equinix, Google Cloud Platform (GCP), Huawei, IBM Cloud, Meta Platforms (Facebook), Microsoft Azure, NTT Global Data. Centros, Oracle Cloud, Tencent Cloud.
Noticias
Implementación y evaluación de un modelo de enseñanza de pasantía quirúrgica optimizado utilizando ChatGPT | Educación Médica BMC
Los avances tecnológicos están haciendo avanzar significativamente la educación médica. Actualmente, el desarrollo del plan de estudios médico enfatiza la mejora de los métodos de enseñanza a través de la simulación médica, la discusión de la literatura y la investigación. Existe una creciente defensa de la integración de la inteligencia artificial y las pautas clínicas en la enseñanza para cultivar mejor el razonamiento clínico y las habilidades de pensamiento lógico de los estudiantes.
Múltiples estudios han demostrado los beneficios potenciales de ChatGPT en la educación médica. Los chatbots como ChatGPT pueden ser una herramienta poderosa para mejorar la alfabetización sanitaria, especialmente entre estudiantes y jóvenes estudiantes. [6]. En primer lugar, ChatGPT ofrece acceso rápido e inmediato a amplia información médica, lo que ayuda a los estudiantes de medicina novatos a analizar datos médicos complejos. [7]. En segundo lugar, al crear escenarios y estudios de casos, ChatGPT ayuda a los estudiantes a perfeccionar y mejorar sus habilidades de planificación de diagnóstico y tratamiento, mejorando así sus capacidades de razonamiento clínico y su preparación para situaciones clínicas del mundo real. [8]. En tercer lugar, ChatGPT puede respaldar las tareas académicas respondiendo preguntas y redactando resúmenes. Su capacidad para crear esquemas y revisiones de la literatura puede agilizar la investigación médica. Además, también facilita el resumen de publicaciones relevantes y destaca hallazgos importantes, lo que ayuda a los investigadores médicos a navegar por la gran cantidad de material disponible en línea. [9]. Finalmente, ChatGPT permite el aprendizaje personalizado para los estudiantes al actuar como tutor o asistente virtual, ayudándolos con las tareas y fomentando experiencias de aprendizaje interactivas. [10].
En este estudio, ChatGPT se utilizó en cuatro funciones clave en las fases de educación médica previa, en clase y posterior a la clase. Durante la fase de preparación previa a la clase, los estudiantes pudieron consultar ChatGPT sobre cualquier problema que encontraron, lo que facilitó una comprensión inicial de conceptos, terminología y casos médicos fundamentales. En un estudio, se pudo generar una serie de imágenes a partir de texto descriptivo utilizando un modelo de aprendizaje profundo basado en redes generativas adversarias. La herramienta se utiliza en el proceso narrativo visual para facilitar el aprendizaje mejorado por la tecnología y mejorar las habilidades de razonamiento lógico. [11]. Los modelos de aprendizaje profundo basados en redes generativas adversarias desempeñan un papel clave en la simulación de varios tipos de entornos de aprendizaje y ayudan a desarrollar habilidades prácticas en modelos de asistentes de enseñanza virtuales. Los resultados experimentales muestran que este modelo mejora el efecto de aprendizaje de los estudiantes y mejora su motivación y capacidad de aprendizaje. [12]. En el aula, se empleó ChatGPT para simular las interacciones con los pacientes, proporcionando una plataforma para que los estudiantes practiquen habilidades de diagnóstico y comunicación en un entorno seguro y controlado. En sus interacciones con ChatGPT, los estudiantes son libres de practicar habilidades de diagnóstico y comunicación sin los riesgos que podría representar un paciente real. Un diagnóstico falso o una falta de comunicación no tiene un impacto real en el paciente, lo que permite a los estudiantes aprender mediante prueba y error. ChatGPT está disponible y los estudiantes pueden practicar a su propio ritmo y necesidades de aprendizaje, sin depender de un tiempo y lugar específicos. Esta flexibilidad hace que el aprendizaje sea más eficiente y conveniente. ChatGPT puede simular una variedad de escenarios clínicos y características del paciente para brindar una experiencia interactiva diversa. Los estudiantes están expuestos a diferentes condiciones y antecedentes de pacientes, mejorando así su capacidad para afrontar situaciones complejas. Después de clase, los estudiantes pueden interactuar con ChatGPT individualmente o en grupos de estudio, discutiendo preguntas de práctica proporcionadas por la herramienta, abordando preguntas difíciles o desafiantes y explorando el material desde varias perspectivas. A lo largo del proceso interactivo, los estudiantes evaluaron continuamente su comprensión del material, identificaron sus debilidades y ajustaron sus estrategias de aprendizaje y áreas de enfoque de manera oportuna para enfocarse en áreas específicas para revisión y refuerzo, asegurando que se mantuvieran en el camino correcto. [13]. De manera similar, los instructores podrían utilizar ChatGPT para recopilar recursos didácticos y estudios de casos relevantes durante la fase de preparación de la lección. Al aprovechar ChatGPT, podrían mejorar la participación de los estudiantes en el aula y utilizar la herramienta después de clase para recopilar y analizar los comentarios de los estudiantes sobre el proceso de enseñanza. Además, los estudiantes podrían utilizar ChatGPT para resolver rápidamente cualquier confusión relacionada con el conocimiento profesional. Con la capacitación del modelo ChatGPT, los estudiantes de medicina y los médicos pueden mejorar su razonamiento clínico y sus habilidades de toma de decisiones, mejorando así el desempeño del análisis y diagnóstico de casos. Además, ChatGPT proporciona a los estudiantes de medicina una experiencia de aprendizaje personalizada y eficiente a través de conversaciones simuladas, tutorías inteligentes y preguntas y respuestas automatizadas, profundizando así la comprensión de los conocimientos médicos de los estudiantes. [14].
Los resultados de este estudio indican que las puntuaciones teóricas de los grupos de estudio fueron significativamente más altas que las de los grupos de control, lo que refleja mejores resultados de aprendizaje. No se observaron diferencias significativas en las puntuaciones entre los dos grupos de estudio ni entre los dos grupos de control. Esto sugiere que la aplicación de ChatGPT en los grupos de estudio resultó en una comprensión y dominio superiores del conocimiento teórico en comparación con los métodos de enseñanza tradicionales utilizados en los grupos de control.
Los resultados de satisfacción docente de este estudio indican que los estudiantes de los grupos de estudio que utilizaron ChatGPT informaron puntuaciones de satisfacción total significativamente más altas, así como mejores calificaciones en la organización del curso y los métodos de enseñanza, en comparación con los grupos de control. Las diferencias en la satisfacción con el contenido del curso y los instructores fueron relativamente menores, lo que sugiere que el uso de ChatGPT como ayuda didáctica, a través de su novedoso y atractivo formato interactivo de preguntas y respuestas, su fuerte interactividad y su enfoque estructurado, parece mejorar la participación de los estudiantes. y participación en el aprendizaje. Esto indica que ChatGPT puede fomentar eficazmente un mayor interés y promover resultados educativos. La diferencia más notable entre los métodos de enseñanza radica en la ejecución en el aula; La capacidad de ChatGPT para simular varios escenarios y realizar análisis de casos, combinada con el acceso a recursos didácticos adicionales, mejora significativamente las habilidades de aplicación clínica de los estudiantes de medicina.
La evaluación del estudio sobre el cumplimiento del aprendizaje abarcó cuatro aspectos. Los hallazgos indican que no hubo diferencias significativas entre los grupos en cuanto al establecimiento de planes de aprendizaje. Sin embargo, para los otros tres aspectos (preparación autónoma previa a la clase y revisión posterior a la clase, participación en la enseñanza en el aula y búsqueda de retroalimentación y asistencia), los grupos de estudio exhibieron calificaciones significativamente más altas en comparación con los grupos de control. En muchos estudios y análisis estadísticos, una “puntuación más alta” suele considerarse un resultado positivo, lo que significa que el grupo de estudio obtuvo mejores resultados en algo. Los indicadores de evaluación de este estudio son todos positivos y se puede considerar que una “puntuación más alta” indica un mejor desempeño del grupo de investigación, lo que es un resultado positivo. Esto sugiere que la incorporación de ChatGPT como ayuda didáctica mejora el cumplimiento del aprendizaje de los estudiantes al promover el aprendizaje activo, fomentar el aprendizaje basado en la investigación y mejorar su interés y capacidad para el aprendizaje autónomo.
Si bien las mejoras en el cumplimiento son evidentes, la profundización continua de la comprensión antes, durante y después de la clase también contribuye a mejorar el pensamiento lógico y las habilidades analíticas. En particular, el estudio encontró una tasa relativamente baja de preguntas y solicitudes de ayuda de los estudiantes, durante y después de clase. Las diferencias observadas entre los grupos de estudio y control pueden atribuirse a la capacidad de ChatGPT para ayudar a los estudiantes a superar la timidez y no juzgar los errores. La herramienta de inteligencia artificial ayuda a los estudiantes a superar las dudas, permitiéndoles hacer preguntas de forma libre y repetida sin temor a ser juzgados o interacciones negativas. Al generar materiales de aprendizaje basados en el estado de aprendizaje y las necesidades de cada estudiante, ChatGPT les permite adoptar un enfoque más autónomo del aprendizaje y tener una experiencia educativa adaptada a sus preferencias. Estas interacciones facilitan la aclaración oportuna, una comprensión más profunda y el dominio del material.
ChatGPT también puede adaptar planes y materiales de aprendizaje individualizados para cada estudiante para adaptarse a los diferentes estilos y habilidades de aprendizaje dentro del aula. Este enfoque personalizado fomenta un circuito de retroalimentación positiva, mejorando las capacidades de aprendizaje de los estudiantes.
La aplicación de ChatGPT en la educación médica sigue siendo un tema de considerable debate. Si bien ChatGPT ofrece funcionalidades innovadoras y ventajas potenciales, también plantea varias preocupaciones éticas y prácticas, el potencial de uso indebido, particularmente en los ámbitos de la educación y el mundo académico. [15]. Como chatbot, ChatGPT carece de la capacidad de pensar críticamente como un ser humano, lo que limita su capacidad para interpretar y analizar información médica más allá de sus algoritmos programados. No posee el juicio ni el discernimiento necesarios para los aspectos éticos o legales de la práctica médica y puede plantear riesgos relacionados con violaciones de datos y privacidad. [16, 17].
El auge de herramientas de inteligencia artificial como ChatGPT ha llevado a la deshonestidad académica, con informes de estudiantes que utilizan la tecnología para hacer trampa en sus trabajos de ensayo. [18]. Algunas investigaciones sugieren que ChatGPT puede no ser un recurso confiable para problemas complejos que requieren habilidades y conocimientos avanzados. [19]. Además, los académicos han estado preocupados por la confiabilidad de ChatGPT como fuente creíble de información. [20]. Según muchos educadores, ChatGPT puede ser utilizado fácilmente para hacer trampa por parte de estudiantes que toman cursos de comunicación y filosofía, pero es fácil de identificar. Una preocupación creciente es que los estudiantes eventualmente perderán la capacidad de generar ideas originales y no podrán presentar argumentos adecuados para demostrar un punto. [21]. La accesibilidad tecnológica es un desafío. El uso eficaz de ChatGPT depende de la conectividad de la red y la disponibilidad del dispositivo, lo que puede resultar problemático en diferentes regiones y entre poblaciones estudiantiles específicas. Se deben desarrollar políticas para utilizar ChatGPT en diferentes entornos técnicos. [22]. Una preocupación es la posible devaluación del aprendizaje cooperativo en la educación médica, particularmente en enfoques tradicionales como ABP, CBL y TBL. La colaboración y el trabajo en equipo son cruciales en estos enfoques, y ChatGPT puede reducir involuntariamente la importancia de las interacciones entre humanos. Mantener un equilibrio entre la tecnología y las relaciones es esencial para un aprendizaje eficaz. Si bien ChatGPT mejora el ABP mediante instrucción personalizada, los educadores deben enfatizar la importancia duradera del aprendizaje basado en el paciente y el trabajo en equipo. A pesar de las capacidades de simulación y los conocimientos teóricos de ChatGPT, no puede reemplazar la experiencia práctica obtenida a través de interacciones en el mundo real, especialmente en la educación médica. Reconocer las limitaciones de los modelos es esencial para evitar una dependencia excesiva del aprendizaje por simulación. Integrar perfectamente ChatGPT en los planes de estudio existentes es un desafío que requiere que los educadores inviertan tiempo en diseñar e integrar componentes impulsados por IA que se alineen con los objetivos generales de aprendizaje. [23]. Dadas estas consideraciones, es esencial utilizar ChatGPT con prudencia como herramienta auxiliar de aprendizaje, complementando en lugar de reemplazar los métodos educativos y las técnicas de investigación tradicionales, y siendo consciente de las limitaciones de ChatGPT.
-
Startups7 meses ago
Remove.bg: La Revolución en la Edición de Imágenes que Debes Conocer
-
Recursos8 meses ago
Cómo Empezar con Popai.pro: Tu Espacio Personal de IA – Guía Completa, Instalación, Versiones y Precios
-
Recursos8 meses ago
Suno.com: La Revolución en la Creación Musical con Inteligencia Artificial
-
Recursos7 meses ago
Perplexity aplicado al Marketing Digital y Estrategias SEO
-
Estudiar IA7 meses ago
Curso de Inteligencia Artificial de UC Berkeley estratégico para negocios
-
Tutoriales8 meses ago
Cómo Comenzar a Utilizar ChatGPT: Una Guía Completa para Principiantes
-
Eventos8 meses ago
La nueva era de la inteligencia artificial por el Washington Post – Mayo 2024
-
Noticias6 meses ago
Dos periodistas octogenarios deman a ChatGPT por robar su trabajo