Connect with us

Noticias

Can Otter and ChatGPT produce a good-enough account of a podcast interview? – Media Nation

Published

on

This post will no doubt have limited appeal, but a few readers might find it interesting. I’ve been thinking about how to produce summaries and news stories based on the podcast that Ellen Clegg and I host, “What Works: The Future of Local News.” The best way would be to pay a student to write it up. But is it also a task that could be turned over to AI?

Purely as an experiment, I took our most recent podcast — an interview with Scott Brodbeck, founder and CEO of Local News Now, in the Virginia suburbs of Washington, D.C. — and turned it over to the robots.

I started by downloading the audio and feeding it into Otter, a web-based transcription service that uses AI to guess at what the speaker might actually be saying. Once I had a transcript, I took a part of it — our conversation with Brodbeck, eliminating the introduction and other features — and fed it into ChatGPT twice, once asking it to produce a 600-word summary and then again to produce a 600-word news story. Important caveat: I did very little to clean up the transcript and did not edit what ChatGPT spit out.

The results were pretty good. I’m guessing it would have been better if I had been using a paid version of ChatGPT, but that would require, you know, money. I’d say that what AI produced would be publishable if some human-powered editing were employed to fix it up. Anyway, here are the results.

The transcript

Q: Scott, so many of the projects that we have looked at are nonprofit, and that trend seems to be accelerating. In fact, we love nonprofit news, but we also worry that there are limits to how much community journalism can be supported by philanthropy. So your project is for profit. How have you made that work? Dan, do you think for profit? Digital only, local news can thrive in other parts of the country as well.

A: I’m agnostic in terms of the future of both business models. I think there are nonprofits doing absolutely fantastic work. I think there are for profits that are doing great work in serving their communities. It is largely a business model distinction, and the thing that the nonprofit lets you do is raise some of that those larger philanthropic dollars or go after large donors in a community block club Chicago is one of the local operations that I respect the most. They’re amazing. The way they do their fundraising and the editorial output and how they serve their readers, absolutely amazing, and that works for them. But if I were to take the same model and try to apply it in Arlington, I don’t necessarily think it would work. It’s a smaller community. The donors who might get excited about serving Chicago, as you know, a city might. There’s just going to be a lot fewer of them, if I’m just talking about Arlington County, here, outside of DC. So for us, the for profit works we’ve had been fortunate to get lots of advertising support from local businesses. We do have some memberships, but it’s less than 10% of our revenue, maybe even less than 5% even with a recent influx when we put out the call. It’s meaningful, but it’s far from the main source of support for. Business model, and that’s what works here each community. What I’ve learned over time, because I’ve looked at potentially expanding to other other areas in years past, for the record, we are pretty firmly ensconced here in the DC area for now, but when I’ve looked at that the difference in each community and just the dynamics, and are you going to get support from advertisers? Are you going to get support from donors or philanthropy. It’s different. This is going back to local. Doesn’t scale. It’s very hard to take what works in one area and just clone, stamp it and apply it somewhere else. That’s a long way of saying that. I think both of these types of models are going to going to coexist, and they’re going to do there’s probably advantages and disadvantages, but as long as you’re serving your readers and as long as you have a viable business or a viable organization in terms of your financials, I think that’s great. I think all should be supported all the above.

Q: When we had Howard Owens of the Batavian on the podcast, he told us that he thinks for profits can actually act more independently than nonprofits, because it’s less harmful to offend one advertiser out of many than to offend one major funder who might be crucial to the whole enterprise. Do you agree with his take?

A: You know, I do, and it’s, I think it’s more of a question of revenue diversification for us. No one advertiser has more than 1% of our revenue as a result. I that’s not something I have to care about. Is what a specific advertiser thinks of a specific, you know, type of coverage we’re doing. We just, we call our own shots and approach, you know, our news coverage the way we we want to do it, without regard of what anybody external thinks. That’s the way to go here. That’s the way you serve readers, is by being independent and being a authentic voice for the community, and not being beholden to what a, you know, specific large donor thinks. Now on the nonprofit side, you know, if they’re relatively, you know, well diversified in terms of no one philanthropy or no one large donor holds too much sway, then I very much think they could be independent. But you know, if there is a situation where a particular nonprofit has a dependency on a single source, you know, I do think that calls into question, to what degree is that affecting editorial judgment? You know, not necessarily a bad thing, but I do think that, you know, you can make ask some questions there about how that’s affecting things.

Q: Scott, I’m looking at your video feed, and that is one of the most impressive mics I’ve ever seen in my life. And it leads me to think that there must be some multimedia aspects to what you’re doing that I’m not aware of. So could you talk about that a little bit?

A: We’ve tried some podcasts here and there. Over the years, there have been two main attempts at making it work. And you know, I think what we’ve found is that for us, what we have done in the past, or newsmaker interviews. We’ve also done a just kind of news discussion amongst some of our journalists, and we found an audience, but it wasn’t a it wasn’t a large audience in relation to our overall readership on the site. You know one thing about local is, especially when you’re online, only is, you are limited. You are limited in what you can do and what your resources are, and you know how much time you can spend on things. And we just ended up, after the last attempt, sunsetted the podcast. Now I the feeds are live. We could bring it back, but in the end, I decided to that we should prioritize reporting, you know, and telling stories that are of relevance to the community. So I still like multimedia. We’re going to try we’re going to be trying some stuff. We’ve been trying some stuff on social media, multimedia wise, we are going to be trying some new things, hopefully in the months to come. I do think that experimentation is important. Try things, see what works, but also don’t be afraid to make the decision if it’s not working, to pull back on it and reprioritize.

Q: Now in looking at one of your sites, ARL, now I see a pretty eclectic mix of pose it’s laid out like an old school blog in reverse chronological order. When I was looking the other day, I saw a restaurant opening an update on towing regulations, a morning Notes feature that aggregates content from other sites, some sponsored content police news and a high school football game. So what makes a local news now? Story are you are you seeking to be the news source of record in the towns that you’re in, or are you a supplement to something else?

A: I think we are. I think we are the most comprehensive local news outlets for each of the communities we serve here in Northern Virginia, and that is certainly the goal within the bounds of the resource. As we have available to us at this point, we have a newsroom of nine in the office behind me. We have about four people who work three days a week, but everybody else is remote. So newsroom is taken as a more conceptual term here. But yeah, we so it’s essentially about three people per community, and we are able to do a lot of coverage because we are able to focus, you know, our energy on reporting, and we don’t have to lay out a paper. We have a lot of automations on the back end of our of our systems where, you know, for social media, the social media posts go out automatically. Nobody has to do that. The newsletter goes out automatically. And so our reporters and editors are able to focus on just reporting the news, breaking stories you know that are of relevance to people in our community, doing the kind of service journalism around everything from what restaurant is opening down the street to, you know, where can I go and buy Christmas trees this year? We try to do everything that anybody in the community might want to know about, or at least, you know, a critical mass of people in the community might want to know about. And this approach, where you kind of mix some of the hard news, the government reporting, the elections, with what some might see as softer news. You know, local business, restaurant openings, development is in there somewhere, policing, public safety. This approach, I see it more and more working in different communities. You know, rough draft Atlanta, community impact in Texas, a number of online those are all kind of digital. You have the paper and the website. I kind of consider them peers and like minded in terms of the approach of coverage to coverage. And you see it elsewhere, with online only outlets. You know, it’s not the only model out there, but for serving a community like ours, which our communities are essentially sub markets of the DC metro area, I think it works pretty well.

Q: Your towns are pretty large, and yet, even so, I have to say three people per community sounds like a luxury in this day.

A: And we achieved this level of staffing thanks to an acquisition. We just acquired the Gazette leader, which was the weekly newspaper serving Arlington County and Fairfax County. So I before, I referenced a newspaper that was only going to the the more well, to do parts of town, and that was the sun Gazette, which was later supplanted by the Gazette leader. We were able to acquire it and the core news team of a news editor and a sports editor, which has really enhanced our coverage since that acquisition. This has been a dream to get to this level. And I do think three people, while by newsrooms, of your standards, might not seem like a lot for a place that would otherwise be served by, you know, a weekly paper. I think we are able to have a lot of impact locally and do a lot of really great reporting and telling stories that would otherwise go untold.

Q: Well, you jumped the gun on the GazetteLeader. So let me ask you about that. Back in September, you acquired a print newspaper, converted it to digital only and said you would be expanding coverage. In fact, you quoted me when I was looking at your website, I did not see the GazetteLeader listed as one of your offerings.

A: What’s going on with that is the print paper has gotten more expensive to print and produce and to distribute, rather at the same time, there’s been softening of demand for print advertising, as I understand it now, it still works in many communities, but for whatever reason, it wasn’t working here. So as a result, this was not a we just acquired the assets, the digital assets, of the Z leader, and we’re able to hire over the team, which is fantastic for our coverage, but it does mean that, unfortunately, it’s no longer in print. Now, I’ve been in talks to potentially partner with someone to put out a print publication locally. I’ve been in some talks about that. It’s far from a done deal. So there might be a revival of print in some form or fashion somewhere in our coverage area down the road. We’ll have to see how that plays out. It’s not a business that I want to have to learn a lot about and get into. You know, I think the future is clearly online. And so my goal in all this has been to figure out a enduring model for online only local news. I think we’ve figured out a lot, but I don’t have all the answers, and we’re since the acquisition and some of the additional costs we took on, we’re right about at our monthly average revenue, in terms of our expenses, we need to continue to grow from a business standpoint, and that’s what I’m focused on in the months to come. None of this is easy. You know, print, online, it’s all hard.

Q: It’s definitely not easy. But my my question was, I didn’t see the GazetteLeader offered. As a digital offering, either is the coverage area that was served by the GazetteLeader still being covered by by your network?

A: So it covered there were separate additions at one point for Arlington and for Fairfax County, and it was mostly focused on specific parts of Fairfax County, as opposed to the entire county. Long story short, we we were already covering those, and so essentially, we just absorbed the staff and the reporting they were doing, which was, you know, somewhat different than ours. Scott McCaffrey, the editor, the news editor, who came over as part of the deal, he goes to, like every single government meeting there is in Arlington, Fairfax County, and now he’s doing more in Falls Church, which is a little, little tiny city in between. Before I had been content, you know, you made note of our morning notes, where we link out to other news outlets covering news of interest to Arlington and Fairfax County. We do that from from both sides, and I was content to link to his coverage for a long time, while he was doing it. And I do think it’s important to do, but I’m like, as long as Scott’s there, he’s gonna be he’s gonna be on this, like, we can link to his coverage and focus more on, you know, what we can do uniquely well. And now we have both. We have what we were doing before, and we have Scott’s coverage, which was, you know, there was some overlap, but was differentiated. We have his coverage on both our Arlington and Fairfax site. So essentially, all the journalism that they were producing that was unique to that paper, we are now doing online on our sites.

Q: I see on your website that you offer what could be called B to B services, client services to other news outlets. What can you tell us about that?

A: So this is the services that we’re providing to pop fill and to moco show. And one thing that’s pretty clear from from the 15 years of doing this is that every part of this is hard. You know, as the the news side is hard, the sales and advertising side is hard, the membership side is hard, but also the technology bit is not easy, particularly if you have a lot of readership. Now, if you, if you’re just, you know, doing 100,000 page views or less per month, then you can probably, you know, have a bog standard WordPress site on shared hosting and be fine. But our sites, you know, our Arlington site, pop, fill, moco show, they have one, one and a half to 2 million page views per month each. And at that level, you’re talking about enterprise grade hosting, you’re talking about all sorts of little problems that come up that someone needs to fix. And while local news doesn’t scale from an editorial standpoint and sometimes a business standpoint, the technology side certainly scales. And so being on the same WordPress installation, and we have our own custom built WordPress theme that is a little more chronological feed style, as opposed to the more you know, newspaper style home page that’s been in vogue for a while. Being on the same theme allows us to also find some efficiencies in terms of our sales, so that we can go to a regional advertiser and put the same ad unit or the same type of sponsored content with the same call to action button at the at the bottom on any of the sites that we serve.

600-word summary

In a recent conversation, Scott discussed the viability and challenges of for-profit digital-only local news outlets, sharing insights into his business model and how it has evolved. Scott’s project, a for-profit news outlet serving the Northern Virginia region, provides a stark contrast to the growing trend of nonprofit local journalism. While some worry about the sustainability of community journalism funded by philanthropy, Scott believes both nonprofit and for-profit models can coexist, each with their own strengths.

He emphasizes that a for-profit model works well for his community, particularly because it allows for advertising support from local businesses. Despite having some membership revenue, it is a minor part of the income stream. He notes that the dynamics of each community vary, making it difficult to replicate successful models from one area to another. A model that works in a large city like Chicago may not be feasible in a smaller town like Arlington, Virginia, where local donors and advertisers are fewer.

Scott also agrees with Howard Owens’ view that for-profit outlets can sometimes be more independent than nonprofits. He points out that, in his model, no single advertiser makes up a significant portion of the revenue, allowing the news team to operate without undue influence. While nonprofit outlets can be independent as long as they maintain revenue diversification, Scott highlights that dependence on a single donor can raise concerns about editorial independence.

Regarding multimedia efforts, Scott mentions that his team has experimented with podcasts and social media content. While they initially found success with these formats, they decided to focus on reporting, recognizing the limitations of resources in a local, digital-only newsroom. However, they continue to experiment with new formats as part of their strategy to engage their audience.

Scott’s outlet covers a broad range of local news, from restaurant openings to public safety, government meetings, and high school sports. He aims to be the most comprehensive local news source for his community, focusing on stories that are of relevance to the area. This includes a mix of hard news, community updates, and “softer” content like local events. Despite being a small team, Scott believes they have a significant impact because they focus on local reporting and use technology to streamline operations, such as automating social media posts and newsletters.

A significant recent development for Scott’s outlet was the acquisition of the Gazette Leader, a former print newspaper. After absorbing the paper’s staff and digital assets, Scott transitioned it to a fully digital operation. Although the print version was discontinued due to rising costs and declining demand for print ads, the acquired team has greatly enhanced their coverage of Arlington and Fairfax counties. Scott notes that while the Gazette Leader is no longer in print, the expanded team continues to produce local reporting for the digital platforms, filling gaps in coverage.

Scott also touched on his outlet’s B2B services, where they provide technological and advertising solutions to other local news organizations like Popville and MoCo Show. [Note: ChatGPT actually got these two names right, although “Popville” should be rendered as “PoPville.”] With each site receiving over a million page views per month, the technical demands are high, and Scott’s team has developed a custom-built WordPress theme to handle the scale. This collaboration not only enhances the editorial content across these sites but also enables efficiencies in sales and advertising, allowing regional advertisers to reach multiple local outlets through a unified platform.

Overall, Scott’s approach underscores the importance of adaptability and experimentation in the local news space. While the business of local journalism is undoubtedly challenging, he remains focused on creating a sustainable model that balances quality reporting with financial viability, leveraging both innovative technology and a strong connection to the community.

600-word news story

Local Digital News Model Finds Success Amid Nonprofit vs. For-Profit Debate

As community journalism faces financial challenges across the U.S., a growing debate between nonprofit and for-profit business models continues to shape the future of local news. Scott, the owner of a digital-only news outlet in Northern Virginia, offers a unique perspective, arguing that both models can coexist, each with distinct advantages. His outlet, which covers multiple communities in the D.C. metro area, blends news with a revenue-driven approach, demonstrating how for-profit digital journalism can thrive in an increasingly competitive landscape.

While nonprofit news organizations have gained traction in recent years, especially with the backing of philanthropic donations, Scott points out that there are limits to what these sources can achieve, especially in smaller communities. His outlet, which primarily relies on local advertising, has found success by catering to a specific audience and fostering deep local engagement. “The key is understanding your community,” he says. “What works in Arlington, Virginia, won’t necessarily work in other places. That’s why for-profit can thrive in certain areas.”

Scott stresses that the for-profit model allows for greater independence in editorial decisions, citing a perspective shared by Howard Owens of The Batavian. Owens argued that for-profit outlets, with a diversified advertiser base, can maintain editorial freedom by not being beholden to large donors, a concern for nonprofit outlets reliant on a few major philanthropists. “No single advertiser represents more than 1% of our revenue,” Scott notes, explaining that this independence allows them to cover stories without external pressure.

This freedom to cover diverse topics—from hard news like local elections and government meetings to more community-centric stories like restaurant openings and high school football games—is central to Scott’s approach. His site is a digital blend of old-school blogging and comprehensive reporting. With nine full-time staffers and a dedicated crew working remotely, his outlet has managed to serve multiple Northern Virginia communities, despite having a modest newsroom by traditional standards. “We try to be the most comprehensive local news outlet we can be within our resource constraints,” Scott explains.

The outlet has expanded recently through the acquisition of the Gazette Leader, a weekly print publication. After absorbing the editorial team, Scott converted the paper’s content into a digital format, enhancing coverage of Arlington and Fairfax Counties. While the Gazette Leader is no longer printed, Scott sees the acquisition as a step forward for local digital journalism. The transition has allowed his team to bolster coverage with more in-depth reporting from veteran journalists like Scott McCaffrey, who previously covered local government meetings. This has strengthened the outlet’s position as a key player in local news.

In addition to growing coverage, Scott’s outlet offers a unique business model by providing technology services to other news outlets. With a digital infrastructure capable of handling millions of page views, the site helps smaller outlets like Popville and MoCo Show streamline their technology and advertising operations. This collaboration allows for shared advertising and technical resources, creating efficiencies for smaller outlets that might otherwise struggle with the challenges of scaling their digital operations. “As the technology side of digital journalism scales, we can pass on some of those efficiencies to others,” Scott explains.

While Scott’s outlet has proven that digital-only, for-profit local news can succeed, he remains cautious about the future. He is keenly aware of the financial hurdles facing the industry, especially after the costs of acquiring the Gazette Leader. Despite this, he maintains that both nonprofit and for-profit outlets play essential roles in serving their communities. “The most important thing is to keep experimenting, adapting, and making sure you’re meeting the needs of your readers,” he says.

In an era where local news outlets are disappearing, Scott’s model offers a potential path forward, demonstrating that while the challenges are significant, innovation and community focus can still make local, for-profit digital journalism a viable and impactful business.


Discover more from Media Nation

Subscribe to get the latest posts sent to your email.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

Esto es lo que debes saber

Published

on

El lunes, la startup china de inteligencia artificial DeepSeek tomó el codiciado lugar de su rival OpenAI como la aplicación gratuita más descargada en los EE. UU. Manzana‘s App Store, destronando a ChatGPT para el asistente de inteligencia artificial de DeepSeek. Las acciones tecnológicas mundiales se vendieron y estaban en camino de eliminar miles de millones en capitalización de mercado.

Líderes tecnológicos, analistas, inversores y desarrolladores dicen que la exageración (y el consiguiente temor de quedarse atrás en el siempre cambiante ciclo exagerado de la IA) puede estar justificada. Especialmente en la era de la carrera armamentista generativa de la IA, donde tanto los gigantes tecnológicos como las nuevas empresas compiten para asegurarse de no quedarse atrás en un mercado que se prevé superará el billón de dólares en ingresos dentro de una década.

¿Qué es DeepSeek?

DeepSeek fue fundada en 2023 por Liang Wenfeng, cofundador de High-Flyer, un fondo de cobertura cuantitativo centrado en la IA. Según se informa, la startup de IA surgió de la unidad de investigación de IA del fondo de cobertura en abril de 2023 para centrarse en grandes modelos de lenguaje y alcanzar la inteligencia artificial general, o AGI, una rama de la IA que iguala o supera al intelecto humano en una amplia gama de tareas, que OpenAI y sus rivales dicen que lo están persiguiendo rápidamente. DeepSeek sigue siendo propiedad total de High-Flyer y financiado por ella, según analistas de Jefferies.

Los rumores en torno a DeepSeek comenzaron a cobrar fuerza a principios de este mes, cuando la startup lanzó R1, su modelo de razonamiento que rivaliza con el o1 de OpenAI. Es de código abierto, lo que significa que cualquier desarrollador de IA puede usarlo, y se ha disparado a la cima de las tiendas de aplicaciones y tablas de clasificación de la industria, y los usuarios elogian su rendimiento y capacidades de razonamiento.

Al igual que otros chatbots chinos, tiene sus limitaciones cuando se le pregunta sobre ciertos temas: cuando se le pregunta sobre algunas de las políticas del líder chino Xi Jinping, por ejemplo, DeepSeek supuestamente aleja al usuario de líneas de preguntas similares.

Otra parte clave de la discusión: el R1 de DeepSeek se construyó a pesar de que Estados Unidos limitó las exportaciones de chips a China tres veces en tres años. Las estimaciones difieren sobre cuánto cuesta exactamente el R1 de DeepSeek o cuántas GPU se incluyen en él. Los analistas de Jefferies estimaron que una versión reciente tenía un “coste de capacitación de sólo 5,6 millones de dólares (suponiendo un costo de alquiler de 2 dólares por hora y 800 horas). Eso es menos del 10% del costo de Meta‘s Llama.” Pero independientemente de las cifras específicas, los informes coinciden en que el modelo fue desarrollado a una fracción del costo de los modelos rivales por OpenAI, Anthropic, Google y otros.

Como resultado, el sector de la IA está inundado de preguntas, entre ellas si el creciente número de rondas de financiación astronómicas y valoraciones de miles de millones de dólares de la industria es necesaria, y si una burbuja está a punto de estallar.

Lea más informes de CNBC sobre IA

Acciones de NVIDIA cayó un 11%, con el fabricante de chips ASML bajó más del 6%. El Nasdaq cayó más del 2% y cuatro gigantes tecnológicos… Meta, microsoft, Manzana y ASML están listos para informar sus ganancias esta semana.

Los analistas de Raymond James detallaron algunas de las preguntas que afectan a la industria de la IA este mes y escribieron: “¿Cuáles son las implicaciones para la inversión? ¿Qué dice sobre los modelos de código abierto versus los propietarios? ¿Invertir dinero en GPU es realmente una panacea? ¿Existen restricciones a las exportaciones de Estados Unidos? ¿Cuáles son las implicaciones más amplias de [DeepSeek]? Bueno, podrían ser espantosos o no ser un evento, pero tengan la seguridad de que la industria está llena de incredulidad y especulación”.

Los analistas de Bernstein escribieron en una nota el lunes que “según las muchas (ocasionalmente histéricas) tomas calientes que vimos [over the weekend,] las implicaciones van desde ‘Eso es realmente interesante’ hasta ‘Esta es la sentencia de muerte del complejo de infraestructura de IA tal como lo conocemos'”.

Cómo están respondiendo las empresas estadounidenses

Algunos directores ejecutivos de tecnología estadounidenses están luchando por responder antes de que los clientes cambien a ofertas potencialmente más baratas de DeepSeek, y se informa que Meta está iniciando cuatro “salas de guerra” relacionadas con DeepSeek dentro de su departamento de IA generativa.

microsoft El director ejecutivo Satya Nadella escribió en X que el fenómeno DeepSeek era solo un ejemplo de la paradoja de Jevons: “A medida que la IA se vuelva más eficiente y accesible, veremos cómo su uso se dispara, convirtiéndola en un bien del que simplemente no podemos tener suficiente”. “. El director ejecutivo de OpenAI, Sam Altman, tuiteó una cita que atribuyó a Napoleón y escribió: “Una revolución no se puede hacer ni detener. Lo único que se puede hacer es que uno de sus hijos le dé una dirección a fuerza de victorias”.

Yann LeCun, científico jefe de IA de Meta, escribió en LinkedIn que el éxito de DeepSeek es indicativo del cambio de rumbo en el sector de la IA para favorecer la tecnología de código abierto.

LeCun escribió que DeepSeek se ha beneficiado de parte de la tecnología propia de Meta, es decir, sus modelos Llama, y ​​que la startup “ideó nuevas ideas y las construyó sobre el trabajo de otras personas. Debido a que su trabajo está publicado y es de código abierto, todos pueden sacar provecho de ello. Ese es el poder de la investigación abierta y del código abierto”.

Alexandr Wang, director ejecutivo de Scale AI, dijo a CNBC la semana pasada que el último modelo de IA de DeepSeek fue “revolucionario” y que su versión R1 es aún más poderosa.

“Lo que hemos descubierto es que DeepSeek… tiene el mejor rendimiento, o aproximadamente está a la par de los mejores modelos estadounidenses”, dijo Wang, añadiendo que la carrera de IA entre EE.UU. y China es una “guerra de IA”. La empresa de Wang proporciona datos de entrenamiento a actores clave de la IA, incluidos OpenAI, Google y Meta.

A principios de esta semana, el presidente Donald Trump anunció una empresa conjunta con OpenAI, Oracle y SoftBank para invertir miles de millones de dólares en infraestructura de IA en Estados Unidos. El proyecto, Stargate, fue presentado en la Casa Blanca por Trump, el director ejecutivo de SoftBank, Masayoshi Son, el cofundador de Oracle, Larry Ellison, y el director ejecutivo de OpenAI, Sam Altman. Los socios tecnológicos iniciales clave incluirán a Microsoft, Nvidia y Oracle, así como a la empresa de semiconductores Arm. Dijeron que invertirían 100.000 millones de dólares para empezar y hasta 500.000 millones de dólares en los próximos cuatro años.

IA evolucionando

La noticia de la destreza de DeepSeek también llega en medio del creciente revuelo en torno a los agentes de IA (modelos que van más allá de los chatbots para completar tareas complejas de varios pasos para un usuario) que tanto los gigantes tecnológicos como las nuevas empresas están persiguiendo. Meta, Google, Amazon, Microsoft, OpenAI y Anthropic han expresado su objetivo de crear IA agente.

Anthropic, la startup de IA respaldada por Amazon y fundada por ex ejecutivos de investigación de OpenAI, intensificó su desarrollo tecnológico durante el año pasado y, en octubre, la startup dijo que sus agentes de IA podían usar computadoras como humanos para completar tareas complejas. La capacidad de uso de computadoras de Anthropic permite que su tecnología interprete lo que hay en la pantalla de una computadora, seleccione botones, ingrese texto, navegue por sitios web y ejecute tareas a través de cualquier software y navegación por Internet en tiempo real, dijo la startup.

La herramienta puede “usar computadoras básicamente de la misma manera que nosotros”, dijo a CNBC Jared Kaplan, director científico de Anthropic, en una entrevista en ese momento. Dijo que puede realizar tareas con “decenas o incluso cientos de pasos”.

OpenAI lanzó una herramienta similar la semana pasada, introduciendo una función llamada Operador que automatizará tareas como planificar vacaciones, completar formularios, hacer reservas en restaurantes y pedir alimentos.

El microsoft-La startup respaldada lo describe como “un agente que puede ir a la web para realizar tareas por usted” y agregó que está capacitado para interactuar con “los botones, menús y campos de texto que la gente usa a diario” en la web. También puede hacer preguntas de seguimiento para personalizar aún más las tareas que realiza, como información de inicio de sesión para otros sitios web. Los usuarios pueden tomar el control de la pantalla en cualquier momento.

Continue Reading

Noticias

Esto es lo que debes saber: NBC 6 South Florida

Published

on

  • El zumbido alrededor de la startup de IA China Deepseek comenzó a recoger a Steam a principios de este mes, cuando la startup lanzó R1, su modelo de razonamiento que rivaliza con el O1 de Openai.
  • El lunes, Deepseek se hizo cargo del lugar codiciado de su rival Openai para la aplicación gratuita más descargada en los EE. UU. En la App Store de Apple, destronando a Chatgpt para el asistente de IA de Deepseek.
  • Global Tech Stocks se vendió, con el gigante de chip de IA Nvidia cayendo un 10%.

El lunes, la startup de inteligencia artificial china Deepseek se hizo cargo del lugar codiciado de su rival Openai como la aplicación gratuita más desactivada en los EE. UU. En la tienda de aplicaciones de Apple, destronando Chatgpt para el asistente de IA de Deepseek. Las acciones de Global Tech se vendieron y estaban en camino de acabar con miles de millones en el límite de mercado.

Los líderes tecnológicos, analistas, inversores y desarrolladores dicen que el bombo, y el consiguiente temor de quedarse atrás en el ciclo de bombo de IA en constante cambio, pueden estar justificados. Especialmente en la era de la carrera armamentista generativa de IA, donde los gigantes tecnológicos y las startups están corriendo para garantizar que no se queden atrás en un mercado previsto para superar los ingresos de $ 1 billón en una década.

¿Qué es Deepseek?

Deepseek fue fundada en 2023 por Liang Wenfeng, cofundador de High-Flyer, un fondo cuantitativo de cobertura centrado en la IA. Según los informes, la startup de IA surgió de la Unidad de Investigación de AI del fondo de cobertura en abril de 2023 para centrarse en modelos de idiomas grandes y alcanzar la inteligencia general artificial, o AGI, una rama de IA que iguala o supere el intelecto humano en una amplia gama de tareas, que se abren. Y sus rivales dicen que están persiguiendo rápidamente. Deepseek sigue siendo propiedad y financiado por High-Flyer, según analistas de Jefferies.

El zumbido alrededor de Deepseek comenzó a recoger a Steam a principios de este mes, cuando la startup lanzó R1, su modelo de razonamiento que rivaliza con el O1 de OpenAI. Es de código abierto, lo que significa que cualquier desarrollador de IA puede usarlo, y se ha disparado a la cima de las tiendas de aplicaciones y las tablas de clasificación de la industria, con los usuarios elogios de su rendimiento y capacidades de razonamiento.

Al igual que otros chatbots chinos, tiene sus limitaciones cuando se les pregunta sobre ciertos temas: cuando se le pregunta sobre algunas de las políticas del líder chino Xi Jinping, por ejemplo, Deepseek aleja al usuario de líneas similares de preguntas.

Otra parte clave de la discusión: R1 de Deepseek se construyó a pesar de las exportaciones de chips de EE. UU. A China tres veces en tres años. Las estimaciones difieren exactamente en la cantidad de R1 de Deepseek, o en cuántas GPU entró. Los analistas de Jefferies estimaron que una versión reciente tenía un “costo de capacitación de solo US $ 5,6 millones (suponiendo un costo de alquiler de US $ 2/h800 horas). Eso es menos del 10% del costo de la LLAMA de Meta”. Pero independientemente de los números específicos, los informes acuerdan que el modelo se desarrolló a una fracción del costo de los modelos rivales por OpenAI, Anthrope, Google y otros.

Como resultado, el sector de la IA está inundado de preguntas, incluido si es necesario el creciente número de rondas de financiación astronómica y las valoraciones de mil millones de dólares, y si una burbuja está a punto de estallar.

Las acciones de NVIDIA cayeron un 11%, con el fabricante de chips ASML más del 6%. El NASDAQ cayó por 2%, y cuatro gigantes tecnológicos: Meta, Microsoft, Apple y ASML están listos para informar las ganancias esta semana.

Los analistas de Raymond James detallaron algunas de las preguntas que afectan a la industria de la IA este mes, escribiendo: “¿Cuáles son las implicaciones de inversión? ¿Qué dice sobre los modelos de origen abierto versus patentado? ¿Está arrojando dinero a las GPU realmente una panacea? trabajando? ¿Cuáles son las implicaciones más amplias de [DeepSeek]? Bueno, podrían ser terribles o un no evento, pero tengan la seguridad de que la industria está llena de incredulidad y especulación “.

Los analistas de Bernstein escribieron en una nota el lunes que “según las muchas tomas (ocasionalmente histéricas) que vimos que vimos [over the weekend,] El rango de implicaciones en cualquier lugar desde ‘eso es realmente interesante’ hasta ‘Esta es la luz de muerte del complejo de infraestructura de IA tal como lo conocemos’ “.

Cómo están respondiendo las empresas estadounidenses

Algunos CEO de tecnología estadounidense están trepando por responder antes de que los clientes cambien a ofertas potencialmente más baratas de Deepseek, y Según los informes, Meta inicia cuatro “salas de guerra” relacionadas con Deepseek dentro de su departamento generativo de IA.

El CEO de Microsoft, Satya Nadella, escribió en X que el fenómeno de Deepseek era solo un ejemplo de la paradoja de Jevons, escribiendo, “A medida que AI se vuelve más eficiente y accesible, veremos su uso Skyroocket, convirtiéndolo en una mercancía, simplemente no podemos obtener suficiente de.” El CEO de Operai, Sam Altman, tuiteó una cita que atribuyó a Napoleón, escribiendo: “Una revolución no se puede hacer ni detener.

Yann Lecun, el jefe científico de AI de Meta, escribió en LinkedIn que el éxito de Deepseek es indicativo de cambiar las mareas en el sector de IA para favorecer la tecnología de código abierto.

Lecun escribió que Deepseek se ha beneficiado de algunas de la propia tecnología de Meta, es decir, sus modelos de llama, y ​​que la startup “se les ocurrió nuevas ideas y las construyó en la parte superior del trabajo de otras personas. Debido a que su trabajo es publicado y de código abierto, todos pueden Se beneficia de él.

Alexandr Wang, CEO de Scale AI, le dijo a CNBC la semana pasada que el último modelo de IA de Deepseek fue “devastador de la tierra” y que su lanzamiento de R1 es aún más poderoso.

“Lo que hemos encontrado es que Deepseek … es el mejor desempeño, o aproximadamente a la par con los mejores modelos estadounidenses”, dijo Wang, y agregó que la carrera de IA entre los Estados Unidos y China es una “guerra de IA”. La compañía de Wang proporciona datos de capacitación a jugadores clave de IA, incluidos OpenAI, Google y Meta.

A principios de esta semana, presidente Donald Trump anunció una empresa conjunta con OpenAI, Oracle y Softbank para invertir miles de millones de dólares en infraestructura de IA de EE. UU. El proyecto, Stargate, fue presentado en la Casa Blanca por Trump, el CEO de SoftBank, Masayoshi,, cofundador Larry Ellison, y el CEO de Operai, Sam Altman. Los socios de tecnología iniciales clave incluirán Microsoft, Nvidia y Oracle, así como el brazo de la compañía de semiconductores. Dijeron que invertirían $ 100 mil millones para comenzar y hasta $ 500 mil millones en los próximos cuatro años.

AI evolucionando

La noticia de la destreza de Deepseek también se produce en medio de la creciente exageración en torno a los agentes de IA, modelos que van más allá de los chatbots para completar tareas complejas de varios pasos para un usuario, que los gigantes tecnológicos y las startups están persiguiendo. Meta, Google, Amazon, Microsoft, Openai y Anthrope han expresado su objetivo de construir IA de agente.

Anthrope, la startup de IA respaldada por Amazon fundada por ex ejecutivos de investigación de Openai, aumentó su desarrollo de tecnología durante el año pasado, y en octubre, la startup dijo que sus agentes de IA pudieron usar computadoras como humanos para completar tareas complejas. La capacidad de uso de la computadora de Anthrope permite que su tecnología interprete lo que está en la pantalla de una computadora, seleccione botones, ingrese texto, navegue por los sitios web y ejecute tareas a través de cualquier software y navegación en Internet en tiempo real, dijo la startup.

La herramienta puede “usar computadoras básicamente de la misma manera que lo hacemos”, dijo Jared Kaplan, director científico de Anthrope, a CNBC en una entrevista en ese momento. Dijo que puede hacer tareas con “decenas o incluso cientos de pasos”.

Openai lanzó una herramienta similar la semana pasada, presentando una característica llamada operador que automatizará tareas como planificar vacaciones, completar formularios, hacer reservas de restaurantes y ordenar comestibles.

La startup respaldada por Microsoft lo describe como “un agente que puede ir a la web para realizar tareas para usted”, y agregó que está capacitado para interactuar con “los botones, los menús y los campos de texto que las personas usan a diario” en la web . También puede hacer preguntas de seguimiento para personalizar aún más las tareas que completa, como la información de inicio de sesión para otros sitios web. Los usuarios pueden tomar el control de la pantalla en cualquier momento.

Continue Reading

Noticias

¿Por qué DeepSeek AI de repente es tan popular?

Published

on

OpenAI lanzó su agente Operador AI para ChatGPT el jueves, lo que debería haber sido un hito importante para la empresa y el desarrollo de la IA en general. Si bien no pagaría $200 al mes para probar esta versión inicial de Operador, lo que vi en las demostraciones de OpenAI me dejó alucinado. El operador está muy por delante de los agentes de inteligencia artificial de Google, al menos en lo que respecta a demostraciones. No puedo esperar a tenerlo en mis manos una vez que OpenAI lo lleve a otros niveles pagos de ChatGPT y, lo que es más importante para mí personalmente, a la UE.

Sin embargo, la verdadera historia de la IA que se está apoderando del mundo no es ChatGPT, Operador o el enorme proyecto Stargate que se anunció la semana pasada. La historia de DeepSeek AI se apoderó del mundo cuando la startup china lanzó su modelo de razonamiento R1 que puede igualar el ChatGPT o1 de OpenAI.

No hay nada sorprendente en eso; Esperamos que otras empresas de IA igualen o1. Después de todo, OpenAI ya presentó o3, que debería anunciarse en unos días o semanas. Lo inusual de DeepSeek es que la empresa china hizo que sus modelos fueran de código abierto, por lo que cualquier empresa o desarrollador puede acceder a ellos e inspeccionarlos. Más interesante es el artículo de investigación sobre R1 que publicó DeepSeek, que afirma que el modelo altamente sofisticado fue entrenado a una fracción del costo del o1 de OpenAI.

La noticia de que el entrenamiento de DeepSeek R1 es posible con solo del 3% al 5% de los recursos que OpenAI necesita para un progreso similar con ChatGPT causó sensación en todo el mundo. Las acciones relacionadas con la IA se desplomaron durante las primeras operaciones del lunes, justo cuando DeepSeek saltó hasta convertirse en el número uno en la App Store, superando a ChatGPT.

Uno de los problemas del software de IA actual tiene que ver con el coste de desarrollo y uso del producto. Desarrollar modelos avanzados como o1 puede costar decenas de millones. El proceso requiere tarjetas gráficas (GPU) de alta gama que proporcionen la potencia informática y el gasto de energía necesarios.

Es por eso que los productos terminados como ChatGPT o1 no pueden estar disponibles de forma gratuita y sin limitaciones. Empresas como OpenAI necesitan cubrir costos y obtener ganancias. Es por eso que el enorme programa Stargate de 500 mil millones de dólares es una decisión tan monumental para el desarrollo de la IA, especialmente considerando la inevitable carrera armamentista de IA entre Estados Unidos y China.

Agregue las sanciones de EE. UU. que impiden que China acceda a los mismos chips y GPU de alta gama que hacen posible el desarrollo de productos ChatGPT o1, y uno pensaría que ChatGPT, Gemini, Meta AI y Claude no pueden obtener una competencia significativa de China.

Ahí es donde DeepSeek sorprendió al mundo. La startup china sabía que no podía competir contra OpenAI basándose en la potencia bruta. No podría tener acceso a la misma cantidad de GPU que acaparan empresas como OpenAI. Entonces, los investigadores de DeepSeek adoptaron otro enfoque para R1 y encontraron formas de entrenar un modelo de razonamiento avanzado sin acceso al mismo hardware.

No es sólo eso, sino que DeepSeek hizo que el acceso a R1 fuera mucho más barato que ChatGPT de OpenAI, lo cual es un avance significativo. Agregue la naturaleza de código abierto de los modelos DeepSeek y podrá ver por qué los desarrolladores acudirían en masa para probar la IA de la empresa china y por qué DeepSeek surgiría en la App Store.

Según la investigación, la startup china reemplazó la tecnología Supervised Fine-Tuning (SFT) que OpenAI utiliza para entrenar ChatGPT con Reinforcement Learning (RL) para producir resultados más rápidos y económicos. SFT se basa en mostrarle a la IA formas de resolver problemas brindando acceso a los datos para que la IA sepa qué tipo de respuestas brindar a varias indicaciones.

RL se basa en el modelo de IA, intenta descubrir las respuestas con un sistema de recompensa implementado y luego proporciona retroalimentación a la IA. RL permitió a DeepSeek mejorar las capacidades de razonamiento de R1 y superar la falta de computación. Sin embargo, como VentureBeat explica, se necesitaba algo de entrenamiento SFT, donde los humanos supervisan la IA, en las primeras fases de R1 antes de cambiar a RL.

Si bien señalé los inconvenientes obvios de depender de un rival de ChatGPT de China en este momento, no hay duda de que DeepSeek merece atención.

Como mínimo, las innovaciones que desarrollaron los investigadores de DeepSeek se pueden copiar en otros lugares para lograr avances similares. Después de todo, las primeras versiones de DeepSeek mostraron que la startup china podría haber copiado el trabajo de desarrollo de ChatGPT. Ya sea IA u otra cosa, las innovaciones tecnológicas siempre serán robadas y adaptadas.

Piénselo: a DeepSeek se le ocurrió una forma más eficiente de entrenar la IA utilizando solo unas 50.000 GPU, 10.000 de las cuales eran GPU NVIDIA compradas antes de las restricciones a las exportaciones de EE. UU. Comparativamente, empresas como OpenAI, Google y Anthropic operan con más de 500.000 GPU cada una, por VentureBeat.

Me imagino que los investigadores de estas empresas ahora están compitiendo para ver cómo y si pueden replicar el éxito de DeepSeek R1. También me imagino que encontrarán formas de hacerlo.

Con tanta computación y recursos a disposición de OpenAI, Google, Meta y Anthropic, pronto serán posibles avances similares a R1 además de lo que ya está disponible en los modelos de IA.

Además, si bien el mercado se vio afectado por las noticias sobre la IA de DeepSeek en China, no creo que el hardware, la potencia informática y la energía no importen en el futuro del desarrollo de la IA. Nuevamente, combine las innovaciones de DeepSeek con, digamos, un fondo de 500 mil millones de dólares y acceso a tarjetas gráficas de alta tecnología NVIDIA, y podría obtener las primeras fases de AGI.

Una vez que se empleen métodos similares a DeepSeek R1 para el desarrollo de ChatGPT y Gemini, los costos del acceso avanzado a la IA probablemente disminuirán para los usuarios premium. Esta sería una victoria clave para los consumidores.

Las empresas occidentales de IA no podrán mantener los costos altos y competir con DeepSeek R1 y sus sucesores. Algunos desarrolladores siempre elegirán los modelos más baratos a pesar del país de origen de la IA y el sesgo de entrenamiento. Como recordatorio, los modelos de DeepSeek mostrarán un sesgo hacia China. Este sigue siendo un software que debe cumplir con las leyes de censura locales.

Señalaré que China no se quedará de brazos cruzados. Estas son victorias tempranas. DeepSeek no está solo, ya que ByteDance también lanzó un chatbot de primer nivel. Se invertirán miles de millones de dólares en el desarrollo de la IA en el país para computación y energía. Recuerde, no todo lo que viene de China puede tomarse al pie de la letra. No está claro si los costos de entrenar DeepSeek son reales. La transparencia sólo funciona hasta cierto punto.

Afortunadamente, debido a que DeepSeek es de código abierto, otros pronto podrán ver si el entrenamiento similar al R1 se puede realizar con éxito en otros lugares.

VentureBeat hace un gran trabajo explicando las complejidades del desarrollo de DeepSeek R1 en este enlace. El documento técnico de DeepSeek que acompaña al lanzamiento de R1 el lunes se puede encontrar en GitHub.

Continue Reading

Trending