Noticias
Deepseek vs. Chatgpt Fuels debate sobre bloques de construcción de IA

Cuando la startup china Deepseek lanzó su modelo de IA este mes, fue aclamado como un avance, una señal de que las compañías de inteligencia artificial de China podrían competir con sus homólogos de Silicon Valley utilizando menos recursos.
La narración era clara: Deepseek había hecho más con menos, encontrando soluciones inteligentes para las restricciones de chips de EE. UU. Sin embargo, esa historia ha comenzado a cambiar.
Operai, la compañía con sede en los Estados Unidos detrás de ChatGPT, ahora afirma que Deepseek puede haber utilizado de manera incorrecta sus datos patentados para capacitar a su modelo, planteando preguntas sobre si el éxito de Deepseek fue realmente una maravilla de la ingeniería.
En declaraciones a varios medios de comunicación esta semana, Operai dijo que está revisando las indicaciones de que Deepseek pudo haber capacitado a su IA imitando las respuestas de los modelos de Openai.
El proceso, conocido como destilación, es común entre los desarrolladores de IA, pero está prohibido por los términos de servicio de OpenAI, que prohíben el uso de sus resultados modelo para capacitar a los sistemas competidores.
Algunos funcionarios estadounidenses parecen apoyar las preocupaciones de Openai. En su audiencia de confirmación esta semana, el nominado al Secretario de Comercio, Howard Lutnick, acusó a Deepseek de mal uso de la tecnología estadounidense para crear un modelo de IA “barato”.
“Robaron cosas. Ingresaron. Han tomado nuestra IP”, dijo Lutnick sobre China.
David Sacks, el zar de la Casa Blanca para la IA y la criptomoneda, fue más medido, y dijo solo que es “posible” que Deepseek nos hubiera robado propiedad intelectual de los Estados Unidos.
En una entrevista con Cable News Network Fox News, Sacks agregó que existe una “evidencia sustancial” de que Deepseek “destiló el conocimiento de los modelos de Openai”, y agregó que se necesitan esfuerzos más fuertes para frenar el aumento de los sistemas de IA “imitadores”.
En el centro de la disputa hay una pregunta clave sobre el futuro de la IA: ¿cuánto control debería tener las empresas sobre sus propios modelos de IA, cuando esos programas se construyeron utilizando datos tomados de otros?
Lucha de datos de IA
La pregunta es especialmente relevante para OpenAI, que enfrenta sus propios desafíos legales. La compañía ha sido demandada por varias compañías de medios y autores que lo acusan de usar ilegalmente material con derechos de autor para capacitar a sus modelos de IA.
Justin Hughes, profesor de la Facultad de Derecho de Loyola, especializado en propiedad intelectual, IA y derechos de datos, dijo que las acusaciones de OpenAI contra Deepseek son “profundamente irónicas”, dados los problemas legales de la compañía.
“Operai no ha tenido problemas para tomar el contenido de todos los demás y afirmar que es ‘justo'”, dijo Hughes a VOA en un correo electrónico.
“Si los informes son precisos de que OpenAI violó los términos de servicio de otras plataformas para obtener los datos de capacitación que ha querido, eso solo agregaría una capa adicional de ironía, nos atreveremos a decir hipocresía, a OpenAi quejándose de Deepseek”.
Deepseek no ha respondido a las acusaciones de OpenAi. En un artículo técnico lanzado con su nuevo chatbot, Deepseek reconoció que algunos de sus modelos fueron entrenados junto con otros modelos de código abierto, como Qwen, desarrollado por Alibaba de China, y Llama, lanzados por Meta, según Johnny Zou, un Hong Kong, un Hong Kong -El especialista en inversión de IA basado en AI.
Sin embargo, OpenAi parece estar alegando que Deepseek usó incorrectamente sus modelos de código cerrado, a los que no se puede acceder ni usar libremente para entrenar otros sistemas de IA.
“Es una declaración bastante seria”, dijo Zou, quien señaló que OpenAi aún no ha presentado evidencia de irregularidades por Deepseek.
Probar la destilación inadecuada puede ser difícil sin revelar detalles sobre cómo se capacitaban sus propios modelos, agregó Zou.
Incluso si Openai presenta pruebas concretas, sus opciones legales pueden ser limitadas. Aunque Zou señaló que la compañía podría buscar un caso en contra de Deepseek por violar sus términos de servicio, no todos los expertos creen que tal reclamo se mantendría en la corte.
“Incluso asumiendo que Deepseek entrenado en los datos de OpenAi, no creo que OpenAi tenga mucho caso”, dijo Mark Lemley, profesor de la Facultad de Derecho de Stanford que se especializa en propiedad y tecnología intelectual.
A pesar de que los modelos de IA a menudo tienen términos de servicio restrictivos, “ningún creador de modelos ha tratado de hacer cumplir estos términos con sanciones monetarias o medidas cautelares”, escribió Lemley en un artículo reciente con el coautor Peter Henderson.
El artículo argumenta que estas restricciones pueden ser inaplicables, ya que los materiales que apuntan a proteger son “en gran medida no con derechos de autor”.
“Hay razones convincentes para que muchas de estas disposiciones no sean ejecutables: relajan la investigación de buena fe, limitan la competencia y crean la propiedad cuasi-copyright donde ninguna debería existir”, señaló el artículo.
El principal argumento legal de OpenAI probablemente sería una incumplimiento de contrato, dijo Hughes. Sin embargo, incluso si ese fuera el caso, agregó, “Buena suerte aplicando eso contra una empresa china sin activos significativos en los Estados Unidos”.
Posibles opciones
Las apuestas financieras están agregando urgencia al debate. Las acciones de EE. UU. Tech se sumergieron el lunes después de después de las noticias de los avances de Deepseek, aunque luego recuperaron algo de terreno.
El nominado al comercio Lutnick sugirió que más acciones gubernamentales, incluidas las tarifas, podrían usarse para disuadir a China de copiar modelos AI avanzados.
Pero hablando el mismo día, el presidente de los Estados Unidos, Donald Trump, parecía tener una opinión diferente, sorprendiendo a algunos expertos de la industria con una versión optimista del avance de Deepseek.
El modelo de bajo costo de la compañía china, dijo Trump, fue “un desarrollo muy positivo” para la IA, porque “en lugar de gastar miles y miles de millones, gastará menos y, con suerte, encontrará la misma solución”.
Si Deepseek ha logrado construir un modelo de IA relativamente barato y competitivo, eso puede ser malo para aquellos con inversión, o opciones de acciones, en las empresas generativas actuales de IA, dijo Hughes.
“Pero podría ser bueno para el resto de nosotros”, agregó, señalando que hasta hace poco parecía que solo los gigantes tecnológicos existentes “tenían los recursos para jugar en la caja de arena de IA generativa”.
“Si Deepseek refutaba eso, debemos esperar que lo que puede hacer un equipo de ingenieros en China puede hacer por un equipo de ingenieros de recursos similares en Detroit o Denver o Boston”, dijo.
Noticias
How ChatGPT, Gemini, Claude, And Others Are Shaping The Future Of Artificial Intelligence – Analysis – Eurasia Review

The competition among top AI models is transforming how we work, create, and communicate. But as these systems grow smarter and more accessible, new questions emerge about cost, sustainability, and responsible development in a rapidly evolving landscape.
Artificial intelligence (AI) has seen rapid growth, transforming industries and daily life. From chatbots to advanced generative models, AI’s capabilities continue to expand, driven by powerful companies investing heavily in research and development. “The development of AI is as fundamental as the creation of the microprocessor, the personal computer, the Internet, and the mobile phone,” wrote Bill Gates in 2023. “It will change the way people work, learn, travel, get health care, and communicate with each other.”
In 2025, companies such as OpenAI, Google, Anthropic, and emerging challengers like DeepSeek have pushed the boundaries of what large language models (LLMs) can do. Moreover, corporate solutions from Microsoft and Meta are making AI tools more accessible to enterprises and developers alike. This article explores the latest AI models available to the public, their advantages and drawbacks, and how they compare in the competitive AI landscape.
The Power and Performance of AI Models
AI models rely on extensive computational resources, particularly large language models (LLMs) that require vast datasets and processing power. The leading AI models undergo complex training procedures that involve billions of parameters, consuming significant energy and infrastructure.
Key AI players invest in cutting-edge hardware and optimization strategies to improve efficiency while maintaining high performance. The balance between computational power, speed, and affordability is a significant factor in differentiating these AI models.
The Competitive Landscape: Top AI Models
OpenAI’s ChatGPT
ChatGPT, developed by OpenAI, is one of the most recognizable and widely used AI models in the world. Built with a dialogue-driven format, ChatGPT is designed to answer follow-up questions, challenge incorrect premises, admit mistakes, and reject inappropriate requests. Its versatility has made it a leading AI tool for both casual and professional use, spanning industries such as customer service, content creation, programming, and research.
ChatGPT is ideal for a wide range of users, including writers, business professionals, educators, developers, and researchers. Its free-tier accessibility makes it an excellent starting point for casual users, while businesses, content creators, and developers can leverage its advanced models for enhanced productivity and automation.
It is also among the most user-friendly AI models available, featuring a clean interface, intuitive responses, and seamless interaction across devices. However, organizations that require custom AI models or stricter data privacy controls may find its closed-source nature restrictive, particularly compared to open-source alternatives like Meta’s LLaMA.
The latest version, GPT-4o, is available for free-tier users and offers a strong balance of speed, reasoning, and text generation capabilities. For users seeking enhanced performance, ChatGPT Plus provides priority access and faster response times at a monthly subscription cost.
For professionals and businesses requiring more robust capabilities, ChatGPT Pro unlocks advanced reasoning features through the o1 pro mode, which includes enhanced voice functionality and improved performance on complex queries.
Developers looking to integrate ChatGPT into applications can access its API, a type of software interface. Pricing starts at approximately $0.15 per million input tokens and $0.60 per million output tokens for GPT-4o mini, while the more powerful o1 models come at a higher cost. A token is defined as a fundamental unit of data, like a word or subword, that an AI model processes to understand and generate text.
One of ChatGPT’s greatest strengths is its versatility and conversational memory. It can handle a broad range of tasks, from casual conversation and creative writing to technical problem-solving, coding assistance, and business automation. When memory is enabled, ChatGPT can retain context across interactions, allowing for a more personalized user experience.
Another key advantage is its proven user base—with hundreds of millions of users worldwide, ChatGPT has undergone continuous refinement based on real-world feedback, improving its accuracy and usability. Additionally, GPT-4o’s multimodal capabilities allow it to process text, images, audio, and video, making it a comprehensive AI tool for content creation, analysis, and customer engagement.
While a free version exists, the most powerful features require paid subscriptions, which may limit accessibility for smaller businesses, independent developers, and startups. Another drawback is an occasional lag in real-time updates; even though ChatGPT has web-browsing capabilities, it may struggle with the most recent or fast-changing information. Lastly, its proprietary model means users have limited control over modifications or customization, as they must adhere to OpenAI’s data policies and content restrictions.
Google’s Gemini
Google’s Gemini series is renowned for its multimodal capabilities and its ability to handle extensive context, making it a versatile tool for both personal and enterprise-level applications.
General consumers and productivity users benefit from Gemini’s deep integration with Google Search, Gmail, Docs, and Assistant, making it an excellent tool for research, email drafting, and task automation. Business and enterprise users find value in Gemini’s integration with Google Workspace, enhancing collaboration across Drive, Sheets, and Meet. Developers and AI researchers can leverage its capabilities through Google Cloud and Vertex AI, making it a strong choice for building AI applications and custom models. Creative professionals can take advantage of its multimodal abilities, working with text, images, and video. Meanwhile, students and educators benefit from Gemini’s ability to summarize, explain concepts, and assist with research, making it a powerful academic tool.
Google Gemini is highly accessible, especially for those already familiar with Google services. Its seamless integration across Google’s ecosystem allows for effortless adoption in both personal and business applications. Casual users will find it intuitive, with real-time search enhancements and natural interactions that require little to no learning curve. Developers and AI researchers can unlock advanced customization through API access and cloud-based features, though utilizing these tools effectively may require technical expertise.
The current versions, Gemini 1.5 Flash and Pro, cater to different needs, with Flash offering a cost-efficient, distilled option and Pro providing higher performance. Meanwhile, the Gemini 2.0 series, designed primarily for enterprise use, includes experimental models like Gemini 2.0 Flash with enhanced speed and multimodal live APIs, as well as the more powerful Gemini 2.0 Pro.
Basic access to Gemini is often free or available through Google Cloud’s Vertex AI. Still, advanced usage, especially when integrated into enterprise solutions, was introduced at $19.99–$25 per month per user, with pricing adjusted to reflect added features like a 1-million-token context window.
Gemini’s main advantage over other AIs is that it excels in processing text, images, audio, and video simultaneously, making it a standout in multimodal mastery. It also integrates seamlessly with Google Workspace, Gmail, and Android devices, making it a natural fit for users already in the Google ecosystem. Additionally, it offers competitive pricing for developers and enterprises needing robust capabilities, especially in extended context handling.
However, Gemini’s performance can be inconsistent, particularly with rare languages or specialized queries. Some advanced versions may be limited by safety testing, delaying wider access. Furthermore, its deep integration with Google’s ecosystem can be a barrier for users outside that environment, making adoption more challenging.
Anthropic’s Claude
Anthropic’s Claude is known for its emphasis on safety, natural conversational flow, and long-form contextual understanding. It is particularly well-suited for users who prioritize ethical AI usage and structured collaboration in their workflows.
Researchers and academics who need long-form contextual retention and minimal hallucinations, as well as writers and content creators who benefit from its structured approach and accuracy, will find Claude an essential and beneficial AI assistant. Business professionals and teams can leverage Claude’s “Projects” feature for task and document management, while educators and students will find its safety guardrails and clear responses ideal for learning support.
Because Claude is highly accessible for those seeking a structured, ethical AI with a strong contextual understanding, it is moderately suitable for creative users who may find its restrictive filters limiting and less ideal for those needing unrestricted, fast brainstorming tools or AI-generated content with minimal moderation.
Claude 3.5 Sonnet, on the other hand, is the flagship model, offering enhanced reasoning, speed, and contextual understanding for both individual and enterprise users. For businesses and teams, the Claude Team and Enterprise Plans start at approximately $25 per user per month (billed annually), providing advanced collaboration features. Individual users can access Claude Pro, a premium plan that costs around $20 per month, offering expanded capabilities and priority access. A limited free tier is also available, allowing general users to explore basic features and test its functionality.
Unlike most AIs, Claude excels in ethical AI safety, extended conversational memory, and structured project management, making it ideal for users who require reliable and well-moderated AI assistance. Its intuitive interface and organization tools enhance productivity for writers, researchers, educators, and business professionals.
However, there are instances when availability constraints during peak hours can disrupt workflow efficiency. Claude’s strict safety filters, while preventing harmful content, sometimes limit creative flexibility, making it less suitable for highly experimental or unrestricted brainstorming sessions. Additionally, enterprise costs may be high for large-scale teams with extensive AI usage.
DeepSeek AI
DeepSeek, a newcomer from China, has quickly gained attention for its cost efficiency and open-access philosophy. Unlike many established AI models, DeepSeek focuses on providing affordable AI access while maintaining strong reasoning capabilities, making it an appealing option for businesses and individual users alike. “DeepSeek R1 is one of the most amazing and impressive breakthroughs I’ve ever seen—and as open source, a profound gift to the world,” said Marc Andreessen, former software engineer and co-founder of Netscape.
Being an excellent choice for cost-conscious businesses, independent developers, and researchers who need a powerful yet affordable AI solution, DeepSeek is particularly suitable for startups, academic institutions, and enterprises that require strong reasoning and problem-solving capabilities without high operational costs. It is highly accessible for individuals due to its free web-based model, and even developers and enterprises benefit from its low-cost API. However, organizations requiring politically neutral AI models or strict privacy assurances may find it less suitable, especially in industries where data security and regulatory compliance are paramount.
The latest model, DeepSeek-R1, is designed for advanced reasoning tasks and is accessible through both an API and a chat interface. An earlier version, DeepSeek-V3, serves as the architectural foundation for the current releases, offering an extended context window of up to 128,000 tokens while being optimized for efficiency.
DeepSeek is free for individual users through its web interface, making it one of the most accessible AI models available. However, for business applications, API usage comes at a significantly lower cost than U.S. competitors, making it an attractive option for enterprises looking to reduce expenses. Reports indicate that DeepSeek’s training costs are drastically lower, with estimates suggesting it was trained for approximately $6 million, a fraction of the cost compared to competitors, whose training expenses can run into the tens or hundreds of millions.
One of DeepSeek’s biggest strengths is its cost efficiency. It allows businesses and developers to access powerful AI without the financial burden associated with models like OpenAI’s GPT-4 or Anthropic’s Claude. Its open-source approach further enhances its appeal, as it provides model weights and technical documentation under open licenses, encouraging transparency and community-driven improvements.
Additionally, its strong reasoning capabilities have been benchmarked against leading AI models, with DeepSeek-R1 rivaling OpenAI’s top-tier models in specific problem-solving tasks. As Anthropic co-founder Jack Clark wrote in his “Import AI” newsletter, “R1 is significant because it broadly matches OpenAI’s o1 model on a range of reasoning tasks and challenges the notion that Western AI companies hold a significant lead over Chinese ones.”
A notable problem with DeepSeek is that its response latency, especially during periods of high demand, makes it less ideal for real-time applications where speed is crucial. Censorship and bias are also potential concerns. DeepSeek aligns with local content regulations, meaning it may sanitize or avoid politically sensitive topics, which could limit its appeal in global markets. Additionally, some users have raised privacy concerns due to its Chinese ownership, questioning whether its data policies are as stringent as those of Western AI companies that comply with strict international privacy standards.
Microsoft’s Copilot
Microsoft’s Copilot is a productivity-focused AI assistant designed to enhance workplace efficiency through seamless integration with the Microsoft 365 suite. By embedding AI-powered automation directly into tools like Word, Excel, PowerPoint, Outlook, and Teams, Copilot serves as an intelligent assistant that streamlines workflows, automates repetitive tasks, and enhances document generation.
Ideal for businesses, enterprise teams, and professionals who heavily rely on Microsoft 365 applications for their daily operations, Microsoft’s Copilot is particularly beneficial for corporate professionals, financial analysts, project managers, and administrative staff who need AI-powered assistance to enhance productivity and reduce time spent on routine tasks. However, organizations that prefer open-source AI models or require flexible, cross-platform compatibility may find Copilot less suitable, especially if they rely on non-Microsoft software ecosystems for their workflows.
Microsoft 365 Copilot is available across Microsoft’s core productivity applications, providing AI-powered assistance for document creation, email drafting, data analysis, and meeting summarization. The service costs approximately $30 per user per month and typically requires an annual subscription. However, pricing can vary based on region and enterprise agreements, with some organizations receiving customized pricing based on their licensing structure.
One of Copilot’s most significant advantages is its deep ecosystem integration within Microsoft 365. For businesses and professionals already using Microsoft Office, Copilot enhances workflows by embedding AI-driven suggestions and automation directly within familiar applications. Its task automation capabilities are another significant benefit, helping users generate reports, summarize meetings, draft emails, and analyze data more efficiently. Furthermore, Copilot receives continuous updates backed by Microsoft’s substantial investments in AI and cloud computing, ensuring regular improvements in performance, accuracy, and feature expansion.
In contrast, one of the significant drawbacks of Microsoft’s Copilot is its ecosystem lock-in—Copilot is tightly coupled with Microsoft 365, meaning its full potential is only realized by organizations already invested in Microsoft’s software ecosystem. Limited flexibility is another concern, as it lacks extensive third-party integrations found in more open AI platforms, making customization difficult for businesses that rely on a broader range of tools. Additionally, some users report occasional response inconsistencies, where Copilot may lose context in long sessions or provide overly generic responses, requiring manual refinement.
Meta AI
Meta’s suite of AI tools, built on its open-weight LLaMA models, is a versatile and research-friendly AI suite designed for both general use and specialized applications. Meta’s approach prioritizes open-source development, accessibility, and integration with its social media platforms, making it a unique player in the AI landscape. It is ideal for developers, researchers, and AI enthusiasts who want free, open-source models that they can customize and fine-tune. It is also well-suited for businesses and brands leveraging Meta’s social platforms, as its AI can enhance customer interactions and content creation within apps like Instagram and WhatsApp.
Meta AI is highly accessible for developers and researchers due to its open-source availability and flexibility. However, businesses and casual users may find it less intuitive compared to AI models with more refined user-facing tools. Additionally, companies needing strong content moderation and regulatory compliance may prefer more tightly controlled AI systems from competitors like Microsoft or Anthropic.
Meta AI operates on a range of LLaMA models, including LLaMA 2 and LLaMA 3, which serve as the foundation for various applications. Specialized versions, such as Code Llama, are tailored for coding tasks, offering developers AI-powered assistance in programming.
One of Meta AI’s standout features is its open-source licensing, which makes many of its tools free for research and commercial use. However, enterprise users may encounter service-level agreements (SLAs) or indirect costs, especially when integrating Meta’s AI with proprietary systems or platform partnerships.
Meta AI’s biggest advantage is its open-source and customizable nature, allowing developers to fine-tune models for specific use cases. This fosters greater innovation, flexibility, and transparency compared to closed AI systems. Additionally, Meta AI is embedded within popular social media platforms like Facebook, Instagram, and WhatsApp, giving it massive consumer reach and real-time interactive capabilities. Meta also provides specialized AI models, such as Code Llama, for programming and catering to niche technical applications.
Despite its powerful underlying technology, Meta AI’s user interfaces and responsiveness can sometimes feel less polished than those of competitors like OpenAI and Microsoft. Additionally, Meta has faced controversies regarding content moderation and bias, raising concerns about AI-generated misinformation and regulatory scrutiny. Another challenge is ecosystem fragmentation; with multiple AI models and branding under Meta, navigating the differences between Meta AI, LLaMA, and other offerings can be confusing for both developers and general users.
AI’s Impact on the Future of Technology
As AI adoption grows, the energy demand for training and operating these models increases. Companies are developing more efficient AI models while managing infrastructure costs. Modern AI models, particularly those known as large language models (LLMs), are powerhouses that demand vast computational resources. Training these models involves running billions of calculations across highly specialized hardware over days, weeks, or even months.
The process is analogous to running an industrial factory non-stop—a feat that requires a tremendous amount of energy. The rise of AI assistants, automation, and multimodal capabilities will further shape industries, from customer support to content creation. “The worst thing you can do is have machines wasting power by being always on,” said James Coomer, senior vice president for products at DDN, a California-based software development firm, during the 2023 AI conference ai-PULSE.
AI competition will likely drive further advancements, leading to smarter, more accessible, and environmentally conscious AI solutions. However, challenges related to cost, data privacy, and ethical considerations will continue to shape the development of AI.
Sustainable AI and the Future
AI companies are actively addressing concerns about energy consumption and sustainability by optimizing their models to enhance efficiency while minimizing power usage. One key approach is leveraging renewable energy sources, such as solar and wind power, to supply data centers, which significantly reduces their carbon footprint. Additionally, advancements in hardware are being developed to support more energy-efficient AI computation, enabling systems to perform complex tasks with lower energy demands. These innovations not only help reduce environmental impact but also contribute to long-term cost savings for AI companies.
Beyond technological improvements, regulatory policies are being introduced to ensure AI growth aligns with environmental sustainability. Governments and industry leaders need to work together to establish guidelines that encourage responsible energy consumption while promoting research into eco-friendly AI solutions. However, the fear of governmental regulation often makes technology leaders hesitant to collaborate.
One voice at the forefront of global AI governance is Amandeep Singh Gill, the United Nations Secretary-General’s envoy on technology, who emphasizes the importance of collaborative governance in AI development—and sustainable development needs to be part of this cooperation and coordination.
“[W]e have to find ways to engage with those who are in the know,” he said in a September 2024 interview in Time. “Often, there’s a gap between technology developers and regulators, particularly when the private sector is in the lead. When it comes to diplomats and civil servants and leaders and ministers, there’s a further gap. How can you involve different stakeholders, the private sector in particular, in a way that influences action? You need to have a shared understanding.”
No matter the level of collaboration between the private and public sectors, companies need to aggressively explore emission-mitigation methods like carbon offset programs and energy-efficient algorithms to further mitigate their environmental impact. By integrating these strategies, the AI industry is making strides toward a more sustainable future without compromising innovation and progress.
Balancing Innovation and Responsibility
AI is advancing rapidly, with OpenAI, Google, Anthropic, DeepSeek, CoPilot, and MetaAI leading the way. While these models offer groundbreaking capabilities, they also come with costs, limitations, and sustainability concerns.
Businesses, researchers, and policymakers must prioritize responsible AI development while maintaining accessibility and efficiency. The Futurist: The AI (R)evolution panel discussion held by the Washington Post brought together industry leaders to explore the multifaceted impact of artificial intelligence (AI) on business, governance, and society. Martin Kon of Cohere explains that his role is securing AI for business with an emphasis on data privacy, which is essential for “critical infrastructure like banking, insurance, health care, government, energy, telco, etc.”
Because there’s no equivalent of Google Search for enterprises, AI, Kon says, is an invaluable tool in searching for needles in haystacks–but it’s complicated: “Every year, those haystacks get bigger, and every year, the needles get more valuable, but every enterprise’s haystacks are different. They’re data sources, and everyone cares about different needles.” He is, however, optimistic on the job front, maintaining that the new technology will create more jobs and greater value than many critics fear.
“Doctors, nurses, radiologists spend three and a half hours a day on admin. If you can get that done in 20 minutes, that’s three hours a day you’ve freed up of health care professionals. You’re not going to fire a third of them. They’re just going to have more time to treat patients, to train, to teach others, to sleep for the brain surgery tomorrow.”
May Habib, CEO of Writer, which builds AI models, is similarly optimistic, describing AI as “democratizing.” “All of these secret Einsteins in the company that didn’t have access to the tools to build can now build things that can be completely trajectory-changing for the business, and that’s the kind of vision that folks need to hear. And when folks hear that vision, they see a space and a part for themselves in it.”
Sy Choudhury, director of business development for AI Partnerships at Meta, sees a vital role for AI on the public sector side. “[I]t can be everything very mundane from logistics all the way to cybersecurity, all the way to your billing and making sure that you can talk to your state school when you’re applying for federal student–or student loans, that kind of thing.”
Rep. Jay Obernolte (R-CA), who led the House AI Task Force in 2024, acknowledges the need for “an institute to set standards for AI and to create testing and evaluation methodologies for AI” but emphasizes that “those standards should be non-compulsory…” And while agreeing that AI is “a very powerful tool,” he says that it’s still “just a tool,” adding that “if you concentrate on outcomes, you don’t have to worry as much about the tools…”
But some of those outcomes, he admits, can be adverse. “[O]ne example that I use a lot is the potential malicious use of AI for cyber fraud and cyber theft,” he says. “[I]n the pantheon of malicious uses of AI, that’s one of the ones that we at the task force worried the most about because we say bad actors are going to bad, and they’re going to bad more productively with AI than without AI because it’s such a powerful tool for enhancing productivity.”
Consumers can also do their part by managing AI usage wisely—turning off unused applications, optimizing workflows, and advocating for sustainable AI practices. AI’s future depends on balancing innovation with responsibility. The challenge is not just about creating smarter AI but also ensuring that its growth benefits society while minimizing its environmental impact.
- About the author: Sharon Kumar is a technology editor at The Observatory, where he provides analysis and critical perspectives on the rapidly evolving tech landscape. As a seasoned MAANG tech professional with over a decade of experience in program management, strategic planning, and technology-driven business solutions, including AI and system performance optimization, Kumar has a deep understanding of emerging trends, digital infrastructure, and software development.
- Software: This article was produced by The Observatory, a project of the Independent Media Institute.
Noticias
MidJourney V7 se lanza con la solicitud de voz y el modo de borrador más rápido: ¿por qué está recibiendo críticas mixtas?

Únase a nuestros boletines diarios y semanales para obtener las últimas actualizaciones y contenido exclusivo sobre la cobertura de IA líder de la industria. Obtenga más información
MidJourney, la startup con problemas de liquidez vistos por muchos usuarios de IA como el “estándar de oro” de la generación de imágenes de IA desde su lanzamiento en 2022, ahora ha introducido la versión muy esperada y más avanzada de su modelo generador, MidJourney V7.
La función principal es una nueva forma de pedirle al modelo que cree imágenes.
Anteriormente, los usuarios se limitaban a escribir indicaciones de texto y adjuntar otras imágenes para ayudar a las generaciones de guía (el modelo podría incorporar una variedad de imágenes adjuntas y adjuntas de los usuarios, incluidas otras generaciones MidJourney, para influir en el estilo y los temas de las nuevas generaciones).
Ahora, el usuario simplemente puede hablar en voz alta al sitio web Alpha de MidJourney (alfa.midjourney.com), siempre que tenga un micrófono en/on/adjunto a su computadora (o utilizando un dispositivo en red con entrada de audio, como auriculares o un teléfono inteligente).
No está claro si MidJourney creó o no un nuevo modelo de entrada de voz (habla a texto) desde cero o está utilizando una versión ajustada o lista para usar de otro de otro proveedor como ElevenLabs o OpenAI. Le pregunté al fundador de MidJourney, David Holz, en X, pero aún no ha respondido.
Uso de modo borrador y entrada de voz de conversación para indicar en un estado de flujo
Ir de la mano con este método de entrada es un nuevo “modo de borrador” que genera imágenes más rápidamente que MidJourney V6.1, la versión anterior más inmediata, a menudo en menos de un minuto o incluso 30 segundos en algunos casos.
Si bien las imágenes son inicialmente de menor calidad que V6.1, el usuario puede hacer clic en los botones “Mejorar” o “variar” ubicados a la derecha de cada generación para volver a renderizar el borrador con toda calidad.
La idea es que el usuario humano estará encantado de usar ambos juntos; de hecho, debe activarse “Modo de borrador” para activar la entrada de audio, para ingresar un estado de flujo más transparente de redacción creativa con el modelo, pasar menos tiempo en refinar el lenguaje específico de las indicaciones y más en ver las nuevas generaciones en tiempo real y ajustarlos o ajustarlos como es necesario más naturalmente y rápidamente hablando de los pensamientos fuera de los pensamientos fuera de los pensamientos fuera de las nuevas.
“Haga que este look sea más detallado, más oscuro, más claro, más realista, más cinético, más vibrante”, etc. son algunas de las instrucciones que el usuario podría proporcionar a través de la nueva interfaz de audio en respuesta a generaciones para producir nuevas y ajustadas que coincidan mejor con su visión creativa.
Comenzando con MidJourney V7
Para ingresar estos modos, comenzando con la nueva función de “borrador”, el usuario primero debe saltar a través de un nuevo obstáculo: la función de personalización de MidJourney.
Si bien esta característica se había introducido anteriormente en MidJourney V6 en junio de 2024, era opcional, lo que permitía al usuario crear un “estilo” personal que podría aplicarse a todas las generaciones en el futuro calificando 200 pares de imágenes (seleccionando que al usuario le gustaba mejor) a través del sitio web de Midjourney. El usuario podría alternar un estilo que coincidía con las imágenes que más les gustó durante el proceso de calificación por pares.
Ahora, MidJourney V7 requiere que los usuarios generen un nuevo estilo personalizado específico de V7 antes Incluso usarlo en absoluto en primer lugar.

Una vez que el usuario lo haga, aterrizará en el familiar tablero del sitio web de Midjourney Alpha, donde puede hacer clic en “Crear” desde el riel lateral izquierdo para abrir una pestaña de creación.

Luego, en la barra de entrada rápida en la parte superior, el usuario puede hacer clic en el nuevo botón “P” a la derecha de la barra para encender su modo de personalización.

El fundador y líder de MidJourney, David Holz, confirmó que VentureBeat en X también se podían seleccionar estilos de personalización más antiguos de V6, pero no las “tablas de humor” separadas, los estilos formados por colecciones de imágenes con suplotación de usuarios, aunque la cuenta X de MidJourney declaró que las funciones regresarán pronto. Sin embargo, no vi la oportunidad de seleccionar mi estilo V6 anterior.
No obstante, el usuario puede hacer clic en el nuevo botón “Modo de borrador” a la derecha del botón Personalización (también más a la derecha del cuadro de entrada de indicación del texto) para activar este modo de generación de imágenes más rápido.

Una vez que se haya seleccionado con el cursor, se volverá naranja, indicando que está activado, y luego un nuevo botón con un icono de micrófono debe aparecer a la derecha de este. Este es el modo de solicitación de voz, en el que el usuario puede hacer clic una vez más para activar.

Una vez que el usuario ha presionado este botón de micrófono para ingresar al modo de indicación de voz, debe ver que el icono del micrófono cambia de blanco a naranja para indicar que está activado, y una línea de forma de onda aparecerá a la derecha que debería comenzar a ondular a tiempo con el discurso del usuario.


El modelo podrá escucharlo y también debe escuchar cuando termine de hablar. En la práctica, a veces recibí un mensaje de error que decía “API en tiempo real desconectado”, pero detener y reiniciar el modo de entrada de voz y actualizar la página web generalmente la aclaraba rápidamente.
Después de unos segundos de hablar, MidJourney comenzará a flashear algunas ventanas de palabras clave debajo del cuadro de texto de entrada de inmediato en la parte superior y también generará un mensaje de texto completo a la derecha, ya que genera un nuevo conjunto de 4 imágenes basado en lo que dijo el usuario.

El usuario puede modificar aún más estas nuevas generaciones hablando con el modelo nuevamente, alternando y desactivando el modo de voz según sea necesario.
Aquí hay un video de demostración rápido de mí usando hoy para generar algunas imágenes de muestra. Verá que el proceso está lejos de ser perfecto, pero es realmente rápido y permite más de un estado interrumpido de indicación, refinación y recepción de imágenes del modelo.
Más características nuevas … pero también muchas características y limitaciones faltantes de V6/6.1
MidJourney V7 se lanza con dos modos operativos: turbo y relajarse. El modo Turbo proporciona un alto rendimiento al doble del costo de un trabajo V6 estándar, mientras que el modo borrador cuesta la mitad (en términos de trabajos). Un modo de velocidad estándar está actualmente en desarrollo y se lanzará una vez optimizado.
En el lanzamiento, las características como el aumento de la escala, la interpago y la retirada dependerán temporalmente del modelo V6. MidJourney planea hacer la transición de estas funciones a V7 en futuras actualizaciones.
La compañía se compromete con el desarrollo regular durante los próximos dos meses, con actualizaciones programadas cada una o dos semanas. Una próxima incorporación importante será un nuevo sistema de referencia de carácter y objetos diseñado específicamente para V7, características que se encuentran en versiones más antiguas de Midjourney aplicando sufijos de texto de texto arcano como –Cref y –Sref (para estilo) para atender el mensaje de texto de un usuario.
MidJourney planea involucrar a su comunidad a través de espacios de intercambio público y canales de retroalimentación, y organizará una sesión de clasificación de hoja de ruta para ayudar a priorizar futuros esfuerzos de desarrollo.
MidJourney enfatiza que V7 es un modelo completamente nuevo con sus propias fortalezas y desafíos. Se alienta a los usuarios a experimentar con diferentes estilos de inmediato e informar sus experiencias para ayudar a refinar la plataforma.
La reacción inicial es mixta … lejos de los elogios casi unánime de los lanzamientos anteriores de MidJourney
Si bien la mayoría de los lanzamientos más antiguos de mediana edad se encontraron con una abrumadora emoción y adulación, la recepción inicial a V7 es decididamente más mixta.
Aunque MidJourney tuvo cuidado de llamar a esto un lanzamiento de “alfa” en su blog y en las redes sociales, muchos usuarios aún esperaban un salto más grande en la calidad de imagen y la adherencia rápida (qué tan bien las generaciones de imágenes coincidían con las instrucciones específicas del usuario en el texto o el audio), y esperaban una comprensión anatómica humana mejorada (particularmente las manos, un problema de generación de imagen común) y la generación de textos (también los modelos de imagen de la imagen han tenido una mejor comprensión humana y se abren y se abren con la generación de imágenes de AI) y se han estrellado por algo, también algo de imagen de imagen. El generador de imágenes GPT-4O parece tenerlo mucho más consistentemente preciso que MidJourney V7 basado en los informes iniciales de los usuarios).
Como @Freiboitar escribió en X:
“Tengo que decirlo: un poco decepcionado.
OpenAi coloca el bar de cielo. ¿Habla con tu imagen Gen como si fuera tu hermano? Mente = soplado.MJ7 se ve “más realista”. ¿Pero realmente necesitamos eso?
MJ + Magnific ya lo clavó.Podría pausar mi sub tbh “.
“El problema es que V7 realmente no se siente como V7. Se siente más como V6.2”, publicó la fundadora de AI Magnific Javi Lopez en X, citando la naturaleza incremental aparente de las actualizaciones.
De hecho, Ethan Mollick, el profesor de la Escuela de Negocios de Pensilvania Wharton e Influencer de AI, también intervino para decir: “Me gustan sus nuevos lanzamientos, pero el problema con el nuevo V7 (derecha) lanzado hoy es que V6 (izquierda) ya era realmente bueno”.
“Las indicaciones idénticas de V6 son peores en V7”, escribió autodescrito “Maximalista de AI” David Shapiro en X.
“Todos los viejos favoritos que se están volviendo demasiado viejos”, dijo el artista y músico @Captainhahaa: “Las manos, el mensaje de texto siguen siendo un problema, sin CREF, SREFS se han vuelto locos. Pero está bien porque puedes hablar con él mientras te decepciona”.
Otros fueron más indulgentes y encantados con sus generaciones iniciales de prueba en V7, con el usuario de AI Power soñando a Tulpa diciendo en X que tenía “mejor calidad de imagen” y era “súper artística”.
Del mismo modo, la artista y diseñadora de IA Tatiana Tsiguleva expresó que MidJourney V7 era un “gran salto en calidad!”
Sin embargo, todavía son los primeros días para MidJourney V7, y la reacción inicial podría volver en cualquier dirección, ya sea adulación o frustración con el nuevo modelo y características de diseño. Por ahora, está disponible para cualquier persona con una cuenta de mediana edad para comenzar a usar.
Noticias
Operai fácilmente encabeza una semana masiva

¿Quiere realizar un seguimiento de las ofertas de financiación de inicio más grandes en 2025 con nuestra lista curada de más de $ 100 millones de ofertas de riesgo a empresas con sede en EE. UU.? Echa un vistazo al tablero de megadeals de Crunchbase.
Esta es una característica semanal que recorre las 10 rondas de financiación anunciadas de la semana en los EE. UU. Echa un vistazo a las mayores rondas de financiación de la semana pasada aquí.
Esta fue una semana desde los días de gasto libre de 2021. Las grandes rondas fueron abundantes, lideradas por los más grandes de todos, ya que finalmente se anunció la gran inversión de $ 40 mil millones de OpenAI.
1. Operai, $ 40b, inteligencia artificial: Por supuesto, la gran noticia de la semana fue la inversión de $ 40 mil millones para OpenAI dirigida por SoftBank. El acuerdo es la mayor inversión de riesgo de la historia. Según los detalles del acuerdo, SoftBank construirá un sindicato de co-inversores para proporcionar $ 10 mil millones del total, mientras espera financiar los otros $ 30 mil millones, con $ 10 mil millones de eso a través de la deuda. El acuerdo también depende parcialmente de las condiciones de reestructuración de OpenAI de su subsidiaria con fines de lucro. Si eso ocurre, OpenAi tendrá una valoración posterior al dinero de $ 300 mil millones.
2. Silicon Ranch, $ 500m, Energía: Silicon Ranch, con sede en Nashville, Tennessee, recaudó $ 500 millones del inversor europeo de la infraestructura AIP Management. La gran inversión es probablemente una apuesta por las crecientes demandas de electricidad de Estados Unidos. Silicon Ranch, que opera proyectos de energía solar y batería, ha estado en esta lista antes. En 2022, la compañía recaudó $ 775 millones en capital de capital dirigido por Manulife Investment Management. Fundada en 2011, la compañía energética ha recaudado más de $ 2 mil millones, según los datos de Crunchbase.
3. Plaid, $ 575m, fintech: Plaid recaudó una ronda masiva de $ 575 millones dirigida por Franklin Templeton con una valoración de $ 6.1 mil millones. La compañía con sede en San Francisco planea usar el efectivo para pagar las obligaciones de retención de impuestos de los empleados relacionados con la conversión de acciones y ofrecer cierta liquidez a los empleados a través de una oferta de licitación. Plaid, que conecta las cuentas bancarias de usuarios con las aplicaciones FinTech, tenía una venta planificada de $ 5.3 mil millones a la visa desechada en 2021 después de problemas regulatorios.
4. Pista, $ 308 millones, inteligencia artificial: La pista con sede en Nueva York recaudó $ 308 millones en una nueva ronda a aproximadamente el doble de su valoración de hace menos de dos años. La nueva ronda, dirigida por el General Atlantic, valora la inicio del video de IA en más de $ 3 mil millones, según los informes. En junio de 2023, la compañía recaudó una extensión de $ 141 millones a su serie C. Runway de $ 50 millones de diciembre de 2022 hace un software que permite a los usuarios crear videos utilizando indicaciones o imágenes de texto. A principios de semana, Runway dio a conocer su nuevo modelo AI, Gen-4, que permite a los usuarios crear videos con personajes y fondos consistentes. El otoño pasado, la compañía firmó un acuerdo con la compañía de producción Lionsgate para crear un modelo de video generación personalizado. La startup planea usar el nuevo efectivo para desarrollar AI centrándose en su estudio de película y animación. Fundada en 2018, ha recaudado más de $ 540 millones, por Crunchbase.
5. Airna, $ 155 millones, biotecnología: Airna, con sede en Cambridge, con sede en Massachusetts, una startup de biotecnología que desarrolla Therapeutics de edición de ARN para ayudar con condiciones raras y comunes, cerró una serie B de $ 155 millones dirigida por Forbion Capital Partners y Venrock Healthcare Capital Partners. El nuevo efectivo se destinará a lanzar un ensayo de fase para el candidato fármaco de Airna para la deficiencia de antitripsina alfa-1 y ayudarlo a desarrollar su tubería de terapéutica de edición de ARN. Fundada en 2021, la compañía ha recaudado $ 245 millones, por Crunchbase.
6. (Astado) Atsena Therapeutics, $ 150 millones, biotecnología: Atsena Therapeutics, una compañía de terapia génica centrada en revertir o prevenir la ceguera, cerró una serie C de $ 150 millones dirigida por el brazo de la vida de Bain Capital. El dinero del financiamiento se utilizará para avanzar en el tratamiento de la compañía con sede en Durham, Carolina del Norte, de retinosquisis ligada a X, una condición genética que se diagnostica típicamente en la infancia y conduce a la ceguera más adelante en la vida. Los ingresos también apoyarán la tubería preclínica de Atsena. Fundada en 2019, la compañía ha recaudado casi $ 238 millones, por Crunchbase.
6. (Astado) SandboxAq, $ 150m, computación cuántica: Alphabet spin -off sandboxAQ, una startup de computación cuántica de IA y Quantum, agregó otros $ 150 millones a su serie E de los gustos de Google y Nvidia. El complemento se produce menos de cuatro meses después de que la compañía anunció que había recaudado una ronda de $ 300 millones con una valoración de $ 5.6 mil millones. SandboxAQ está analizando los efectos relacionados de AI y Quantum, que es donde la compañía obtiene “AQ”, para desarrollar productos comerciales para telecomunicaciones, servicios financieros, atención médica, seguridad y otros sectores computacionalmente intensivos. La compañía ya está trabajando con un puñado de clientes en software empresarial y herramientas de ciberseguridad relacionadas con la computación cuántica. En marzo de 2022, Alphabet salió oficialmente a su grupo de tecnología Quantum de 6 años, Sandboxaq, que surgió como su propia compañía después de cerrar una ronda de financiamiento de $ 500 millones y nombrar al ex CEO de Google Eric Schmidt Presidente. SandboxAQ ha recaudado más de $ 950 millones, según la compañía.
8. Tecnologías temporales, $ 146 millones, software: Temporal Technologies, con sede en Seattle, encerró una gran serie C de $ 146 millones en una valoración de $ 1.7 mil millones dirigida por Tiger Global Management. La compañía ayuda a otras empresas a administrar aplicaciones de software complejas y utilizará el nuevo efectivo para desarrollar productos en la nube e invertir en investigación y desarrollo para el uso de inteligencia artificial. La compañía recaudó una serie B de $ 103 millones en febrero de 2022 con una valoración de un poco más de $ 1.5 mil millones, seguido de $ 75 millones en una serie “B-Prime”. Fundada en 2019, Temporal ha recaudado $ 350 millones, según la compañía.
9. Neurona Therapeutics, $ 102 millones, biotecnología: Neurona Therapeutics, una compañía de biotecnología clínica con sede en el sur de San Francisco que desarrolla terapias celulares regenerativas para los trastornos del sistema nervioso, aumentó una ronda de financiamiento de $ 102 millones. Los inversores incluyeron Fidelity Management & Research Co. Fundada en 2008, la compañía ha recaudado $ 426 millones, según CrunchBase.
10. (Astado) Cyberhaven, $ 100 millones, ciberseguridad: Cyberhaven, con sede en California, una startup de seguridad de datos con IA, recaudó una serie D de $ 100 millones dirigida por Stepstone Group con una valoración de $ 1 mil millones. Fundada en 2016, Cyberhaven ha recaudado $ 250 millones, según la compañía.
10. (Astado) Datos de Redpanda, $ 100 millones, datos: La startup de datos de la transmisión de datos Redpanda recaudó una serie D de $ 100 millones dirigida por GV con una valoración de $ 1 mil millones. La startup con sede en San Francisco proporciona servicios de datos de transmisión en tiempo real, ayudados por inteligencia artificial y aprendizaje automático. Fundada en 2019, Redpanda ha recaudado casi $ 265 millones, según la compañía.
Grandes ofertas globales
El mayor aumento de esta semana provino de al otro lado del estanque.
- Google Spin -off Isomorphic Labs recaudó $ 600 millones en su primera ronda de financiación externa mientras la compañía busca aplicar inteligencia artificial al proceso de desarrollo de fármacos. La nueva ronda fue dirigida por Thrive Capital con la participación de Google Ventures. La compañía AI con sede en Londres recibirá capital de seguimiento del inversor Alphabet existente.
Metodología
Hicimos un seguimiento de las rondas anunciadas más grandes en la base de datos de Crunchbase que fueron planteadas por compañías con sede en los Estados Unidos para el período de siete días del 29 de marzo al 4 de abril. Aunque la mayoría de las rondas anunciadas están representadas en la base de datos, podría haber un poco de retraso, ya que algunas rondas se informan a fines de la semana.
Ilustración: Dom Guzman
Manténgase al día con rondas de financiación recientes, adquisiciones y más con el Crunchbase Daily.
-
Startups11 meses ago
Remove.bg: La Revolución en la Edición de Imágenes que Debes Conocer
-
Tutoriales11 meses ago
Cómo Comenzar a Utilizar ChatGPT: Una Guía Completa para Principiantes
-
Startups9 meses ago
Startups de IA en EE.UU. que han recaudado más de $100M en 2024
-
Recursos11 meses ago
Cómo Empezar con Popai.pro: Tu Espacio Personal de IA – Guía Completa, Instalación, Versiones y Precios
-
Startups11 meses ago
Deepgram: Revolucionando el Reconocimiento de Voz con IA
-
Recursos11 meses ago
Suno.com: La Revolución en la Creación Musical con Inteligencia Artificial
-
Recursos10 meses ago
Perplexity aplicado al Marketing Digital y Estrategias SEO
-
Noticias9 meses ago
Dos periodistas octogenarios deman a ChatGPT por robar su trabajo