Noticias
OpenAI’s Economic Blueprint – Sync #502
Published
2 meses agoon

Hello and welcome to Sync #502!
In this week’s issue, we take a closer look at OpenAI’s Economic Blueprint, which outlines policy proposals preferred by OpenAI for how the US can maximise AI’s benefits, bolster national security, and drive economic growth.
Elsewhere in AI, Mark Zuckerberg said that AI could soon do the work of Meta’s midlevel engineers, Elon Musk wants courts to force OpenAI to auction off a significant ownership stake, and President Joe Biden issued an executive order to accelerate the domestic construction of AI infrastructure.
Over in robotics, OpenAI is taking robotics seriously again and is looking for people to join its newly reformed robotics team. We also have another video of a humanoid robot, and how soft robotics can help create more flexible, quieter, and adaptable robots.
In other news, Neuralink announced that its brain-computer interface has been implanted in a third patient. We also look at how AI is helping archaeologists read ancient texts, meet a startup planning to bury micro-nuclear reactors to power data centres and explore the future of nanotechnology.
Enjoy!
The car was not invented in America—it was invented in Europe. This invention promised to revolutionise the world and completely reimagine every aspect of our lives—how we work, how we do business, and how we live our everyday lives. It promised to unlock new ways of living and new opportunities for economic growth.
However, not everyone saw cars and the emerging automotive industry as an opportunity. Many countries introduced laws and regulations that hindered cars—this new, exciting technology—from reaching their full potential. Meanwhile, America seized this opportunity and transformed the automotive industry into one of the pillars of its 20th-century economy. While individual states invested in the necessary infrastructure and business incentives for the automotive industry to thrive, the federal government funded the massive highway system that connected the country.
This is the story that OpenAI opens its recently released Economic Blueprint and argues that history repeats before our eyes. However, instead of cars, this new vehicle of innovation, opportunity, and economic growth is AI. In this 15-page document, OpenAI outlines its preferred AI policies and how these can ensure shared and responsible AI benefits while fostering US leadership in AI development. It urges US policymakers to fully embrace AI, much as the country did a century ago with automobiles, and to create a fertile environment where the AI industry can thrive and become the new engine of economic growth.
OpenAI’s Economic Blueprint and the proposed policies are organised into three sections: Competitiveness and Security, Rules of the Road and Infrastructure as Destiny.
In the first section, OpenAI focuses on policies aimed at maintaining US leadership in AI and emphasises the need for the United States to lead in AI development through clear, consistent rules that promote innovation, ensure national security, and prevent misuse. It advocates aligning AI development with democratic values, such as free-market competition and user freedom while holding developers and users accountable for responsible use.
OpenAI warns of the risks posed by adversarial misuse of AI, including authoritarian governments using it for control, industrial espionage, novel cyber threats, and unchecked global investments flowing to nations like China.
To counter these risks, the blueprint calls for federal leadership to develop a cohesive strategy for AI. This includes prioritising the development of state-of-the-art frontier models with robust safeguards, streamlining regulations, and promoting collaboration with international allies. OpenAI also advocates for deeper collaboration with national security organizations (the company highlights here its partnerships with agencies like Los Alamos National Laboratory and the Air Force Research Laboratory, as well as recently the announced partnership with defence startup Andruil), to develop best practices for deploying AI securely and addressing emerging threats.
Export policies should securely share AI advancements with partner nations to strengthen their AI ecosystems while restricting access for adversaries. OpenAI also emphasises the need for an international coalition to establish shared safety standards and prevent regulatory fragmentation.
OpenAI highlights the importance of establishing clear and practical guidelines to ensure AI is developed and used responsibly while maximising its benefits for society. It emphasises that AI, like past transformative technologies, requires thoughtful governance to unlock its full potential. By setting these rules early, OpenAI argues, the US can lay the foundation for the rapid and widespread adoption of AI and empower users across the country.
OpenAI advocates for robust safeguards to prevent the creation of harmful AI-generated content and calls for stronger collaboration between AI companies and law enforcement. To build public trust in AI, it proposes using provenance data to trace AI-generated content back to its source. OpenAI also emphasises empowering users with control over their AI tools, including how personal data is used and the ability to personalise AI to their preferences.
OpenAI encourages states to serve as testing grounds for AI innovation, particularly in education and healthcare, fostering local AI ecosystems while increasing public confidence in the technology. By implementing these “rules of the road,” OpenAI believes the US can establish a secure, innovative, and user-centric AI ecosystem that benefits all Americans.
OpenAI underscores the critical role of infrastructure in securing US leadership in AI and fostering economic growth. Drawing parallels to the transformative impact of the automobile industry, OpenAI emphasises the need to develop the foundational resources—chips, data, energy, and talent—necessary for the AI industry to thrive. OpenAI argues that timely investment in these areas could catalyse a “reindustrialisation” of the US, creating widespread economic opportunities and bolstering global competitiveness.
To meet the growing demand for AI compute and energy, OpenAI proposes initiatives such as AI Economic Zones to fast-track infrastructure projects, increased investment in new energy sources, and a National AI Infrastructure Highway to connect regional power and communication grids. It also advocates digitising public data to support US AI developers of all sizes. In return, OpenAI suggests, developers using this data could collaborate with the government to generate insights that inform the development of better public policies.
The document envisions the creation of AI research labs aligned with local industries. As an example, the blueprint suggests Kansas could establish a hub dedicated to applying AI in agriculture, while Texas or Pennsylvania could develop hubs focused on integrating AI into power production and grid resilience.
The section also warns of the risks of inaction, such as allowing global AI investments (which OpenAI estimates at $175 billion) to flow to adversaries like China, and emphasises the importance of policies that ensure AI is built on democratic foundations. By investing in infrastructure and fostering the growth of AI ecosystems, OpenAI envisions a future where the US remains at the forefront of innovation while unlocking economic opportunities across the country.
In essence, OpenAI’s Economic Blueprint brings together what OpenAI and its CEO, Sam Altman, have been advocating for for the last two years. It calls on the US government to take decisive action to establish a federal legal framework that sets clear rules for the AI industry. At the same time, OpenAI urges the US government to step in and support the development of infrastructure necessary for an AI-powered economy — from creating new energy sources to investing in the chip industry and education.
With these policies in place, OpenAI argues, the US can win the AI race. In fact, OpenAI goes even further and says the US must win this race. The document suggests that if these policies are not implemented, it will be China—not the US—that benefits most from AI and dictates the course of the technology. This “us versus them” rhetoric appears throughout the document, aiming to use patriotism or nationalism to rally support for OpenAI’s proposed policies. OpenAI frames AI development as a critical battle for technological leadership and security between democratic nations like the US and authoritarian adversaries like China—a framing reminiscent of the Cold War.
With the new Trump administration set to take power soon, OpenAI might find greater success in convincing the White House and the US government to adopt its preferred AI policies.
By using the car industry as an analogy to the AI industry, OpenAI references one of the industries that defined the 20th-century United States. The car and the automotive industry redefined what America is and transformed how people work, conduct business, and live. OpenAI argues that AI will play a similarly transformative role in the 21st century. However, for history to repeat itself, decisive actions must be taken, according to OpenAI. Otherwise, AI will not be associated with the US, and the benefits of AI will be reaped by someone else.
The full Blueprint is available here.
If you enjoy this post, please click the button or share it.
Share
Do you like my work? Consider becoming a paying subscriber to support it
Become a paid subscriber
For those who prefer to make a one-off donation, you can ‘buy me a coffee’ via Ko-fi. Every coffee bought is a generous support towards the work put into this newsletter.
Your support, in any form, is deeply appreciated and goes a long way in keeping this newsletter alive and thriving.
Musk Says Neuralink Implanted Third Patient With Brain Device
Speaking at an event in Las Vegas, Elon Musk announced that Neuralink’s brain-computer interface has been implanted in a third patient. “We’ve now got three humans with Neuralinks implanted, and they’re all working well,” said Musk, adding that the company plans to carry out about 20 to 30 more implants in 2025.
It’s not fair having 12 pairs of legs (9:58)
I’ve recently been reminded about this TED Talk by Aimee Mullins from 2009. While her talk focuses on redefining disability and turning it into a superpower, it is also about how people react to someone who changed their body beyond what most will ever encounter. The story Mullins shares about someone telling her it’s unfair that she can choose her height offers insight into how people might respond if—or when—radical human augmentation becomes a reality.
Omi, a competitor to Friend, wants to boost your productivity using AI and a ‘brain interface’
Meet Omi, yet another AI-first device revealed at CES 2025. Similar to other devices in this category, such as Rabbit, Humane, and Friend, this AI wearable offers functions like answering questions, summarising conversations, creating to-do lists, and scheduling meetings. Like its predecessors, it features a sleek, futuristic design. However, unlike its predecessors, Omi is positioned as a complementary device to smartphones rather than a replacement or AI companion. Additionally, it includes a built-in brain interface to detect user commands without requiring a wake word.I have some doubts, but let’s wait for independent reviews, which are expected in Q2 2025 when the device is planned to be shipped.
Nanotechnology: The Future of Everything (36:48)
In this video, Isaac Arthur takes a closer look at nanotechnology—exploring its origins, the challenges and risks of engineering at the nanoscale, and the enormous potential this technology holds for manufacturing, medicine, and many other areas. Arthur compares the current state of nanotechnology to that of artificial intelligence a decade ago—when the AI we have today seemed like science fiction. The same, Arthur argues, could happen to nanotechnology and massively transform our lives.
Mark Zuckerberg says AI could soon do the work of Meta’s midlevel engineers
In a conversation with Joe Rogan, Mark Zuckerberg revealed Meta’s plans to automate the work of mid-level software engineers by 2025. Meta aims to have all coding for its apps eventually generated by AI, potentially making coding a fully automated skill which could lead to significant cost savings.
Biden opens federal land for AI data centers, sets rules for developers
President Joe Biden issued an executive order to accelerate the domestic construction of AI infrastructure and address national security risks associated with the technology. The US Department of Defense and Department of Energy are authorised to lease federal sites for gigawatt-scale AI data centres. The order also issued guidelines for AI developers using the sites to not only build, operate, and maintain the leased centres at full cost, but also to deliver clean energy resources to match their capacity needs to prevent increases in electricity costs. The move aligns with efforts to keep AI development onshore and reduce reliance on foreign resources. Agencies will now select federal sites for AI data centres, after which developers can submit lease proposals.
Elon Musk wants courts to force OpenAI to auction off a large ownership stake
The battle between OpenAI and Elon Musk continues. According to a report by the Financial Times, Elon Musk’s lawyer has urged the attorneys general of California and Delaware to force OpenAI to auction a significant stake in its business. OpenAI plans to convert into a public benefit corporation, with its nonprofit retaining shares—a move Musk has legally challenged, arguing it undervalues the nonprofit’s assets and unfairly consolidates power. OpenAI defends the conversion as a means to fund its mission better, while Musk and allies, including Meta, continue to voice concerns over governance, transparency, and potential monopolisation.
AI researcher François Chollet founds a new AI lab focused on AGI
There is a new AI lab focusing on AGI on the block. It’s called Ndea and was founded by François Chollet—a well-respected AI researcher, the author of Keras (a popular deep learning framework) and the co-creator of the ARC Benchmark and ARC-AGI Prize—and Mike Knoop, the founder of Zapier. As Chollet writes in his tweet, Ndea will focus on researching deep learning-guided program synthesis, a promising new method of building AI systems, which the team hopes will eventually lead to AGI.
How AI is unlocking ancient texts — and could rewrite history
AI is revolutionising archaeology by helping decipher ancient texts, reconstruct incomplete documents, and analyse vast historical archives. Recent projects include the Vesuvius Challenge, where AI revealed text from carbonised Herculaneum scrolls, and the Ithaca model, which restores missing words and dates Greek inscriptions. AI has also translated Korean royal archives and made strides in decoding rare scripts like Linear B. By combining machine learning with human expertise, researchers are uncovering hidden knowledge and making new discoveries about the ancient world.
Asimov’s Laws of Robotics Need an Update for AI
For decades, Asimov’s famous Three Laws of Robotics have been shaping the discourse on AI and robotics ethics. Times, however, have changed, and we now live in a world flooded with deepfakes and AI-generated misinformation. To address the rise in AI-generated misinformation and deepfakes, this article proposes a fourth law: A robot or AI must not deceive a human by impersonating a human being, and suggests how this fourth law could be implemented.
It’s Time to Move Past AI Nationalism
”AI nationalism depicts AI as a battle to be won, rather than an opportunity to be harnessed,” writes Verity Harding in this article calling to stop viewing the AI race from a nationalistic point of view, to not view AI through a competitive and nationalistic lens, influenced by geopolitical tensions, and to embrace diplomacy and collaborative frameworks in managing AI’s global impact. As Harding notes, there are signs that this shift is happening.
AI Brad Pitt dupes French woman out of €830,000
Here is yet another example of AI is being used by scammers. A 53-year-old French woman was conned out of €830,000 by scammers posing as actor Brad Pitt. For over 18 months, the scammers used AI-generated photos, videos, and fabricated news reports to convince the woman that she was interacting with the real Brad Pitt. When she realised it was a scam, the woman contacted the authorities and later publicly shared her story. While mockery dominated online responses, some posts and media highlighted the need for empathy and greater awareness of modern digital scams.
Transformer²: Self-Adaptive LLMs
Researchers from the Japanese AI lab Sakana.ai present Transformer²—a new approach to developing large language models that can adjust their own weights dynamically and adapt to new knowledge. The results presented in the paper look promising. Researchers hope this new approach will eventually lead to models embodying “living intelligence” that continually learn, evolve and adapt over time.
If you’re enjoying the insights and perspectives shared in the Humanity Redefined newsletter, why not spread the word?
Refer a friend
New OpenAI job listings reveal the company’s robotics plans
After dismantling its robotics team in 2021, OpenAI is now taking robotics seriously again and is looking for people to join its newly reformed robotics team. Caitlin Kalinowski, who leads OpenAI’s robotics efforts, recently tweeted that the company has open job listings for robotics engineers to develop “general-purpose,” “adaptive,” and “versatile” robots capable of human-like intelligence in dynamic, real-world settings. The company is looking to recruit engineers experienced in designing systems for high-volume manufacturing (1M+ units), hinting at potential plans for “full-scale production” of robots. While there are no further details on the type of robots OpenAI intends to build, rumours suggest that humanoid robots may be on the table.
Unitree G1 Bionic: Agile Upgrade (1:06)
Another week, another video of a humanoid robot. This time, the Chinese company Unitree showcases how its humanoid robot, G1, can navigate challenging terrain, such as stone-laden surfaces, running up and down hills, and climbing stairs.
How we can make robots more human-like (12:50)
In this talk, Robert Katzschmann, Assistant Professor of Robotics at ETH Zurich, shares his vision for soft robotics, which takes inspiration from nature to create more flexible, quieter, and adaptable robots. Katzschmann explains how these robots differ from traditional robots and demonstrates one on the stage. He also showcases his latest research project—a robotic leg powered by artificial hydraulic muscles—and its potential to revolutionise robotics for everyday life.
Illumina, Nvidia Launch AI-Based Genomics Partnership
Nvidia and Illumina announced a partnership to apply genomics and AI technologies in drug discovery, clinical research, and human health. The partnership will focus on developing biology foundation models, integrating Nvidia tools like RAPIDS and BioNeMo with Illumina’s multi-omics analysis tools, with production-ready solutions expected before the end of the year.
Nuclear startup Deep Fission plans to bury micro-reactors to power data centers
The growing demand for greater computing power has spurred interest in nuclear power and brought attention to the emerging ecosystem of startups focused on nuclear energy. One such startup is Deep Fission, which recently signed a deal with data centre developer Endeavour to deliver 2 gigawatts from its small modular reactors (SMRs) buried in boreholes one mile deep, using depth as a substitute for extensive concrete shielding. Deep Fission’s reactors are designed to be affordable, targeting electricity costs of 5–7 cents per kilowatt-hour, significantly lower than current nuclear power costs. The company aims to activate its first reactor by 2029.
Thanks for reading. If you enjoyed this post, please click the button or share it.
Share
Humanity Redefined sheds light on the bleeding edge of technology and how advancements in AI, robotics, and biotech can usher in abundance, expand humanity’s horizons, and redefine what it means to be human.
A big thank you to my paid subscribers, to my Patrons: whmr, Florian, dux, Eric, Preppikoma and Andrew, and to everyone who supports my work on Ko-Fi. Thank you for the support!
My DMs are open to all subscribers. Feel free to drop me a message, share feedback, or just say “hi!”
You may like
Noticias
Google lanza Gemini 2.5 Pro, empujando los límites del razonamiento de IA
Published
4 horas agoon
27 marzo, 2025
Géminis 2.5
Gemini 2.5 Pro es el último modelo de IA multimodal a gran escala de Google Deepmind, diseñado con capacidades incorporadas de “pensamiento” para manejar tareas complejas. Como el primer lanzamiento de la serie Gemini 2.5, el modelo Pro lidera muchos puntos de referencia de la industria mediante márgenes significativos y demuestra fuertes capacidades de razonamiento y codificación.
A diferencia de las generaciones anteriores de IA que simplemente predijeron texto basado en patrones, Gemini 2.5 Pro está diseñado para analizar la información profundamente, sacar conclusiones lógicas, incorporar un contexto matizado y tomar decisiones informadas antes de responder. Esta evolución en las posiciones de diseño Gemini 2.5 Pro como un modelo de propósito general altamente avanzado que es adecuado para aplicaciones empresariales que exigen precisión y adaptabilidad.
En el núcleo de las características avanzadas de Gemini 2.5 Pro hay un cambio fundamental en su diseño arquitectónico, avanzando hacia lo que Google se refiere como un “modelo de pensamiento”. Esto indica una ruptura de los modelos de IA tradicionales centrados principalmente en la predicción y la clasificación hacia un sistema que se involucra en la deliberación y el razonamiento internos antes de generar una respuesta. Este enfoque intencional conduce a un rendimiento y una precisión significativamente mejorados, especialmente cuando se abordan tareas complejas que requieren más que un mero reconocimiento de patrones.
El rendimiento mejorado de Gemini Pro 2.5 no se debe únicamente al aumento de la potencia computacional o el tamaño del modelo. Más bien, surge de una combinación sofisticada de un modelo base subyacente muy mejorado, aprovechando los avances en la arquitectura de la red neuronal, los conjuntos de datos de entrenamiento extensos y las metodologías refinadas posteriores a la capacitación. Estas técnicas posteriores a la capacitación, que con frecuencia implican el aprendizaje de refuerzo, son cruciales para ajustar el comportamiento del modelo, asegurando una mayor calidad y resultados más relevantes. Esta evolución arquitectónica permite que el modelo realice análisis de información más exhaustivos, lleguen a conclusiones más precisas y lógicas, comprenda mejor e incorpore matices contextuales y, en última instancia, tome decisiones más informadas y confiables, capacidad que son esenciales para aplicaciones comerciales estratégicas.
Más allá del razonamiento abstracto, Gemini 2.5 Pro ofrece un conjunto de capacidades avanzadas que son directamente relevantes para las necesidades empresariales. Lo más destacado es su mejora significativa en el dominio de la codificación. Los ingenieros de Google informan que el rendimiento de la codificación experimentó un salto considerable de Gemini 2.0 a 2.5, con más mejoras en el horizonte. El modelo 2.5 Pro se destaca en la generación y el código de refinación, capaz de crear un software complejo, como una aplicación web interactiva funcional, desde un aviso de alto nivel. En una demostración, el modelo desarrolló un juego completo de “corredor interminable” en HTML/JS a partir de un mensaje de una sola línea, ilustrando su capacidad para administrar las tareas de codificación a nivel de proyecto de forma autónoma. Gemini 2.5 Pro también se destaca en una sólida transformación y edición de código, por lo que es valioso para tareas como refactorizar el código heredado o la traducción del código entre idiomas. En un punto de referencia de ingeniería de software estandarizado (verificado por el banco SWE), el modelo logró una puntuación alta (63.8%) utilizando una configuración de agente autónomo, lo que indica su fuerza para abordar los desafíos de codificación complejos de varios pasos. Para las empresas, esto significa que la IA puede funcionar no solo como un asistente de conversación sino también como una ayuda de codificación capaz o incluso un agente de software semiautónomo.
Géminis 2.5 Pro
Como parte del ecosistema de Géminis más amplio, Google también ha introducido TXGEMMA, un conjunto de modelos abiertos dirigidos a desafíos especializados de la industria. TXGEMMA es una colección de modelos derivados de la Serie Ligera de Gemma (versiones de código abierto de Gemini Technology) y adaptado específicamente para el desarrollo terapéutico de fármacos y biotecnología. Estos modelos están capacitados para comprender y predecir las propiedades de posibles medicamentos y terapias génicas, lo que ayuda a los investigadores a identificar candidatos prometedores e incluso pronosticar resultados de ensayos clínicos.
En esencia, TXGEMMA toma las técnicas de modelado y razonamiento del lenguaje central de Géminis y las aplica al dominio farmacéutico, donde puede examinar la literatura biomédica, los datos químicos y los resultados del ensayo para ayudar en las decisiones de I + D. El modelo de TXGEMMA más grande (con 27 mil millones de parámetros) ha demostrado el rendimiento a la par o excediendo modelos especializados en muchas tareas de descubrimiento de fármacos, todo mientras se conserva las habilidades generales de razonamiento. Para los líderes empresariales en atención médica y ciencias de la vida, TXGEMMA muestra la adaptabilidad de la arquitectura de Géminis a dominios misioneros críticos: ilustra cómo la IA de vanguardia puede acelerar flujos de trabajo altamente específicos como el descubrimiento de fármacos que tradicionalmente llevan años e incurrir en costos masivos.
Gemini 2.5 Pro representa un paso adelante significativo en el diseño del modelo de IA, combinando la potencia bruta con capacidades de razonamiento refinado que abordan directamente las tareas complejas del mundo real. Su arquitectura, con multimodalidad nativa y una longitud de contexto sin precedentes, permite a las empresas traer una variedad más rica de datos para tener problemas, extrayendo ideas que los modelos anteriores podrían haberse perdido. El fuerte desempeño del modelo en los puntos de referencia de codificación y razonamiento brinda la confianza de que puede manejar aplicaciones exigentes, desde la automatización de partes de la ingeniería de software hasta dar sentido a las amplias bases de conocimiento corporativo. Con el soporte de Google para la integración empresarial a través de plataformas en la nube y la aparición de ramas específicas de dominio como TXGEMMA, el ecosistema Gemini 2.5 Pro está listo para proporcionar la inteligencia general y las habilidades especializadas que buscan las empresas modernas. Para las CXO que planea la estrategia de IA de su empresa, Gemini 2.5 Pro ofrece una vista previa de cómo se pueden implementar sistemas de IA de próxima generación para impulsar la innovación y la ventaja competitiva, todos centrados en un razonamiento más profundo, un contexto más amplio y resultados tangibles.
Noticias
Gemini 2.5 Pro está aquí, y cambia el juego AI (nuevamente)
Published
10 horas agoon
26 marzo, 2025
Google ha presentado Gemini 2.5 Pro, llamándolo “Modelo de IA más inteligente” hasta la fecha. Este último modelo de lenguaje grande, desarrollado por el equipo de Google Deepmind, se describe como un “modelo de pensamiento” diseñado para abordar problemas complejos razonando a través de pasos internamente antes de responder. Los primeros puntos de referencia respaldan la confianza de Google: Gemini 2.5 Pro (un primer lanzamiento experimental de la serie 2.5) debutan en el número 1 en la tabla de clasificación Lmarena de asistentes de IA por un margen significativo, y lidera muchas pruebas estándar para la codificación, las matemáticas y las tareas científicas.
Las nuevas capacidades y características clave en Gemini 2.5 Pro incluyen:
- Razonamiento de la cadena de pensamiento: A diferencia de los chatbots más sencillos, Gemini 2.5 Pro explícitamente “piensa” a través de un problema internamente. Esto lleva a respuestas más lógicas y precisas sobre consultas difíciles, desde rompecabezas lógicos difíciles hasta tareas de planificación complejas.
- Rendimiento de última generación: Google informa que 2.5 Pro supera los últimos modelos de OpenAI y Anthrope en muchos puntos de referencia. Por ejemplo, estableció nuevos máximos en las pruebas de razonamiento difíciles como el último examen de la humanidad (puntuando 18.8% frente a 14% para el modelo de OpenAI y 8.9% para Anthrope’s), y lidera en varios desafíos de matemáticas y ciencias sin necesidad de trucos costosos como la votación en conjunto.
- Habilidades de codificación avanzada: El modelo muestra un gran salto en la capacidad de codificación sobre su predecesor. Se destaca en la generación y edición del código para aplicaciones web e incluso scripts autónomos de “agente”. En el punto de referencia de codificación SWE-Bench, Gemini 2.5 Pro alcanzó una tasa de éxito del 63.8%, muy por delante de los resultados de OpenAi, aunque todavía un poco detrás del modelo especializado de “soneto” “soneto” de Anthrope (70.3%).
- Comprensión multimodal: Al igual que los modelos Gemini anteriores, 2.5 Pro es multimodal nativo: puede aceptar y razonar sobre texto, imágenes, audio, incluso videos e entrada de código en una conversación. Esta versatilidad significa que podría describir una imagen, depurar un programa y analizar una hoja de cálculo, todo dentro de una sola sesión.
- Ventana de contexto masivo: Quizás lo más impresionante, Gemini 2.5 Pro puede manejar hasta 1 millón de tokens de contexto (con una actualización de tokens de 2 millones en el horizonte). En términos prácticos, eso significa que puede ingerir cientos de páginas de textos o repositorios de código enteros a la vez sin perder el seguimiento de los detalles. Esta larga memoria supera enormemente lo que ofrecen la mayoría de los otros modelos de IA, permitiendo que Gemini mantenga una comprensión detallada de documentos o discusiones muy grandes.
Según Google, estos avances provienen de un modelo base significativamente mejorado combinado con técnicas mejoradas después de la capacitación. En particular, Google también retira la marca separada de “pensamiento flash” que utilizó para Gemini 2.0; Con 2.5, las capacidades de razonamiento ahora están incorporadas de forma predeterminada en todos los modelos futuros. Para los usuarios, eso significa que incluso las interacciones generales con Gemini se beneficiarán de este nivel más profundo de “pensar” debajo del capó.
Implicaciones para la automatización y diseño
Más allá del zumbido de los puntos de referencia y la competencia, la importancia real de Gemini 2.5 Pro puede estar en lo que permite para los usuarios finales e industrias. El fuerte desempeño del modelo en las tareas de codificación y razonamiento no se trata solo de resolver acertijos para alardear de los derechos: insinúa nuevas posibilidades para la automatización del lugar de trabajo, el desarrollo de software e incluso el diseño creativo.
Tome la codificación, por ejemplo. Con la capacidad de generar código de trabajo a partir de un mensaje simple, Gemini 2.5 Pro puede actuar como un multiplicador de proyecto para los desarrolladores. Un solo ingeniero podría potencialmente prototipos de una aplicación web o analizar una base de código completa con asistencia de IA que maneja gran parte del trabajo de gruñidos. En una demostración de Google, el modelo creó un videojuego básico desde cero dada solo una descripción de una oración. Esto sugiere un futuro en el que los no programadores describirán una idea y obtendrán una aplicación en ejecución en respuesta (“codificación de vibos”), bajando drásticamente la barrera para la creación de software.
Incluso para desarrolladores experimentados, tener una IA que pueda comprender y modificar repositorios de código grandes (gracias a ese contexto de 1 m) significa una depuración más rápida, revisiones de código y refactorización. Nos estamos moviendo hacia una era de programadores de pares de IA que pueden mantener el “Gran imagen” de un proyecto complejo en su cabeza, por lo que no tiene que recordarles el contexto con cada aviso.
Las habilidades de razonamiento avanzado de Gemini 2.5 también juegan en la automatización del trabajo de conocimiento. Los primeros usuarios han intentado alimentarse en largos contratos y pedirle al modelo que extraiga cláusulas clave o resume puntos, con resultados prometedores. Imagine automatizar partes de la revisión legal, la investigación de diligencia debida o el análisis financiero al dejar que la IA pase a través de cientos de páginas de documentos y retire lo que importa, tareas que actualmente comen innumerables horas humanas.
La habilidad multimodal de Gemini significa que incluso podría analizar una mezcla de textos, hojas de cálculo y diagramas juntos, dando un resumen coherente. Este tipo de IA podría convertirse en un asistente invaluable para profesionales en derecho, medicina, ingeniería o cualquier campo ahogamiento en datos y documentación.
Para los campos creativos y el diseño de productos, modelos como Gemini 2.5 Pro también abren posibilidades intrigantes. Pueden servir como socios de lluvia de ideas, por ejemplo, que generan conceptos de diseño o copia de marketing mientras razonan sobre los requisitos, o como prototipos rápidos que transforman una idea aproximada en un borrador tangible. El énfasis de Google en el comportamiento de la agente (la capacidad del modelo para usar herramientas y realizar planes de varios pasos de forma autónoma) sugerencias de que las versiones futuras podrían integrarse directamente con el software.
Uno podría imaginar una IA de diseño que no solo sugiere ideas, sino que también navega por el software de diseño o escribe código para implementar esas ideas, todas guiadas por instrucciones humanas de alto nivel. Tales capacidades difuminan la línea entre “Thinker” y “Doer” en el reino de AI, y Gemini 2.5 es un paso en esa dirección, una IA que puede conceptualizar soluciones y ejecutarlas en varios dominios.
Sin embargo, estos avances también plantean preguntas importantes. A medida que AI asume tareas más complejas, ¿cómo nos aseguramos de que comprenda los matices y los límites éticos (por ejemplo, al decidir qué cláusulas de contrato son sensibles o cómo equilibrar los aspectos creativos frente a los aspectos prácticos en el diseño)? Google y otros necesitarán construir barandillas robustas, y los usuarios necesitarán aprender nuevos conjuntos de habilidades, lo que solicita y supervisará la IA, a medida que estas herramientas se convierten en compañeros de trabajo.
No obstante, la trayectoria es clara: modelos como Gemini 2.5 Pro están empujando la IA más profundamente en roles que anteriormente requerían inteligencia humana y creatividad. Las implicaciones para la productividad y la innovación son enormes, y es probable que veamos efectos dominantes en cómo se construyen los productos y cómo se realiza el trabajo en muchas industrias.
Géminis 2.5 y el nuevo campo AI
Con Gemini 2.5 Pro, Google está apostando un reclamo a la vanguardia de la carrera de IA, y enviando un mensaje a sus rivales. Hace solo un par de años, la narración era que la IA de Google (piense en las primeras iteraciones de Bard) estaba rezagada detrás de Chatgpt de OpenAi y los movimientos agresivos de Microsoft. Ahora, al organizar el talento combinado de Google Research y DeepMind, la compañía ha entregado un modelo que puede competir legítimamente por el título del mejor asistente de IA en el planeta.
Esto es un buen augurio para el posicionamiento a largo plazo de Google. Los modelos de IA se consideran cada vez más como plataformas centrales (al igual que los sistemas operativos o los servicios en la nube), y tener un modelo de nivel superior le da a Google una mano fuerte para jugar en todo, desde ofertas de la nube empresarial (Google Cloud/Vertex AI) hasta servicios de consumo como búsqueda, aplicaciones de productividad y Android. A la larga, podemos esperar que la familia Gemini se integre en muchos productos de Google, potencialmente sobrealimentando el Asistente de Google, mejorando las aplicaciones de Google Workspace con características más inteligentes y mejorando la búsqueda con habilidades más conversacionales y conscientes del contexto.
El lanzamiento de Gemini 2.5 Pro también destaca cuán competitivo se ha vuelto el panorama de IA. Operai, antrópico y otros jugadores como Meta y Startups emergentes están iterando rápidamente en sus modelos. Cada salto de una empresa, ya sea una ventana de contexto más amplia, una nueva forma de integrar herramientas o una nueva técnica de seguridad, es respondida rápidamente por otros. El movimiento de Google para incrustar el razonamiento en todos sus modelos es estratégico, asegurando que no se quede atrás en la “inteligencia” de su IA. Mientras tanto, la estrategia de Anthrope de dar a los usuarios más control (como se ve con la profundidad de razonamiento ajustable de Claude 3.7) y los refinamientos continuos de OpenAI a GPT-4.X mantienen la presión sobre.
Para los usuarios finales y los desarrolladores, esta competencia es en gran medida positiva: significa mejores sistemas de IA que llegan más rápido y más opciones en el mercado. Estamos viendo un ecosistema de IA en el que ninguna empresa tiene el monopolio de la innovación, y esa dinámica empuja a cada uno a sobresalir, al igual que los primeros días de la computadora personal o las guerras de teléfonos inteligentes.
En este contexto, la versión de Gemini 2.5 Pro es más que una actualización de productos de Google: es una declaración de intención. Se indica que Google pretende no ser solo un seguidor rápido sino un líder en la nueva era de la IA. La compañía está aprovechando su infraestructura informática masiva (necesaria para entrenar modelos con más de 1 millones de contextos tokens) y vastas recursos de datos para superar los límites que pocos otros pueden. Al mismo tiempo, el enfoque de Google (implementando modelos experimentales para usuarios de confianza, integrando AI en su ecosistema cuidadosamente) muestra un deseo de equilibrar la ambición con la responsabilidad y la practicidad.
Como Koray Kavukcuoglu, CTO de Google Deepmind, lo expresó en el anuncio, el objetivo es hacer que la IA sea más útil y capaz al mejorarlo a un ritmo rápido.
Para los observadores de la industria, Gemini 2.5 Pro es un hito que marca qué tan lejos ha llegado la IA a principios de 2025, y un indicio de hacia dónde va. El bar de “estado del arte” sigue aumentando: hoy es razonamiento y destreza multimodal, mañana podría ser algo así como la resolución de problemas o la autonomía aún más general. El último modelo de Google muestra que la compañía no solo está en la carrera, sino que tiene la intención de dar forma a su resultado. Si Gemini 2.5 tiene algo que ver, la próxima generación de modelos de IA estará aún más integrada en nuestro trabajo y vidas, lo que nos lleva a volver a imaginar cómo usamos la inteligencia de la máquina.
Noticias
Usé IA para planificar mis comidas durante una semana, esta es mi opinión honesta.
Published
11 horas agoon
26 marzo, 2025
Como escritor, siempre he sido reclino de AI. ¿Robará mi trabajo? ¿Terminará tomando el mundo como esos robots en esa película de Will Smith? Dejando de lado mis dramáticas preocupaciones, me encontré increíblemente intrigado cuando recientemente encontré varias publicaciones en X (anteriormente Twitter) por personas que usaban ChatGPT para crear listas de compras y planificar sus comidas durante una semana. Cualquier cosa que haga que esta tarea semanal sea más fácil es algo que pueda respaldar, o al menos probar.
Entonces, como experimento, en lugar de llenar mi carrito de compras con los sospechosos habituales, utilicé ChatGPT para crear un plan de comidas de cinco días y mi lista de compras. Esto es lo que siguió:
El proceso
Para que Chatgpt se encargue de esta tarea para mí, escribí el siguiente comando: “Cree una lista de comestibles y recetas (desayuno, almuerzo, cena y bocadillos) para los lunes a viernes. El presupuesto es de $ 75. No incluya tomates, guisantes u avena. Las recetas deben ser bastante saludables y densas en nutrientes. ¡Gracias!”
Traté de ser lo más específico posible sin hacer demasiado. También quería desafiar a ChatGPT financieramente lanzando un presupuesto modesto. Y me aseguré de mantenerlo lindo y amable con un poco de gratitud al final (me niego a ser Yo, robot‘d). Al recibir mis resultados, había un ingrediente que sabía que quería salir. “Eso es genial, pero no tofu”, escribí al chatbot.
“¡Lo tengo! Ajustaré el plan y eliminaré el tofu, reemplazándolo con otras opciones de proteínas”, respondió ChatGPT, antes de compartir una lista de comestibles y un plan de comidas actualizados.
Y así, tenía una lista completa de comestibles y comidas de lunes a viernes. Aunque ChatGPT hizo todo el trabajo, me sentí productivo de alguna manera. Algo sobre las comidas planeadas para la semana realmente se quita una carga. Tenía esperanzas.
Las comidas
Aquí está el plan de comidas Chatgpt diseñado para mí, a continuación. Para ahorrarle mucha redundancia, he notado algunos, pero no todas, de las instrucciones que Chatgpt me dio en cuanto a la preparación. (La mayoría de estas comidas son bastante fáciles de hacer sin mucha dirección externa).
Lunes
Desayuno: Huevos revueltos con espinacas
Almuerzo: Ensalada de atún con aceite de oliva, pepinos y zanahorias
Cena: Pollo a la parrilla con batatas asadas y brócoli (Sazone el pollo con sal, pimienta y ajo en polvo, luego sea la parrilla o la sartén; las batatas de cubos y asanlos con aceite de oliva, sal y pimienta a 400 ° F durante 25 minutos; brócoli de vapor).
Bocadillo: Yogurt griego con bayas.
Martes
Desayuno: Yogurt griego con mantequilla de plátano y maní (Corte el plátano y agregue a un tazón de yogurt griego; rocíe con mantequilla de maní para proteínas agregadas).
Almuerzo: Vegetal salteado con pollo y arroz marrón (Corte el pollo y cocine en aceite de oliva hasta que se dore; Agregue verduras congeladas y saltee con salsa de soja; Servir con arroz integral).
Cena: Pechuga de pollo al horno con calabacín asado y batatas
Bocadillo: Zanahorias con mantequilla de maní
Miércoles
Desayuno: Huevos revueltos con pimiento rojo y espinacas
Almuerzo: Envoltura de pollo y verduras con pan de trigo integral (Corte el pollo a la parrilla y coloque en una envoltura con espinacas y pepino. Rocíe con aceite de oliva y enrolle.)
Cena: Salteado de pollo con brócoli y arroz marrón
Bocadillo: Yogurt griego con llovizna de miel
Jueves
Desayuno: Tostada de mantequilla de plátano y maní
Almuerzo: Ensalada de atún en tostada de trigo entero (Mezcle el atún enlatado con pepino picado y aceite de oliva; extienda la mezcla sobre pan de trigo integral tostado).
Cena: Pollo horneado con verduras asadas
Bocadillo: Zanahorias con salsa de yogurt griega
Viernes
Desayuno: Veggie Scramble con huevos
Almuerzo: Tazón de pollo y arroz (Cocine el pollo y córtelo; sirva con arroz integral y brócoli al vapor; rocíe con salsa de soja).
Cena: Pollo salteado con verduras mixtas y batata
Bocadillo: Yogurt griego con un puñado de bayas congeladas.
Al revisar las diversas comidas que se proporcionan Chatgpt, desearía que incluya “Hacerlo sabroso” en mi solicitud inicial. Tengo que admitir que mis papilas gustativas estaban bastante aburridas el miércoles. No tengo nada contra el pollo, pero ahora sufro un caso importante de fatiga avícola.
Las compras de comestibles
Chatgpt me dio esta lista para hacer mis comidas, junto con su precio para cada artículo:
Desglose del presupuesto:
- Huevos: $ 2.50
- Pechuga de pollo (1 lb): $ 6.00
- TUMA CONDIVADO: $ 1.00
- Frijoles negros (1 lata): $ 1.00
- Yogurt griego (32 oz): $ 4.00
- Espinacas (1 grupo): $ 1.50
- Brócoli (1 cabeza): $ 2.00
- Batatas (2): $ 3.00
- Calabacín (2): $ 1.50
- Pepino (1): $ 1.00
- Zanahorias (1 lb): $ 1.50
- Pimiento rojo (1): $ 1.00
- Verduras mixtas congeladas: $ 2.00
- Bananas (2): $ 1.00
- Manzanas (2): $ 1.50
- Bayas congeladas: $ 3.00
- Pan de trigo integral: $ 2.00
- Arroz marrón: $ 2.00
- Pasta de trigo integral: $ 1.50
- Queso cheddar: $ 2.50
- Leche: $ 1.50
- Mantequilla de maní: $ 2.00
- Aceite de oliva, salsa de soja, sal, pimienta, ajo en polvo, cebolla en polvo: ~ $ 6.00
Total: ~ $ 74.50
También incluyó este mensaje agradable en buena medida: “Esto debería estar dentro de su presupuesto mientras mantiene las comidas saludables y equilibradas. ¡Disfruta!”
Primero: el presupuesto. Ya tenía aceite de oliva, salsa de soja y los condimentos disponibles, por lo que no necesitaba comprarlos. Afortunadamente, tenía todos esos ingredientes porque no hay forma de que cuestan solo $ 6 juntos. ¡El aceite de oliva solo es más que eso! (Me pregunté si ChatGPT estaba calculando ese precio según la cantidad que usaría.
Compré más de una sola libra de pollo, no seguro si se trataba de un error de chatgpt, pero dada la cantidad de comidas que llamaban al pollo, me quedé con mi paquete habitual, que está más cerca de una libra y media. Para hacer mis compras, utilicé Instacart, que tiende a ser más caro que ir en persona, pero obtuve dentro de aproximadamente $ 10 de ese presupuesto de $ 75. ¡No está mal, chatgpt!
(Notaré que estaba cocinando para mí, pero con la cantidad de artículos comprados, habría habido mucha comida para uno, tal vez incluso otras dos personas).
Ahora, aquí es donde las cosas se ponen raras. Después de comprar los comestibles, comparé las comidas con la lista de comestibles, y algo importante se destacó. Varios de los artículos enumerados en la lista de compras no se usaron en las comidas. Sé que ChatGPT es plenamente consciente del costo de los comestibles, así que por qué me haría comprar cinco artículos (¡sí, cinco!) Que no necesitaba está más allá de mí. En caso de que se lo pregunte, esos cinco artículos eran una lata de frijoles negros, pasta de trigo integral, queso, manzanas y leche. Sinceramente, todavía estoy rascándome la cabeza sobre este.

Dejando a un lado la lista de compras, estaba emocionado de probar algunas recetas nuevas (y saludables). Y me complace decir que encontré algunos favoritos nuevos gracias a este pequeño experimento. Entre mis recetas favoritas estaban el yogur griego con plátanos y mantequilla de maní (también agregué una llovizna de miel) y salteado de verduras con pollo y arroz integral.
Pero, hubo casos en los que se sentía absolutamente como si las comidas fueran planificadas por un robot. Por ejemplo, una envoltura de sándwich hecha “usando pan de trigo integral” me pareció un poco extraño. ¿Cómo “enrollar” una rebanada de pan? Y las bayas frescas habrían sido una mejor compra que las bayas congeladas, dado que las estaba usando como una cobertura de yogurt.
El veredicto
El fiasco de la lista de comestibles me apagó, pero avanzé. Y tal vez debería haber presionado ese carrito de comestibles virtual muy, muy lejos porque, en última instancia, esta es una técnica sin la que puedo prescindir. Además de un puñado de favoritos, las comidas sugeridas eran decepcionantes. La conveniencia de todo simplemente no valió la pena para mí. Estoy seguro de que obtendría mejores resultados con un presupuesto más grande y solicitudes más específicas, pero prefiero trabajar con una persona humana real en un plan de comidas que se adapte a mí individualmente.
¡Ahora, por favor envíeme todas sus recetas favoritas de pollo y sin atún!
Danielle Harling es una escritora independiente con sede en Atlanta con un amor por los espacios diseñados con colores, cócteles artesanales y compras en línea (generalmente para tacones de diseñador que rompen el presupuesto). Su trabajo anterior ha aparecido en Fodor’s, Forbes, Mydomaine, Architectural Digest y más.
Related posts






































































































































































































































Trending
-
Startups10 meses ago
Remove.bg: La Revolución en la Edición de Imágenes que Debes Conocer
-
Recursos11 meses ago
Cómo Empezar con Popai.pro: Tu Espacio Personal de IA – Guía Completa, Instalación, Versiones y Precios
-
Tutoriales11 meses ago
Cómo Comenzar a Utilizar ChatGPT: Una Guía Completa para Principiantes
-
Startups9 meses ago
Startups de IA en EE.UU. que han recaudado más de $100M en 2024
-
Recursos11 meses ago
Suno.com: La Revolución en la Creación Musical con Inteligencia Artificial
-
Startups11 meses ago
Deepgram: Revolucionando el Reconocimiento de Voz con IA
-
Recursos10 meses ago
Perplexity aplicado al Marketing Digital y Estrategias SEO
-
Noticias8 meses ago
Dos periodistas octogenarios deman a ChatGPT por robar su trabajo