Connect with us

Noticias

What is ChatGPT? How the world’s most popular AI chatbot can benefit you

Published

on

Sabrina Ortiz/ZDNET

What is ChatGPT?

ChatGPT is an AI chatbot with advanced natural language processing (NLP) that allows you to have human-like conversations to complete various tasks. The generative AI tool can answer questions and assist you with composing text, code, and much more.

Also: How to use ChatGPT

It’s currently open to use for free. OpenAI launched a paid subscription version called ChatGPT Plus in February 2023, which guarantees users access to the company’s latest models, exclusive features, and updates but is not necessary for basic usage. 

What is ChatGPT used for?

ChatGPT offers many functions in addition to answering simple questions. ChatGPT can compose essays, have philosophical conversations, do math, and even code for you. 

The tasks ChatGPT can help with don’t have to be so ambitious. For example, my favorite use case for ChatGPT is to help create basic lists for chores, such as packing and grocery shopping, and to-do lists that make my daily life more productive. The possibilities are endless. 

ZDNET has published many ChatGPT how-to guides. Below are some of the most popular ones. 

Use ChatGPT to: 

Is ChatGPT available for free?  

ChatGPT is free, regardless of what you use it for, including writing, coding, and much more. 

There is a subscription option, ChatGPT Plus, that costs $20 per month. The paid subscription model gives you extra perks, such as priority access to GPT-4o, DALL-E 3, unlimited photogeneration, Canvas, Voice Mode, and the latest upgrades. 

Also: ChatGPT vs ChatGPT Plus: Is it worth the subscription fee?

Although the subscription price may seem steep, it is the same amount as Microsoft Copilot Pro and Google One AI Premium, which are Microsoft’s and Google’s paid AI offerings. 

How can you access ChatGPT?

On April 1, 2024, OpenAI stopped requiring you to log in to ChatGPT. Now, you can access ChatGPT simply by visiting chat.openai.com. You can also access ChatGPT via an iPhone, Android, or desktop app.

Once you visit the site, you can start chatting away with ChatGPT. A great way to get started is by asking a question, similar to what you would do with Google. You can ask as many questions as you’d like.

Also: ChatGPT no longer requires a login, but you might want one anyway. Here’s why

Creating an OpenAI account still offers some perks, such as saving and reviewing your chat history, accessing custom instructions, and, most importantly, getting free access to GPT-4o. Signing up is free and easy; you can use your existing Google login.

For step-by-step instructions, check out ZDNET’s guide on how to start using ChatGPT. 

Is there a ChatGPT app?

Yes, an official ChatGPT app is available for iPhone and Android users. Make sure to download OpenAI’s app, as many copycat fake apps are listed on Apple’s App Store and the Google Play Store that are not affiliated with OpenAI.

Also: I changed 5 ChatGPT settings and instantly became more productive – here’s how

There’s also a ChatGPT app for MacOS and Windows, which lets you access the chatbot quickly via a keyboard shortcut. The Mac app was initially only available for ChatGPT Plus subscribers, but OpenAI recently made it available to all users. The Windows app is still limited to ChatGPT Plus, Enterprise, and EDU users.

Is ChatGPT safe?

People have expressed concerns about AI chatbots replacing or atrophying human intelligence. 

For example, chatbots can write an entire essay in seconds, raising concerns about students cheating and not learning how to write properly. These fears even led some school districts to block access when ChatGPT initially launched.

Now, not only have many of those schools decided to unblock the technology, but some higher education institutions have been catering their academic offerings to AI-related coursework. 

Also: Two ways you can build custom AI assistants with GPT-4o – and one is free

Another concern with AI chatbots is the possible spread of misinformation. ChatGPT says: “My responses are not intended to be taken as fact, and I always encourage people to verify any information they receive from me or any other source.” OpenAI also notes that ChatGPT sometimes writes “plausible-sounding but incorrect or nonsensical answers.”

Lastly, there are ethical and privacy concerns regarding the information ChatGPT was trained on. OpenAI scraped the internet to train the chatbot without asking content owners for permission to use their content, which brings up many copyright and intellectual property concerns. 

Also: How to use ChatGPT to analyze PDFs for free

There are also privacy concerns regarding generative AI companies using your data to fine-tune their models further, which has become a common practice. OpenAI lets you turn off training in ChatGPT’s settings.

So, is ChatGPT safe? If your main concern is privacy, OpenAI has implemented several options to give users peace of mind that their data will not be used to train models. The company even allows you to turn off your chat history. If you are concerned about moral and ethical problems, they are still being hotly debated.

Will my conversations with ChatGPT be used for training?

Companies train generative AI models on user inputs. Therefore, when familiarizing yourself with how to use ChatGPT, you might wonder if your specific conversations will be used for training and, if so, who can view your chats.

Also: This ChatGPT update fixed one of my biggest productivity issues with the AI chatbot

OpenAI will, by default, use your conversations with the free chatbot to train data and refine its models. You can opt out of it using your data for model training by clicking on the question mark in the bottom left-hand corner, Settings, and turning off “Improve the model for everyone.”

Can ChatGPT help me apply for jobs?

Yes, ChatGPT is a great resource for helping with job applications. Undertaking a job search can be tedious and difficult, and ChatGPT can help you lighten the load. ChatGPT can build your resume and write a cover letter.

AlsoHow to use ChatGPT to write an essay

If your application has any written supplements, you can use ChatGPT to help you write those essays or personal statements. You can also use ChatGPT to prep for your interviews by asking ChatGPT to provide you mock interview questions, background on the company, or questions that you can ask. 

Can you use ChatGPT for schoolwork?

ChatGPT can be an excellent resource in assisting students with their work. A popular misconception is that ChatGPT and other AI resources will do students’ work for them. However, it can be used as a personal tutor or editor, giving students assistance outside of the classroom. 

Also: 5 free AI tools for school that students, teachers, and parents can use, too

For example, a student can drop their essay into ChatGPT and have it copyedit, upload class handwritten notes and have them digitized, or even generate study outlines from class materials. 

It is especially helpful for coding homework since most coding languages are very character-sensitive, and one missing semicolon can throw the entire result off. Instead of staring at the screen for ages, you can ask ChatGPT to identify errors for you, which allows you to grow. 

What does ChatGPT stand for?  

The last three letters in ChatGPT’s namesake stand for Generative Pre-trained Transformer (GPT), a family of large language models created by OpenAI that uses deep learning to generate human-like, conversational text. 

Also: What does GPT stand for? Understanding GPT 3.5, GPT 4, GPT-4 Turbo, and more

The “Chat” part of the name is simply a callout to its chatting capabilities. 

Can ChatGPT generate images?

Yes, ChatGPT can generate images using DALL-E 3. However, the limits vary depending on whether you are a ChatGPT Plus subscriber or a free user. ChatGPT Plus subscribers are allowed 50 generations per day, while free users are allotted two. 

Also: The best AI image generators of 2024: Tested and reviewed

Since OpenAI discontinued DALL-E 2 in February 2024, the only way to access its most advanced AI image generator, DALL-E 3, through OpenAI’s offerings is via its chatbot.

Microsoft’s Copilot offers free image generation, also powered by DALL-E 3, in its chatbot. This is a great alternative if you don’t want to pay for ChatGPT Plus but want high-quality image outputs for free. 

How does ChatGPT work?

ChatGPT runs on a large language model (LLM) architecture created by OpenAI called the Generative Pre-trained Transformer (GPT). Since its launch, the free version of ChatGPT ran on a fine-tuned model in the GPT-3.5 series until May 2024, when OpenAI upgraded the model to GPT-4o. Now, the free version runs on GPT-4o mini, with limited access to GPT-4o. 

Also: How does ChatGPT actually work? 

With a subscription to ChatGPT Plus, you can access GPT-4, GPT-4o mini or GPT-4o. Plus, users also have priority access to GPT-4o, even at capacity, while free users get booted down to GPT-4o mini. 

The LLMs used in generative AI models of this type are trained on vast amounts of information from the internet, including websites, books, news articles, and more, typically via web scraping, where the entirety of the internet is scraped for information. 

Who owns ChatGPT currently?

OpenAI launched ChatGPT on November 30, 2022. OpenAI has also developed DALL-E 2 and DALL-E 3, popular AI image generators, and Whisper, an automatic speech recognition system. 

Also: The best AI chatbots: ChatGPT, Copilot and worthy alternatives

As a result, OpenAI owns ChatGPT. Microsoft is a major investor in OpenAI thanks to multiyear, multi-billion dollar investments. Elon Musk was an investor when OpenAI was first founded in 2015 but has since completely severed ties with the startup and created his own AI chatbot,Grok.

Is ChatGPT better than a search engine?

ChatGPT is an AI chatbot created to converse with the end user. A search engine indexes web pages on the internet to help users find information. One is not better than the other, as each suits different purposes. 

When searching for as much up-to-date, accurate information as possible, your most reliable option is a search engine. It will provide you with pages upon pages of sources you can peruse. 

Also: ChatGPT has officially replaced Google Search for me – here’s why

In November 2024, OpenAI already unveiled ChatGPT Search, a feature within the ChatGPT app that lets users search the web for timely, up-to-date information, complete with citations linked to sources. 

With ChatGPT Search, you can enter your sentence as your train of thought takes you, and the AI will understand the meaning of your query by leveraging its NLP capabilities. This means you can spend less time crafting a tailored search query but still get exactly what you want. 

If you are looking for a platform that can explain complex topics in an easy-to-understand manner, then ChatGPT might be what you want. If you want the best of both worlds, plenty of AI search engines combine both.

The search experience is available on the ChatGPT website, desktops, and mobile apps for all ChatGPT Plus, Team users, and SearchGPT waitlist users. 

What is SearchGPT?

SearchGPT is an experimental offering from OpenAI that functions as an AI-powered search engine that is aware of current events and uses real-time information from the Internet. The experience was a prototype. OpenAI integrated the best features directly into ChatGPT with ChatGPT Search. 

Upon launching the prototype, users were given a waitlist to sign up for. However, shortly after, OpenAI closed its waitlist. Those users were given priority access to ChatGPT Search when it launched. 

What is ChatGPT Search?

In November, OpenAI unveiled ChatGPT Search, a feature that lets users search the web directly within ChatGPT for timely, up-to-date information, complete with citations linked to sources. The tool can be called on manually or activated whenever a user prompt could benefit from web-based information.   

What are ChatGPT’s limitations?

Despite its impressive capabilities, ChatGPT still has limitations. Users sometimes need to reword questions multiple times for ChatGPT to understand their intent. A bigger limitation is a lack of quality in responses, which can sometimes be plausible-sounding but are verbose or make no practical sense.

Also: Police are using AI to write crime reports. What could go wrong?

Instead of asking for clarification on ambiguous questions, the model guesses what your question means, which can lead to poor responses. Generative AI models are also subject to hallucinations, which can result in inaccurate responses.

Does ChatGPT give wrong answers?

As mentioned above, ChatGPT, like all language models, has limitations and can give nonsensical answers and incorrect information, so it’s important to double-check the answers it gives you.

Also: 8 ways to reduce ChatGPT hallucinations

OpenAI recommends you provide feedback on what ChatGPT generates by using the thumbs-up and thumbs-down buttons to improve its underlying model. You can also join the startup’s Bug Bounty program, which offers up to $20,000 for reporting security bugs and safety issues.

Can ChatGPT refuse to answer my prompts?

AI systems like ChatGPT can and do reject inappropriate requests. The AI assistant can identify inappropriate submissions to prevent unsafe content generation.

Also: 6 things ChatGPT can’t do (and another 20 it refuses to do)

These submissions include questions that violate someone’s rights, are offensive, are discriminatory, or involve illegal activities. The ChatGPT model can also challenge incorrect premises, answer follow-up questions, and even admit mistakes when you point them out.

These guardrails are important. AI models can generate advanced, realistic content that can be exploited by bad actors for harm, such as spreading misinformation about public figures and influencing elections.

Does ChatGPT plagiarize?

Yes, OpenAI scraped the internet to train ChatGPT’s models. Therefore, the technology’s knowledge is influenced by other people’s work. Since there is no guarantee that ChatGPT’s outputs are entirely original, the chatbot may regurgitate someone else’s work in your answer, which is considered plagiarism. 

Also, technically speaking, if you, as a user, copy and paste ChatGPT’s response, that is an act of plagiarism because you are claiming someone else’s work as your own. This act could have repercussions based on the rules enforced by your workplace or educational institution. 

Is there a ChatGPT detector?

In short, the answer is no, not because people haven’t tried, but because none do it efficiently. 

In January 2023, OpenAI released a free tool to detect AI-generated text. Unfortunately, OpenAI’s classifier tool could only correctly identify 26% of AI-written text with a “likely AI-written” designation. Furthermore, it provided false positives 9% of the time, incorrectly identifying human-written work as AI-produced. 

Also: I tested 7 AI content detectors – they’re getting dramatically better at identifying plagiarism

The tool performed so poorly that, six months after its release, OpenAI shut it down “due to its low rate of accuracy.” Despite the tool’s failure, the startup claims to be researching more effective techniques for AI text identification.

Other AI detectors exist on the market, including GPT-2 Output Detector, Writer AI Content Detector, and Content at Scale’s AI Content Detection tool. ZDNET tested these tools, and the results were underwhelming: all three were unreliable sources for spotting AI, repeatedly giving false negatives. Here are ZDNET’s full test results.

What is GPT-4?

GPT-4 is OpenAI’s language model, much more advanced than its predecessor, GPT-3.5. GPT-4 outperforms GPT-3.5 in a series of simulated benchmark exams and produces fewer hallucinations.   

What is GPT-4o?

GPT-4o is OpenAI’s latest, fastest, and most advanced flagship model. As the name implies, GPT-4o has the same intelligence as GPT-4. However, the “o” in the title stands for “omni,” referring to its multimodal capabilities, which allow the model to understand text, audio, image, and video inputs and output text, audio, and image outputs.

Also: 6 ways OpenAI just supercharged ChatGPT for free users

The model is 50% cheaper in OpenAI’s API than GPT-4 Turbo while still matching its English and coding capabilities and outperforming it in non-English language, vision, and audio understanding — a big win for developers.

What is ChatGPT o1?

In September 2024, OpenAI unveiled its o1 models, which are capable of more advanced reading, making them ideal for math, science, and coding. For example, it scored 83% on the International Mathematics Olympiad (IMO) qualifying exam. For comparison, GPT-4o correctly solved only 13% of problems. 

Also: What are o1 and o1-mini? OpenAI’s mystery AI models are finally here

ZDNET’s David Gewirtz put o1- preview to the test and was impressed by its ability to tackle several complex tasks with lots of detail, including writing a WordPress plugin, rewriting a string function, finding an annoying bug, and more. 

What are the best ChatGPT alternatives?

Although ChatGPT gets the most buzz, other options are just as good — and might even be better suited to your needs. ZDNET has created a list of the best chatbots, all of which we have tested to identify the best tool for your requirements.

Also: Claude AI can now analyze PDFs – here’s how to try it

Despite ChatGPT’s extensive abilities, other chatbots have advantages that might be better suited for your use case, including Copilot, Claude, Perplexity, Jasper, and more.

What are GPTs?

OpenAI once offered plugins for ChatGPT to connect to third-party applications and access real-time information on the web. The plugins expanded ChatGPT’s abilities, allowing it to assist with many more activities, such as planning a trip or finding a place to eat. 

Also: My two favorite ChatGPT Plus features and the remarkable things I can do with them

However, on March 19, 2024, OpenAI stopped letting users install new plugins or start new conversations with existing ones. Instead, OpenAI replaced plugins with GPTs, which are easier for developers to build. 

With the latest update, all users, including those on the free plan, can access the GPT Store and find 3 million customized ChatGPT chatbots. Unfortunately, there is also a lot of spam in the GPT store, so be careful which ones you use.

What is Microsoft’s involvement with ChatGPT?

Microsoft was an early investor in OpenAI, the AI startup behind ChatGPT, long before ChatGPT was released to the public. Microsoft’s first involvement with OpenAI was in 2019 when the company invested $1 billion. The company invested another $2 billion in the years after. In January 2023, Microsoft extended its partnership with OpenAI through a multiyear, multi-billion dollar investment.

Also: ChatGPT vs. Copilot: Which AI chatbot is better for you?

Neither company disclosed the investment value, but unnamed sources told Bloomberg that it could total $10 billion over multiple years. In return, OpenAI’s exclusive cloud-computing provider — Microsoft Azure, powers all OpenAI workloads across research, products, and API services.

Microsoft has also used its OpenAI partnership to revamp its Bing search engine and improve its browser. On February 7, 2023, Microsoft unveiled a new Bing tool, now known as Copilot, that runs on OpenAI’s GPT-4, customized specifically for search.

How does Copilot compare to ChatGPT?

Copilot uses OpenAI’s GPT-4, which means that since its launch, it has been more efficient and capable than the standard, free version of ChatGPT, which was powered by GPT 3.5 at the time. At the time, Copilot boasted several other features over ChatGPT, such as access to the internet, knowledge of current information, and footnotes.

Also: I was a Copilot diehard until ChatGPT added these 5 features

In May 2024, however, OpenAI supercharged the free version of its chatbot with GPT-4o. The upgrade gave users GPT-4 level intelligence, the ability to get responses from the web, analyze data, chat about photos and documents, use GPTs, and access the GPT Store and Voice Mode. After the upgrade, ChatGPT reclaimed its crown as the best AI chatbot.

What is Gemini and how does it relate to ChatGPT?

Gemini is Google’s AI chat service, a rival to ChatGPT. On February 6, 2023, Google introduced its experimental AI chat service, which was then called Google Bard. 

Also: ChatGPT vs. Microsoft Copilot vs. Gemini: Which is the best AI chatbot?

Over a month after the announcement, Google began rolling out access to Bard first via a waitlist. Now, the tool is available to the public. The biggest perk of Gemini is that it has Google Search at its core and has the same feel as Google products. Therefore, if you are an avid Google user, Gemini might be the best AI chatbot for you. 

What is Apple’s involvement with OpenAI?

At Apple’s Worldwide Developer’s Conference in June 2024, the company announced a partnership with OpenAI that will integrate ChatGPT with Siri. With the user’s permission, Siri can request ChatGPT for help if Siri deems a task is better suited for ChatGPT. This feature has not yet been released to users.   

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

Google lanza Gemini 2.5 Pro, empujando los límites del razonamiento de IA

Published

on

Gemini 2.5 Pro es el último modelo de IA multimodal a gran escala de Google Deepmind, diseñado con capacidades incorporadas de “pensamiento” para manejar tareas complejas. Como el primer lanzamiento de la serie Gemini 2.5, el modelo Pro lidera muchos puntos de referencia de la industria mediante márgenes significativos y demuestra fuertes capacidades de razonamiento y codificación.

A diferencia de las generaciones anteriores de IA que simplemente predijeron texto basado en patrones, Gemini 2.5 Pro está diseñado para analizar la información profundamente, sacar conclusiones lógicas, incorporar un contexto matizado y tomar decisiones informadas antes de responder. Esta evolución en las posiciones de diseño Gemini 2.5 Pro como un modelo de propósito general altamente avanzado que es adecuado para aplicaciones empresariales que exigen precisión y adaptabilidad.

En el núcleo de las características avanzadas de Gemini 2.5 Pro hay un cambio fundamental en su diseño arquitectónico, avanzando hacia lo que Google se refiere como un “modelo de pensamiento”. Esto indica una ruptura de los modelos de IA tradicionales centrados principalmente en la predicción y la clasificación hacia un sistema que se involucra en la deliberación y el razonamiento internos antes de generar una respuesta. Este enfoque intencional conduce a un rendimiento y una precisión significativamente mejorados, especialmente cuando se abordan tareas complejas que requieren más que un mero reconocimiento de patrones.

El rendimiento mejorado de Gemini Pro 2.5 no se debe únicamente al aumento de la potencia computacional o el tamaño del modelo. Más bien, surge de una combinación sofisticada de un modelo base subyacente muy mejorado, aprovechando los avances en la arquitectura de la red neuronal, los conjuntos de datos de entrenamiento extensos y las metodologías refinadas posteriores a la capacitación. Estas técnicas posteriores a la capacitación, que con frecuencia implican el aprendizaje de refuerzo, son cruciales para ajustar el comportamiento del modelo, asegurando una mayor calidad y resultados más relevantes. Esta evolución arquitectónica permite que el modelo realice análisis de información más exhaustivos, lleguen a conclusiones más precisas y lógicas, comprenda mejor e incorpore matices contextuales y, en última instancia, tome decisiones más informadas y confiables, capacidad que son esenciales para aplicaciones comerciales estratégicas.

Más allá del razonamiento abstracto, Gemini 2.5 Pro ofrece un conjunto de capacidades avanzadas que son directamente relevantes para las necesidades empresariales. Lo más destacado es su mejora significativa en el dominio de la codificación. Los ingenieros de Google informan que el rendimiento de la codificación experimentó un salto considerable de Gemini 2.0 a 2.5, con más mejoras en el horizonte. El modelo 2.5 Pro se destaca en la generación y el código de refinación, capaz de crear un software complejo, como una aplicación web interactiva funcional, desde un aviso de alto nivel. En una demostración, el modelo desarrolló un juego completo de “corredor interminable” en HTML/JS a partir de un mensaje de una sola línea, ilustrando su capacidad para administrar las tareas de codificación a nivel de proyecto de forma autónoma. Gemini 2.5 Pro también se destaca en una sólida transformación y edición de código, por lo que es valioso para tareas como refactorizar el código heredado o la traducción del código entre idiomas. En un punto de referencia de ingeniería de software estandarizado (verificado por el banco SWE), el modelo logró una puntuación alta (63.8%) utilizando una configuración de agente autónomo, lo que indica su fuerza para abordar los desafíos de codificación complejos de varios pasos. Para las empresas, esto significa que la IA puede funcionar no solo como un asistente de conversación sino también como una ayuda de codificación capaz o incluso un agente de software semiautónomo.

Como parte del ecosistema de Géminis más amplio, Google también ha introducido TXGEMMA, un conjunto de modelos abiertos dirigidos a desafíos especializados de la industria. TXGEMMA es una colección de modelos derivados de la Serie Ligera de Gemma (versiones de código abierto de Gemini Technology) y adaptado específicamente para el desarrollo terapéutico de fármacos y biotecnología. Estos modelos están capacitados para comprender y predecir las propiedades de posibles medicamentos y terapias génicas, lo que ayuda a los investigadores a identificar candidatos prometedores e incluso pronosticar resultados de ensayos clínicos.

En esencia, TXGEMMA toma las técnicas de modelado y razonamiento del lenguaje central de Géminis y las aplica al dominio farmacéutico, donde puede examinar la literatura biomédica, los datos químicos y los resultados del ensayo para ayudar en las decisiones de I + D. El modelo de TXGEMMA más grande (con 27 mil millones de parámetros) ha demostrado el rendimiento a la par o excediendo modelos especializados en muchas tareas de descubrimiento de fármacos, todo mientras se conserva las habilidades generales de razonamiento. Para los líderes empresariales en atención médica y ciencias de la vida, TXGEMMA muestra la adaptabilidad de la arquitectura de Géminis a dominios misioneros críticos: ilustra cómo la IA de vanguardia puede acelerar flujos de trabajo altamente específicos como el descubrimiento de fármacos que tradicionalmente llevan años e incurrir en costos masivos.

Gemini 2.5 Pro representa un paso adelante significativo en el diseño del modelo de IA, combinando la potencia bruta con capacidades de razonamiento refinado que abordan directamente las tareas complejas del mundo real. Su arquitectura, con multimodalidad nativa y una longitud de contexto sin precedentes, permite a las empresas traer una variedad más rica de datos para tener problemas, extrayendo ideas que los modelos anteriores podrían haberse perdido. El fuerte desempeño del modelo en los puntos de referencia de codificación y razonamiento brinda la confianza de que puede manejar aplicaciones exigentes, desde la automatización de partes de la ingeniería de software hasta dar sentido a las amplias bases de conocimiento corporativo. Con el soporte de Google para la integración empresarial a través de plataformas en la nube y la aparición de ramas específicas de dominio como TXGEMMA, el ecosistema Gemini 2.5 Pro está listo para proporcionar la inteligencia general y las habilidades especializadas que buscan las empresas modernas. Para las CXO que planea la estrategia de IA de su empresa, Gemini 2.5 Pro ofrece una vista previa de cómo se pueden implementar sistemas de IA de próxima generación para impulsar la innovación y la ventaja competitiva, todos centrados en un razonamiento más profundo, un contexto más amplio y resultados tangibles.

Continue Reading

Noticias

Gemini 2.5 Pro está aquí, y cambia el juego AI (nuevamente)

Published

on

Google ha presentado Gemini 2.5 Pro, llamándolo “Modelo de IA más inteligente” hasta la fecha. Este último modelo de lenguaje grande, desarrollado por el equipo de Google Deepmind, se describe como un “modelo de pensamiento” diseñado para abordar problemas complejos razonando a través de pasos internamente antes de responder. Los primeros puntos de referencia respaldan la confianza de Google: Gemini 2.5 Pro (un primer lanzamiento experimental de la serie 2.5) debutan en el número 1 en la tabla de clasificación Lmarena de asistentes de IA por un margen significativo, y lidera muchas pruebas estándar para la codificación, las matemáticas y las tareas científicas.

Las nuevas capacidades y características clave en Gemini 2.5 Pro incluyen:

  • Razonamiento de la cadena de pensamiento: A diferencia de los chatbots más sencillos, Gemini 2.5 Pro explícitamente “piensa” a través de un problema internamente. Esto lleva a respuestas más lógicas y precisas sobre consultas difíciles, desde rompecabezas lógicos difíciles hasta tareas de planificación complejas.
  • Rendimiento de última generación: Google informa que 2.5 Pro supera los últimos modelos de OpenAI y Anthrope en muchos puntos de referencia. Por ejemplo, estableció nuevos máximos en las pruebas de razonamiento difíciles como el último examen de la humanidad (puntuando 18.8% frente a 14% para el modelo de OpenAI y 8.9% para Anthrope’s), y lidera en varios desafíos de matemáticas y ciencias sin necesidad de trucos costosos como la votación en conjunto.
  • Habilidades de codificación avanzada: El modelo muestra un gran salto en la capacidad de codificación sobre su predecesor. Se destaca en la generación y edición del código para aplicaciones web e incluso scripts autónomos de “agente”. En el punto de referencia de codificación SWE-Bench, Gemini 2.5 Pro alcanzó una tasa de éxito del 63.8%, muy por delante de los resultados de OpenAi, aunque todavía un poco detrás del modelo especializado de “soneto” “soneto” de Anthrope (70.3%).
  • Comprensión multimodal: Al igual que los modelos Gemini anteriores, 2.5 Pro es multimodal nativo: puede aceptar y razonar sobre texto, imágenes, audio, incluso videos e entrada de código en una conversación. Esta versatilidad significa que podría describir una imagen, depurar un programa y analizar una hoja de cálculo, todo dentro de una sola sesión.
  • Ventana de contexto masivo: Quizás lo más impresionante, Gemini 2.5 Pro puede manejar hasta 1 millón de tokens de contexto (con una actualización de tokens de 2 millones en el horizonte). En términos prácticos, eso significa que puede ingerir cientos de páginas de textos o repositorios de código enteros a la vez sin perder el seguimiento de los detalles. Esta larga memoria supera enormemente lo que ofrecen la mayoría de los otros modelos de IA, permitiendo que Gemini mantenga una comprensión detallada de documentos o discusiones muy grandes.

Según Google, estos avances provienen de un modelo base significativamente mejorado combinado con técnicas mejoradas después de la capacitación. En particular, Google también retira la marca separada de “pensamiento flash” que utilizó para Gemini 2.0; Con 2.5, las capacidades de razonamiento ahora están incorporadas de forma predeterminada en todos los modelos futuros. Para los usuarios, eso significa que incluso las interacciones generales con Gemini se beneficiarán de este nivel más profundo de “pensar” debajo del capó.

Implicaciones para la automatización y diseño

Más allá del zumbido de los puntos de referencia y la competencia, la importancia real de Gemini 2.5 Pro puede estar en lo que permite para los usuarios finales e industrias. El fuerte desempeño del modelo en las tareas de codificación y razonamiento no se trata solo de resolver acertijos para alardear de los derechos: insinúa nuevas posibilidades para la automatización del lugar de trabajo, el desarrollo de software e incluso el diseño creativo.

Tome la codificación, por ejemplo. Con la capacidad de generar código de trabajo a partir de un mensaje simple, Gemini 2.5 Pro puede actuar como un multiplicador de proyecto para los desarrolladores. Un solo ingeniero podría potencialmente prototipos de una aplicación web o analizar una base de código completa con asistencia de IA que maneja gran parte del trabajo de gruñidos. En una demostración de Google, el modelo creó un videojuego básico desde cero dada solo una descripción de una oración. Esto sugiere un futuro en el que los no programadores describirán una idea y obtendrán una aplicación en ejecución en respuesta (“codificación de vibos”), bajando drásticamente la barrera para la creación de software.

Incluso para desarrolladores experimentados, tener una IA que pueda comprender y modificar repositorios de código grandes (gracias a ese contexto de 1 m) significa una depuración más rápida, revisiones de código y refactorización. Nos estamos moviendo hacia una era de programadores de pares de IA que pueden mantener el “Gran imagen” de un proyecto complejo en su cabeza, por lo que no tiene que recordarles el contexto con cada aviso.

Las habilidades de razonamiento avanzado de Gemini 2.5 también juegan en la automatización del trabajo de conocimiento. Los primeros usuarios han intentado alimentarse en largos contratos y pedirle al modelo que extraiga cláusulas clave o resume puntos, con resultados prometedores. Imagine automatizar partes de la revisión legal, la investigación de diligencia debida o el análisis financiero al dejar que la IA pase a través de cientos de páginas de documentos y retire lo que importa, tareas que actualmente comen innumerables horas humanas.

La habilidad multimodal de Gemini significa que incluso podría analizar una mezcla de textos, hojas de cálculo y diagramas juntos, dando un resumen coherente. Este tipo de IA podría convertirse en un asistente invaluable para profesionales en derecho, medicina, ingeniería o cualquier campo ahogamiento en datos y documentación.

Para los campos creativos y el diseño de productos, modelos como Gemini 2.5 Pro también abren posibilidades intrigantes. Pueden servir como socios de lluvia de ideas, por ejemplo, que generan conceptos de diseño o copia de marketing mientras razonan sobre los requisitos, o como prototipos rápidos que transforman una idea aproximada en un borrador tangible. El énfasis de Google en el comportamiento de la agente (la capacidad del modelo para usar herramientas y realizar planes de varios pasos de forma autónoma) sugerencias de que las versiones futuras podrían integrarse directamente con el software.

Uno podría imaginar una IA de diseño que no solo sugiere ideas, sino que también navega por el software de diseño o escribe código para implementar esas ideas, todas guiadas por instrucciones humanas de alto nivel. Tales capacidades difuminan la línea entre “Thinker” y “Doer” en el reino de AI, y Gemini 2.5 es un paso en esa dirección, una IA que puede conceptualizar soluciones y ejecutarlas en varios dominios.

Sin embargo, estos avances también plantean preguntas importantes. A medida que AI asume tareas más complejas, ¿cómo nos aseguramos de que comprenda los matices y los límites éticos (por ejemplo, al decidir qué cláusulas de contrato son sensibles o cómo equilibrar los aspectos creativos frente a los aspectos prácticos en el diseño)? Google y otros necesitarán construir barandillas robustas, y los usuarios necesitarán aprender nuevos conjuntos de habilidades, lo que solicita y supervisará la IA, a medida que estas herramientas se convierten en compañeros de trabajo.

No obstante, la trayectoria es clara: modelos como Gemini 2.5 Pro están empujando la IA más profundamente en roles que anteriormente requerían inteligencia humana y creatividad. Las implicaciones para la productividad y la innovación son enormes, y es probable que veamos efectos dominantes en cómo se construyen los productos y cómo se realiza el trabajo en muchas industrias.

Géminis 2.5 y el nuevo campo AI

Con Gemini 2.5 Pro, Google está apostando un reclamo a la vanguardia de la carrera de IA, y enviando un mensaje a sus rivales. Hace solo un par de años, la narración era que la IA de Google (piense en las primeras iteraciones de Bard) estaba rezagada detrás de Chatgpt de OpenAi y los movimientos agresivos de Microsoft. Ahora, al organizar el talento combinado de Google Research y DeepMind, la compañía ha entregado un modelo que puede competir legítimamente por el título del mejor asistente de IA en el planeta.

Esto es un buen augurio para el posicionamiento a largo plazo de Google. Los modelos de IA se consideran cada vez más como plataformas centrales (al igual que los sistemas operativos o los servicios en la nube), y tener un modelo de nivel superior le da a Google una mano fuerte para jugar en todo, desde ofertas de la nube empresarial (Google Cloud/Vertex AI) hasta servicios de consumo como búsqueda, aplicaciones de productividad y Android. A la larga, podemos esperar que la familia Gemini se integre en muchos productos de Google, potencialmente sobrealimentando el Asistente de Google, mejorando las aplicaciones de Google Workspace con características más inteligentes y mejorando la búsqueda con habilidades más conversacionales y conscientes del contexto.

El lanzamiento de Gemini 2.5 Pro también destaca cuán competitivo se ha vuelto el panorama de IA. Operai, antrópico y otros jugadores como Meta y Startups emergentes están iterando rápidamente en sus modelos. Cada salto de una empresa, ya sea una ventana de contexto más amplia, una nueva forma de integrar herramientas o una nueva técnica de seguridad, es respondida rápidamente por otros. El movimiento de Google para incrustar el razonamiento en todos sus modelos es estratégico, asegurando que no se quede atrás en la “inteligencia” de su IA. Mientras tanto, la estrategia de Anthrope de dar a los usuarios más control (como se ve con la profundidad de razonamiento ajustable de Claude 3.7) y los refinamientos continuos de OpenAI a GPT-4.X mantienen la presión sobre.

Para los usuarios finales y los desarrolladores, esta competencia es en gran medida positiva: significa mejores sistemas de IA que llegan más rápido y más opciones en el mercado. Estamos viendo un ecosistema de IA en el que ninguna empresa tiene el monopolio de la innovación, y esa dinámica empuja a cada uno a sobresalir, al igual que los primeros días de la computadora personal o las guerras de teléfonos inteligentes.

En este contexto, la versión de Gemini 2.5 Pro es más que una actualización de productos de Google: es una declaración de intención. Se indica que Google pretende no ser solo un seguidor rápido sino un líder en la nueva era de la IA. La compañía está aprovechando su infraestructura informática masiva (necesaria para entrenar modelos con más de 1 millones de contextos tokens) y vastas recursos de datos para superar los límites que pocos otros pueden. Al mismo tiempo, el enfoque de Google (implementando modelos experimentales para usuarios de confianza, integrando AI en su ecosistema cuidadosamente) muestra un deseo de equilibrar la ambición con la responsabilidad y la practicidad.

Como Koray Kavukcuoglu, CTO de Google Deepmind, lo expresó en el anuncio, el objetivo es hacer que la IA sea más útil y capaz al mejorarlo a un ritmo rápido.

Para los observadores de la industria, Gemini 2.5 Pro es un hito que marca qué tan lejos ha llegado la IA a principios de 2025, y un indicio de hacia dónde va. El bar de “estado del arte” sigue aumentando: hoy es razonamiento y destreza multimodal, mañana podría ser algo así como la resolución de problemas o la autonomía aún más general. El último modelo de Google muestra que la compañía no solo está en la carrera, sino que tiene la intención de dar forma a su resultado. Si Gemini 2.5 tiene algo que ver, la próxima generación de modelos de IA estará aún más integrada en nuestro trabajo y vidas, lo que nos lleva a volver a imaginar cómo usamos la inteligencia de la máquina.

Continue Reading

Noticias

Usé IA para planificar mis comidas durante una semana, esta es mi opinión honesta.

Published

on

Como escritor, siempre he sido reclino de AI. ¿Robará mi trabajo? ¿Terminará tomando el mundo como esos robots en esa película de Will Smith? Dejando de lado mis dramáticas preocupaciones, me encontré increíblemente intrigado cuando recientemente encontré varias publicaciones en X (anteriormente Twitter) por personas que usaban ChatGPT para crear listas de compras y planificar sus comidas durante una semana. Cualquier cosa que haga que esta tarea semanal sea más fácil es algo que pueda respaldar, o al menos probar.

Entonces, como experimento, en lugar de llenar mi carrito de compras con los sospechosos habituales, utilicé ChatGPT para crear un plan de comidas de cinco días y mi lista de compras. Esto es lo que siguió:

El proceso

Para que Chatgpt se encargue de esta tarea para mí, escribí el siguiente comando: “Cree una lista de comestibles y recetas (desayuno, almuerzo, cena y bocadillos) para los lunes a viernes. El presupuesto es de $ 75. No incluya tomates, guisantes u avena. Las recetas deben ser bastante saludables y densas en nutrientes. ¡Gracias!”

Traté de ser lo más específico posible sin hacer demasiado. También quería desafiar a ChatGPT financieramente lanzando un presupuesto modesto. Y me aseguré de mantenerlo lindo y amable con un poco de gratitud al final (me niego a ser Yo, robot‘d). Al recibir mis resultados, había un ingrediente que sabía que quería salir. “Eso es genial, pero no tofu”, escribí al chatbot.

“¡Lo tengo! Ajustaré el plan y eliminaré el tofu, reemplazándolo con otras opciones de proteínas”, respondió ChatGPT, antes de compartir una lista de comestibles y un plan de comidas actualizados.

Y así, tenía una lista completa de comestibles y comidas de lunes a viernes. Aunque ChatGPT hizo todo el trabajo, me sentí productivo de alguna manera. Algo sobre las comidas planeadas para la semana realmente se quita una carga. Tenía esperanzas.

Las comidas

Aquí está el plan de comidas Chatgpt diseñado para mí, a continuación. Para ahorrarle mucha redundancia, he notado algunos, pero no todas, de las instrucciones que Chatgpt me dio en cuanto a la preparación. (La mayoría de estas comidas son bastante fáciles de hacer sin mucha dirección externa).

Lunes

Desayuno: Huevos revueltos con espinacas
Almuerzo
: Ensalada de atún con aceite de oliva, pepinos y zanahorias
Cena: Pollo a la parrilla con batatas asadas y brócoli (Sazone el pollo con sal, pimienta y ajo en polvo, luego sea la parrilla o la sartén; las batatas de cubos y asanlos con aceite de oliva, sal y pimienta a 400 ° F durante 25 minutos; brócoli de vapor).
Bocadillo: Yogurt griego con bayas.

Martes

Desayuno: Yogurt griego con mantequilla de plátano y maní (Corte el plátano y agregue a un tazón de yogurt griego; rocíe con mantequilla de maní para proteínas agregadas).
Almuerzo: Vegetal salteado con pollo y arroz marrón (Corte el pollo y cocine en aceite de oliva hasta que se dore; Agregue verduras congeladas y saltee con salsa de soja; Servir con arroz integral).
Cena: Pechuga de pollo al horno con calabacín asado y batatas
Bocadillo:
Zanahorias con mantequilla de maní

Miércoles

Desayuno: Huevos revueltos con pimiento rojo y espinacas
Almuerzo:
Envoltura de pollo y verduras con pan de trigo integral (Corte el pollo a la parrilla y coloque en una envoltura con espinacas y pepino. Rocíe con aceite de oliva y enrolle.)
Cena:
Salteado de pollo con brócoli y arroz marrón
Bocadillo:
Yogurt griego con llovizna de miel

Jueves

Desayuno: Tostada de mantequilla de plátano y maní
Almuerzo:
Ensalada de atún en tostada de trigo entero (Mezcle el atún enlatado con pepino picado y aceite de oliva; extienda la mezcla sobre pan de trigo integral tostado).
Cena: Pollo horneado con verduras asadas
Bocadillo: Zanahorias con salsa de yogurt griega

Viernes

Desayuno: Veggie Scramble con huevos
Almuerzo:
Tazón de pollo y arroz (Cocine el pollo y córtelo; sirva con arroz integral y brócoli al vapor; rocíe con salsa de soja).
Cena:
Pollo salteado con verduras mixtas y batata
Bocadillo:
Yogurt griego con un puñado de bayas congeladas.

Al revisar las diversas comidas que se proporcionan Chatgpt, desearía que incluya “Hacerlo sabroso” en mi solicitud inicial. Tengo que admitir que mis papilas gustativas estaban bastante aburridas el miércoles. No tengo nada contra el pollo, pero ahora sufro un caso importante de fatiga avícola.

Pinterest

Danielle Harling

Las compras de comestibles

Chatgpt me dio esta lista para hacer mis comidas, junto con su precio para cada artículo:

Desglose del presupuesto:

  • Huevos: $ 2.50
  • Pechuga de pollo (1 lb): $ 6.00
  • TUMA CONDIVADO: $ 1.00
  • Frijoles negros (1 lata): $ 1.00
  • Yogurt griego (32 oz): $ 4.00
  • Espinacas (1 grupo): $ 1.50
  • Brócoli (1 cabeza): $ 2.00
  • Batatas (2): $ 3.00
  • Calabacín (2): $ 1.50
  • Pepino (1): $ 1.00
  • Zanahorias (1 lb): $ 1.50
  • Pimiento rojo (1): $ 1.00
  • Verduras mixtas congeladas: $ 2.00
  • Bananas (2): $ 1.00
  • Manzanas (2): $ 1.50
  • Bayas congeladas: $ 3.00
  • Pan de trigo integral: $ 2.00
  • Arroz marrón: $ 2.00
  • Pasta de trigo integral: $ 1.50
  • Queso cheddar: $ 2.50
  • Leche: $ 1.50
  • Mantequilla de maní: $ 2.00
  • Aceite de oliva, salsa de soja, sal, pimienta, ajo en polvo, cebolla en polvo: ~ $ 6.00

Total: ~ $ 74.50

También incluyó este mensaje agradable en buena medida: “Esto debería estar dentro de su presupuesto mientras mantiene las comidas saludables y equilibradas. ¡Disfruta!”

Primero: el presupuesto. Ya tenía aceite de oliva, salsa de soja y los condimentos disponibles, por lo que no necesitaba comprarlos. Afortunadamente, tenía todos esos ingredientes porque no hay forma de que cuestan solo $ 6 juntos. ¡El aceite de oliva solo es más que eso! (Me pregunté si ChatGPT estaba calculando ese precio según la cantidad que usaría.

Compré más de una sola libra de pollo, no seguro si se trataba de un error de chatgpt, pero dada la cantidad de comidas que llamaban al pollo, me quedé con mi paquete habitual, que está más cerca de una libra y media. Para hacer mis compras, utilicé Instacart, que tiende a ser más caro que ir en persona, pero obtuve dentro de aproximadamente $ 10 de ese presupuesto de $ 75. ¡No está mal, chatgpt!

(Notaré que estaba cocinando para mí, pero con la cantidad de artículos comprados, habría habido mucha comida para uno, tal vez incluso otras dos personas).

Ahora, aquí es donde las cosas se ponen raras. Después de comprar los comestibles, comparé las comidas con la lista de comestibles, y algo importante se destacó. Varios de los artículos enumerados en la lista de compras no se usaron en las comidas. Sé que ChatGPT es plenamente consciente del costo de los comestibles, así que por qué me haría comprar cinco artículos (¡sí, cinco!) Que no necesitaba está más allá de mí. En caso de que se lo pregunte, esos cinco artículos eran una lata de frijoles negros, pasta de trigo integral, queso, manzanas y leche. Sinceramente, todavía estoy rascándome la cabeza sobre este.

plan de comidas chatgptPinterest

Danielle Harling

Dejando a un lado la lista de compras, estaba emocionado de probar algunas recetas nuevas (y saludables). Y me complace decir que encontré algunos favoritos nuevos gracias a este pequeño experimento. Entre mis recetas favoritas estaban el yogur griego con plátanos y mantequilla de maní (también agregué una llovizna de miel) y salteado de verduras con pollo y arroz integral.

Pero, hubo casos en los que se sentía absolutamente como si las comidas fueran planificadas por un robot. Por ejemplo, una envoltura de sándwich hecha “usando pan de trigo integral” me pareció un poco extraño. ¿Cómo “enrollar” una rebanada de pan? Y las bayas frescas habrían sido una mejor compra que las bayas congeladas, dado que las estaba usando como una cobertura de yogurt.

El veredicto

El fiasco de la lista de comestibles me apagó, pero avanzé. Y tal vez debería haber presionado ese carrito de comestibles virtual muy, muy lejos porque, en última instancia, esta es una técnica sin la que puedo prescindir. Además de un puñado de favoritos, las comidas sugeridas eran decepcionantes. La conveniencia de todo simplemente no valió la pena para mí. Estoy seguro de que obtendría mejores resultados con un presupuesto más grande y solicitudes más específicas, pero prefiero trabajar con una persona humana real en un plan de comidas que se adapte a mí individualmente.

¡Ahora, por favor envíeme todas sus recetas favoritas de pollo y sin atún!

Marca de letras

Danielle Harling es una escritora independiente con sede en Atlanta con un amor por los espacios diseñados con colores, cócteles artesanales y compras en línea (generalmente para tacones de diseñador que rompen el presupuesto). Su trabajo anterior ha aparecido en Fodor’s, Forbes, Mydomaine, Architectural Digest y más.

Continue Reading

Trending