Noticias
Google presenta Gemini 2.5 Pro con razonamiento de cadena de pensamiento incorporado

Google LLC dijo hoy que está actualizando su Familia de Modelo de Inteligencia Artificial de Géminis insignia al presentar una versión experimental de Gemini 2.5 Pro.
La compañía agregó que es la “más inteligente” hasta ahora e incluirá capacidades de “pensamiento” incorporadas. Todos los próximos modelos Gemini 2.5 serán modelos, capaces de desglosar tareas en múltiples pasos y razonar a través de ellos antes de responder. La compañía dijo que esto dará como resultado un mejor rendimiento y una mayor precisión.
“En el campo de la IA, la capacidad de un” razonamiento “de un sistema se refiere a algo más que clasificación y predicción”, explicó Koray Kavukcuoglu, director de tecnología de Google Deepmind, el brazo de investigación de la compañía, explicó en el anuncio. “Se refiere a su capacidad para analizar información, sacar conclusiones lógicas, incorporar contexto y matices, y tomar decisiones informadas”.
Google introdujo por primera vez esta capacidad de pensamiento en su modelo de IA Experimental Gemini 2.0 Flash Thinking, que se lanzó en diciembre. Para crear el modelo, la compañía exploró las prácticas de construcción de IA, que incluyen el aprendizaje de refuerzo y la solicitud de la cadena de pensamiento.
En el caso de Gemini 2.0 Flash Thinking, los usuarios pueden activar la capacidad de pensamiento haciendo clic en un botón al solicitar el modelo y luego “pensaría” a través de las tareas. También muestra su razonamiento, lo que permite al usuario ver el proceso y la cadena de pensamiento que llevó llegar a su conclusión.
Google ya no agrega la etiqueta de “pensar” a sus modelos.
La compañía dijo que con la nueva capacidad de razonamiento, Gemini 2.5 Pro Experimental ha logrado un nuevo nivel de rendimiento por encima del modelo base debido al post-entrenamiento. Es el modelo más avanzado para tareas complejas y superó la tabla de clasificación de Lmarena, que mide las preferencias humanas, por un margen significativo.
También lideró con un 18.8% en el último examen de la humanidad, un conjunto de datos diseñado por cientos de expertos en la materia sobre el conocimiento y el razonamiento humano, en comparación con el 14% para el O3-Mini de OpenAI y el 8.6% de Deepseek R1. Para el contexto, O3-Mini y R1 son modelos pensantes capaces de razonamiento complejo de la misma manera que Google ha diseñado Gemini 2.5 Pro Experimental.
“Nos hemos centrado en el rendimiento de la codificación, y con Gemini 2.5 hemos logrado un gran salto sobre 2.0, con más mejoras por venir”, dijo Kavukcuoglu.
https://www.youtube.com/watch?v=rlcbspgos6s
Para demostrar las nuevas capacidades del modelo, los investigadores de Google lo llevaron a generar un videojuego de dinosaurio de estilo sin fin utilizando HTML, CSS y JavaScript utilizando un solo mensaje y lo hizo con éxito en un solo pase.
El modelo experimental de Gemini 2.5 Pro viene con una ventana de contexto de 1 millón de tokens, lo que le permite ingerir documentos, audio y videos extremadamente grandes, que son alrededor de 1,5 millones de palabras. Google dijo que tiene la intención de expandir la ventana a 2 millones.
Con su gran ventana de contexto y su alto rendimiento, Gemini 2.5 Pro proporciona una base poderosa para los agentes de IA. Esto les permite procesar vastas conjuntos de datos y abordar problemas complejos de manera más efectiva. Debido a que los agentes de IA operan y planean de forma autónoma, la capacidad de razonamiento mejorada del modelo mejorará significativamente su capacidad para comprender los datos y utilizar herramientas para completar las tareas.
Los desarrolladores y los usuarios empresariales pueden comenzar a experimentar con Gemini 2.5 Pro en Google AI Studio ahora, y los usuarios avanzados de Gemini pueden seleccionarlo inmediatamente desde el descenso en el escritorio y el móvil. Los usuarios de Vertex AI, la plataforma de aprendizaje automático administrado de Google para construir e implementar IA, podrán experimentar con el nuevo modelo en las próximas semanas.
TXGEMMA: modelos de IA abiertos para mejorar el desarrollo terapéutico
Además del experimental Gemini 2.5 Pro, Google también anunció TXGEMMA, una colección de modelos de IA abiertos diseñados para mejorar la eficiencia del desarrollo de fármacos y terapia utilizando modelos de idiomas grandes.
Los nuevos modelos se basan en Gemma, los modelos livianos de código abierto existentes de Google Deepmind, específicamente entrenados para comprender y predecir las propiedades de los medicamentos y las terapias génicas a lo largo de todo el proceso de descubrimiento. Esto incluye identificar entradas prometedoras y predecir resultados de ensayos clínicos.
Google entrenó a la familia de modelos de TXGEMMA de Gemma 2 utilizando 7 millones de ejemplos de entrenamiento. Los modelos vienen en tres tamaños, incluidos 2 mil millones, 9 mil millones y 27 mil millones de parámetros.
Cada tamaño incluye una versión de “predicción”, adaptada para tareas estrechas extraídas de los comunes de datos terapéuticos. Los ejemplos de estas tareas específicas incluyen clasificar los medicamentos para la capacidad, como el cruce de la barrera hematoencefálica, la regresión para predecir la capacidad de unión de un fármaco o generar otros tipos de fármacos basados en una reacción particular.
TXGEMMA 9B y 27B también incluyen versiones de “CHAT”. Estos modelos explican su razonamiento, responden preguntas y entablan una conversación. Como resultado, los investigadores podrían preguntarle a Txgemma-Chat por qué predijo que una molécula particular podría ser tóxica y profundizar en la estructura de la molécula.
Al igual que cualquier otro modelo que Google construya, TXGEMMA está diseñado para la integración en sistemas de IA agente avanzados e incluye el uso de herramientas para abordar problemas de investigación más complejos.
“Los modelos de lenguaje estándar a menudo luchan con tareas que requieren conocimiento externo actualizado o razonamiento de varios pasos”, Shekofeh Azizi, científico de investigación del personal de Google. “Para abordar esto, hemos desarrollado Agentic-TX, un sistema de agente centrado en la terapéutica impulsado por Gemini 2.0 Pro”.
Agentic-TX está equipado con 18 herramientas que incluyen TXGEMMA para razonamiento de varios pasos; Herramientas de búsqueda generales de PubMed, Wikipedia y la Web; herramientas moleculares específicas; y herramientas de genes y proteínas. Esta herramienta de agente de IA puede usarse para orquestar el trabajo de diseño de investigación terapéutica y responder preguntas de investigación de varios pasos para científicos y médicos.
TXGEMMA está disponible hoy en Vertex AI Model Garden y abrazando la cara.
Imagen: Google
Su voto de apoyo es importante para nosotros y nos ayuda a mantener el contenido libre.
Un clic a continuación admite nuestra misión de proporcionar contenido gratuito, profundo y relevante.
Únete a nuestra comunidad en YouTube
Únase a la comunidad que incluye a más de 15,000 expertos en #Cubealumni, incluido el CEO de Amazon.com, Andy Jassy, el fundador y CEO de Dell Technologies, Michael Dell, el CEO de Intel, Pat Gelsinger y muchos más luminarios y expertos.
GRACIAS