Noticias
Creé una presentación completa usando Gemini en Google Diaides, así es como fue
Published
3 días agoon

Google Slides es una herramienta poderosa, pero crear una presentación completa puede llevar mucho tiempo. Recientemente, Google introdujo la integración de Gemini en diapositivas y todas las aplicaciones del espacio de trabajo. Ahora, solo necesita indicaciones de texto para crear presentaciones atractivas e imágenes de alta calidad para sus diapositivas. Tuve que verlo yo mismo, y decidí experimentar con Géminis y lo encargué con la construcción de una presentación completa.
En esta publicación, comparto mi viaje y revelo cómo Gemini manejó el desafío y si ofrece la promesa de presentaciones sin esfuerzo.
Relacionado
Google Gemini: Todo lo que necesita saber sobre la IA multimodal de próxima generación de Google
Google Gemini está aquí, con un enfoque completamente nuevo para la IA multimodal
Acceso a Géminis en las diapositivas de Google: requisitos

Antes de encender las hojas de Google en la web, repasemos los requisitos. Si bien varios modelos Gemini son gratuitos de descargar y usar, pagará más para desbloquear el asistente de IA en las aplicaciones de productividad de Google.
Debe comprar el plan avanzado de Gemini a $ 20 por mes. Después de eso, la opción Géminis aparece en Docs, Hojas, Gmail, Google Drive y Slides. Google también ofrece un mes de prueba gratuita para usuarios elegibles.
Dado que Google Slides es una solución web, puede explorar la integración de Gemini en escritorios de Windows, Mac y Chromebooks.
Explorando Géminis en las diapositivas de Google
Genere diapositivas utilizando un mensaje de texto
Después de habilitar Gemini en Google Slides, es hora de verificarlo en acción. En el siguiente ejemplo, crearé una presentación sobre los beneficios de un estilo de vida saludable. Mi objetivo es cubrir los beneficios de la nutrición, el ejercicio regular, el bienestar mental y el manejo del estrés. Siga los pasos a continuación.
-
Inicie las diapositivas de Google en la web e inicie sesión con los detalles de su cuenta de Google. Comience con una presentación en blanco.
-
Abra Géminis desde la esquina superior derecha y escriba un aviso.
Escribir un aviso es una parte crucial de su proceso de presentación. Dado que es un tema amplio y adaptable, sea lo más descriptivo posible. En nuestro caso, escribiré un aviso a continuación para mi diapositiva de introducción.
Genere una diapositiva con el título “Los beneficios de un estilo de vida saludable”. Agregue una definición breve de un estilo de vida saludable, enfatizando el equilibrio del bienestar físico, mental y nutricional.
Esto es lo que se le ocurrió a Géminis. Puede volver a intentarlo si no está satisfecho con los resultados y haga clic en Insertar para agregarlo.

Ahora, haga clic + + Para agregar una nueva diapositiva y continuar escribiendo indicaciones para generar nuevas diapositivas para su presentación.
Cree una diapositiva titulada “Nutrición: alimentar su cuerpo”. Agregue información sobre la importancia de las frutas y verduras.

A diferencia de Copilot en PowerPoint, no puede crear múltiples diapositivas a la vez. Debes describir cada diapositiva por separado. Por lo tanto, asegúrese de planificar el esquema de su presentación.
Después de eso, creé cuatro diapositivas nuevas utilizando las indicaciones de texto a continuación.
Cree una diapositiva titulada, “Ejercicio: moverse para un usted más saludable”. Agregue información sobre la cantidad recomendada de ejercicio por semana.

Crea una diapositiva titulada, “Bienestar mental: encontrar tu paz interior”. Agregue puntos de bala en buenos hábitos de sueño.

Genere una diapositiva que enumere los beneficios de un estilo de vida saludable, que incluye un aumento de la energía, un mejor estado de ánimo y un mejor sueño.

Cree una diapositiva de conclusión con pasos prácticos para adoptar un estilo de vida más saludable. Incluir puntos de bala orientados a la acción.

Hubo algunos casos en los que no estaba satisfecho con los resultados. Entonces, le pedí a Gemini que recreara esas diapositivas. Además, no te sorprenderá con diseños de diapositivas llamativas y animaciones. Debe agregarlos manualmente y completar su presentación.
En cualquier momento, puede escribir @Nombre del archivo Y solicite a Gemini que se refiera a un documento de su cuenta de Google Drive. Por ejemplo, si escribió una dieta vegetariana en un documento, puede pedirle a Gemini que se refiera a ella para sus diapositivas de presentación.
Estás usando diapositivas generadas por AI. La precisión puede recibir un éxito cuando se trata de temas complejos como IA, fotografía computacional, aprendizaje automático y más. Compruebe dos veces antes de compartir la presentación con otros.

Relacionado
Google Gemini: 5 maneras de usar el asistente a día a día de Google con IA
Puede hacer que muchas tareas cotidianas sean mucho más fáciles
Crear e insertar imágenes con Gemini
No tenía idea de que Géminis podía crear imágenes basadas en indicaciones de texto. Es un gran ahorro de tiempo, ya que no necesita buscar imágenes en la web para obtener imágenes adecuadas para su presentación. Generé un par de imágenes relevantes utilizando las indicaciones de texto a continuación.
Una imagen de una placa equilibrada con proteína magra, granos integrales y verduras.

Una fotografía de primer plano de un vaso de agua con rebanadas de limón y pepino.

Gemini le ofrece cuatro opciones de imagen para sus diapositivas. Puede verlos e insertarlos en sus diapositivas.
Géminis hizo mis diapositivas
Géminis en Google Slides abrió mis ojos al potencial de la IA en la creación de presentación. Si bien no es un reemplazo perfecto para la creatividad humana y el pensamiento estratégico, es una herramienta poderosa para racionalizar el proceso, especialmente para elaborar borradores iniciales y imágenes llamativas.
Aún así, la supervisión humana es crucial, pero si tiene plazos ajustados o desea explorar nuevas formas de crear diapositivas atractivas, pruebe a Gemini. Gemini Advanced desbloquea el asistente de IA de Google en otras aplicaciones de productividad como Google Sheets. Así es como puedes aumentar tus hojas de cálculo con Gemini.
You may like
Noticias
Usé IA para planificar mis comidas durante una semana, esta es mi opinión honesta.
Published
1 hora agoon
26 marzo, 2025
Como escritor, siempre he sido reclino de AI. ¿Robará mi trabajo? ¿Terminará tomando el mundo como esos robots en esa película de Will Smith? Dejando de lado mis dramáticas preocupaciones, me encontré increíblemente intrigado cuando recientemente encontré varias publicaciones en X (anteriormente Twitter) por personas que usaban ChatGPT para crear listas de compras y planificar sus comidas durante una semana. Cualquier cosa que haga que esta tarea semanal sea más fácil es algo que pueda respaldar, o al menos probar.
Entonces, como experimento, en lugar de llenar mi carrito de compras con los sospechosos habituales, utilicé ChatGPT para crear un plan de comidas de cinco días y mi lista de compras. Esto es lo que siguió:
El proceso
Para que Chatgpt se encargue de esta tarea para mí, escribí el siguiente comando: “Cree una lista de comestibles y recetas (desayuno, almuerzo, cena y bocadillos) para los lunes a viernes. El presupuesto es de $ 75. No incluya tomates, guisantes u avena. Las recetas deben ser bastante saludables y densas en nutrientes. ¡Gracias!”
Traté de ser lo más específico posible sin hacer demasiado. También quería desafiar a ChatGPT financieramente lanzando un presupuesto modesto. Y me aseguré de mantenerlo lindo y amable con un poco de gratitud al final (me niego a ser Yo, robot‘d). Al recibir mis resultados, había un ingrediente que sabía que quería salir. “Eso es genial, pero no tofu”, escribí al chatbot.
“¡Lo tengo! Ajustaré el plan y eliminaré el tofu, reemplazándolo con otras opciones de proteínas”, respondió ChatGPT, antes de compartir una lista de comestibles y un plan de comidas actualizados.
Y así, tenía una lista completa de comestibles y comidas de lunes a viernes. Aunque ChatGPT hizo todo el trabajo, me sentí productivo de alguna manera. Algo sobre las comidas planeadas para la semana realmente se quita una carga. Tenía esperanzas.
Las comidas
Aquí está el plan de comidas Chatgpt diseñado para mí, a continuación. Para ahorrarle mucha redundancia, he notado algunos, pero no todas, de las instrucciones que Chatgpt me dio en cuanto a la preparación. (La mayoría de estas comidas son bastante fáciles de hacer sin mucha dirección externa).
Lunes
Desayuno: Huevos revueltos con espinacas
Almuerzo: Ensalada de atún con aceite de oliva, pepinos y zanahorias
Cena: Pollo a la parrilla con batatas asadas y brócoli (Sazone el pollo con sal, pimienta y ajo en polvo, luego sea la parrilla o la sartén; las batatas de cubos y asanlos con aceite de oliva, sal y pimienta a 400 ° F durante 25 minutos; brócoli de vapor).
Bocadillo: Yogurt griego con bayas.
Martes
Desayuno: Yogurt griego con mantequilla de plátano y maní (Corte el plátano y agregue a un tazón de yogurt griego; rocíe con mantequilla de maní para proteínas agregadas).
Almuerzo: Vegetal salteado con pollo y arroz marrón (Corte el pollo y cocine en aceite de oliva hasta que se dore; Agregue verduras congeladas y saltee con salsa de soja; Servir con arroz integral).
Cena: Pechuga de pollo al horno con calabacín asado y batatas
Bocadillo: Zanahorias con mantequilla de maní
Miércoles
Desayuno: Huevos revueltos con pimiento rojo y espinacas
Almuerzo: Envoltura de pollo y verduras con pan de trigo integral (Corte el pollo a la parrilla y coloque en una envoltura con espinacas y pepino. Rocíe con aceite de oliva y enrolle.)
Cena: Salteado de pollo con brócoli y arroz marrón
Bocadillo: Yogurt griego con llovizna de miel
Jueves
Desayuno: Tostada de mantequilla de plátano y maní
Almuerzo: Ensalada de atún en tostada de trigo entero (Mezcle el atún enlatado con pepino picado y aceite de oliva; extienda la mezcla sobre pan de trigo integral tostado).
Cena: Pollo horneado con verduras asadas
Bocadillo: Zanahorias con salsa de yogurt griega
Viernes
Desayuno: Veggie Scramble con huevos
Almuerzo: Tazón de pollo y arroz (Cocine el pollo y córtelo; sirva con arroz integral y brócoli al vapor; rocíe con salsa de soja).
Cena: Pollo salteado con verduras mixtas y batata
Bocadillo: Yogurt griego con un puñado de bayas congeladas.
Al revisar las diversas comidas que se proporcionan Chatgpt, desearía que incluya “Hacerlo sabroso” en mi solicitud inicial. Tengo que admitir que mis papilas gustativas estaban bastante aburridas el miércoles. No tengo nada contra el pollo, pero ahora sufro un caso importante de fatiga avícola.
Las compras de comestibles
Chatgpt me dio esta lista para hacer mis comidas, junto con su precio para cada artículo:
Desglose del presupuesto:
- Huevos: $ 2.50
- Pechuga de pollo (1 lb): $ 6.00
- TUMA CONDIVADO: $ 1.00
- Frijoles negros (1 lata): $ 1.00
- Yogurt griego (32 oz): $ 4.00
- Espinacas (1 grupo): $ 1.50
- Brócoli (1 cabeza): $ 2.00
- Batatas (2): $ 3.00
- Calabacín (2): $ 1.50
- Pepino (1): $ 1.00
- Zanahorias (1 lb): $ 1.50
- Pimiento rojo (1): $ 1.00
- Verduras mixtas congeladas: $ 2.00
- Bananas (2): $ 1.00
- Manzanas (2): $ 1.50
- Bayas congeladas: $ 3.00
- Pan de trigo integral: $ 2.00
- Arroz marrón: $ 2.00
- Pasta de trigo integral: $ 1.50
- Queso cheddar: $ 2.50
- Leche: $ 1.50
- Mantequilla de maní: $ 2.00
- Aceite de oliva, salsa de soja, sal, pimienta, ajo en polvo, cebolla en polvo: ~ $ 6.00
Total: ~ $ 74.50
También incluyó este mensaje agradable en buena medida: “Esto debería estar dentro de su presupuesto mientras mantiene las comidas saludables y equilibradas. ¡Disfruta!”
Primero: el presupuesto. Ya tenía aceite de oliva, salsa de soja y los condimentos disponibles, por lo que no necesitaba comprarlos. Afortunadamente, tenía todos esos ingredientes porque no hay forma de que cuestan solo $ 6 juntos. ¡El aceite de oliva solo es más que eso! (Me pregunté si ChatGPT estaba calculando ese precio según la cantidad que usaría.
Compré más de una sola libra de pollo, no seguro si se trataba de un error de chatgpt, pero dada la cantidad de comidas que llamaban al pollo, me quedé con mi paquete habitual, que está más cerca de una libra y media. Para hacer mis compras, utilicé Instacart, que tiende a ser más caro que ir en persona, pero obtuve dentro de aproximadamente $ 10 de ese presupuesto de $ 75. ¡No está mal, chatgpt!
(Notaré que estaba cocinando para mí, pero con la cantidad de artículos comprados, habría habido mucha comida para uno, tal vez incluso otras dos personas).
Ahora, aquí es donde las cosas se ponen raras. Después de comprar los comestibles, comparé las comidas con la lista de comestibles, y algo importante se destacó. Varios de los artículos enumerados en la lista de compras no se usaron en las comidas. Sé que ChatGPT es plenamente consciente del costo de los comestibles, así que por qué me haría comprar cinco artículos (¡sí, cinco!) Que no necesitaba está más allá de mí. En caso de que se lo pregunte, esos cinco artículos eran una lata de frijoles negros, pasta de trigo integral, queso, manzanas y leche. Sinceramente, todavía estoy rascándome la cabeza sobre este.

Dejando a un lado la lista de compras, estaba emocionado de probar algunas recetas nuevas (y saludables). Y me complace decir que encontré algunos favoritos nuevos gracias a este pequeño experimento. Entre mis recetas favoritas estaban el yogur griego con plátanos y mantequilla de maní (también agregué una llovizna de miel) y salteado de verduras con pollo y arroz integral.
Pero, hubo casos en los que se sentía absolutamente como si las comidas fueran planificadas por un robot. Por ejemplo, una envoltura de sándwich hecha “usando pan de trigo integral” me pareció un poco extraño. ¿Cómo “enrollar” una rebanada de pan? Y las bayas frescas habrían sido una mejor compra que las bayas congeladas, dado que las estaba usando como una cobertura de yogurt.
El veredicto
El fiasco de la lista de comestibles me apagó, pero avanzé. Y tal vez debería haber presionado ese carrito de comestibles virtual muy, muy lejos porque, en última instancia, esta es una técnica sin la que puedo prescindir. Además de un puñado de favoritos, las comidas sugeridas eran decepcionantes. La conveniencia de todo simplemente no valió la pena para mí. Estoy seguro de que obtendría mejores resultados con un presupuesto más grande y solicitudes más específicas, pero prefiero trabajar con una persona humana real en un plan de comidas que se adapte a mí individualmente.
¡Ahora, por favor envíeme todas sus recetas favoritas de pollo y sin atún!
Danielle Harling es una escritora independiente con sede en Atlanta con un amor por los espacios diseñados con colores, cócteles artesanales y compras en línea (generalmente para tacones de diseñador que rompen el presupuesto). Su trabajo anterior ha aparecido en Fodor’s, Forbes, Mydomaine, Architectural Digest y más.
Noticias
ChatGPT acaba de obtener una gran actualización de generación de imágenes
Published
10 horas agoon
26 marzo, 2025
Sí, esto es AI.
Crédito: OpenAI
Operai ha aumentado significativamente las capacidades de generación de imágenes de ChatGPT, agregando la actualización como parte del modelo GPT-4O introducido en mayo pasado. El nuevo y mejorado generador de IA se está implementando ahora para todos los usuarios de ChatGPT, en todos los planes pagos y el nivel gratuito (aunque los usuarios gratuitos están más restringidos en cuánto pueden usarlo).
Ha sido posible generar imágenes a través de la interfaz CHATGPT durante un tiempo, aunque detrás de escena el trabajo fue cultivado en el modelo de imagen Dall-E 3. Ahora, todo será manejado por GPT-4O, para una experiencia más consistente y nativa.
Aquí hay muchas mejoras, que cubren algunas de las áreas con las que las herramientas de creador de imágenes de IA generalmente han luchado: representar texto, mantener a los personajes consistentes en las imágenes y los diagramas de dibujo. Operai dice que ahora puede esperar “más preciso, preciso, [and] Resultados fotorrealistas “de sus indicaciones.
Imágenes más realistas y precisas
Las imágenes generadas no son perfectas cada vez, pero se están acercando mucho.
Crédito: Lifehacker a través de chatgpt
Las imágenes hechas con IA a menudo vienen con un brillo artificial que te dice que han sido soñados por algoritmos, y eso debería ser menos obvio con las imágenes GPT-4O. Una de las imágenes de demostración mostradas por OpenAi tiene una mujer escribiendo en una pizarra, con una vista reflejada en ella, todo bien como por vida, aunque tenga en cuenta el pequeño subtítulo en la parte inferior que le dice que este fue el mejor de los ocho intentos que Chatgpt tenía en el aviso.
Los usuarios de arte de IA crean también deberían mantenerse más estrechamente a las indicaciones dadas, dice Openai. Entonces, si desea objetos específicos en lugares específicos, o necesita personas en ciertas posiciones, entonces estas instrucciones aparentemente se llevarán a cabo de manera más fiel. Una de las imágenes de ejemplo más impresionantes muestra una tira cómica de cuatro paneles representada por ChatGPT, sin errores o inconsistencias obvias.
Traté de hacer que Chatgpt convirtiera una novela de Austen en una tira cómica y produzca una imagen fotorrealista de una casa majestuosa con un jardín, y los resultados fueron impresionantes, si no es perfecto. Ciertamente son significativamente mejores de lo que el chatgpt de imágenes estaba produciendo anteriormente, aunque la representación lleva más tiempo completarse (generalmente minutos en lugar de segundos).
El texto y los diagramas se mejoran enormemente

El texto ya no es un problema importante, por lo que se pueden hacer portadas de libros falsos con facilidad.
Crédito: Lifehacker a través de chatgpt
Tratar de lograr que la IA represente el texto y los diagramas con precisión ha sido un desafío durante mucho tiempo: la forma en que se construyen estas herramientas significa que son mucho mejores para inventar y remezclar las imágenes en las que han sido entrenadas, en lugar de reproducir una copia exacta del alfabeto o una serie de rectángulos y flechas.
El nuevo modelo GPT-4O puede hacer que el texto y los diagramas a un alto nivel de detalle y precisión, por lo que no debe ver tantos errores e inconsistencias extrañas. El showreel de OpenAI incluyó un menú, una invitación, un pase de embarque y un diagrama que explica el experimento de prisma de Newton, todo generado a partir de un solo mensaje de texto.
Cuando le pedí a ChatGPT que produjera una infografía que explicara el ADN en términos simples, y una portada del libro con un título y autor especificados, siguió el resumen exactamente: el gráfico era básico pero preciso (según el mensaje), y la portada del libro parecía algo que podría ver en una tienda. Igual de importante, no había artefactos extraños o inconsistencias en las imágenes.
Consistencia y edición

Profesor, ¿eres tú? La consistencia de carácter e imagen todavía necesita algo de trabajo.
Crédito: Lifehacker a través de chatgpt
He escrito antes sobre las limitaciones de la edición de imágenes de ChatGPT, y esta es otra área que se ha actualizado. Ahora es más fácil mantener a los personajes y escenas consistentes entre las imágenes, solo ajustar partes de una imagen y dejar el resto intacta, y construir diferentes capas de una imagen. Incluso puede crear fondos transparentes, si es necesario, o especificar colores utilizando códigos hexadecimales.
¿Qué piensas hasta ahora?
Otras mejoras entran en la forma en que ChatGPT puede aceptar y remezcar sus propias imágenes, e incorporar otra información (de la web y sus datos de capacitación): por lo tanto, una de las imágenes de demostración Operai se construyó a partir de la pronta. “Haga una infografía visual que describa por qué SF está tan nebulosa” y ChatGPT hizo exactamente eso (bueno, mejor tres).
En mis propias pruebas, encontré chatgpt mucho mejor en la edición de imágenes y bastante competente en la remezcla de imágenes en diferentes estilos. Todavía lucha hasta cierto punto manteniendo la consistencia entre las imágenes, especialmente con objetos y caracteres complejos. Definitivamente es mejor de lo que fue en esto, pero todavía hay una tendencia a exagerar las ediciones, haciendo que la IA sea menos útil para ajustar imágenes o hacer una serie de varias imágenes que necesitan coincidir.
Problemas de derechos de autor y seguridad

Los diagramas ahora son mucho menos sin sentido y más precisos.
Crédito: OpenAI
Al igual que con cualquier anuncio generativo de IA, los problemas sobre los derechos de autor, el mal uso y las demandas de energía se me recuerdan una vez más. Operai está registrado diciendo que es imposible construir estas herramientas sin capacitar en imágenes con derechos de autor, aunque recientemente ha comenzado a firmar ofertas de contenido con proveedores como Shutterstock. Brad Lightcap, director de operaciones de OpenAi, le dijo al Wall Street Journal que el generador de imágenes GPT-4O rechazará las solicitudes para imitar el trabajo de cualquier artista vivo.
Cuando se trata de seguridad, Operai dice que las imágenes generadas vienen con metadatos C2PA para identificarlas como generadas por IA, aunque estos metadatos se pueden eliminar fácilmente con algo tan simple como una captura de pantalla. El generador de IA también está construido para rechazar cualquier intento de crear “materiales de abuso sexual infantil y defectos sexuales”, dice OpenAi, así como otras indicaciones que violan sus políticas de contenido.
Este es claramente un gran paso adelante para las imágenes de IA: la tecnología actualizada es realmente asombrosa a veces, y muchos de los signos reveladores de IA y los errores cometidos por la tecnología están desapareciendo. Sin embargo, plantea algunas preguntas importantes sobre el futuro, todos corremos, uno en el que las falsificaciones se realizan tan fácilmente, donde los robots realizan el trabajo creativo en lugar de las personas, y donde perdemos colectivamente nuestra capacidad de dibujar una imagen, crear una oración o escribir una línea de código. Y luego, ¿cómo encontrará la IA generativa más datos de entrenamiento?
Noticias
Google presenta Gemini 2.5 Pro con razonamiento de cadena de pensamiento incorporado
Published
1 día agoon
25 marzo, 2025
Google LLC dijo hoy que está actualizando su Familia de Modelo de Inteligencia Artificial de Géminis insignia al presentar una versión experimental de Gemini 2.5 Pro.
La compañía agregó que es la “más inteligente” hasta ahora e incluirá capacidades de “pensamiento” incorporadas. Todos los próximos modelos Gemini 2.5 serán modelos, capaces de desglosar tareas en múltiples pasos y razonar a través de ellos antes de responder. La compañía dijo que esto dará como resultado un mejor rendimiento y una mayor precisión.
“En el campo de la IA, la capacidad de un” razonamiento “de un sistema se refiere a algo más que clasificación y predicción”, explicó Koray Kavukcuoglu, director de tecnología de Google Deepmind, el brazo de investigación de la compañía, explicó en el anuncio. “Se refiere a su capacidad para analizar información, sacar conclusiones lógicas, incorporar contexto y matices, y tomar decisiones informadas”.
Google introdujo por primera vez esta capacidad de pensamiento en su modelo de IA Experimental Gemini 2.0 Flash Thinking, que se lanzó en diciembre. Para crear el modelo, la compañía exploró las prácticas de construcción de IA, que incluyen el aprendizaje de refuerzo y la solicitud de la cadena de pensamiento.
En el caso de Gemini 2.0 Flash Thinking, los usuarios pueden activar la capacidad de pensamiento haciendo clic en un botón al solicitar el modelo y luego “pensaría” a través de las tareas. También muestra su razonamiento, lo que permite al usuario ver el proceso y la cadena de pensamiento que llevó llegar a su conclusión.
Google ya no agrega la etiqueta de “pensar” a sus modelos.
La compañía dijo que con la nueva capacidad de razonamiento, Gemini 2.5 Pro Experimental ha logrado un nuevo nivel de rendimiento por encima del modelo base debido al post-entrenamiento. Es el modelo más avanzado para tareas complejas y superó la tabla de clasificación de Lmarena, que mide las preferencias humanas, por un margen significativo.
También lideró con un 18.8% en el último examen de la humanidad, un conjunto de datos diseñado por cientos de expertos en la materia sobre el conocimiento y el razonamiento humano, en comparación con el 14% para el O3-Mini de OpenAI y el 8.6% de Deepseek R1. Para el contexto, O3-Mini y R1 son modelos pensantes capaces de razonamiento complejo de la misma manera que Google ha diseñado Gemini 2.5 Pro Experimental.
“Nos hemos centrado en el rendimiento de la codificación, y con Gemini 2.5 hemos logrado un gran salto sobre 2.0, con más mejoras por venir”, dijo Kavukcuoglu.
https://www.youtube.com/watch?v=rlcbspgos6s
Para demostrar las nuevas capacidades del modelo, los investigadores de Google lo llevaron a generar un videojuego de dinosaurio de estilo sin fin utilizando HTML, CSS y JavaScript utilizando un solo mensaje y lo hizo con éxito en un solo pase.
El modelo experimental de Gemini 2.5 Pro viene con una ventana de contexto de 1 millón de tokens, lo que le permite ingerir documentos, audio y videos extremadamente grandes, que son alrededor de 1,5 millones de palabras. Google dijo que tiene la intención de expandir la ventana a 2 millones.
Con su gran ventana de contexto y su alto rendimiento, Gemini 2.5 Pro proporciona una base poderosa para los agentes de IA. Esto les permite procesar vastas conjuntos de datos y abordar problemas complejos de manera más efectiva. Debido a que los agentes de IA operan y planean de forma autónoma, la capacidad de razonamiento mejorada del modelo mejorará significativamente su capacidad para comprender los datos y utilizar herramientas para completar las tareas.
Los desarrolladores y los usuarios empresariales pueden comenzar a experimentar con Gemini 2.5 Pro en Google AI Studio ahora, y los usuarios avanzados de Gemini pueden seleccionarlo inmediatamente desde el descenso en el escritorio y el móvil. Los usuarios de Vertex AI, la plataforma de aprendizaje automático administrado de Google para construir e implementar IA, podrán experimentar con el nuevo modelo en las próximas semanas.
TXGEMMA: modelos de IA abiertos para mejorar el desarrollo terapéutico
Además del experimental Gemini 2.5 Pro, Google también anunció TXGEMMA, una colección de modelos de IA abiertos diseñados para mejorar la eficiencia del desarrollo de fármacos y terapia utilizando modelos de idiomas grandes.
Los nuevos modelos se basan en Gemma, los modelos livianos de código abierto existentes de Google Deepmind, específicamente entrenados para comprender y predecir las propiedades de los medicamentos y las terapias génicas a lo largo de todo el proceso de descubrimiento. Esto incluye identificar entradas prometedoras y predecir resultados de ensayos clínicos.
Google entrenó a la familia de modelos de TXGEMMA de Gemma 2 utilizando 7 millones de ejemplos de entrenamiento. Los modelos vienen en tres tamaños, incluidos 2 mil millones, 9 mil millones y 27 mil millones de parámetros.
Cada tamaño incluye una versión de “predicción”, adaptada para tareas estrechas extraídas de los comunes de datos terapéuticos. Los ejemplos de estas tareas específicas incluyen clasificar los medicamentos para la capacidad, como el cruce de la barrera hematoencefálica, la regresión para predecir la capacidad de unión de un fármaco o generar otros tipos de fármacos basados en una reacción particular.
TXGEMMA 9B y 27B también incluyen versiones de “CHAT”. Estos modelos explican su razonamiento, responden preguntas y entablan una conversación. Como resultado, los investigadores podrían preguntarle a Txgemma-Chat por qué predijo que una molécula particular podría ser tóxica y profundizar en la estructura de la molécula.
Al igual que cualquier otro modelo que Google construya, TXGEMMA está diseñado para la integración en sistemas de IA agente avanzados e incluye el uso de herramientas para abordar problemas de investigación más complejos.
“Los modelos de lenguaje estándar a menudo luchan con tareas que requieren conocimiento externo actualizado o razonamiento de varios pasos”, Shekofeh Azizi, científico de investigación del personal de Google. “Para abordar esto, hemos desarrollado Agentic-TX, un sistema de agente centrado en la terapéutica impulsado por Gemini 2.0 Pro”.
Agentic-TX está equipado con 18 herramientas que incluyen TXGEMMA para razonamiento de varios pasos; Herramientas de búsqueda generales de PubMed, Wikipedia y la Web; herramientas moleculares específicas; y herramientas de genes y proteínas. Esta herramienta de agente de IA puede usarse para orquestar el trabajo de diseño de investigación terapéutica y responder preguntas de investigación de varios pasos para científicos y médicos.
TXGEMMA está disponible hoy en Vertex AI Model Garden y abrazando la cara.
Imagen: Google
Su voto de apoyo es importante para nosotros y nos ayuda a mantener el contenido libre.
Un clic a continuación admite nuestra misión de proporcionar contenido gratuito, profundo y relevante.
Únete a nuestra comunidad en YouTube
Únase a la comunidad que incluye a más de 15,000 expertos en #Cubealumni, incluido el CEO de Amazon.com, Andy Jassy, el fundador y CEO de Dell Technologies, Michael Dell, el CEO de Intel, Pat Gelsinger y muchos más luminarios y expertos.
GRACIAS
Related posts






































































































































































































































Trending
-
Startups10 meses ago
Remove.bg: La Revolución en la Edición de Imágenes que Debes Conocer
-
Recursos11 meses ago
Cómo Empezar con Popai.pro: Tu Espacio Personal de IA – Guía Completa, Instalación, Versiones y Precios
-
Tutoriales11 meses ago
Cómo Comenzar a Utilizar ChatGPT: Una Guía Completa para Principiantes
-
Startups9 meses ago
Startups de IA en EE.UU. que han recaudado más de $100M en 2024
-
Recursos11 meses ago
Suno.com: La Revolución en la Creación Musical con Inteligencia Artificial
-
Startups11 meses ago
Deepgram: Revolucionando el Reconocimiento de Voz con IA
-
Recursos10 meses ago
Perplexity aplicado al Marketing Digital y Estrategias SEO
-
Noticias8 meses ago
Dos periodistas octogenarios deman a ChatGPT por robar su trabajo