Una multitud ve “Solace”, una película generada por IA que incorpora imágenes surrealistas en Sora Selects, una proyección de cortometrajes realizados por Sora de OpenAi.
Opadai
Published
2 días agoon
Cuando Operai dio a conocer la tecnología llamada Sora el año pasado que permite a las personas generar instantáneamente videos hiperrealistas, como un avance de una película de un astronauta que atraviesa un planeta desierto estéril, en respuesta a un mensaje de texto de solo unas pocas palabras, no fue la calidad de las imágenes que atrapó a Hollywood Off Guente tanto como el rápido crecimiento de la tecnología que se creía inicialmente a años de que se enciendan a la enchufación de ser enchufado en la producción.
Las preguntas se arremolinaron cuando los ejecutivos de los estudios hablaron sobre el lugar de la IA en la industria del entretenimiento: qué procesos de producción pueden racionalizar; ¿Hasta qué punto puede reducir los costos; ¿Cuáles son las barandillas legales y laborales?
Desde entonces, Operai ha estado comprometiendo con Studios sobre Sora, al marcar a casa sus aplicaciones, ya que resuelve los cineastas independientes y sufre pruebas de seguridad. Ahora, la compañía está lanzando a Hollywood mientras se aventura hacia la adopción generalizada de su tecnología.
Rohan Sahai, quien dirige el equipo de productos SORA, le dice The Hollywood Reporter En una entrevista, ha habido un interés considerable de la industria del entretenimiento, sin especificar los contornos de las conversaciones. Él ve la utilización de las herramientas en la mayoría de las etapas de producción a medida que mejoran las herramientas.
“Para algunas de estas compañías de producción más grandes, las que buscan hacia adelante, ven a dónde van las cosas e intentan pensar en cómo cambiar todos sus flujos de trabajo para hacer que se ajuste mejor en este momento”, dice.
El panorama legal actual limita principalmente la adopción del proceso de previsualización, como la concepción y el guión gráfico, que no involucran directamente el producto final. La utilización generalizada de las herramientas de IA en el proceso de fabricación de movimientos dependerá en gran medida de cómo los tribunales aterrizan sobre nuevos asuntos legales planteados por la tecnología. Aún así, los trabajadores de la industria ya están perdiendo empleos, con artistas conceptuales, actores de voz y animadores a la vanguardia de ese desplazamiento. Agbo, la compañía de producción administrada por Vengadores Los directores Joe y Anthony Russo, están haciendo un impulso significativo en el espacio, más recientemente contratando a experto en IA y ex ejecutivo de Apple, el Dr. Dominic Hughes, para servir como su director científico en un intento por racionalizar los procesos de producción.
Entre pocas consideraciones que se encuentran más despliegue de IA se encuentra el espectro de una decisión judicial de que el uso de materiales con derechos de autor para capacitar a los sistemas de IA constituye una infracción. Otro factor es que las obras generadas por IA no son elegibles para la protección de los derechos de autor, lo que limita la explotación ya que ingresarían al dominio público.
Operai es optimista sobre un futuro en el que su tecnología no está limitada por las barandillas legales o laboristas, ya que continúa luchando contra las demandas de los creadores. Sus conversaciones con Hollywood reflejan esa confianza.
“Estamos dando un derrame cerebral más amplio aquí en términos de lo que queremos que la gente haga con estos modelos en términos de creación y narración de historias”, dice Sahai. En lugar de “perfeccionar una determinada parte del [production] Pipeline “, agrega que la compañía está teniendo una visión holística al vender Hollywood en la tecnología ya que” a largo plazo, la gente se dará cuenta de que es mucho más poderoso que simplemente aprovechar un flujo de trabajo de VFX “.
“Estamos profundamente comprometidos con la industria en su conjunto para obtener sus comentarios, incluidos los estudios”, dijo Openii en un comunicado.
El 19 de marzo, el fabricante de chatgpt proyectó 11 cortometrajes hechos con Sora por cineastas independientes en Brain Dead Studios, un cine de modernas en West Hollywood en Fairfax Avenue, en un intento por exhibir su tecnología. Esas películas mostraron las limitaciones de las herramientas mientras insinuaban su potencial.
Ninguno de los títulos incorporó un diálogo extenso entre personajes. Las narraciones eran escasas a inexistentes, con más de una persona comentando después de las proyecciones, algunas de las películas estaban más cerca de los comerciales que los cortometrajes. Los personajes parecían estar sentados en el aire en un momento en una película sobre las desventuras de los Caballeros.
Una multitud ve “Solace”, una película generada por IA que incorpora imágenes surrealistas en Sora Selects, una proyección de cortometrajes realizados por Sora de OpenAi.
Opadai
Aún así, la posibilidad de que Sora pueda racionalizar el flujo de trabajo VFX, un área de producción conocida por márgenes especialmente delgados, era evidente. Los títulos seleccionados para la proyección presentaban una variedad de tomas generadas por la herramienta que exhibe por qué está cautivado Hollywood: un pez lleno de ojos; una vista oceánica besada por una serie de soles de sol; Una silueta de un hombre tragado por un vórtice de periódicos. Algunos artistas de VFX ya se están inclinando a la IA, trabajando en torno a ciertas limitaciones legales al capacitar a los sistemas de código abierto en sus propios trabajos.
Verena Puhm, una cineasta de IA, dijo que comenzó su cortometraje sobre una granja lechera en un futuro distópico destinado a ser una crítica en la producción y explotación en masa con 15 horas restantes antes de que cerrara la ventana de aplicación. Ella dijo que su proyecto está destinado a crear “un poco de conciencia sobre lo que estamos consumiendo”.
OpenAI ya no revela las fuentes de datos utilizados para entrenar sus sistemas. Artistas, autores y publicaciones han demandado a la compañía liderada por Sam Altman por las acusaciones de que ilegalmente robó su trabajo sin consentimiento y compensación. Los tribunales que dictaminan contra el uso justo, una doctrina legal que permite la utilización de trabajos con derechos de autor sin una licencia, podría tener importantes implicaciones para el líder de la IA. La semana pasada, cientos de cifras principales de Hollywood firmaron una carta que se apelación contra Operai y Google al gobierno de los Estados Unidos para permitir que sus modelos de IA entrenen en trabajos con derechos de autor.
Asistió a la proyección había un ejecutivo en Universal Pictures, así como en Disney, que llegó a su capacidad personal y no como representante del estudio. Un empleado de UTA en la división de marketing de entretenimiento de la agencia también estaba en la multitud.
Alton Glass, miembro del Gremio de Directores de América que asistió a la proyección, dijo que “los flujos de trabajo cambiarán” con el advenimiento de la IA. Hizo hincapié en: “La oportunidad vendrá de eso”.
La adopción de IA en Hollywood ha sido lenta pero está progresando constantemente. El año pasado, Lionsgate anunció una asociación por primera vez con Runway que hará que la startup de IA con sede en Nueva York entrenara a un nuevo modelo de IA generativo en contenido propiedad del estudio, que se utilizará para ayudar con los procesos de producción detrás de escena. Bajo el acuerdo sin efectivo, Runway tendrá acceso a una parte de los títulos del estudio para crear un modelo diseñado exclusivamente para el uso de Lionsgate, con la esperanza de que pueda conectarse a diferentes partes de la tubería de producción, como el proceso de guión gráfico y para ayudar con el diseño del trabajo VFX, según una persona familiarizada con el acuerdo. Esto fue seguido por Blumhouse asociándose con Meta en una serie de cortometrajes producidos con la ayuda de la película Gen, que crea video y audio correspondiente, ya que prueba las AI Waters y James Cameron uniendo la junta directiva de Stability AI.
“Están buscando estudios de casos”, dice Rob Rosenberg, ex vicepresidente ejecutivo de Showtime Networks y asesor general. “Están buscando una prueba de concepto de que puedan dar la vuelta y decir que reducimos los costos de producción en un X por ciento”.
Sora se puso a disposición para uso público en diciembre después de someterse a pruebas de seguridad por parte de expertos en información errónea, contenido de odio y sesgo. Los cineastas, artistas visuales y diseñadores también recibieron acceso para comentarios sobre mejoras. Desde entonces, los creadores han estado presentando proyectos generados por IA para una recepción mixta, con algunas estéticas criticantes que dicen que se acercan al extraño Valle y otros que acogen la creación casi instantánea de imágenes y efectos listos para películas.
Similar a cómo Operai se está involucrando con los cineastas independientes, ya que despliega Sora, Meeka Bondy, presidente de la práctica de entretenimiento de Perkins Coie y el ex vicepresidente senior de asuntos legales de HBO, dice que las compañías de IA cortejan a Hollywood están buscando mostrar a los creadores que su tecnología no es el Boogeyman que ha sido representado por los críticos. Ella agrega: ‘Destaca su visibilidad, pero también creo que les da legitimidad. Si James Cameron lo está haciendo, sin embargo, es que no están tratando de reemplazar el equipo de producción “.
La narración avanzada por OpenAI para fomentar la adopción de sus herramientas de IA ha girado en torno a la “democratización” de la industria del entretenimiento. Con las herramientas, los creadores enfrentan barreras más bajas para el cine que, algunos pueden decir, ayudarán a realizar sus ideas a la pantalla. A principios de este mes, se anunció que James Lamont y Jon Foster, el equipo de escritura detrás Paddington en Perúestán en cuenta para una película animada de IA Criticz. El título es una adaptación de larga duración del cortometraje del mismo nombre de Vertigo Films, a la que se une AI Creatives en Native Foreign en el proyecto. Esa breve, escrita y dirigida por el especialista creativo de Operai Chad Nelson, surgió como una de las primeras películas de IA en combinar imágenes generadas por la herramienta Dall-E de Openai con técnicas de animación tradicionales y luego se remasterizó con Sora. Los productores dijeron que esperan “establecer un nuevo punto de referencia para la narración generativa que emparejan la creatividad impulsada por los humanos y las técnicas de animación tradicionales con la última tecnología de IA”.
Pero estos puntos de conversación, que subrayan la oportunidad presentada a algunos creativos que han podido avanzar en sus carreras con las herramientas de inteligencia artificial, brillar sobre aquellos que han perdido y continuarán perdiendo trabajo debido a la tecnología. Los artistas conceptuales y los trabajadores en VFX, entre otros puestos que son vistos como incendios por IA, están haciendo un balance de desplazamiento potencial en el futuro si la tecnología avanza al ritmo que ha sido.
Un estudio encargado el año pasado por la Asociación de Arte Conceptual. Y el gremio de animación que encuestó a 300 líderes en toda la industria del entretenimiento descubrió que las tres cuartas partes de los encuestados indicaron que las herramientas de IA respaldaban la eliminación, reducción o consolidación de empleos en sus empresas. Durante los próximos tres años, estimó que casi 204,000 posiciones se verán afectadas negativamente. A la vanguardia del desplazamiento: ingenieros de sonido, actores de voz, artistas conceptuales y empleados en puestos de nivel de entrada, según el estudio. Los efectos visuales y otros trabajos de postproducción son particularmente vulnerables.
Sora tiene limitaciones, tecnológicas y legales, que restringirán sus aplicaciones en la industria del entretenimiento. Aún así, tiene un potencial muy real en la producción en industrias auxiliares, incluidos los anuncios y el trabajo de video encargado por las corporaciones, que presentan menos limitaciones laborales para adoptar la tecnología. Entre las consideraciones sobre el impacto de la tecnología en Hollywood estarán efectos aguas abajo para los creativos que dependen de dicho trabajo para la fuente principal de sus ingresos. Se espera que tenga un impacto similar en los estadios de sonido y las compañías de alquiler de equipos, ya que la tecnología probablemente fomentará menos tripulación de producción.
Published
6 horas agoon
27 marzo, 2025Géminis 2.5
Gemini 2.5 Pro es el último modelo de IA multimodal a gran escala de Google Deepmind, diseñado con capacidades incorporadas de “pensamiento” para manejar tareas complejas. Como el primer lanzamiento de la serie Gemini 2.5, el modelo Pro lidera muchos puntos de referencia de la industria mediante márgenes significativos y demuestra fuertes capacidades de razonamiento y codificación.
A diferencia de las generaciones anteriores de IA que simplemente predijeron texto basado en patrones, Gemini 2.5 Pro está diseñado para analizar la información profundamente, sacar conclusiones lógicas, incorporar un contexto matizado y tomar decisiones informadas antes de responder. Esta evolución en las posiciones de diseño Gemini 2.5 Pro como un modelo de propósito general altamente avanzado que es adecuado para aplicaciones empresariales que exigen precisión y adaptabilidad.
En el núcleo de las características avanzadas de Gemini 2.5 Pro hay un cambio fundamental en su diseño arquitectónico, avanzando hacia lo que Google se refiere como un “modelo de pensamiento”. Esto indica una ruptura de los modelos de IA tradicionales centrados principalmente en la predicción y la clasificación hacia un sistema que se involucra en la deliberación y el razonamiento internos antes de generar una respuesta. Este enfoque intencional conduce a un rendimiento y una precisión significativamente mejorados, especialmente cuando se abordan tareas complejas que requieren más que un mero reconocimiento de patrones.
El rendimiento mejorado de Gemini Pro 2.5 no se debe únicamente al aumento de la potencia computacional o el tamaño del modelo. Más bien, surge de una combinación sofisticada de un modelo base subyacente muy mejorado, aprovechando los avances en la arquitectura de la red neuronal, los conjuntos de datos de entrenamiento extensos y las metodologías refinadas posteriores a la capacitación. Estas técnicas posteriores a la capacitación, que con frecuencia implican el aprendizaje de refuerzo, son cruciales para ajustar el comportamiento del modelo, asegurando una mayor calidad y resultados más relevantes. Esta evolución arquitectónica permite que el modelo realice análisis de información más exhaustivos, lleguen a conclusiones más precisas y lógicas, comprenda mejor e incorpore matices contextuales y, en última instancia, tome decisiones más informadas y confiables, capacidad que son esenciales para aplicaciones comerciales estratégicas.
Más allá del razonamiento abstracto, Gemini 2.5 Pro ofrece un conjunto de capacidades avanzadas que son directamente relevantes para las necesidades empresariales. Lo más destacado es su mejora significativa en el dominio de la codificación. Los ingenieros de Google informan que el rendimiento de la codificación experimentó un salto considerable de Gemini 2.0 a 2.5, con más mejoras en el horizonte. El modelo 2.5 Pro se destaca en la generación y el código de refinación, capaz de crear un software complejo, como una aplicación web interactiva funcional, desde un aviso de alto nivel. En una demostración, el modelo desarrolló un juego completo de “corredor interminable” en HTML/JS a partir de un mensaje de una sola línea, ilustrando su capacidad para administrar las tareas de codificación a nivel de proyecto de forma autónoma. Gemini 2.5 Pro también se destaca en una sólida transformación y edición de código, por lo que es valioso para tareas como refactorizar el código heredado o la traducción del código entre idiomas. En un punto de referencia de ingeniería de software estandarizado (verificado por el banco SWE), el modelo logró una puntuación alta (63.8%) utilizando una configuración de agente autónomo, lo que indica su fuerza para abordar los desafíos de codificación complejos de varios pasos. Para las empresas, esto significa que la IA puede funcionar no solo como un asistente de conversación sino también como una ayuda de codificación capaz o incluso un agente de software semiautónomo.
Géminis 2.5 Pro
Como parte del ecosistema de Géminis más amplio, Google también ha introducido TXGEMMA, un conjunto de modelos abiertos dirigidos a desafíos especializados de la industria. TXGEMMA es una colección de modelos derivados de la Serie Ligera de Gemma (versiones de código abierto de Gemini Technology) y adaptado específicamente para el desarrollo terapéutico de fármacos y biotecnología. Estos modelos están capacitados para comprender y predecir las propiedades de posibles medicamentos y terapias génicas, lo que ayuda a los investigadores a identificar candidatos prometedores e incluso pronosticar resultados de ensayos clínicos.
En esencia, TXGEMMA toma las técnicas de modelado y razonamiento del lenguaje central de Géminis y las aplica al dominio farmacéutico, donde puede examinar la literatura biomédica, los datos químicos y los resultados del ensayo para ayudar en las decisiones de I + D. El modelo de TXGEMMA más grande (con 27 mil millones de parámetros) ha demostrado el rendimiento a la par o excediendo modelos especializados en muchas tareas de descubrimiento de fármacos, todo mientras se conserva las habilidades generales de razonamiento. Para los líderes empresariales en atención médica y ciencias de la vida, TXGEMMA muestra la adaptabilidad de la arquitectura de Géminis a dominios misioneros críticos: ilustra cómo la IA de vanguardia puede acelerar flujos de trabajo altamente específicos como el descubrimiento de fármacos que tradicionalmente llevan años e incurrir en costos masivos.
Gemini 2.5 Pro representa un paso adelante significativo en el diseño del modelo de IA, combinando la potencia bruta con capacidades de razonamiento refinado que abordan directamente las tareas complejas del mundo real. Su arquitectura, con multimodalidad nativa y una longitud de contexto sin precedentes, permite a las empresas traer una variedad más rica de datos para tener problemas, extrayendo ideas que los modelos anteriores podrían haberse perdido. El fuerte desempeño del modelo en los puntos de referencia de codificación y razonamiento brinda la confianza de que puede manejar aplicaciones exigentes, desde la automatización de partes de la ingeniería de software hasta dar sentido a las amplias bases de conocimiento corporativo. Con el soporte de Google para la integración empresarial a través de plataformas en la nube y la aparición de ramas específicas de dominio como TXGEMMA, el ecosistema Gemini 2.5 Pro está listo para proporcionar la inteligencia general y las habilidades especializadas que buscan las empresas modernas. Para las CXO que planea la estrategia de IA de su empresa, Gemini 2.5 Pro ofrece una vista previa de cómo se pueden implementar sistemas de IA de próxima generación para impulsar la innovación y la ventaja competitiva, todos centrados en un razonamiento más profundo, un contexto más amplio y resultados tangibles.
Published
12 horas agoon
26 marzo, 2025Google ha presentado Gemini 2.5 Pro, llamándolo “Modelo de IA más inteligente” hasta la fecha. Este último modelo de lenguaje grande, desarrollado por el equipo de Google Deepmind, se describe como un “modelo de pensamiento” diseñado para abordar problemas complejos razonando a través de pasos internamente antes de responder. Los primeros puntos de referencia respaldan la confianza de Google: Gemini 2.5 Pro (un primer lanzamiento experimental de la serie 2.5) debutan en el número 1 en la tabla de clasificación Lmarena de asistentes de IA por un margen significativo, y lidera muchas pruebas estándar para la codificación, las matemáticas y las tareas científicas.
Las nuevas capacidades y características clave en Gemini 2.5 Pro incluyen:
Según Google, estos avances provienen de un modelo base significativamente mejorado combinado con técnicas mejoradas después de la capacitación. En particular, Google también retira la marca separada de “pensamiento flash” que utilizó para Gemini 2.0; Con 2.5, las capacidades de razonamiento ahora están incorporadas de forma predeterminada en todos los modelos futuros. Para los usuarios, eso significa que incluso las interacciones generales con Gemini se beneficiarán de este nivel más profundo de “pensar” debajo del capó.
Más allá del zumbido de los puntos de referencia y la competencia, la importancia real de Gemini 2.5 Pro puede estar en lo que permite para los usuarios finales e industrias. El fuerte desempeño del modelo en las tareas de codificación y razonamiento no se trata solo de resolver acertijos para alardear de los derechos: insinúa nuevas posibilidades para la automatización del lugar de trabajo, el desarrollo de software e incluso el diseño creativo.
Tome la codificación, por ejemplo. Con la capacidad de generar código de trabajo a partir de un mensaje simple, Gemini 2.5 Pro puede actuar como un multiplicador de proyecto para los desarrolladores. Un solo ingeniero podría potencialmente prototipos de una aplicación web o analizar una base de código completa con asistencia de IA que maneja gran parte del trabajo de gruñidos. En una demostración de Google, el modelo creó un videojuego básico desde cero dada solo una descripción de una oración. Esto sugiere un futuro en el que los no programadores describirán una idea y obtendrán una aplicación en ejecución en respuesta (“codificación de vibos”), bajando drásticamente la barrera para la creación de software.
Incluso para desarrolladores experimentados, tener una IA que pueda comprender y modificar repositorios de código grandes (gracias a ese contexto de 1 m) significa una depuración más rápida, revisiones de código y refactorización. Nos estamos moviendo hacia una era de programadores de pares de IA que pueden mantener el “Gran imagen” de un proyecto complejo en su cabeza, por lo que no tiene que recordarles el contexto con cada aviso.
Las habilidades de razonamiento avanzado de Gemini 2.5 también juegan en la automatización del trabajo de conocimiento. Los primeros usuarios han intentado alimentarse en largos contratos y pedirle al modelo que extraiga cláusulas clave o resume puntos, con resultados prometedores. Imagine automatizar partes de la revisión legal, la investigación de diligencia debida o el análisis financiero al dejar que la IA pase a través de cientos de páginas de documentos y retire lo que importa, tareas que actualmente comen innumerables horas humanas.
La habilidad multimodal de Gemini significa que incluso podría analizar una mezcla de textos, hojas de cálculo y diagramas juntos, dando un resumen coherente. Este tipo de IA podría convertirse en un asistente invaluable para profesionales en derecho, medicina, ingeniería o cualquier campo ahogamiento en datos y documentación.
Para los campos creativos y el diseño de productos, modelos como Gemini 2.5 Pro también abren posibilidades intrigantes. Pueden servir como socios de lluvia de ideas, por ejemplo, que generan conceptos de diseño o copia de marketing mientras razonan sobre los requisitos, o como prototipos rápidos que transforman una idea aproximada en un borrador tangible. El énfasis de Google en el comportamiento de la agente (la capacidad del modelo para usar herramientas y realizar planes de varios pasos de forma autónoma) sugerencias de que las versiones futuras podrían integrarse directamente con el software.
Uno podría imaginar una IA de diseño que no solo sugiere ideas, sino que también navega por el software de diseño o escribe código para implementar esas ideas, todas guiadas por instrucciones humanas de alto nivel. Tales capacidades difuminan la línea entre “Thinker” y “Doer” en el reino de AI, y Gemini 2.5 es un paso en esa dirección, una IA que puede conceptualizar soluciones y ejecutarlas en varios dominios.
Sin embargo, estos avances también plantean preguntas importantes. A medida que AI asume tareas más complejas, ¿cómo nos aseguramos de que comprenda los matices y los límites éticos (por ejemplo, al decidir qué cláusulas de contrato son sensibles o cómo equilibrar los aspectos creativos frente a los aspectos prácticos en el diseño)? Google y otros necesitarán construir barandillas robustas, y los usuarios necesitarán aprender nuevos conjuntos de habilidades, lo que solicita y supervisará la IA, a medida que estas herramientas se convierten en compañeros de trabajo.
No obstante, la trayectoria es clara: modelos como Gemini 2.5 Pro están empujando la IA más profundamente en roles que anteriormente requerían inteligencia humana y creatividad. Las implicaciones para la productividad y la innovación son enormes, y es probable que veamos efectos dominantes en cómo se construyen los productos y cómo se realiza el trabajo en muchas industrias.
Con Gemini 2.5 Pro, Google está apostando un reclamo a la vanguardia de la carrera de IA, y enviando un mensaje a sus rivales. Hace solo un par de años, la narración era que la IA de Google (piense en las primeras iteraciones de Bard) estaba rezagada detrás de Chatgpt de OpenAi y los movimientos agresivos de Microsoft. Ahora, al organizar el talento combinado de Google Research y DeepMind, la compañía ha entregado un modelo que puede competir legítimamente por el título del mejor asistente de IA en el planeta.
Esto es un buen augurio para el posicionamiento a largo plazo de Google. Los modelos de IA se consideran cada vez más como plataformas centrales (al igual que los sistemas operativos o los servicios en la nube), y tener un modelo de nivel superior le da a Google una mano fuerte para jugar en todo, desde ofertas de la nube empresarial (Google Cloud/Vertex AI) hasta servicios de consumo como búsqueda, aplicaciones de productividad y Android. A la larga, podemos esperar que la familia Gemini se integre en muchos productos de Google, potencialmente sobrealimentando el Asistente de Google, mejorando las aplicaciones de Google Workspace con características más inteligentes y mejorando la búsqueda con habilidades más conversacionales y conscientes del contexto.
El lanzamiento de Gemini 2.5 Pro también destaca cuán competitivo se ha vuelto el panorama de IA. Operai, antrópico y otros jugadores como Meta y Startups emergentes están iterando rápidamente en sus modelos. Cada salto de una empresa, ya sea una ventana de contexto más amplia, una nueva forma de integrar herramientas o una nueva técnica de seguridad, es respondida rápidamente por otros. El movimiento de Google para incrustar el razonamiento en todos sus modelos es estratégico, asegurando que no se quede atrás en la “inteligencia” de su IA. Mientras tanto, la estrategia de Anthrope de dar a los usuarios más control (como se ve con la profundidad de razonamiento ajustable de Claude 3.7) y los refinamientos continuos de OpenAI a GPT-4.X mantienen la presión sobre.
Para los usuarios finales y los desarrolladores, esta competencia es en gran medida positiva: significa mejores sistemas de IA que llegan más rápido y más opciones en el mercado. Estamos viendo un ecosistema de IA en el que ninguna empresa tiene el monopolio de la innovación, y esa dinámica empuja a cada uno a sobresalir, al igual que los primeros días de la computadora personal o las guerras de teléfonos inteligentes.
En este contexto, la versión de Gemini 2.5 Pro es más que una actualización de productos de Google: es una declaración de intención. Se indica que Google pretende no ser solo un seguidor rápido sino un líder en la nueva era de la IA. La compañía está aprovechando su infraestructura informática masiva (necesaria para entrenar modelos con más de 1 millones de contextos tokens) y vastas recursos de datos para superar los límites que pocos otros pueden. Al mismo tiempo, el enfoque de Google (implementando modelos experimentales para usuarios de confianza, integrando AI en su ecosistema cuidadosamente) muestra un deseo de equilibrar la ambición con la responsabilidad y la practicidad.
Como Koray Kavukcuoglu, CTO de Google Deepmind, lo expresó en el anuncio, el objetivo es hacer que la IA sea más útil y capaz al mejorarlo a un ritmo rápido.
Para los observadores de la industria, Gemini 2.5 Pro es un hito que marca qué tan lejos ha llegado la IA a principios de 2025, y un indicio de hacia dónde va. El bar de “estado del arte” sigue aumentando: hoy es razonamiento y destreza multimodal, mañana podría ser algo así como la resolución de problemas o la autonomía aún más general. El último modelo de Google muestra que la compañía no solo está en la carrera, sino que tiene la intención de dar forma a su resultado. Si Gemini 2.5 tiene algo que ver, la próxima generación de modelos de IA estará aún más integrada en nuestro trabajo y vidas, lo que nos lleva a volver a imaginar cómo usamos la inteligencia de la máquina.
Published
13 horas agoon
26 marzo, 2025Como escritor, siempre he sido reclino de AI. ¿Robará mi trabajo? ¿Terminará tomando el mundo como esos robots en esa película de Will Smith? Dejando de lado mis dramáticas preocupaciones, me encontré increíblemente intrigado cuando recientemente encontré varias publicaciones en X (anteriormente Twitter) por personas que usaban ChatGPT para crear listas de compras y planificar sus comidas durante una semana. Cualquier cosa que haga que esta tarea semanal sea más fácil es algo que pueda respaldar, o al menos probar.
Entonces, como experimento, en lugar de llenar mi carrito de compras con los sospechosos habituales, utilicé ChatGPT para crear un plan de comidas de cinco días y mi lista de compras. Esto es lo que siguió:
Para que Chatgpt se encargue de esta tarea para mí, escribí el siguiente comando: “Cree una lista de comestibles y recetas (desayuno, almuerzo, cena y bocadillos) para los lunes a viernes. El presupuesto es de $ 75. No incluya tomates, guisantes u avena. Las recetas deben ser bastante saludables y densas en nutrientes. ¡Gracias!”
Traté de ser lo más específico posible sin hacer demasiado. También quería desafiar a ChatGPT financieramente lanzando un presupuesto modesto. Y me aseguré de mantenerlo lindo y amable con un poco de gratitud al final (me niego a ser Yo, robot‘d). Al recibir mis resultados, había un ingrediente que sabía que quería salir. “Eso es genial, pero no tofu”, escribí al chatbot.
“¡Lo tengo! Ajustaré el plan y eliminaré el tofu, reemplazándolo con otras opciones de proteínas”, respondió ChatGPT, antes de compartir una lista de comestibles y un plan de comidas actualizados.
Y así, tenía una lista completa de comestibles y comidas de lunes a viernes. Aunque ChatGPT hizo todo el trabajo, me sentí productivo de alguna manera. Algo sobre las comidas planeadas para la semana realmente se quita una carga. Tenía esperanzas.
Aquí está el plan de comidas Chatgpt diseñado para mí, a continuación. Para ahorrarle mucha redundancia, he notado algunos, pero no todas, de las instrucciones que Chatgpt me dio en cuanto a la preparación. (La mayoría de estas comidas son bastante fáciles de hacer sin mucha dirección externa).
Desayuno: Huevos revueltos con espinacas
Almuerzo: Ensalada de atún con aceite de oliva, pepinos y zanahorias
Cena: Pollo a la parrilla con batatas asadas y brócoli (Sazone el pollo con sal, pimienta y ajo en polvo, luego sea la parrilla o la sartén; las batatas de cubos y asanlos con aceite de oliva, sal y pimienta a 400 ° F durante 25 minutos; brócoli de vapor).
Bocadillo: Yogurt griego con bayas.
Desayuno: Yogurt griego con mantequilla de plátano y maní (Corte el plátano y agregue a un tazón de yogurt griego; rocíe con mantequilla de maní para proteínas agregadas).
Almuerzo: Vegetal salteado con pollo y arroz marrón (Corte el pollo y cocine en aceite de oliva hasta que se dore; Agregue verduras congeladas y saltee con salsa de soja; Servir con arroz integral).
Cena: Pechuga de pollo al horno con calabacín asado y batatas
Bocadillo: Zanahorias con mantequilla de maní
Desayuno: Huevos revueltos con pimiento rojo y espinacas
Almuerzo: Envoltura de pollo y verduras con pan de trigo integral (Corte el pollo a la parrilla y coloque en una envoltura con espinacas y pepino. Rocíe con aceite de oliva y enrolle.)
Cena: Salteado de pollo con brócoli y arroz marrón
Bocadillo: Yogurt griego con llovizna de miel
Desayuno: Tostada de mantequilla de plátano y maní
Almuerzo: Ensalada de atún en tostada de trigo entero (Mezcle el atún enlatado con pepino picado y aceite de oliva; extienda la mezcla sobre pan de trigo integral tostado).
Cena: Pollo horneado con verduras asadas
Bocadillo: Zanahorias con salsa de yogurt griega
Desayuno: Veggie Scramble con huevos
Almuerzo: Tazón de pollo y arroz (Cocine el pollo y córtelo; sirva con arroz integral y brócoli al vapor; rocíe con salsa de soja).
Cena: Pollo salteado con verduras mixtas y batata
Bocadillo: Yogurt griego con un puñado de bayas congeladas.
Al revisar las diversas comidas que se proporcionan Chatgpt, desearía que incluya “Hacerlo sabroso” en mi solicitud inicial. Tengo que admitir que mis papilas gustativas estaban bastante aburridas el miércoles. No tengo nada contra el pollo, pero ahora sufro un caso importante de fatiga avícola.
Chatgpt me dio esta lista para hacer mis comidas, junto con su precio para cada artículo:
Desglose del presupuesto:
Total: ~ $ 74.50
También incluyó este mensaje agradable en buena medida: “Esto debería estar dentro de su presupuesto mientras mantiene las comidas saludables y equilibradas. ¡Disfruta!”
Primero: el presupuesto. Ya tenía aceite de oliva, salsa de soja y los condimentos disponibles, por lo que no necesitaba comprarlos. Afortunadamente, tenía todos esos ingredientes porque no hay forma de que cuestan solo $ 6 juntos. ¡El aceite de oliva solo es más que eso! (Me pregunté si ChatGPT estaba calculando ese precio según la cantidad que usaría.
Compré más de una sola libra de pollo, no seguro si se trataba de un error de chatgpt, pero dada la cantidad de comidas que llamaban al pollo, me quedé con mi paquete habitual, que está más cerca de una libra y media. Para hacer mis compras, utilicé Instacart, que tiende a ser más caro que ir en persona, pero obtuve dentro de aproximadamente $ 10 de ese presupuesto de $ 75. ¡No está mal, chatgpt!
(Notaré que estaba cocinando para mí, pero con la cantidad de artículos comprados, habría habido mucha comida para uno, tal vez incluso otras dos personas).
Ahora, aquí es donde las cosas se ponen raras. Después de comprar los comestibles, comparé las comidas con la lista de comestibles, y algo importante se destacó. Varios de los artículos enumerados en la lista de compras no se usaron en las comidas. Sé que ChatGPT es plenamente consciente del costo de los comestibles, así que por qué me haría comprar cinco artículos (¡sí, cinco!) Que no necesitaba está más allá de mí. En caso de que se lo pregunte, esos cinco artículos eran una lata de frijoles negros, pasta de trigo integral, queso, manzanas y leche. Sinceramente, todavía estoy rascándome la cabeza sobre este.
Dejando a un lado la lista de compras, estaba emocionado de probar algunas recetas nuevas (y saludables). Y me complace decir que encontré algunos favoritos nuevos gracias a este pequeño experimento. Entre mis recetas favoritas estaban el yogur griego con plátanos y mantequilla de maní (también agregué una llovizna de miel) y salteado de verduras con pollo y arroz integral.
Pero, hubo casos en los que se sentía absolutamente como si las comidas fueran planificadas por un robot. Por ejemplo, una envoltura de sándwich hecha “usando pan de trigo integral” me pareció un poco extraño. ¿Cómo “enrollar” una rebanada de pan? Y las bayas frescas habrían sido una mejor compra que las bayas congeladas, dado que las estaba usando como una cobertura de yogurt.
El fiasco de la lista de comestibles me apagó, pero avanzé. Y tal vez debería haber presionado ese carrito de comestibles virtual muy, muy lejos porque, en última instancia, esta es una técnica sin la que puedo prescindir. Además de un puñado de favoritos, las comidas sugeridas eran decepcionantes. La conveniencia de todo simplemente no valió la pena para mí. Estoy seguro de que obtendría mejores resultados con un presupuesto más grande y solicitudes más específicas, pero prefiero trabajar con una persona humana real en un plan de comidas que se adapte a mí individualmente.
¡Ahora, por favor envíeme todas sus recetas favoritas de pollo y sin atún!
Danielle Harling es una escritora independiente con sede en Atlanta con un amor por los espacios diseñados con colores, cócteles artesanales y compras en línea (generalmente para tacones de diseñador que rompen el presupuesto). Su trabajo anterior ha aparecido en Fodor’s, Forbes, Mydomaine, Architectural Digest y más.
Remove.bg: La Revolución en la Edición de Imágenes que Debes Conocer
Cómo Empezar con Popai.pro: Tu Espacio Personal de IA – Guía Completa, Instalación, Versiones y Precios
Cómo Comenzar a Utilizar ChatGPT: Una Guía Completa para Principiantes
Startups de IA en EE.UU. que han recaudado más de $100M en 2024
Suno.com: La Revolución en la Creación Musical con Inteligencia Artificial
Deepgram: Revolucionando el Reconocimiento de Voz con IA
Perplexity aplicado al Marketing Digital y Estrategias SEO
Dos periodistas octogenarios deman a ChatGPT por robar su trabajo
This website uses cookies so that we can provide you with the best user experience possible. Cookie information is stored in your browser and performs functions such as recognising you when you return to our website and helping our team to understand which sections of the website you find most interesting and useful.
Strictly Necessary Cookie should be enabled at all times so that we can save your preferences for cookie settings.
If you disable this cookie, we will not be able to save your preferences. This means that every time you visit this website you will need to enable or disable cookies again.