Connect with us

Noticias

El modelo de próxima generación de OpenAI llega al muro de rendimiento: informe

Published

on

El próximo modelo de inteligencia artificial de OpenAI está generando menores ganancias de rendimiento que sus predecesores, dijeron a The Information fuentes familiarizadas con el asunto.

Las pruebas de los empleados revelan que Orion logró un rendimiento de nivel GPT-4 después de completar solo el 20% de su capacitación, informa The Information.

El aumento de calidad de GPT-4 a la versión actual de GPT-5 parece ser menor que el de GPT-3 a GPT-4.

“Algunos investigadores de la compañía creen que Orion no es mejor que su predecesor en el manejo de ciertas tareas, según los empleados (de OpenAI)”, informó The Information. “Orion se desempeña mejor en tareas de lenguaje, pero es posible que no supere a los modelos anteriores en tareas como la codificación, según un empleado de OpenAI”.

Si bien el hecho de que Orion se acerque a GPT-4 con un 20% de su entrenamiento puede parecer impresionante para algunos, es importante tener en cuenta que las primeras etapas del entrenamiento de IA suelen ofrecer las mejoras más espectaculares, mientras que las fases posteriores producen ganancias menores.

Por lo tanto, no es probable que el 80% restante del tiempo de capacitación produzca la misma magnitud de avance observado en saltos generacionales anteriores, dijeron las fuentes.

Imagen: Laboratorios V7

Las limitaciones surgen en un momento crítico para OpenAI luego de su reciente ronda de financiación de 6.600 millones de dólares.

La empresa ahora enfrenta mayores expectativas por parte de los inversores mientras lidia con limitaciones técnicas que desafían los enfoques tradicionales de escalamiento en el desarrollo de la IA. Si estas primeras versiones no cumplen con las expectativas, es posible que los próximos esfuerzos de recaudación de fondos de la compañía no reciban el mismo entusiasmo que antes, y eso podría ser un problema para una empresa potencialmente lucrativa, que es lo que Sam Altman parece querer para OpenAI. .

Los resultados decepcionantes apuntan a un desafío fundamental que enfrenta toda la industria de la IA: la oferta cada vez menor de datos de capacitación de alta calidad y la necesidad de seguir siendo relevante en un campo tan competitivo como la IA generativa.

Una investigación publicada en junio predijo que las empresas de inteligencia artificial agotarán los datos de texto públicos disponibles generados por humanos entre 2026 y 2032, lo que marca un punto de inflexión crítico para los enfoques de desarrollo tradicionales.

“Nuestros hallazgos indican que las tendencias actuales de desarrollo de LLM no pueden sostenerse únicamente mediante el escalamiento de datos convencional”, afirma el artículo de investigación, destacando la necesidad de enfoques alternativos para la mejora del modelo, incluida la generación de datos sintéticos, la transferencia de aprendizaje de dominios ricos en datos y el uso. de datos no públicos.

La estrategia histórica de entrenar modelos de lenguaje en texto disponible públicamente de sitios web, libros y otras fuentes ha llegado a un punto de rendimiento decreciente, y los desarrolladores han “exprimido en gran medida ese tipo de datos tanto como pueden”, según The Information. .

Cómo OpenAI está abordando este problema: razonamiento versus modelos de lenguaje

Para abordar estos desafíos, OpenAI está reestructurando fundamentalmente su enfoque para el desarrollo de la IA.

“En respuesta al reciente desafío a las leyes de escalamiento basadas en capacitación que plantea la desaceleración de las mejoras de GPT, la industria parece estar cambiando sus esfuerzos para mejorar los modelos después de su capacitación inicial, lo que podría generar un tipo diferente de ley de escala”, informa The Information.

Para lograr este estado de mejora continua, OpenAI está separando el desarrollo de modelos en dos vías distintas:

La Serie O (que parece tener el nombre en clave Strawberry), centrada en las capacidades de razonamiento, representa una nueva dirección en la arquitectura de modelos. Estos modelos operan con una intensidad computacional significativamente mayor y están diseñados explícitamente para tareas complejas de resolución de problemas.

Las demandas computacionales son sustanciales, y las primeras estimaciones sugieren costos operativos seis veces mayores que los de los modelos actuales. Sin embargo, las capacidades de razonamiento mejoradas podrían justificar el aumento del gasto para aplicaciones específicas que requieren procesamiento analítico avanzado.

Este modelo, si es el mismo que Strawberry, también tiene la tarea de generar suficientes datos sintéticos para aumentar constantemente la calidad de los LLM de OpenAI.

Paralelamente, los Modelos Orion o la Serie GPT (considerando que OpenAI registra el nombre GPT-5) continúan evolucionando, enfocándose en tareas generales de procesamiento del lenguaje y comunicación. Estos modelos mantienen requisitos computacionales más eficientes al tiempo que aprovechan su base de conocimientos más amplia para tareas de redacción y argumentación.

El CPO de OpenAI, Kevin Weil, también confirmó esto durante una AMA y dijo que espera que ambos desarrollos converjan en algún momento en el futuro.

“No es una cosa o la otra”, respondió cuando se le preguntó si OpenAI se centraría en escalar los LLM con más datos o usar un enfoque diferente, centrándose en modelos más pequeños pero más rápidos, “mejores modelos base y más computación de escalado/tiempo de inferencia”. “

¿Una solución alternativa o la solución definitiva?

El enfoque de OpenAI para abordar la escasez de datos mediante la generación de datos sintéticos presenta desafíos complejos para la industria. Los investigadores de la compañía están desarrollando modelos sofisticados diseñados para generar datos de entrenamiento, pero esta solución introduce nuevas complicaciones en el mantenimiento de la calidad y confiabilidad del modelo.

Como informó anteriormente por Descifrarlos investigadores han descubierto que el entrenamiento de modelos con datos sintéticos representa un arma de doble filo. Si bien ofrece una solución potencial a la escasez de datos, introduce nuevos riesgos de degradación del modelo y problemas de confiabilidad con una degradación comprobada después de varias iteraciones de entrenamiento.

En otras palabras, a medida que los modelos se entrenan con contenido generado por IA, pueden comenzar a amplificar imperfecciones sutiles en sus resultados. Estos ciclos de retroalimentación pueden perpetuar y magnificar los sesgos existentes, creando un efecto compuesto que se vuelve cada vez más difícil de detectar y corregir.

El equipo de Foundations de OpenAI está desarrollando nuevos mecanismos de filtrado para mantener la calidad de los datos, implementando diferentes técnicas de validación para distinguir entre contenido sintético de alta calidad y potencialmente problemático. El equipo también está explorando enfoques de capacitación híbridos que combinan estratégicamente contenido generado por humanos y por IA para maximizar los beneficios de ambas fuentes y minimizar sus respectivos inconvenientes.

La optimización post-entrenamiento también ha ganado relevancia. Los investigadores están desarrollando nuevos métodos para mejorar el rendimiento del modelo después de la fase de entrenamiento inicial, ofreciendo potencialmente una manera de mejorar las capacidades sin depender únicamente de expandir el conjunto de datos de entrenamiento.

Dicho esto, GPT-5 es todavía un embrión de un modelo completo con un importante trabajo de desarrollo por delante. Sam Altman, director ejecutivo de OpenAI, ha indicado que no estará listo para su implementación este año ni el próximo. Este cronograma ampliado podría resultar ventajoso, ya que permitiría a los investigadores abordar las limitaciones actuales y potencialmente descubrir nuevos métodos para mejorar el modelo, mejorando considerablemente GPT-5 antes de su lanzamiento final.

Editado por Josh Quittner y Sebastian Sinclair.

Generalmente inteligente Hoja informativa

Un viaje semanal de IA narrado por Gen, un modelo de IA generativa.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

Creé una presentación completa usando Gemini en Google Diaides, así es como fue

Published

on

Google Slides es una herramienta poderosa, pero crear una presentación completa puede llevar mucho tiempo. Recientemente, Google introdujo la integración de Gemini en diapositivas y todas las aplicaciones del espacio de trabajo. Ahora, solo necesita indicaciones de texto para crear presentaciones atractivas e imágenes de alta calidad para sus diapositivas. Tuve que verlo yo mismo, y decidí experimentar con Géminis y lo encargué con la construcción de una presentación completa.

En esta publicación, comparto mi viaje y revelo cómo Gemini manejó el desafío y si ofrece la promesa de presentaciones sin esfuerzo.

Relacionado

Google Gemini: Todo lo que necesita saber sobre la IA multimodal de próxima generación de Google

Google Gemini está aquí, con un enfoque completamente nuevo para la IA multimodal

Acceso a Géminis en las diapositivas de Google: requisitos

Usando Géminis en las diapositivas de Google

Antes de encender las hojas de Google en la web, repasemos los requisitos. Si bien varios modelos Gemini son gratuitos de descargar y usar, pagará más para desbloquear el asistente de IA en las aplicaciones de productividad de Google.

Debe comprar el plan avanzado de Gemini a $ 20 por mes. Después de eso, la opción Géminis aparece en Docs, Hojas, Gmail, Google Drive y Slides. Google también ofrece un mes de prueba gratuita para usuarios elegibles.

Dado que Google Slides es una solución web, puede explorar la integración de Gemini en escritorios de Windows, Mac y Chromebooks.

Explorando Géminis en las diapositivas de Google

Genere diapositivas utilizando un mensaje de texto

Después de habilitar Gemini en Google Slides, es hora de verificarlo en acción. En el siguiente ejemplo, crearé una presentación sobre los beneficios de un estilo de vida saludable. Mi objetivo es cubrir los beneficios de la nutrición, el ejercicio regular, el bienestar mental y el manejo del estrés. Siga los pasos a continuación.

  1. Inicie las diapositivas de Google en la web e inicie sesión con los detalles de su cuenta de Google. Comience con una presentación en blanco.

  2. Abra Géminis desde la esquina superior derecha y escriba un aviso.

Escribir un aviso es una parte crucial de su proceso de presentación. Dado que es un tema amplio y adaptable, sea lo más descriptivo posible. En nuestro caso, escribiré un aviso a continuación para mi diapositiva de introducción.

Genere una diapositiva con el título “Los beneficios de un estilo de vida saludable”. Agregue una definición breve de un estilo de vida saludable, enfatizando el equilibrio del bienestar físico, mental y nutricional.

Esto es lo que se le ocurrió a Géminis. Puede volver a intentarlo si no está satisfecho con los resultados y haga clic en Insertar para agregarlo.

Géminis creando diapositivas en las diapositivas de Google

Ahora, haga clic + + Para agregar una nueva diapositiva y continuar escribiendo indicaciones para generar nuevas diapositivas para su presentación.

Cree una diapositiva titulada “Nutrición: alimentar su cuerpo”. Agregue información sobre la importancia de las frutas y verduras.

Géminis creando una diapositiva nutritiva

A diferencia de Copilot en PowerPoint, no puede crear múltiples diapositivas a la vez. Debes describir cada diapositiva por separado. Por lo tanto, asegúrese de planificar el esquema de su presentación.

Después de eso, creé cuatro diapositivas nuevas utilizando las indicaciones de texto a continuación.

Cree una diapositiva titulada, “Ejercicio: moverse para un usted más saludable”. Agregue información sobre la cantidad recomendada de ejercicio por semana.

Usar Géminis para crear una presentación

Crea una diapositiva titulada, “Bienestar mental: encontrar tu paz interior”. Agregue puntos de bala en buenos hábitos de sueño.

Diapositiva de bienestar mental para diapositivas de Google

Genere una diapositiva que enumere los beneficios de un estilo de vida saludable, que incluye un aumento de la energía, un mejor estado de ánimo y un mejor sueño.

Beneficios de la diapositiva de estilo de vida saludable

Cree una diapositiva de conclusión con pasos prácticos para adoptar un estilo de vida más saludable. Incluir puntos de bala orientados a la acción.

Use Géminis para crear conclusión diapositiva

Hubo algunos casos en los que no estaba satisfecho con los resultados. Entonces, le pedí a Gemini que recreara esas diapositivas. Además, no te sorprenderá con diseños de diapositivas llamativas y animaciones. Debe agregarlos manualmente y completar su presentación.

En cualquier momento, puede escribir @Nombre del archivo Y solicite a Gemini que se refiera a un documento de su cuenta de Google Drive. Por ejemplo, si escribió una dieta vegetariana en un documento, puede pedirle a Gemini que se refiera a ella para sus diapositivas de presentación.

Estás usando diapositivas generadas por AI. La precisión puede recibir un éxito cuando se trata de temas complejos como IA, fotografía computacional, aprendizaje automático y más. Compruebe dos veces antes de compartir la presentación con otros.

Relacionado

Google Gemini: 5 maneras de usar el asistente a día a día de Google con IA

Puede hacer que muchas tareas cotidianas sean mucho más fáciles

Crear e insertar imágenes con Gemini

No tenía idea de que Géminis podía crear imágenes basadas en indicaciones de texto. Es un gran ahorro de tiempo, ya que no necesita buscar imágenes en la web para obtener imágenes adecuadas para su presentación. Generé un par de imágenes relevantes utilizando las indicaciones de texto a continuación.

Una imagen de una placa equilibrada con proteína magra, granos integrales y verduras.

Generar una imagen con Géminis

Una fotografía de primer plano de un vaso de agua con rebanadas de limón y pepino.

Cree una imagen usando Gemini en Google Diagras

Gemini le ofrece cuatro opciones de imagen para sus diapositivas. Puede verlos e insertarlos en sus diapositivas.

Géminis hizo mis diapositivas

Géminis en Google Slides abrió mis ojos al potencial de la IA en la creación de presentación. Si bien no es un reemplazo perfecto para la creatividad humana y el pensamiento estratégico, es una herramienta poderosa para racionalizar el proceso, especialmente para elaborar borradores iniciales y imágenes llamativas.

Aún así, la supervisión humana es crucial, pero si tiene plazos ajustados o desea explorar nuevas formas de crear diapositivas atractivas, pruebe a Gemini. Gemini Advanced desbloquea el asistente de IA de Google en otras aplicaciones de productividad como Google Sheets. Así es como puedes aumentar tus hojas de cálculo con Gemini.

Continue Reading

Noticias

Google Assistant Transitions a Gemini: cambios clave por delante

Published

on

Google Assistant está evolucionando a Géminis, trayendo potentes nuevas capacidades de IA pero también descontinuando algunas características favoritas. Si usa el Asistente de Google para establecer temporizadores, reproducir música o controlar su hogar inteligente, prepárese para algunas interrupciones significativas a medida que la compañía comienza a reemplazar al asistente de nueve años con su chatbot Gemini más nuevo, más potente y alimentado por IA. Este artículo describirá los cambios clave que puede esperar, ayudándole a prepararse para la transición y comprender lo que será diferente.

Gemini representa un salto gigante en la capacidad en comparación con el Asistente de Google. Podrá chatear con Gemini de manera similar a la forma en que hablas con Google Assistant ahora, pero como se basa en modelos de lenguaje grande (LLM) con AI, Gemini puede ser mucho más conversacional y útil, capaz de realizar tareas más desafiantes y capaz de adaptarle sus respuestas específicamente a usted. Google ya ha comenzado la transición a Gemini. Los teléfonos inteligentes son los primeros en cambiar y serán seguidos por altavoces inteligentes, televisores, otros dispositivos domésticos, dispositivos portátiles y automóviles en los próximos meses. Los teléfonos inteligentes, con algunas excepciones importantes, se habrán mudado a Gemini por completo a fines de 2025, ya que “el asistente clásico de Google ya no se puede acceder en la mayoría de los dispositivos móviles o disponible para nuevas descargas en tiendas de aplicaciones móviles”, según Google.

Continue Reading

Noticias

Cómo se puede mejorar la investigación profunda de Chatgpt con 8 características clave

Published

on

La herramienta de investigación profunda de Chatgpt es fantástica para profundizar en casi cualquier tema que elija, pero aún necesita algunas mejoras para ser realmente útiles. Utilizo investigaciones profundas todo el tiempo y creo que sería mucho mejor con estas características adicionales.

1

Parámetros personalizables

Cuando uso la investigación de chatgpt profunda, normalmente respondo preguntas de seguimiento para darle a la herramienta más contexto. Sin embargo, desearía poder usar parámetros personalizables en su lugar.

Imaginaría que esta característica funcione como filtros al comprar en línea. Me encantaría elegir cuántos recursos quiero que se analice ChatGPT, junto con los plazos publicados. Además, sería genial si pudiera buscar en función de diferentes palabras clave.

Los parámetros personalizables mantendrían mi investigación mucho más organizada. Siento que los resultados valdrían la pena el tiempo que lleva a ChatGPT realizar investigaciones profundas también. Hasta que esto suceda, hay al menos formas en que puede obligar a ChatGPT a usar fuentes de alta calidad.

2

Opciones de diseño de investigación

La función de investigación profunda de ChatGPT puede establecer información de múltiples maneras. Por ejemplo, utilizará tablas al comparar estadísticas u otros aspectos. En otros casos, la herramienta establecerá información en subsecciones integrales.

Si bien varias opciones de diseño son buenas, desearía que ChatGPT me permita elegir cómo quiero que presente información. A veces, veo contenido presentado en forma de oración cuando prefiero usar tablas.

A veces uso las indicaciones para pedirle a ChatGPT que presente información en mi formato preferido, pero desafortunadamente, no siempre escucha.

3

Una asignación mensual más grande

Quizás mi mayor queja con la herramienta de investigación profunda de Chatgpt es lo fácil que es usar sus créditos mensuales. Aunque esto está bien para los usuarios casuales, 10 consultas mensuales no son suficientes para las personas que regularmente necesitan realizar una investigación integral. Revisé mis consultas en dos días.

Podía entender diez consultas mensuales para usuarios gratuitos; En estos casos, en realidad creo que sería un buen valor. Sin embargo, como alguien que paga $ 20 por mes por ChatGPT, no puedo evitar sentir que no me dan el mejor servicio posible.

Quedarse sin solicitudes en chatgpt

Por lo menos, creo que 15-20 consultas mensuales son justas para un plan positivo. Aumentaría aún más estas asignaciones para suscripciones de nivel superior. Operai podría incentivar a las personas a registrarse para estos planes al hacerlo, lo que resulta en una mejor experiencia del usuario y un aumento de los ingresos.

4

Una sección separada en chatgpt

Utilizo ChatGPT para múltiples conversaciones, ya sea que esté planeando una nueva parte de mi vida o quiero trabajar a través de mis pensamientos actuales. A medida que creo más chats, la interfaz se vuelve torpe y desorganizada. Molesto, no tengo forma de diferenciar entre conversaciones y discusiones ordinarias en las que he usado investigaciones profundas.

Si bien puedo crear nuevos proyectos a través de la barra lateral, prefiero que ChatGPT organice automáticamente mis conversaciones con una investigación profunda. Esta sería una mejora efectiva para la interfaz de usuario de ChatGPT, y no sería particularmente difícil de implementar.

Incluso si la aplicación no tuviera una sección separada, un diferenciador, como un ícono, sería útil.

5

Integración con GPTS personalizados

Los GPT personalizados son la función más subestimada de ChatGPT. Me encanta lo fácil que son para obtener el tipo de respuesta exacto que estaba buscando, y hay útiles GPT personalizados para todo tipo de intereses. Pero desafortunadamente, actualmente no puede integrarlos con la función de investigación profunda.

Siento que las respuestas serían mucho más precisas si tuvieran el contexto de GPT personalizados. Esto es particularmente cierto, considerando que algunos de mis chats normales tienen múltiples temas.

GPT personalizado como asistente de programación

No sé cómo sería posible porque imagino que los dos programas entrarían en conflicto. Pero si hubiera una manera de integrar investigaciones profundas y GPT personalizados, no veo cómo cualquier otra herramienta de IA podría competir en esta área.

6

La capacidad de dividir el texto en trozos más pequeños

He comparado la investigación profunda de ChatGPT con herramientas similares, como el equivalente de Microsoft Copilot. Cuando se trata de respuestas detalladas, la investigación profunda se encuentra en la cabeza y los hombros por encima de su competencia. Pero al mismo tiempo, a veces veo enormes párrafos una vez que la investigación ha concluido.

Encontrar información de la dieta en Chatgpt Investigación profunda

La lectura de Skim en una pantalla es mucho más difícil que con un libro, y a veces pierdo los puntos clave en la investigación. Cuando esto sucede, la investigación tarda más de lo que debería. Romper el texto en trozos más pequeños sería una solución simple pero efectiva.

Si todo el texto es realmente importante, ChatGPT podría dividirlo en más subsecciones. De esa manera, podría identificar la información más esencial fácilmente.

7

La opción de excluir sitios web específicos

La información inexacta es uno de los muchos grandes problemas con ChatGPT, y lamentablemente, esto se extiende a la función de investigación profunda. Puedo examinar ciertos sitios web al investigar a través de motores de búsqueda, pero este no es el caso cuando se utiliza una investigación profunda, lo que significa que debo tener mucho cuidado para verificar los recursos.

He visto características similares en otros tipos de aplicaciones, como bloqueadores de sitios web. La forma en que veo esto, los usuarios podrían ingresar a la URL para excluir un sitio de la búsqueda. Me imagino que esto aumentaría el tiempo que lleva completar estas tareas, pero sería un gran éxito.

8

Audio

ChatGPT tiene algunas características de voz geniales, pero ninguna se aplica a una investigación profunda. Tengo que escribir indicaciones de texto y recibo respuestas escritas. Si bien normalmente estoy contento con estas búsquedas, a veces me gustaría usar audio.

Cambiar la voz del altavoz en el modo de voz en chatgpt.

Además de hablar por una investigación profunda, agradecería las respuestas escritas. Me encantaría que la herramienta me cuente sobre sus hallazgos y proporcione una transcripción más tarde. Esto sería interactivo y beneficioso para las personas que aprenden mejor a través de la escucha que la lectura.

Operai inevitablemente agregará nuevas características a la herramienta de investigación profunda de ChatGPT a su debido tiempo, y creo que debería priorizar algunas adiciones simples pero efectivas. Los parámetros personalizables conducirían a hallazgos más precisos, y tener más control sobre el diseño de información también sería bueno.

Continue Reading

Trending