Connect with us

Noticias

OpenAI presenta SearchGPT y desafía a Google en medio de retrasos en su implementación

Published

on

El 31 de octubre de 2024, OpenAI pospuso nuevos modelos de IA debido a desafíos computacionales, pero lo compensó con el lanzamiento de SearchGPT. Este motor de búsqueda de IA generativa puede absorber la información más reciente en la web.

Search GPT es una nueva característica dentro de ChatGPT que desafía directamente a gigantes de la industria como Google y Microsoft Bing con capacidades de búsqueda en tiempo real que combinan la experiencia de IA conversacional con la navegación web.

Nuestra discusión comienza con ideas del reciente Reddit AMA de OpenAI, que se centró en los retrasos y el progreso de los modelos de IA como GPT-5, SORA y otros modelos de razonamiento. Posteriormente, analizaremos la introducción de Search GPT, explorando sus características clave, sus implicaciones estratégicas para el mercado de la IA y los desafíos legales que enfrenta.

Descripción general de la sesión de AMA: OpenAI enfrenta retrasos computacionales

Durante una sesión de Reddit AMA el 31 de octubre de 2024, el director ejecutivo de OpenAI, Sam Altman, abordó los desafíos y retrasos actuales en el desarrollo de los modelos de IA de próxima generación de la empresa. Altman analizó con franqueza las limitaciones computacionales que han ralentizado el lanzamiento de nuevas tecnologías y afirmó: “Todos estos modelos se han vuelto bastante complejos”, lo que dificulta la distribución eficaz de los recursos informáticos entre múltiples proyectos.

Altman reveló que los lanzamientos anticipados de actualizaciones importantes, incluida la próxima versión de DALL-E y la herramienta de generación de video de IA Sora, se posponen sin fechas de lanzamiento firmes. Enfatizó que la próxima actualización de DALL-E “valdrá la pena esperar”, destacando los esfuerzos en curso para mejorar las capacidades de la IA a pesar de los contratiempos.

Al detallar más los obstáculos computacionales, Altman señaló: “Nos enfrentamos a muchas limitaciones y decisiones difíciles sobre cómo asignamos nuestra computación a muchas grandes ideas”. Este problema ha afectado notablemente el avance de la función de conversación de sonido realista de OpenAI, el Modo de Voz Avanzado, que carece de las capacidades de visión que se mostraron inicialmente a principios de este año. Como resultado de la capacidad limitada, Altman indicó que estas capacidades de visión, mostradas por primera vez en abril cuando la aplicación ChatGPT respondió a señales visuales como la ropa en la vista de la cámara de un teléfono inteligente, no llegarán pronto. Este retraso se debe a las mejoras continuas necesarias en los aspectos de seguridad y escalamiento de la tecnología.

Durante la sesión, Kevin Weil, director de productos de OpenAI, también comentó sobre el estado de Sora y explicó que la herramienta necesita mayor perfección, particularmente en lo que respecta a cuestiones de seguridad y suplantación, antes de que se pueda considerar un lanzamiento más amplio. Según se informa, Sora sufrió contratiempos técnicos, ya que el sistema original reveló en febrero que tardaba más de 10 minutos en generar un videoclip de 1 minuto. Estos desafíos lo posicionan mal frente a sistemas rivales de empresas como Luma y Runway.

Al abordar los desafíos de infraestructura, los informes de Reuters indican que OpenAI ha tenido dificultades para asegurar suficiente infraestructura informática para respaldar sus ambiciosos proyectos. La compañía lleva meses colaborando con Broadcom en un chip de IA para mejorar el rendimiento del modelo, que se espera que esté listo para 2026.

En respuesta a las preguntas sobre el tan esperado GPT-5, Altman respondió que si bien hay “algunos lanzamientos muy buenos a finales de este año”, también aclaró que “sin embargo, nada de lo que vamos a llamar GPT-5”. Por ahora, OpenAI parece centrarse en mejorar los modelos existentes en lugar de lanzar nuevos números de modelo.

Altman también mencionó que OpenAI está considerando la posibilidad de permitir contenido “NSFW” en ChatGPT “algún día”, enfatizando la creencia de la compañía en “tratar a los usuarios adultos como adultos”. La principal prioridad de la compañía sigue siendo mejorar su serie o1 de modelos de “razonamiento” y sus sucesores, con características presentadas en la conferencia DevDay de OpenAI en Londres, incluidos avances en la comprensión de imágenes.

Descripción detallada de la función SearchGPT de OpenAI

Con la sesión de Reddit AMA, OpenAI lanzó Search GPT, el motor de búsqueda impulsado por IA integrado perfectamente en ChatGPT. Permite al chatbot acceder y transmitir información en tiempo real desde Internet, abordando así las necesidades de información inmediata de sus usuarios. A diferencia de otros motores de búsqueda, Search GPT combina la naturaleza conversacional de la inteligencia artificial con la navegación web para brindar una experiencia optimizada y sin complicaciones publicitarias.

Capacidades funcionales e integraciones.

Search GPT va más allá de una actualización típica y cambia por completo la forma en que ChatGPT interactúa con los datos. La función facilita el acceso directo a contenido procedente de la web, incluidas actualizaciones meteorológicas, tendencias del mercado de valores, resultados deportivos y noticias de última hora. OpenAI ha establecido asociaciones con destacados medios de comunicación como Le Monde de Francia, Axel Springer de Alemania y Financial Times del Reino Unido, asegurando que la información entregada sea precisa y relevante.

Durante una demostración detallada previa al lanzamiento, Adam Fry, líder de la iniciativa de búsqueda ChatGPT de OpenAI, ilustró la nueva funcionalidad buscando información sobre las acciones de Apple. El chatbot mostró un gráfico de acciones interactivo, próximas ganancias detalladas y artículos de noticias relevantes con enlaces en los que se puede hacer clic, lo que muestra la naturaleza interactiva y detallada de Search GPT. Otra demostración presentó una búsqueda de restaurantes italianos locales en San Francisco, lo que resultó en un mapa interactivo que señalaba varias recomendaciones, demostrando así el aspecto atractivo y fácil de usar de los resultados de la búsqueda.

Consideraciones técnicas y éticas

Esta capacidad de búsqueda mejorada está impulsada por una combinación de tecnologías avanzadas, incluido Microsoft Bing. El modelo subyacente, una versión refinada de GPT-4o, fue probado rigurosamente con 10.000 usuarios bajo el nombre de prototipo SearchGPT antes de su integración completa.

Un avance notable de Search GPT es su capacidad para aumentar significativamente la precisión de los hechos al obtener la información más reciente disponible, crucial especialmente en el período crítico previo a las elecciones presidenciales de EE. UU.

El director ejecutivo de OpenAI, Sam Altman, expresó su entusiasmo por la nueva función en las plataformas de redes sociales y afirmó en X (anteriormente Twitter) que es su “función favorita que hemos lanzado” desde el debut de ChatGPT en 2022. Destacó la eficiencia y la facilidad de acceso. información a través de Search GPT, reflexionando sobre su potencial para transformar la accesibilidad a la información.

La función de búsqueda permite a los usuarios activarla de forma predeterminada o manualmente a través de un ícono de búsqueda web, brindando flexibilidad en cómo se accede a la información. OpenAI también permite que cualquier sitio web o editor opte por aparecer en los resultados de búsqueda de ChatGPT, buscando activamente comentarios para perfeccionar aún más el sistema. Este enfoque proactivo para la gestión de contenidos es fundamental mientras OpenAI navega por un panorama legal complejo, donde enfrenta demandas de entidades como News Corp y The New York Times por supuestas infracciones de derechos de autor.

OpenAI se compromete a manejar estos desafíos de manera responsable, enfatizando las asociaciones con empresas de medios para garantizar que el contenido se utilice de manera ética. Adam Fry señaló que a pesar del potencial de inexactitudes (“alucinaciones”), la nueva función de búsqueda probablemente aumentaría la precisión fáctica general debido a su acceso a información actualizada.

Implicaciones financieras y operativas

A pesar de la ausencia de publicidad, que diferencia a Search GPT de competidores como Google Search, mantener una herramienta de búsqueda impulsada por IA es intrínsecamente más costoso. El portavoz de OpenAI, Niko Felix, indicó que mientras todavía están tratando de resolver las cosas, intentarán equilibrar los costos imponiendo algunos límites a los usuarios gratuitos.

Con la introducción de Search GPT, el ámbito de la búsqueda web impulsada por IA es ahora más competitivo que nunca. Si bien esta nueva característica empuja a OpenAI a competir directamente con gigantes como Google, también aumentará los requisitos computacionales y el gasto de la empresa. En el futuro, será fundamental que OpenAI navegue de manera eficiente por estas crecientes demandas para garantizar la viabilidad a largo plazo de este ambicioso esfuerzo.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

¿Qué modelo de chatgpt es el mejor? Una guía sobre qué modelo usar y cuándo.

Published

on

Chatgpt no es un monolito.

Desde que Operai lanzó por primera vez el Buzzy Chatbot en 2022, ha implementado lo que parece un nuevo modelo cada pocos meses, utilizando una panoplia confusa de nombres.

Varios competidores de Operai tienen populares Alternativas de chatgptcomo Claude, Géminis y perplejidad. Pero los modelos de Openai se encuentran entre los más reconocibles de la industria. Algunos son buenos para tareas cuantitativas, como la codificación. Otros son mejores para hacer una lluvia de ideas sobre nuevas ideas.

Si está buscando una guía sobre qué modelo usar y cuándo, está en el lugar correcto.

GPT-4 y GPT-4O

Openai lanzó por primera vez GPT-4 en 2023 como su modelo de lenguaje grande. El CEO Sam Altman dijo en un podcast de abril que la modelo tomó “cientos de personas, casi todo el esfuerzo de Openi” para construir.

Desde entonces, ha actualizado su modelo insignia a GPT-4O, que lanzó por primera vez el año pasado. Es tan inteligente como GPT-4, que es capaz de acumular el SAT, el GRE y pasar la barra, pero es significativamente más rápido y mejora sus “capacidades entre el texto, la voz y la visión”, dice Openii. El “O” significa Omni.

4O puede traducir rápidamente el habla y ayudar con el álgebra lineal básica, y tiene las capacidades visuales más avanzadas.

Sus imágenes de estilo Studio Ghibli tocaron la emoción en línea. Sin embargo, también planteó preguntas de derechos de autor cuando los críticos argumentaron que Operai se está beneficiando injustamente del contenido de los artistas.

Operai dice que 4O “se destaca en las tareas cotidianas”, como hacer una lluvia de ideas, resumir, escribir correos electrónicos y revisar informes.

GPT-4.5

Altman describió a GPT-4.5 en una publicación sobre X como “el primer modelo que se siente como hablar con una persona reflexiva”.

Es el último avance en el paradigma de “aprendizaje sin supervisión” de OpenAI, que se centra en ampliar los modelos en el “conocimiento de las palabras, la intuición y la reducción de las alucinaciones”, dijo la miembro del personal técnico de Operai, Amelia Glaese, durante su presentación en febrero.

Entonces, si está teniendo una conversación difícil con un colega, GPT-4.5 podría ayudarlo a replantear esas conversaciones en un tono más profesional y tacto.

Operai dice que GPT-4.5 es “ideal para tareas creativas”, como proyectos de colaboración y lluvia de ideas.

O1 y O1-Mini

Openai lanzó una mini versión de O1, su modelo de razonamiento, en septiembre del año pasado y la versión completa en diciembre.

Los investigadores de la compañía dijeron que es el primer modelo capacitado para “pensar” antes de que responda y se adapte bien a las tareas cuantitativas, de ahí el “modelo de razonamiento” del apodo. Esa es una función de su técnica de entrenamiento, conocida como cadena de pensamiento, que alienta a los modelos a razonar a través de problemas descomponiéndolos paso a paso.

En un artículo publicado en la capacitación de seguridad del modelo, la compañía dijo que “los modelos de capacitación para incorporar una cadena de pensamiento antes de responder tienen el potencial de desbloquear beneficios sustanciales, al tiempo que aumentan los riesgos potenciales que provienen de una inteligencia aumentada”.

En un video de una presentación interna de Operai en los mejores casos de uso para O1, Joe Casson, un ingeniero de soluciones en OpenAI, demostró cómo O1-Mini podría resultar útil para analizar el máximo beneficio en una llamada cubierta, una estrategia de negociación financiera. Casson también mostró cómo la versión de vista previa de O1 podría ayudar a alguien razonar a través de cómo crear un plan de expansión de la oficina.

Operai dice que el modo Pro de O1, una “versión de O1 que utiliza más cómputo para pensar más y proporcionar respuestas aún mejores a los problemas más difíciles”, es mejor para un razonamiento complejo, como crear un algoritmo para el pronóstico financiero utilizando modelos teóricos o generar un resumen de investigación de varias páginas en tecnologías emergentes.

O3 y O3-Mini

Los modelos pequeños han estado ganando tracción en la industria durante un tiempo como una alternativa más rápida y rentable a los modelos de base más grandes. Operai lanzó su primer modelo pequeño, O3 Mini, en enero, solo semanas después de que la startup de la startup china Butterfly Effect debutó el R1 de Deepseek, que conmocionó a Silicon Valley, y los mercados, con sus precios asequibles.

Openai dijo que 03 Mini es el “modelo más rentable” en su serie de razonamiento. Está destinado a manejar preguntas complejas, y Openai dijo que es particularmente fuerte en ciencias, matemáticas y codificación.

Julian Goldie, un influencer de las redes sociales que se centra en la estrategia de SEO, dijo en una publicación sobre el medio que O3 “brilla en tareas de desarrollo rápido” y es ideal para tareas de programación básicas en HTML y CSS, funciones simples de JavaScript y la construcción de prototipos rápidos. También hay una versión “mini alta” del modelo que, según él, es mejor para la “codificación y lógica compleja”, aunque tenía algunos problemas de control.

En abril, Openai lanzó una versión completa de O3, que llama “nuestro modelo de razonamiento más poderoso que empuja la frontera a través de la codificación, matemáticas, ciencias, percepción visual y más”.

Operai dice que el O3 se usa mejor para “tareas complejas o de múltiples pasos”, como la planificación estratégica, la codificación extensa y las matemáticas avanzadas.

O4 mini

Operai lanzó otro modelo más pequeño, el O4 Mini, en abril. Dijo que está “optimizado para un razonamiento rápido y rentable”.

La compañía dijo que logra un rendimiento notable para el costo, especialmente en “Matemáticas, codificación y tareas visuales”. Fue el modelo de referencia con mejor rendimiento en el examen de matemáticas de invitación estadounidense en 2024 y 2025.

O4 Mini, y su mini versión, son excelentes para un razonamiento rápido y más sencillo. Son buenos para acelerar cualquier tarea de razonamiento cuantitativo que encuentre durante su día. Si está buscando un trabajo más profundo, opte por O3.

Scott Swingle, alumbre de DeepMind y fundador de la compañía de herramientas de desarrolladores con IA Abante AI, probó O4 con un problema de Euler, una serie de problemas computacionales desafiantes lanzados cada semana más o menos. Dijo en una publicación sobre X que O4 resolvió el problema en 2 minutos y 55 segundos, “Mucho más rápido que cualquier solucionador humano. Solo 15 personas pudieron resolverlo en menos de 30 minutos”.

Operai dice que el O4 Mini se usa mejor para “tareas técnicas rápidas”, como consultas rápidas relacionadas con STEM. Dice que también es ideal para el razonamiento visual, como extraer puntos de datos clave de un archivo CSV o proporcionar un resumen rápido de un artículo científico.