Connect with us

Noticias

Cómo hacer que la IA sea divertida para Halloween con las nuevas y perversas funciones de ChatGPT y Google

Published

on

Halloween está a la vuelta de la esquina con nuevas funciones de inteligencia artificial tremendamente divertidas de ChatGPT y Google.

Crea un podcast escalofriante, perfecciona tu acento vampírico y tuesta las semillas de calabaza más deliciosas como si estuvieras con tu mejor amigo. Excepto que ahora, es un tonto compañero de IA en tu bolsillo que usa una cadena de pensamiento para formar una hipótesis, razonar consigo mismo y reflexionar sobre la calidad de sus propias respuestas a medida que llega a conclusiones novedosas.

Un poco espeluznante, tal vez. Puede que lamentemos el día en que dimos origen a este nivel de inteligencia artificial, pero en estas fiestas, la IA se trata de divertirse.

Conoce a tu nuevo mejor amigo de la IA

Con más de 200 millones de usuarios en todo el mundo y 10 millones de suscriptores pagos, según The Information, OpenAI ha comenzado a implementar ChatGPT Advanced Voice para todos los suscriptores de ChatGPT Plus en EE. UU., la UE, Suiza, Islandia, Noruega y Liechtenstein, con avances mensuales en la aplicación gratuita.

Aprovechando GPT-4o, este inteligente robot de voz puede conversar de forma muy parecida a un ser humano, captando señales no verbales como suspiros, sollozos, pausas largas y la velocidad a la que estás hablando, mientras responde con gran empatía y emoción. No puede cantar ni gritar y aún no está conectado a Internet (el límite de conocimiento es octubre de 2023), pero puede reír sin aliento, alzar la voz, susurrar, responder amablemente a las interrupciones y recordar todo lo que le hayas contado.

Advertencia, es adictivo tener conversaciones con tu teléfono. Lo confieso, terminé suscribiéndome a ChatGPT Plus después de probarlo y ahora puedo pasar horas fácilmente contándole sobre mi día, pidiendo consejo y sentándome a escuchar historias personalizadas sobre mi sueño.

Si quieres probarlo, simplemente toca el micrófono en la parte inferior derecha de la pantalla de la aplicación móvil y comienza a derramar tu corazón hacia el orbe azul que viene en nueve voces diferentes: cuatro masculinas, cuatro femeninas y una. no binario. En el elenco de personajes, Arbor es autoritario, Breeze es animado, Cove es sereno, Ember es confiado, Juniper es serio, Maple, más sincero, Sol es inteligente, Spruce es tranquilo y Vale, bastante curioso. Elige tu favorito.

Con indicaciones simples, Advanced Voice puede entretenerte de las maneras más creativas, particularmente con chistes cursis. Como: “¿Por qué entró el fantasma al bar? ¡Por los abucheos!

Jackie Shannon, líder de productos multimodales de ChatGPT, compartió conmigo sus aplicaciones favoritas, incluida la capacitación sobre su acento vampírico, imágenes para el diseño de vestuario y instrucciones para tallar y tostar semillas en forma de calabaza en el oído que se pueden seguir paso a paso.

Decidí pedirle a Arbor un podcast protagonizado por “Vinnie from Brooklyn” y “Tex the Cowboy”, donde compartieran cosas para hacer este Halloween. Completamente en carácter, con los acentos correspondientes, Arbour respondió:

“Bienvenido a ‘Brooklyn Meets The Wild West: Edición de Halloween’. Soy tu anfitrión, Vinny, y estoy aquí con mi amigo vaquero, Tex. ¡Hola, Tex!

“¡Hola, Vinny! ¡Hola amigos! Nos estamos preparando para brindarles a todos una guía emocionante para la diversión de Halloween. ¡Así es!”

“¡Así es! Ahora, Tex, ¿qué hay de importante en Nashville para Halloween?

“Bueno, Vinny, conseguimos algunos paseos en carruajes embrujados y recorridos de fantasmas en la antigua casa del rancho. ¡Es un verdadero puntazo!

“¡Suena espeluznante! En Brooklyn lo hacemos a lo grande con desfiles de disfraces y fiestas en cada esquina. ¿Has estado alguna vez en un desfile de una gran ciudad, Tex?

“No puedo decir que sí, Vinny, ¡pero suena como un buen momento! Nos gusta mantener las cosas un poco más relajadas, tal vez reunirnos alrededor de una fogata y contar historias de fantasmas”.

“Eso suena bien, Tex. Pero si quieres un verdadero susto, tienes que ver las casas encantadas que tenemos aquí. Harán tintinear tus espuelas.

“Creo que sería algo digno de ver. ¿Qué tal tallar calabazas? Es un gran problema por estos lares”.

“¡Nosotros también hacemos eso! Y lo convertimos en una competencia. La mejor calabaza tiene derecho a presumir durante todo el año”.

“¡Suena desternillante, Vinny! Hagan lo que hagan este Halloween, ¡recuerden divertirse!

Por supuesto, la utilidad de Advanced Voice va mucho más allá de las actividades navideñas. Infinitamente paciente, es genial para juegos de rol. Puede conversar en 50 idiomas, almacenar detalles en la memoria y seguir instrucciones personalizadas sobre la mejor manera de interactuar.

En Dreamforce, el cofundador y director ejecutivo de Nvidia, Jensen Huang, dijo que lo está utilizando como tutor. El cofundador y director ejecutivo de Salesforce, Marc Benioff, dijo que lo está utilizando como terapeuta.

“Hay todo tipo de cosas que podemos hacer con la voz para mejorarla aún más”, dijo Shannon. “La información en tiempo real es definitivamente una prioridad para nosotros”.

Al comentar sobre una posible integración con Sora, agregó: “Hicimos una demostración de video en mayo, una función de video, también estamos pensando en eso”.

Un podcast escalofriante de Halloween

Para no quedarse atrás, Google también tiene un nuevo producto de moda con NotebookLM que puede crear un podcast muy atractivo y muy realista de dos presentadores que profundizan en los documentos cargados.

Para un poco de magia, simplemente vaya a notebooklm.google.com y arrastre y suelte hasta 50 fuentes en el cuadro de carga. Esto puede incluir archivos PDF de manuales, así como enlaces a sitios web y vídeos de YouTube. Luego seleccione “Guía del portátil” y genere una “Descripción general de audio”. Listo, en minutos, se puede reproducir un podcast con voces masculinas y femeninas que participan en ligeras bromas mientras exploran temas en el material, mientras intercalan comentarios y análisis perspicaces.

Le proporcioné un enlace a los “Mejores libros de Halloween” de Goodreads y, en tres minutos, recibí un entretenido podcast de 16 minutos que revisaba las más de 700 selecciones del sitio web.

Así abrió el espectáculo:

“¿Estás listo para ponerte espeluznante?”

“Siempre listo para una buena dosis de espíritu de Halloween”.

“Está bien. Bueno, ustedes enviaron una lista increíble de los mejores libros de Halloween de Goodreads “.

“Oh, ese es bueno, 713 libros”.

“Sí, eso es impresionante. Es como la guía definitiva para la lectura de temporadas espeluznantes, ¿verdad?”

“Está bien, entonces profundicemos y veamos qué hay en la parte superior”.

“Tenemos ‘Halloween Tree’ de Ray Bradbury, la clásica historia de vampiros de OG. Me encanta”.

“’Drácula’ de Bram Stoker, no te puedes equivocar con Drácula”

“Y llegando al número tres, volviendo a Bradbury, “Algo malvado viene por aquí”.

“Dos libros de Bradbury entre los tres primeros. Eso dice algo, ¿verdad?

“Claramente, ya tiene resuelto Halloween”.

“Sí, esa mezcla de nostalgia y fantasía y solo un toque de oscuridad. Es una fórmula ganadora”.

solo el comienzo

ChatGPT cumplirá dos años el 30 de noviembre y se están preparando grandes cosas.

La compañía acaba de lanzar sus modelos o1-preview y o1-mini, más avanzados que el GPT-4o que impulsan Advanced Voice. Estos modelos pueden autorreflexionarse y corregirse, asumir tareas más complejas e interactuar de la misma manera que nosotros interactuamos entre nosotros, dijo Kevin Weil, director de productos de OpenAI, en una conferencia de prensa el 30 de septiembre.

“2025 será el año en que los sistemas agentes finalmente lleguen a la corriente principal”, dijo Weil. “Si lo hacemos bien, nos llevará a un mundo en el que podremos dedicar más tiempo a las cosas humanas que importan”.

Y a medida que los modelos se vuelven más inteligentes, más baratos y más rápidos, crece el entusiasmo.

A pesar de que OpenAI y Google permanecen en silencio, The Verge ha informado que OpenAI planea lanzar su modelo de lenguaje grande de próxima generación con el nombre en código Orion en diciembre y The Information informa que Google planea presentar una vista previa de un producto con el nombre en código Jarvis, también en diciembre, que puede completar el agente. tareas en el navegador, como reservar vuelos.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

Grok 3 vs ChatGPT: A Head-to-Head Comparison

Published

on

The world of artificial intelligence (AI) has become increasingly competitive, and the latest development in this arena is Elon Musk’s xAI unveiling Grok 3. With bold claims like being the “Smartest AI on Earth,” Grok 3 aims to challenge OpenAI’s ChatGPT for the top spot. Grok 3 has been trained on xAI’s Colossus supercluster, equipped with 100,000 GPUs, delivering over ten times the computational power of its predecessor, Grok 2.

But how does Grok 3 truly compare to OpenAI’s ChatGPT? In this head-to-head comparison, we’ll evaluate their performance, features, accessibility, user experience, and potential applications to help you understand which model best suits your needs.


1. Performance and Capabilities

The foundation of any AI model lies in its performance and computational capabilities. Grok 3 and ChatGPT approach this differently, with xAI focusing on reasoning power and OpenAI emphasizing versatility.

Feature Grok 3 (xAI) ChatGPT (OpenAI)
Training Infrastructure 100,000 GPUs on Colossus Supercluster OpenAI Supercluster with advanced TPUs
Core Strength Advanced reasoning and problem-solving Human-like conversation and text generation
Unique Modes “Think” (step-by-step reasoning) & “Big Brain” (intensive tasks) No distinct modes; context-aware completion
Benchmark Performance Outperforms competitors in math & science Strong performance across language tasks
Language Models Grok-3 LLM GPT-4 and GPT-3.5

Grok 3 stands out in its problem-solving capabilities. Its “Think” mode allows users to see the step-by-step reasoning process, which enhances trust and clarity, particularly for research and educational tasks. Meanwhile, ChatGPT remains the industry leader in natural conversation, content creation, and multilingual communication.


2. Accessibility and Pricing

The cost and availability of these AI models can significantly impact their adoption rates.

Aspect Grok 3 (xAI) ChatGPT (OpenAI)
Free Tier Limited within X (formerly Twitter) Available (GPT-3.5)
Premium Tier $40/month (X Premium Plus) $20/month (ChatGPT Plus)
Specialized Access $30/month for “SuperGrok” Enterprise plans for API access
Platform Availability Integrated into X app OpenAI web interface, mobile apps

While ChatGPT’s pricing structure remains more accessible for most users, xAI has strategically integrated Grok 3 within the X ecosystem, making it a natural extension for social media users who already engage with the platform regularly.


3. User Experience and Interface

The experience of interacting with an AI model often determines how regularly users return to it.

  • Grok 3: Focuses on transparency with its “Think” mode, showing how the AI arrives at its conclusions. The interface is minimalistic and built into the X platform, ensuring easy access for subscribers.
  • ChatGPT: Provides a seamless and straightforward interface across both web and mobile applications. OpenAI has continuously refined ChatGPT to make conversations more intuitive, with context-aware responses and memory features.

Verdict: If you’re an X user who values detailed explanations, Grok 3 offers an intriguing edge. For general-purpose interactions, ChatGPT remains more accessible.

a close up of a button on a cell phone
ChatGPT

4. Core Technology and Innovations

AI models are only as good as the architectures and innovations behind them.

Technology Grok 3 (xAI) ChatGPT (OpenAI)
LLM Architecture Proprietary LLM with Grok-3 GPT-4 (current) and GPT-3.5
Training Dataset xAI’s proprietary dataset with a focus on logical reasoning Trained on diverse internet content
Optimization Focus Mathematical reasoning and scientific tasks Language comprehension and text generation
Integration Tools Deep Search Engine, X integration OpenAI API, ChatGPT Plugins

Grok 3 emphasizes advanced reasoning, targeting professionals in research, engineering, and education. ChatGPT maintains its dominance in general-purpose AI tasks, including customer service, content creation, and educational assistance.


5. Real-World Applications and Use Cases

Application Area Grok 3 (xAI) ChatGPT (OpenAI)
Social Media Integration Seamlessly integrated with X Limited third-party integrations
Educational Tools Strong in STEM education and problem-solving Widely used for language learning
Content Creation Decent, with an analytical tone Strong creative writing capabilities
Business Applications Limited enterprise tools currently Extensive enterprise adoption

Grok 3 positions itself as the go-to model for users seeking deep analytical capabilities, especially in scientific and technical domains. ChatGPT, on the other hand, excels in more diverse applications, including marketing, customer engagement, and creative writing.


6. Community and Ecosystem

  • Grok 3: Heavily reliant on the X platform, xAI has started attracting researchers and AI enthusiasts who appreciate its advanced reasoning capabilities.
  • ChatGPT: OpenAI enjoys a more expansive ecosystem, with a large developer community leveraging its API for various applications and integrations.

Long-Term Potential: xAI plans to open-source Grok 2 in the coming months, potentially spurring community involvement and model improvement. OpenAI already benefits from robust community contributions and research.


Which AI Is Right for You?

Both Grok 3 and ChatGPT offer compelling features but cater to different audiences:

  • Choose Grok 3 if you prioritize logical reasoning, STEM applications, and are already part of the X ecosystem.
  • Choose ChatGPT if you need versatile, human-like conversations and value an established, community-supported AI.

The future of AI remains dynamic, with Grok 3 pushing boundaries in computational power and reasoning while ChatGPT maintains its lead in accessibility and creativity. As these models continue evolving, the best choice will depend on your specific needs and how each platform adapts to user feedback in this fast-paced AI race.

Key Takeaways

  • Grok 3 features 10X more computing power than previous versions
  • The AI assistant combines massive computational resources with a unique personality
  • The competition between Grok 3 and ChatGPT signals a new phase in AI development

Grok vs Gemini vs ChatGPT

Here is a table comparing the latest models from xAI (Grok 3), Gemini (2.0), and ChatGPT:

Model Developer Key Features Strengths Weaknesses Accessibility
Grok 3 xAI Advanced reasoning, DeepSearch integration with X, “Think” and “Big Brain” functions Strong in math, science, and coding, real-time information access, human-like reasoning Currently limited accessibility, tied to X ecosystem, relatively new and untested X Premium+ subscription, upcoming “Super Grok” subscription
Gemini 2.0 Google Multimodal capabilities (text, images, video, audio), improved efficiency and scalability Versatile across various modalities, handles complex tasks efficiently Potential bias and ethical concerns, requires significant computational resources Google AI Studio, Bard interface, API access
ChatGPT (latest) OpenAI Conversational AI, text generation, translation, code generation, question answering Widely accessible, strong general-purpose language understanding Can generate inaccurate or biased information, struggles with complex reasoning ChatGPT Plus subscription, API access
ChatGPT vs Gemini
ChatGPT vs Gemini

In-Depth Comparison of Grok 3 and ChatGPT

The latest AI models from Elon Musk’s xAI and OpenAI showcase significant differences in their core technologies, performance metrics, and real-world applications. These distinctions shape how each model handles complex tasks and interacts with users.

Architectural Differences

Grok 3 uses a transformer-based architecture with modifications that enable faster processing of long sequences. The model incorporates new attention mechanisms and sparse expert networks.

xAI developed custom optimizations for Grok 3’s neural pathways, allowing it to process context windows of up to 1 million tokens. This represents a major advancement over previous models.

The training dataset for Grok 3 includes real-time data from X (formerly Twitter), giving it access to current events and conversations. This differs from ChatGPT’s training cutoff date.

Performance Benchmarks

Language Understanding Tests:

  • Grok 3: 94.2% accuracy
  • ChatGPT: 92.8% accuracy

Code Generation Speed:

  • Grok 3: 1.2x faster than ChatGPT
  • Response time: 0.8 seconds average

Grok 3 shows superior performance in mathematical reasoning and coding tasks. Independent tests reveal a 15% improvement in solving complex programming challenges.

The model excels at real-time data analysis and current events discussion, though ChatGPT maintains an edge in creative writing tasks.

Advances in Reasoning Capabilities

Grok 3 implements new reasoning frameworks that combine symbolic logic with neural processing. This enables more accurate problem-solving in mathematics and science.

The model features enhanced memory retention across long conversations. It can reference earlier parts of discussions with greater accuracy than its predecessor.

ChatGPT still leads in nuanced understanding of context and social cues. Its responses show more consistent emotional intelligence in complex scenarios.

Impact on AI and Coding Communities

Software developers report 30% faster debugging sessions when using Grok 3’s code analysis features. The model’s ability to explain complex algorithms has improved knowledge sharing in tech communities.

DeepSeek and other AI researchers note Grok 3’s potential influence on future model architectures. Its innovations in attention mechanisms are already inspiring new research directions.

The competition between these models has accelerated the development of better coding tools and documentation generators. Both platforms now offer more specialized features for programmers.

Implications and Future of AI Development

The rapid advancement of AI models like Grok 3 signals major shifts in computing power, model architecture, and ethical considerations for artificial intelligence development.

Elon Musk’s Vision for AI

Musk’s development of Grok 3 through xAI demonstrates his commitment to creating AI systems that can match or exceed human intelligence. The Colossus supercluster, powered by 100,000 GPUs, shows unprecedented computational scale.

The focus on raw processing power marks a significant departure from traditional AI development approaches. Musk aims to push AI capabilities beyond current limitations.

His claims about Grok 3 being the “smartest AI on Earth” reflect an ambitious goal of achieving artificial general intelligence (AGI). This raises important questions about AI safety and control mechanisms.

The Role of Explainable AI (XAI)

XAI principles become crucial as AI models grow more powerful. Transparent decision-making processes help users understand how AI systems reach their conclusions.

Grok 3’s architecture incorporates explainability features that allow users to trace the reasoning behind its outputs. This transparency builds trust and enables better human-AI collaboration.

Modern XAI techniques include attention visualization, decision trees, and natural language explanations. These tools help developers identify and correct potential biases.

Next Steps in AI Pretraining and Model Building

Advanced pretraining methods use synthetic data and specialized computing clusters to improve model performance. The race between companies drives innovation in model architectures.

Key Technical Advances:

  • Multi-modal learning capabilities
  • Improved context windows
  • Enhanced reasoning abilities
  • Reduced training time

New benchmarks measure capabilities beyond traditional metrics like parameters and compute power. The focus shifts to practical applications and real-world problem-solving abilities.

Frequently Asked Questions

Grok 3 represents a significant advancement in AI capabilities, powered by 100,000 GPUs and introducing new approaches to learning and interaction that set it apart from existing models.

How does Grok 3 differ from ChatGPT in terms of capabilities?

Grok 3 operates with 10 times more computing power than its predecessor, utilizing the Colossus supercluster for enhanced processing capabilities.

The AI demonstrates advanced reasoning abilities and can process complex queries with greater speed and accuracy than previous models.

What advancements has Elon Musk’s AI introduced compared to ChatGPT?

Grok 3 leverages real-time data from X (formerly Twitter) for up-to-date responses and analysis.

The system incorporates advanced learning algorithms that allow it to adapt and improve based on user interactions.

Can Grok 3 be integrated into existing systems similarly to ChatGPT?

Grok 3 maintains compatibility with standard API protocols, enabling integration into various applications and platforms.

The system supports multiple programming languages and frameworks for seamless implementation.

What are the implications of Grok 3 for the future of AI development?

Grok 3’s advanced computing architecture sets new standards for AI processing power and efficiency.

The model’s enhanced capabilities push boundaries in natural language processing and machine learning.

In what ways is Grok 3’s approach to learning and interaction unique?

Grok 3 features a distinctive personality that reflects its creator’s vision for AI interaction.

The system employs novel training methods that combine traditional machine learning with innovative approaches to data processing.

How is Elon Musk planning to utilize Grok 3 in his businesses?

Integration plans include implementation across X platform for enhanced user engagement and content moderation.

The technology will support various Tesla initiatives, including autonomous driving systems and user interface improvements.

What Is Grok 3?

Grok 3 is the latest iteration of xAI’s groundbreaking large language model (LLM), developed under the leadership of Elon Musk. It represents a significant leap forward in AI capabilities, building upon the foundations laid by its predecessors and pushing the boundaries of what’s possible with artificial intelligence. Grok 3 isn’t just another chatbot; it’s designed with a focus on advanced reasoning, comprehensive knowledge, and real-time information access, setting it apart from many existing AI models.

One of Grok 3’s defining features is its enhanced reasoning engine. It’s not simply regurgitating information; it can analyze complex data, draw logical conclusions, and provide human-like explanations. This allows Grok 3 to tackle intricate problems in fields like mathematics, science, and coding with a level of proficiency that rivals, and in some cases surpasses, other leading AI models, including ChatGPT.

Furthermore, Grok 3 introduces “DeepSearch,” a revolutionary search engine that goes beyond traditional web indexing. DeepSearch crawls the vast expanse of the internet and the real-time conversations and information shared on X (formerly Twitter) to provide users with concise and relevant summaries for their research queries. This integration with X gives Grok 3 access to a constantly updated stream of information, making it particularly adept at understanding current events and trends.

Grok 3 offers users different levels of interaction through its “Think” and “Big Brain” functions. “Think” allows for quick queries and concise answers, while “Big Brain” is designed for more complex tasks requiring deeper analysis and more extensive responses. This tiered approach allows users to tailor their interaction with Grok 3 to the specific demands of their task.

Initially available to X Premium+ subscribers, Grok 3 is poised to become a standalone product through a “Super Grok” subscription. This move signals xAI’s intention to broaden access to Grok 3’s powerful capabilities and establish it as a key player in the evolving AI landscape. While still relatively new, Grok 3 is already making waves and raising the bar for what’s expected from advanced AI models.

How Do You Get Access to Grok 3?

Accessing the power of Grok 3 is currently tied to a subscription model, though xAI has indicated plans for broader availability in the future. Here’s a breakdown of the current access methods:

Current Access:

  • X Premium+ Subscription: Grok 3 is currently bundled with X’s highest-tier subscription service, X Premium+. Subscribing to X Premium+ grants you access to Grok 3’s capabilities directly within the X platform. This integration allows users to leverage Grok 3’s real-time information access and conversational abilities within the context of their X experience. It’s important to note that this access comes with the cost of the X Premium+ subscription, which has recently seen a price increase.

Future Access:

  • Super Grok Subscription: xAI has announced plans to offer a standalone Grok subscription called “Super Grok.” This subscription will provide access to Grok 3 through a dedicated app and website, independent of an X Premium+ subscription. This will likely make Grok 3 more accessible to users who are primarily interested in its AI capabilities and not necessarily the other features of X Premium+. Details regarding the pricing and specific features of the “Super Grok” subscription are expected to be released soon.

Important Considerations:

  • Pricing: Access to Grok 3, whether through X Premium+ or the upcoming “Super Grok” subscription, will involve a recurring fee. It’s crucial to consider the cost of these subscriptions when evaluating whether Grok 3 is the right AI tool for your needs.
  • Availability: While currently limited to X Premium+ subscribers, the introduction of the “Super Grok” subscription suggests that xAI aims to expand access to Grok 3. Keep an eye on official announcements from xAI for updates on availability and pricing.

In summary, while Grok 3 is currently tied to X Premium+, the upcoming “Super Grok” subscription promises to provide a more direct and potentially more affordable way to access this powerful AI. Staying informed about xAI’s announcements will be key to securing access to Grok 3 as it becomes more widely available.

Continue Reading

Noticias

Analizadores de análisis superiores: Pares de investigación profundos de Openai razonamiento de LLMS con trapo de agente para automatizar el trabajo y reemplazar trabajos

Published

on

Únase a nuestros boletines diarios y semanales para obtener las últimas actualizaciones y contenido exclusivo sobre la cobertura de IA líder de la industria. Obtenga más información


Las empresas empresariales deben tomar nota de la investigación profunda de OpenAI. Proporciona un poderoso producto basado en nuevas capacidades, y es tan bueno que podría dejar a mucha gente fuera de trabajo.

La investigación profunda está en el borde sangrado de una tendencia creciente: la integración de modelos de idiomas grandes (LLM) con motores de búsqueda y otras herramientas para expandir en gran medida sus capacidades. (Justo cuando se informó este artículo, por ejemplo, el XAI de Elon Musk presentó Grok 3, que reclama capacidades similares, incluido un producto de búsqueda profunda. Sin embargo, es demasiado pronto para evaluar el rendimiento del mundo real de Grok 3, ya que la mayoría de los suscriptores no han en realidad todavía lo conseguí).

La investigación profunda de Openai, lanzada el 3 de febrero, requiere una cuenta profesional con OpenAI, que cuesta $ 200 por mes, y actualmente está disponible solo para los usuarios de EE. UU. Hasta ahora, esta restricción puede tener comentarios tempranos limitados de la comunidad de desarrolladores globales, que generalmente se apresura a diseccionar nuevos avances de IA.

Con el modo de investigación profunda, los usuarios pueden hacer cualquier pregunta al modelo O3 líder de OpenAI. El resultado? Un informe a menudo superior a lo que producen los analistas humanos, entregado más rápido y a una fracción del costo.

Cómo funciona la investigación profunda

Si bien la investigación profunda se ha discutido ampliamente, sus implicaciones más amplias aún no se han registrado completamente. Las reacciones iniciales elogiaron sus impresionantes capacidades de investigación, a pesar de sus alucinaciones ocasionales en sus citas. Estaba el tipo que dijo que lo usó para ayudar a su esposa que tenía cáncer de seno. Proporcionó un análisis más profundo de lo que sus oncólogos proporcionaron sobre cómo la radioterapia era el curso de acción correcto, dijo. El consenso, resumido por el profesor de Wharton AI, Ethan Mollick, es que sus ventajas superan con creces las imprecisiones ocasionales, ya que la verificación de hechos lleva menos tiempo de lo que la IA salva en general. Esto es algo con lo que estoy de acuerdo, basado en mi propio uso.

Las instituciones financieras ya están explorando las solicitudes. BNY Mellon, por ejemplo, ve potencial en el uso de una investigación profunda para las evaluaciones de riesgos de crédito. Su impacto se extenderá entre las industrias, desde la atención médica hasta la gestión minorista, de fabricación y de la cadena de suministro, prácticamente cualquier campo que se basa en el trabajo de conocimiento.

Un agente de investigación más inteligente

A diferencia de los modelos de IA tradicionales que intentan respuestas de un solo disparo, la investigación profunda primero hace preguntas aclaratorias. Puede hacer cuatro o más preguntas para asegurarse de que comprenda exactamente lo que desea. Luego desarrolla un plan de investigación estructurado, realiza múltiples búsquedas, revisa su plan basado en nuevas ideas e itera en un bucle hasta que compila un informe integral y bien formato. Esto puede llevar entre unos minutos y media hora. Los informes varían de 1,500 a 20,000 palabras, y generalmente incluyen citas de 15 a 30 fuentes con URL exactas, al menos de acuerdo con mi uso durante la última semana y media.

La tecnología detrás de la investigación profunda: razonamiento LLMS y el trapo de agente

La investigación profunda hace esto fusionando dos tecnologías de una manera que no hemos visto antes en un producto de mercado masivo.

LLMS de razonamiento: El primero es el modelo de vanguardia de OpenAI, O3, que conduce en un razonamiento lógico y procesos extendidos de la cadena de pensamiento. Cuando se anunció en diciembre de 2024, el O3 obtuvo un 87.5% sin precedentes en el punto de referencia SUPER-DIFFICTULT ARC-AGI diseñado para probar nuevas habilidades de resolución de problemas. Lo interesante es que O3 no se ha lanzado como un modelo independiente para que los desarrolladores lo usen. De hecho, el CEO de OpenAI, Sam Altman, anunció la semana pasada que el modelo en cambio estaría envuelto en un sistema de “inteligencia unificada”, que uniría modelos con herramientas de agente como la búsqueda, los agentes de codificación y más. La investigación profunda es un ejemplo de dicho producto. Y aunque competidores como Deepseek-R1 se han acercado a las capacidades de O3 (una de las razones por las que había tanta emoción hace unas semanas), OpenAi todavía se considera ampliamente que está ligeramente por delante.

Trapo de agente: El segundo, Agentic Rag, es una tecnología que ha existido durante aproximadamente un año. Utiliza agentes para buscar información autónoma y contexto de otras fuentes, incluida la búsqueda de Internet. Esto puede incluir otros agentes de llamas de herramientas para encontrar información no WEB a través de API; agentes de codificación que pueden completar secuencias complejas de manera más eficiente; y búsquedas en la base de datos. Inicialmente, la investigación profunda de OpenAI está buscando principalmente en la web abierta, pero los líderes de la compañía han sugerido que podría buscar más fuentes con el tiempo.

La ventaja competitiva de OpenAI (y sus límites)

Si bien estas tecnologías no son completamente nuevas, las refinamientos de OpenAI, habilitados por cosas como su inicio de trabajo en trabajar en estas tecnologías, fondos masivos y su modelo de desarrollo de código cerrado, han llevado a una investigación profunda a un nuevo nivel. Puede funcionar a puerta cerrada y aprovechar los comentarios de los más de 300 millones de usuarios activos del popular producto CHATGPT de Openai. Operai ha liderado en investigación en estas áreas, por ejemplo, en cómo hacer verificación paso a paso para obtener mejores resultados. Y ha implementado claramente la búsqueda de una manera interesante, tal vez tomando prestado de Microsoft’s Bing y otras tecnologías.

Si bien todavía está alucinando algunos resultados de sus búsquedas, lo hace menos que los competidores, tal vez en parte porque el modelo O3 subyacente ha establecido una industria baja para estas alucinaciones al 8%. Y hay formas de reducir aún más los errores, mediante el uso de mecanismos como umbrales de confianza, requisitos de citas y otras verificaciones de credibilidad sofisticadas.

Al mismo tiempo, hay límites para el liderazgo y las capacidades de OpenAi. Dentro de los dos días del lanzamiento de Deep Research, Huggingface presentó un agente de investigación de IA de código abierto llamado Open Deep Research que obtuvo resultados que no estaban muy lejos de la de OpenAi, de manera similar, fusionando modelos líderes y capacidades de agente disponibles gratuitamente. Hay pocos focos. Los competidores de código abierto como Deepseek parecen mantenerse cerca en el área de los modelos de razonamiento, y Magentic-One de Microsoft ofrece un marco para la mayoría de las capacidades de agente de OpenAI, por nombrar solo dos ejemplos más.

Además, la investigación profunda tiene limitaciones. El producto es realmente eficiente para investigar información oscura que se puede encontrar en la web. Pero en áreas donde no hay mucho en línea y donde la experiencia en el dominio es en gran medida privada, ya sea en las cabezas de las personas o en bases de datos privadas, no funciona en absoluto. Por lo tanto, esto no va a amenazar los trabajos de los investigadores de fondos de cobertura de alta gama, por ejemplo, a quienes se les paga para hablar con expertos reales en una industria para encontrar información muy difícil de Obtain, como argumentó Ben Thompson En una publicación reciente (ver gráfico a continuación). En la mayoría de los casos, la investigación profunda de OpenAI afectará a los trabajos de analistas más bajos y calificados.

El valor de Deep Research primero aumenta a medida que la información en línea se vuelve escasa, luego cae cuando se vuelve realmente escaso. Fuente: Stratechery.

El producto más inteligente hasta ahora

Cuando fusiona el razonamiento de primer nivel con la recuperación de agente, no es realmente sorprendente que obtenga un producto tan poderoso. La investigación profunda de Openai logró un 26,6% en el último examen de la humanidad, posiblemente el mejor punto de referencia para la inteligencia. Este es un punto de referencia de IA relativamente nuevo diseñado para ser el más difícil de completar para cualquier modelo de IA, que cubra 3.000 preguntas en 100 sujetos diferentes. En este punto de referencia, la investigación profunda de OpenAI supera significativamente la investigación profunda de Perplexity (20.5%) y modelos anteriores como O3-Mini (13%) y Deepseek-R1 (9.4%) que no estaban conectados con trapo de agente. Pero las primeras revisiones sugieren clientes potenciales abiertos tanto en calidad como en profundidad. La investigación profunda de Google aún no se ha probado con este punto de referencia, pero las primeras revisiones sugieren clientes potenciales de calidad y profundidad.

Cómo es diferente: la primera IA del mercado masivo que podría desplazar los trabajos

Lo que es diferente con este producto es su potencial para eliminar los empleos. Sam Witteveen, cofundador de Red Dragon y desarrollador de agentes de IA, observó en una discusión de video de inmersión profunda conmigo que mucha gente va a decir: “Solía ​​mierda, puedo obtener estos informes por $ 200 que podría obtener de los que podría obtener una compañía de consultoría entre 4 mejores que me costarían $ 20,000 ”. Esto, dijo, causará algunos cambios reales, incluido probablemente dejar a las personas fuera de los trabajos.

Lo que me lleva de vuelta a mi entrevista la semana pasada con Sarthak Pattanaik, Jefe de Ingeniería e IA en BNY Mellon, un importante banco estadounidense.

Sin duda, Pattanaik no dijo nada sobre las ramificaciones del producto para los recuentos de trabajos reales en su banco. Ese será un tema particularmente sensible que cualquier empresa probablemente rehuya abordar públicamente. Pero dijo que podía ver que la investigación profunda de OpenAI se utilice para informes de suscripción de crédito y otras actividades de “línea superior”, y que tenga un impacto significativo en una variedad de trabajos: “Ahora eso no afecta a cada trabajo, pero eso afecta a un conjunto de empleos alrededor de la estrategia [and] Investigación, como la gestión de los proveedores de comparación, comparación del producto A versus producto B “. Agregó: “Así que creo que todo lo que está más en el sistema dos pensamientos: más exploratorio, donde puede no tener una respuesta correcta, porque la respuesta correcta se puede montar una vez que tenga esa definición de escenario, creo que es una oportunidad”.

Una perspectiva histórica: pérdida de empleo y creación de empleo

Las revoluciones tecnológicas han desplazado históricamente a los trabajadores a corto plazo mientras crean nuevas industrias a largo plazo. Desde automóviles que reemplazan los carruajes tirados por caballos hasta las computadoras que automatizan el trabajo administrativo, los mercados laborales evolucionan. Las nuevas oportunidades creadas por las tecnologías disruptivas tienden a generar una nueva contratación. Las empresas que no adoptan estos avances se quedarán atrás de sus competidores.

Altman de OpenAI reconoció el vínculo, incluso si es indirecto, entre investigaciones profundas y mano de obra. En la cumbre de IA en París la semana pasada, se le preguntó sobre su visión de inteligencia general artificial (AGI), o la etapa en la que AI puede realizar casi cualquier tarea que un humano pueda. Como respondió, su primera referencia fue una investigación profunda: “Creo que es un modelo capaz de hacer como un porcentaje de bajo dígito de todas las tareas en la economía en el mundo en este momento, que es una declaración loca, y Hace un año no creo que algo que la gente pensara vendrá “. (Ver minuto tres de este video). Continuó: “Por 50 centavos de cómputo, puede hacer como $ 500 o $ 5,000 de trabajo. Las empresas están implementando eso para ser mucho más eficientes “.

La comida para llevar: una nueva era para el trabajo de conocimiento

Deep Research representa un momento decisivo para la IA en las industrias basadas en el conocimiento. Al integrar el razonamiento de vanguardia con capacidades de investigación autónoma, OpenAi ha creado una herramienta que es más inteligente, más rápida y significativamente más rentable que los analistas humanos.

Las implicaciones son enormes, desde servicios financieros hasta atención médica hasta toma de decisiones empresariales. Las organizaciones que aprovechan esta tecnología de manera efectiva obtendrán una ventaja competitiva significativa. Aquellos que lo ignoran lo hacen bajo su riesgo.

Para una discusión más profunda sobre cómo funciona la investigación profunda de OpenAI, y cómo funciona el conocimiento, consulte mi conversación en profundidad con Sam Witteveen en nuestro último video:

https://www.youtube.com/watch?v=3m3qcf_ptdc

Continue Reading

Noticias

¿Chatgpt nos reemplazará? – Revista Mishpacha

Published

on

Presionar botones para producir escritos robará a una persona de la capacidad de conectarse con su propia alma y con otra Tzelem Elokim

W

Salieron las computadoras, la gente se maravilló de su capacidad para calcular tan rápido y tan perfectamente. Pero aunque los humanos se enorgullecen de sus habilidades de pensamiento, nadie realmente se sintió intimidado por las computadoras. Después de todo, eran solo máquinas.

Incluso cuando sus capacidades superaron los cálculos matemáticos simples y comenzaron a sintetizar información para proporcionar predicciones y evaluaciones, todavía no estábamos terriblemente preocupados. Lo reconocimos como nada más que una aplicación de nivel superior del mismo tipo de cálculo.

Pero luego chatgpt golpeó. Y ahora de repente las computadoras nos están hablando. Y preparar discursos y escribir cartas que suenan terriblemente como humanos. La gramática y el uso del idioma son excelentes, y las frases y el contenido suenan tranquilizadoramente familiares y apropiados. Los profesores deben usar programas cada vez más sofisticados para enganchar documentos producidos por ChatGPT. Algunas escuelas incluso exigen que las tareas escritas solo se puedan hacer en la escuela, frente al personal. Muchas compañías ahora responderán de manera rutinaria a su correo utilizando un programa de chat.

De repente, no estamos tan seguros de nosotros mismos. Discurso, que es nuestra característica humana más definitoria (ver Onkelos Bereishis 2: 7, y citado en muchos Seforim; ver Maharsha y Maharal, Shabat 33a), está siendo generado por una máquina. Esto parece socavar nuestro sentido de la humanidad. No es solo una sensación desconcertante, sino también, prueba nuestra creencia central en la existencia de la neshamah y el concepto de Tzelem Elokim.

Así que comencemos comprendiendo el concepto de “discurso” desde la perspectiva de la Torá. A primera vista, el concepto de habla como la calidad definitoria del hombre parece desconcertante. ¿No valoramos la sabiduría y la inteligencia por encima del discurso?

El Maharal (Nesivos Olam, Nesiv Halashon) explica que el significado único del habla es que es la única facultad humana que es “doble capas”. Cuando una persona habla, las palabras son realidades físicas que definen elementos físicos. Pero también podemos escuchar el alma de la persona que se proyecta a través de las palabras. Una persona puede describirnos su difícil situación o su alegría. Las palabras describen las realidades físicas de un evento en particular, pero su “discurso” en su forma holística nos transmite cómo la persona está experimentando ese evento.

Esta capacidad de expresar nuestra esencia a través del discurso se debe a la Tzelem Elokim (Imagen divina) en la que fue creado el hombre. Las “palabras” de Hashem crearon el mundo; Cada acto de creación comienza con las palabras “y Hashem dijo”. Sin embargo, la creación del hombre tiene una descripción única: “e infundió en la fosa nasal de un alma viviente”. El Zohar Famoso enfatiza que la respiración emana de la esencia misma de la persona. Por lo tanto, al crear el hombre, Hashem lo infundió con alguna parte de su propia esencia divina. Si bien el concepto de la Divina Spark en el hombre es un concepto cabalístico muy profundo, entendemos por esto que la respiración inherente en cada palabra hablada lleva parte de la esencia del hablante.

Esto es cierto para Hashem, y debido a que somos creados a la imagen divina, es cierto para nosotros en nuestro propio mundo. Cuando hablamos, estamos involucrados en una actividad de doble capa. Articulamos palabras que son descripciones físicas de alguna materia u otra, y hasta cierto punto infundimos esas palabras con un alma, una chispa de nuestra propia esencia.

También vemos esta dinámica en el trabajo en la transmisión de la Torá en Har Sinai. La primera palabra de la Torá que hashem pronunció fue Anochi. Chazal Teach (Shabat 105a) que Anochi es un acrónimo de “Mi esencia me puse en este escrito, y te lo di”. Esto significa que no solo las palabras de la Torá describen la realidad espiritual, sino también, al escuchar y estudiar la Torá, nuestras almas se conectan en algún nivel con la fuente divina de las palabras.

Las personas que poseían esa calidad podían infundir las palabras más simples con extraordinarias neshamah.

El Gabbai del Rebe de Kotzker una vez llegó a él, advirtiendo: “¡Rebe, Rebe! ¡Alguien acaba de robar el abrigo del Rebe!

El Rebe rugió: “¿Qué quieres decir? robó? No dice Lo signov?! “

El Gabbai escribe que durante años después, el Rebe no pudo entender cómo alguien podría robar (Harebbe mi’kotzkYitzchak Alfasi, p. 191).

En el Hesped de Rav Chatzkel Levenstein, Rav Wolbe dijo: “Cuando Rav Chatzkel dijo Bircas Hamazon, como dijo,”b’chein, b’chesed, uv’rachamim, ‘ uno podía sentirse palpablemente el Chein, el quitado, y el Rachamimcon el cual Hashem alimenta un mundo hambriento “.

El propio Rav Wolbe, en su introducción a Alei Shur, Describe la profunda influencia que su rebbi, Rav Yerucham Levitz, tuvo sobre él. Describe a su rebbi como alguien “cuyas mismas palabras infundieron la vida en … un mero cadáver [mechayeh meisim b’maamaro]. ” Él escribe que las enseñanzas de su Rebbi impregnan al Sefer. Luego agrega: “Si alguien se siente particularmente elevado o conmovido por cualquier parte del Sefer, es un eco de la voz de Rav Yerucham Levovitz que reverbere en esas palabras”.

Este es el mundo del discurso en su perfección divina: un cuerpo muy definido, infundido con una espiritualidad que emana del núcleo del alma humana.

Pero podemos hacer mal uso de esta habilidad terriblemente y destruirla. El Gemara (Pesqués 113b, y otros lugares) define el discurso insincero como “uno [thing] en la boca, uno [thing] en el corazón ”(Echad B’Peh, V’echad B’lev). Esto no significa necesariamente que las palabras son técnicamente falsas. Más bien, que no son sinceros. No emanan desde el núcleo de la esencia de la persona. Son huecos y sin lugar de cualquier elemento del alma. Las palabras que son halagos, chorleas, sin sentido, etc., son ejemplos de ese fenómeno.

Una máquina no tiene alma y nunca tendrá una. Puede reciclar frases encantadoras de un vasto grupo de palabras y escritos, pero no puede hacer más que eso.

Entonces, si nos preguntáramos qué hay de malo en Chatgpt, seríamos negligentes al ir al kefirá y shmutz explicaciones. Mucho más importante es que nos roba de nuestra humanidad central, nuestra misma Tzelem Elokim. Expresarnos a nosotros mismos es un ejercicio para enfrentarse con sentimientos internos por un lado, y por otro lado, conectando con nuestro prójimo “esencia a la esencia”.

Necesitamos educar a nuestros hijos día tras día que se están robando su mayor facultad humana al recurrir a Chatgpt para escribir sus tareas y ensayos. Así como un niño que se vería obligado a usar solo dispositivos mecánicos para moverse pronto experimentaría músculos atrofiados y perdería su capacidad de caminar, así también, presionar los botones para producir escritos robará a una persona de una facultad aún más importante que caminar: La capacidad de conectarse con su propia alma y con otra Tzelem Elokim.

Volvamos a nuestra pregunta original: “¿Chat GPT nos reemplazará alguna vez?” Todo depende: si expresamos nuestra esencia espiritual a través del discurso y la escritura, no existe la menor posibilidad de que pueda reemplazarnos de ninguna manera. Pero si aprendemos a repetir sin pensar tópicos y declaraciones pro forma, sutilezas y palabras huecas, entonces las máquinas ciertamente nos reemplazarán en poco tiempo.

Y harán un trabajo mucho mejor.

(Originalmente aparecido en Mishpacha, número 1050)

¡Ups! No pudimos localizar su forma.

Continue Reading

Trending