Noticias
No necesitas la inteligencia de Apple, cualquiera puede usar ChatGPT en Siri

Conclusiones clave
- Siri utiliza ChatGPT para consultas complejas en modelos de iPhone con Apple Intelligence.
- Los iPhone más antiguos pueden acceder a ChatGPT a través de Siri instalando la aplicación ChatGPT y usando la frase “Pregunta a ChatGPT”.
- Los usuarios pueden crear atajos en la aplicación Atajos para que ChatGPT utilice modelos específicos o funciones de búsqueda en Siri.
Si su iPhone es compatible con Apple Intelligence, Siri puede recurrir a ChatGPT en busca de ayuda en caso de que el asistente de Apple no pueda responder una consulta por sí mismo. Pero resulta que puedes hacer lo mismo en cualquier iPhone, simplemente usando una simple frase.
Cómo Siri usa ChatGPT con Apple Intelligence
Si está utilizando un iPhone 15 Pro, iPhone 15 Pro Max o cualquier modelo de iPhone 16, su teléfono es capaz de ejecutar Apple Intelligence. Esto significa que en iOS 18.2, Siri puede obtener ayuda de ChatGPT para responder consultas que aún están más allá de las capacidades de Siri.
Por ejemplo, si le preguntas a Siri cómo está el clima, obtendrás una respuesta sin necesidad de que ChatGPT te ayude. Sin embargo, si pides algo más complejo o creativo, como pedir escribir una quintilla, aparecerá una notificación preguntándote si estás dispuesto a usar ChatGPT para cumplir con la solicitud.
Si toca “Usar ChatGPT”, la consulta se enviará a los servidores de OpenAI y se generará una respuesta utilizando ChatGPT. Seguirá apareciendo en la pantalla y se leerá en voz alta como si la respuesta fuera de Siri.
En un mundo ideal, Apple habría desarrollado su propio y potente modelo de IA generativa que podría utilizar para potenciar a Siri sin necesidad de depender de otros chatbots. Sin embargo, como compromiso actual, la adición de ChatGPT a Siri es muy útil, ya que le permite responder consultas mucho más complejas que el procesamiento en el dispositivo por sí solo.
Cómo hacer que Siri use ChatGPT en iPhones más antiguos
Si tienes un iPhone antiguo que no es compatible con Apple Intelligence, es posible que te sientas un poco celoso de que algunos usuarios de iPhone puedan acceder a ChatGPT a través de Siri cuando tú no puedes. Bueno, resulta que esto no es cierto. Incluso si estás usando un iPhone antiguo que no puede ejecutar Apple Intelligence, aún puedes usar ChatGPT dentro de Siri, y es increíblemente sencillo de hacer.
La experiencia es muy similar a cómo funciona en Apple Intelligence, y todo lo que requiere es descargar e instalar la aplicación ChatGPT desde la App Store. Este método funcionará con una cuenta gratuita, pero deberás iniciar sesión en la aplicación ChatGPT.
Una vez que hayas hecho eso, activa Siri manteniendo presionado el botón lateral o de inicio en tu iPhone, o diciendo “Hola Siri”. Cuando Siri se despierte, diga “Preguntar a ChatGPT”. Deberías ver aparecer un mensaje en tu pantalla preguntándote si deseas activar los accesos directos de ChatGPT con Siri. Toca “Activar” para confirmar.
Activa Siri nuevamente y di “Pregunta a ChatGPT”. Siri ahora debería preguntarte sobre qué quieres preguntarle a ChatGPT. Di tu solicitud, tal como lo harías con Siri, como “Escríbeme una quintilla”. Después de unos momentos, la respuesta generada por ChatGPT debería aparecer en la pantalla y Siri la leerá en voz alta.
Cada vez que desee que ChatGPT genere una respuesta en lugar de Siri, simplemente inicie Siri y diga “Preguntar a ChatGPT” y su solicitud se pasará al chatbot de IA para que la maneje, al igual que con Apple Intelligence.
Tenga cuidado al instalar la aplicación ChatGPT desde App Store. Hay muchas aplicaciones con nombres y logotipos similares que aparecen en los resultados de búsqueda. La aplicación oficial ChatGPT se llama simplemente “ChatGPT”.
Cree un acceso directo para que ChatGPT use un modelo específico en Siri
ChatGPT viene en una variedad de modelos, algunos de los cuales son más útiles para diferentes tipos de consultas. Por ejemplo, el modelo de vista previa o1 razona mejor y puede indicar cuántas veces aparece la letra R en la palabra fresa, mientras que la mayoría de los demás modelos obtienen la respuesta incorrecta.
El uso de “Preguntar a ChatGPT” parece ser el uso predeterminado de GPT-4. Si desea utilizar un modelo diferente, puede crear un acceso directo personalizado en la aplicación Accesos directos que ejecutará el modelo específico que seleccione. Necesitará una suscripción para acceder a algunos modelos de ChatGPT.
Abra la aplicación Atajos y toque el ícono “+” en la esquina superior derecha de la pantalla para crear un nuevo atajo. Toque “Buscar acciones”, escriba “Solicitar” y seleccione la acción “Solicitar información”. Toca “Preguntar” y escribe “¿Qué te gustaría preguntar?”
Toca “Acciones de búsqueda” nuevamente, escribe “Preguntar a ChatGPT” y toca el modelo que deseas usar. Toca “Mensaje” y selecciona “Solicitar información”. Esto tomará el texto de su consulta y se lo pasará al modelo seleccionado para que responda.
Toca el nombre del acceso directo en la parte superior de la pantalla y selecciona “Cambiar nombre”. Dale al atajo un nombre que sea fácil de recordar y que se lo pregunte a Siri y toca “Listo” para guardar el atajo.
El acceso directo completo debería verse como la imagen a continuación, con “o1-preview” reemplazada por el modelo que haya seleccionado.
Activa Siri y di el nombre de tu atajo. Se le preguntará lo que desea preguntar. Exprese su consulta y se pasará al modelo elegido de ChatGPT. La respuesta aparecerá en la pantalla y Siri la leerá en voz alta.
Cree un acceso directo para que ChatGPT utilice la búsqueda en Siri
Si tiene una suscripción a ChatGPT, también puede utilizar ChatGPT Search en la aplicación ChatGPT. Esta función busca en la web para proporcionar respuestas, con enlaces a las páginas web que se utilizaron para proporcionar la información. Puedes crear un acceso directo que obligue a ChatGPT a utilizar la búsqueda de ChatGPT, siempre que tengas una suscripción.
Abra la aplicación Atajos y toque el ícono “+” en la esquina superior derecha de la pantalla para crear un nuevo atajo. Toque “Buscar acciones”, escriba “Solicitar” y seleccione la acción “Solicitar información”. Toca “Preguntar” y escribe “¿Qué te gustaría preguntar?”
Toca “Acciones de búsqueda” nuevamente, escribe “Preguntar a ChatGPT” y toca el modelo que deseas usar. Toca “Mensaje” y escribe “Usa la búsqueda para responder a esto y no incluyas imágenes ni enlaces”:
Sin salir de la acción “Preguntar a ChatGPT”, seleccione “Solicitar información”. Esto tomará el texto de su consulta y lo pasará a ChatGPT con instrucciones para usar la función de búsqueda de ChatGPT.
Toca el nombre del acceso directo en la parte superior de la pantalla y toca “Cambiar nombre”. Asigne al acceso directo un nombre memorable que sea fácil de preguntarle a Siri y toque “Listo” para guardar el acceso directo.
Su acceso directo completo debería verse como la imagen a continuación con “GPT-4o” reemplazado por el modelo que seleccionó.
Active Siri, diga el nombre de su acceso directo y Siri le pedirá su mensaje. Dígalo en voz alta y se utilizará la búsqueda de ChatGPT para responder al mensaje. La respuesta aparecerá en su pantalla y se leerá en voz alta.
Incluir la instrucción de no incluir imágenes o enlaces puede ayudar a que el texto sea más adecuado para que Siri lo lea, ya que las imágenes se devolverán como una URL que Siri intentará leer en voz alta. Es posible que aún encuentres que las fuentes de la respuesta se agregan al final.
La integración de ChatGPT en Siri fue aclamada como una de las grandes características cuando Apple Intelligence se reveló por primera vez en la WWDC 24. Sin embargo, resulta que es posible obtener casi la misma experiencia en cualquier iPhone, simplemente usando la frase “Pregunta a ChatGPT”. “.
Es un motivo menos para sentir celos cada vez que ves a alguien con un iPhone 16.
Noticias
Grok 3 vs ChatGPT: A Head-to-Head Comparison

The world of artificial intelligence (AI) has become increasingly competitive, and the latest development in this arena is Elon Musk’s xAI unveiling Grok 3. With bold claims like being the “Smartest AI on Earth,” Grok 3 aims to challenge OpenAI’s ChatGPT for the top spot. Grok 3 has been trained on xAI’s Colossus supercluster, equipped with 100,000 GPUs, delivering over ten times the computational power of its predecessor, Grok 2.
But how does Grok 3 truly compare to OpenAI’s ChatGPT? In this head-to-head comparison, we’ll evaluate their performance, features, accessibility, user experience, and potential applications to help you understand which model best suits your needs.
1. Performance and Capabilities
The foundation of any AI model lies in its performance and computational capabilities. Grok 3 and ChatGPT approach this differently, with xAI focusing on reasoning power and OpenAI emphasizing versatility.
Feature | Grok 3 (xAI) | ChatGPT (OpenAI) |
---|---|---|
Training Infrastructure | 100,000 GPUs on Colossus Supercluster | OpenAI Supercluster with advanced TPUs |
Core Strength | Advanced reasoning and problem-solving | Human-like conversation and text generation |
Unique Modes | “Think” (step-by-step reasoning) & “Big Brain” (intensive tasks) | No distinct modes; context-aware completion |
Benchmark Performance | Outperforms competitors in math & science | Strong performance across language tasks |
Language Models | Grok-3 LLM | GPT-4 and GPT-3.5 |
Grok 3 stands out in its problem-solving capabilities. Its “Think” mode allows users to see the step-by-step reasoning process, which enhances trust and clarity, particularly for research and educational tasks. Meanwhile, ChatGPT remains the industry leader in natural conversation, content creation, and multilingual communication.
2. Accessibility and Pricing
The cost and availability of these AI models can significantly impact their adoption rates.
Aspect | Grok 3 (xAI) | ChatGPT (OpenAI) |
---|---|---|
Free Tier | Limited within X (formerly Twitter) | Available (GPT-3.5) |
Premium Tier | $40/month (X Premium Plus) | $20/month (ChatGPT Plus) |
Specialized Access | $30/month for “SuperGrok” | Enterprise plans for API access |
Platform Availability | Integrated into X app | OpenAI web interface, mobile apps |
While ChatGPT’s pricing structure remains more accessible for most users, xAI has strategically integrated Grok 3 within the X ecosystem, making it a natural extension for social media users who already engage with the platform regularly.
3. User Experience and Interface
The experience of interacting with an AI model often determines how regularly users return to it.
- Grok 3: Focuses on transparency with its “Think” mode, showing how the AI arrives at its conclusions. The interface is minimalistic and built into the X platform, ensuring easy access for subscribers.
- ChatGPT: Provides a seamless and straightforward interface across both web and mobile applications. OpenAI has continuously refined ChatGPT to make conversations more intuitive, with context-aware responses and memory features.
Verdict: If you’re an X user who values detailed explanations, Grok 3 offers an intriguing edge. For general-purpose interactions, ChatGPT remains more accessible.

4. Core Technology and Innovations
AI models are only as good as the architectures and innovations behind them.
Technology | Grok 3 (xAI) | ChatGPT (OpenAI) |
---|---|---|
LLM Architecture | Proprietary LLM with Grok-3 | GPT-4 (current) and GPT-3.5 |
Training Dataset | xAI’s proprietary dataset with a focus on logical reasoning | Trained on diverse internet content |
Optimization Focus | Mathematical reasoning and scientific tasks | Language comprehension and text generation |
Integration Tools | Deep Search Engine, X integration | OpenAI API, ChatGPT Plugins |
Grok 3 emphasizes advanced reasoning, targeting professionals in research, engineering, and education. ChatGPT maintains its dominance in general-purpose AI tasks, including customer service, content creation, and educational assistance.
5. Real-World Applications and Use Cases
Application Area | Grok 3 (xAI) | ChatGPT (OpenAI) |
---|---|---|
Social Media Integration | Seamlessly integrated with X | Limited third-party integrations |
Educational Tools | Strong in STEM education and problem-solving | Widely used for language learning |
Content Creation | Decent, with an analytical tone | Strong creative writing capabilities |
Business Applications | Limited enterprise tools currently | Extensive enterprise adoption |
Grok 3 positions itself as the go-to model for users seeking deep analytical capabilities, especially in scientific and technical domains. ChatGPT, on the other hand, excels in more diverse applications, including marketing, customer engagement, and creative writing.
6. Community and Ecosystem
- Grok 3: Heavily reliant on the X platform, xAI has started attracting researchers and AI enthusiasts who appreciate its advanced reasoning capabilities.
- ChatGPT: OpenAI enjoys a more expansive ecosystem, with a large developer community leveraging its API for various applications and integrations.
Long-Term Potential: xAI plans to open-source Grok 2 in the coming months, potentially spurring community involvement and model improvement. OpenAI already benefits from robust community contributions and research.
Which AI Is Right for You?
Both Grok 3 and ChatGPT offer compelling features but cater to different audiences:
- Choose Grok 3 if you prioritize logical reasoning, STEM applications, and are already part of the X ecosystem.
- Choose ChatGPT if you need versatile, human-like conversations and value an established, community-supported AI.
The future of AI remains dynamic, with Grok 3 pushing boundaries in computational power and reasoning while ChatGPT maintains its lead in accessibility and creativity. As these models continue evolving, the best choice will depend on your specific needs and how each platform adapts to user feedback in this fast-paced AI race.
Key Takeaways
- Grok 3 features 10X more computing power than previous versions
- The AI assistant combines massive computational resources with a unique personality
- The competition between Grok 3 and ChatGPT signals a new phase in AI development
Grok vs Gemini vs ChatGPT
Here is a table comparing the latest models from xAI (Grok 3), Gemini (2.0), and ChatGPT:
Model | Developer | Key Features | Strengths | Weaknesses | Accessibility |
---|---|---|---|---|---|
Grok 3 | xAI | Advanced reasoning, DeepSearch integration with X, “Think” and “Big Brain” functions | Strong in math, science, and coding, real-time information access, human-like reasoning | Currently limited accessibility, tied to X ecosystem, relatively new and untested | X Premium+ subscription, upcoming “Super Grok” subscription |
Gemini 2.0 | Multimodal capabilities (text, images, video, audio), improved efficiency and scalability | Versatile across various modalities, handles complex tasks efficiently | Potential bias and ethical concerns, requires significant computational resources | Google AI Studio, Bard interface, API access | |
ChatGPT (latest) | OpenAI | Conversational AI, text generation, translation, code generation, question answering | Widely accessible, strong general-purpose language understanding | Can generate inaccurate or biased information, struggles with complex reasoning | ChatGPT Plus subscription, API access |

In-Depth Comparison of Grok 3 and ChatGPT
The latest AI models from Elon Musk’s xAI and OpenAI showcase significant differences in their core technologies, performance metrics, and real-world applications. These distinctions shape how each model handles complex tasks and interacts with users.
Architectural Differences
Grok 3 uses a transformer-based architecture with modifications that enable faster processing of long sequences. The model incorporates new attention mechanisms and sparse expert networks.
xAI developed custom optimizations for Grok 3’s neural pathways, allowing it to process context windows of up to 1 million tokens. This represents a major advancement over previous models.
The training dataset for Grok 3 includes real-time data from X (formerly Twitter), giving it access to current events and conversations. This differs from ChatGPT’s training cutoff date.
Performance Benchmarks
Language Understanding Tests:
- Grok 3: 94.2% accuracy
- ChatGPT: 92.8% accuracy
Code Generation Speed:
- Grok 3: 1.2x faster than ChatGPT
- Response time: 0.8 seconds average
Grok 3 shows superior performance in mathematical reasoning and coding tasks. Independent tests reveal a 15% improvement in solving complex programming challenges.
The model excels at real-time data analysis and current events discussion, though ChatGPT maintains an edge in creative writing tasks.
Advances in Reasoning Capabilities
Grok 3 implements new reasoning frameworks that combine symbolic logic with neural processing. This enables more accurate problem-solving in mathematics and science.
The model features enhanced memory retention across long conversations. It can reference earlier parts of discussions with greater accuracy than its predecessor.
ChatGPT still leads in nuanced understanding of context and social cues. Its responses show more consistent emotional intelligence in complex scenarios.
Impact on AI and Coding Communities
Software developers report 30% faster debugging sessions when using Grok 3’s code analysis features. The model’s ability to explain complex algorithms has improved knowledge sharing in tech communities.
DeepSeek and other AI researchers note Grok 3’s potential influence on future model architectures. Its innovations in attention mechanisms are already inspiring new research directions.
The competition between these models has accelerated the development of better coding tools and documentation generators. Both platforms now offer more specialized features for programmers.
Implications and Future of AI Development
The rapid advancement of AI models like Grok 3 signals major shifts in computing power, model architecture, and ethical considerations for artificial intelligence development.
Elon Musk’s Vision for AI
Musk’s development of Grok 3 through xAI demonstrates his commitment to creating AI systems that can match or exceed human intelligence. The Colossus supercluster, powered by 100,000 GPUs, shows unprecedented computational scale.
The focus on raw processing power marks a significant departure from traditional AI development approaches. Musk aims to push AI capabilities beyond current limitations.
His claims about Grok 3 being the “smartest AI on Earth” reflect an ambitious goal of achieving artificial general intelligence (AGI). This raises important questions about AI safety and control mechanisms.
The Role of Explainable AI (XAI)
XAI principles become crucial as AI models grow more powerful. Transparent decision-making processes help users understand how AI systems reach their conclusions.
Grok 3’s architecture incorporates explainability features that allow users to trace the reasoning behind its outputs. This transparency builds trust and enables better human-AI collaboration.
Modern XAI techniques include attention visualization, decision trees, and natural language explanations. These tools help developers identify and correct potential biases.
Next Steps in AI Pretraining and Model Building
Advanced pretraining methods use synthetic data and specialized computing clusters to improve model performance. The race between companies drives innovation in model architectures.
Key Technical Advances:
- Multi-modal learning capabilities
- Improved context windows
- Enhanced reasoning abilities
- Reduced training time
New benchmarks measure capabilities beyond traditional metrics like parameters and compute power. The focus shifts to practical applications and real-world problem-solving abilities.
Frequently Asked Questions
Grok 3 represents a significant advancement in AI capabilities, powered by 100,000 GPUs and introducing new approaches to learning and interaction that set it apart from existing models.
How does Grok 3 differ from ChatGPT in terms of capabilities?
Grok 3 operates with 10 times more computing power than its predecessor, utilizing the Colossus supercluster for enhanced processing capabilities.
The AI demonstrates advanced reasoning abilities and can process complex queries with greater speed and accuracy than previous models.
What advancements has Elon Musk’s AI introduced compared to ChatGPT?
Grok 3 leverages real-time data from X (formerly Twitter) for up-to-date responses and analysis.
The system incorporates advanced learning algorithms that allow it to adapt and improve based on user interactions.
Can Grok 3 be integrated into existing systems similarly to ChatGPT?
Grok 3 maintains compatibility with standard API protocols, enabling integration into various applications and platforms.
The system supports multiple programming languages and frameworks for seamless implementation.
What are the implications of Grok 3 for the future of AI development?
Grok 3’s advanced computing architecture sets new standards for AI processing power and efficiency.
The model’s enhanced capabilities push boundaries in natural language processing and machine learning.
In what ways is Grok 3’s approach to learning and interaction unique?
Grok 3 features a distinctive personality that reflects its creator’s vision for AI interaction.
The system employs novel training methods that combine traditional machine learning with innovative approaches to data processing.
How is Elon Musk planning to utilize Grok 3 in his businesses?
Integration plans include implementation across X platform for enhanced user engagement and content moderation.
The technology will support various Tesla initiatives, including autonomous driving systems and user interface improvements.
What Is Grok 3?
Grok 3 is the latest iteration of xAI’s groundbreaking large language model (LLM), developed under the leadership of Elon Musk. It represents a significant leap forward in AI capabilities, building upon the foundations laid by its predecessors and pushing the boundaries of what’s possible with artificial intelligence. Grok 3 isn’t just another chatbot; it’s designed with a focus on advanced reasoning, comprehensive knowledge, and real-time information access, setting it apart from many existing AI models.
One of Grok 3’s defining features is its enhanced reasoning engine. It’s not simply regurgitating information; it can analyze complex data, draw logical conclusions, and provide human-like explanations. This allows Grok 3 to tackle intricate problems in fields like mathematics, science, and coding with a level of proficiency that rivals, and in some cases surpasses, other leading AI models, including ChatGPT.
Furthermore, Grok 3 introduces “DeepSearch,” a revolutionary search engine that goes beyond traditional web indexing. DeepSearch crawls the vast expanse of the internet and the real-time conversations and information shared on X (formerly Twitter) to provide users with concise and relevant summaries for their research queries. This integration with X gives Grok 3 access to a constantly updated stream of information, making it particularly adept at understanding current events and trends.
Grok 3 offers users different levels of interaction through its “Think” and “Big Brain” functions. “Think” allows for quick queries and concise answers, while “Big Brain” is designed for more complex tasks requiring deeper analysis and more extensive responses. This tiered approach allows users to tailor their interaction with Grok 3 to the specific demands of their task.
Initially available to X Premium+ subscribers, Grok 3 is poised to become a standalone product through a “Super Grok” subscription. This move signals xAI’s intention to broaden access to Grok 3’s powerful capabilities and establish it as a key player in the evolving AI landscape. While still relatively new, Grok 3 is already making waves and raising the bar for what’s expected from advanced AI models.
How Do You Get Access to Grok 3?
Accessing the power of Grok 3 is currently tied to a subscription model, though xAI has indicated plans for broader availability in the future. Here’s a breakdown of the current access methods:
Current Access:
- X Premium+ Subscription: Grok 3 is currently bundled with X’s highest-tier subscription service, X Premium+. Subscribing to X Premium+ grants you access to Grok 3’s capabilities directly within the X platform. This integration allows users to leverage Grok 3’s real-time information access and conversational abilities within the context of their X experience. It’s important to note that this access comes with the cost of the X Premium+ subscription, which has recently seen a price increase.
Future Access:
- Super Grok Subscription: xAI has announced plans to offer a standalone Grok subscription called “Super Grok.” This subscription will provide access to Grok 3 through a dedicated app and website, independent of an X Premium+ subscription. This will likely make Grok 3 more accessible to users who are primarily interested in its AI capabilities and not necessarily the other features of X Premium+. Details regarding the pricing and specific features of the “Super Grok” subscription are expected to be released soon.
Important Considerations:
- Pricing: Access to Grok 3, whether through X Premium+ or the upcoming “Super Grok” subscription, will involve a recurring fee. It’s crucial to consider the cost of these subscriptions when evaluating whether Grok 3 is the right AI tool for your needs.
- Availability: While currently limited to X Premium+ subscribers, the introduction of the “Super Grok” subscription suggests that xAI aims to expand access to Grok 3. Keep an eye on official announcements from xAI for updates on availability and pricing.
In summary, while Grok 3 is currently tied to X Premium+, the upcoming “Super Grok” subscription promises to provide a more direct and potentially more affordable way to access this powerful AI. Staying informed about xAI’s announcements will be key to securing access to Grok 3 as it becomes more widely available.
Noticias
Analizadores de análisis superiores: Pares de investigación profundos de Openai razonamiento de LLMS con trapo de agente para automatizar el trabajo y reemplazar trabajos

Únase a nuestros boletines diarios y semanales para obtener las últimas actualizaciones y contenido exclusivo sobre la cobertura de IA líder de la industria. Obtenga más información
Las empresas empresariales deben tomar nota de la investigación profunda de OpenAI. Proporciona un poderoso producto basado en nuevas capacidades, y es tan bueno que podría dejar a mucha gente fuera de trabajo.
La investigación profunda está en el borde sangrado de una tendencia creciente: la integración de modelos de idiomas grandes (LLM) con motores de búsqueda y otras herramientas para expandir en gran medida sus capacidades. (Justo cuando se informó este artículo, por ejemplo, el XAI de Elon Musk presentó Grok 3, que reclama capacidades similares, incluido un producto de búsqueda profunda. Sin embargo, es demasiado pronto para evaluar el rendimiento del mundo real de Grok 3, ya que la mayoría de los suscriptores no han en realidad todavía lo conseguí).
La investigación profunda de Openai, lanzada el 3 de febrero, requiere una cuenta profesional con OpenAI, que cuesta $ 200 por mes, y actualmente está disponible solo para los usuarios de EE. UU. Hasta ahora, esta restricción puede tener comentarios tempranos limitados de la comunidad de desarrolladores globales, que generalmente se apresura a diseccionar nuevos avances de IA.
Con el modo de investigación profunda, los usuarios pueden hacer cualquier pregunta al modelo O3 líder de OpenAI. El resultado? Un informe a menudo superior a lo que producen los analistas humanos, entregado más rápido y a una fracción del costo.
Cómo funciona la investigación profunda
Si bien la investigación profunda se ha discutido ampliamente, sus implicaciones más amplias aún no se han registrado completamente. Las reacciones iniciales elogiaron sus impresionantes capacidades de investigación, a pesar de sus alucinaciones ocasionales en sus citas. Estaba el tipo que dijo que lo usó para ayudar a su esposa que tenía cáncer de seno. Proporcionó un análisis más profundo de lo que sus oncólogos proporcionaron sobre cómo la radioterapia era el curso de acción correcto, dijo. El consenso, resumido por el profesor de Wharton AI, Ethan Mollick, es que sus ventajas superan con creces las imprecisiones ocasionales, ya que la verificación de hechos lleva menos tiempo de lo que la IA salva en general. Esto es algo con lo que estoy de acuerdo, basado en mi propio uso.
Las instituciones financieras ya están explorando las solicitudes. BNY Mellon, por ejemplo, ve potencial en el uso de una investigación profunda para las evaluaciones de riesgos de crédito. Su impacto se extenderá entre las industrias, desde la atención médica hasta la gestión minorista, de fabricación y de la cadena de suministro, prácticamente cualquier campo que se basa en el trabajo de conocimiento.
Un agente de investigación más inteligente
A diferencia de los modelos de IA tradicionales que intentan respuestas de un solo disparo, la investigación profunda primero hace preguntas aclaratorias. Puede hacer cuatro o más preguntas para asegurarse de que comprenda exactamente lo que desea. Luego desarrolla un plan de investigación estructurado, realiza múltiples búsquedas, revisa su plan basado en nuevas ideas e itera en un bucle hasta que compila un informe integral y bien formato. Esto puede llevar entre unos minutos y media hora. Los informes varían de 1,500 a 20,000 palabras, y generalmente incluyen citas de 15 a 30 fuentes con URL exactas, al menos de acuerdo con mi uso durante la última semana y media.
La tecnología detrás de la investigación profunda: razonamiento LLMS y el trapo de agente
La investigación profunda hace esto fusionando dos tecnologías de una manera que no hemos visto antes en un producto de mercado masivo.
LLMS de razonamiento: El primero es el modelo de vanguardia de OpenAI, O3, que conduce en un razonamiento lógico y procesos extendidos de la cadena de pensamiento. Cuando se anunció en diciembre de 2024, el O3 obtuvo un 87.5% sin precedentes en el punto de referencia SUPER-DIFFICTULT ARC-AGI diseñado para probar nuevas habilidades de resolución de problemas. Lo interesante es que O3 no se ha lanzado como un modelo independiente para que los desarrolladores lo usen. De hecho, el CEO de OpenAI, Sam Altman, anunció la semana pasada que el modelo en cambio estaría envuelto en un sistema de “inteligencia unificada”, que uniría modelos con herramientas de agente como la búsqueda, los agentes de codificación y más. La investigación profunda es un ejemplo de dicho producto. Y aunque competidores como Deepseek-R1 se han acercado a las capacidades de O3 (una de las razones por las que había tanta emoción hace unas semanas), OpenAi todavía se considera ampliamente que está ligeramente por delante.
Trapo de agente: El segundo, Agentic Rag, es una tecnología que ha existido durante aproximadamente un año. Utiliza agentes para buscar información autónoma y contexto de otras fuentes, incluida la búsqueda de Internet. Esto puede incluir otros agentes de llamas de herramientas para encontrar información no WEB a través de API; agentes de codificación que pueden completar secuencias complejas de manera más eficiente; y búsquedas en la base de datos. Inicialmente, la investigación profunda de OpenAI está buscando principalmente en la web abierta, pero los líderes de la compañía han sugerido que podría buscar más fuentes con el tiempo.
La ventaja competitiva de OpenAI (y sus límites)
Si bien estas tecnologías no son completamente nuevas, las refinamientos de OpenAI, habilitados por cosas como su inicio de trabajo en trabajar en estas tecnologías, fondos masivos y su modelo de desarrollo de código cerrado, han llevado a una investigación profunda a un nuevo nivel. Puede funcionar a puerta cerrada y aprovechar los comentarios de los más de 300 millones de usuarios activos del popular producto CHATGPT de Openai. Operai ha liderado en investigación en estas áreas, por ejemplo, en cómo hacer verificación paso a paso para obtener mejores resultados. Y ha implementado claramente la búsqueda de una manera interesante, tal vez tomando prestado de Microsoft’s Bing y otras tecnologías.
Si bien todavía está alucinando algunos resultados de sus búsquedas, lo hace menos que los competidores, tal vez en parte porque el modelo O3 subyacente ha establecido una industria baja para estas alucinaciones al 8%. Y hay formas de reducir aún más los errores, mediante el uso de mecanismos como umbrales de confianza, requisitos de citas y otras verificaciones de credibilidad sofisticadas.
Al mismo tiempo, hay límites para el liderazgo y las capacidades de OpenAi. Dentro de los dos días del lanzamiento de Deep Research, Huggingface presentó un agente de investigación de IA de código abierto llamado Open Deep Research que obtuvo resultados que no estaban muy lejos de la de OpenAi, de manera similar, fusionando modelos líderes y capacidades de agente disponibles gratuitamente. Hay pocos focos. Los competidores de código abierto como Deepseek parecen mantenerse cerca en el área de los modelos de razonamiento, y Magentic-One de Microsoft ofrece un marco para la mayoría de las capacidades de agente de OpenAI, por nombrar solo dos ejemplos más.
Además, la investigación profunda tiene limitaciones. El producto es realmente eficiente para investigar información oscura que se puede encontrar en la web. Pero en áreas donde no hay mucho en línea y donde la experiencia en el dominio es en gran medida privada, ya sea en las cabezas de las personas o en bases de datos privadas, no funciona en absoluto. Por lo tanto, esto no va a amenazar los trabajos de los investigadores de fondos de cobertura de alta gama, por ejemplo, a quienes se les paga para hablar con expertos reales en una industria para encontrar información muy difícil de Obtain, como argumentó Ben Thompson En una publicación reciente (ver gráfico a continuación). En la mayoría de los casos, la investigación profunda de OpenAI afectará a los trabajos de analistas más bajos y calificados.
El producto más inteligente hasta ahora
Cuando fusiona el razonamiento de primer nivel con la recuperación de agente, no es realmente sorprendente que obtenga un producto tan poderoso. La investigación profunda de Openai logró un 26,6% en el último examen de la humanidad, posiblemente el mejor punto de referencia para la inteligencia. Este es un punto de referencia de IA relativamente nuevo diseñado para ser el más difícil de completar para cualquier modelo de IA, que cubra 3.000 preguntas en 100 sujetos diferentes. En este punto de referencia, la investigación profunda de OpenAI supera significativamente la investigación profunda de Perplexity (20.5%) y modelos anteriores como O3-Mini (13%) y Deepseek-R1 (9.4%) que no estaban conectados con trapo de agente. Pero las primeras revisiones sugieren clientes potenciales abiertos tanto en calidad como en profundidad. La investigación profunda de Google aún no se ha probado con este punto de referencia, pero las primeras revisiones sugieren clientes potenciales de calidad y profundidad.
Cómo es diferente: la primera IA del mercado masivo que podría desplazar los trabajos
Lo que es diferente con este producto es su potencial para eliminar los empleos. Sam Witteveen, cofundador de Red Dragon y desarrollador de agentes de IA, observó en una discusión de video de inmersión profunda conmigo que mucha gente va a decir: “Solía mierda, puedo obtener estos informes por $ 200 que podría obtener de los que podría obtener una compañía de consultoría entre 4 mejores que me costarían $ 20,000 ”. Esto, dijo, causará algunos cambios reales, incluido probablemente dejar a las personas fuera de los trabajos.
Lo que me lleva de vuelta a mi entrevista la semana pasada con Sarthak Pattanaik, Jefe de Ingeniería e IA en BNY Mellon, un importante banco estadounidense.
Sin duda, Pattanaik no dijo nada sobre las ramificaciones del producto para los recuentos de trabajos reales en su banco. Ese será un tema particularmente sensible que cualquier empresa probablemente rehuya abordar públicamente. Pero dijo que podía ver que la investigación profunda de OpenAI se utilice para informes de suscripción de crédito y otras actividades de “línea superior”, y que tenga un impacto significativo en una variedad de trabajos: “Ahora eso no afecta a cada trabajo, pero eso afecta a un conjunto de empleos alrededor de la estrategia [and] Investigación, como la gestión de los proveedores de comparación, comparación del producto A versus producto B “. Agregó: “Así que creo que todo lo que está más en el sistema dos pensamientos: más exploratorio, donde puede no tener una respuesta correcta, porque la respuesta correcta se puede montar una vez que tenga esa definición de escenario, creo que es una oportunidad”.
Una perspectiva histórica: pérdida de empleo y creación de empleo
Las revoluciones tecnológicas han desplazado históricamente a los trabajadores a corto plazo mientras crean nuevas industrias a largo plazo. Desde automóviles que reemplazan los carruajes tirados por caballos hasta las computadoras que automatizan el trabajo administrativo, los mercados laborales evolucionan. Las nuevas oportunidades creadas por las tecnologías disruptivas tienden a generar una nueva contratación. Las empresas que no adoptan estos avances se quedarán atrás de sus competidores.
Altman de OpenAI reconoció el vínculo, incluso si es indirecto, entre investigaciones profundas y mano de obra. En la cumbre de IA en París la semana pasada, se le preguntó sobre su visión de inteligencia general artificial (AGI), o la etapa en la que AI puede realizar casi cualquier tarea que un humano pueda. Como respondió, su primera referencia fue una investigación profunda: “Creo que es un modelo capaz de hacer como un porcentaje de bajo dígito de todas las tareas en la economía en el mundo en este momento, que es una declaración loca, y Hace un año no creo que algo que la gente pensara vendrá “. (Ver minuto tres de este video). Continuó: “Por 50 centavos de cómputo, puede hacer como $ 500 o $ 5,000 de trabajo. Las empresas están implementando eso para ser mucho más eficientes “.
La comida para llevar: una nueva era para el trabajo de conocimiento
Deep Research representa un momento decisivo para la IA en las industrias basadas en el conocimiento. Al integrar el razonamiento de vanguardia con capacidades de investigación autónoma, OpenAi ha creado una herramienta que es más inteligente, más rápida y significativamente más rentable que los analistas humanos.
Las implicaciones son enormes, desde servicios financieros hasta atención médica hasta toma de decisiones empresariales. Las organizaciones que aprovechan esta tecnología de manera efectiva obtendrán una ventaja competitiva significativa. Aquellos que lo ignoran lo hacen bajo su riesgo.
Para una discusión más profunda sobre cómo funciona la investigación profunda de OpenAI, y cómo funciona el conocimiento, consulte mi conversación en profundidad con Sam Witteveen en nuestro último video:
Noticias
¿Chatgpt nos reemplazará? – Revista Mishpacha

Presionar botones para producir escritos robará a una persona de la capacidad de conectarse con su propia alma y con otra Tzelem Elokim
W
Salieron las computadoras, la gente se maravilló de su capacidad para calcular tan rápido y tan perfectamente. Pero aunque los humanos se enorgullecen de sus habilidades de pensamiento, nadie realmente se sintió intimidado por las computadoras. Después de todo, eran solo máquinas.
Incluso cuando sus capacidades superaron los cálculos matemáticos simples y comenzaron a sintetizar información para proporcionar predicciones y evaluaciones, todavía no estábamos terriblemente preocupados. Lo reconocimos como nada más que una aplicación de nivel superior del mismo tipo de cálculo.
Pero luego chatgpt golpeó. Y ahora de repente las computadoras nos están hablando. Y preparar discursos y escribir cartas que suenan terriblemente como humanos. La gramática y el uso del idioma son excelentes, y las frases y el contenido suenan tranquilizadoramente familiares y apropiados. Los profesores deben usar programas cada vez más sofisticados para enganchar documentos producidos por ChatGPT. Algunas escuelas incluso exigen que las tareas escritas solo se puedan hacer en la escuela, frente al personal. Muchas compañías ahora responderán de manera rutinaria a su correo utilizando un programa de chat.
De repente, no estamos tan seguros de nosotros mismos. Discurso, que es nuestra característica humana más definitoria (ver Onkelos Bereishis 2: 7, y citado en muchos Seforim; ver Maharsha y Maharal, Shabat 33a), está siendo generado por una máquina. Esto parece socavar nuestro sentido de la humanidad. No es solo una sensación desconcertante, sino también, prueba nuestra creencia central en la existencia de la neshamah y el concepto de Tzelem Elokim.
Así que comencemos comprendiendo el concepto de “discurso” desde la perspectiva de la Torá. A primera vista, el concepto de habla como la calidad definitoria del hombre parece desconcertante. ¿No valoramos la sabiduría y la inteligencia por encima del discurso?
El Maharal (Nesivos Olam, Nesiv Halashon) explica que el significado único del habla es que es la única facultad humana que es “doble capas”. Cuando una persona habla, las palabras son realidades físicas que definen elementos físicos. Pero también podemos escuchar el alma de la persona que se proyecta a través de las palabras. Una persona puede describirnos su difícil situación o su alegría. Las palabras describen las realidades físicas de un evento en particular, pero su “discurso” en su forma holística nos transmite cómo la persona está experimentando ese evento.
Esta capacidad de expresar nuestra esencia a través del discurso se debe a la Tzelem Elokim (Imagen divina) en la que fue creado el hombre. Las “palabras” de Hashem crearon el mundo; Cada acto de creación comienza con las palabras “y Hashem dijo”. Sin embargo, la creación del hombre tiene una descripción única: “e infundió en la fosa nasal de un alma viviente”. El Zohar Famoso enfatiza que la respiración emana de la esencia misma de la persona. Por lo tanto, al crear el hombre, Hashem lo infundió con alguna parte de su propia esencia divina. Si bien el concepto de la Divina Spark en el hombre es un concepto cabalístico muy profundo, entendemos por esto que la respiración inherente en cada palabra hablada lleva parte de la esencia del hablante.
Esto es cierto para Hashem, y debido a que somos creados a la imagen divina, es cierto para nosotros en nuestro propio mundo. Cuando hablamos, estamos involucrados en una actividad de doble capa. Articulamos palabras que son descripciones físicas de alguna materia u otra, y hasta cierto punto infundimos esas palabras con un alma, una chispa de nuestra propia esencia.
También vemos esta dinámica en el trabajo en la transmisión de la Torá en Har Sinai. La primera palabra de la Torá que hashem pronunció fue Anochi. Chazal Teach (Shabat 105a) que Anochi es un acrónimo de “Mi esencia me puse en este escrito, y te lo di”. Esto significa que no solo las palabras de la Torá describen la realidad espiritual, sino también, al escuchar y estudiar la Torá, nuestras almas se conectan en algún nivel con la fuente divina de las palabras.
Las personas que poseían esa calidad podían infundir las palabras más simples con extraordinarias neshamah.
El Gabbai del Rebe de Kotzker una vez llegó a él, advirtiendo: “¡Rebe, Rebe! ¡Alguien acaba de robar el abrigo del Rebe!
El Rebe rugió: “¿Qué quieres decir? robó? No dice Lo signov?! “
El Gabbai escribe que durante años después, el Rebe no pudo entender cómo alguien podría robar (Harebbe mi’kotzkYitzchak Alfasi, p. 191).
En el Hesped de Rav Chatzkel Levenstein, Rav Wolbe dijo: “Cuando Rav Chatzkel dijo Bircas Hamazon, como dijo,”b’chein, b’chesed, uv’rachamim, ‘ uno podía sentirse palpablemente el Chein, el quitado, y el Rachamimcon el cual Hashem alimenta un mundo hambriento “.
El propio Rav Wolbe, en su introducción a Alei Shur, Describe la profunda influencia que su rebbi, Rav Yerucham Levitz, tuvo sobre él. Describe a su rebbi como alguien “cuyas mismas palabras infundieron la vida en … un mero cadáver [mechayeh meisim b’maamaro]. ” Él escribe que las enseñanzas de su Rebbi impregnan al Sefer. Luego agrega: “Si alguien se siente particularmente elevado o conmovido por cualquier parte del Sefer, es un eco de la voz de Rav Yerucham Levovitz que reverbere en esas palabras”.
Este es el mundo del discurso en su perfección divina: un cuerpo muy definido, infundido con una espiritualidad que emana del núcleo del alma humana.
Pero podemos hacer mal uso de esta habilidad terriblemente y destruirla. El Gemara (Pesqués 113b, y otros lugares) define el discurso insincero como “uno [thing] en la boca, uno [thing] en el corazón ”(Echad B’Peh, V’echad B’lev). Esto no significa necesariamente que las palabras son técnicamente falsas. Más bien, que no son sinceros. No emanan desde el núcleo de la esencia de la persona. Son huecos y sin lugar de cualquier elemento del alma. Las palabras que son halagos, chorleas, sin sentido, etc., son ejemplos de ese fenómeno.
Una máquina no tiene alma y nunca tendrá una. Puede reciclar frases encantadoras de un vasto grupo de palabras y escritos, pero no puede hacer más que eso.
Entonces, si nos preguntáramos qué hay de malo en Chatgpt, seríamos negligentes al ir al kefirá y shmutz explicaciones. Mucho más importante es que nos roba de nuestra humanidad central, nuestra misma Tzelem Elokim. Expresarnos a nosotros mismos es un ejercicio para enfrentarse con sentimientos internos por un lado, y por otro lado, conectando con nuestro prójimo “esencia a la esencia”.
Necesitamos educar a nuestros hijos día tras día que se están robando su mayor facultad humana al recurrir a Chatgpt para escribir sus tareas y ensayos. Así como un niño que se vería obligado a usar solo dispositivos mecánicos para moverse pronto experimentaría músculos atrofiados y perdería su capacidad de caminar, así también, presionar los botones para producir escritos robará a una persona de una facultad aún más importante que caminar: La capacidad de conectarse con su propia alma y con otra Tzelem Elokim.
Volvamos a nuestra pregunta original: “¿Chat GPT nos reemplazará alguna vez?” Todo depende: si expresamos nuestra esencia espiritual a través del discurso y la escritura, no existe la menor posibilidad de que pueda reemplazarnos de ninguna manera. Pero si aprendemos a repetir sin pensar tópicos y declaraciones pro forma, sutilezas y palabras huecas, entonces las máquinas ciertamente nos reemplazarán en poco tiempo.
Y harán un trabajo mucho mejor.
(Originalmente aparecido en Mishpacha, número 1050)
¡Ups! No pudimos localizar su forma.
-
Startups9 meses ago
Remove.bg: La Revolución en la Edición de Imágenes que Debes Conocer
-
Recursos9 meses ago
Cómo Empezar con Popai.pro: Tu Espacio Personal de IA – Guía Completa, Instalación, Versiones y Precios
-
Recursos9 meses ago
Suno.com: La Revolución en la Creación Musical con Inteligencia Artificial
-
Tutoriales9 meses ago
Cómo Comenzar a Utilizar ChatGPT: Una Guía Completa para Principiantes
-
Recursos9 meses ago
Perplexity aplicado al Marketing Digital y Estrategias SEO
-
Startups7 meses ago
Startups de IA en EE.UU. que han recaudado más de $100M en 2024
-
Estudiar IA9 meses ago
Curso de Inteligencia Artificial de UC Berkeley estratégico para negocios
-
Startups9 meses ago
Deepgram: Revolucionando el Reconocimiento de Voz con IA