Connect with us

Noticias

Google Gemini Code Assist + VSCode Integration

Published

on

Gemini Code Assist is an AI-powered coding assistant created to help developers write code faster and more efficiently within Visual Studio Code (VS Code). It utilizes Google’s Gemini AI model, which is recognized for its natural language understanding and generation capabilities. Gemini Code Assist offers context-aware suggestions, completes code snippets, and can even generate entire functions.

The integration of Google’s Gemini with Visual Studio Code (VSCode) represents a significant advancement for developers seeking improved efficiency and innovation. By combining Gemini’s impressive AI capabilities with the widely-used coding environment of VSCode, the overall coding experience is enhanced.

https://cloud.google.com/products/gemini/code-assist

Google Gemini Code Assist and VS Code

Features of Gemini Code Assist

  • Code Generation: Generate code snippets or entire functions based on natural language prompts or existing code context.
  • Code Completion: Suggest relevant code completions as you type, accelerating your coding process.
  • Context-Aware Suggestions: Offer suggestions tailored to your specific project and coding style.
  • Debugging Assistance: Help identify and fix errors in your code.
  • Refactoring Support: Provide suggestions for improving the structure and efficiency of your code.
  • Collaboration: Enable real-time collaboration with other developers on code projects.

How to Use Gemini Code Assist in VS Code

  1. Install: Download and install the “Gemini Code Assist + Google Cloud Code” extension from the VS Code Marketplace.
  2. Set Up: Select a Google Cloud project with the Cloud AI Companion API enabled.
  3. Start Coding: Use the “chat_spark” icon in the activity bar to open the Gemini Code Assist pane and start interacting with the AI assistant.

Pricing

Gemini Code Assist is currently available for free during its preview phase.

Additional Information

Feature Description
Supported Languages Currently supports Python, Java, Go, JavaScript, TypeScript, and more.
Customization Allows customization of suggestions and behavior to match your preferences.
Security Ensures code security by integrating with existing security tools and practices.
Resources Offers access to relevant documentation and resources for further assistance.

For more information and to get started, visit the official documentation for Gemini Code Assist.

Google Gemini
Google Gemini

Enhance Your Coding with Gemini Code Assist

Google’s Gemini Code Assist is a powerful tool that can help developers write code faster and more efficiently. It uses the Gemini AI model to provide context-aware suggestions, complete code snippets, and even generate whole functions. Let’s take a closer look at how it can improve your coding workflow.

Practical Use Cases

Imagine you need to write a Python function to read data from a CSV file. Instead of searching for examples online, you can simply ask Gemini Code Assist to generate the code for you. Just type a natural language prompt like “write a Python function to read a CSV file” and Gemini will provide you with the code snippet you need.

Another example is creating a React component for a user login form. Gemini can generate the basic structure of the component, including the necessary input fields and event handlers. This can save you a lot of time and effort, especially when starting a new project.

Deeper Dive into Features

Code Completion

Gemini’s code completion goes beyond traditional IntelliSense by offering more context-aware suggestions. It can predict entire lines of code based on your current context and coding style. This can help you write code faster and with fewer errors.

Debugging Assistance

Gemini can help you identify and fix errors in your code. It can analyze your code for potential issues and suggest solutions. This can be especially helpful for complex codebases where finding and fixing bugs can be time-consuming.

Refactoring Support

Gemini can suggest improvements to your code’s structure and efficiency. It can identify redundant code, suggest better design patterns, and help you make your code more maintainable.

Comparison with Other Tools

Gemini Code Assist is one of several AI-powered coding assistants available. Here’s how it compares to some of its competitors:

Feature Gemini Code Assist GitHub Copilot Amazon CodeWhisperer Tabnine
Code Generation Yes Yes Yes Yes
Code Completion Yes Yes Yes Yes
Debugging Assistance Yes Limited Limited Limited
Refactoring Support Yes Limited Limited Yes
Language Support Python, Java, JavaScript, etc. Many Many Many
Pricing Free (preview) Paid Free tier available Free and paid tiers

Gemini Code Assist stands out with its strong debugging and refactoring capabilities. It also offers a free preview, making it a good option for developers who want to try out AI-powered coding assistance.

Addressing Potential Concerns

Privacy

Google takes privacy seriously. Gemini Code Assist does not send your code to Google’s servers for analysis. All processing happens locally on your machine. You can also control privacy settings within the extension.

Accuracy

While Gemini Code Assist is highly accurate, it’s important to remember that AI code generation is not perfect. Always review and validate the code suggested by Gemini before using it in your project.

Over-reliance

Avoid becoming overly reliant on AI coding tools. Use Gemini Code Assist as a helpful assistant, but don’t let it replace your understanding of coding principles and best practices.

Advanced Topics

Customization

You can customize Gemini Code Assist’s behavior to match your coding style and project requirements. This includes adjusting the level of assistance, fine-tuning suggestions, and configuring code generation preferences.

API Integration

Developers can use the Gemini API to integrate its capabilities into other tools and workflows. This allows for greater flexibility and customization in how you use Gemini’s AI capabilities.

Google Gemini VSCode Integration

Feature Description Notes
Direct Code Generation Use prompts to generate code directly in your VSCode editor. Currently in alpha, limited languages and functionalities. Requires API key and Google Cloud account.
Code Completion Get smart suggestions for code completion based on your context and prompt. Available for languages like Python, Javascript, and Java. May require specific extensions or configurations.
Function Summarization Automatically generate summaries of existing code functions or libraries. Requires specific extensions or configurations.
Log Analysis Use Gemini to analyze and understand log files with natural language queries. Currently in alpha, limited functionality.
Error Explanation Get human-readable explanations for complex error messages. Requires specific extensions or configurations.
Smart Actions One-click shortcuts for repetitive tasks like generating boilerplate code or unit tests. Limited set of actions available, may require specific extensions or configurations.
Language Support Supports multiple programming languages, with more being added over time. Current supported languages include Python, Javascript, Java, C++, C#, and Go.
Integrations Works with existing VSCode extensions and tools for a seamless experience. Requires compatibility checks and potential configurations.

Additional Notes:

  • The available features and functionalities may vary depending on your development environment, installed extensions, and Gemini’s development progress.
  • Some features require additional setup or configurations using API keys or specific extensions.
  • Integration is still under development, and new features and improvements are expected to be released over time.

Overview of Google Gemini and VSCode Integration

VSCode users can rejoice as Google’s AI powers a plugin known as Ask Bard. This plugin harnesses the Gemini API to suggest code snippets, answer queries, and even guide through complex coding problems. Programmers, from novices to veterans, can expect a smoother flow while crafting their code.

Here are some key benefits developers can expect:

  • Quick Integration: Setting up Gemini in VSCode is hassle-free, having developers ready in just a few clicks.
  • AI-Powered Assistance: The plugin offers real-time help, learning from input and providing relevant output, thus boosting productivity.
  • Multi-language Support: Whether it’s Python or any other language, Gemini’s versatility shines through, catering to diverse coding requirements.
Feature Description
Gemini Pro Advanced version with more features
Gemini Ultra The ultimate tier offering state-of-the-art capabilities
API Key A unique key developers use to access Gemini services

Furthermore, the Gemini Pro and Gemini Ultra tiers offer enhanced functionalities, addressing the needs of data-intensive projects. They represent the evolution of large language models like GPT-4 and GPT-3.5, promising high accuracy in predictions.

By leveraging Gemini’s API, which can be obtained with an API key, VSCode becomes more than just an editor. It evolves into a powerful coding companion, providing developers a robust platform to write, revise, and optimize their code. This combination is redefining coding efficiency, positioning Google AI Studio’s offering as a relevant tool in the software development landscape, similar to other innovations like GitHub Copilot and Microsoft’s contributions.

Gemini’s Multimodal Capabilities and API Usage

Gemini’s API empowers developers to craft versatile applications. It excels in understanding and creating content across various formats like text and images.

Multimodal Features in Gemini

Gemini, by Google, stands out with its capability to process and respond to multiple types of data, including text, images, audio, and video. This multimodality means that Gemini can perform tasks that combine different forms of information. For instance, it could analyze an English sentence within a natural image, understand context, and provide insights. Moreover, Gemini extends its utility across different platforms such as Android, iOS, mobile, and web applications, showcasing its versatility.

  • Text and Code: Gemini can generate and interpret human-like text as well as code, facilitating developers’ work on software projects.
  • Mathematical Reasoning: Gemini possesses the ability to engage in complex mathematical reasoning, making it a helpful tool for educational purposes.
  • Visual Understanding: When it comes to images and video, Gemini’s comprehension of content extends beyond mere text, aiding in more intuitively designed apps.

Implementing Gemini API in VSCode

For developers aiming to integrate Gemini’s prowess into Visual Studio Code (VSCode), here is a streamlined approach:

  1. Getting Started:

    • Obtain API credentials by registering your application with Google’s developer services.
    • Install Gemini’s VSCode extension through the extensions marketplace, if available.
  2. Setting Up:

    • Configure your settings.json in VSCode with the necessary Gemini API keys.
    • Ensure the environment is ready for multimodal inputs if your project demands.
  3. Usage:

    • Directly in your code editor, you can invoke Gemini’s capabilities as needed.
    • Use commands or hotkeys predefined by the extension to activate Gemini’s features.

By adopting Gemini in VSCode, developers can engage with a powerful toolset that understands both the nuances of language and the subtleties of visual elements. In return, they earn the ability to construct more intuitive and intelligent applications.

Compliance and Localization

Incorporating Google’s Gemini into Visual Studio Code (VS Code) presents unique challenges and opportunities in the areas of compliance and localization. Ensuring that developers can confidently use the tool within regulatory frameworks and adapt it for various languages is critical.

Safety Measures and Compliance

Safety is a major concern when integrating Gemini, Google’s generative AI created by DeepMind, into any development environment. For EU users, Gemini must adhere to the General Data Protection Regulation (GDPR), ensuring that all data is handled with the utmost privacy and security. Google has implemented safeguards to prevent toxicity and promote safety in AI conversations by utilizing advanced foundation models and datasets that are carefully vetted.

Google’s AI tool, Bard, and its more powerful version, Bard Advanced, are designed to generate code within VS Code, while also keeping efficiency and compliance in check. When utilizing these tools, developers have to set specific environment variables to ensure that the tool adheres to local regulations and standards.

Supporting Internationalization in Development

For developers working with multiple language requirements, Google’s generative AI in VS Code is well-equipped to handle internationalization. This includes full support for widely-used languages such as Japanese and Korean, facilitating a more inclusive development process.

Additionally, tools like Gemini take into account various knowledge bases, allowing the AI to generate code and comments that are culturally sensitive and relevant. This level of localization ensures that products made using VS Code can reach a global market with a strong foundation in both language and culture.

Frequently Asked Questions

This section aims to shed light on some of the common queries regarding the Gemini extension in Visual Studio Code, providing concise and useful responses.

How can you install the Gemini extension in Visual Studio Code?

To install the Gemini extension, open the Extensions view in Visual Studio Code, search for “Gemini,” and click ‘Install’. Make sure Visual Studio Code is up to date to ensure compatibility.

What are the primary features of the Gemini extension for VS Code?

The primary features of the Gemini extension include AI-powered code completion, syntax highlighting, and debugging assistance, which streamline and enhance the coding process for developers.

Can the Gemini extension be used for free in VS Code, or is there a cost involved?

The basic features of the Gemini extension can be used for free. However, there may be premium features that require a subscription or one-time payment.

What programming languages are supported by the Gemini extension in VS Code?

The Gemini extension typically supports popular programming languages such as Python, JavaScript, and more. For an updated list of supported languages, users should check the documentation on the Visual Studio Code marketplace.

How does Gemini AI enhance coding within Visual Studio Code?

Gemini AI assists programmers by using machine learning to offer intelligent code suggestions, helping to reduce errors and improve code quality, all within the Visual Studio Code environment.

Are there any tutorials available for learning how to use the Gemini extension in VS Code?

Yes, there are tutorials and official documentation available online that guide users on how to utilize the Gemini extension effectively in their Visual Studio Code projects.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

Deepseek R1 es genial, pero Chatgpt todavía tiene la ventaja de IA

Published

on

Únase a nuestros boletines diarios y semanales para obtener las últimas actualizaciones y contenido exclusivo sobre la cobertura de IA líder de la industria. Obtenga más información


Hace solo una semana, el 20 de enero de 2025, la startup china de IA Deepseek desató un nuevo modelo de IA de código abierto llamado R1 que inicialmente podría haber sido confundido con una de las masas cada vez más crecientes de rivales casi intercambiables desde OpenAi desde OpenAi debutó ChatGPT (impulsado por su propio modelo GPT-3.5, inicialmente) hace más de dos años.

Pero eso rápidamente resultó infundada, ya que la aplicación móvil de Deepseek ha incrementado en ese corto tiempo las listas de Apple App Store en los EE. UU. Para destronar el chatgpt por el lugar número uno y causado una corrección de mercado masiva cuando los inversores arrojaron acciones en chips de computadora anteriormente caliente. Los fabricantes como Nvidia, cuyas unidades de procesamiento de gráficos (GPU) han tenido una gran demanda de uso en superclusters masivos para entrenar nuevos modelos de IA y servirles a los clientes de manera continua (una modalidad conocida como “inferencia”).

El capitalista de riesgo, Marc Andreessen, haciéndose los sentimientos de otros trabajadores tecnológicos, escribió en la red social X anoche: “Deepseek R1 es el momento sputnik de AI”, comparándolo con el lanzamiento fundamental de octubre de 1957 del primer satélite artificial en la historia, Sputnik 1, por el La Unión Soviética, que provocó la “carrera espacial” entre ese país y los Estados Unidos para dominar los viajes espaciales.

El lanzamiento de Sputnik galvanizó a los Estados Unidos para invertir mucho en la investigación y el desarrollo de naves espaciales y cohetros. Si bien no es una analogía perfecta, no se necesitaba una gran inversión para crear Deepseek-R1, todo lo contrario (más sobre esto a continuación), parece significar un importante punto de inflexión en el mercado global de IA, como por primera vez, un El producto de IA de China se ha convertido en el más popular del mundo.

Pero antes de subir al tren de bombo de Deepseek, retrocedamos y examinemos la realidad. Como alguien que ha utilizado ampliamente el ChatGPT de OpenAI, tanto en plataformas web como móviles, y ha seguido de cerca los avances de IA, creo que si bien los logros de Deepseek-R1 son notables, no es hora de descartar las inversiones de ChatGPT o US AI todavía. Y tenga en cuenta que OpenAi no me paga para decir esto: nunca he tomado dinero de la empresa y no planeo.

¿Qué hace bien?

Deepseek-R1 es parte de una nueva generación de grandes modelos de “razonamiento” que hacen más que responder consultas de los usuarios: reflexionan sobre su propio análisis mientras producen una respuesta, intentando captar errores antes de servirlos al usuario.

Y Deepseek-R1 coincide o supera el propio modelo de razonamiento de OpenAI, O1, lanzado en septiembre de 2024 inicialmente solo para usuarios de suscripción ChatGPT Plus y Pro, en varias áreas.

Por ejemplo, en el punto de referencia Math-500, que evalúa la resolución matemática de problemas matemáticos a nivel de escuela secundaria, Deepseek-R1 alcanzó una tasa de precisión del 97.3%, superando ligeramente el 96.4% de OpenAI O1. En términos de capacidades de codificación, Deepseek-R1 obtuvo un 49.2% en el punto de referencia verificado SWE-Bench, superando el 48.9% de OpenAI O1.

Además, financieramente, Deepseek-R1 ofrece ahorros de costos sustanciales. El modelo se desarrolló con una inversión de menos de $ 6 millones, una fracción del gasto, estimado de múltiples miles de millones, se asocia informalmente con modelos de capacitación como OpenAI’s O1.

Deepseek se vio esencialmente obligado a ser más eficiente con GPU escasas y antiguas gracias a una restricción de exportación de los Estados Unidos en las ventas de la tecnología a China. Además, Deepseek proporciona acceso a API a $ 0.14 por millón de tokens, restringiendo significativamente la tasa de OpenAI de $ 7.50 por millón de tokens.

La ganancia de eficiencia masiva de Deepseek-R1, los ahorros de costos y el rendimiento equivalente al modelo de IA de EE. UU. Han causado que Silicon Valley y la comunidad empresarial más amplia se asusten por lo que parece ser un aumento completo del mercado de IA, la geopolítica y la economía conocida de la IA. Entrenamiento modelo.

Si bien las ganancias de Deepseek son revolucionarias, el péndulo se está balanceando demasiado hacia él en este momento

No se puede negar que la rentabilidad de Deepseek-R1 es un logro significativo. Pero no olvidemos que Deepseek debe gran parte de su éxito a las innovaciones de IA de EE. UU., Volviendo a la arquitectura de transformadores inicial de 2017 desarrollada por Google AI Investigers (que comenzó toda la locura de LLM).

Deepseek-R1 fue entrenado en preguntas y respuestas de datos sintéticos y específicamente, según el documento publicado por sus investigadores, en el “conjunto de datos de DeepSeek-V3” supervisado, que se encontró, que se encontró. ¡Tener muchos indicadores de ser generados con el modelo GPT-4O de Opensei!

Parece bastante claro decir que sin GPT-4O para proporcionar estos datos, y sin el lanzamiento de OpenAi del primer modelo de razonamiento comercial O1 en septiembre de 2024, que creó la categoría, Deepseek-R1 casi seguramente no existiría.

Además, el éxito de Openai requirió grandes cantidades de recursos de GPU, allanando el camino para los avances que Deepseek se ha beneficiado sin duda. El actual inversor en pánico sobre EE. UU. Y las compañías de IA se sienten prematuras y exageradas.

Las capacidades de visión y generación de imágenes de ChatGPT siguen siendo muy importantes y valiosas en el lugar de trabajo y en los entornos personales: Deepseek-R1 aún no tiene ninguna

Mientras que Deepseek-R1 ha impresionado con su razonamiento visible de “cadena de pensamiento”, una especie de flujo de conciencia en la que el modelo muestra texto a medida que analiza el aviso del usuario y busca responder a él, y eficiencia en flujos de trabajo basados ​​en texto y matemáticas, Carece de varias características que hacen que ChatGPT sea una herramienta más robusta y versátil hoy.

No hay capacidades de generación de imágenes o visión

El sitio web oficial de Deepseek-R1 y la aplicación móvil permiten a los usuarios subir fotos y archivos adjuntos de archivos. Pero, solo pueden extraer texto de ellos utilizando el reconocimiento de caracteres ópticos (OCR), una de las primeras tecnologías informáticas (que datan de 1959).

Esto palidece en comparación con las capacidades de visión de ChatGPT. Un usuario puede cargar imágenes sin ningún texto y hacer que ChatGPT analice la imagen, describirla o proporcionar más información basada en lo que ve y el texto del usuario solicita.

CHATGPT permite a los usuarios subir fotos y pueden analizar material visual y proporcionar información detallada o consejos procesables. Por ejemplo, cuando necesitaba orientación para reparar mi bicicleta o mantener mi unidad de aire acondicionado, la capacidad de ChatGPT para procesar imágenes resultó invaluable. Deepseek-r1 simplemente no puede hacer esto todavía. Vea a continuación para una comparación visual:

No hay generación de imágenes

La ausencia de capacidades de imagen generativa es otra limitación importante. Como alguien que genera frecuentemente imágenes de IA usando CHATGPT (como para el propio encabezado de este artículo) alimentado por el modelo Dall · E 3 subyacente de OpenAI, la capacidad de crear imágenes detalladas y estilísticas con ChatGPT es un cambio de juego.

Esta característica es esencial para muchos flujos de trabajo creativos y profesionales, y Deepseek aún no ha demostrado una funcionalidad comparable, aunque hoy la compañía lanzó un modelo de visión de código abierto, Janus Pro, que dice que supera a Dall · E 3, Difusión estable 3 y otros Modelos de generación de imágenes líderes en la industria en puntos de referencia de terceros.

Sin modo de voz

Deepseek-R1 también carece de un modo de interacción de voz, una característica que se ha vuelto cada vez más importante para la accesibilidad y la conveniencia. El modo de voz de ChatGPT permite interacciones naturales y conversacionales, lo que lo convierte en una opción superior para uso de manos libres o para usuarios con diferentes necesidades de accesibilidad.

Estar emocionado por el potencial futuro de Deepseek, pero también desconfíe de sus desafíos

Sí, Deepseek-R1 puede, y probablemente lo hará, agregar capacidades de voz y visión en el futuro. Pero hacerlo no es una hazaña pequeña.

La integración de la generación de imágenes, el análisis de la visión y las capacidades de voz requieren recursos de desarrollo sustanciales y, irónicamente, muchas de las mismas GPU de alto rendimiento que los inversores ahora están subvalorando. Implementar estas características de manera efectiva y de manera fácil de usar es otro desafío por completo.

Los logros de Deepseek-R1 son impresionantes y indican un cambio prometedor en el panorama global de IA. Sin embargo, es crucial mantener la emoción bajo control. Por ahora, ChatGPT sigue siendo el producto mejor redondeado y más capaz, ofreciendo un conjunto de características que Deepseek simplemente no puede igualar. Apreciamos los avances al tiempo que reconocemos las limitaciones y la importancia continua de la innovación e inversión de la IA de EE. UU.

Continue Reading

Noticias

¿Qué es Deepseek y por qué está causando que Nvidia y otras acciones se caigan?

Published

on

Una compañía de inteligencia artificial china llamada Deepseek está captando la atención de Estados Unidos, y enviando una ola de choque a través de Wall Street, debido a su nueva tecnología, que algunos expertos rivalizan con el de Chatgpt de OpenAi.

Deepseek también está atrapando a los inversores desprevenidos debido a los bajos costos de desarrollo de su aplicación AI, que el analista de valores de Wedbush, Dan Ives, vinculó a solo $ 6 millones. En comparación, Openai, Google y otras compañías importantes de EE. UU. Están en camino de invertir un total de aproximadamente $ 1 billón en IA en los próximos años, según Goldman Sachs.

El lunes, el despliegue de Deepseek arrancó las acciones de AI Stalwarts como Nvidia, el fabricante de chips avanzados diseñados para el desarrollo de IA, y la compañía holandesa ASML, otro fabricante de chips. La tecnología de la compañía china está planteando preguntas sobre si la demanda de chips de Nvidia podría recibir un golpe, así como si los inversores están sobrevalorando las acciones tecnológicas que han sido impulsadas por la promesa de IA, de Meta a Microsoft, dijeron los expertos.

“Deepseek ha tomado el mercado por asalto al hacer más con menos”, dijo Giuseppe Sette, presidente de la firma de investigación de mercado de IA Reflexividad, en un correo electrónico. “Esto muestra que con IA las sorpresas seguirán llegando en los próximos años”.

La última aplicación de Deepseek se produce pocos días después de que Trump anunció un nueva empresa de $ 500 mil millones Con el fabricante de chatgpt OpenAi, SoftBank y Oracle, denominado Stargate, que promocionó para garantizar “el futuro de la tecnología” en los Estados Unidos

Las acciones relacionadas con la IA recibieron un golpe el lunes por la mañana, con las acciones de Nvidia que cayeron un 17% a las 2:08 pm, hora del este, mientras que ASML arrojó un 7,6%. El índice NASDAQ pesado tecnológico cayó un 3,5%, o 698 puntos, en el comercio de la tarde, mientras que el S&P 500 disminuyó 1.7%. El promedio industrial Dow Jones Blue-chip agregó 0.4%.

A pesar de la fuerte caída en el Nasdaq, está lejos del peor día para el índice durante los últimos cinco años. La peor disminución de un día desde el 27 de enero de 2020 llegó el 16 de marzo de 2020, cuando el índice cayó más del 12% cuando Covid-19 Pandemic golpeó la economía.

¿Qué es Deepseek?

Deepseek es una compañía china privada fundada en julio de 2023 por Liang Wenfeng, un graduado de la Universidad de Zhejiang, una de las principales universidades de China, que financió la startup a través de su fondo de cobertura, según el MIT Technology Review. Liang tiene alrededor de $ 8 mil millones en activos, escribió Ives en una nota de investigación del 27 de enero.

Liang, quien previamente se había centrado en aplicar IA a invertir, había comprado un “stock de chips A100 Nvidia”, un tipo de tecnología que ahora está prohibida por la exportación a China. Esos chips se convirtieron en la base de Deepseek, informó la publicación del MIT.

Ben Reitzes, jefe de investigación de tecnología en Melius, dijo a los inversores en una nota que Deepseek hace avances legítimos como una herramienta de IA, que incluye un mejor aprendizaje y un uso más eficiente de la memoria, aunque expresó escepticismo sobre la “cantidad de chips utilizados”.

¿Deepseek está disponible en los Estados Unidos?

La aplicación AI de la compañía está disponible en la App Store de Apple, así como en línea en su sitio web. El servicio es gratuito y hasta el lunes por la mañana fue la mejor descarga en la tienda de Apple, aunque algunas personas tenían problemas para suscribirse a la aplicación.

En su sitio chino, Deepseek culpó a “ataques maliciosos a gran escala” en su servicio, lo que requiere que limite temporalmente nuevos registros. “Los usuarios existentes pueden iniciar sesión como de costumbre”, dijo la compañía en la publicación, que fue fechada poco después de la medianoche el 28 de enero en la hora local de China.


Nueva aplicación de IA china Deepseek impactando los precios de las acciones de las compañías tecnológicas del área de la bahía

04:16

La compañía lanzó su último modelo de IA el 20 de enero, lo que está causando que Wall Street reevalúe el sector de IA.

“La semana pasada, Deepseek lanzó un modelo que rivaliza con el chatgpt de OpenAI y el Llama 3.1 de Meta y fue el número 1 en la tienda de aplicaciones de Apple durante el fin de semana”, escribió Ives de Wedbush. “Deepseek construyó el modelo utilizando chips de capacidad reducida de NVIDIA. Lo cual es impresionante y, por lo tanto, ha causado una gran agita para las acciones tecnológicas estadounidenses con una presión masiva sobre NASDAQ esta mañana”.

¿En qué se diferencia Deepseek de otras aplicaciones de IA?

Deepseek es un modelo de lenguaje grande de código abierto que se basa en lo que se conoce como “informática de tiempo de inferencia”, que según Sette en los términos de Layman significa “Activan solo las partes más relevantes de su modelo para cada consulta, y que ahorra dinero y potencia de cálculo “.

Algunos expertos elogiaron la actuación de Deepseek, con el destacado inversionista tecnológico Marc Andreessen escribiendo en X el 24 de enero, “Deepseek R1 es uno de los avances más sorprendentes e impresionantes que he visto, y como código abierto, un regalo profundo para el mundo. “

Sin embargo, Ives dijo que es escéptico de que el servicio ganará terreno con las principales empresas estadounidenses.

“No US Global 2000 usará una startup china Deepseek para lanzar su infraestructura de IA y casos de uso”, escribió Ives. “Al final del día, solo hay una compañía de chips en el mundo que lanza casos autónomos, robóticos y de uso de IA más amplios y eso es Nvidia”.

¿Qué significa Deepseek para Nvidia y otras compañías tecnológicas?

Wall Street está tratando de evaluar el impacto a largo plazo de una herramienta de IA de bajo costo de China que rivaliza con ChatGPT y otras llamadas aplicaciones generativas de IA. También plantea preguntas sobre si Silicon Valley está gastando demasiado en los avances tecnológicos en el sector de IA, señaló Angelo Zino, analista senior de renta variable de CFRA Research, en un correo electrónico.

“El hecho de que se supone que esta tecnología requiere menos energía y es más rentable que los modelos con sede en EE. UU. Hace que los inversores de tecnología estadounidenses sean muy preocupados”, dijo Jay Woods, estratega global de Freedom Capital Markets.

Tampoco está claro qué tipo de retroceso o reacción podría provenir de la Casa Blanca, dado que Trump ha elevado la posibilidad de imponer nuevos aranceles a las importaciones chinas, aunque también le dio un aplazamiento de Tiktok de propiedad china al ordenar al Departamento de Justicia. no hacer cumplir Una prohibición inminente.


Cómo el proyecto AI de Trump afectará a los estadounidenses

05:32

Mientras tanto, las principales compañías tecnológicas, incluidas Meta y Microsoft, están programadas para informar las ganancias esta semana, donde los inversores probablemente escucharán más de sus ejecutivos sobre sus planes de IA y sus pensamientos sobre Deepseek, dijeron los expertos.

Algunos analistas de Wall Street piensan que la venta de acciones del lunes es una reacción exagerada, y señala que la enorme demanda de IA continuará levantando jugadores clave en el sector.

“Una cosa es entrenar un [large language] El modelo por menos dinero, pero acomodar la gran demanda de consumo de toda esta tecnología de IA todavía requerirá grandes cantidades de infraestructura “, dijo Adam Crisafulli de Vitalknowledge en un informe.

Continue Reading

Noticias

¿Qué es Deepseek, el nuevo rival chino de Openai?

Published

on

Un nuevo modelo de IA chino, creado por la startup con sede en Hangzhou, Deepseek, ha sorprendido a la industria de la IA estadounidense al superar a algunos de los principales modelos de OpenAi, desplazando a Chatgpt en la parte superior de la tienda de aplicaciones de iOS y usurpando a Meta como el principal proveedor de SOM llamadas herramientas de IA de código abierto. Todo lo cual ha planteado una pregunta crítica: a pesar de las sanciones estadounidenses a la capacidad de Beijing para acceder a semiconductores avanzados, ¿se está poniendo al día con los Estados Unidos en la carrera global de IA?

A un supuesto costo de solo $ 6 millones para entrenar, el nuevo modelo R1 de Deepseek, lanzado la semana pasada, pudo igualar el rendimiento de varias métricas de matemáticas y razonamiento del modelo O1 de OpenAi: el resultado de decenas de miles de millones de dólares en inversión por OpenAI y Su patrón Microsoft.

El modelo chino también es más barato para los usuarios. El acceso a sus versiones más poderosas cuesta un 95% menos que Operai y sus competidores. El resultado: la industria de la tecnología de los Estados Unidos se enfrenta repentinamente a un retador potencialmente más barato y más poderoso, inversores desconcertantes, que vendieron acciones tecnológicas estadounidenses el lunes por la mañana.

Sin embargo, no todos están convencidos. Algunos investigadores estadounidenses de IA han puesto en duda las afirmaciones de Deepseek sobre cuánto gastó y cuántos chips avanzados implementó para crear su modelo.

Pocos, sin embargo, disputan las impresionantes capacidades de Deepseek. “Deepseek R1 es el momento Sputnik de AI”, escribió el destacado capitalista de riesgo estadounidense Marc Andreessen en X, refiriéndose al momento en la Guerra Fría cuando la Unión Soviética logró poner un satélite en órbita por delante de los Estados Unidos.

Entonces, ¿qué es Deepseek y qué podría significar para la supremacía tecnológica estadounidense?

¿Qué es Deepseek?

Deepseek fue fundado hace menos de dos años por el Fondo de cobertura chino High Flyer como un laboratorio de investigación dedicado a perseguir la inteligencia general artificial, o AGI. Una serie de lanzamientos de código abierto a fines de 2024 colocó la startup en el mapa, incluido el modelo de lenguaje grande “V3”, que superó a todos los LLM de código abierto de Meta y rivalizó con el GPT4-O de código cerrado de OpenAi.

Según los informes, Liang Wenfeng, el CEO, dijo que había contratado jóvenes investigadores de informática con un lanzamiento para “resolver las preguntas más difíciles del mundo”, críticamente, sin apuntar a las ganancias. eficiente que los lanzamientos de 2024 de Deepseek provocaron una guerra de precios dentro de la industria china de IA, lo que obligó a los competidores a reducir los precios.

Este año, esa guerra de precios parece llegar a través del Océano Pacífico.

Sin embargo, la IA de Deepseek se ve diferente de sus competidores estadounidenses de una manera importante. A pesar de su alto rendimiento en las pruebas de razonamiento, los modelos de Deepseek están limitados por las políticas restrictivas de China con respecto a las críticas al gobernante Partido Comunista Chino (PCCh). Deepseek R1 se niega a responder preguntas sobre la masacre en la Plaza Tiananmen, Beijing, en 1989, por ejemplo. “Lo siento, eso está más allá de mi alcance actual. Hablemos de otra cosa ”, dijo el modelo cuando se considera el tiempo.

¿Qué podría significar el éxito de Deepseek para los gigantes tecnológicos estadounidenses?

En un momento en que Google, Meta, Microsoft, Amazon y docenas de sus competidores se preparan para gastar más decenas de miles de millones de dólares en una nueva infraestructura de IA, el éxito de Deepseek ha planteado una pregunta preocupante: ¿podrían coincidir las empresas tecnológicas chinas potencialmente, o incluso superar, ¿Su destreza técnica mientras gastaba significativamente menos?

Meta, que planea gastar $ 65 mil millones en infraestructura de IA este año, ya ha establecido cuatro “salas de guerra” para analizar los modelos de Deepseek, buscando averiguar cómo la empresa china había logrado capacitar a un modelo tan barato y usar las ideas para mejorar Sus propios modelos de Llama de código abierto, sitio de noticias tecnológicas, la información informó durante el fin de semana.

En los mercados financieros, el precio de las acciones de Nvidia cayó más del 15% el lunes por la mañana por temor a que se necesitaran menos chips de IA para capacitar a una IA poderosa de lo que se pensaba anteriormente. Otras acciones tecnológicas estadounidenses también se cotizaban más bajo.

“Mientras [DeepSeek R1] Es una buena noticia para los usuarios y la economía global, son malas noticias para las acciones tecnológicas estadounidenses ”, dice Luca Paolini, estratega jefe de Pictet Asset Management. “Puede resultar en una reducción nominal de la inversión de capital en IA y presión sobre los márgenes, en un momento en que las expectativas de valoración y crecimiento están muy estiradas”.

Pero la tecnología estadounidense no ha perdido, al menos todavía no.

Por ahora, el modelo “O1 Pro” de Openai todavía se considera el más avanzado del mundo. Sin embargo, el rendimiento de Deepseek R1 sugiere que China está mucho más cerca de la frontera de la IA de lo que se pensaba anteriormente, y que los modelos de código abierto han alcanzado sus homólogos de código cerrado.

Quizás aún más preocupante para compañías como OpenAi y Google, cuyos modelos son de código cerrado, es cuánto, o más bien, cuán poco, DePseek está cobrando a los consumidores a acceder a sus modelos más avanzados. Openai cobra $ 60 por millón de “tokens”, o segmentos de palabras, generados por su modelo más avanzado, O1. Por el contrario, Deepseek cobra $ 2.19 por el mismo número de tokens de R1, casi 30 veces menos.

“Eroja la base industrial, erosiona el margen, erosiona el incentivo para una mayor inversión de capital en Western [AI] escala de fuentes privadas “, dice Edouard Harris, director de tecnología de Gladstone AI, una firma de IA que trabaja en estrecha colaboración con el gobierno de los Estados Unidos.

… ¿Pero Deepseek es transparente?

El éxito de Deepseek fue aún más explosivo porque parecía cuestionar la efectividad de la estrategia del gobierno de los Estados Unidos para restringir el ecosistema de IA de China restringiendo la exportación de fichas poderosas o GPU, a Beijing. Si las afirmaciones de Deepseek son precisas, significa que China tiene la capacidad de crear modelos de IA poderosos a pesar de esas restricciones, subrayando los límites de la estrategia de los Estados Unidos.

Deepseek ha afirmado que está limitado por el acceso a chips, no en efectivo o talento, diciendo que entrenó a sus modelos V3 y R1 utilizando solo 2,000 chips Nvidia de segundo nivel. “El dinero nunca ha sido el problema para nosotros”, dijo el CEO de Deepseek, Liang Wenfeng, en 2024. “Las prohibiciones de los envíos de chips avanzados son el problema”. (La política actual de EE. UU. Hace que sea ilegal exportar a China los tipos más avanzados de chips de IA, los gustos de los cuales pueblan centros de datos de EE. UU. Utilizados por OpenAi y Microsoft).

¿Pero son ciertas esas afirmaciones? “Entiendo que Deepseek tiene 50,000 H100”, dijo recientemente el CEO de Scale AI, Alexandr Wang, a CNBC en Davos, refiriéndose a los chips de GPU de NVIDIA mejor potenciados actualmente en el mercado. “No pueden hablar de [them]porque está en contra de los controles de exportación lo que Estados Unidos ha establecido “. (Un grupo H100 de ese tamaño costaría en la región de miles de millones de dólares).

En una señal de cuán en serio, el PCCh está tomando la tecnología, Liang, el CEO de Deepseek, se reunió con el primer ministro de China, Li Qiang en Beijing, el lunes pasado. En esa reunión, Según los informes, Liang le dijo a Li que Deepseek necesita más chips. “Deepseek solo tiene acceso a unos pocos miles de GPU, y sin embargo, están logrando esto”, dice Jeremie Harris, CEO de Gladstone AI. “Entonces, esto plantea la pregunta obvia: ¿qué sucede cuando obtienen una asignación del Partido Comunista Chino para proceder a toda velocidad?”

A pesar de que China podría haber logrado un nivel sorprendente de capacidad de IA con menos chips, los expertos dicen que más potencia informática siempre seguirá siendo una ventaja estratégica. En ese frente, Estados Unidos sigue muy por delante. “Nunca es malo tener más”, dice Dean Ball, investigador de la Universidad George Mason. “No importa cuánto tengas de él, siempre lo usarás”.

¿Dónde deja esto la rivalidad tecnológica de Estados Unidos con China?

La respuesta corta: desde la perspectiva de Washington, en aguas inciertas.

En los días finales de la administración Biden, el asesor de seguridad nacional saliente Jake Sullivan advirtió que la velocidad del avance de la IA era “lo más importante que sucedió en el mundo en este momento”. Y pocos días después de su nuevo trabajo, el presidente Trump anunció una nueva empresa de $ 500 mil millones, respaldada por Operai y otros, para construir la infraestructura vital para la creación de “inteligencia general artificial”, el próximo salto hacia adelante en la IA, con sistemas lo suficientemente avanzados para Haga nuevos avances científicos y razones de manera que hasta ahora se haya mantenido en el ámbito de la ciencia ficción.

Leer más: Qué saber sobre ‘Stargate’, la nueva empresa de Openai anunciada por el presidente Trump

Y aunque quedan preguntas sobre el futuro de las restricciones de Chips en China, las prioridades de Washington eran evidentes en la orden ejecutiva de IA del presidente Trump, también firmada durante su primera semana en el cargo, lo que declaró que “es la política de los Estados Unidos sostener y mejorar El dominio global de IA de Estados Unidos para promover el florecimiento humano, la competitividad económica y la seguridad nacional “.

Mantener este dominio significará, al menos en parte, comprender exactamente lo que están haciendo las empresas tecnológicas chinas, así como protegerse de la propiedad intelectual de los Estados Unidos, dicen los expertos.

“Existe una buena posibilidad de que Deepseek y muchas de las otras grandes compañías chinas estén siendo apoyadas por el [Chinese] Gobierno, de manera más que una forma monetaria “, dice Edouard Harris de Gladstone Ai, quien también recomendó que las compañías de IA de EE. UU. Enduden sus medidas de seguridad.

¿A dónde va la IA desde aquí?

Desde diciembre, los nuevos modelos O1 y O3 de Openai han roto discos en las pruebas de razonamiento avanzado diseñadas para ser difíciles para los modelos de IA.

Leer más: Los modelos de IA se están volviendo más inteligentes. Las nuevas pruebas están corriendo para ponerse al día

Deepseek R1 hace algo similar, y en el proceso ejemplifica lo que muchos investigadores dicen que es un cambio de paradigma: en lugar de escalar la cantidad de potencia informática utilizada tren El modelo, los investigadores escalan la cantidad de tiempo (y, por lo tanto, calculan la energía y la electricidad) que el modelo usa para pensar en una respuesta a una consulta antes de responder. Es esta escala de lo que los investigadores llaman “computa de tiempo de prueba” la que distingue la nueva clase de “modelos de razonamiento”, como Deepseek R1 y Openi’s O1, de sus predecesores menos sofisticados. Muchos investigadores de IA creen que queda mucho espacio para la cabeza antes de que este paradigma alcance su límite.

Algunos investigadores de IA elogiaron el R1 de Deepseek como un avance en el mismo nivel que Alphazero de Deepmind, un modelo de 2017 que se volvió sobrehumano en el ajedrez de los juegos de mesa y pasó simplemente jugando contra sí mismo y mejorando, en lugar de observar cualquier juego humano.

Esto se debe a que R1 no estaba “previamente” en los datos marcados con humanos de la misma manera que otros LLM principales.

En cambio, los investigadores de Deepseek encontraron una manera de permitir que el modelo arrancara sus propias capacidades de razonamiento esencialmente desde cero.

“En lugar de enseñar explícitamente al modelo sobre cómo resolver un problema, simplemente le proporcionamos los incentivos correctos y desarrolla de forma autónoma estrategias avanzadas de resolución de problemas”, afirman.

El hallazgo es significativo porque sugiere que las capacidades de IA poderosas podrían surgir más rápidamente y con menos esfuerzo humano de lo que se pensaba, con solo la aplicación de más potencia informática. “Deepseek R1 es como GPT-1 de este paradigma de escala”, dice Ball.

En última instancia, el reciente progreso de la IA de China, en lugar de usurpar la fuerza de los Estados Unidos, podría ser el comienzo de un reordenamiento: un paso, en otras palabras, hacia un futuro donde, en lugar de un poder hegemónico, hay muchos centros competidores de poder de IA.

“China aún tendrá su propia superinteligencia (s) no más de un año después de los Estados Unidos, ausente [for example] Una guerra “, escribió Miles Brundage, un ex empleado de políticas de Operai, en X.” Entonces, a menos que desee una guerra (literal), debe tener una visión para navegar por los resultados de IA multipolar “.

Continue Reading

Trending