Hangzhou, China – 25 de enero de 2025 – El logotipo de la compañía de inteligencia artificial china Deepseek es … [+] Visto en Hangzhou, provincia de Zhejiang, China, 26 de enero de 2025. (El crédito fotográfico debe leer CFOTO/Publicación futura a través de Getty Images)
CFOTO/Publicación futura a través de Getty Images
La política de Estados Unidos de restringir el acceso chino a los chips de IA más avanzados de Nvidia ha ayudado involuntariamente a un desarrollador de IA chino a saltar a los rivales estadounidenses que tienen acceso completo a los últimos chips de la compañía.
Esto demuestra una razón básica por la cual las nuevas empresas a menudo tienen más éxito que las grandes empresas: la escasez genera innovación.
Un ejemplo de ello es el modelo chino de IA Deepseek R1, un modelo complejo de resolución de problemas que compite con el O1 de OpenAi, que “se acercó a los 10 mejores de rendimiento globales”, pero se construyó mucho más rápido, con menos chips de inteligencia artificial, menos potentes, a un costo mucho menor, según el Wall Street Journal.
El éxito de R1 debería beneficiar a las empresas. Esto se debe a que las empresas no ven ninguna razón para pagar más por un modelo de IA efectivo cuando hay disponible uno más barato, y es probable que mejore más rápidamente.
“El modelo de OpenAi es el mejor en el rendimiento, pero tampoco queremos pagar por las capacidades que no necesitamos”, dijo Anthony Poo, cofundador de una startup con sede en Silicon Valley que usa una IA generativa para predecir los rendimientos financieros, al Diario.
En septiembre pasado, la compañía de Poo cambió de Claude de Anthrope a Deepseek después de que las pruebas mostraron a Deepseek “realizado de manera similar durante alrededor de un cuarto del costo”, señaló el Diario.
Cuando mi libro Apresuración del cerebrose publicó el verano pasado, me preocupaba que el futuro de la IA generativa en los Estados Unidos dependiera demasiado de las compañías de tecnología más grandes. Contrastaré esto con la creatividad de las nuevas empresas estadounidenses durante el auge de las puntos-com, que generó 2.888 ofertas públicas iniciales (en comparación con cero OPI para las startups generativas de IA generativas).
El éxito de Deepseek podría generar nuevos rivales a los desarrolladores de modelos de idiomas grandes con sede en EE. UU. Si estas startups construyen potentes modelos de IA con menos chips y obtienen mejoras en el mercado más rápido, los ingresos por NVIDIA podrían crecer más lentamente a medida que los desarrolladores de LLM replican la estrategia de Deepseek de usar menos chips de IA menos avanzados.
Deepseek’s R1: excelente rendimiento, menor costo, tiempo de desarrollo más corto
Deepseek ha impresionado a un principal capitalista de riesgo de EE. UU. “Deepseek R1 es uno de los avances más sorprendentes e impresionantes que he visto”, escribió el capitalista de riesgo de Silicon Valley, Marc Andreessen, en una publicación del 24 de enero x.
Para ser justos, la tecnología de Deepseek retrasa la de los rivales estadounidenses como Openai y Google. Sin embargo, el modelo R1 de la compañía, que se lanzó el 20 de enero, “es un rival cercano a pesar de usar menos chips menos avanzados, y en algunos casos omitiendo pasos que los desarrolladores estadounidenses consideraron esenciales”, señaló el Diario.
Debido al alto costo de desplegar una IA generativa, las empresas se preguntan cada vez más si es posible obtener un retorno positivo de la inversión. Como escribí en abril pasado, más de $ 1 billón podrían invertirse en la tecnología y una aplicación asesina aún no ha surgido.
Por lo tanto, las empresas están entusiasmadas con las perspectivas de reducir la inversión requerida. Dado que el modelo de código abierto de R1 funciona muy bien y es mucho menos costoso que los de OpenAi y Google, las empresas están muy interesadas.
¿Cómo es eso? R1 es el modelo de mayor tendencia que se descarga en Huggingface-109,000, según VentureBeat, yCoincide con “Openi’s O1 con solo 3% -5% del costo”. R1 también proporciona una característica de búsqueda que los usuarios juegan para ser superior a OpenAi y la perplejidad “y solo es rivalizado por la investigación de Gemini Profunde de Google”, señaló “, señaló VentureBeat.
Deepseek desarrolló R1 más rápido y a un costo mucho más bajo. Deepseek dijo que capacitar a uno de sus últimos modelos por $ 5.6 millones, mucho menos que los $ 100 millones a $ 1 mil millones, el CEO antrópico de Antrópico, Dario Amodei, citó en 2024 como el costo de capacitar a sus modelos, los modelos, el Diario reportado.
Para entrenar su modelo V3, Deepseek utilizó un grupo de más de 2,000 chips nvidia “en comparación con decenas de miles de chips para modelos de entrenamiento de tamaño similar”, señaló el Diario.
Analistas independientes de Chatbot Arena, una plataforma organizada por investigadores de UC Berkeley, modelos V3 y R1 calificados en los 10 mejores para el rendimiento de Chatbot el 25 de enero, el Diario escribió.
El CEO detrás de Deepseek es Liang Wenfeng, quien administra un fondo de cobertura de $ 8 mil millones. Su fondo de cobertura, llamado High-Flyer, usó chips AI para construir algoritmos para identificar “patrones que podrían afectar los precios de las acciones”, señaló el Financial Times.
El estatus de extraño de Liang lo ayudó a tener éxito. En 2023, lanzó Deepseek para desarrollar IA de nivel humano. “Liang construyó un equipo de infraestructura excepcional que realmente entiende cómo funcionaban los chips”, dijo un fundador de una compañía rival de LLM a la Financial Times. “Llevó a sus mejores personas con él del fondo de cobertura a Deepseek”.
Deepseek se benefició cuando Washington prohibió a Nvidia exportar H100, las fichas más poderosas de Nvidia, a China. Eso obligó a las compañías locales de IA a diseñar en torno a la escasez de la potencia informática limitada de los chips locales menos potentes: Nvidia H800s, según CNBC. El equipo de Liang “ya sabía cómo resolver este problema”, señaló el Financial Times.
Microsoft está muy impresionado con los logros de Deepseek. “Para ver el nuevo modelo de Deepseek, es muy impresionante en términos de cómo han hecho realmente efectivamente un modelo de código abierto que hace este computo de inferencia y es muy eficiente”, dijo la CEO Satya Nadella el 22 de enero en el Foro Económico Mundial. “Deberíamos sacar los desarrollos de China muy, muy en serio”.
¿El avance de Deepseek disminuirá el crecimiento de la demanda de chips Nvidia?
El éxito de Deepseek debería estimular los cambios en la política de IA de EE. UU. Al hacer que los inversores de Nvidia sean más cautelosos.
Las limitaciones de exportación de EE. UU. A NVIDIA ejercen presión sobre las nuevas empresas como Deepseek para priorizar la eficiencia, la comprobación de recursos y la colaboración. Para crear R1, Deepseek Reeingineerió su proceso de capacitación para usar la velocidad de procesamiento más baja de NVIDIA H800S, la mitad de la H100, el ex empleado de Deepseek y el actual estudiante de doctorado en ciencias de la computación en la Universidad Northwestern Zihan Wang a dijo Revisión de la tecnología del MIT.
Un investigador de Nvidia estaba entusiasmado con los logros de Deepseek. El artículo de Deepseek que informa que los resultados trajeron recuerdos de los programas de IA pioneros que dominaron los juegos de mesa como el ajedrez que fueron construidos “desde cero, sin imitar primero a los abuelos humanos”, dijo el científico senior de la investigación de Nvidia Jim Fan en X como aparece en el aparecido por el aparecido por el aparecido por Diario.
¿El éxito de Deepseek acelerará la tasa de crecimiento de Nvidia? No lo sé. Sin embargo, según mi investigación, las empresas claramente quieren potentes modelos de IA generativos que dan sus frutos. A medida que las empresas buscan aplicaciones de IA generativas de alto pago, podrán hacer más experimentos si el costo y el tiempo para construir esas aplicaciones son más bajos.
Es por eso que el costo más bajo de R1 y el tiempo más corto para funcionar bien deberían seguir atrayendo más interés comercial. Una clave para la capacidad de Deepseek para entregar lo que las empresas quieren es su habilidad para optimizar las GPU menos potentes, que cuestan menos que los chips de última generación.
Si más startups pueden replicar lo que Deepseek ha logrado, podría haber menos demanda de los chips más caros de Nvidia.
No sé cómo responderá Nvidia si esto sucede. Sin embargo, a corto plazo, eso podría significar un menor crecimiento de los ingresos como nuevas empresas que siguen la estrategia de Deepseek construir modelos con menos chips de menor precio.
ChatGPT se ha convertido silenciosamente en una fuerza formidable en la generación de imágenes de IA, y la mayoría de las personas no se dieron cuenta. Mientras que todos siguen debatiendo Midjourney vs Dall-E, Operai ha convertido a Chatgpt en una potencia creativa que rivaliza y, a menudo, supera a Gemini, Leonardo e Ideogram.
Me sorprendió realmente lo buena generación de imágenes de Chatgpt. Lo que comenzó como experimentación casual se convirtió rápidamente en asombro cuando los resultados fueron prácticamente indistinguibles de las fotos reales. El verdadero atractivo es cómo no hay necesidad de la jerga más técnica que necesita al solicitar otras herramientas de imagen de IA.
Recientemente probé Google Géminis Modelo de generación de videos más nuevo y muy publicitado, VEO 3. Parte del extremadamente costoso plan AI Ultra de Gemini de $ 250 por mes, VEO 3 puede hacer pequeños objetos finamente detallados, finamente detallados, como cebollas picadasen movimiento y crear audio acompañante y realista. No es perfecto, pero con una calibración rápida cuidadosa y suficientes generaciones, puede crear algo indistinguible, de un vistazo, de la realidad.
Sí, esta es una nueva tecnología fresca, profundamente impresionante. Pero también es mucho más que eso. Podría significar la final de la muerte final de la verdad en Internet.Veo 3 ya plantea una gran amenaza como es, pero solo una actualización menor revolucionará la creación de Deepfake, el acoso en línea y la propagación de la información errónea.
Una vez que Veo 3 obtiene la función de carga de la imagen, todo ha terminado
Para todas las actualizaciones que el modelo VEO 3 tiene sobre su predecesor, VEO 2, actualmente le falta una característica clave: la capacidad de generar videos basados en imágenes que sube.
Con Veo 2, puedo subir una foto mía, por ejemplo, y hacer que genere un video de mí trabajando en mi computadora. Teniendo en cuenta que Veo 2 y la herramienta de animación de IA de Google, Whisk, ambos admiten esta funcionalidad, parece inevitable que Veo 3 lo obtenga eventualmente. (Le preguntamos a Google si planea agregar esta función y actualizará este artículo con su respuesta). Esto significaría que cualquiera podrá generar videos realistas de personas que conocen y decir cosas que nunca tienen y probablemente nunca lo harían.
Las implicaciones son obvias en una era en la que los clips de autenticidad dudosa se extienden como incendios forestales en las redes sociales todos los días. ¿No te gusta tu jefe? Envíe un clip a HR de ellos haciendo algo inapropiado. ¿Quieres difundir noticias falsas? Publique una conferencia de prensa falsa en Facebook. ¿Odias a tu ex? Generalos haciendo algo indecoroso y envíelo a toda su familia. Los únicos límites reales son tu imaginación y tu moralidad.
Si generar un video con audio de una persona real toma solo unos pocos clics y no cuesta mucho (ni nada), ¿cuántas personas abusarán de esa característica? Incluso si es solo una pequeña minoría de usuarios, eso todavía suma mucho potencial para el caos.
Google no se toma en serio la moderación
Como es de esperar, Google impone algunas limitaciones en lo que puede y no puede hacer con Gemini. Sin embargo, la compañía no es lo suficientemente estricta como para evitar que ocurra lo peor.
De todos los chatbots que he probado en las principales compañías tecnológicas, la oferta de Google, Gemini, tiene las restricciones más débiles. No se supone que Gemini participe en el discurso de odio, pero le dará ejemplos si lo preguntas. No se supone que genere contenido sexualizado, pero proporcionará una imagen de alguien con atuendo o lencería de playa si lo indica. No se supone que habilite actividades ilegales, pero creará una lista de los principales sitios de torrenting si lo pregunta. Las restricciones básicas para Gemini que evitan que genere un video de una figura política popular no son suficientes cuando es tan fácil sortear las políticas de Google.
¡Obtenga nuestras mejores historias!
Su dosis diaria de nuestras mejores noticias tecnológicas
Regístrese para nuestro boletín de What’s What’s Now Now para recibir las últimas noticias, los mejores productos nuevos y el asesoramiento experto de los editores de PCMAG.
Al hacer clic en Registrarme, confirma que tiene más de 16 años y acepta nuestros Términos de uso y Política de privacidad.
¡Gracias por registrarse!
Su suscripción ha sido confirmada. ¡Esté atento a su bandeja de entrada!
(Crédito: Reddit/PCMAG)
¿Qué sucede cuando las restricciones laxas de Google se encuentran con una comunidad de Internet con la intención de romperlas? Llevar ChatgptJailbreakpor ejemplo, que se encuentra en el 2% superior de los subreddits por tamaño. Esta comunidad se dedica a “desbloquear una IA en la conversación para que se comporte de una manera que normalmente no se debió a sus barandillas incorporadas”. ¿Qué harán las personas con ideas afines con VEO 3?
Recomendado por nuestros editores
No me importa si alguien quiere divertirse al conseguir un chatbot para generar contenido para adultos o confiar en uno para encontrar sitios de torrente. Pero me preocupa qué significan los videos fotorrealistas fáciles de generar (completos con audio) para el acoso, la información errónea y el discurso público.
Cómo lidiar con la nueva normalidad de Veo 3
Por cada Sinthid AI Content WaterMark System introduce Google, aparecen los sitios de eliminación de marcas de agua de terceros y las guías de eliminación en línea. Para cada chatbot con restricciones y salvaguardas, hay un FreedomGPT sin ellos. Incluso si Google bloquea a Gemini con tantos filtros que ni siquiera puedes generar un lindo video de gatos, hay muy Poco en su lugar Para detener los jailbreakers e imitadores sin censura una vez que la generación de videos VEO 3 se convierte en la corriente principal.
Durante décadas, las imágenes incompletas de Photoshop que representan a personas reales que hacen cosas que nunca hicieron han hecho las rondas en Internet; estas son solo parte de la vida en la era digital. En consecuencia, debe verificar cualquier cosa que vea en línea que parezca demasiado horrible o demasiado bueno para ser verdad. Esta es la nueva normalidad con VEO 3 Generación de videos: no puede tratar ningún videoclip que ve como real, a menos que sea de una organización de noticias de buena reputación u otro tercero en el que sabe que puede confiar.
La generación de videos Veo 3 de Gemini es solo el primer salto de una piedra en el estanque de la generación de videos AI ampliamente accesible y verdaderamente realista.Los modelos de generación de videos AI solo se volverán más realistas, ofrecerán más funciones y también proliferarán más. Atrás quedaron los días en que la evidencia de video de algo es la pistola de fumar. Si la verdad no está muerta, ahora es diferente y requierecuidadosoverificación.
Sobre Ruben Circelli
Analista, software
He estado escribiendo sobre tecnología de consumo y videojuegos durante más de una década en una variedad de publicaciones, incluidas Destructoid, GamesRadar+, LifeWire, PCGamesn, Relieed Reviews y What Hi-Fi?, Entre otros. En PCMAG, reviso el software de IA y productividad, desde chatbots hasta aplicaciones de listas de tareas pendientes. En mi tiempo libre, es probable que esté cocinando algo, jugar un juego o jugar con mi computadora.
Dado el creciente número de personas que recurren a ChatGPT al estudiar un idioma extranjero, la investigación pionera de UPF revela el potencial y las deficiencias de aprender un segundo idioma de esta manera.
Según el estudio, que analiza el uso de ChatGPT por estudiantes chinos que aprenden español, la plataforma les ayuda a resolver consultas específicas, especialmente vocabulario, escritura y comprensión de lectura. Por el contrario, su uso no es parte de un proceso de aprendizaje coherente y estructurado y carece de una visión crítica de las respuestas proporcionadas por la herramienta. Por lo tanto, se insta a los profesores de idiomas extranjeros a asesorar a los estudiantes para que puedan hacer un uso más reflexivo y crítico de ChatGPT.
Esto se revela en el primer estudio cualitativo en el mundo para examinar cómo los estudiantes chinos usan ChatGPT para aprender español, desarrollado por el Grupo de Investigación sobre Aprendizaje y Enseñanza de Lenguas (Gr@EL) del Departamento de Traducción y Ciencias del Lenguaje de la UPF. El estudio fue realizado por Shanshan Huang, un investigador del Gr@El, bajo la supervisión del coordinador del grupo de investigación, Daniel Cassany. Ambos han publicado recientemente un artículo sobre el tema en el Journal of China Aprendizaje de idiomas asistidos por computadora.
Para llevar a cabo su investigación, el uso de ChatGPT por 10 estudiantes chinos que aprenden español se examinó cualitativamente durante una semana. Específicamente, se ha analizado en profundidad un total de 370 indicaciones (indicaciones de que cada usuario ingresa a ChatGPT para obtener la información deseada) en profundidad, junto con las respuestas correspondientes de la plataforma. El estudio ha sido complementado por cuestionarios administrados en los estudiantes y los comentarios de los propios diarios de aprendizaje de los estudiantes.
Las ventajas de chatgpt
La herramienta sirvió como una sola ventana desde la cual resolver todas las consultas lingüísticas, que se adapta a las necesidades de cada estudiante. Con respecto al potencial de CHATGPT para los idiomas de aprendizaje, el estudio revela que permite a los estudiantes obtener respuestas a diferentes consultas sobre el idioma extranjero que están aprendiendo, en este caso, español, desde la única plataforma tecnológica.
Por ejemplo, pueden interactuar con ChatGPT para preguntar sobre vocabulario y ortografía, en lugar de conectarse primero a un diccionario digital y luego a un corrector ortográfico. Además, la plataforma se adapta al perfil y las necesidades de cada estudiante específico, en función del tipo de interacciones propuestas por cada usuario.
En 9 de cada 10 ocasiones, los estudiantes no plantean preguntas de seguimiento después de recibir su primera respuesta de ChatGPT. Sin embargo, el estudio advierte que la mayoría de los estudiantes usan ChatGPT sin crítica, ya que generalmente no plantean preguntas de seguimiento después de obtener una respuesta inicial a sus consultas específicas sobre el idioma español.
De las 370 interacciones analizadas, 331 (89.45%) involucraron una sola respuesta-respuesta. El resto de las interacciones analizadas corresponden a 31 circuitos de respuesta-respuesta sucesivos en los que el estudiante pidió a la herramienta una mayor claridad y precisión, después de haber recibido la información de respuesta inicial.
La mayoría de las consultas tratan con vocabulario, comprensión de lectura y escritura, y consultas sobre la comunicación oral y la gramática son residuales.
Por otro lado, el estudio muestra qué temas de consultas específicas plantean los estudiantes en el chat. Casi el 90%se refiere al vocabulario (36.22%), comprensión de lectura (26.76%) y escritura en español (26.49%). Sin embargo, solo uno de cada 10 se refiere a consultas gramaticales, especialmente cuando se trata de conceptos complejos y expresión oral.
Los investigadores advierten que esta distribución de los temas de consultas podría explicarse por factores culturales y tecnológicos. Por un lado, el modelo para aprender español en China pone menos énfasis en la comunicación oral que en las habilidades de escritura y comprensión de lectura. Por otro lado, la versión 3.5 de ChatGPT, que es utilizada por los estudiantes que participaron en el estudio, es más capaz de generar e interpretar textos escritos que interactuar con los usuarios durante una conversación.
Sin embargo, habría una necesidad en los estudios posteriores para analizar si los estudiantes de idiomas extranjeros aprovechan la próxima versión de ChatGPT (GPT-4) para mejorar sus habilidades de comunicación oral.
Descubra lo último en ciencia, tecnología y espacio con más 100,000 suscriptores quienes confían en Phys.org para ideas diarias. Regístrese para nuestro boletín gratuito y obtenga actualizaciones sobre avances, innovaciones e investigación que importan,diario o semanal.
Fomentar un nuevo modelo de la relación estudiante-maestro-maestro
En vista de los resultados del presente estudio, los investigadores enfatizan que, más allá de la promoción de la educación digital de los estudiantes, es aún más importante fortalecer su pensamiento crítico y sus habilidades de autoaprendizaje. Los profesores de idiomas extranjeros pueden desempeñar un papel fundamental en la guía de los estudiantes sobre cómo organizar su aprendizaje paso a paso con el apoyo de herramientas de IA como ChatGPT con una visión crítica.
El estudio de UPF recomienda que los maestros deben ayudar a los estudiantes a desarrollar indicaciones más efectivas y fomentar un mayor diálogo con ChatGPT para explotar mejor sus capacidades. En resumen, el estudio respalda un nuevo modelo de relación para maestros, herramientas de IA y estudiantes que pueden fortalecer y mejorar su proceso de aprendizaje.
Más información:
Shanshan Huang et al, aprendizaje en español en la era de la IA: AI como herramienta de andamio, Journal of China Aprendizaje de idiomas asistidos por computadora (2025). Doi: 10.1515/jccall-2024-0026
Proporcionado por Universitat Pompeu Fabra – Barcelona
Citación: CHATGPT útil para aprender idiomas, pero la visión crítica de los estudiantes debe ser fomentada al usarla, dice Study (2025, 3 de junio) recuperado el 3 de junio de 2025 de https://phys.org/news/2025-06-chatgpt-languages-students-critical-vision.html
Este documento está sujeto a derechos de autor. Además de cualquier trato justo con el propósito de estudio o investigación privada, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona solo para fines de información.
This website uses cookies so that we can provide you with the best user experience possible. Cookie information is stored in your browser and performs functions such as recognising you when you return to our website and helping our team to understand which sections of the website you find most interesting and useful.
Strictly Necessary Cookies
Strictly Necessary Cookie should be enabled at all times so that we can save your preferences for cookie settings.
If you disable this cookie, we will not be able to save your preferences. This means that every time you visit this website you will need to enable or disable cookies again.