Connect with us

Noticias

Cómo la startup china de IA DeepSeek compite con OpenAI y Google

Published

on

El día después de Navidad, una pequeña empresa china llamada DeepSeek presentó un nuevo sistema de inteligencia artificial que podría igualar las capacidades de los chatbots de vanguardia de empresas como OpenAI y Google.

Sólo eso habría sido un hito. Pero el equipo detrás del sistema, llamado DeepSeek-V3, describió un paso aún mayor. En un artículo de investigación que explica cómo construyeron la tecnología, los ingenieros de DeepSeek dijeron que utilizaron sólo una fracción de los chips informáticos altamente especializados en los que confiaban las principales empresas de inteligencia artificial para entrenar sus sistemas.

Estos chips están en el centro de una tensa competencia tecnológica entre Estados Unidos y China. Mientras el gobierno de Estados Unidos trabaja para mantener el liderazgo del país en la carrera mundial de la IA, está tratando de limitar el número de chips potentes, como los fabricados por la empresa Nvidia de Silicon Valley, que pueden venderse a China y otros rivales.

Pero el desempeño del modelo DeepSeek plantea dudas sobre las consecuencias no deseadas de las restricciones comerciales del gobierno estadounidense. Los controles han obligado a los investigadores en China a ser creativos con una amplia gama de herramientas que están disponibles gratuitamente en Internet.

El chatbot DeepSeek respondió preguntas, resolvió problemas lógicos y escribió sus propios programas informáticos con tanta capacidad como cualquier otro que ya esté en el mercado, según las pruebas comparativas que las empresas estadounidenses de inteligencia artificial han estado utilizando.

Y se creó a bajo precio, desafiando la idea predominante de que sólo las empresas más grandes de la industria tecnológica (todas ellas con sede en Estados Unidos) podían permitirse el lujo de fabricar los sistemas de inteligencia artificial más avanzados. Los ingenieros chinos dijeron que sólo necesitaban unos 6 millones de dólares en potencia informática bruta para construir su nuevo sistema. Eso es aproximadamente 10 veces menos de lo que gastó el gigante tecnológico Meta en desarrollar su última tecnología de inteligencia artificial.

“El número de empresas que tienen 6 millones de dólares para gastar es muchísimo mayor que el número de empresas que tienen 100 millones o 1.000 millones de dólares para gastar”, dijo Chris V. Nicholson, inversor de la firma de capital de riesgo Page One Ventures, que se centra en Tecnologías de IA.

Desde que OpenAI desató el auge de la IA en 2022 con el lanzamiento de ChatGPT, muchos expertos e inversores habían llegado a la conclusión de que ninguna empresa podía competir con los líderes del mercado sin gastar cientos de millones de dólares en chips especializados.

Las principales empresas de inteligencia artificial del mundo entrenan sus chatbots utilizando supercomputadoras que utilizan hasta 16.000 chips, si no más. Los ingenieros de DeepSeek, por otro lado, dijeron que sólo necesitaban unos 2.000 chips informáticos especializados de Nvidia.

Las limitaciones de los chips en China obligaron a los ingenieros de DeepSeek a “entrenarlo de manera más eficiente para que aún pudiera ser competitivo”, dijo Jeffrey Ding, profesor asistente de la Universidad George Washington que se especializa en tecnología emergente y relaciones internacionales.

A principios de este mes, la administración Biden emitió nuevas reglas que tienen como objetivo evitar que China obtenga chips de IA avanzados a través de otros países. Las reglas se basan en múltiples rondas de restricciones anteriores que impiden que las empresas chinas puedan comprar o fabricar chips de computadora de última generación. El presidente Trump aún no ha indicado si aprobará las reglas o las rescindirá.

El gobierno de Estados Unidos ha tratado de mantener los chips avanzados fuera del alcance de las empresas chinas por temor a que puedan usarse con fines militares. En respuesta, algunas empresas en China han almacenado miles de chips, mientras que otras los obtuvieron de un próspero mercado clandestino de contrabandistas.

DeepSeek está dirigido por una empresa de negociación de acciones cuantitativa llamada High Flyer. Para 2021, había canalizado sus ganancias en la adquisición de miles de chips Nvidia, que utilizó para entrenar sus modelos anteriores. La compañía, que no respondió a las solicitudes de comentarios, se ha hecho conocida en China por captar talentos recién llegados de las mejores universidades con la promesa de altos salarios y la capacidad de seguir las preguntas de investigación que más despiertan su interés.

Zihan Wang, un ingeniero informático que trabajó en un modelo anterior de DeepSeek, dijo que la compañía también contrata personas sin ningún conocimiento en informática para ayudar a comprender la tecnología y ser capaz de generar poesía y resolver preguntas en el notoriamente difícil examen de ingreso a la universidad china.

DeepSeek no fabrica ningún producto para consumidores, por lo que sus ingenieros se centran exclusivamente en la investigación. Eso significa que su tecnología no está limitada por el aspecto más estricto de las regulaciones chinas sobre IA, que exigen que la tecnología orientada al consumidor cumpla con los controles gubernamentales sobre la información.

Las principales empresas estadounidenses siguen avanzando en los últimos avances en IA. En diciembre, OpenAI presentó un nuevo sistema de “razonamiento” llamado o3 que supera el rendimiento de las tecnologías existentes, aunque aún no está ampliamente disponible fuera de la empresa. Pero DeepSeek sigue demostrando que no se queda atrás. Este mes, lanzó su propio modelo de razonamiento impresionante.

(El New York Times ha demandado a OpenAI y su socio, Microsoft, acusándolos de infracción de derechos de autor de contenido de noticias relacionado con sistemas de inteligencia artificial. OpenAI y Microsoft han negado esas afirmaciones).

Una parte crucial de este mercado global que cambia rápidamente es una vieja idea: el software de código abierto. Como muchas otras empresas, DeepSeek ha abierto su último sistema de inteligencia artificial, lo que significa que ha compartido el código subyacente con otras empresas e investigadores. Esto permite que otros creen y distribuyan sus propios productos utilizando las mismas tecnologías.

Si bien los empleados de las grandes empresas tecnológicas chinas se limitan a colaborar con colegas, “si trabajas en código abierto, trabajas con talentos de todo el mundo”, dijo Yineng Zhang, ingeniero de software líder en Baseten en San Francisco que trabaja en el código abierto SGLang. proyecto. Ayuda a otras personas y empresas a crear productos utilizando el sistema de DeepSeek.

El ecosistema de código abierto para la IA cobró fuerza en 2023 cuando Meta compartió libremente un sistema de IA llamado LLama. Muchos asumieron que esta comunidad prosperaría sólo si empresas como Meta (gigantes tecnológicos con enormes centros de datos llenos de chips especializados) continuaran abriendo el código fuente de sus tecnologías. Pero DeepSeek y otros han demostrado que ellos también pueden ampliar los poderes de las tecnologías de código abierto”.

Muchos ejecutivos y expertos han argumentado que las grandes empresas estadounidenses no deberían abrir el código fuente de sus tecnologías porque podrían usarse para difundir desinformación o causar otros daños graves. Algunos legisladores estadounidenses han explorado la posibilidad de prevenir o limitar esta práctica.

Pero otros sostienen que si los reguladores frenan el progreso de la tecnología de código abierto en Estados Unidos, China obtendrá una ventaja significativa. Si las mejores tecnologías de código abierto provienen de China, argumentan, los desarrolladores estadounidenses construirán sus sistemas sobre esas tecnologías. A largo plazo, eso podría colocar a China en el centro de la investigación y el desarrollo de la IA.

“El centro de gravedad de la comunidad de código abierto se ha ido trasladando a China”, afirmó Ion Stoica, profesor de informática en la Universidad de California, Berkeley. “Esto podría ser un gran peligro para Estados Unidos”, porque permite a China acelerar el desarrollo de nuevas tecnologías.

Horas después de su toma de posesión, el presidente Trump rescindió una orden ejecutiva de la administración Biden que amenazaba con frenar las tecnologías de código abierto.

El Dr. Stoica y sus estudiantes construyeron recientemente un sistema de inteligencia artificial llamado Sky-T1 que rivaliza con el rendimiento del último sistema OpenAI, llamado OpenAI o1, en ciertas pruebas comparativas. Sólo necesitaban 450 dólares en potencia informática.

Lo hicieron basándose en dos tecnologías de código abierto lanzadas por el gigante tecnológico chino Alibaba.

Su sistema de 450 dólares no es tan poderoso como la tecnología de OpenAI o el nuevo sistema de DeepSeek. Y es poco probable que las técnicas que utilizaron produzcan sistemas que superen el rendimiento de las tecnologías líderes. Pero el proyecto demostró que incluso operaciones con recursos minúsculos pueden construir sistemas competitivos.

Reuven Cohen, consultor tecnológico de Toronto, ha estado utilizando DeepSeek-V3 desde finales de diciembre. Dice que es comparable a los últimos sistemas de OpenAI, Google y la nueva empresa Anthropic de San Francisco, y mucho más barato de usar.

“Para mí, DeepSeek es una forma de ahorrar dinero”, afirmó. “Éste es el tipo de tecnología que alguien como yo quiere utilizar”.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

Google Cloud Next 2025: Gemini y actualizaciones de AI de Agente, nuevas TPUS

Published

on

Pichai destacó que Géminis ahora impulsa cada uno de GoogleLos productos de medio billón de usuarios, incluidos siete con más de dos mil millones de usuarios, y se burlaron de la llegada de Gemini 2.5 Flash, un nuevo modelo de baja latencia optimizado para un razonamiento rápido y una rentabilidad.

Thomas Kurian, CEO de Google Cloudexpandido en esta visión: “Lo que alguna vez fue una posibilidad es ahora la realidad vibrante que estamos construyendo colectivamente”.

Kurian reveló que más de cuatro millones de desarrolladores ahora están construyendo con Gemini, mientras que el uso de Vertex Ai ha crecido 20 veces año tras año, impulsado por la creciente adopción de modelos como Gemini, Imagen y VEO.

Este aumento en el uso está respaldado por la vasta infraestructura de Google: 42 regiones, más de dos millones de millas de fibra submarina y terrestre, y más de 200 puntos de presencia a nivel mundial, todos accesibles para las empresas a través del nuevo servicio WAN en la nube.

En todos los modelos de IA, sistemas de agente, redes y seguridad, el mensaje de Google Cloud fue claro: esta no es solo una plataforma de IA; Es un motor de transformación de pila completa para la empresa.

Estos son todos los anuncios principales de Google Cloud Next 2025:

El CEO de Alphabet, Pichai, subió a la etapa de apertura para provocar el próximo modelo en el arsenal Ai de HyperScaler: Géminis 2.5 Flashun modelo de razonamiento de baja latencia. No se reveló un marco de tiempo de lanzamiento específico, pero el CEO dijo que representa una evolución de su popular modelo de caballo de batalla.

Google Cloud también proporcionó una actualización en VEO 2, Un modelo de generación de videos desarrollado por Google DeepMind, revelando que ahora está “listo para la producción” en la API de Géminis.

El modelo puede seguir instrucciones simples y complejas, así como simular la física del mundo real en videos de alta calidad que abarcan una amplia gama de estilos visuales.

Los primeros usuarios incluyen Wolf Games, que está utilizando VEO 2 para construir “experiencias cinematográficas” para su plataforma de juego de historia interactiva personalizada.

https://www.youtube.com/watch?v=-uqle4fmvka

Conozca el nuevo hardware de hipercomutadores: Ironwood

AI HyperComuter de Google Cloud es el caballo de batalla detrás de casi todas las cargas de trabajo de IA en su plataforma en la nube. El sistema de supercomputación integrado ahora presenta el Última iteración de su línea de hardware personalizadaUnidades de procesamiento de tensor (TPU).

Madera de hierroLa TPU de la 7ª generación ofrece 5 veces más capacidad de cómputo pico y 6x la capacidad de memoria de alto ancho de banda (HBM) en comparación con la generación previa, Trillium.

Las nuevas TPU de Ironwood vienen en dos configuraciones: 256 chips o 9,216 chips, cada una disponible como una cápsula de una sola escala, con la vaina más grande que ofrece 42.5 exafultos de cómputo.

El hardware HyperComuter está diseñado para ser 2 veces más eficiente de energía en comparación con Trillium, al tiempo que ofrece más valor por vatio.

Los desarrolladores ahora pueden acceder a Ironwood a través de la pila optimizada de Google Cloud en Pytorch y Jax.

Google Cloud vio al hiperscaler duplicar su AI agente Ofertas, presentando nuevas herramientas para permitir que las empresas construyan, implementen y escalaran sistemas de múltiples agentes.

En el corazón de las actualizaciones estaba la nueva Kit de desarrollo de agentes (ADK)-Un marco de código abierto que permite a los desarrolladores construir agentes de IA sofisticados en menos de 100 líneas de código. Ya está siendo utilizado por marcas como Renault y Revionics para automatizar los flujos de trabajo y la toma de decisiones.

Para implementar estos agentes en producción, Google introdujo Motor de agenteun tiempo de ejecución totalmente administrado en Vertex AI. Admite memoria a corto y largo plazo, herramientas de evaluación incorporadas e integración nativa con la plataforma Agentspace de Google para un intercambio interno seguro.

El segundo gran anuncio de agente fue el Protocolo de Agente2Agent (A2A) – Un estándar de interoperabilidad abierto que permite a los agentes comunicarse y colaborar en diferentes marcos como ADK, Langgraph y Crew.ai. Ya están a bordo más de 50 socios, incluidos Box, ServiceNow, Uipath y Deloitte.

Actualizaciones de redes: Cloud Wan, Reducciones de costos de servicio Gen AI

Las redes en el próximo 2025 se centraron en la escala para la IA y la mejora del rendimiento de la nube.

Un nuevo Interconexión de nube de 400 g e interconexión de nubellegando a finales de este año, promete 4X el ancho de banda para la incorporación de datos más rápidos y el entrenamiento de modelos de múltiples nubes.

Google Cloud también se introdujo Soporte para grupos de IA de hasta 30,000 GPU En una configuración sin bloqueo, ahora disponible en la vista previa, dirigida a sobrealimentar la capacitación y el rendimiento de inferencia.

Se han reducido los costos generativos de servicio de IA hasta hasta un 30%, con mejoras de rendimiento de hasta el 40%, gracias a innovaciones como GKE Inference Gateway.

Google también debutó Nube wanuna columna vertebral empresarial totalmente administrada que abre su infraestructura de red global para redes de área amplia. Diseñado para simplificar y asegurar arquitecturas WAN Enterprise, ofrece un rendimiento hasta un 40% más rápido en comparación con Internet público.

En el borde, Google anunció Programabilidad y rendimiento mejoradoscon extensiones de servicio ahora GA para equilibrio de carga en la nube. Cloud CDN Support está en camino, lo que permite a los desarrolladores personalizar el comportamiento de la aplicación en el borde utilizando estándares abiertos como WebAssembly.

https://www.youtube.com/watch?v=xzgu02ycsvc

Actualizaciones de seguridad: Google Unified Security, agentes de Géminis

La infraestructura empresarial está creciendo en complejidad, ampliando la superficie de ataque y sobrecargando a los equipos de seguridad aislados. ¿La respuesta de Google? Seguridad unificada de Google (Gus), que ahora está generalmente disponible.

Gus está diseñado para unificar la inteligencia de amenazas, las operaciones de seguridad, la seguridad en la nube y la navegación segura en una sola plataforma con IA, integrando la experiencia de la empresa. Mandante Subsidiaria para ofrecer una protección más escalable y eficiente.

La nueva solución de seguridad crea un tejido de datos de seguridad de búsqueda en toda la superficie de ataque, que ofrece visibilidad, detección y respuesta en tiempo real en redes, puntos finales, nubes y aplicaciones. Las señales de seguridad se enriquecen automáticamente con la inteligencia de amenazas de Google, y cada flujo de trabajo se simplifica con sus modelos insignia de IA Gemini.

Google también introdujo Agentes de seguridad con Géminis. Entre las nuevas herramientas de AI de agente incluyen un agente de triaje de alerta en las operaciones de seguridad de Google, que investiga automáticamente alertas, compila evidencia y realiza veredictos.

Un nuevo agente de análisis de malware en Google Amenazing Intelligence evalúa un código potencialmente malicioso, ejecuta scripts de deobfuscación y entrega veredictos con plena explicación. Ambos están previsamente en la Q2.

Asociaciones: Equipo Ups con Nvidia, Juniper, SAP y más

No sería una nube de Google a continuación sin una serie de asociaciones golpeadas o extendidas, y este año no fue diferente.

El hiperscaler amplió su asociación con Lumen Para mejorar las soluciones de nube y de red. El equipo se centrará en integrar WAN en la nube con los servicios de Lumen, proporcionar acceso directo a la fibra a las regiones de Google Cloud y ofrecer conexiones seguras y obtenidas de aire a Google Distributed Cloud.

Google Cloud también unió fuerzas con Nvidia Para llevar su familia Géminis de modelos de IA a los sistemas Blackwell del fabricante de chips. La medida ve que los modelos de Géminis están disponibles en el momento, lo que permite a los clientes bloquear la información confidencial, como los registros de pacientes, las transacciones financieras e información del gobierno clasificada.

“Al llevar nuestros modelos de Géminis en las instalaciones con el rendimiento innovador de Nvidia Blackwell y las capacidades informáticas confidenciales, estamos permitiendo a las empresas desbloquear todo el potencial de la IA agente”, dijo Sachin Gupta, vicepresidente y gerente general de infraestructura y soluciones en Google Cloud.

Sus modelos Géminis también están llegando a SAVIAEl centro de IA generativo en su plataforma de tecnología comercial. La hiperescala también agregó sus capacidades de video e inteligencia del habla para apoyar la generación (RAG) de recuperación multimodal para el aprendizaje basado en video y el descubrimiento de conocimiento en los productos SAP.

También anunciado fue una colaboración con Redes de enebro para acelerar los nuevos despliegues de campus y ramas empresariales. Los clientes podrán usar la solución WAN Cloud WAN de Google junto con Juniper Mist Wired, Wireless, NAC, Firewalls y Secure SD-WAN Solutions, lo que les permite conectar aplicaciones críticas y cargas de trabajo de IA, ya sea en Internet, en nubes o dentro de los centros de datos.

El hiperscaler se asoció con Oráculo Para presentar un programa de socios diseñado para permitir a Oracle y Google Cloud Partners ofrecer Oracle Database@Google Cloud a sus clientes.

Firma de almacenamiento de datos DataDirect Reds (DDN) también se unió a Google Cloud en su servicio de sistema de archivos paralelo de Luster Administrado, que proporciona hasta 1 TB/s de rendimiento para servicios de acceso rápido para empresas y startups que construyen AI y aplicaciones de computación de alto rendimiento (HPC).

Acentuar También amplió su asociación estratégica con Google Cloud, con la pareja comprometida a trabajar juntos para desarrollar soluciones de IA específicas de la industria.

Estas últimas asociaciones se suman a las que se escriben a principios de este año, como con Deutsche Telekom, con la pareja trabajando juntos en AI Avancement and Cloud Integration en la infraestructura de red del operador.

Google Cloud para impulsar la modernización de red de Deutsche Telekom con IA, Cloud

Google Cloud, Infovista unen fuerzas en la planificación de la red de RF

Google Cloud admite DT y Vodafone Italia con Ran-Driven AI y una revisión de datos

Continue Reading

Noticias

Operai golpea a Elon Musk con contador • El registro

Published

on

Operai ha contrarrestado al cofundador Elon Musk, acusándolo de tácticas ilegales e injustas para descarrilar sus planes de reestructuración y exigir que un juez lo responsabilice por el daño presuntamente infligido en la AI Super-Lab.

El contador considerable [PDF] y la respuesta a las afirmaciones de Musk se presentó ayer en el Tribunal Federal de California. Si bien acusa al magnate de Tesla de una amplia gama de comportamientos destinados a socavar las operaciones de OpenAI, incluido “acoso, interferencia y información errónea”, las dos reclamaciones de alivio de la Contadora se concentran en el intento de febrero de Musk para comprar el fabricante de ChatGPT por $ 97.375 mil millones. Si bien el equipo de Musk ha retratado la oferta como genuina, los abogados de OpenAi lo llaman algo completamente diferente.

En lugar de una oferta de adquisición seria, OpenAI afirma que la medida de Musk fue una “simulada” diseñada “para interferir con la reestructuración corporativa contemplada de OpenAI”. Musk ya no está involucrado en OpenAi y dirige un atuendo de inteligencia artificial rival, Xai, entre otros negocios.

“La carta no incluía evidencia de financiamiento para pagar el precio de compra de casi $ 100 mil millones”, dijo Openai en su presentación de contadores, y agregó que ninguno de los inversores enumerados en la carta de intención de Musk había hecho ninguna diligencia debida. Más tarde, un inversor admitió, según los registros de la corte, que la intención de Musk era obtener acceso a los materiales internos de Openi a través de los procedimientos legales y “detrás de la pared” en el Super Lab de respaldo de Microsoft.

“Aunque OpenAi reconoció la oferta como una finta, su mera existencia, y la tormenta de fuego de los medios que lo rodean, requirió OpenAi para gastar recursos significativos en la respuesta”, dijo el gigante de la IA.

Es ese esfuerzo, y la llamada “oferta simulada”, lo que llevó a OpenAi a acusar a Musk de prácticas comerciales injustas y fraudulentas, así como una interferencia tortuosa con prospectivo ventaja económica (es decir, cuando un tercero interrumpe un posible acuerdo en detrimento del demandante).

Operai está buscando un alivio cautelar para detener la supuesta interferencia y restitución de Musk por los recursos que, según los que afirma, respondieron a su oferta.

Le preguntamos a OpenAi qué esperaba lograr, y nos dirigió a la presentación de la corte y a sus comentarios realizados en la X de Musk, donde el negocio AI dijo que el contador estaba destinado a detener sus “tácticas de mala fe para reducir la velocidad de OpenAi y aprovechar el control de las innovaciones principales de la IA para su beneficio personal”.

[Musk] Intenté confiscar el control de OpenAi y fusionarlo con Tesla como un fin de lucro: sus propios correos electrónicos lo demuestran. Cuando no se salió con la suya, se quedó

“Elon nunca ha sido sobre la misión. Siempre ha tenido su propia agenda”, continuó Openai. “Trató de confiscar el control de OpenAi y fusionarlo con Tesla como una con fines de lucro: sus propios correos electrónicos lo demuestran. Cuando no se salió con la suya, se fue”.

La muy breve historia de una disputa multimillonaria

Para aquellos que han hecho todo lo posible para ignorar la disputa del jefe de Musk y Operai, Sam Altman, puede ser necesaria un poco de historia.

Musk fue uno de los cofundadores de OpenAi, pero se asaltó en 2018 luego de desacuerdos internos sobre el control y la dirección estratégica. Operai alega que el Oligarch SpaceX propuso fusionarse OpenAi con Tesla (que tiene objetivos autónomos impulsados ​​por IA) o buscó un control total, que el equipo de Altman rechazó, lo que llevó a su salida.

En un momento, el liderazgo de Openi temía que Musk se convertiría en un “dictador” de AGI, o poderosa inteligencia general artificial, si se le permitiera un control completo sobre el laboratorio, a juzgar por correos electrónicos surgió durante esta batalla legal.

“Usted declaró que no desea controlar el AGI final, pero durante esta negociación, nos ha demostrado que el control absoluto es extremadamente importante para usted”, escribió Musk, cofundador y mega-boffin Ilya Sutskever. “El objetivo de OpenAi es hacer el futuro el futuro y evitar una dictadura AGI”.

En marzo de 2024, Musk demandó a Openai y Altman alegando incumplimiento de contrato, prácticas comerciales injustas y fallas fiduciarias relacionadas con la estrecha asociación de OpenAI con Microsoft y el establecimiento de una subsidiaria con fines de lucro. (Openai comenzó como una organización sin fines de lucro).

Musk retiró esta demanda en junio del año pasado sin proporcionar una razón pública, pero presentó una casi idéntica un par de meses después. Afirmó el cambio de OpenAi hacia un modelo con fines de lucro contradecía su misión original de desarrollar IA en beneficio de la humanidad.

El equipo legal de Openai describió la queja de Musk como “Lurch[ing] De la teoría a la teoría, distorsione[ing] sus propias exhibiciones y comercio[ing] De principio a fin en conclusiones sin hechos y a menudo ad hominem “.

Operai niega que se esté convirtiendo en una empresa única con fines de lucro, afirmando en su contratación que su plan de reestructuración solo vería que su subsidiaria con fines de lucro se convirtió en una corporación de beneficios público. Ese movimiento es necesario, afirmado Openai, para permitir que el equipo compita mejor por el capital “al servicio de la misión de desarrollar AGI en beneficio de la humanidad”. Dicho esto, Operai continúa recaudando decenas de miles de millones de dólares en fondos, $ 40 mil millones tan recientemente como finales de marzo.

Un portavoz de Operai le dijo además El registro No tenía intención de abandonar su núcleo sin fines de lucro.

“Nuestra junta ha sido muy clara de que tenemos la intención de fortalecer la organización sin fines de lucro para que pueda cumplir su misión a largo plazo”, nos dijo Openai. “No lo estamos vendiendo, estamos duplicando su trabajo”.

Operai también nos señaló el anuncio de la semana pasada de una comisión que comprende expertos en salud, ciencia, educación y servicios públicos para guiar la evolución planificada de las ORG.

“Esperamos los aportes y los consejos de los líderes que tienen experiencia en organizaciones comunitarias sobre cómo podemos ayudarlos a lograr sus misiones”, dijo Openai en un comunicado enviado por correo electrónico.

Sin embargo, OpenAi tiene que completar su transición a una entidad con fines de lucro a fines de 2025 para asegurar que los $ 40 mil millones mencionados anteriormente en fondos dirigidos por SoftBank.

Es probable que la demanda de Musk solo desacelere, especialmente porque el juicio, según una orden previa al juicio esta semana, no se debe comenzar hasta marzo de 2026.

Ni Musk, famoso ahora, la grasa Eminence del presidente Trump, ni su equipo legal respondieron a preguntas para esta historia. ®

Continue Reading

Noticias

La generación de imágenes en chatgpt se ha mejorado mucho

Published

on

Resumen

  • La generación de imágenes 4O en ChatGPT ofrece imágenes fotorrealistas con una consistencia mejorada y sigue con precisión las instrucciones.

  • Los usuarios pueden convertir imágenes en diferentes estilos y refinarlas a través de indicaciones.

  • Las imágenes cargadas se pueden emplear como referencias, o ChatGPT puede utilizar su propia base de conocimiento.

Cuando Operai deja una nueva característica, a menudo hay una pequeña cantidad de zumbido entre las personas interesadas, pero rara vez rompe Internet. Sin embargo, con el lanzamiento de un modelo actualizado de generación de imágenes, ChatGPT hizo exactamente eso.

La generación de imágenes 4O ha reemplazado a Dall-E como la herramienta de generación de imágenes predeterminada en ChatGPT, y los resultados son muy impresionantes. Ha llevado a que las personas inundan Internet con imágenes que han generado utilizando la herramienta, y su popularidad parece haber tomado por sorpresa por sorpresa.

La generación de imágenes 4O está integrada en GPT-4O

Como su nombre indica, 4O Generación de imágenes está integrada en el modelo GPT-4O. Mientras esté utilizando ese modelo, no necesita hacer nada más que pedirle a ChatGPT que cree una imagen, y la generación de imágenes 4O llegará a funcionar. Algunos modelos, como O1, no le permiten crear imágenes, pero parece que 4O Generation de imágenes no se limita a GPT-4O. Intenté crear una imagen en GPT-4, y todavía usaba la generación de imágenes 4O en lugar del modelo Dall-E que se usaba anteriormente.

Si prefiere usar Dall-E por algún motivo, todavía hay un Dall-E GPT dedicado disponible en la tienda pública GPT. Puede usar esto para generar imágenes utilizando el modelo más antiguo y menos capaz. Hay poco uso para eso ahora, aparte de ver cuán mejor se ha vuelto la generación de imágenes.

Crear excelentes imágenes fotorrealistas

Una de las mejoras más obvias sobre Dall-E es que la generación de imágenes 4O puede producir algunas imágenes fotorrealistas excelentes, sin que tenga que preocuparse demasiado por la elaboración rápida. Mientras que las imágenes tardan un poco en generarse y revelan lentamente de arriba hacia abajo de una manera que recuerda cómo las imágenes se solucionan lentamente sobre el acceso telefónico, los resultados son muy superiores a lo que Dall-E podría producir.

Relacionado

La nueva generación de imágenes de Chatgpt se siente como un acceso telefónico de nuevo

Ver mis imágenes aparecer lentamente de arriba hacia abajo me lleva de regreso a los viejos tiempos.

Le pedí a Dall-E una imagen fotorrealista de un mono con un sombrero de copa, y esto es lo que me dio:

Una imagen de un mono con un sombrero de copa generado por Dall-e
Adam Davidson / How-To Geek / Dall-E

Esta es una imagen generada por la generación de imágenes 4O utilizando el mismo aviso:

Una imagen de un mono con un sombrero de copa
Adam Davidson / geek / chatgpt

La diferencia es asombrosa y, francamente, un poco aterradora. Hasta ahora, generalmente es posible saber si una imagen era generada por AI si parecía lo suficientemente fuerte para dedos adicionales o texto destrozado. Sin embargo, las imágenes que genera ChatGPT son muy difíciles de distinguir de lo real, y como se dice comúnmente sobre los nuevos desarrollos de IA, este es lo peor que jamás sean.

Puedes convertir imágenes en diferentes estilos

Una de las cosas que ha incorporado Internet desde el lanzamiento de 4O Generation de imágenes es la capacidad de pedirle a ChatGPT que convierta sus imágenes en diferentes estilos. Por ejemplo, puede subir una foto tuya y pedirle a ChatGPT que la cambie al estilo de Van Gogh. Esto no es algo nuevo, pero la calidad de los resultados es un gran paso adelante de Dall-E.

Una imagen de un mono convertido en el estilo de Van Gogh
Adam Davidson / geek / chatgpt

Esto hizo que muchas personas comenzaran a subir imágenes de sí mismas o de la cultura popular que se habían transformado en el estilo de Studio Ghibli, el popular estudio de animación detrás de películas clásicas como Enérgico y Mi vecino Totoro. Los resultados suelen ser impresionantes, pero provocó un debate en línea sobre cuán ético es usar AI para robar esencialmente el estilo de un artista sin su permiso. En el momento de escribir, sin embargo, todavía podía hacer imágenes al estilo de Studio Ghibli sin problemas.

Es fácil refinar imágenes a través de indicaciones

Otra mejora importante es que la generación de imágenes 4O tiene una excelente consistencia. Esto significa que si hay una pequeña cosa mal con su imagen, puede pedirle a ChatGPT que lo arregle, y dejará solo el resto de la imagen. Dall-E a menudo hará cambios importantes en el resto de la imagen cuando intente arreglar una parte de ella.

Esto hace que sea mucho más fácil obtener la imagen exacta que desea, que a menudo es una gran fuente de frustración con Dall-E. Tendría que probar varias veces incluso para acercarse a la imagen que quería, y a veces fallaría por completo. Ahora, por ejemplo, puede pedir tener el sombrero de copa del mono en un ángulo diferente, y el sombrero cambiará, pero el resto de la imagen permanecerá igual.

Una imagen de un mono en un sombrero con el sombrero movido a un ángulo de treinta grados
Adam Davidson / geek / chatgpt

Esta consistencia también lo hace excelente para producir múltiples imágenes de la misma persona o carácter. Puede pedir que el mismo personaje aparezca en una configuración diferente, y ChatGPT preservará la apariencia del personaje en su nueva imagen.

Chatgpt finalmente puede manejar el texto

Este es uno de los mayores cambios en la generación de imágenes 4O. Dall-E podría agregar texto a las imágenes, pero realmente, realmente luchó por hacerlo. Por lo general, recibirías un mensaje de texto que se parecía principalmente a las palabras que querías, pero que estaban muy ligeramente apagados. Suficiente para arruinar sus imágenes, al menos. Usando la generación de imágenes 4O, puede crear el texto exacto que desea, y genera sin problemas.

Una caricatura de cuatro paneles creada en ChatGPT.
Adam Davidson / geek / chatgpt

Esto, combinado con la consistencia mejorada, significa que puede crear cosas usando la generación de imágenes 4O que simplemente no eran posibles antes. Bosquejé un terrible dibujo de un alienígena de dibujos animados y pude crear una caricatura de cuatro paneles que usó ese personaje, completo con burbujas de habla con texto perfecto. Tomó más tiempo escribir el aviso que para generar mi dibujos animados completos.

4O La generación de imágenes seguirá las instrucciones

Esto es enorme. Uno de los mayores problemas que tuve con Dall-E es que a menudo se negaría a seguir una instrucción, especialmente si esa instrucción involucraba un negativo. Pasé horas tratando de generar una imagen de Santa con bigote pero sin barba (solo para ver cómo se vería, obviamente), y no importa lo que intentara, obtendría una barba completa cada vez.

La única forma en que logré acercarme al éxito fue pedirle que generara una imagen de Hercule Poirot disfrazada de Santa, e incluso entonces, tomó múltiples intentos antes de obtener una imagen sin la barba y un bigote blanco. Ahora, sin embargo, puedo obtener una imagen de Santa sin barba en el primer intento.

Una imagen de Santa con bigote pero sin barba.
Adam Davidson / geek / chatgpt

Sin embargo, la adhesión de instrucciones es aún más impresionante. Puede definir hasta 20 objetos diferentes, describiendo cada uno, y la generación de imágenes 4O seguirá las instrucciones para cada objeto. El ejemplo que ofrece OpenAI es para una cuadrícula 4×4 de emoji con formas y colores específicos, y ChatGPT puede crear una imagen con los 16 emoji exactamente como se describe.

Puede usar imágenes cargadas como referencias

Una desventaja de generar imágenes a partir de indicaciones es que describir lo que desea en una imagen puede ser difícil, pero describir el estilo de la imagen puede ser aún más difícil. Decirle a ChatGPT que produzca el aspecto exacto que tiene en la cabeza no siempre es tan fácil.

Afortunadamente, no solo necesitas usar texto. Puede cargar imágenes para indicar el tipo de estilo que desea para sus imágenes. CHATGPT usará estas imágenes para informar la imagen final que genera a partir de su mensaje.

Un mono con un sombrero de copa al estilo de Studio Ghibli.
Adam Davidson / geek / chatgpt

Si desea un elemento específico en su imagen, por ejemplo, puede cargar una imagen de él en ChatGPT. Si desea que las personas se encuentren en una pose específica, puede subir una imagen de personas que se encuentran en esa pose. Si encuentra una ilustración que desea que fuera una imagen fotorrealista, puede cargarla y pedirle a ChatGPT que lo convierta en una fotografía.

Incluso puede dibujar un bosquejo aproximado de cómo quiere que se vea la imagen, tomar una foto y subirlo a Chatgpt. Luego puede generar una imagen fotorrealista basada en su terrible boceto. Hace que sea mucho más fácil generar la imagen exacta que desea.

Las imágenes pueden llamar al conocimiento de Chatgpt.

La generación de imágenes 4O no se limita a la información en su mensaje o los archivos que carga. GPT-4O tiene su propia base de conocimiento a la que puede recurrir, para ayudarlo a crear las imágenes que desea. Las imágenes Studio Ghibli son un excelente ejemplo; No necesitas explicar cómo se ve Studio Ghibli Animation; Chatgpt ya lo sabe.

Una imagen de 8 bits que explica el ciclo del agua.
Adam Davidson / geek / chatgpt

Sin embargo, esto va mucho más allá de conocer diferentes estilos artísticos. Cualquier conocimiento que ChatGPT tenga se puede aplicar a sus imágenes. Por ejemplo, puede solicitar un diagrama que explique el ciclo del agua, y no necesita explicar cuál es el ciclo del agua; ChatGPT extraerá la información clave de su propio conocimiento.

4O La generación de imágenes no es perfecta (todavía)

4O La generación de imágenes es increíblemente buena. De hecho, es tan bueno que Sam Altman, el CEO de OpenAI, tuviera que agregar límites de tarifa porque las GPU de la compañía comenzaban a derretirse.

Inicialmente, puede crear tantas imágenes como quisiera, pero ahora a menudo verá un mensaje que le dice que debe esperar unos minutos antes de crear otra imagen. No es el único problema que puede encontrar con la generación de imágenes 4O.

Una familia de ardillas al estilo de los Simpson.
Adam Davidson / geek / chatgpt

También hay limitaciones en la creación de ciertos tipos de contenido. En teoría, al menos, no debería poder generar nada ofensivo o inapropiado. Si intenta crear imágenes con caracteres con derechos de autor, ChatGPT también puede rechazar. Las líneas están un poco borrosas aquí. Por lo general, puede crear personajes de un estilo similar, si no los personajes en sí, o evitar las restricciones utilizando indicaciones ligeramente vagas.

El seguimiento de las instrucciones no siempre funciona perfectamente, y todavía ocasionalmente también tengo problemas con el texto. Ahora es muy raro, pero ocasionalmente, arrojará una letra adicional, especialmente si agregar esa letra todavía hace que el texto sea una palabra válida. Sin embargo, generalmente puede corregir fácilmente estos errores con la próxima generación.


La generación de imágenes 4O es un salto considerable en la generación de imágenes de IA, con un fotorrealismo mejorado, una mejor consistencia y una instrucción significativamente mejor. Ahora es increíblemente fácil crear imágenes fotorrealistas que se ven exactamente como quieres.

Sin embargo, hay muchas preguntas éticas que esto plantea. Si eres un diseñador gráfico o un fotógrafo, esta actualización enviará escalofríos por la columna vertebral. Lo que no se puede negar es que esta actualización ha hecho que sea mucho más fácil para los usuarios de ChatGPT crear imágenes muy impresionantes, sean cuales sean los dilemas éticos.

Continue Reading

Trending