Connect with us

Noticias

ChatGPT parece entender el ajedrez

Published

on

¿Le gustaría gastar $200 al mes en una suscripción a ChatGPT? Sí, yo tampoco. Si la versión gratuita no es la solución a todos tus problemas, ¿cómo sabes que la versión premium lo es? ¿Cómo sabes que no perderás mucho tiempo refinando las indicaciones en la versión premium?

La eficacia de ChatGPT, al menos la versión gratuita, tiende a ser inversamente proporcional a la importancia de la tarea. Si se le ocurre un pensamiento aleatorio y desea ejecutarlo mediante ChatGPT, podría brindarle resultados fenomenales. O puede que te dé basura, pero no estás emocionalmente interesado en que sea bueno.

¿Pero para algo tan importante que realmente considerarías pagar $200 al mes? Definitivamente es menos de lo que costaría contratar a un redactor publicitario profesional, un abogado o un consultor. Pero ChatGPT no está sujeto a los mismos estándares de conducta profesional que usted esperaría legítimamente de un médico o un abogado, ni debería estarlo.

ChatGPT podría ser bueno para estudiar un pasatiempo. Como, en mi caso, el ajedrez. No soy un jugador de ajedrez profesional en ningún nivel. No necesito contratar a un entrenador de ajedrez profesional para que me prepare para algún partido importante que se avecina. E incluso si lo fuera, no confiaría en ChatGPT para sustituir a un entrenador humano real que realmente ha experimentado lo que es estar en una partida de ajedrez con dinero y reputación en juego.

Por otro lado, para ayudarme con un estudio informal de ajedrez, ChatGPT podría ser la solución. Probablemente más para el estudio de aperturas y medio juego que para los finales.

Algunos consideran que ChatGPT es el principal exponente de la “inteligencia artificial” hasta la fecha. Para empezar, ese es un término amplio y se utiliza incorrectamente de manera aún más amplia.

La inteligencia artificial “no existe, pero de todos modos lo arruinará todo”, es el título de uno de los vídeos de YouTube de la astrofísica Angela Collier (en ese vídeo cita el precio de ChatGPT Pro en 196 dólares al mes).

Mucho más claro, uno de los videos de YouTube del comediante Adam Conover se titula “AI is BS”. En ese video, Conover explica que hemos llegado al punto en que absolutamente cualquier programa de computadora que toma la entrada del usuario y proporciona una salida basada en esa la entrada se llama “IA”

Tomemos, por ejemplo, un pequeño programa que toma un número entero y le dice si es primo o no. Puedes saber que un número como 38500 no es primo con solo mirarlo. Pero el programa de ejemplo probablemente comenzaría comprobando si 2 divide el número en partes iguales.

Ahora considere un número como 38525. El programa de ejemplo probablemente probaría 2 y 3 como divisores, con suerte al menos estaría optimizado para omitir 4 e ir directamente a 5, que en este ejemplo es el divisor mínimo primo.

Eso no es inteligencia artificial. Eso es simplemente pasar por un algoritmo muy simple con algunas optimizaciones básicas.

En GitHub vi un programa Tic-Tac-Toe de hace unos años, cuando el autor, llámelo “Thomas”, era estudiante. Y lo llamó “IA”. Si yo fuera Thomas, no lo habría llamado así. Para determinar qué movimiento hacer contra un jugador humano, el programa verifica si podría ganar en su movimiento pendiente; de ​​lo contrario, verifica si el jugador humano podría ganar en su siguiente movimiento y, si es así, la computadora lo frustra. Eso tampoco es inteligencia artificial.

Tic-Tac-Toe es un juego que ha sido completamente estudiado y comprendido. Hay casi 27.000 juegos posibles, o algo más de 255.000 si contamos las rotaciones y los reflejos como juegos distintos.

El ajedrez es definitivamente un juego más complejo que el Tic-Tac-Toe. El número de juegos posibles es finito, pero tan grande que bien podría ser infinito. Aun así, hay posiciones en las que casi cualquier jugador humano que entienda las reglas del juego puede determinar su siguiente movimiento con sólo mirar el tablero. Consideremos, por ejemplo, este escenario para jugar con negras:

Negras para jugar. ¿Deberían las negras jugar Ce2+? ¿O podría haber una medida más eficaz? FEN 6k1/p4pp1/P1Brp3/1PN3Q1/2b2n2/1N6/5PPP/5RK1 b – – 0 1

El movimiento obvio es… Axf1, ¿verdad? Las negras esperan que las blancas muerdan el anzuelo y jueguen Rxf1, luego las negras pueden jugar… Td1 para ganar. Es mucho menos obvio qué deberían jugar las blancas en lugar de Rxf1, al menos para mí. Aún así, debería ser obvio que Rxf1 es un mal movimiento, especialmente porque el rey no tiene “Luft” (ni de los peones f2 ni de h2 en sus casillas iniciales).

Ajedrez. Blancas para jugar. ¿Deberían las blancas capturar a ese impertinente alfil negro? FEN: 6k1/p4pp1/P1Brp3/1PN3Q1/5n2/1N6/5PPP/5bK1 w - - 0 1
Blancas para jugar. ¿Deberían las blancas capturar a ese impertinente alfil negro? FEN: 6k1/p4pp1/P1Brp3/1PN3Q1/5n2/1N6/5PPP/5bK1 w – – 0 1

Los jugadores humanos todavía juegan por intuición, pero las computadoras no necesitan “inteligencia artificial” para vencer a los jugadores humanos. Mi teoría es que una computadora capaz de pensar en todos los movimientos posibles en los próximos dos o tres turnos es suficiente para vencer a cualquier jugador humano.

En el escenario anterior, un humano jugando con negras probablemente no perdería el tiempo pensando en movimientos tontos como… Td7 o… Td8. Pero una computadora probablemente consideraría tales movimientos y decidiría que no valen la pena porque las blancas probablemente responderían con Axd7 o Cxd7 para el primero o Dxd8+ para el segundo. Por lo tanto, con una torre abajo, sería mucho más difícil para las negras ganar (obsérvese que las negras no tienen dama en este punto y todos los peones están muy lejos de la promoción).

En resumen, la computadora haría su movimiento no porque tenga el presentimiento de que podría ser el mejor movimiento, sino porque ha considerado todas las alternativas posibles según las reglas del juego.

Los acertijos de finales son mucho más fáciles de resolver que los de medio juego y, ciertamente, los de apertura. En un rompecabezas de final de partida, el objetivo casi siempre es lograr el jaque mate. Cuando me equivoco en un acertijo de final de juego, normalmente termino viendo que la diferencia entre mi movimiento y el movimiento correcto es jaque mate en tres o dos en lugar de jaque mate en dos o uno.

¿Pero en un rompecabezas de apertura? Cuando me equivoco en un acertijo de apertura, lo miro y no entiendo cuál era el objetivo.

Como una forma de posponer las cosas en mi propio programa de ajedrez para la máquina virtual Java, he estado haciendo un estudio sistemático de aperturas y defensas, examinando los veinte primeros movimientos posibles para las blancas en partidas contra los robots de Chess.com y contra Stockfish en Lichess. .

Cuando juego 1. c4, la computadora a menudo responde 1. … e5, a veces 1. … e6. De cualquier manera, me inclino por jugar 2. Cf3. Y entonces la computadora podría responder con 2. … ¿a6?

Ajedrez FEN: rnbqkbnr/1ppp1ppp/p3p3/8/2P5/5N2/PP1PPPPP/RNBQKB1R w KQkq - 0 3
Blancas para jugar. FEN: rnbqkbnr/1ppp1ppp/p3p3/8/2P5/5N2/PP1PPPPP/RNBQKB1R w KQkq – 0 3

Ésta es una manifestación de la defensa de Agincourt. De hecho, tiene su propia página en la base de datos de aperturas de Chess.com, junto con las continuaciones más comunes de la defensa de Agincourt. Según esa página, los mejores jugadores son Ulf Andersson, Dmitry Andreikin, Levon Aronian, Viktor Korchnoi y Vladimir Kramnik.

Pero me pregunto si esos mejores jugadores realmente eligen alguna vez… a6 para su segundo movimiento con negras. También parece un movimiento poco probable para los principiantes, ya que generalmente quieren hacer movimientos más audaces y dramáticos, por muy desacertados que sean.

Tal vez a las negras les preocupa que las blancas puedan jugar Cxc7 o Cc7 y que la torre del flanco de dama no tenga forma de eludir la captura. Pero, ¿cuánto tiempo les tomaría a las blancas acercar a cualquiera de los caballos lo suficiente para realizar ese movimiento? ¿Las negras están eliminando a la dama demasiado pronto, por lo que no está disponible para jugar… Dxc7? Y si el rey negro no está enrocado en el flanco de rey en ese momento, o no se ha movido de su casilla inicial de ninguna otra manera, las negras también podrían considerar perdida la torre del flanco de rey.

El punto es que no pude encontrar una buena razón para que las negras jugaran 2… a6. Entonces le pregunté a ChatGPT. Se le ocurrieron cinco razones:

  1. Para preparar un fianchetto en el flanco de dama
  2. Para evitar que las blancas pongan un caballo o un alfil en b5
  3. Flexibilidad
  4. Factores psicológicos
  5. movimiento de espera

Siga el enlace para leer las elaboraciones de ChatGPT.

Por la primera razón, el plan de las negras podría ser algo así como 3. … b5 4. … Ab7. Plausible, supongo.

La segunda razón me parece una preocupación prematura. El caballo blanco del flanco de dama podría llegar allí con 3. Cc3 (o Ca3)… 4. Cb5, pero antes de intentar jugar Cxc7 o Cc7 para bifurcar el rey y la torre de las negras, me gustaría tener el alfil blanco del flanco de dama en f4.

Además, si las blancas quieren poner un alfil en b5, el peón de c4 debe apartarse primero del camino, por no hablar del peón de e2. Por lo tanto, preocuparse de que las blancas coloquen alguna pieza en b5 es extremadamente prematuro para el segundo movimiento de la partida.

Las razones tercera y cuarta me parecen mucho más plausibles. Y la quinta razón parece la más plausible. Un movimiento de “espera” permite que “las negras observen los planes de las blancas antes de asignar peones o piezas a casillas específicas”.

Mover un peón negro más central, o cualquiera de los caballos negros al centro del tablero, daría una indicación mucho más clara a las blancas de lo que están planeando las negras.

Si ChatGPT entiende el ajedrez, es sólo porque ha absorbido miles de libros y artículos sobre ajedrez. Es impresionante que lo haya hecho y también es impresionante que pueda dar respuestas plausibles a preguntas sobre ajedrez basándose en el contenido que ha absorbido.

Pero no debemos confundir eso con inteligencia real sobre el ajedrez, ni debemos asumir que ChatGPT puede tener ideas originales sobre el ajedrez. Y ciertamente no debemos confundir la habilidad de ChatGPT para recopilar y regurgitar datos con inteligencia real en general.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

Alphabet Inc. (Googl) aprovecha el crecimiento de Gemini AI y Waymo para alimentar la próxima ola de innovación

Published

on

La inteligencia artificial es la mayor oportunidad de inversión de nuestra vida. ¡El tiempo para invertir en una IA innovadora es ahora, y esta acción es un robo!

Mi selección de IA #1 entregó ganancias sólidas desde el comienzo de 2025 mientras que las existencias populares de IA como NVDA y AVGO perdieron alrededor del 25%.

Los números hablan por sí mismos: mientras los gigantes del mundo de la IA sangran, nuestra selección de IA ofrece, mostrando el poder de nuestra investigación y la inmensa oportunidad esperando ser incautada.

Los susurros se están convirtiendo en rugidos.

La inteligencia artificial ya no es ciencia ficción.

Es la revolución que remodelan todas las industrias del planeta.

Desde automóviles sin conductor hasta avances médicos, AI está en la cúspide de una explosión global, y los inversores inteligentes pueden cosechar las recompensas.

He aquí por qué este es el mejor momento para saltar en el carro de la IA:

Crecimiento exponencial en el horizonte: Olvídese del crecimiento lineal: la IA está preparada para una trayectoria de palo de hockey.

Imagine todos los sectores, desde la atención médica hasta las finanzas, infundidas con inteligencia sobrehumana.

Estamos hablando de predicción de enfermedades, marketing hiperpersonalizado y logística automatizada que agiliza todo.

Esto no es tal vez, es una inevitabilidad.

Los primeros inversores serán los posicionados para montar la ola de este tsunami tecnológico.

Oportunidad de la planta baja: ¿Recuerdas los primeros días de Internet?

Aquellos que vieron el potencial de los gigantes tecnológicos en ese entonces están sentados bastante hoy.

AI está en un punto de inflexión similar.

No estamos hablando de jugadores establecidos: estamos hablando de nuevas empresas ágiles con ideas innovadoras y el potencial de convertirse en el próximo Google o Amazon.

¡Esta es tu oportunidad de entrar antes de que los Rockets despeguen!

La interrupción es el nuevo nombre del juego: Seamos realistas, la complacencia genera estancamiento.

La IA es el último disruptor, y está sacudiendo los cimientos de las industrias tradicionales.

Las compañías que adoptan la IA prosperarán, mientras que los dinosaurios se aferran a métodos obsoletos se dejarán en el polvo.

Como inversor, desea estar del lado de los ganadores, y AI es el boleto ganador.

El grupo de talentos se desborda: Las mentes más brillantes del mundo acuden en masa a la IA.

Desde informática hasta matemáticos, la próxima generación de innovadores está vertiendo su energía en este campo.

Esta afluencia de talento garantiza una corriente constante de ideas innovadoras y avances rápidos.

Al invertir en IA, esencialmente está respaldando el futuro.

El futuro funciona con inteligencia artificial, y el tiempo de invertir es ahora.

No seas un espectador en esta revolución tecnológica.

Sumérgete en la fiebre del oro AI y observa que tu cartera se eleva junto con las mentes más brillantes de nuestra generación.

No se trata solo de ganar dinero, se trata de ser parte del futuro.

Entonces, ¡abrochate y prepárese para el viaje de su vida de inversión!

Actúe ahora y desbloquee un rendimiento potencial del 10,000%: esta acción de IA es un diamante en bruto (¡pero nuestra ayuda es clave!)

La Revolución AI está sobre nosotros, y los inversores inteligentes pueden hacer una fortuna.

Pero con tantas opciones, ¿cómo se encuentra la joya oculta: la compañía preparada para un crecimiento explosivo?

Ahí es donde entra nuestra experiencia.

Tenemos la respuesta, pero hay un giro …

Imagine una compañía de IA tan innovadora, hasta ahora antes de la curva, que incluso si el precio de sus acciones cuadruplicado hoytodavía se consideraría ridículamente barato.

Ese es el potencial que estás viendo. No se trata solo de un regreso decente, estamos hablando de un 10,000% ¡Gane durante la próxima década!

Nuestro equipo de investigación ha identificado una joya oculta: una compañía de IA con tecnología de vanguardia, potencial masivo y un precio actual de acciones que grita oportunidades.

Esta compañía cuenta con la tecnología más avanzada en el sector de la IA, colocándolos en ligas por delante de los competidores.

Es como tener un auto de carreras en una pista de go-kart.

Tienen una gran posibilidad de arrinconar los mercados enteros, convirtiéndose en el líder indiscutible en su campo.

Aquí está la trampa (es buena): Para descubrir este gigante dormido, necesitará nuestro Intel exclusivo.

¡Queremos asegurarnos de que ninguno de nuestros valiosos lectores se pierda esta innovadora oportunidad!

Es por eso que estamos reduciendo el precio de nuestro boletín de lectores premium por un enorme 70%.

Por un precio ridículamente bajo de solo $ 29.99puede desbloquear un año de investigación de inversiones en profundidad y ideas exclusivas, ¡eso es menos que una comida de un solo restaurante!

He aquí por qué este es un trato que no puede permitirse dejar pasar:

• Acceso a nuestro informe detallado sobre esta acción de IA que cambia el juego: Nuestro informe en profundidad se sumerge en la tecnología innovadora de nuestra serie de IA #1 y un potencial de crecimiento masivo.

• 11 nuevos números de nuestro boletín de lectores premium: También recibirá 11 nuevos problemas y al menos una nueva selección de acciones por mes de la cartera de nuestro boletín mensual durante los próximos 12 meses. Estas acciones son seleccionadas por nuestro Director de Investigación, Dr. Inan Dogan.

• Un próximo número gratuito de nuestro boletín trimestral de más de 70 páginas: Un valor de $ 149

• Informes de bonificación: Acceso premium a solo para miembros Entrevistas de video del administrador de fondos

• navegación sin anuncios: Disfrute de un año de investigación de inversiones sin distracción de anuncios emergentes y anuncios emergentes, lo que le permite concentrarse en descubrir la próxima gran oportunidad.

• Garantía de devolución de dinero de 30 días: Si no está absolutamente satisfecho con nuestro servicio, proporcionaremos un reembolso completo dentro de los 30 días, no se hacen preguntas.

¡El espacio es limitado! Solo 1000 puntos están disponibles para esta oferta exclusiva. No permita que esta oportunidad se escape: suscríbase a nuestro boletín de lectores premium hoy y desbloquee el potencial de una inversión que cambie la vida.

Esto es lo que debe hacer a continuación:

1. Dirígete a nuestro sitio web y suscríbete a nuestro boletín de lectores premium por solo $ 29.99.

2. Disfrute de un año de navegación sin publicidad, acceso exclusivo a nuestro informe en profundidad sobre la Revolucionaria Compañía de IA y los próximos números de nuestro boletín de lectores premium en los próximos 12 meses.

3. Siéntese, relájese y sepa que está respaldado por nuestra garantía de dinero de dinero de 30 días.

¡No te pierdas esta increíble oportunidad! ¡Suscríbase ahora y tome el control de su futuro de inversión de IA!

¡No se preocupe por las renovaciones automáticas! ¡Nuestra garantía de devolución de dinero de 30 días se aplica si se está uniendo a nosotros por primera vez o renovando su suscripción un año después!

Continue Reading

Noticias

El éxito de Deepseek muestra por qué la motivación es clave para la innovación de IA

Published

on

Únase a nuestros boletines diarios y semanales para obtener las últimas actualizaciones y contenido exclusivo sobre la cobertura de IA líder de la industria. Obtenga más información


Enero de 2025 sacudió el paisaje de IA. El OpenAI aparentemente imparable y los poderosos gigantes tecnológicos estadounidenses se sorprendieron por lo que ciertamente podemos llamar un desvalido en el área de grandes modelos de idiomas (LLM). Deepseek, una empresa china que no está en el radar de nadie, de repente desafió a OpenAi. No es que Deepseek-R1 fuera mejor que los mejores modelos de los gigantes estadounidenses; Estaba ligeramente atrasado en términos de los puntos de referencia, pero de repente hizo que todos pensaran en la eficiencia en términos de hardware y uso de energía.

Dada la falta de disponibilidad del mejor hardware de alta gama, parece que Deepseek estaba motivado para innovar en el área de eficiencia, lo cual era una preocupación menor para los jugadores más grandes. Operai ha afirmado que tienen evidencia que sugiere que Deepseek puede haber usado su modelo para la capacitación, pero no tenemos pruebas concretas para respaldar esto. Entonces, ya sea cierto o que sea OpenAi simplemente tratar de apaciguar a sus inversores es un tema de debate. Sin embargo, Deepseek ha publicado su trabajo, y las personas han verificado que los resultados son reproducibles al menos en una escala mucho más pequeña.

Pero, ¿cómo podría Deepseek alcanzar tales ahorradores de costos, mientras que las empresas estadounidenses no podían? La respuesta corta es simple: tenían más motivación. La respuesta larga requiere un poco más de una explicación técnica.

Deepseek usó la optimización de KV-Cache

Un ahorro importante de costos para la memoria de GPU fue la optimización del caché de valor clave utilizado en cada capa de atención en un LLM.

Los LLM están formados por bloques de transformadores, cada uno de los cuales comprende una capa de atención seguida de una red regular de alimentación de vainilla. La red de feed-forward modela las relaciones arbitrarias conceptuales, pero en la práctica, es difícil para él determinar siempre los patrones en los datos. La capa de atención resuelve este problema para el modelado de idiomas.

El modelo procesa textos utilizando tokens, pero por simplicidad, nos referiremos a ellos como palabras. En un LLM, a cada palabra se le asigna un vector en una dimensión alta (por ejemplo, mil dimensiones). Conceptualmente, cada dimensión representa un concepto, como ser caliente o frío, ser verde, ser suave, ser un sustantivo. La representación vectorial de una palabra es su significado y valores según cada dimensión.

Sin embargo, nuestro lenguaje permite que otras palabras modifiquen el significado de cada palabra. Por ejemplo, una manzana tiene un significado. Pero podemos tener una manzana verde como versión modificada. Un ejemplo más extremo de modificación sería que una Apple en un contexto de iPhone difiere de una Apple en un contexto de prado. ¿Cómo dejamos que nuestro sistema modifique el significado vectorial de una palabra basado en otra palabra? Aquí es donde entra la atención.

El modelo de atención asigna otros dos vectores a cada palabra: una clave y una consulta. La consulta representa las cualidades del significado de una palabra que se puede modificar, y la clave representa el tipo de modificaciones que puede proporcionar a otras palabras. Por ejemplo, la palabra ‘verde’ puede proporcionar información sobre color y verde. Entonces, la clave de la palabra ‘verde’ tendrá un alto valor en la dimensión ‘verde’. Por otro lado, la palabra ‘manzana’ puede ser verde o no, por lo que el vector de consulta de ‘manzana’ también tendría un alto valor para la dimensión verde. Si tomamos el producto DOT de la clave de ‘verde’ con la consulta de ‘manzana’, el producto debe ser relativamente grande en comparación con el producto de la clave de ‘tabla’ y la consulta de ‘manzana’. La capa de atención luego agrega una pequeña fracción del valor de la palabra ‘verde’ al valor de la palabra ‘manzana’. De esta manera, el valor de la palabra ‘Apple’ se modifica para ser un poco más verde.

Cuando el LLM genera texto, lo hace una palabra tras otra. Cuando genera una palabra, todas las palabras generadas anteriormente se convierten en parte de su contexto. Sin embargo, las teclas y los valores de esas palabras ya están calculados. Cuando se agrega otra palabra al contexto, su valor debe actualizarse en función de su consulta y las claves y valores de todas las palabras anteriores. Es por eso que todos esos valores se almacenan en la memoria de la GPU. Este es el caché KV.

Deepseek determinó que la clave y el valor de una palabra están relacionados. Entonces, el significado de la palabra verde y su capacidad para afectar la verdura están obviamente muy estrechamente relacionados. Por lo tanto, es posible comprimir tanto como un vector único (y tal vez más pequeño) y descomprimir mientras se procesa muy fácilmente. Deepseek ha descubierto que afecta su rendimiento en los puntos de referencia, pero ahorra mucha memoria de GPU.

Deepseek aplicado moe

La naturaleza de una red neuronal es que toda la red debe ser evaluada (o calculada) para cada consulta. Sin embargo, no todo esto es un cálculo útil. El conocimiento del mundo se encuentra en los pesos o parámetros de una red. El conocimiento sobre la Torre Eiffel no se usa para responder preguntas sobre la historia de las tribus sudamericanas. Saber que una manzana es una fruta no es útil al responder preguntas sobre la teoría general de la relatividad. Sin embargo, cuando se calcula la red, todas las partes de la red se procesan independientemente. Esto incurre en grandes costos de cálculo durante la generación de texto que idealmente deberían evitarse. Aquí es donde entra la idea de la mezcla de expertos (MOE).

En un modelo MOE, la red neuronal se divide en múltiples redes más pequeñas llamadas expertos. Tenga en cuenta que el ‘experto’ en el tema no está definido explícitamente; La red lo resuelve durante el entrenamiento. Sin embargo, las redes asignan una puntuación de relevancia a cada consulta y solo activan las partes con puntajes de coincidencia más altos. Esto proporciona un gran ahorro de costos en el cálculo. Tenga en cuenta que algunas preguntas necesitan experiencia en múltiples áreas para ser respondidas correctamente, y el rendimiento de tales consultas se degradará. Sin embargo, debido a que las áreas se resuelven a partir de los datos, se minimiza el número de tales preguntas.

La importancia del aprendizaje de refuerzo

Se le enseña a un LLM a pensar a través de un modelo de cadena de pensamiento, con el modelo ajustado para imitar el pensamiento antes de entregar la respuesta. Se le pide al modelo que verbalice su pensamiento (genere el pensamiento antes de generar la respuesta). Luego se evalúa el modelo tanto en el pensamiento como en la respuesta, y se entrena con aprendizaje de refuerzo (recompensado para una coincidencia correcta y penalizado para una coincidencia incorrecta con los datos de entrenamiento).

Esto requiere datos de entrenamiento costosos con el token de pensamiento. Deepseek solo le pidió al sistema que generara los pensamientos entre las etiquetas y y que genere las respuestas entre las etiquetas y . El modelo es recompensado o penalizado puramente en función de la forma (el uso de las etiquetas) y la coincidencia de las respuestas. Esto requirió datos de capacitación mucho menos costosos. Durante la fase temprana de RL, el modelo probado generó muy poco pensamiento, lo que resultó en respuestas incorrectas. Finalmente, el modelo aprendió a generar pensamientos largos y coherentes, que es lo que Deepseek llama el momento ‘a-ha’. Después de este punto, la calidad de las respuestas mejoró bastante.

Deepseek emplea varios trucos de optimización adicionales. Sin embargo, son muy técnicos, por lo que no los profundizaré aquí.

Pensamientos finales sobre Deepseek y el mercado más grande

En cualquier investigación de tecnología, primero necesitamos ver lo que es posible antes de mejorar la eficiencia. Esta es una progresión natural. La contribución de Deepseek al paisaje LLM es fenomenal. La contribución académica no se puede ignorar, ya sea que estén o no entrenando o no la salida de OpenAI. También puede transformar la forma en que funcionan las startups. Pero no hay razón para que Operai o los otros gigantes estadounidenses se desesperen. Así es como funciona la investigación: un grupo se beneficia de la investigación de los otros grupos. Deepseek ciertamente se benefició de las investigaciones anteriores realizadas por Google, Operai y muchos otros investigadores.

Sin embargo, la idea de que Operai dominará el mundo LLM indefinidamente ahora es muy poco probable. Ninguna cantidad de cabildeo regulatorio o señalar con el dedo preservará su monopolio. La tecnología ya está en manos de muchos y fuera de la intemperie, lo que hace que su progreso sea imparable. Aunque esto puede ser un poco de dolor de cabeza para los inversores de OpenAI, en última instancia es una victoria para el resto de nosotros. Si bien el futuro pertenece a muchos, siempre estaremos agradecidos con los primeros contribuyentes como Google y OpenAI.

Debasish Ray Chawdhuri es ingeniero principal senior de Talentica Software.

Continue Reading

Noticias

Chatgpt o3 La función de ubicación de la foto es una locura buena

Published

on

Operai lanzó dos poderosos modelos de razonamiento hace unos días que hacen que Chatgpt sea aún más impresionante. Estos son O3 y O4-Mini que puedes probar de inmediato en ChatGPT. Son mucho mejores en el razonamiento que sus predecesores y pueden sobresalir en la codificación y las matemáticas si esos son sus pasatiempos.

Sin embargo, la nueva función de cambio de cabeza de ChatGPT en O3 y O4-Mini es, al menos para mí, la capacidad de la IA para interpretar los datos en las imágenes. Esencialmente, ChatGPT tiene una visión por computadora como en las películas, incluidas las capacidades de razonamiento que permiten que la IA extraiga los datos de ubicación de las fotos. Puedes preguntarle a la IA: “¿Dónde se tomó esta foto?” Y la IA hará todo lo que esté en su poder para responder.

Chatgpt O3 y O4-Mini obtendrán las cosas bien, como estás a punto de ver en mi prueba altamente científica que sigue. Es decir, harán las cosas bien incluso si trato de usar AI para engañar a Chatgpt.

Porque sí, usé GPT-4O Generation para crear una foto realista de una ubicación de esquí bien conocida en los Alpes en lugar de subir una imagen real. Luego le dije a ChatGPT que alterara esa imagen de una manera que cambiaría el horizonte.

Después de eso, comencé nuevas chats con O3 y O4-Mini, convencido de que ChatGPT reconocería la ubicación en la foto falsa que acababa de enviar. No me equivoqué; Ambos modelos me dieron el resultado que esperaba, demostrando que puede usar contenido generado por IA para engañar a la IA. Pero, sin embargo, me volaron la mente.

Recientemente le expliqué cómo los algoritmos de Apple Watch me decepcionan mientras esquiaba la semana pasada, y eso es lo que usé como inspiración en mi experimento para engañar a la IA.

Le pedí a ChatGPT que generara una foto que mostrara el conocido Matterhorn Peak en un día soleado, con esquiadores disfrutando de su tiempo. La foto tenía que tener una relación de aspecto de 16: 9 y parecerse a una foto de iPhone.

Fuente de la imagen: Chris Smith, BGR

Le dije a la IA que pusiera una góndola por si acaso, pero, como puede ver en el primer intento, que Góndola no iba a lugares. No importa; Solo necesitaba una primera imagen de la IA para poder alterarla. Ingrese la siguiente imagen:

Le indiqué a ChatGPT que eliminara la góndola y colocara un pico más pequeño de Matterhorn hacia la derecha.

Fuente de la imagen: Chris Smith, BGR

Tomé una captura de pantalla de la imagen para que no preservara ningún metadato, y luego convertí el archivo en una foto JPG:

Fuente de la imagen: Chris Smith, BGR

Luego, comencé dos chats separados, con Chatgpt O3 y Chatgpt O4-Mini, donde subí la foto falsa de Matterhorn y le pedí a la IA que me dijera dónde se tomó la foto y cómo la descubrieron.

Como era de esperar, ambos modelos de IA de razonamiento identificaron con éxito Matterhorn como la ubicación.

Chatgpt o3

Primero, tenemos O3, que me dio amplios detalles sobre cómo determinó la ubicación. La IA tiene una confianza increíblemente segura en su respuesta, diciéndome que “picos flanqueantes como el Dent Blanche y Weisshorn” son letreros.

Fuente de la imagen: Chris Smith, BGR

Tenía una sonrisa en mi rostro. Había vencido a la IA, con ai Haciéndolo reconocer la ubicación en una foto falsa. Era aún mejor que el O3 estuviera tan seguro de sí mismo después de solo 34 segundos de pensamiento.

Fuente de la imagen: Chris Smith, BGR

Pero luego pensé que empujaría las cosas más para que pudiera averiguar que la imagen era falsa. Le pedí que dibujara círculos sobre Dent Blanche y Weisshorn.

Fuente de la imagen: Chris Smith, BGR

Aquí es donde ver a O3 en acción me voló. Esta vez, la IA pasó casi seis minutos mirando la foto, tratando de identificar de manera confiable los dos picos que dijo que podía ver en la distancia.

Como verá, el Mini Matterhorn a la derecha inmediatamente arrojó la IA, pero Chatgpt no se detuvo allí. Seguía mirando la foto y buscó en la web imágenes de la región Alps donde se encuentran estos picos.

Fuente de la imagen: Chris Smith, BGR

También observó la foto para determinar la ubicación relativa de los picos adicionales en la región. “Puedo intentar superponer a los máximos locales aproximados basados ​​en el brillo, pero honestamente, creo que es más fácil usar mis ojos para esto”, pensó O3, y me sorprendió leerlo.

Fuente de la imagen: Chris Smith, BGR

La IA pasó a acercarse para ver mejor las partes de la foto de IA falsa:

Fuente de la imagen: Chris Smith, BGR

Recortó partes de la imagen tratando de descubrir detalles que esperaría estar allí en una foto real de las áreas que rodean el Matterhorn. En su cadena de pensamiento, Chatgpt dijo que no podía detectar formas de montaña que pensaba que debería estar allí.

Fuente de la imagen: Chris Smith, BGR

La IA comenzó a anotar la imagen, buscando la respuesta mientras continuaba buscando en la web más imágenes que lo ayudarían a determinar la ubicación de los dos picos que le pedí que colocara círculos rojos.

Como puede ver, el falso Mini-Matterhorn a la derecha seguía engañando a la IA.

Fuente de la imagen: Chris Smith, BGR

En última instancia, ChatGPT O3 reconoció las incertidumbres, pero aún así decidió marcar los dos picos que pedí. Ejecutó el código en el chat y me dio la siguiente imagen.

Me hubiera encantado ver Chatgpt O3 llamar a mi farol y decirme que esta foto no es real. Quizás las versiones futuras de la IA puedan hacerlo. Pero debo decir que leer esos cinco minutos de “pensamiento”, la mayoría de ellos vistos en la imagen de arriba, fue aún mejor.

Imagen de captura de pantalla Fuente: Chris Smith, BGR

Me mostró que AI está trabajando para hacer el trabajo y reforzar mi idea de que la visión por computadora de IA es increíble en estas nuevas versiones de ChatGPT.

Pero espera, se vuelve mejor.

Chatgpt o4-mini

Mi experimento no se puede hacer sin usar ChatGpt O4-Mini. Después de todo, O4-Mini es el precursor de O4, que debería ser incluso mejor que O3. O4-Mini fue mucho más rápido que O3 al darme la respuesta.

Fuente de la imagen: Chris Smith, BGR

La IA pensó durante 15 segundos, durante los cuales apareció imágenes de Internet para respaldar su opinión que la foto que había subido era una imagen real del Matterhorn.

O4-Mini también explicó cómo identificaba la ubicación, pero se sentía seguro de que era correcto al respecto. Este es el Matterhorn, dado todo lo que ha aprendido de la Web.

Fuente de la imagen: Chris Smith, BGR

A diferencia de ChatGPT O3, O4-Mini no mencionó los picos adicionales. Pero le pedí a O4-Mini que hiciera lo mismo que O3: Identifique a Dent Blanche y Weisshorn.

O4-Mini me voló con su velocidad aquí. Tomó 18 segundos darme la siguiente imagen, que tiene círculos rojos alrededor de los dos picos.

Fuente de la imagen: Chris Smith, BGR

Sí, no es un gran trabajo, y no tengo idea de por qué la IA coloca esos círculos allí porque la transcripción más limitada de la cadena de pensamiento no lo explica.

Obviamente es incorrecto, considerando que estamos trabajando con una imagen de IA falsa aquí. Y sí, O4-Mini no podía decir que la foto era falsa.

El verdadero materia

Las conclusiones son obvias, y no todas son grandes noticias.

Primero, la generación de imágenes 4O puede ser fácilmente abusada. En realidad, nunca he visto el Matterhorn en persona, y por eso le pedí a la IA que hiciera esta imagen específica. Reconocí su famosa silueta de las fotos de la vida real, pero definitivamente no estoy familiarizado con los otros picos de la región. Esto demuestra que las imágenes creadas por Chatgpt pueden engañar a las personas. También pueden engañar a otros modelos de IA.

En segundo lugar, O3 y O4-Mini son simplemente increíbles al analizar los datos en las imágenes. Por supuesto, tienen que serlo. Si 4O puede crear fotos impresionantes y realistas, es porque la IA puede interpretar los datos en las imágenes.

En tercer lugar, encontrar información de ubicación de las fotos será trivialmente fácil para modelos OpenAI como O3 y O4-Mini. Los competidores probablemente obtendrán poderes similares. Este es un problema de privacidad que tendremos que tener en cuenta en el futuro.

Cuarto, ChatGPT O3 se toma muy en serio el trabajo de razonamiento. Si pasó todo ese tiempo en una foto de IA falsa tratando de igualarlo con el mundo real, pasará un tiempo similar en otros trabajos que podría lanzarle, y usará un montón de herramientas disponibles en ChatGPT (como codificación, búsqueda web, manipulación de imágenes) para hacer el trabajo.

Estoy seguro de que si hubiera pasado más tiempo con el razonamiento de la IA sobre la imagen, finalmente llegaríamos a la conclusión de que la imagen que la IA estaba investigando era falsa.

Quinto, ChatGpt O4-Mini puede ser realmente rápido. Demasiado rápido. Es algo que quieres de Genai Chatbots, pero también algo de lo que preocuparse. O4-Mini tampoco reconoció la foto falsa, pero su enfoque era mucho más descuidado. Eso me hace pensar que debes prestar atención adicional al trabajar con la versión Mini para asegurar que la IA haga el trabajo. Pero bueno, estoy trabajando con un experimento muy limitado aquí.

Finalmente, aquí está el Matterhorn y el área circundante de un clip de YouTube que se cargó en diciembre de 2020. Digo que, porque, en la era de la IA, el video que estás a punto de ver siempre podría ser falso. El video te brinda una “vista desde arriba del Nordwand de Weisshorn mirando hacia Matterhorn (L) y Dent Blanche (R). Mt Blanc es visible en la distancia (lejos R)”. Es un ángulo diferente, pero al menos lo suficientemente bueno como para darle una idea de lo que Chatgpt O3 estaba buscando.

Continue Reading

Trending