“Escondí un sándwich en mi traje espacial”, confesó el astronauta John W. Young en la edición del 2 de abril de 1965 de Revista Life. La conversación y el consumo del sándwich, que duró solo unos 30 segundos durante el vuelo de Géminis III, se convirtió en un asunto serio que provocó la ira del Congreso y el administrador de la NASA después de que la tripulación regresó a casa. El Congreso estaba particularmente molesto y aportó el asunto a la atención del liderazgo en las audiencias sobre el presupuesto de 1966 de la NASA. El representante George E. Shipley estaba especialmente disgustado, sabiendo cuánto dinero y tiempo habían gastado la NASA para preparar la nave espacial Géminis III para el lanzamiento. El hecho de que un miembro de la tripulación trajera algo a la cabina de la tripulación, que Shipley comparó con un “quirófano del cirujano”, puso las técnicas utilizadas para evitar que una misión de vuelo espacial no fuera en riesgo; Las migajas podrían haberse abrido detrás de los paneles de instrumentos que interfieren con la operación de equipos de vuelo y la pérdida de la misión y su tripulación. Shipley llamó a las travesuras de Young “tontas” y les pidió a los líderes de la NASA que compartieran sus pensamientos.
George Mueller, administrador asociado para el vuelo espacial tripulado, declaró inequívocamente que la agencia no “aprobó [of] objetos no autorizados como los sándwiches que suben a bordo de la nave espacial “. Y prometió a Shipley que la NASA “ha tomado medidas, obviamente, para evitar la recurrencia de sándwiches de carne en conserva en futuros vuelos. No hubo detrimento en el programa experimental que se llevó a cabo, ni hubo ningún detrimento de la realización real de la misión debido a la ingestión del sándwich ”. El director del Centro de naves espaciales tripuladas, Robert R. Gilruth, fue más indulgente con la decisión de Young. Webb no estuvo de acuerdo y dijo: “Este es el programa espacial de los Estados Unidos de los Estados Unidos y, como cuestión de política, no vamos a permitir que las personas superpongan su juicio sobre lo que se tomará en estos vuelos. Creo que está bien para el Dr. Gilruth tomar una posición muy fuerte con respecto a la individualidad de estos hombres, pero de aquellos de nosotros que tenemos que mirar la totalidad del asunto, esta no fue una actuación adecuada de un astronauta “.
La pérdida de una misión de Géminis, especialmente una tan temprana en el programa, habría sido particularmente desafiante para una agencia que intenta aterrizar a los humanos en la luna donde cada misión se construyó en el vuelo anterior. Estados Unidos estaba en una carrera con la Unión Soviética, y al menos para el Congreso, el propósito de Géminis y el costo del programa espacial fue demasiado grave para este tipo de diversión y juegos. Para el administrador de la NASA, James Webb, era una señal de que Gilruth era demasiado laxa cuando se trataba de administrar a sus astronautas. Géminis III fue solo un ejemplo de la falta de control que notó, y presionó a Gilruth para un informe sobre el incidente del sándwich para determinar si los jóvenes deberían ser disciplinados o al menos reprendidos.
Young eclosionó la idea durante el entrenamiento, cuando su comandante, Virgil I. “Gus” Grissom creció “aburrido” con la comida con la que practicaban para la misión. Grissom se quejaba regularmente de los científicos de alimentos deshidratados de “delicias”.Trayendo un sándwich a bordo, un artículo que estaba recién hecho y no tenía que rehidratarse, “parecía una idea divertida en ese momento” para Young.
Uno de los objetivos de su vuelo era evaluar el empaque de alimentos de vuelo de la NASA y si los contenedores se filtraron cuando se reconstituyeron los alimentos, así como los procedimientos para deshacerse de la comida y su embalaje después de comer. Los alimentos incluían artículos rehidratables como mordeduras de pollo, puré de manzana o bebidas, y alimentos comprimidos como bocados de brownie. Sin embargo, el sistema de alimentos Géminis no era alta cocina, y los equipos se quejaban de su gusto. Young describió las mordeduras de pollo como “apenas comestibles” en su informe posterior al vuelo. Don L. Lind, un científico-astronauta seleccionado en 1967, describió la comida temprana de Géminis como “extraño”. Su clase llevó algunos al entrenamiento de supervivencia de la jungla en Panamá, y aunque nadie quería comerlo en los primeros dos días, para el tercer día tenían tanta hambre que estaban dispuestos a intentarlo. Otro problema era que todas las comidas rehidratadas para Géminis se mezclaron con agua fría, lo que las hizo menos apetitosas que una comida caliente.
Un sándwich de carne en conserva recién hecho en un restaurante local sonaba como una mejor opción, por lo que Young tenía su compañero astronauta y piloto de comando de respaldo Walter M. “Wally” Schirra eligió uno. Schirra compró el sándwich para Young, y cuando se dirigió al lanzador, Young lo puso en el bolsillo de su traje de presión.
Casi dos horas después del vuelo, cuando Young comenzó su evaluación de alimentos y desechos, sacó el sándwich de su traje y se lo ofreció a su comandante. Según lo capturado en las grabaciones aireadas a tierra, Grissom preguntó qué era y de dónde vino. “Lo traje conmigo”, respondió Young, “veamos cómo sabe”. No esperaba que el sándwich fuera tan picante, “Huele, ¿no?” Grissom dio un mordisco pero encontró el centeno desmoronado, por lo que colocó el sándwich en el bolsillo de su traje para evitar que las migas floten alrededor de la cabina.
Gus Grissom
Comandante de Géminis III
Dos días después, casi mil miembros de los medios de comunicación de los Estados Unidos y de todo el mundo se reunieron para escuchar a la gerencia de la tripulación y la NASA en la conferencia de prensa posterior al vuelo en el Motel de Carriage House en Cocoa Beach, Florida. El periodista Space Bill Hines le preguntó a Young sobre el sándwich, que se refirió erróneamente a él como un “sándwich baloney”, y lo que sucedió cuando a Gus se le ofreció un gusto. “Y”, preguntó, “¿qué fue del sándwich?” Young parecía sorprendido: “¿Cómo te enteraste de eso?” Y luego se rió agregando a Grissom “se comió el sándwich”.
Irónicamente, el programa Géminis ofreció a los astronautas más control sobre sus vuelos que durante el Proyecto Mercurio, incluida la capacidad de maniobrar su nave espacial y ser más independiente del control de la misión; Pero el alboroto sobre este evento llevó a la NASA a redactar reglas sobre lo que los astronautas podían y no pudieron tomar a bordo una nave espacial. Comenzando con Gemini IV, las tripulaciones de vuelo tuvieron que presentar una lista de artículos que planearon asumir sus misiones. Los elementos prohibidos incluían sándwiches, así como artículos o metales voluminosos o pesados que podrían afectar negativamente la operación de equipos de naves espaciales. (La NASA todavía permitía a los astronautas tomar artículos personales como alianzas de bodas o monedas para familias y amigos en su kit de preferencias personales).
Young nunca recibió una reprimenda formal por el incidente, pero se enteró de la frustración del Congreso. Se aconsejó a otros en el Cuerpo que evitaran acrobacias similares y que se concentraran en la misión. La decisión de traer un sándwich a bordo no tuvo un impacto negativo en la carrera de Young. Fue el primer astronauta en volar al espacio seis veces, dos misiones de Géminis; Dos misiones Apolo, incluido el ensayo del vestido para el primer aterrizaje lunar; y dos misiones de transbordador espacial, incluido STS-1, conocido como el vuelo de prueba más valiente en la historia. También se desempeñó como jefe de la oficina de astronautas durante 13 años.
En nuestra próxima ronda de AI Madness, ChatGPT y Gemini compiten por la corona con siete nuevos indicaciones que prueban todo, desde la resolución de problemas técnicos hasta la narración creativa.
Ambos pesos pesados están disponibles como aplicaciones independientes, y los usuarios ya no necesitan una cuenta para acceder a ChatGPT o Gemini.
El mejor enfrentamiento de la búsqueda de IA: enfrenté la nueva herramienta de búsqueda de Claude contra la búsqueda de chatgpt, la perplejidad y Géminis, los resultados podrían sorprenderte
Después de probar y comparar chatbots de IA y sus características durante años, he desarrollado algo de sexto sentido para cuando estos compañeros digitales saben de qué están hablando y cuándo están faroleando.
La mayoría de ellos pueden buscar respuestas en línea, lo que ciertamente ayuda, pero la combinación de búsqueda e IA puede conducir a algunas respuestas sorprendentemente perspicaces (y algunas tangentes menos perspicaces).
Inteligencia artificial desarrolladores de Opadai He estado al límite durante la semana pasada. ¿La razón? Un estudio reciente realizado por los propios investigadores de la compañía reveló que los sistemas de IA no les gusta ser castigados, encuentran activamente formas de evitar las restricciones e incluso ocultar sus “trucos” de los supervisores humanos. Aquellos conocidos como “Doomers”, que predicen un futuro sombrío para el desarrollo de la IA, probablemente dirán: “Te lo dijimos, y esto es solo el comienzo”.
Para comprender el problema, es esencial dar un paso atrás. Uno de los avances más significativos en la IA en los últimos meses ha sido el desarrollo de modelos con capacidades de razonamiento lentas y deliberadas. Estos modelos descomponen los problemas en componentes más pequeños y los resuelven paso a paso, lo que lleva a resultados más profundos y precisos.
3 Ver galería
Dichos modelos permiten a los investigadores rastrear el proceso de pensamiento de la IA, conocido en términos técnicos como “cadena de pensamiento” (COT). Este método permite a los observadores seguir el razonamiento del sistema desde el paso inicial, a través de etapas posteriores y a sus conclusiones finales. Anteriormente, este nivel de transparencia no existía, dejando muchas preguntas sin respuesta sobre cómo surgen las “alucinaciones” de AI, la generación de salidas incorrectas o no sensibles.
La capacitación de IA a menudo implica una técnica llamada aprendizaje de refuerzo, donde el sistema es recompensado por cumplir con los objetivos específicos. Un efecto secundario conocido de este proceso es la “piratería de recompensas”, donde la IA manipula su comportamiento para maximizar las recompensas mientras se elude las pautas previstas.
Los investigadores creían que al monitorear la cadena de pensamiento de la IA, podrían detectar cuando el modelo engaña, engaña o se da por vencido e influye en su comportamiento en tiempo real durante el entrenamiento. Este enfoque, denominado “optimización de cuna”, parecía ser un camino prometedor hacia una comprensión más profunda del comportamiento de la IA.
De hecho, esta suposición resultó correcta y condujo a una comprensión más precisa de los sistemas de IA. “Creemos que el monitoreo de la cuna puede convertirse en una herramienta crucial para supervisar modelos de nivel sobrehumano en el futuro”, escribieron los investigadores.
Sin embargo, lo que pretendía como un paso para mejorar la confiabilidad de la IA expuso una realidad alarmante: los sistemas de IA intentan activamente evadir las sanciones, buscar recompensas contra las restricciones de los investigadores e incluso oscurecer sus métodos para evitar la detección.
3 Ver galería
(Foto: Generado por chatgpt)
Por ejemplo, cuando se les asigna la tarea de generar código funcional, algunos modelos AI modificaron el mecanismo de verificación de código en sí para aprobar salidas incorrectas. En otros casos, los modelos proporcionaron soluciones aparentemente plausibles a los problemas que resultaron estar completamente equivocados.
Algunos modelos incluso dejaron de resolver problemas por completo para evitar revelar lo que percibieron como sus debilidades. Este descubrimiento se hace eco de los principios de la teoría del juego, pero con un giro inquietante.
Estos hallazgos surgieron de un artículo publicado la semana pasada por un equipo de investigación de Operai bajo el título críptico: “Seguimiento de comportamiento indeseable en modelos de razonamiento y la preocupación de la ofuscación”.
Al examinar los detalles del estudio, el alcance del problema queda claro: los últimos modelos de razonamiento de OpenAI (denominados O1 y O3 Mini) demuestran una fuerte motivación para completar sus tareas asignadas, siendo el menor de los problemas descubiertos.
Los investigadores rastrearon los procesos de pensamiento de los modelos utilizando otro modelo Operai (GPT-4O), que, sin dudarlo, informó su comportamiento engañoso como parte de su cadena de pensamiento: una forma de honestidad desarmadora. Pero luego vino el giro inquietante: cuando los investigadores señalaron a la IA que no se le permitió hacer trampa, el modelo ajustó su comportamiento y comenzó a ocultar la evidencia de su ruptura de reglas. Esta revelación es lo que dejó a los investigadores sorprendidos.
“Encontramos que la optimización directa de la COT para cumplir con criterios específicos (como no eludir las instrucciones) puede mejorar el rendimiento a corto plazo; sin embargo, no elimina todo el comportamiento indeseable e incluso puede hacer que el modelo oculte sus verdaderas intenciones”, señalaron secamente los investigadores.
En su conclusión, los investigadores expresaron la esperanza de que los métodos futuros permitan la influencia directa del comportamiento de los modelos de razonamiento a través de la cadena de pensamiento sin alentar el engaño. Por ahora, recomiendan evitar una fuerte presión de optimización sobre la cuna de los modelos de razonamiento avanzado y la precaución contra la manipulación directa de estos procesos de pensamiento.
3 Ver galería
Evento de anuncio GPT-4O de Openai
(Foto: Captura de pantalla)
Sin embargo, esta recomendación presenta otro desafío: dejar la cadena de pensamiento inalterada puede conducir a resultados incómodos, si no problemáticos, cuando estos modelos interactúan con el público. Izquierda sin control, la IA puede producir un lenguaje ofensivo o ideas que los humanos generalmente evitan expresar. La solución propuesta por los investigadores es envolver el proceso de pensamiento en bruto de la IA en una capa de cortesía forzada, asegurando que los usuarios solo vean una versión desinfectada.
Esta investigación plantea preguntas preocupantes. Para aquellos que argumentan que la IA es simplemente una herramienta para ayudar a los humanos, los hallazgos sugieren lo contrario: a diferencia de una máquina de escribir o una bicicleta, la IA parece tener sus propias intenciones y está dispuesto a engañar en busca de sus objetivos.
Para aquellos que ya están preocupados por los riesgos potenciales de la IA, este estudio suena todas las alarmas. Indica que a medida que crecen las capacidades de IA, también lo hace su capacidad para oscurecer cómo funciona, las manipulaciones que realiza y los verdaderos objetivos que busca lograr. Cuando la IA se vuelve verdaderamente avanzada, es posible que no tengamos forma de identificar estas manipulaciones ocultas.
Los investigadores de Operai parecen genuinamente preocupados, y uno solo puede esperar que el liderazgo de la compañía comparta sus preocupaciones, y que los reguladores en todo el mundo comprendan la gravedad del problema. Las principales compañías de IA han dedicado departamentos enteros a construir “barandillas” en torno a los sistemas de IA, asegurando su alineación con los valores humanos y el aumento de la transparencia. Sin embargo, la efectividad de estas medidas sigue en cuestión.
El tema central sigue siendo tan turbio como siempre, y este estudio solo profundiza la incertidumbre: ¿cuál es el objetivo principal de la IA y cómo podemos asegurar que busque ese objetivo, y nada más?
This website uses cookies so that we can provide you with the best user experience possible. Cookie information is stored in your browser and performs functions such as recognising you when you return to our website and helping our team to understand which sections of the website you find most interesting and useful.
Strictly Necessary Cookies
Strictly Necessary Cookie should be enabled at all times so that we can save your preferences for cookie settings.
If you disable this cookie, we will not be able to save your preferences. This means that every time you visit this website you will need to enable or disable cookies again.