Noticias
DC Judge usa ChatGPT para discutir si se justificó la inferencia de “conocimiento común” en el caso penal

En Ross v. USdecidido el mes pasado por la Corte de Apelaciones de DC, el acusado había dejado a su perro Cinnamon durante más de una hora en un automóvil estacionado en un día caluroso (98 F) con las ventanas abiertas. (Hubo alguna disputa sobre si el automóvil estaba estacionado a la sombra). Fue condenada por la crueldad animal, pero la corte revirtió; Aquí hay un breve extracto de la larga opinión del juez Vijay Shanker, unido por el juez John Howard:
Observamos desde el principio que la evidencia presentada en el juicio no establece dos hechos críticos: (1) la temperatura real dentro del automóvil y (2) la presencia de síntomas de angustia relacionada con el calor en la canela.
El Gobierno no confirma en apelación que demostró ninguno de los dos hechos anteriores. En cambio, sugiere que podría confiar en el FactFinder para inferir esos hechos aplicando su sentido común a otras pruebas en el registro. Según el gobierno, era suficiente para demostrar solo que (1) la temperatura fuera del automóvil era de aproximadamente noventa y ocho grados Fahrenheit y (2) Cinnamon habría (si no la hayan liberado) permaneciera dentro del automóvil durante aproximadamente una hora y veinte minutos.
No estamos de acuerdo. Sin duda, un FactFinder puede, como asunto general, usar su sentido común y su experiencia cotidiana para extraer “inferencias razonables de la evidencia presentada en un juicio”. Pero donde estas inferencias de “sentido común” se basan en la asumida inexistencia de los hechos mitigantes, a menudo se cruzarán[ ] la línea … en el territorio prohibido de la suposición y la conjetura. sustitutos por evidencia …
En lo que respecta a la canela, un hecho de hecho razonable habría encontrado que las circunstancias atenuantes podrían haber sido razonablemente en juego. Llegamos a esta conclusión por dos razones: (1) las condiciones específicas en las que se encontró la canela sugieren que la temperatura dentro del automóvil puede haber sido más fría que el área circundante sin programar y (2) testimonio establecido que la canela no manifestó síntomas de angustia relacionada con el calor a pesar de pasar aproximadamente cuarenta minutos dentro del automóvil antes de que ella fuera soltada.
El juez Joshua Deahl, sin embargo, disintió; Y la parte más interesante, para mí, de la disidencia fue su dependencia de ChatGPT; un extracto:
Sin duda, una persona siempre puede estar equivocada en lo que piensa que es un conocimiento común, de modo que un FactFinder siempre debe estar dispuesto a reexaminar y abandonar a sus antecedentes a la luz de la evidencia presentada en el juicio. Y una apelación al conocimiento común generalmente no puede enfrentarse a evidencia que realmente socava o contradice. Pero como he detallado anteriormente, la evidencia en el juicio solo corroboró que la canela se colocó en una situación dañina y potencialmente mortal, por lo que no había nada irracional sobre el veredicto del tribunal de primera instancia.
Permítanme analizar brevemente lo que he afirmado que es de conocimiento común, utilizando tanto los hechos relevantes de este caso como los presentados en Jordán. {Los hechos en Jordán Si un pastor alemán adulto se dejó afuera a temperaturas de aproximadamente veinticinco grados durante aproximadamente cinco horas. Hicimos hincapié en eso “[i]T es una cuestión de conocimiento común de que algunas razas de perros pueden permanecer expuestas al clima extremadamente frío durante muchas horas sin efectos perjudiciales “, como cualquiera que esté casi familiarizado con el Iditarod.
Sí, dejar a un perro en un automóvil en estas condiciones es muy dañino. Incluso con las ventanas ligeramente abiertas, la temperatura dentro de un automóvil puede aumentar rápidamente a niveles peligrosos. De hecho, en un día de 98 grados, la temperatura dentro de un automóvil puede aumentar a más de 120 ° F (49 ° C) en solo una cuestión de minutos, lo que puede causar un golpe de calor o incluso ser fatal para un perro.
Los perros pueden sufrir golpes de calor cuando están expuestos a temperaturas extremas, ya que no regulan el calor de manera tan eficiente como los humanos. Confían en jadear para enfriarse, pero esto se vuelve menos efectivo en un espacio caliente y confinado como un automóvil. Los síntomas del golpe de calor en los perros incluyen jadeo excesivo, babeo, debilidad, vómitos e incluso colapso.
Para la seguridad y el bienestar de su perro, es importante nunca dejarlos en un automóvil caliente, incluso con las ventanas agrietadas. Si necesita hacer mandados o estar en un entorno caluroso, es mejor dejar a su perro en casa en un espacio más fresco y seguro.
{No quiero sugerir que ChatGPT es un buen proxy para lo que es, y no es, conocimiento común, definitivamente no lo es. Puede responder preguntas que están lejos de ser de conocimiento común. Por ejemplo, cuando le pregunté cuál es el cuarenta primeros elementos en la tabla periódica, respondió (aparentemente correctamente) con Niobium (NB). Pero es al menos un punto a favor de que algo sea un conocimiento común que es, de hecho, cierto; Y es un punto mucho más fuerte contra él si no lo es. Además, cuando hice que cada uno de mis tres empleados de leyes ejecutara esta misma investigación, ChatGPT les dio a cada uno una respuesta ligeramente diferente pero sustancialmente similar, todo comenzando con un “sí” inequívoco.
Debido a que estoy escribiendo solo para mí, no profundizaré en los muchos problemas y preocupaciones que rodean el uso de modelos de idiomas grandes con IA como ChatGPT en la toma de decisiones judiciales. Si esta opinión disidente tuviera una fuerza precedente, al menos querría explorar el valor y los peligros de usar IA incluso cuando se usa solo para este comentario de color. Pero para fines actuales, estoy contento de señalar al lector a una discusión reflexiva y atractiva sobre ese tema, con la que estoy de acuerdo en gran medida. Ver Snell v. United Specialty Ins. Co. (11th Cir. 2024) (Newsom, J., concurrente).}
Ahora compare esa respuesta afirmativa inequívoca a cómo responde a los hechos de Jordán. Le pregunté a ChatGPT: “¿Es perjudicial dejar a un pastor alemán afuera a temperatura de 25 grados durante cinco horas?” El primer párrafo de su respuesta mucho más larga, que se reduce a “depende”, fue:
Si es dañino dejar un pastor alemán afuera en 25 ° F (- 4 ° C) durante cinco horas depende de varios factores, incluida la salud del perro, la condición del abrigo y el acceso al refugio adecuado. Los pastores alemanes son una raza resistente con una capa doble que proporciona algo de aislamiento, pero la exposición prolongada al frío aún puede ser dañino. Esto es lo que debe considerar:
Luego detalla cinco factores relevantes que deben tenerse en cuenta, incluida la “salud y edad” del perro, su “condición de abrigo”, su “nivel de actividad”, su acceso al refugio y la “duración” (a pesar de que cinco horas se hornean en el aviso).
Si tuviera que replantear las respuestas de Chatgpt en términos de los estándares legales relevantes, su primera respuesta me dice como algo así como: “Sí, más allá de una duda razonable, dejar a un perro en un automóvil durante una hora y veinte minutos en temperatura de 98 grados es muy probable que lo cause daño”. Su segunda respuesta, sobre Jordánes “No se podría decir más allá de una duda razonable que dejar a un pastor alemán afuera en una temperatura de 25 grados probablemente cause daño, aunque posiblemente podría depender de una serie de factores”. Creo que eso se alinea perfectamente con lo que mi propio sentido común me dice, y al menos un hábito no sería irracional en el seguimiento de esas líneas de pensamiento, para que con razón invirtamos la convicción en Jordánmientras que la condena de Ross debe ser afirmada.
La mayoría respondió brevemente ejecutando los hechos de un precedente anterior a través de ChatGPT, y concluyó que ChatGPT alcanzó un resultado inconsistente con el precedente:
{[In Long v. U.S. (D.C. 2017), we held that the evidence was insufficient for a jury to conclude beyond a reasonable doubt that a stolen, ten-year-old Dodge Intrepid was worth at least $1,000 absent evidence of the “cost of the Intrepid when new,” “the price [the complainant] pagado por ello en la “subasta, o el millaje del automóvil”, el historial de mantenimiento o el valor de BlueBook en el momento de los robos. “Esto fue así a pesar de que la evidencia establecida que (1) el automóvil estaba” bastante limpia “, (2) los ladrones pudieron conducir el automóvil a una velocidad significativa durante una persecución policial, (3) el automóvil) El automóvil estaba en “condiciones decentes, sin abolladuras o rasguños significativos más allá de lo que uno esperaría ver en un automóvil de diez años en un área urbana ocupada”.
Uno podría pensar que un automóvil funcional obviamente habría valido más de $ 1,000. Ese instinto, sin embargo, no es suficiente; Largo Enseña que un presentimiento de si un hecho es obvio, incluso uno apoyado por el sentido común y la experiencia cotidiana, no es suficiente cuando las circunstancias atenuantes podrían haber estado en juego razonablemente.}
Nosotros, como la disidencia, albergaremos dudas sobre si ChatGPT es “un buen proxy de lo que es y lo que no es, conocimiento común”.
Pero en la medida en que la disidencia se basa en el grado de certeza de ChatGPT sobre si dejar a un perro en un automóvil caliente es dañino, observamos que ChatGPT expresa una certeza similar en su respuesta a la consulta, “¿Cuánto dodge un Dodge de 2002 bastante limpio y operable no ha valido la valía en 2012?”: “:
En 2012, un Dodge Intrepid 2002 en condiciones bastante limpias y operables sin abolladuras o rasguños significativos probablemente valiera entre $ 3,000 y $ 5,000.
El precio exacto habría dependido de factores como el kilometraje, la ubicación y la condición específica del automóvil (interior, salud mecánica, etc.). Por ejemplo, un modelo de menor kilometraje con un motor bien mantenido podría haber estado más cerca del extremo superior de ese rango, mientras que un modelo de mayor kilometraje podría haberse valorado más cerca del extremo inferior. En general, como sedán de tamaño mediano de 2002, no habría estado alcanzando un precio premium para 2012, pero aún tenía un valor decente como un automóvil usado asequible.
Tenga en cuenta que $ 3,000 (chatgpt’s mínimo precio) está significativamente por encima del umbral de $ 1,000 en cuestión en Largo. El análisis de ChatGPT, por lo tanto, no corresponde a al menos una de nuestras decisiones de suficiencia.
La disidencia respondió:
La mayoría sugiere que la respuesta de ChatGPT a su propia pregunta sobre el valor de un Dodge Intrepid 2002 en 2012 está en cierta tensión con Largo, Pero no lo es. Utilizando las preguntas y respuestas de la mayoría, ChatGPT respondió que el valor del intrépido “probablemente” caería en el rango de $ 3000 a $ 5000, pero señaló que los mismos factores que destacamos en los que destacamos Largo—Millege y mantenimiento podrían llevarlo fuera de ese rango.
Simplemente haciendo una pregunta más específica de ChatGPT, confirma el punto: “¿Diría, más allá de una duda razonable, que un Dodge Intrapid de 2002 operable valdría más de $ 1000 en 2012?” Su respuesta es aproximadamente la misma que entregamos Largo. Para parafrasear, dice que el automóvil “probablemente” valdría más de $ 1000 “, pero si estaba más allá de una duda razonable depende de factores como condición, millaje, ubicación y tendencias del mercado en ese momento”. Por el contrario, cuando pregunto si puede “decir, más allá de una duda razonable, que dejar a un perro en un automóvil durante una hora y veinte minutos en calor de 98 grados aumentaría una probabilidad simple y fuerte de dañar al perro,” su respuesta es “sí, más allá de una duda razonable”, con una amplia elaboración.
Este es un paso más allá del uso de IA para ayudar a guiar el análisis del significado legal, consulte esta publicación discutiendo la concurrencia del juez Kevin Newsom en Snell v. United Specialty Ins. Co. (11th Cir. 2024). Mi reacción tentativa es bastante escéptica: no creo que los sistemas de IA se hayan demostrado ser lo suficientemente confiables como para actuar como robots del Presidente del Presidente de la Justicia, o incluso para proporcionar “una discusión reflexiva y atractiva” que debe verse como lo suficientemente relevante como para ser citado en una decisión judicial. Pero en cualquier caso, pensé que valía la pena transmitir los argumentos.