Connect with us

Noticias

O3 O3 de OpenAi es menos AGI de lo que se mide originalmente

Published

on


Resumen

Un análisis reciente de la Fundación del Premio ARC encuentra que el modelo O3 de OpenAI ofrece resultados significativamente más débiles en puntos de referencia de razonamiento estandarizados que su versión de vista previa de O3 previamente probada.

La Fundación del Premio ARC, un grupo sin fines de lucro centrado en la evaluación de IA, utiliza puntos de referencia abiertos como ARC-AGI para resaltar la brecha entre el razonamiento humano y los sistemas de inteligencia artificial actuales. Cada evaluación tiene como objetivo aclarar el estado actual del campo.

El punto de referencia ARC-AGI está estructurado para probar el razonamiento simbólico, la composición de varios pasos y la aplicación de reglas dependiente del contexto, las habilidades que los humanos a menudo demuestran sin capacitación especial, pero que los modelos de IA solo funcionan en un grado limitado.

El análisis evaluó el rendimiento en niveles de razonamiento “bajo”, “medio” y “altos”, que varían la profundidad del razonamiento del modelo. “Bajo” prioriza la velocidad y el uso mínimo de token, mientras que “alto” tiene la intención de fomentar la resolución de problemas más integral. Para este estudio, dos modelos, O3 y O4-Mini, se probaron en los tres niveles de razonamiento en 740 tareas de ARC-AGI-1 y ARC-AGI-2, produciendo 4.400 puntos de datos.

Anuncio

Eficiencia de rentabilidad y rendimiento: O3 Outpacios O1

Según la Fundación del Premio ARC, O3 alcanzó la precisión del 41 por ciento (bajo cálculo) y el 53 por ciento (cómputo medio) en ARC-AGI-1. El modelo O4-Mini más pequeño alcanzó el 21 por ciento (bajo cálculo) y el 42 por ciento (cómputo medio). En el punto de referencia ARC-AGI-2 más desafiante, ambos modelos actuales lucharon considerablemente, anotando por debajo del tres por ciento de precisión.

Trama de dispersión: la tabla de clasificación ARC-AGI muestra los puntajes del modelo de IA frente al costo por tarea, incluidos los modelos GPT y O.
El modelo O3 de OpenAI supera el modelo O1 publicado en el otoño de 2024 en aproximadamente un 20 por ciento en el punto de referencia ARC-AGI-1, pero permanece muy por detrás de los resultados de la previa vista O3 desde diciembre de 2024. El gráfico representa la relación precio / rendimiento. | Imagen: Arc Premio Foundation

A niveles de razonamiento más altos (cómputo “alto”), ambos modelos no pudieron completar muchas tareas. El análisis también observó que los modelos tendían a responder tareas que podrían resolver más fácilmente, mientras dejaban tareas más difíciles sin respuesta. Evaluar solo las respuestas exitosas distorsionaría el rendimiento real, por lo que estos resultados parciales fueron excluidos de las tablas de clasificación oficiales.

Modelo Configuración de razonamiento Eval Semi Private V1 Eval Semi Private V2 Costo por tarea (V2)
O3 Bajo 41% 1,9% 1.22 dólares estadounidenses
O3 Medio 53% 2,9% 2.52 dólares estadounidenses
O3 Alto
O4-Mini Bajo 21% 1,6% 0.05 dólar estadounidense
O4-Mini Medio 42% 2,3% 0.23 dólar estadounidense
O4-Mini Alto

Los datos muestran que un mayor esfuerzo de razonamiento no garantiza mejores resultados, pero a menudo solo resulta en costos más altos. En particular, O3 High consume significativamente más tokens sin lograr una ganancia correspondiente en precisión para tareas más simples. Esto plantea preguntas sobre la escalabilidad del enfoque actual para el razonamiento de la cadena de pensamiento.

Parcela de dispersión: comparación del uso de tokens de O3-Medium vs. O3-High en ARCV1, codificado por color según la corrección.
Una comparación del consumo de token para O3-Medio y O3-High en ARCV1 revela que los niveles de razonamiento más altos con frecuencia conducen a mayores costos. Los puntos azules por encima de la línea indican tareas donde O3 High usó más tokens sin mejorar los resultados. | Imagen: Arc Premio Foundation

Para aplicaciones sensibles a los costos, la Fundación del Premio ARC aconseja el uso de O3-Medio como la configuración predeterminada. El modo de “alta recuperación” solo se recomienda cuando se necesita la máxima precisión y el costo es menos importante. “No hay una razón convincente para usar bajo si te importa la precisión”, dice Mike Knoop, cofundador de la Fundación del Premio ARC.

La Fundación también señala que, a medida que avanza el rendimiento del modelo, la eficiencia, con qué rapidez, de bajo costo y con el uso mínimo de tokens, un modelo puede resolver problemas, se convierte en el diferenciador primario. En este sentido, O4-Mini es notable: logra una precisión del 21 por ciento en ARC-AGI-1 a un costo de aproximadamente cinco centavos por tarea, mientras que los modelos más antiguos como O1-Pro requieren aproximadamente once dólares por tarea para obtener resultados comparables.

Recomendación

Inconsistente e ilógico: el estudio descubre el razonamiento errático de los modelos de idiomas de IA

Inconsistente e ilógico: el estudio descubre el razonamiento errático de los modelos de idiomas de IA

O3 O3 de OpenAI es menos AGI que O3 previa

La versión actual de O3 diverge sustancialmente de la versión de previsión de O3 probada en diciembre de 2024. En ese momento, la previa vista de O3 obtuvo un 76 por ciento (bajo cómputo) y un 88 por ciento (alto cálculo) en ARC-AGI-1 en el modo de texto, mientras que el modelo O3 liberado ahora ofrece 41 por ciento (bajo) y 53 por ciento (medio).

OpenAI confirmó a ARC que el modelo de producción O3 difiere de la versión de vista previa de varias maneras clave. La compañía explicó que el modelo lanzado tiene una arquitectura diferente, es un modelo general más pequeño, opera multimodalmente (manejando las entradas de texto e imágenes) y utiliza menos recursos computacionales que la versión de vista previa.

Con respecto a los datos de capacitación, OpenAI afirma que la capacitación de O3 previa revisión cubrió el 75 por ciento del conjunto de datos ARC-AGI-1. Para el modelo O3 lanzado, OpenAI dice que no fue capacitado directamente en los datos de ARC-AGI, ni siquiera en el conjunto de datos de capacitación. Sin embargo, es posible que el modelo esté expuesto indirectamente al punto de referencia a través de su disponibilidad pública.

El modelo O3 publicado también se ha refinado para los casos de uso de productos y productos, que, según el premio ARC, se presenta tanto en ventajas como en desventajas en el punto de referencia ARC-AGI. Estas diferencias subrayan que los resultados de referencia, especialmente para los modelos de IA inéditos, deben verse con precaución.

Progreso continuo y limitaciones persistentes

El modelo O3-Medium actualmente ofrece el mayor rendimiento entre los modelos de Fundación de Premios ARC de ARC publicados en Publicación en ARC-AGI-1, duplicando los resultados de los enfoques anteriores de la cadena de pensamiento.

A pesar de esta mejora, el recién introducido Arc-Agi-2 Benchmark sigue sin resolverse en gran medida por ambos modelos nuevos. Mientras que los humanos resuelven un promedio del 60 por ciento de las tareas ARC-AGI-2 incluso sin capacitación especial, el modelo de razonamiento más fuerte de OpenAI actualmente logra solo alrededor del tres por ciento.

“ARC V2 tiene un largo camino por recorrer, incluso con la gran eficiencia de razonamiento de O3. Todavía se necesitan nuevas ideas”, escribe Knoop.

Esto destaca una brecha persistente en la capacidad de resolución de problemas entre humanos y máquinas, a pesar de los recientes avances y lo que la CEO de Microsoft, Satya Nadella, ha descrito como “piratería de referencia sin sentido”.

Un análisis reciente también sugiere que los llamados modelos de razonamiento como O3 probablemente no tienen ninguna capacidad nueva más allá de las de sus modelos de lenguaje fundamental. En cambio, estos modelos están optimizados para llegar a soluciones correctas más rápidamente para ciertas tareas, particularmente aquellos para los que han sido entrenados a través del aprendizaje de refuerzo dirigido.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

Probé Claude 4 soneto vs chatgpt-4o con 7 indicaciones: los resultados fueron sorprendentes

Published

on

Los chatbots de IA avanzan rápidamente y los probando hasta sus límites es lo que hago para vivir. El soneto Claude 4 de Anthrope y el chatgpt-4o de OpenAI son dos de las herramientas más inteligentes disponibles en este momento. Pero, ¿cómo se comparan realmente en el uso diario?

Para averiguarlo, le di a ambos modelos el mismo conjunto de 7 indicaciones; Cubriendo todo, desde narración de cuentos y productividad hasta apoyo emocional y pensamiento crítico.

Continue Reading

Noticias

Una nueva IA prepara proteínas de diseñador con solo un mensaje de texto

Published

on

“Escríbeme un resumen conciso de Misión imposible Personajes y tramas hasta la fecha ”, recientemente le pregunté a ChatGPT antes de atrapar la última entrada de franquicia. Se entregó. No necesitaba entender su código o conocer su conjunto de datos de capacitación. Todo lo que tenía que hacer era preguntar.

ChatGPT y otros chatbots impulsados ​​por modelos de idiomas grandes, o LLM, son más populares que nunca. Los científicos están tomando nota. Las proteínas, los caballos de batalla moleculares de las células, mantienen nuestros cuerpos corriendo suavemente. También tienen un idioma propio. Los científicos asignan una letra abreviada a cada uno de los 20 aminoácidos que componen proteínas. Al igual que las palabras, las cadenas de estas letras se unen para formar proteínas de trabajo, su secuencia determina la forma y la función.

Inspirados en LLM, los científicos ahora están construyendo modelos de lenguaje de proteínas que diseñan proteínas desde cero. Algunos de estos algoritmos están disponibles públicamente, pero requieren habilidades técnicas. ¿Qué pasaría si su investigador promedio podría simplemente pedirle a una IA que diseñe una proteína con un solo mensaje?

El mes pasado, los investigadores dieron a Protein Design AI el tratamiento con chatgpt. De una descripción del tipo, estructura o funcionalidad de una proteína que está buscando, el algoritmo produce posibles candidatos. En un ejemplo, la IA, denominada pinal, hizo con éxito múltiples proteínas que podrían descomponer el alcohol cuando se analizó dentro de las células vivas. Puedes probarlo aquí.

Pinal es el último en un creciente conjunto de algoritmos que traducen el inglés cotidiano en nuevas proteínas. Estos diseñadores de proteínas entienden el lenguaje sencillo y la biología estructural, y actúan como guías para los científicos que exploran proteínas personalizadas, con poca experiencia técnica.

Es un “enfoque ambicioso y general”, el equipo internacional detrás de Pinal escribió en una preimpresión publicada en Biorxiv. La IA aprovecha el “poder descriptivo y la flexibilidad del lenguaje natural” para hacer que las proteínas de diseñador sean más accesibles para los biólogos.

Enfrentados contra los algoritmos de diseño de proteínas existentes, Pinal entendió mejor el objetivo principal de una proteína objetivo y aumentó las posibilidades de que funcionaría en las células vivas.

“Somos los primeros en diseñar una enzima funcional usando solo texto”, dijo Fajie Yuan, científica de IA de la Universidad de Westlake en China que dirigió el equipo. Naturaleza. “Es como la ciencia ficción”.

Más allá de la evolución

Las proteínas son los componentes básicos de la vida. Forman nuestros cuerpos, el metabolismo del combustible y son el objetivo de muchos medicamentos. Estas intrincadas moléculas comienzan a partir de una secuencia de “letras” de aminoácidos, que se unen entre sí y eventualmente se doblan en intrincadas estructuras 3D. Muchos elementos estructurales, un bucle aquí, un tejido o bolsillo allí, son esenciales para su función.

Los científicos han intentado durante mucho tiempo diseñar proteínas con nuevas habilidades, como enzimas que descomponen de manera eficiente los plásticos. Tradicionalmente, han personalizado las proteínas existentes para un cierto uso biológico, químico o médico. Estas estrategias “están limitadas por su dependencia de las plantillas de proteínas existentes y las limitaciones evolutivas naturales”, escribieron los autores. Los modelos de lenguaje de proteínas, en contraste, pueden soñar con un universo de nuevas proteínas sin ataduras de la evolución.

En lugar de absorber el texto, la imagen o los archivos de video, como LLMS, estos algoritmos aprenden el lenguaje de las proteínas entrenando en secuencias y estructuras de proteínas. ESM3 de EvolutionaryScale, por ejemplo, entrenó en más de 2.700 millones de secuencias de proteínas, estructuras y funciones. Los modelos similares ya se han utilizado para diseñar anticuerpos que luchan contra ataques virales y nuevas herramientas de edición de genes.

Pero estos algoritmos son difíciles de usar sin experiencia. Pinal, por el contrario, apunta al científico promedio-joe. Al igual que una cámara DSLR en Auto, el modelo “evita las especificaciones estructurales manuales”, escribió el equipo, lo que hace que sea más simple hacer su proteína deseable.

Háblame

Para usar Pinal, un usuario le pide a la IA que construya una proteína con una solicitud de varias palabras clave, frases o un párrafo completo. En la parte delantera, la IA analiza los requisitos específicos en el aviso. En el back -end, transforma estas instrucciones en una proteína funcional.

Es un poco como pedirle a ChatGTP que le escriba una reseña de restaurante o un ensayo. Pero, por supuesto, las proteínas son más difíciles de diseñar. Aunque también están formados por “letras”, su forma final determina cómo (o si) funcionan. Un enfoque, denominado entrenamiento de extremo a extremo, traduce directamente un aviso en secuencias de proteínas. Pero esto abre la IA a un vasto mundo de secuencias potenciales, lo que hace que sea más difícil marcar las secuencias precisas de las proteínas de trabajo. En comparación con las secuencias, la estructura de proteínas, la forma 3D final, es más fácil para el algoritmo generar y descifrar.

Luego está el dolor de cabeza de los datos de entrenamiento. Aquí, el equipo recurrió a las bases de datos de proteínas existentes y usó LLM para etiquetarlas. El resultado final fue una vasta biblioteca de 1.700 millones de pares de texto proteico, en el que las estructuras de proteínas coinciden con descripciones de texto de lo que hacen.

El algoritmo completado utiliza 16 mil millones de parámetros, estas son las conexiones internas de una IA, para traducir el inglés simple al idioma de la biología.

Pinal sigue dos pasos. Primero traduce las indicaciones en información estructural. Este paso divide una proteína en elementos estructurales, o “fichas”, que son más fáciles de procesar. En el segundo paso, un modelo en idioma proteico llamado Saprot considera la intención del usuario y la funcionalidad de proteínas para diseñar secuencias de proteínas con mayor probabilidad de doblar en una proteína de trabajo que satisfaga las necesidades del usuario.

En comparación con los algoritmos de diseño de proteínas de última generación que también usan el texto como entrada, incluida ESM3, el pinal superó la precisión y la novedad, es decir, generar proteínas no conocidas por la naturaleza. Usando algunas palabras clave para diseñar una proteína, “la mitad de las proteínas de pinal exhiben funciones predecibles, solo alrededor del 10 por ciento de las proteínas generadas por ESM3 lo hacen”.

En una prueba, el equipo le dio a la IA un breve aviso: “Por favor, diseñe una proteína que sea una alcohol deshidrogenasa”. Estas enzimas descomponen el alcohol. De más de 1.600 proteínas candidatas, el equipo eligió los ocho más prometedores y las probó en células vivas. Dos rompieron con éxito el alcohol a temperatura corporal, mientras que otros fueron más activos a un sudor de 158 grados Fahrenheit.

Las indicaciones más elaboradas que incluían la función de una proteína y los ejemplos de moléculas similares, arrojaron candidatos a antibióticos y proteínas para ayudar a las células a recuperarse de la infección.

Pinal no es el único IA de texto a proteína. El Startup 310 AI ha desarrollado una IA denominada MP4 para generar proteínas a partir del texto, con los resultados que la compañía dice que podría beneficiar la enfermedad cardíaca.

El enfoque no es perfecto. Al igual que los LLM, que a menudo “alucinan”, los modelos de lenguaje de proteínas también sueñan secuencias poco confiables o repetitivas que reducen las posibilidades de un resultado final de trabajo. La redacción precisa de las indicaciones también afecta la estructura de proteína final. Aún así, la IA es como la primera versión de Dall-E: juega con ella y luego valida la proteína resultante usando otros métodos.

Continue Reading

Noticias

¿Demasiado chatgpt? Estudia lazos de IA de IA a los grados inferiores y la motivación

Published

on

Sigue a Psypost en Google News

Un estudio publicado en la revista Tecnologías de educación e información Encuentra que los estudiantes que son más conscientes tienden a usar herramientas de IA generativas como ChatGPT con menos frecuencia, y que usar tales herramientas para tareas académicas se asocia con una mayor autoeficacia, un peor rendimiento académico y mayores sentimientos de impotencia. Los hallazgos destacan la dinámica psicológica detrás de la adopción de la IA y plantean preguntas sobre cómo puede dar forma al aprendizaje y la motivación de los estudiantes.

La IA generativa se refiere a sistemas informáticos que pueden crear contenido original en respuesta a las indicaciones del usuario. Los modelos de idiomas grandes, como ChatGPT, son un ejemplo común. Estas herramientas pueden producir ensayos, resúmenes, explicaciones e incluso simular la conversación, lo que los hace atractivos para los estudiantes que buscan ayuda rápida con tareas académicas. Pero su ascenso también ha provocado un debate entre los educadores, que están preocupados por el plagio, el aprendizaje reducido y el uso ético de la IA en las aulas.

“Ser testigo de la dependencia excesiva entre algunos de mis estudiantes en herramientas generativas de IA como ChatGPT me hizo preguntarme si estas herramientas tenían implicaciones para los resultados de aprendizaje a largo plazo de los estudiantes y su capacidad cognitiva”, dijo el autor de estudio Sundas Azeem, profesor asistente de gestión y comportamiento organizacional en la Universidad Szabist.

“Era particularmente evidente que para aquellas actividades y tareas en las que los estudiantes se basaban en herramientas generativas de IA, la participación y el debate en el aula fue considerablemente menor ya que las respuestas similares de estas herramientas aumentaron el acuerdo de los estudiantes sobre los temas de discusión. Con un compromiso reducido en la clase, estas observaciones provocaron mi preocupación si realmente se cumplían objetivos de aprendizaje.

“En el momento en que comenzamos este estudio, la mayoría de los estudios sobre el uso de la IA generativo por parte de los estudiantes estaban basados ​​en la opinión o teóricos, explorando la ética del uso generativo de la IA”, continuó Azeem. “Los estudios que exploran el rendimiento académico rara vez consideran las calificaciones académicas (CGPA) para los resultados académicos, y también ignoraron las diferencias individuales como los rasgos de personalidad.

“A pesar del uso generalizado, no todos los estudiantes se basaron en el uso generativo de la IA por igual. Los estudiantes que de otro modo eran más responsables, puntuales y participativos en la clase parecían confiar menos en las herramientas generativas de IA. Esto me llevó a investigar si hubo diferencias de personalidad en el uso de estas herramientas. Esta brecha, acoplada con inquietudes enriquecidas sobre la equidad en el grado de la justicia y la integridad académica inspirada para este estudio”.

Para explorar cómo los estudiantes realmente se involucran con la IA generativa y cómo sus rasgos de personalidad influyen en este comportamiento, los investigadores encuestaron a 326 estudiantes universitarios de tres universidades principales en Pakistán. Los estudiantes se inscribieron en programas relacionados con los negocios y abarcaron de segundo a octavo semestre. Es importante destacar que el estudio utilizó un diseño de encuesta de tres ondas y retrasado en el tiempo para recopilar datos con el tiempo y minimizar los sesgos comunes en las respuestas autoinformadas.

En el primer momento, los estudiantes informaron sus rasgos de personalidad y sus percepciones de equidad en el sistema de calificación de su universidad. Específicamente, los investigadores se centraron en tres rasgos de personalidad del modelo Big Five: conciencia, apertura a la experiencia y neuroticismo. Estos rasgos fueron seleccionados debido a su relevancia para el rendimiento académico y el uso de la tecnología. Por ejemplo, los estudiantes concienzñosos tienden a ser organizados, autodisciplinados y orientados a los logros. La apertura refleja la curiosidad intelectual y la creatividad, mientras que el neuroticismo se asocia con ansiedad e inestabilidad emocional.

En el segundo punto, los participantes informaron con qué frecuencia usaban herramientas de IA generativas, especialmente ChatGPT, para fines académicos. En la tercera y última ola, los estudiantes completaron medidas que evaluaron su autoeficacia académica (cuán capaces se sintieron de tener éxito académicamente), su experiencia de impotencia aprendida (la creencia de que los esfuerzos no conducirán al éxito) e informaron su promedio acumulativo de calificaciones.

Entre los tres rasgos de personalidad estudiados, solo la conciencia estaba significativamente vinculada al uso de la IA. Los estudiantes que obtuvieron puntajes más altos en la conciencia tenían menos probabilidades de usar IA generativa para el trabajo académico. Este hallazgo sugiere que las personas concienzudas pueden preferir confiar en sus propios esfuerzos y están menos inclinados a tomar atajos, alineándose con investigaciones previas que demuestran que este rasgo de personalidad está asociado con la honestidad académica y el aprendizaje autodirigido.

“Nuestro estudio encontró que los estudiantes que son más conscientes tienen menos probabilidades de confiar en la IA generativa para tareas académicas debido a una mayor autodisciplina y tal vez también estándares éticos más altos”, dijo Azeem a PSYPOST. “Pueden preferir explorar múltiples fuentes de información y otras actividades de aprendizaje más cognitivamente atractivas como investigaciones y discusiones”.

Contrariamente a las expectativas, la apertura a la experiencia y el neuroticismo no se relacionó significativamente con el uso de IA. Si bien investigaciones anteriores han vinculado la apertura con una mayor disposición a probar nuevas tecnologías, los investigadores sugieren que los estudiantes con alto contenido de apertura también pueden valorar la originalidad y el pensamiento independiente, lo que potencialmente reduce su dependencia del contenido generado por IA. Del mismo modo, los estudiantes con un alto nivel de neuroticismo pueden sentirse incómodos con la precisión o la ética de las herramientas de IA, lo que lleva a la ambivalencia sobre su uso.

Los investigadores también examinaron cómo las percepciones de la justicia en la clasificación podrían dar forma a estas relaciones. Pero solo una interacción, entre la apertura y la equidad de calificación, fue marginalmente significativa. Para los estudiantes con alto contenido de apertura, percibir el sistema de calificación como justo se asoció con un menor uso de IA. Los investigadores no encontraron interacciones significativas que involucraban la conciencia o neuroticismo.

“Un hallazgo sorprendente fue que la justicia en la calificación solo influyó marginalmente en el uso generativo de la IA, y solo para la apertura del rasgo de personalidad a la experiencia, mostrando que, independientemente de la justicia de calificación, la IA generativa está ganando una popularidad generalizada”, dijo Azeem. “Esto es revelador, dado que habíamos anticipado que los estudiantes confiarían más en las herramientas generativas de IA con el objetivo de obtener calificaciones más altas, cuando la calificación percibió que la calificación era injusta. Además, mientras que las personas con una apertura a la experiencia de la experiencia son generalmente adoptantes de tecnologías que nuestro estudio no informó tales hallazgos”.

En términos más generales, los investigadores encontraron que un mayor uso de la IA generativa en las tareas académicas se asoció con varios resultados negativos. Los estudiantes que se basaron más en IA informaron una mayor autoeficacia académica. En otras palabras, se sintieron menos capaces de tener éxito por su cuenta. También experimentaron mayores sentimientos de impotencia aprendida, un estado en el que las personas creen que el esfuerzo es inútil y los resultados están fuera de su control. Además, un mayor uso de IA se vinculó con un rendimiento académico ligeramente más bajo medido por GPA.

Estos patrones sugieren que, si bien la IA generativa puede ofrecer conveniencia a corto plazo, su uso excesivo podría socavar el sentido de agencia de los estudiantes y reducir su motivación para participar profundamente con sus cursos. Con el tiempo, esta confianza podría erosionar el pensamiento crítico y las habilidades de resolución de problemas que son esenciales para el éxito a largo plazo.

Un análisis posterior reveló que el uso de IA generativo también medió el vínculo entre la conciencia y los resultados académicos. Específicamente, los estudiantes que eran más conscientes tenían menos probabilidades de usar IA, y este menor uso se asoció con un mejor rendimiento académico, una mayor autoeficacia y menos impotencia.

“Una conclusión clave para los estudiantes, los maestros, así como el liderazgo académico es el impacto de la dependencia de los estudiantes en las herramientas generativas de IA en sus resultados psicológicos y de aprendizaje”, dijo Azeem a PSYPOST. “Por ejemplo, nuestros hallazgos de que el uso generativo de la IA se asocia con una autoeficacia académica reducida y una mayor impotencia aprendida lo considera, ya que los estudiantes pueden comenzar a creer que sus propios esfuerzos no importan. Esto puede llevar a una agencia reducida cuando los estudiantes pueden creer que el éxito académico depende de las herramientas externas en lugar de la competencia interna. Como el uso excesivo de la AI generativa es la autoefficacia, los estudiantes pueden creer que su capacidad completa o desafiante los problemas sin problemas de los estudiantes en lugar de la ayuda de los estudiantes. Aprendedores pasivos, dudando en intentar tareas sin apoyo.

“Cuando se sienten menos control o dudan durante mucho tiempo, puede conducir a los hábitos de aprendizaje distorsionados, ya que pueden creer que la IA generativa siempre proporcionará la respuesta. Esto también puede hacer que las tareas académicas sean aburridas en lugar de desafiar, retraso aún más la resiliencia y el crecimiento intelectual. Nuestros hallazgos implican que la IA generativa está aquí aquí, su integración responsable en la academia a través de la formación de políticas, así como los maestros y el crecimiento intelectual es clave, nuestros hallazgos son clave.

“Nuestros hallazgos no respaldaron la idea común de que las herramientas generativas de IA ayudan a funcionar mejor académicamente”, explicó Azeem. “Esto tiene sentido dados nuestros hallazgos de que el uso generativo de la IA aumenta la impotencia aprendida. El rendimiento académico (indicado por CGPA en nuestro estudio) se basa más en las habilidades cognitivas individuales y el conocimiento de la materia, que puede afectar negativamente con una reducción de la autoeficacia académica reducida en exceso”.

El estudio, como todas las investigaciones, incluye algunas limitaciones. La muestra se limitó a estudiantes de negocios de universidades paquistaníes, lo que puede limitar la generalización de los hallazgos a otras culturas o disciplinas académicas. Los investigadores se basaron en medidas autoinformadas, aunque tomaron medidas para reducir el sesgo al separar las encuestas y usar escalas establecidas.

“Los datos autoinformados pueden ser susceptibles al sesgo de deseabilidad social”, señaló Azeem. “Además, si bien nuestro estudio siguió un diseño de tiempo de tiempo que permite la separación temporal entre la recopilación de datos, las instrucciones causales entre el uso generativo de la IA y sus resultados pueden mapear mejor a través de un diseño longitudinal. Del mismo modo, para diseñar las intervenciones y planes de capacitación necesarios, puede ayudar a futuros estudios a investigar las condiciones bajo las cuales el uso generativo de la IA lidera a los medios de aprendizaje más positivos y menos negativos”.

“A largo plazo, su objetivo es realizar estudios longitudinales que investiguen el desarrollo de los estudiantes a largo plazo, como la creatividad, la autorregulación y la empleabilidad en los semestres múltiples. Esto puede ayudar a cerrar las diferencias emergentes en la literatura con respecto al positivo versus los efectos dañinos de la IA generativa para los estudiantes. También tengo la intención de explorar otros rasgos motivacionales para que la personalidad sea de la personalidad, que puede influenciar la IA Generación. y razonamiento ético para el uso efectivo de IA generativo entre los estudiantes a largo plazo ”.

Los hallazgos plantean preguntas más grandes sobre el futuro de la educación en una era de IA accesible y poderosa. Si las herramientas generativas pueden completar muchas tareas académicas con un esfuerzo mínimo, los estudiantes pueden perder los procesos de aprendizaje que generan confianza, resistencia y pensamiento crítico. Por otro lado, las herramientas de IA también podrían usarse para apoyar el aprendizaje, por ejemplo, ayudando a los estudiantes a hacer una lluvia de ideas, explorar nuevas perspectivas o refinar sus escritos.

“Si bien nuestro estudio nos alarma a los posibles efectos adversos de la IA generativa para los estudiantes, la literatura también está disponible que respalda sus resultados positivos”, dijo Azeem. “Por lo tanto, a medida que las herramientas de IA se integran cada vez más en la educación, es vital que los responsables políticos, los educadores y los desarrolladores de EDTech vayan más allá de las opiniones binarias de la IA generativa como inherentemente bueno o malo. Creo que guiar el uso responsable de la IA generativa mientras mitigan los riesgos tienen la clave del aprendizaje mejorado”.

“Para ser específicos, la capacitación de instructor para diseñar actividades de aprendizaje acuáticas de AI puede ayudar a fomentar el pensamiento crítico. Estos pueden enfatizar la reflexión de los estudiantes alentando sobre el contenido generado por IA para abordar algunas cartas del uso generativo de IA en el aula. De la misma manera, la promoción de los sistemas de clasificación justos y transparentes es probable que se convierta en un mal uso. Con el uso no regulado y no regulado entre los estudiantes generativos entre los estudiantes de AI, los que se aprenden a los estudiantes de AI, lo que puede ser acelerado, se debe convertir en aceleración. Puede afectar las capacidades que la educación está destinada a desarrollar: la independencia, el pensamiento crítico y la curiosidad.

El estudio, “La personalidad se correlaciona del uso académico de la inteligencia artificial generativa y sus resultados: ¿Importa la justicia?”, Fue escrita por Sundas Azeem y Muhammad Abbas.

Continue Reading

Trending