Noticias
La IA generativa crecerá un 17% en 2024, pero la calidad de los datos se desploma: hallazgos clave del informe sobre el estado de la IA de Appen
Únase a nuestros boletines diarios y semanales para obtener las últimas actualizaciones y contenido exclusivo sobre la cobertura de IA líder en la industria. Más información
Un nuevo informe del proveedor de datos de IA Appen revela que las empresas están luchando por obtener y gestionar los datos de alta calidad necesarios para impulsar los sistemas de IA a medida que la inteligencia artificial se expande a las operaciones empresariales.
El informe sobre el estado de la IA 2024 de Appen, que encuestó a más de 500 tomadores de decisiones de TI en EE. UU., revela que la adopción de la IA generativa aumentó un 17 % el año pasado; sin embargo, las organizaciones ahora enfrentan obstáculos importantes en la preparación de datos y el control de calidad. El informe muestra un aumento interanual del 10 % en los cuellos de botella relacionados con el abastecimiento, la limpieza y el etiquetado de datos, lo que subraya las complejidades de crear y mantener modelos de IA eficaces.
Si Chen, jefa de estrategia de Appen, explicó en una entrevista con VentureBeat: “A medida que los modelos de IA abordan problemas más complejos y especializados, los requisitos de datos también cambian”, afirmó. “Las empresas están descubriendo que tener una gran cantidad de datos ya no es suficiente. Para ajustar un modelo, los datos deben ser de muy alta calidad, lo que significa que deben ser precisos, diversos, adecuadamente etiquetados y adaptados al caso de uso específico de la IA”.
Si bien el potencial de la IA sigue creciendo, el informe identifica varias áreas clave en las que las empresas encuentran obstáculos. A continuación se muestran las cinco conclusiones principales del informe sobre el estado de la IA de 2024 de Appen:
1. La adopción de la IA generativa está aumentando, pero también lo están los desafíos relacionados con los datos
La adopción de IA generativa (GenAI) ha crecido un impresionante 17 % en 2024, impulsada por avances en grandes modelos de lenguaje (LLM) que permiten a las empresas automatizar tareas en una amplia gama de casos de uso. Desde operaciones de TI hasta I+D, las empresas están aprovechando GenAI para optimizar los procesos internos y aumentar la productividad. Sin embargo, el rápido aumento en el uso de GenAI también ha introducido nuevos obstáculos, particularmente en torno a la gestión de datos.
“Los resultados de la IA generativa son más diversos, impredecibles y subjetivos, lo que hace que sea más difícil definir y medir el éxito”, dijo Chen a VentureBeat. “Para lograr una IA lista para la empresa, los modelos deben personalizarse con datos de alta calidad adaptados a casos de uso específicos”.
La recopilación de datos personalizados se ha convertido en el método principal para obtener datos de entrenamiento para los modelos GenAI, lo que refleja un cambio más amplio desde los datos genéricos extraídos de la web en favor de conjuntos de datos confiables y personalizados.
2. Las implementaciones de IA empresarial y el ROI están disminuyendo
A pesar del entusiasmo que rodea a la IA, el informe encontró una tendencia preocupante: menos proyectos de IA están llegando a implementarse, y aquellos que lo hacen muestran menos retorno de la inversión. Desde 2021, el porcentaje medio de proyectos de IA implementados ha disminuido un 8,1%, mientras que el porcentaje medio de proyectos de IA implementados que muestran un retorno de la inversión significativo ha disminuido un 9,4%.
Esta disminución se debe en gran medida a la creciente complejidad de los modelos de IA. Los casos de uso simples como el reconocimiento de imágenes y la automatización del habla ahora se consideran tecnologías maduras, pero las empresas están cambiando hacia iniciativas de IA más ambiciosas, como la IA generativa, que requieren datos personalizados y de alta calidad y son mucho más difíciles de implementar con éxito.
Chen explicó: “La IA generativa tiene capacidades más avanzadas en comprensión, razonamiento y generación de contenido, pero estas tecnologías son intrínsecamente más difíciles de implementar”.
3. La calidad de los datos es esencial, pero está disminuyendo
El informe destaca una cuestión crítica para el desarrollo de la IA: la precisión de los datos ha disminuido casi un 9 % desde 2021. A medida que los modelos de IA se vuelven más sofisticados, los datos que requieren también se han vuelto más complejos y, a menudo, requieren anotaciones especializadas y de alta calidad.
Un asombroso 86% de las empresas ahora reentrenan o actualizan sus modelos al menos una vez por trimestre, lo que subraya la necesidad de datos nuevos y relevantes. Sin embargo, a medida que aumenta la frecuencia de las actualizaciones, se vuelve más difícil garantizar que estos datos sean precisos y diversos. Las empresas están recurriendo a proveedores de datos externos para ayudar a satisfacer estas demandas, y casi el 90% de las empresas dependen de fuentes externas para entrenar y evaluar sus modelos.
“Si bien no podemos predecir el futuro, nuestra investigación muestra que la gestión de la calidad de los datos seguirá siendo un desafío importante para las empresas”, afirmó Chen. “Con modelos de IA generativa más complejos, los datos de abastecimiento, limpieza y etiquetado ya se han convertido en obstáculos clave”.
4. Los cuellos de botella en los datos están empeorando
El informe de Appen revela un aumento interanual del 10% en los cuellos de botella relacionados con los datos de abastecimiento, limpieza y etiquetado. Estos cuellos de botella están impactando directamente la capacidad de las empresas para implementar con éxito proyectos de IA. A medida que los casos de uso de la IA se vuelven más especializados, el desafío de preparar los datos correctos se vuelve más grave.
“Los problemas de preparación de datos se han intensificado”, afirmó Chen. “La naturaleza especializada de estos modelos exige conjuntos de datos nuevos y personalizados”.
Para abordar estos problemas, las empresas se están centrando en estrategias a largo plazo que enfatizan la precisión, coherencia y diversidad de los datos. Muchos también buscan asociaciones estratégicas con proveedores de datos para ayudar a navegar las complejidades del ciclo de vida de los datos de la IA.
5. Human-in-the-Loop es más vital que nunca
Si bien la tecnología de IA continúa evolucionando, la participación humana sigue siendo indispensable. El informe encontró que el 80% de los encuestados enfatizaron la importancia del aprendizaje automático con humanos en el circuito, un proceso en el que se utiliza la experiencia humana para guiar y mejorar los modelos de IA.
“La participación humana sigue siendo esencial para desarrollar sistemas de IA de alto rendimiento, éticos y contextualmente relevantes”, afirmó Chen.
Los expertos humanos son particularmente importantes para garantizar la mitigación de prejuicios y el desarrollo ético de la IA. Al proporcionar conocimientos específicos de un dominio e identificar posibles sesgos en los resultados de la IA, ayudan a perfeccionar los modelos y alinearlos con comportamientos y valores del mundo real. Esto es especialmente crítico para la IA generativa, donde los resultados pueden ser impredecibles y requieren una supervisión cuidadosa para evitar resultados dañinos o sesgados.
Consulte el informe completo de Appen sobre el estado de la IA en 2024 aquí.