Connect with us

Noticias

La IA generativa crecerá un 17% en 2024, pero la calidad de los datos se desploma: hallazgos clave del informe sobre el estado de la IA de Appen

Published

on

Únase a nuestros boletines diarios y semanales para obtener las últimas actualizaciones y contenido exclusivo sobre la cobertura de IA líder en la industria. Más información


Un nuevo informe del proveedor de datos de IA Appen revela que las empresas están luchando por obtener y gestionar los datos de alta calidad necesarios para impulsar los sistemas de IA a medida que la inteligencia artificial se expande a las operaciones empresariales.

El informe sobre el estado de la IA 2024 de Appen, que encuestó a más de 500 tomadores de decisiones de TI en EE. UU., revela que la adopción de la IA generativa aumentó un 17 % el año pasado; sin embargo, las organizaciones ahora enfrentan obstáculos importantes en la preparación de datos y el control de calidad. El informe muestra un aumento interanual del 10 % en los cuellos de botella relacionados con el abastecimiento, la limpieza y el etiquetado de datos, lo que subraya las complejidades de crear y mantener modelos de IA eficaces.

Si Chen, jefa de estrategia de Appen, explicó en una entrevista con VentureBeat: “A medida que los modelos de IA abordan problemas más complejos y especializados, los requisitos de datos también cambian”, afirmó. “Las empresas están descubriendo que tener una gran cantidad de datos ya no es suficiente. Para ajustar un modelo, los datos deben ser de muy alta calidad, lo que significa que deben ser precisos, diversos, adecuadamente etiquetados y adaptados al caso de uso específico de la IA”.

Si bien el potencial de la IA sigue creciendo, el informe identifica varias áreas clave en las que las empresas encuentran obstáculos. A continuación se muestran las cinco conclusiones principales del informe sobre el estado de la IA de 2024 de Appen:

1. La adopción de la IA generativa está aumentando, pero también lo están los desafíos relacionados con los datos

La adopción de IA generativa (GenAI) ha crecido un impresionante 17 % en 2024, impulsada por avances en grandes modelos de lenguaje (LLM) que permiten a las empresas automatizar tareas en una amplia gama de casos de uso. Desde operaciones de TI hasta I+D, las empresas están aprovechando GenAI para optimizar los procesos internos y aumentar la productividad. Sin embargo, el rápido aumento en el uso de GenAI también ha introducido nuevos obstáculos, particularmente en torno a la gestión de datos.

“Los resultados de la IA generativa son más diversos, impredecibles y subjetivos, lo que hace que sea más difícil definir y medir el éxito”, dijo Chen a VentureBeat. “Para lograr una IA lista para la empresa, los modelos deben personalizarse con datos de alta calidad adaptados a casos de uso específicos”.

La recopilación de datos personalizados se ha convertido en el método principal para obtener datos de entrenamiento para los modelos GenAI, lo que refleja un cambio más amplio desde los datos genéricos extraídos de la web en favor de conjuntos de datos confiables y personalizados.

El uso de la IA generativa en los procesos de negocio continúa expandiéndose, con aumentos notables en las operaciones de TI, la fabricación y la investigación y el desarrollo. Sin embargo, la adopción en áreas como marketing y comunicaciones ha disminuido ligeramente. (Fuente: Informe Appen sobre el estado de la IA 2024)

2. Las implementaciones de IA empresarial y el ROI están disminuyendo

A pesar del entusiasmo que rodea a la IA, el informe encontró una tendencia preocupante: menos proyectos de IA están llegando a implementarse, y aquellos que lo hacen muestran menos retorno de la inversión. Desde 2021, el porcentaje medio de proyectos de IA implementados ha disminuido un 8,1%, mientras que el porcentaje medio de proyectos de IA implementados que muestran un retorno de la inversión significativo ha disminuido un 9,4%.

Esta disminución se debe en gran medida a la creciente complejidad de los modelos de IA. Los casos de uso simples como el reconocimiento de imágenes y la automatización del habla ahora se consideran tecnologías maduras, pero las empresas están cambiando hacia iniciativas de IA más ambiciosas, como la IA generativa, que requieren datos personalizados y de alta calidad y son mucho más difíciles de implementar con éxito.

Chen explicó: “La IA generativa tiene capacidades más avanzadas en comprensión, razonamiento y generación de contenido, pero estas tecnologías son intrínsecamente más difíciles de implementar”.

El porcentaje de proyectos de IA que llegan a implementarse ha disminuido constantemente desde 2021, con una fuerte caída al 47,4% en 2024. De manera similar, el porcentaje medio de proyectos implementados que muestran un retorno de la inversión significativo ha caído al 47,3%, lo que refleja los crecientes desafíos que enfrentan las empresas para lograrlo. Implementaciones exitosas de IA. (Fuente: Informe Appen sobre el estado de la IA 2024)

3. La calidad de los datos es esencial, pero está disminuyendo

El informe destaca una cuestión crítica para el desarrollo de la IA: la precisión de los datos ha disminuido casi un 9 % desde 2021. A medida que los modelos de IA se vuelven más sofisticados, los datos que requieren también se han vuelto más complejos y, a menudo, requieren anotaciones especializadas y de alta calidad.

Un asombroso 86% de las empresas ahora reentrenan o actualizan sus modelos al menos una vez por trimestre, lo que subraya la necesidad de datos nuevos y relevantes. Sin embargo, a medida que aumenta la frecuencia de las actualizaciones, se vuelve más difícil garantizar que estos datos sean precisos y diversos. Las empresas están recurriendo a proveedores de datos externos para ayudar a satisfacer estas demandas, y casi el 90% de las empresas dependen de fuentes externas para entrenar y evaluar sus modelos.

“Si bien no podemos predecir el futuro, nuestra investigación muestra que la gestión de la calidad de los datos seguirá siendo un desafío importante para las empresas”, afirmó Chen. “Con modelos de IA generativa más complejos, los datos de abastecimiento, limpieza y etiquetado ya se han convertido en obstáculos clave”.

La gestión de datos surgió como el principal desafío para los proyectos de IA en 2024, y el 48% de los encuestados la citó como un cuello de botella importante. Otros obstáculos incluyen la falta de recursos técnicos, herramientas y datos, lo que pone de relieve la creciente complejidad de la implementación de la IA. (Fuente: Informe Appen sobre el estado de la IA 2024)

4. Los cuellos de botella en los datos están empeorando

El informe de Appen revela un aumento interanual del 10% en los cuellos de botella relacionados con los datos de abastecimiento, limpieza y etiquetado. Estos cuellos de botella están impactando directamente la capacidad de las empresas para implementar con éxito proyectos de IA. A medida que los casos de uso de la IA se vuelven más especializados, el desafío de preparar los datos correctos se vuelve más grave.

“Los problemas de preparación de datos se han intensificado”, afirmó Chen. “La naturaleza especializada de estos modelos exige conjuntos de datos nuevos y personalizados”.

Para abordar estos problemas, las empresas se están centrando en estrategias a largo plazo que enfatizan la precisión, coherencia y diversidad de los datos. Muchos también buscan asociaciones estratégicas con proveedores de datos para ayudar a navegar las complejidades del ciclo de vida de los datos de la IA.

La precisión de los datos en EE. UU. ha disminuido constantemente, pasando del 63,5 % en 2021 a solo el 54,6 % en 2024. La disminución pone de relieve el creciente desafío de mantener datos de alta calidad a medida que los modelos de IA se vuelven más complejos. (Fuente: Informe Appen sobre el estado de la IA 2024)

5. Human-in-the-Loop es más vital que nunca

Si bien la tecnología de IA continúa evolucionando, la participación humana sigue siendo indispensable. El informe encontró que el 80% de los encuestados enfatizaron la importancia del aprendizaje automático con humanos en el circuito, un proceso en el que se utiliza la experiencia humana para guiar y mejorar los modelos de IA.

“La participación humana sigue siendo esencial para desarrollar sistemas de IA de alto rendimiento, éticos y contextualmente relevantes”, afirmó Chen.

Los expertos humanos son particularmente importantes para garantizar la mitigación de prejuicios y el desarrollo ético de la IA. Al proporcionar conocimientos específicos de un dominio e identificar posibles sesgos en los resultados de la IA, ayudan a perfeccionar los modelos y alinearlos con comportamientos y valores del mundo real. Esto es especialmente crítico para la IA generativa, donde los resultados pueden ser impredecibles y requieren una supervisión cuidadosa para evitar resultados dañinos o sesgados.

Consulte el informe completo de Appen sobre el estado de la IA en 2024 aquí.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

Operai, Google y Xai trabajan para reclutar Top AI Talent: A continuación se muestra cómo

Published

on

jugar

  • La competencia para los principales investigadores de IA se ha intensificado en niveles sin precedentes en Silicon Valley.
  • Empresas como OpenAI y Google están ofreciendo paquetes de compensación exorbitantes, incluidos bonos y capital multimillonarios, para atraer y retener talento.
  • La escasez de personas con experiencia en modelos de idiomas grandes es impulsar las tácticas de reclutamiento agresivas.

SAN FRANCISCO – El concurso en Silicon Valley para dominar la inteligencia artificial se está desarrollando en una nueva corte: los investigadores superestrella.

Si bien la lucha para atraer el mejor talento y mantenerlos felices siempre ha sido un sello distintivo de la industria tecnológica, desde que ChatGPT se lanzó a fines de 2022, el reclutamiento se ha intensificado a los niveles profesionales de atletas, una docena de personas que han estado involucradas en el reclutamiento de investigadores de IA dijeron a Reuters.

“Los laboratorios de IA se acercan a la contratación como un juego de ajedrez”, dijo Ariel Herbert-Voss, CEO de la startup de ciberseguridad Runsybil y un ex investigador de Operai que ingresó a la pelea de talentos después de lanzar su propia compañía. “Quieren moverse lo más rápido posible, por lo que están dispuestos a pagar mucho por candidatos con experiencia especializada y complementaria, al igual que las piezas del juego. Son como, ‘¿Tengo suficientes torres?

Empresas, incluidas OpenAi y Google, ansiosas por obtener o mantenerse por delante en la carrera para crear los mejores modelos de IA, cortan a estos llamados “IC”: los contribuyentes individuales cuyo trabajo puede hacer o romper empresas.

Noam Brown, uno de los investigadores detrás de los recientes avances de IA de OpenAi en el razonamiento complejo de matemáticas y ciencias, dijo que cuando exploró las oportunidades de trabajo en 2023, se encontró siendo cortejado por la élite de Tech: el almuerzo con el fundador de Google Sergey Brin, póker de Sam Altman’s y una visita de avión privado de un ansioso inversor. Elon Musk también hará llamadas para cerrar candidatos para Xai, su compañía de IA, dijeron que dos personas que han hablado con él. Xai no respondió a una solicitud de comentarios.

Finalmente, dijo Brown, eligió OpenAi porque OpenAi estaba dispuesto a poner recursos, tanto las personas como el cálculo, detrás del trabajo que estaba entusiasmado.

“En realidad, no era financieramente la mejor opción que tenía”, dijo, explicando que la compensación no es lo más importante para muchos investigadores. Eso no ha impedido que las empresas arrojen millones de dólares en bonos y paquetes de paquetes a los investigadores STAR, según siete fuentes familiarizadas con el asunto.

Algunos investigadores de los principales abiertos que han indicado interés en unirse a la nueva compañía de la ex científica jefe Ilya Sutskever, SSI, se les ofreció bonos de retención de $ 2 millones, además de aumentos de capital de $ 20 millones o más, si se quedaron, a dos fuentes le dijeron a Reuters. Algunos solo se les ha requerido que se queden durante un año para obtener la bonificación completa. SSI y OpenAi declinaron hacer comentarios.

Otros investigadores de Operai que han presentado ofertas de once laboratorios han recibido bonos de al menos $ 1 millón para quedarse en OpenAI, dijeron dos fuentes a Reuters. Los principales investigadores de OpenAI reciben regularmente paquetes de compensación de más de $ 10 millones al año, dijeron las fuentes.

Google Deepmind ha ofrecido a los principales investigadores $ 20 millones por año paquetes de compensación, otorgados con subvenciones de capital fuera del ciclo específicamente a los investigadores de IA, y también ha reducido la adjudicación de algunos paquetes de valores a 3 años, en lugar de los 4 años normales, dijeron las fuentes. Google declinó hacer comentarios.

Por el contrario, los principales ingenieros de Big Tech Companies reciben una compensación anual promedio de $ 281,000 en salario y $ 261,000 en capital, según CompreHensive.io, una compañía que rastrea la compensación de la industria tecnológica.

La guerra de talentos de IA

Si bien el talento siempre ha sido importante en Silicon Valley, la diferencia con el auge de la IA es cuán pocas personas están en este grupo de élite, dependiendo de a quién le pregunte, el número podría variar de unas pocas docenas a alrededor de mil, ocho fuentes dijeron a Reuters.

Eso se basa en la creencia de que este pequeño número de “IC” ha hecho contribuciones de gran tamaño al desarrollo de grandes modelos de idiomas, la tecnología en la que se basa el auge de IA de hoy y, por lo tanto, podría hacer o romper el éxito de un modelo de IA.

“Seguro que los ingenieros 10X son geniales, pero maldita sea esos 10,000x ingenieros/investigadores …”, tuiteó el CEO de OpenAI, Sam Altman, a finales de 2023, aludiendo a una máxima larga que los mejores ingenieros de software fueron 10 veces más buenos que el promedio (10X), pero ahora en la industria de la IA, los mejores investigadores son 10,000 veces (10,000x) tan efectivos que el promedio.

La partida de septiembre del director de tecnología de OpenAi, Mira Murati, quien luego fundó una startup rival de IA, ha intensificado la Guerra de Talento AI. Murati, conocido en Operai por sus habilidades de gestión y destreza de ejecución, reclutó a 20 empleados de Operai antes de anunciar su empresa en febrero. Ahora ha atraído aún más investigadores de Operai y otros laboratorios, y el equipo ahora tiene alrededor de 60 personas, dijeron dos fuentes a Reuters. Aunque la compañía no tiene ningún producto en el mercado, Murati está en medio de cerrar una ronda de semillas récord que se basa en la fuerza del equipo. Un representante de Murati declinó hacer comentarios.

La escasez de talento ha obligado a las empresas a acercarse a la contratación creativamente. Zeki Data, una empresa de datos centrada en identificar el talento de IA de los mejores IA, dijo que está empleando técnicas de análisis de datos de la industria del deporte como la popularizada por la película “Moneyball” para identificar talento prometedor pero no descubierto. Por ejemplo, los datos de Zeki descubrieron que Anthrope ha estado contratando investigadores con antecedentes de física teórica, y otras compañías de inteligencia artificial han contratado individuos con antecedentes de computación cuántica.

Anthrope no respondió a una solicitud de comentarios.

“En mi equipo, tengo matemáticos extraordinariamente talentosos que no habrían venido a este campo si no fuera por el rápido progreso que estamos viendo ahora”, dijo Sébastien Bubeck, quien dejó su papel como vicepresidente de investigación de Genai en Microsoft el año pasado para unirse a Openi. “Estamos viendo una afluencia de talento de todos los campos que están en IA ahora. Y algunas de estas personas son muy, muy inteligentes, y marcan la diferencia”.

Informes de Anna Tong en San Francisco; Edición de Kenneth Li y Claudia Parsons

Continue Reading

Noticias

Probé Claude 4 soneto vs chatgpt-4o con 7 indicaciones: los resultados fueron sorprendentes

Published

on

Los chatbots de IA avanzan rápidamente y los probando hasta sus límites es lo que hago para vivir. El soneto Claude 4 de Anthrope y el chatgpt-4o de OpenAI son dos de las herramientas más inteligentes disponibles en este momento. Pero, ¿cómo se comparan realmente en el uso diario?

Para averiguarlo, le di a ambos modelos el mismo conjunto de 7 indicaciones; Cubriendo todo, desde narración de cuentos y productividad hasta apoyo emocional y pensamiento crítico.

Continue Reading

Noticias

Una nueva IA prepara proteínas de diseñador con solo un mensaje de texto

Published

on

“Escríbeme un resumen conciso de Misión imposible Personajes y tramas hasta la fecha ”, recientemente le pregunté a ChatGPT antes de atrapar la última entrada de franquicia. Se entregó. No necesitaba entender su código o conocer su conjunto de datos de capacitación. Todo lo que tenía que hacer era preguntar.

ChatGPT y otros chatbots impulsados ​​por modelos de idiomas grandes, o LLM, son más populares que nunca. Los científicos están tomando nota. Las proteínas, los caballos de batalla moleculares de las células, mantienen nuestros cuerpos corriendo suavemente. También tienen un idioma propio. Los científicos asignan una letra abreviada a cada uno de los 20 aminoácidos que componen proteínas. Al igual que las palabras, las cadenas de estas letras se unen para formar proteínas de trabajo, su secuencia determina la forma y la función.

Inspirados en LLM, los científicos ahora están construyendo modelos de lenguaje de proteínas que diseñan proteínas desde cero. Algunos de estos algoritmos están disponibles públicamente, pero requieren habilidades técnicas. ¿Qué pasaría si su investigador promedio podría simplemente pedirle a una IA que diseñe una proteína con un solo mensaje?

El mes pasado, los investigadores dieron a Protein Design AI el tratamiento con chatgpt. De una descripción del tipo, estructura o funcionalidad de una proteína que está buscando, el algoritmo produce posibles candidatos. En un ejemplo, la IA, denominada pinal, hizo con éxito múltiples proteínas que podrían descomponer el alcohol cuando se analizó dentro de las células vivas. Puedes probarlo aquí.

Pinal es el último en un creciente conjunto de algoritmos que traducen el inglés cotidiano en nuevas proteínas. Estos diseñadores de proteínas entienden el lenguaje sencillo y la biología estructural, y actúan como guías para los científicos que exploran proteínas personalizadas, con poca experiencia técnica.

Es un “enfoque ambicioso y general”, el equipo internacional detrás de Pinal escribió en una preimpresión publicada en Biorxiv. La IA aprovecha el “poder descriptivo y la flexibilidad del lenguaje natural” para hacer que las proteínas de diseñador sean más accesibles para los biólogos.

Enfrentados contra los algoritmos de diseño de proteínas existentes, Pinal entendió mejor el objetivo principal de una proteína objetivo y aumentó las posibilidades de que funcionaría en las células vivas.

“Somos los primeros en diseñar una enzima funcional usando solo texto”, dijo Fajie Yuan, científica de IA de la Universidad de Westlake en China que dirigió el equipo. Naturaleza. “Es como la ciencia ficción”.

Más allá de la evolución

Las proteínas son los componentes básicos de la vida. Forman nuestros cuerpos, el metabolismo del combustible y son el objetivo de muchos medicamentos. Estas intrincadas moléculas comienzan a partir de una secuencia de “letras” de aminoácidos, que se unen entre sí y eventualmente se doblan en intrincadas estructuras 3D. Muchos elementos estructurales, un bucle aquí, un tejido o bolsillo allí, son esenciales para su función.

Los científicos han intentado durante mucho tiempo diseñar proteínas con nuevas habilidades, como enzimas que descomponen de manera eficiente los plásticos. Tradicionalmente, han personalizado las proteínas existentes para un cierto uso biológico, químico o médico. Estas estrategias “están limitadas por su dependencia de las plantillas de proteínas existentes y las limitaciones evolutivas naturales”, escribieron los autores. Los modelos de lenguaje de proteínas, en contraste, pueden soñar con un universo de nuevas proteínas sin ataduras de la evolución.

En lugar de absorber el texto, la imagen o los archivos de video, como LLMS, estos algoritmos aprenden el lenguaje de las proteínas entrenando en secuencias y estructuras de proteínas. ESM3 de EvolutionaryScale, por ejemplo, entrenó en más de 2.700 millones de secuencias de proteínas, estructuras y funciones. Los modelos similares ya se han utilizado para diseñar anticuerpos que luchan contra ataques virales y nuevas herramientas de edición de genes.

Pero estos algoritmos son difíciles de usar sin experiencia. Pinal, por el contrario, apunta al científico promedio-joe. Al igual que una cámara DSLR en Auto, el modelo “evita las especificaciones estructurales manuales”, escribió el equipo, lo que hace que sea más simple hacer su proteína deseable.

Háblame

Para usar Pinal, un usuario le pide a la IA que construya una proteína con una solicitud de varias palabras clave, frases o un párrafo completo. En la parte delantera, la IA analiza los requisitos específicos en el aviso. En el back -end, transforma estas instrucciones en una proteína funcional.

Es un poco como pedirle a ChatGTP que le escriba una reseña de restaurante o un ensayo. Pero, por supuesto, las proteínas son más difíciles de diseñar. Aunque también están formados por “letras”, su forma final determina cómo (o si) funcionan. Un enfoque, denominado entrenamiento de extremo a extremo, traduce directamente un aviso en secuencias de proteínas. Pero esto abre la IA a un vasto mundo de secuencias potenciales, lo que hace que sea más difícil marcar las secuencias precisas de las proteínas de trabajo. En comparación con las secuencias, la estructura de proteínas, la forma 3D final, es más fácil para el algoritmo generar y descifrar.

Luego está el dolor de cabeza de los datos de entrenamiento. Aquí, el equipo recurrió a las bases de datos de proteínas existentes y usó LLM para etiquetarlas. El resultado final fue una vasta biblioteca de 1.700 millones de pares de texto proteico, en el que las estructuras de proteínas coinciden con descripciones de texto de lo que hacen.

El algoritmo completado utiliza 16 mil millones de parámetros, estas son las conexiones internas de una IA, para traducir el inglés simple al idioma de la biología.

Pinal sigue dos pasos. Primero traduce las indicaciones en información estructural. Este paso divide una proteína en elementos estructurales, o “fichas”, que son más fáciles de procesar. En el segundo paso, un modelo en idioma proteico llamado Saprot considera la intención del usuario y la funcionalidad de proteínas para diseñar secuencias de proteínas con mayor probabilidad de doblar en una proteína de trabajo que satisfaga las necesidades del usuario.

En comparación con los algoritmos de diseño de proteínas de última generación que también usan el texto como entrada, incluida ESM3, el pinal superó la precisión y la novedad, es decir, generar proteínas no conocidas por la naturaleza. Usando algunas palabras clave para diseñar una proteína, “la mitad de las proteínas de pinal exhiben funciones predecibles, solo alrededor del 10 por ciento de las proteínas generadas por ESM3 lo hacen”.

En una prueba, el equipo le dio a la IA un breve aviso: “Por favor, diseñe una proteína que sea una alcohol deshidrogenasa”. Estas enzimas descomponen el alcohol. De más de 1.600 proteínas candidatas, el equipo eligió los ocho más prometedores y las probó en células vivas. Dos rompieron con éxito el alcohol a temperatura corporal, mientras que otros fueron más activos a un sudor de 158 grados Fahrenheit.

Las indicaciones más elaboradas que incluían la función de una proteína y los ejemplos de moléculas similares, arrojaron candidatos a antibióticos y proteínas para ayudar a las células a recuperarse de la infección.

Pinal no es el único IA de texto a proteína. El Startup 310 AI ha desarrollado una IA denominada MP4 para generar proteínas a partir del texto, con los resultados que la compañía dice que podría beneficiar la enfermedad cardíaca.

El enfoque no es perfecto. Al igual que los LLM, que a menudo “alucinan”, los modelos de lenguaje de proteínas también sueñan secuencias poco confiables o repetitivas que reducen las posibilidades de un resultado final de trabajo. La redacción precisa de las indicaciones también afecta la estructura de proteína final. Aún así, la IA es como la primera versión de Dall-E: juega con ella y luego valida la proteína resultante usando otros métodos.

Continue Reading

Trending