Connect with us

Noticias

Gemini + OpenAI, Los modelos o1, ¡Salve Flutie!, ¡Avión! chistes y los típicos pitidos y platos al plato

Published

on

Bienvenidos, compañeros jarheads, a Cuentos del lado del frascoel Kousen TI newsletter, para la semana del 17 al 24 de noviembre de 2024. Esta semana impartí mis cursos regulares en Colegio Trinidad.

A principios de este mes, Google anunció que puede acceder a su herramienta Gemini AI mediante el API abierta de IA. Vi eso en este artículo sobre InfoQlo que me llevó a este artículo en el blog para desarrolladores de Google.

Aquí está su ejemplo de Python:

ellos usan el OpenAI clase, pero establezca la clave API, el modelo y la URL base para Gemini de Google. Recientemente hice un video donde mostré cómo Perplejidad Hice lo mismo, pero nunca esperé que Google hiciera lo mismo. Gemini es un competidor directo de OpenAI y ya tiene su propia API completa.

¿Por qué Google haría esto? No lo sé, pero sospecho que tiene algo que ver con esta cifra, que proviene de este informe:

Esto muestra el cambio en la cuota de mercado de los distintos modelos de IA durante el año pasado. OpenAI tenía la llamada “ventaja del primero en actuar”, ya que llegó primero con ChatGPT, pero su participación de mercado cayó del 50% al 34%. La mayor parte se destinó a Anthropic, cuya herramienta Claude AI pasó del 12% al 24% en el mismo período. Debo admitir que considero que Claude es el mejor del grupo, pero principalmente me dedico a generar código con él. Luego viene Meta (es decir, Facebook), con su herramienta de código abierto Llama 3.

En un distante cuarto lugar (!) está Google, donde Gemini mejoró del 7% al 12%, pero sigue siendo una cifra muy baja. Este movimiento parece ser un intento de Google de robarle clientes a OpenAI, con el argumento de que los desarrolladores ya están usando el modelo de programación OpenAI, ¿por qué no cambiar la implementación de AI a Gemini?

Grabé un video donde hablo sobre esto y presento ejemplos con ambos. LangChain4j y IA de primavera para ver qué funciona y qué no. Espere que el video se publique esta semana.

En septiembre, con gran fanfarria, OpenAI anunció sus modelos de “razonamiento”, a los que llamaron o1-vista previa y o1-minirecordándonos nuevamente a todos que a las empresas de inteligencia artificial nunca se les debe permitir nombrar nada. Como tengo una cuenta paga, pude acceder a esos modelos a través de su aplicación, pero no pude acceder a ellos a través de la API.

Eso cambió esta semana. Recibí el siguiente correo electrónico:

Soy Nikunj, PM de la API OpenAI. Hemos estado trabajando para ampliar el acceso a la versión beta de OpenAI o1 y estoy emocionado de brindarle acceso a la API hoy. Hemos desarrollado estos modelos para dedicar más tiempo a pensar antes de responder. Pueden razonar a través de tareas complejas y resolver problemas más difíciles que los modelos anteriores en ciencias, codificación y matemáticas.

Puede comenzar con la versión beta de o1 ahora:

Lea los documentos

Tienes acceso a dos modelos:

  • Nuestro modelo más amplio, o1-preview, que tiene sólidas capacidades de razonamiento y amplio conocimiento mundial.

  • Nuestro modelo más pequeño, o1-mini, que es un 80% más barato que o1-preview.

¡Prueba ambos modelos! Es posible que encuentre uno mejor que el otro para su caso de uso específico. Pero tenga en cuenta que o1-mini es más rápido, más barato y competitivo con o1-preview en tareas de codificación (puede ver cómo funciona aquí). También hemos escrito más sobre estos modelos en nuestro publicación de blog.

Sí, ahora funcionan para mí. Debo admitir que todavía estoy un poco decepcionado con ellos. Para lo que hago, son más lentos y más caros, y las respuestas no son mejores que las de GPT-4o. Quizás todavía no he encontrado el caso de uso adecuado. Ya veremos.

Entonces esto sucedió.

La fecha del aniversario es el 23 de noviembre. En esa fecha de 1984, Doug Flutie, QB senior de Boston College, lanzó este pase contra los Miami Hurricanes, quarterbacked por Bernie Kosar:

Doug Flutie y yo tenemos aproximadamente la misma edad. Le llevo unos seis meses, ya que yo nací en marzo y él nació en octubre. Aún así, debido a los requisitos de cierre del año escolar, eso significó que yo me gradué del MIT en junio de 1984, mientras que él entró en su último año en BC ese otoño. Da la casualidad de que el Día de Acción de Gracias de ese año fue el 22 de noviembre, así que, como casi todos los demás en el país, estaba viendo este juego en casa durante las vacaciones.

En caso de que seas demasiado joven para recordarlo, Doug Flutie era un prospecto imperdible de Natick High, justo en las afueras de Boston, que convirtió a BC de básicamente un perdedor a un contendiente durante los cuatro años que estuvo allí. También fue descrito generosamente como 5′ 9” y 175 libras, lo que significa que era demasiado bajo y pequeño para ser el mago que realmente era en el campo de fútbol.

Wikipedia tiene una página completa sobre este juego, al que llaman Salve flauta. Como dice la pagina:

Miami fue la defensora campeón nacional y entró al juego con un récord de 8-3, clasificado duodécimo en la nación. Boston College ocupó el décimo lugar con un récord de 7-2 y ya había aceptado una invitación al Tazón de algodón en día de año nuevo. El partido se jugó en el Tazón de naranja en miamiy televisado a nivel nacional por CBScon Brent Musburger, Ara Parseghiany Pat Haden comentando.

Los récords y logros del juego incluyeron:

  • El mariscal de campo de los Hurricanes Bernie Kosar Pasó para un récord escolar de 447 yardas, con dos touchdowns.

  • corredor de miami Melvin Bratton corrió para cuatro touchdowns.

  • Flutie lanzó para 472 yardas y tres touchdowns para convertirse en el primer mariscal de campo universitario importante en superar las 10,000 yardas en su carrera.[6]

  • Phelan atrapó 11 pases para 226 yardas y dos touchdowns.

El video comienza con 6 segundos restantes en el juego, BC estaba abajo 45 – 41 después de que Miami liderara otra ofensiva anotadora para tomar la delantera con medio minuto para el final. Flutie toma el centro, trepa hacia su derecha y lanza la pelota literalmente 65 yardas en el aire mientras el tiempo expiraba en la zona de anotación donde fue atrapada por su compañero de cuarto, Gerard Phelan. BC ganó 47 – 41, e incluso ahora Flutie dice que es raro el día en que alguien no le habla de ello.

Uno de los comentaristas (creo que fue Haden) seguía diciendo que Phelan estaba detrás de la defensa y “eso nunca puede suceder” (uf, odio esa construcción; después de todo, simplemente sucedió), pero no entró en detalles por qué. Probablemente sucedió porque no creían que Flutie pudiera lanzar la pelota tan lejos. Quiero decir, mírenlo a él y al video. La reacción de todos fue: Vaya, ¿realmente la pelota voló así? Guau.

(Hablando de los locutores, el único inconveniente de este pequeño viaje de nostalgia fue tener que escuchar a Brent Musburger nuevamente. No lo soportaba. Para mí, él representaba todo lo malo de las transmisiones de la NFL en televisión. Era una máquina de publicidad: todo era siempre “el mejor jugador” o “la jugada más increíble que jamás haya sucedido”, y un favorito total del que me cansé muy rápidamente. El hecho de que fuera excelente en exageraciones solo empeoró las cosas).

La carrera profesional de Flutie fue decididamente mixta. Comenzó en la USFL con los New Jersey Generals, propiedad de un fanfarrón multimillonario de Nueva York en una de sus primeras quiebras. (Es posible que hayas oído hablar de él. Desafortunadamente.) Luego fue a la NFL por algunos años y fue de mediocre a malo, se fue a la liga canadiense donde ganamos múltiples títulos y múltiples premios MVP, regresó a la NFL donde estaba. mucho mejor, pero aún no excelente, y finalmente me retiré.

En su última temporada, a los 43 años, como QB suplente de los New England Patriots de Bill Belichick, hizo esto:

Ese es el primer punto extra exitoso en la NFL desde 1941. Aparentemente Belichick vio a Flutie practicarlos y se divirtió lo suficiente como para darle la oportunidad de hacerlo en su último juego, para deleite de todos.

Viví en Boston durante tres de los cuatro años que Flutie estuvo allí y él aparecía en las noticias constantemente. Siempre lo apoyé. Al fin y al cabo, a mí también me juzgaron demasiado pequeño y bajo para jugar al fútbol, ​​con la diferencia de que en mi caso era cierto. (Viejo chiste: yo era pequeño y lo compensé siendo lento). La verdad es que Flutie fue un gran mariscal de campo de la CFL pero mediocre de la NFL, porque en la NFL los defensores son mucho más grandes y más rápidos, por lo que ya no podía. huir de ellos. Flutie fue el mejor mariscal de campo universitario que jamás haya visto, y ese pase lo convirtió en una leyenda.

Aquí está un enlace directo a ese artículo. Bluesky ahora tiene más de 21 millones de usuarios, y aunque Threads afirma que tiene diez veces más, el lugar no me parece una comunidad. En Threads se trata de seguir a celebridades e influencers, y moderan mucho el contenido en su algoritmo, lo que frustra a muchos periodistas. Bluesky es como Twitter de la vieja escuela, pero mejor y más amigable. Realmente lo estoy disfrutando.

Ah, y Mark Hamill está allí ahora:

Mucha gente recuerda que Bluesky fue creado por Jack Dorsey, la persona muy extraña que (co)creó Twitter, pero ya no está allí.

Puedes encontrarme en Bluesky en https://bsky.app/profile/kousenit.com.

Y eso es todo lo que voy a decir al respecto.

Un ¡Avión! La broma es definitivamente un control de edad. ¿Sabías que esa película salió en 1980? La niña enferma fue interpretada por Jill Whelanque nació el 29 de septiembre de 1966, lo que significa que ahora tiene 58 años. En realidad, nunca dijeron cuál era su enfermedad en la película, pero aparentemente salió bien porque pasó a interpretar a Vicki Stubing en El barco del amor.

Esta semana también tenemos Gladiador II fuera, así que supongo que este otro clip de Airplane! es relevante de nuevo:

Debo admitir que estoy decepcionado porque no he escuchado nada. Gladiador malvado chistes esta semana (ya sabes, porque el Malvado La película también está aquí), así que supongo que elegí la semana equivocada para dejar de regodearme en la nostalgia como un escape de lo que está sucediendo en el mundo real.

En caso de que esas otras referencias no fueran lo suficientemente antiguas, puedo remontarme otra generación a los Beatles.

No significa que no sea peligroso.

¡Que tengáis una gran semana a todos!

Compartir Cuentos desde el lado del frasco

La semana pasada:

Esta semana:

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

La herramienta Sora de OpenAI filtrada por un grupo de primeros evaluadores agraviados

Published

on

La fuga de Sora de OpenAI: las implicaciones de la tecnología, la ética y la promoción

Se ha estado gestando una tormenta en el panorama de la IA luego de la filtración no autorizada del innovador modelo Sora de OpenAI, un generador de texto a video que ha estado causando sensación por su capacidad para crear videos cortos y de alta fidelidad con una estabilidad temporal notable. En el centro de la controversia hay un conflicto multifacético que involucra avances tecnológicos, preocupaciones éticas y defensa artística. La filtración se publicó en Hugging Face y supuestamente fue realizada por personas involucradas en la fase de prueba (usando el nombre de usuario “PR-Puppets”) y plantea preguntas apremiantes sobre la relación entre innovación, trabajo y responsabilidad corporativa. El modelo filtrado, publicado junto con una carta abierta dirigida a los “Señores Supremos de la IA Corporativa”, supuestamente puede producir videoclips de 10 segundos con una resolución de hasta 1080p.

¿Qué es Sora?

Sora representa un salto significativo en las capacidades de IA generativa, funcionando como un modelo de difusión para transformar indicaciones de texto en videos de hasta un minuto. Aprovechando técnicas de varios modelos, Sora ofrece una alineación precisa del texto al visual y una coherencia temporal mejorada. La visión de OpenAI para Sora es ambiciosa y la posiciona como un paso fundamental hacia el logro de la Inteligencia General Artificial (AGI). A pesar de estas aspiraciones, la tecnología no está exenta de limitaciones; Los desafíos para replicar la física compleja y garantizar la seguridad del contenido siguen siendo áreas de mejora.

Como se describe en la plataforma de discusión Hugging Face, Sora es “una muestra fascinante de destreza técnica”. La capacidad del modelo para producir “narrativas visualmente coherentes” en forma de vídeo ha sido elogiada como un logro histórico en la IA generativa.

La filtración y sus supuestas motivaciones

La filtración del modelo de Sora parece deberse a la insatisfacción entre los evaluadores y contribuyentes, particularmente aquellos en las industrias creativas. Los críticos alegan que OpenAI (actualmente valorada en más de 150 mil millones de dólares) explotó su trabajo al depender de contribuciones no remuneradas o mal compensadas para perfeccionar el modelo. Estos evaluadores, incluidos artistas visuales y cineastas, brindaron valiosos comentarios y aportes creativos, solo para supuestamente verse excluidos del reconocimiento o compensación equitativa.

“No se trataba sólo de trabajo no remunerado: se trataba de respeto”, señaló un colaborador anónimo citado en el comentario de Hugging Face. “OpenAI trató nuestros aportes como materia prima, no como experiencia creativa. No es colaboración; es extracción”.

Este acto de rebelión sirve como protesta contra la mercantilización más amplia de la experiencia creativa en el desarrollo de la IA. La filtración se enmarcó estratégicamente para resaltar el supuesto desprecio de OpenAI por el valor económico del trabajo artístico, haciéndose eco de sentimientos de descontento que ya prevalecen en el discurso ético de la IA.

El grupo declaró que, después de tres horas, “OpenAI cerró temporalmente el acceso temprano de Sora para todos los artistas”.

Complicaciones éticas y legales

La controversia de Sora también reaviva los debates sobre derechos de autor y propiedad intelectual. OpenAI se ha enfrentado anteriormente a un escrutinio por su uso de material protegido por derechos de autor con fines de formación, alegando el uso legítimo como defensa. Aunque OpenAI ha declarado que los datos de entrenamiento de Sora incluyen conjuntos de datos públicos y con licencia, la compañía se ha mostrado reticente a dar detalles específicos, dejando espacio para el escepticismo. Esta opacidad, combinada con demandas en curso de creadores y editores, subraya las tensiones entre el avance tecnológico y los derechos de propiedad intelectual.

Las preocupaciones de seguridad con respecto a los modelos de IA generativa como Sora han llevado a OpenAI a implementar salvaguardas, incluidos clasificadores de detección y mecanismos de aplicación de políticas de contenido. Sin embargo, es posible que tales medidas no sean suficientes para abordar el posible uso indebido del modelo filtrado. Los comentaristas de Hugging Face señalaron que “una filtración de esta magnitud socava los esfuerzos de OpenAI para hacer cumplir las salvaguardias éticas. Pone el poder sin control en manos de cualquiera que tenga acceso”.

Implicaciones más amplias para la IA y las industrias creativas

La filtración de Sora es emblemática de una lucha de poder más amplia en la era de la IA. Por un lado, OpenAI se posiciona como pionero en la intersección de innovación y utilidad, y Sora representa una herramienta para democratizar la creación de videos. Por otro lado, la filtración ha puesto de relieve cuestiones sistémicas, como la infravaloración del trabajo creativo y los dilemas éticos que rodean la dependencia de la IA de la creatividad humana.

Como afirmó otro colaborador de Hugging Face: “La IA no existe en el vacío. Se construye sobre los hombros de creativos que a menudo no quedan acreditados. La filtración de Sora es una llamada de atención: la innovación sin ética es explotación”.

Para los profesionales creativos, la filtración es un arma de doble filo. Si bien saca a la luz las desigualdades del sistema actual, también corre el riesgo de socavar la confianza en las colaboraciones entre artistas y desarrolladores de tecnología. En el futuro, el incidente exige repensar la forma en que las corporaciones se relacionan con las comunidades creativas, enfatizando la transparencia, la compensación justa y el respeto por la propiedad intelectual.

Un ajuste de cuentas para la IA

Las consecuencias de la filtración de Sora ofrecen lecciones críticas para el futuro de la IA generativa. A medida que la tecnología continúa desdibujando los límites entre la creatividad y la computación, la necesidad de marcos éticos se vuelve cada vez más apremiante. El manejo de la situación por parte de OpenAI probablemente sentará un precedente sobre cómo las organizaciones navegan por la compleja interacción de innovación, ética y promoción.

En última instancia, la controversia de Sora es un microcosmos de los desafíos más amplios que enfrenta la industria de la IA: cómo equilibrar la búsqueda del progreso con el imperativo de honrar y proteger el trabajo humano que lo sustenta. Como concluyó sucintamente un observador en Hugging Face: “Esto es más que una filtración; es un ajuste de cuentas”.

Continue Reading

Noticias

Cómo GenAI cambió el trabajo tecnológico

Published

on

Hace dos años, el 30 de noviembre, ChatGPT irrumpió en escena, generando una fascinación global por la IA generativa y transformándola en una innovación que deben observar tanto los consumidores como los profesionales de la tecnología. Desde entonces, ChatGPT se ha expandido y las ruedas de la regulación de la IA han comenzado a girar.

TechRepublic preguntó a los profesionales de la tecnología cómo ha evolucionado su trabajo con ChatGPT, tanto personalmente como dentro de la industria tecnológica en general.

Nuevas funciones introducidas en 2024

Durante el último año, OpenAI ha:

  • Se amplió ChatGPT a nuevos formatos como la búsqueda de ChatGPT y Canvas, el último de los cuales está diseñado, en parte, para ubicarse junto a una aplicación de codificación.
  • Presentados GPT-4o y OpenAI o1, nuevos modelos insignia.
  • Se asoció con Apple para admitir algunas funciones de la IA integrada de Apple.
  • Anunciado ChatGPT recordará conversaciones anteriores.
  • Se lanzó la búsqueda ChatGPT, lo que marca la apuesta de OpenAI para reemplazar la Búsqueda de Google como el portal de facto al resto de Internet.
  • Implementó el modo de voz avanzado para usuarios seleccionados en octubre, permitiéndoles hablar con la IA en voz alta.

El 3 de octubre, OpenAI lanzó Canvas, lo que marcó un experimento importante en el uso de ChatGPT.

“Hacer que la IA sea más útil y accesible requiere repensar cómo interactuamos con ella”, escribió el equipo de OpenAI en octubre con motivo del anuncio de Canvas. “Canvas es un nuevo enfoque y la primera actualización importante de la interfaz visual de ChatGPT desde su lanzamiento hace dos años”.

Cómo ha mejorado ChatGPT en 2024

Graham Glass, director ejecutivo de la plataforma de creación de cursos de inteligencia artificial Cypher Learning, señaló cómo ChatGPT ofrece acceso a modelos más sofisticados ahora que en 2023.

“En primer lugar, ChatGPT sigue mejorando”, dijo en una entrevista con TechRepublic. “Y se ha vuelto más sofisticado, lo que abre oportunidades adicionales para aprovechar esa tecnología”.

El año pasado, Glass aprovechó ChatGPT para generar ideas sobre diseños y arquitecturas de software. Preguntar a la tecnología sobre las mejores prácticas o compensaciones de diseño le brinda “el corpus de todos los diseños que todos han hecho sobre ese tema en particular”, dijo.

“Se ha vuelto más inteligente”, añadió Curt Raffi, director de productos de Acrolinx, una empresa que utiliza IA para probar contenido para documentos técnicos y otros trabajos de redacción intensa. Señaló el rendimiento mejorado de GPT-4o, así como de OpenAI o1.

Raffi también explicó que la gente se siente más cómoda usando ChatGPT. Trabaja con ingenieros que han mejorado en la activación de ChatGPT de maneras que expresan una lógica empresarial específica.

VER: La primera reunión de la Red Internacional de Institutos de Seguridad de IA, celebrada esta semana, tiene como objetivo gestionar los riesgos de la IA avanzada.

A Glass le gusta que la búsqueda ChatGPT proporcione información actual y la considera un ahorro de tiempo para tareas como comparaciones de productos. También utiliza el modo de voz avanzado para charlar con la IA en voz alta.

En general, las incorporaciones de ChatGPT durante el último año han brindado más opciones para las personas que desean utilizar la IA generativa para trabajos técnicos.

“La forma más significativa en que los asistentes de IA generativa han cambiado la programación y el desarrollo durante el último año es permitir que personas con diferentes niveles de programación participen en el desarrollo de software para ofrecer soluciones a problemas del mundo real”, dijo Houbing Herbert Song, miembro del Instituto. de Ingenieros Eléctricos y Electrónicos, dijo en un correo electrónico a TechRepublic.

¿Qué no puede hacer ChatGPT en 2024?

La IA no es inmune a los errores. Para Glass, codificar con ChatGPT a menudo implica un diálogo de ida y vuelta, incluido “recordarle” a la IA detalles que pudo haber pasado por alto.

“Aunque creo que es mucho más fiable en lo que respecta al diseño [in 2024]todavía comete muchos errores de codificación”, dijo Glass.

Por ejemplo, Glass dijo sobre una tarea reciente que ChatGPT necesitó 10 indicaciones para crear una función en JavaScript correctamente. Esto aún le ahorró tiempo, pero demuestra que ChatGPT aún es limitado. Atribuyó esto en parte a que ChatGPT fue entrenado en un corpus de código finito, aunque enorme.

Filev señaló que ChatGPT se ha vuelto tan confiable que las personas no se dan cuenta fácilmente cuando comete errores.

“Se está volviendo tan bueno que comencé a bajar la guardia, y no sé si eso es algo bueno o malo”, dijo Filev.

Para muchas tareas, comenzó a buscar fuentes físicas en la Búsqueda de Google o Perplexity AI antes de usar ChatGPT. Estos podrían ser mejores lugares para encontrar fuentes confiables, dijo, mientras que ChatGPT es mejor para intercambiar ideas.

Las regulaciones podrían afectar ChatGPT

El año pasado también reveló las limitaciones y la posible regulación de ChatGPT. Raffi dijo que su equipo está abordando cuidadosamente el código generado por IA después de un caso judicial entre los desarrolladores y GitHub Copilot. Los desarrolladores alegaron que GitHub Copilot violó los derechos de propiedad intelectual al utilizar código fuente abierto.

Raffi señaló que el uso comercial de dicho código en los mercados sigue siendo algo incierto, lo que hace que las aplicaciones de IA en la codificación sean un proceso cauteloso y exploratorio.

“Nuestra propiedad intelectual está en nuestro código, y si de repente estuviéramos abiertos o expuestos a demandas, podríamos erosionar el valor de nuestra empresa”, dijo Raffi.

Cómo ChatGPT ha afectado a los desarrolladores que inician su carrera

Durante el año pasado, otro avance clave fue el impacto de ChatGPT en los desarrolladores que inician su carrera.

“Debido a que esto mejora en gran medida la eficiencia para que los desarrolladores se concentren en el diseño y la innovación de orden superior, quizás lo más importante es que el papel de un desarrollador cambia drásticamente de creadores a supervisores de código generado por IA”, dijo Dheerendra Panwar, miembro senior de IEEE, en un correo electrónico a TechRepublic. “Lo que nos lleva a una pregunta muy importante: ¿estamos simplificando el arte de la codificación?”

En algunos casos, es posible que los desarrolladores junior no sean contratados en absoluto, ya que algunas tareas que normalmente se les asignan ahora están a cargo de la IA.

“Estos cambios parecen ser beneficiosos para los programadores senior, ya que amplían su función e importancia”, escribió en un correo electrónico Jen Stave, directora ejecutiva del Instituto de Diseño de Datos Digitales de la Universidad de Harvard. “Debido a que los desarrolladores junior a menudo carecen de la experiencia para detectar problemas como alucinaciones de IA o resultados inexactos, este papel increíblemente importante recae en los programadores senior que ahora necesitan ampliar su responsabilidad para mitigar riesgos como los errores de código inducidos por la IA”.

En otros casos, los desarrolladores junior pueden ser más competentes en ingeniería rápida que los senior.

“Para los programadores jóvenes, la historia es más compleja”, escribió Stave. “La IA generativa reduce su dependencia de la resolución colaborativa de problemas, fomentando un trabajo más autónomo. Si bien esta independencia puede acelerar la productividad, eso puede no ser algo bueno para los humanos que tienden a obtener beneficios para la salud mental de la interacción y colaboración humana”.

Andrew Filev, fundador y director ejecutivo de Zencoder, una startup de herramientas de desarrollo de software de inteligencia artificial, explicó que impulsar ChatGPT puede parecer un conjunto de habilidades distinto. Sin embargo, le recordó cómo el uso de la Búsqueda de Google alguna vez fue una habilidad incluida en los currículums. Quizás 2024 fue el año en que ChatGPT comenzó a afectar la forma en que los profesionales de la tecnología piensan sobre el portal al resto de Internet.

“Se está convirtiendo cada vez más en una parte integral de mi día a día”, dijo Filev sobre ChatGPT. “Me da un impulso de productividad, pero no me define de una forma u otra, ¿verdad?”

La búsqueda ChatGPT y Canvas ofrecen nuevos factores de forma

Los esfuerzos de OpenAI por convertirse en un nuevo portal para el resto de Internet se pueden ver más claramente en la búsqueda de ChatGPT y en Canvas.

Raffi dijo que la búsqueda ChatGPT no se mantuvo muy bien frente a la Búsqueda de Google, carecía de contexto y proporcionaba “resultados bastante malos”. Sin embargo, utiliza Canvas con frecuencia.

“Está cambiando la forma en que pensamos sobre la IA y ChatGPT”, dijo. “Se trata de introducir una capa de aplicación y hacerte pensar en las API de IA como el back-end y más en la lógica empresarial detrás de todo. Resume muchas de las complejidades confusas de muchos editores”.

Dado que Canvas almacena recuerdos, puede hacer referencia a cambios anteriores en el código. Raffi lo llamó una combinación de capa de aplicación, back-end y capa de lógica empresarial.

Habrá muchos cambios en los próximos años.

2024 demostró que la IA no puede hacerlo todo y que la tasa de casos de uso transformadores podría estar desacelerando. Por otro lado, las empresas de inteligencia artificial están entrenando modelos para digerir cada vez más datos, incluida la mejora de los modelos subyacentes a ChatGPT. La forma en que los profesionales interactúan con ChatGPT ha cambiado desde 2023 y probablemente será diferente dentro de un año.

“Sí, habrá cambios”, dijo Filev. Comparó el auge de la IA con el paso de las tarjetas perforadas a la programación de software. “Pero creo que los desarrolladores están acostumbrados a los cambios”.

“La tecnología avanza y nosotros nos mantenemos al día, y creo que nos permite hacer mucho más y mejor”, añadió. “Y ChatGPT es uno de los buenos ejemplos de tecnologías que nos ayudan”.

Continue Reading

Noticias

¿Qué es la IA generativa? Todo lo que hay que saber sobre la tecnología detrás de ChatGPT y Gemini

Published

on

La inteligencia artificial está en todas partes, te des cuenta o no. Está detrás de los chatbots con los que hablas en línea, las listas de reproducción que transmites y los anuncios personalizados que de alguna manera saben exactamente lo que anhelas. Ahora está adquiriendo una personalidad más pública: piense en Meta AI, que aparece en aplicaciones como Facebook, Messenger y WhatsApp; o Gemini de Google, que trabaja en segundo plano en todas las plataformas de la empresa; o Apple Intelligence, que acaba de iniciar un lento despliegue.

La IA tiene una larga historia, que se remonta a una conferencia en Dartmouth en 1956 en la que se discutió por primera vez la inteligencia artificial como algo. Los hitos en el camino incluyen ELIZA, esencialmente el primer chatbot, desarrollado en 1964 por el científico informático del MIT Joseph Weizenbaum, y 2004, cuando apareció por primera vez el autocompletado de Google.

Luego llegó el 2022 y el ascenso de ChatGPT a la fama. Los desarrollos de IA generativa y los lanzamientos de productos se han acelerado rápidamente desde entonces, incluidos Google Bard (ahora Gemini), Microsoft Copilot, IBM Watsonx.ai y los modelos Llama de código abierto de Meta.

Analicemos qué es la IA generativa, en qué se diferencia de la inteligencia artificial “normal” y si la IA generativa puede estar a la altura de las expectativas.

IA generativa en pocas palabras

Desde refrigeradores parlantes hasta iPhones, nuestros expertos están aquí para ayudar a que el mundo sea un poco menos complicado.

En esencia, la IA generativa se refiere a sistemas de inteligencia artificial que están diseñados para producir contenido nuevo basado en patrones y datos que han aprendido. En lugar de simplemente analizar números o predecir tendencias, estos sistemas generan resultados creativos como texto, imágenes, música, videos y código de software.

Algunas de las herramientas de IA generativa más populares del mercado incluyen ChatGPT, Dall-E, Midjourney, Adobe Firefly, Claude y Stable Diffusion.

La principal de sus capacidades es que ChatGPT puede crear conversaciones o ensayos parecidos a los humanos basándose en unas pocas indicaciones sencillas. Dall-E y Midjourney crean obras de arte detalladas a partir de una breve descripción, mientras que Adobe Firefly se centra en la edición y el diseño de imágenes.

Imagen generada por ChatGPT de una ardilla con ojos grandes sosteniendo una bellota

ChatGPT / Captura de pantalla de CNET

Desde refrigeradores parlantes hasta iPhones, nuestros expertos están aquí para ayudar a que el mundo sea un poco menos complicado.

La IA que no es IA generativa

Sin embargo, no toda la IA es generativa. Mientras que la IA genérica se centra en la creación de contenido nuevo, la IA tradicional sobresale en el análisis de datos y la realización de predicciones. Esto incluye tecnologías como el reconocimiento de imágenes y el texto predictivo. También se utiliza para soluciones novedosas en ciencia, diagnóstico médico, pronóstico del tiempo, detección de fraude y análisis financieros para pronósticos e informes. La IA que venció a los grandes campeones humanos en el ajedrez y en el juego de mesa Go no fue una IA generativa.

Puede que estos sistemas no sean tan llamativos como la IA de generación, pero la inteligencia artificial clásica es una gran parte de la tecnología en la que confiamos todos los días.

Cómo funciona la IA generativa

Detrás de la magia de la IA generativa se encuentran grandes modelos de lenguaje y técnicas avanzadas de aprendizaje automático. Estos sistemas se basan en cantidades masivas de datos, como bibliotecas enteras de libros, millones de imágenes, años de música grabada y datos extraídos de Internet.

Los desarrolladores de IA, desde gigantes tecnológicos hasta nuevas empresas, son muy conscientes de que la IA es tan buena como los datos que la alimentan. Si se alimenta de datos de mala calidad, la IA puede producir resultados sesgados. Es algo a lo que ni siquiera los actores más importantes en el campo, como Google, han sido inmunes.

La IA aprende patrones, relaciones y estructuras dentro de estos datos durante el entrenamiento. Luego, cuando se le solicita, aplica ese conocimiento para generar algo nuevo. Por ejemplo, si le pides a una herramienta de inteligencia artificial que escriba un poema sobre el océano, no se trata simplemente de extraer versos preescritos de una base de datos. En cambio, utiliza lo que aprendió sobre poesía, océanos y estructura del lenguaje para crear una pieza completamente original.

Un poema de 12 líneas llamado The Ocean's Whisper.

ChatGPT / Captura de pantalla de CNET

Es impresionante, pero no es perfecto. A veces los resultados pueden parecer un poco extraños. Tal vez la IA malinterprete su solicitud o se vuelva demasiado creativa de una manera que no esperaba. Puede proporcionar con confianza información completamente falsa y depende de usted verificarla. Esas peculiaridades, a menudo llamadas alucinaciones, son parte de lo que hace que la IA generativa sea fascinante y frustrante.

Las capacidades de la IA generativa están creciendo. Ahora puede comprender múltiples tipos de datos combinando tecnologías como el aprendizaje automático, el procesamiento del lenguaje natural y la visión por computadora. El resultado se llama IA multimodal que puede integrar alguna combinación de texto, imágenes, video y voz dentro de un solo marco, ofreciendo respuestas más precisas y relevantes contextualmente. El modo de voz avanzado de ChatGPT es un ejemplo, al igual que el Proyecto Astra de Google.

La generación de IA conlleva desafíos

No faltan herramientas de IA generativa, cada una con su estilo único. Estas herramientas han despertado la creatividad, pero también han planteado muchas preguntas además de prejuicios y alucinaciones, como, ¿quién posee los derechos sobre el contenido generado por IA? O qué material es un juego limpio o está prohibido para que las empresas de inteligencia artificial lo utilicen para entrenar sus modelos de lenguaje; consulte, por ejemplo, la demanda del New York Times contra OpenAI y Microsoft.

Otras preocupaciones (asuntos no menores) involucran la privacidad, el desplazamiento laboral, la responsabilidad en la IA y los deepfakes generados por la IA. Otro problema es el impacto en el medio ambiente porque el entrenamiento de grandes modelos de IA utiliza mucha energía, lo que genera grandes huellas de carbono.

El rápido ascenso de la IA gen. en los últimos años ha acelerado las preocupaciones sobre los riesgos de la IA en general. Los gobiernos están intensificando las regulaciones sobre IA para garantizar un desarrollo responsable y ético, en particular la Ley de IA de la Unión Europea.

IA generativa en la vida cotidiana

Muchas personas han interactuado con chatbots en el servicio de atención al cliente o han utilizado asistentes virtuales como Siri, Alexa y Google Assistant, que ahora están a punto de convertirse en herramientas poderosas de IA de generación. Eso, junto con las aplicaciones para ChatGPT, Claude y otras herramientas nuevas, está poniendo la IA en tus manos.

Mientras tanto, según la Encuesta global de IA 2024 de McKinsey, el 65% de los encuestados dijeron que sus organizaciones utilizan regularmente IA generativa, casi el doble de la cifra reportada apenas 10 meses antes. Industrias como la atención médica y las finanzas están utilizando IA de generación para optimizar las operaciones comerciales y automatizar tareas mundanas.

La IA generativa no es sólo para técnicos o personas creativas. Una vez que aprendas a darle indicaciones, tiene el potencial de hacer gran parte del trabajo preliminar por ti en una variedad de tareas diarias. Digamos que estás planeando un viaje. En lugar de desplazarse por las páginas de resultados de búsqueda, le pide a un chatbot que planifique su itinerario. En cuestión de segundos, tendrá un plan detallado adaptado a sus preferencias. (Ese es lo ideal. Verifique siempre sus recomendaciones). El propietario de una pequeña empresa que necesita una campaña de marketing pero no tiene un equipo de diseño puede usar IA generativa para crear imágenes llamativas e incluso pedirle que sugiera un texto del anuncio.

Un itinerario de viaje para Nueva Orleans, creado por ChatGPT

ChatGPT / Captura de pantalla de CNET

La IA generativa llegó para quedarse

No ha habido un avance tecnológico que haya causado tal auge desde Internet y, más tarde, el iPhone. A pesar de sus desafíos, la IA generativa es innegablemente transformadora. Está haciendo que la creatividad sea más accesible, ayudando a las empresas a optimizar los flujos de trabajo e incluso inspirando formas completamente nuevas de pensar y resolver problemas.

Pero quizás lo más interesante sea su potencial, y apenas estamos arañando la superficie de lo que estas herramientas pueden hacer.

Continue Reading

Trending