Connect with us

Noticias

RIC va más allá de las exageraciones para enseñar aprendizaje automático responsable • Rhode Island Current

Published

on

Este artículo es parte de una serie en curso sobre la IA en Rhode Island.

Un enigma favorito de los filósofos es el problema del carro. Puedes tirar de una palanca y desviar un tranvía fuera de control justo a tiempo para evitar matar a cinco personas, pero una persona moriría en la nueva vía. ¿Tiras de la palanca?

En una mañana soleada de septiembre, en un aula del tercer piso del campus de Rhode Island College (RIC) en Providence, pequeños grupos de estudiantes debatieron sobre un problema de carrito modificado en el que un robot está en el interruptor. Todos han leído el libro alegórico del autor de ciencia ficción Isaac Asimov.tres leyes de la robótica”, que consideraba prohibido que los robots lastimaran a los humanos. ¿Qué puede hacer un robot cuando un resultado sangriento parece inevitable?

Sonya Cheteyan pensó que el dilema no sería más fácil de resolver para una máquina.

“Si es imposible para un ser humano, será muy difícil para una IA darse cuenta, porque la IA es sólo una extensión de nuestra inteligencia”, dijo Cheteyan, estudiante junior del RIC con doble especialización en ciencias de la computación e IA y un Providence de toda la vida. residente.

“Es como una combinación de la inteligencia de todos reunida en una sola entidad para tomar decisiones por nosotros. Y es difícil, porque si no tenemos una respuesta a ese problema, la IA no la tendrá”.

Cheteyan encontró el problema del tranvía en el curso “Aplicación e impacto de la IA”, impartido por el profesor asociado Leonardo Pinheiro. Es uno de los dos cursos que integran el trabajo de detective ético en el nuevo RIC. Plan de estudios de IAcual lanzado en septiembre.

El programa de licenciatura en ciencias es la primera carrera universitaria centrada en la IA en una escuela estatal de Rhode Island. Su objetivo es preparar a los estudiantes para una fuerza laboral en la que la IA ya no es novedosa, dijo Tim Henry, profesor asociado que dirige el nuevo programa de IA. Eso significa educar a los estudiantes no sólo sobre cómo construir inteligencia artificial, sino también sobre cómo hacerlo de manera responsable.

“Vamos a educar a los estudiantes de Rhode Island, ayudándolos a prepararse para la fuerza laboral”, dijo Henry. “Las empresas ya se están sintiendo cómodas con el uso de la IA. Lo difícil es entender cómo usarlo bien y poder saber cuáles son los riesgos de cómo usarlo”.

Lo que los estudiantes aprenden en el programa de IA se superpone y complementa la especialización en informática existente. “[They’re] En cierto modo, es complementario, porque las habilidades informáticas son tan importantes como saber cómo funcionan los modelos de IA”, dijo Cheteyan.

Una mayor alfabetización en IA ya está en la agenda en el ámbito K-12, como se ve en proyectos de ley como el Ley LIFT de IAcopatrocinado por el representante demócrata estadounidense de Rhode Island, Gabe Amo, y el representante republicano de Nueva Jersey, Tom Kean Jr. Mientras tanto, clases como la de Pinheiro en RIC ayudan a contextualizar la inteligencia artificial para aquellos que ingresarán a la fuerza laboral mucho antes. Cheteyan dijo que no esperaba disfrutar el curso tanto como lo ha hecho.

“Él realmente me reveló todo”, dijo sobre Pinheiro. “’Pensé: ‘Oh, la IA es más que solo ChatGPT’. Se utiliza en ciencia de datos. Se utiliza para el reconocimiento facial. Se usó antes de que fuera una palabra popular… Me sorprendió lo lejos que llegó”.

Sea a=4

Al programa de IA se unen dos menores centrados en la IA y se sincroniza con el Instituto de Ciberseguridad y Tecnologías Emergentes de la escuela, que inaugurado el pasado noviembre y se beneficiará de un pregunta electoral aprobado por el 59,7% de los votantes en las elecciones generales del 5 de noviembre. Los votantes dijeron sí a una emisión de bonos por valor de 160,5 millones de dólares para mejoras de capital en RIC y la Universidad de Rhode Island. RIC usaría su participación de $73 millones para renovar y modernizar Whipple Hall y convertirlo en un espacio dedicado al instituto, con laboratorios de computación, centros de datos, infraestructura de TI, aulas y rangos cibernéticos donde los estudiantes podrían modelar amenazas en tiempo real.

Las instalaciones actualizadas diferirían enormemente de donde Henry escribió su primer código en 1976: el interior del armario de limpieza de su escuela secundaria, donde él y tres compañeros de estudios trabajaban en una terminal de teletipo conectada a la Universidad de Pensilvania.

“Tuvimos que escribir nuestro primer programa de computadora”, dijo Henry en una entrevista reciente en su oficina de Alger Hall en el campus de RIC. “Era como, ‘Sea a igual a cuatro, sea b igual a cinco, sea c igual a a más b, imprima c’”.

Ese fue el lugar inicial de la fascinación de Henry, y sus padres le regalaron una calculadora de cuatro funciones para Navidad. Después de servir en la Guardia Costera y una carrera en gimnasia que incluyó dos estatus All-American, hoy el profesor es muy solicitado por su sagacidad con el código.

“Dr. El historial de Henry habla por sí solo”, afirmó Suzanne Mello-Stark, presidenta del departamento de Ciencias de la Computación y Sistemas de Información del RIC y ex doctora. Estudiante de Henry en la URI.

El Instituto de Ciberseguridad y Tecnologías Emergentes del Rhode Island College se encuentra en Alger Hall. (Alexander Castro/Universidad de Rhode Island)

Por eso RIC reclutó a Henry para dirigir el programa de IA. Henry también forma parte del grupo de trabajo sobre inteligencia artificial del gobernador Dan McKee, que fue creado por orden ejecutiva en febrero y se reunió por primera vez en julio. El grupo de trabajo está presidido por el ex representante estadounidense Jim Langevin, quien se desempeña como presidente distinguido del instituto de ciberseguridad del RIC. Él también quería a Henry a bordo para la primera iniciativa a nivel ejecutivo del estado sobre IA, que eventualmente producirá un informe con hallazgos y recomendaciones sobre cómo el gobierno estatal debería proceder mejor con la IA, un conjunto de tecnologías que ha sido anunciada como apocalíptico y mesiánico.

En opinión de Cheteyan, los comentarios sobre la IA pueden ser excesivamente negativos. “Hay cierta fatalidad, por ejemplo, en el periodismo”, dijo, donde se teme que la IA pueda reemplazar o eliminar ciertos trabajos.

Pero Cheteyan cree que la IA puede aprovecharse como una herramienta para el bien y no para la ruina. “El objetivo es recibir educación sobre cómo usarla y cómo aprovechar la IA, en lugar de sentarse y decir: ‘Oh, ahora perdí mi trabajo’. No, simplemente hicimos su trabajo más fácil”, dijo.

Las computadoras también pueden ser artistas

La IA generativa ha hecho que más personas se den cuenta, aunque no siempre sea bienvenida, de la capacidad de la IA para crear canciones, imágenes e historias. Un poco menos de dos años después Surgió ChatGPT como un sofisticado sucesor del chatbots de antañoel entusiasmo por la IA generativa, que crea contenido, no se ha evaporado. Pero ni siquiera un robot bien entrenado puede resolverlo todo. ¿Qué pasa si le pides a ChatGPT que “resuelva el problema del tranvía”?

“Es poco probable que un robot ‘resuelva’ completamente el problema del tranvía, ya que es fundamentalmente una cuestión de filosofía moral más que de lógica pura”, ChatGPT respondió cuando se le solicite.

Henry dijo que las oportunidades creativas ayudan a generar gran parte del interés en la IA.

“Si tiene IA para predecir las ventas de su organización en dos meses, está bien, genial”, dijo Henry. “Eso es realmente interesante para un grupo pequeño y reducido de personas. Pero si la IA puede conversar contigo o generar algún texto para ti, eso será útil para mucha más gente. Si puede generar una imagen para usted, será útil para mucha más gente”.

Sonya Cheteyan, estudiante de tercer año en Rhode Island College, tiene una doble especialización en Ciencias de la Computación y el nuevo programa de IA. (Cortesía de Sonya Cheteyan)

La codificación, dijo Cheteyan, es “en realidad un tipo de creatividad. Sé que mucha gente dice que son matemáticas, pero hay que pensar, hay que encontrar buenas soluciones a los problemas y para eso se necesita una mente creativa”.

Dos proyectos que ha codificado son un chatbot para la popular aplicación de mensajería Discord y un modelo que analiza datos de Netflix para predecir el tiempo de visualización de un usuario en un día determinado. Cheteyan trabaja principalmente en el lenguaje de programación Python, que es “necesario” para muchos modelos de lenguaje grandes que utiliza la IA, y prioriza el código limpio y legible.

Según una de las 20 pautas tipo koan conocidas como Zen de Pitón: “Ante la ambigüedad, rechaza la tentación de adivinar”.

Un trabajo para facilitar otros trabajos

Pero todavía hay conjeturas sobre qué títulos o puestos ocuparán los estudiantes de IA cuando se gradúen, dijo Henry.

“Es una muy buena pregunta y todo el mundo está tratando de resolverla”, dijo Henry. “No puedo descartar necesariamente los títulos, pero a veces es ‘ingeniero en visión por computadora’ o ‘ingeniero en robótica’ o ‘ingeniero en procesamiento del lenguaje natural’. Esas son áreas muy específicas, pero generalmente será alguien que haga aprendizaje automático como ingeniero de software. Así que la ingeniería de software sigue siendo la categoría general”.

La ciencia de datos es un campo en el que la IA está teniendo un impacto notable, dijo Henry, porque “el análisis y la preparación de datos, el análisis exploratorio de datos… son como la primera parte de cualquier buen modelo de IA, poder hacerlos bien”.

También destacó la utilidad de la IA en ciberseguridad, lo que la convierte en una opción natural para el instituto de RIC: “Las herramientas de IA son realmente buenas para comprender y aprender patrones normales de tráfico de red, por ejemplo, o comportamientos típicos de software malicioso”.

Cheteyan tampoco está segura de su futuro exacto ni de qué trabajo desempeñará algún día, pero dijo que espera crear “herramientas útiles” como chatbots o aprovechar la ciencia de datos para hacer predicciones para las empresas. Ella ofreció el ejemplo de análisis de sentimientoque rastrea enormes cantidades de texto para hablar en línea sobre ciertos productos, personas o empresas.

Esta imagen se creó pidiéndole a ChatGPT que escribiera un mensaje para Midjourney que ilustrara el problema del tranvía. A pesar de numerosos ajustes y revisiones del mensaje, Midjourney tuvo problemas para representar el escenario tal como estaba escrito, pero hizo un trabajo mucho mejor al comprender señales de estilo como la escala del modelo de tren que se muestra. (Generación de IA/Alexander Castro/Rhode Island Current)

Un optimismo cauteloso rodea a la IA generativa, destacado recientemente por la gobernadora de la Reserva Federal, Lisa D. Cook, quien la llamó una “tecnología de propósito general”, que podría aumentar la productividad, reducir la inflación y ser una bendición para el mercado laboral en general, aunque llevaría tiempo.

Un total de 386 estudiantes están tomando clases bajo el paraguas de IA a través del instituto. Ese número incluye una combinación de especializaciones, dobles especializaciones y menores, dijo Lindsay Russell, portavoz del Instituto de Ciberseguridad y Tecnologías Emergentes.

Aún no estaba disponible un número exacto de especialidades y Henry dijo que la escuela todavía está inscribiendo especialidades. “La mayoría de los estudiantes que conozco en este momento son personas que estuvieron aquí en su segundo año y se matricularon en una especialidad de IA en su tercer año”, agregó.

En el próximo semestre, Henry impartirá un curso sobre ética en tecnologías de inteligencia artificial.

“El mayor problema es comprender cómo se puede utilizar el software fuera de lo previsto”, dijo Henry. “Esa es nuestra responsabilidad ética: observar los datos y cómo los recopilamos para entrenarlos”.

OBTÉN LOS TITULARES DE LA MAÑANA.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

Probé el nuevo generador de imágenes de Chatgpt, y destrozó mis expectativas

Published

on

Aviso: ¿Puede generar una imagen colorida realista de perro con un traje en la calle en una relación 16: 9?

Captura de pantalla de Sabrina Ortiz/Zdnet

OpenAi puede haber iniciado la moda de la generación de texto a imagen con su modelo Dall-E, pero desde esos días de gloria anteriores, la oferta de la compañía de IA ha sido lapada por modelos de imagen mucho más capaces. Como resultado, cuando Operai lanzó su último y mejor modelo de generación de imágenes GPT-4O, me escéptico. Después de probarlo, he cambiado de opinión por completo.

Empezando

Cuando Dall-E se lanzó por primera vez, vivió en su sitio web independiente; Desde entonces, se ha movido a Chatgpt. La medida llegó con muchos beneficios, incluso poder pedirle al chatbot Ai una imagen que desee en la misma interfaz donde ya está charlando sobre otra cosa, eliminando así la necesidad de un cambio de contexto constante.

Con el lanzamiento de la generación de imágenes GPT-4O, OpenAI mantuvo este formato conveniente, cambiando el generador de imagen predeterminado de Dall-E a GPT-4O para suscriptores pagados. Como resultado, fue muy fácil comenzar a crear nuevas imágenes desde mi cuenta ChatGPT Plus. Todo lo que tenía que hacer era ingresar el mensaje de lo que quería ver, y luego los generaría. Los usuarios también pueden acceder a él desde la interfaz Sora.

También: Cómo usar Sora de OpenAi para crear impresionantes videos generados por AI

Cuidado: aún puede generar imágenes de manera similar si es un usuario gratuito. Sin embargo, si no está impresionado, eso se debe a que, aunque en el lanzamiento, se anunció que el modelo venía a todos los usuarios, incluidos los gratuitos, el CEO de Operai, Sam Altman, anunció un día después que el despliegue al nivel libre ahora se “retrasaría por un tiempo”.

Las imágenes

En el momento en que has estado esperando: las imágenes. Después de insertar una solicitud, el IA genera la generación en menos de un minuto. El proceso lleva un poco más de lo que solía, pero las imágenes valen la pena, entregando muchos detalles, textura, realismo e incluso precisión del texto. En lugar de describirlo, incluiré ejemplos a continuación para que pueda verlo usted mismo.

Inmediato: ¿Puedes generar una imagen realista de un camaleón, de cerca, filmado como si estuviera en National Geographic en la relación 16: 9?

chatgpt-image-lizard

Sabrina Ortiz/Zdnet a través de chatgpt

Inmediato: ¿Puede generar una imagen de una computadora portátil abierta en un escritorio que dice: “Este modelo es tan bueno que incluso puede obtener texto y manos correctos, que generalmente son desafíos importantes para los modelos de IA”, con las manos escribiendo en un teclado en una relación 16: 9?

chatgpt-laptop-withs

Sabrina Ortiz/Zdnet a través de chatgpt

Inmediato: ¿Puedes generar una foto realista de un primer plano de una mujer en una multitud en Times Square mirando la cámara y sonriendo, con la calidad de una tomada en una DSLR?

chatgpt-woman sonriendo

Sabrina Ortiz/Zdnet a través de chatgpt

Como se vio anteriormente, el generador de imágenes hace un gran trabajo al adherirse a la solicitud y entregar imágenes realistas de alta calidad. Sin embargo, al probar un modelo de IA, una de las verdaderas métricas de rendimiento es cómo se compara con los competidores en el mercado. Para darle un buen indicador de esto, lo hice generar el mismo aviso que probé en todos los principales generadores de imágenes de IA, incluidos MidJourney, Imagen 3 de Google, Adobe Firefly y más.

Adjunto la interpretación de GPT-4O a continuación. Puede ver cómo le va a todos los otros generadores de imágenes de IA en este artículo, incluida la interpretación de Dall-E, que claramente está muy por detrás de lo que el nuevo modelo puede hacer.

Inmediato: ¿Puedes generar una imagen de un colibrí vibrante y realista encaramado en un árbol?

chatgpt-image-hummingbird

Sabrina Ortiz/Zdnet a través de chatgpt

Otras características notables

Aunque la calidad de las imágenes es quizás una de las mayores victorias del modelo, también hay otros beneficios. Una de las más grandes es que vive en la interfaz del chatbot, lo que facilita el ajuste de las generaciones con simples indicaciones de lenguaje natural. Además, debido a que el chatbot tiene el contexto de lo que acabas de preguntar, puede considerar eso al construir la imagen.

Por ejemplo, si está charlando con él sobre organizar una fiesta de cumpleaños, es posible que pueda decir: “¿Puede crear ahora una invitación que tenga la información anterior?” en lugar de tener que volver a escribir. Por ejemplo, comencé a chatear con ChatGPT sobre lanzar un inauguración de la casa, y al pedir que hiciera que creara una invitación, no tuve que repetir la información que dije anteriormente.

Invitación de fiesta de inauguración de la casa: chatgpt

Captura de pantalla de Sabrina Ortiz/Zdnet

También puede cargar imágenes de referencia y luego pedirle a ChatGPT que cree una versión diferente o las use como elementos de una nueva. Por ejemplo, puede ingresarlo como una selfie y generarla en estilo de anime, como se ve en la nueva publicación X de Altman.

Todas estas características de personalización lo convierten en una oferta realmente sólida para los creativos, que también pueden solicitar que se presente en un fondo transparente o incorpore guías de estilo de marca, como códigos hexagonales o logotipos.

Hablando de Altman, pude generar una imagen de él con un sombrero de fiesta. Podría hacerlo porque el nuevo modelo tiene salvaguardas mucho más sueltas, destinadas a permitir a los usuarios inclinarse en su libertad creativa. La publicación de blog que anunció el modelo señaló que limita lo que se puede crear cuando las personas reales están en el contexto, incluidas “salvaguardas particularmente robustas sobre la desnudez y la violencia gráfica”.

chatgpt-image-sam-altman

Sabrina Ortiz/Zdnet a través de chatgpt

No puedo decir si hay un caso de uso práctico para esta función, pero es un cambio notable que necesitaba probar por mí mismo. Cuando intenté crear una imagen de Mickey Mouse, decía que no podía debido a las implicaciones de los derechos de autor, por lo que parece que no todas las figuras públicas son un juego justo.

En general

En general, el generador de imágenes GPT-4O es una gran victoria sobre los modelos Dall-E y quizás entre los mejores de los muchos que he probado. ¿Vale la pena los $ 20 por mes? Si solo está interesado en la generación de imágenes de alta calidad, todavía hay versiones gratuitas que puede explorar que son realmente capaces, como Adobe Firefly o Google’s Imagen 3.

También: los mejores generadores de imágenes de IA: probado y revisado

Dicho esto, si es un usuario de ChatGPT frecuente, la actualización a ChatGPT Plus se vuelve significativamente más atractiva. Con esta actualización, tendrá acceso a todas las últimas y mejores funciones de chatbot de OpenAI, así como una generación de imágenes y videos de alta calidad, todo por $ 20 al mes, lo que no es un mal negocio, especialmente teniendo en cuenta otras ofertas en el mercado. Por ejemplo, la suscripción de MidJourney comienza en $ 10 por mes y solo ofrece generación de imágenes.

¿Quieres más historias sobre AI? Regístrese para la innovaciónnuestro boletín semanal.

Continue Reading

Noticias

El nuevo médico de Siri, los nuevos auriculares VR de Bigscreen, la actualización de Ghibli de OpenAI

Published

on

Sí, Apple realmente confía en el Vision Pro Guy con el futuro de Siri. Apple decidió entregar el liderazgo de Siri a Mike Rockwell, arquitecto y director ejecutivo a cargo del Vision Pro. Si bien Rockwell puede ser el ejecutivo más experimentado en el edificio, su último gran proyecto, el Vision Pro de $ 3,500, fue un fracaso de alto perfil, rivalizando con el Newton. ¿Qué costo entonces el CEO John Scully su trabajo (recuerdas eso, Tim?). A pesar de la ambición técnica de los auriculares de Apple, falló tanto con los consumidores como con los desarrolladores, lo que llevó a muchos a cuestionar por qué Apple lo lanzó. No es que estén solos. Meta tampoco sabe para qué sirve la pantalla. Ahora, Rockwell tiene la tarea de arreglar a Siri. Parir. Tim sabe mejor. Espero que la roca tenga un mejor resultado esta vez.

Apple quiere convertir sus relojes en AI portátil. Apple explora la integración de IA en futuros modelos de Apple Watch que estarán equipados con cámaras para admitir características avanzadas de “inteligencia visual”, como la visión por computadora y la traducción de texto en tiempo real. El modelo de serie en el desarrollo puede albergar una cámara, mientras que el modelo Ultra podría presentar una lente montada en el lado. Esta iniciativa tiene como objetivo integrar las capacidades de IA directamente en el auricular. Mike, si todavía estás leyendo, esto también podría funcionar para ti. ¿Para qué sirve la pantalla?

Operai ha presentado un poderoso generador de imágenes de IA y poderoso integrado en su modelo de lenguaje GPT-4O. Esta característica ha provocado una tendencia de generar imágenes al estilo de artistas y estudios de renombre, en particular Studio Ghibli, que lleva a debates sobre los derechos de autor y la integridad artística. Los críticos argumentan que replicar estilos distintivos sin consentimiento infringe los derechos de los creadores, mientras que los partidarios lo ven como una herramienta para la exploración creativa. Operai ha implementado salvaguardas para evitar el mal uso, incluidas las restricciones en la generación de imágenes en el estilo de los artistas vivos.

IDC dice que las ventas de auriculares de realidad virtual atornillaron al perro en 2024 y no mejoraron hasta que sean nuevos modelos en 2026. Dadas las ventas de nuevos modelos desde la Quest 2 (The Quest Pro, Quest 3 y 3s), no tengo idea de por qué IDC predeciría esto. La realidad virtual necesita una nueva propuesta de valor del consumidor. En este momento, la gente no parece estar interesada en ello, en comparación con, por ejemplo, Grand Theft Auto 6 (GTA IV).

Reve AI lanza un modelo avanzado de texto a imagen. La startup reve AI con sede en Palo Alto ha introducido Reve Image 1.0un modelo de generación de texto a imagen que enfatiza la adherencia rápida, la estética y la tipografía. Los usuarios pueden generar y modificar imágenes utilizando comandos de texto y cargar imágenes de referencia para lograr estilos específicos. En particular, el modelo sobresale en representar un texto claro y legible dentro de las imágenes, un desafío para muchos sistemas de IA, y maneja efectivamente las indicaciones de varios caracteres. Lugar de evaluaciones tempranas Reve Image 1.0 Antes de competidores como MidJourney V6.1 e Imagen 3 de Google en calidad de imagen. El modelo está actualmente disponible para una vista previa gratuita en Preview.reve.Art.

Bigscreen Beyond 2: Refinando una visión para los entusiastas de la realidad virtual sin Apple o Meta. Bigscreen ha presentado el Beyond 2, un auricular VR de peso ultraligero y de peso personalizado que pesa solo 107 gramos. Cuenta con un ajuste de lente independiente para acomodar distancias interpupilares asimétricas y cuenta con óptica de panqueques mejoradas para mejorar la claridad y un campo de visión más amplio. La variante Beyond 2E introduce capacidades opcionales de seguimiento ocular a través de sensores minúsculos, lo que permite aplicaciones como el movimiento de ojos Avatar en VRCHAT. Ambos modelos están disponibles para su pedido, y se espera que los envíos comiencen en junio de 2025.

Diferin aporta el cuidado del acné a Roblox con recompensas gamificadas. Dentsu, Differin y Dubit han lanzado la primera campaña de cuidado del acné sobre Roblox, combinando educación y entretenimiento inmersivo. El Difering nivel up lobby ofrece minijuegos, recompensas en el juego y UGC exclusivo en cinco experiencias de Roblox principales, incluidas Periódico y El piso es lava. Los jugadores pueden escanear los recibos para las compras de diferencias para desbloquear recompensas adicionales. En menos de dos semanas, la iniciativa ganó casi 700,000 impresiones y más de 200,000 jugadas. “Estamos pioneros en una nueva frontera en el compromiso digital”, dijo Val Vacante de Dentsu, destacando el atractivo de la estrategia al grupo de edad de 12 a 24 años, donde se cruzan el acné y los juegos.

Vivaldi 3.0 barre el 5º premio anual de Polys Inmersive Awards. El quinto premio anual de Polys Inmersive tiene lugar el domingo 23 de marzo en Microsoft Garage en Soho, Nueva York, destacando la innovación en XR con fiestas de relojes globales alojadas en VRCHAT y Engage VR. Organizado por Julie Smithson, con entrevistas de alfombra roja de Sophia Moshasha, el evento honró a creadores destacados en medios inmersivos. Vivaldi 3.0una interpretación virtual de Las cuatro estaciones Con el violinista Ara Malikian, dominó la noche, la experiencia ganadora del año, la experiencia educativa del año y la experiencia de entretenimiento del año. Un estudio XR, Cause+Christi y Andy Fidel produjeron la experiencia.

El juego del año fue a Dino Haber por 30 Ninjas y Dark Slope, un juego de realidad virtual que combina cuidado de dinosaurios y aprendizaje ecológico. Otros ganadores incluidos Bromear (Premio de elevación XR), Biel/Bienne: casco antiguo (Splat del año), Supersplat (Innovador del año) y Thomas Richter-Trummer (desarrollador del año).

Esta columna es el guión para la parte de noticias del podcast semanal del autor del autor Co-organizado por el ex futurista de Paramount y cofundador de Red Camera, y Rony Abovitz, fundador de Magic Leap, Mako Robotics y Synthbee AI. Esta semana, nuestros invitados son Nils Phil, CEO de Auki Labs, y Caspar Thykier, CEO de Zappar, que están utilizando códigos QR para crear navegación en interiores por humanos y robots. Se nos puede encontrar en Spotify, iTunes y YouTube.

Lo que estamos leyendo

La revolución cultural de AI está aquí (Elena Nikiforia/Supercargada con AI)

10 películas de ciencia ficción escalofriantes donde la IA se vuelve pícaro (Alisdair Hodgson/Whatculutre)

Continue Reading

Noticias

Chatgpt hace defectos profundos y a Sam Altman no le importa

Published

on

No esperaba que un producto Chatgpt se volviera viral a fines de marzo, pero aquí estamos. Openai sorprendió al mundo con el lanzamiento de GPT-4O Image Generation, un nuevo modelo de IA que está construido en ChatGPT, brindando a los usuarios características de generación de imágenes increíblemente avanzadas.

Envíe un mensaje detallado a la IA, y ChatGPT dibujará inmediatamente una imagen alucinante basada en sus instrucciones. Las imágenes pueden contener texto legible, el primero para la generación de imágenes ChatGPT, lo cual es impresionante. Además, la herramienta de generación de imágenes AI puede usar fotos reales para editarlas como desee.

El problema es que la nueva herramienta de generación de imágenes de Openai puso a disposición de los usuarios premium sin fuertes barandillas de seguridad. La red se inundó inmediatamente con defagos de Chatgpt que presentan celebridades y un montón de dibujos de IA inspirados en el estudio de Ghibli.

ChatGPT ni siquiera coloca una marca de agua en sus creaciones para informar a los espectadores que son imágenes generadas por IA. Los metadatos no son una función de seguridad lo suficientemente buena, no cuando alguien puede crear estas falsificaciones. Géminis podría eliminar las marcas de agua de las creaciones con derechos de autor, pero al menos coloca su propia marca de agua en los resultados.

Lo que es peor es la respuesta sorda de Sam Altman a todo esto. El CEO de Operai está adoptando todos los elogios que recibió la herramienta ChatGpt AI, lo que ciertamente se merece, sin comprometerse con mejores salvaguardas.

Aquí está el mensaje que Altman publicó en X poco después del lanzamiento de la generación de imágenes 4O:

> Sé yo
> Muela durante una década tratando de ayudar a hacer la superinteligencia para curar el cáncer
o lo que sea
> En su mayoría a nadie le importa durante los primeros 7.5 años, luego durante 2.5 años a todos
odios
tu por todo
> Despierta un día a cientos de mensajes: “Mira, te convertí en un twink
estilo ghibli jaja “

El mensaje acompañó un cambio de imagen de perfil para el perfil X de Altman, como se ve en la siguiente imagen. Altman reemplazó su foto con una versión de estilo Gibli creada por Chatgpt de sí mismo.

La reacción de Sam Altman en X al día después del lanzamiento O 40 Generación de imágenes en ChatGPT. Fuente de la imagen: x

Todo es divertido y juegos en este momento porque todavía tenemos que ver abusos reales. Pero no se equivoquen, las personas abusarán de la herramienta para crear defensores profundos que puedan engañar a las personas desprevenidas, especialmente a las personas menos expertas en tecnología y aquellas en países donde la IA podría no ser utilizada tan ampliamente.

No es solo Chatgpt lo que sufre de este problema de seguridad. Google tiene sus propias herramientas avanzadas de generación de imágenes para Gemini que también se pueden usar para crear falsificaciones con facilidad.

Pero Operai deliberadamente eligió no imponer reglas más estrictas. En su anuncio inicial, Openai tiene un capítulo sobre seguridad que aborda ciertos tipos de abuso, y eso es encomiable. Las imágenes de IA vienen con metadatos C2PA que identifican imágenes creadas con IA, pero todo lo que necesita hacer es tomar una captura de pantalla de esa imagen, y eliminará esos datos.

Tome la imagen superior en esta publicación anterior; Es una captura de pantalla de una imagen de estilo ghibli generada por ChatGPT que la IA hizo con el siguiente mensaje:

Hazme una imagen de estilo Gibli de estudio basada en lo que acabamos de hablar. Lo quiero en una relación de aspecto de 16:10, tienes libertad para imaginarme a mí y a ti mismo

Además, ChatGPT bloquea las solicitudes específicas, “como materiales de abuso sexual infantil y defectos sexuales”. Operai también dijo: “Cuando las imágenes de personas reales están en contexto, hemos aumentado restricciones con respecto a qué tipo de imágenes se pueden crear, con salvaguardas particularmente robustas sobre la desnudez y la violencia gráfica”. Pero esto no cambia el hecho de que cualquier usuario de ChatGPT ahora puede crear defensores profundos que puedan ser abusados. No tienen que ser sexuales para ser potencialmente peligrosos.

Operai podría hacer más aquí, pero elige no hacerlo a pesar de saber completamente que algunas de las imágenes que provienen de ChatGPT se verán como fotos reales. Esto es lo que dijo Altman en X después de que se lanzó la herramienta:

Estamos lanzando una cosa nueva hoy: ¡las imágenes en ChatGPT!

Dos cosas que decir al respecto:

1. Es una tecnología/producto increíble. Recuerdo haber visto algunas de las primeras imágenes salir de este modelo y pasar un mal rato las que realmente las hará. Creemos que a la gente le encantará, y estamos emocionados de ver la creatividad resultante.

Felicidades a nuestros investigadores @gabeegoooh @prafdhar @ajabri @eliza_luth @kenjihata @dmed256

2. Esto representa una nueva marca de alta agua para nosotros al permitir la libertad creativa. La gente va a crear algunas cosas realmente increíbles y algunas cosas que pueden ofender a las personas; Lo que nos gustaría apuntar es que la herramienta no crea cosas ofensivas a menos que lo desee, en cuyo caso lo hace. Mientras hablamos en nuestra especificación de modelo, creemos que poner esta libertad y control intelectuales en manos de los usuarios es lo correcto, pero observaremos cómo va y escuchar a la sociedad. Creemos que respetar los límites muy amplios que la sociedad eventualmente elegirá establecer para AI es lo correcto, y cada vez más importante a medida que nos acercamos a AGI. Gracias de antemano por la comprensión mientras trabajamos en esto.

También está el elefante obvio en la habitación que Altman ni siquiera aborda. Los poderes de generación de imágenes de ChatGPT acaban de hacer que los diseñadores gráficos sean obsoletos. O cerca de él. Esto siempre iba a suceder, pero las empresas de IA como OpenAi deberían al menos tratar de fingir que se preocupan por el impacto de sus productos en los trabajos y la vida tal como lo conocemos.

Volviendo a todas las imágenes de ChatGPT que veo en las redes sociales, también anotaré el desprecio de OpenAI por los derechos de autor aquí. Chatgpt no dibujará personajes que pertenecen a Studio Ghibli, claro, pero copiará el estilo y lo adaptará a lo que desee.

No es de extrañar que la reacción de Hayao Miyazaki al usar IA para la animación haya resurgido en línea esta semana. El cofundador de Studio Gibli dijo que la animación generada por IA era un “insulto a la vida en sí” cuando se le presentó una herramienta interna con AI hace unos años que podía crear dibujos en estilo Gibli. Estoy seguro de que no está muy feliz de ver que ChatGPT copia el estilo de su empresa tan fácilmente.

Eso no quiere decir que la IA no pueda usarse con fines creativos o que la nueva tecnología de generación de imágenes de ChatGPT no sea impresionante, porque lo es.

Además, en defensa de Chatgpt, vi protecciones de seguridad en mis pruebas, incluidas las relacionadas con los derechos de autor. Pero esto no cambia el hecho de que OpenAi hace que sea increíblemente fácil para cualquiera usar Deepfakes que parezcan casi indistinguibles de las fotos reales, y al CEO de la compañía no parece importarle.

Continue Reading

Trending