Connect with us

Noticias

Me encanta Google Gemini, pero tomaré Apple Intelligence cualquier día de la semana

Published

on

Si está buscando la mejor experiencia de IA en un teléfono, es probable que le vengan a la mente dos fabricantes de IA diferentes. Para el iPhone 16, Apple Intelligence es la respuesta, mientras que para la serie Pixel 9 (y los mejores teléfonos Android) es Gemini de Google. Por supuesto, también puedes descargar Gemini como una aplicación independiente en el iPhone, pero Apple Intelligence es la opción de IA predeterminada.

Ambas empresas ofrecen una gama de características casi idénticas, al menos en lo que prometen ofrecer, pero también existen diferencias matizadas. Google Gemini se centra principalmente en el uso de IA para ayudarle a crear, editar y generar contenido. Por el contrario, Apple Intelligence se centra más en casos de uso personal y en la integración entre una variedad de aplicaciones.

He estado usando Gemini y Apple Intelligence durante meses y ambos servicios de IA tienen sus pros y sus contras. Después de probar ambos durante meses, esto es lo que encontré.

Activando Apple Intelligence y Gemini

Gemini Advanced en Google Pixel 9 Pro Fold. Andy Boxall / Tendencias digitales

Activar cualquiera de las plataformas de IA es bastante intuitivo, especialmente si has usado un teléfono Android o un iPhone antes. Gemini reemplaza al Asistente de Google como el asistente predeterminado en su teléfono, aunque puede desactivarlo, lo que quizás desee hacer, especialmente si confía en el Asistente de Google para su hogar inteligente. Gemini se puede activar más comúnmente deslizando el dedo desde la esquina inferior de la pantalla, aunque también está disponible a través de la palabra clave “Hey Google”.

De manera similar, Apple Intelligence está integrada en el Siri renovado, que se puede activar usando la palabra clave “Hey Siri” o presionando dos veces el botón de encendido. Cuando activas el nuevo Siri, obtendrás un efecto de iluminación estilo arcoíris alrededor del borde de toda la pantalla, en lugar de que Siri se apodere de toda la pantalla como lo hacía en la generación anterior.

Inteligencia de Apple en el Apple iPhone 16 Plus.
Andy Boxall / Tendencias digitales

Ambos son fáciles de activar y usar, así que este es un empate. Creo que Gemini es más sencillo de usar y activar, especialmente porque hay varias formas de activarlo, pero a la inversa, el método de activación puede cambiar entre diferentes teléfonos Android.

Gemini vs Apple Intelligence: en qué se parecen

Usando Gemini AI en Google Pixel 9.
Usando Gemini AI en Google Pixel 9. Andy Boxall / Tendencias digitales

Ambas plataformas se centran en el uso de la IA para tres propósitos específicos: funciones generativas, como crear y editar imágenes o texto, así como funciones de productividad y un asistente de voz. El primero es el enfoque clave para la mayoría de los creadores de IA, pero a menudo he descubierto que las funciones de IA generativa pueden ser una especie de truco. Sí, crearán memes geniales, pero probablemente no cambiarán tu vida.

Ambas plataformas te permiten editar imágenes que ya has capturado para eliminar objetos no deseados. Google ha tenido esto integrado en Magic Editor en Google Photos durante varios años, mientras que iOS 18 trae esta función de forma nativa al iPhone por primera vez en la aplicación Apple Photos rediseñada.

Toma esta imagen que me tomó un amigo la mañana después de una intensa noche de fiesta. Pedí a ambos teléfonos que eliminaran el menú de la mesa y los resultados son bastante interesantes.

Primero, es inmediatamente obvio que Apple Intelligence no es tan bueno como Gemini, como puede ver que la veta de la madera en la mesa está inclinada en la misma dirección que el menú. Aparte de eso, Apple Intelligence hace un gran trabajo al completar los granos y garantizar que haya continuidad en el antes y el después de la misma foto.

¿Qué pasa con Google Géminis? Aquí es donde la historia más larga de Google entra en vigor: es mucho mejor. Primero, genera cuatro imágenes diferentes para que elijas. En segundo lugar, tiene más precisión al permitirle refinar su selección antes de realizar una edición. Sin embargo, al mismo tiempo, se necesitan más toques para acceder al Magic Editor y, a menos que haya usado Google Photos en el pasado, una persona promedio probablemente encontrará Apple Photos más intuitivo.

Diferencias clave entre Gemini y Apple Intelligence

Un iPhone que muestra una representación de Apple Intelligence de Steve Jobs en la aplicación Image Playground.
Un iPhone que muestra una representación de Apple Intelligence de Steve Jobs en la aplicación Image Playground. Jesse Hollington / Tendencias digitales

El enfoque de Google con Gemini se centra principalmente en las funciones generativas, además de convertirlo en un reemplazo del Asistente de Google. Logra lo primero muy bien, aunque aún necesita algo de trabajo como un verdadero reemplazo del Asistente de Google, especialmente si lo necesita para controles domésticos inteligentes.

Gemini viene con una variedad de funciones que disfruto usar, especialmente Circle to Search, que debutó el año pasado en la serie Galaxy S24 y facilita la búsqueda relacionada con algo en su pantalla. ¿Quieres saber dónde comprar los zapatos que acabas de ver en Instagram? Circle to search puede buscarlo en segundos.

Círculo para buscar con la opción Guardar en capturas de pantalla en Google Pixel 9 Pro.
Círculo para buscar con la opción Guardar en capturas de pantalla en Google Pixel 9 Pro. Christine Romero-Chan / Tendencias digitales

Mientras tanto, Apple Intelligence adopta un enfoque diferente. Presenta muchas de las mismas funciones generativas, excepto un verdadero reemplazo de Circle to Search, pero también está diseñado para ser su asistente. Cualquiera que sea la aplicación que estés usando, Apple Intelligence puede editar, reescribir o resumir texto por ti, lo que lo hace particularmente conmovedor cuando usas una variedad de aplicaciones.

También hay otra diferencia clave entre ellos: los modelos que utilizan.

Debajo: Gemini Advanced vs ChatGPT

Un iPhone que solicita al usuario la aprobación de ChatGPT.
Un iPhone que solicita al usuario la aprobación de ChatGPT. Manzana

Si usó Siri antes del lanzamiento de Apple Intelligence, sabrá que no era tan bueno como el Asistente de Google; ni siquiera estuvo cerca. Con eso en mente, casi siempre parecía inevitable que Apple recurriera a otro proveedor para los modelos subyacentes que impulsan Apple Intelligence.

Google ya le paga a Apple para que sea el motor de búsqueda predeterminado en el iPhone, algo así como casi 20 mil millones de dólares por año, por lo que es algo sorprendente que Apple haya recurrido a ChatGPT para proporcionar los modelos subyacentes para Apple Intelligence.

Usando Gemini AI en Google Pixel 9.
Usando Gemini AI en Google Pixel 9. Andy Boxall / Tendencias digitales

Esta integración va mucho más allá y, cuando el nuevo Siri no puede ayudar, Apple ha integrado ChatGPT como copia de seguridad predeterminada. Esto significa que hay algunas funciones duplicadas (puede generar imágenes usando Image Playground o ChatGPT y lo mismo se aplica a algunas de las herramientas de escritura), pero también significa que tiene una amplia gama de información y datos con los que trabajar. Si tiene una cuenta ChatGPT gratuita o de pago, puede acceder a aún más funciones directamente desde Apple Intelligence.

Comparativamente, Google opta por un enfoque autónomo. El modelo subyacente detrás de Gemini es Gemini Advanced, siendo Gemini 1.5 Pro en particular el modelo actual no beta. Si accedes a Gemini a través de la web, también podrás seleccionar el modelo Gemini 2.0 de próxima generación.

Usando Visual Intelligence en un iPhone 16 Pro que muestra la respuesta ChatGPT.
La inteligencia visual en los iPhone se basa en la cámara para darle sentido al mundo que te rodea. Christine Romero-Chan / Tendencias digitales

Una de las diferencias clave entre estos dos modelos es que Gemini 1.5 tiene una ventana de contexto más grande, mientras que ChatGPT tiende a generar mejor texto similar a un humano. Ambas aplicaciones te permiten crear chatbots personalizados, pero ChatGPT también ofrece funciones más avanzadas y los usuarios Plus o Enterprise pueden crear chatbots ilimitados.

Una cosa un tanto irritante de Apple Intelligence es que no utiliza el último modelo GPT-4, que es mucho más avanzado y capaz. No está claro si Apple implementará esto en una fecha posterior o si se integrará en la próxima versión de Apple Intelligence, pero esto es algo que me gustaría que Apple integrara en Apple Intelligence. GPT-4 tiene un conjunto de datos mucho más reciente con el que trabajar, lo que plantea un desafío para la base de conocimientos con la que trabaja Apple Intelligence.

Por ejemplo, le pregunté a Apple Intelligence y Gemini quién ganó las elecciones de EE. UU. y generó una respuesta relacionada con las elecciones de 2020. Después de aclarar que me refería a las elecciones de 2024, me dio resultados de Búsqueda de Google. En este caso, en realidad era mejor que Géminis. que no discutirá las elecciones pero este es un caso extremo y Gemini suele ser más preciso a la hora de recordar información que Apple Intelligence.

Una cosa más: dónde Apple Intelligence lo hace tan bien

Resúmenes de inteligencia de Apple en un iPhone 16 Pro
Resúmenes de notificaciones en Apple Intelligence en la serie iPhone 16 Nirave Gondhia / Tendencias Digitales

Para todo lo que Gemini es excelente, hay una característica que Apple Intelligence hace bien. Al decidir cómo crear una IA útil, Apple se centró en su capacidad para afectar y mejorar su vida personal, y Apple Intelligence es mucho mejor que Gemini en esto.

Ya escribí que los resúmenes de notificaciones son mi uso favorito de la IA en este momento, pero Apple Intelligence va más allá de eso. Poder acceder a las herramientas de escritura (para redactar, refinar o editar texto) en cualquier aplicación es mucho mejor que Gemini, que actúa como una superposición para esa aplicación. De manera similar, pronto podrás recuperar información de cualquier aplicación, lo que debería convertir al nuevo Siri en un asistente personal mucho mejor.

¿Qué prefiero: Gemini o Apple Intelligence?

Primer plano de la cámara del iPhone 16 Pro y Pixel 9 Pro.
iPhone 16 Pro (izquierda) y Pixel 9 Pro Nirave Gondhia / Tendencias Digitales

He estado usando ambas plataformas durante meses y responder esta pregunta es más difícil de lo que esperaba. Por un lado, Google Gemini es una solución de IA generativa mucho mejor y tiene acceso a una base de conocimientos mucho más amplia que Apple Intelligence. Por otro lado, Apple Intelligence es un asistente personal mucho mejor y tiene una mejor integración con los dispositivos Apple.

Luego está el potencial a largo plazo de cada una de estas plataformas. Google Gemini es el proveedor de IA predeterminado que respalda el conjunto de IA en la mayoría de los dispositivos Android, mientras que Apple Intelligence se centra únicamente en los dispositivos Apple, pero se beneficia de las mejoras realizadas por ChatGPT (al menos una vez que ejecuta los últimos modelos).

Considerando todo esto, descubrí que si bien Gemini es mucho más avanzado que Apple Intelligence, es el enfoque de este último en funciones personales lo que garantiza que lo use con más frecuencia. Cuando quiero buscar algo o editar una foto, recurro a Gemini, pero para el uso diario, encuentro que Apple Intelligence (y en particular los resúmenes de notificaciones) es mucho más beneficioso para la vida diaria. Dicho esto, Gemini es sin duda la mejor plataforma de IA, al menos por ahora.






Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

Los dos abiertos – el Atlántico

Published

on

Realmente hay dos abiertos. Uno es el creador de máquinas que doblan el mundo, la nueva empresa que desató el chatgpt y, a su vez, el auge generativo-AI, surgiendo hacia un futuro irreconocible con el resto de la industria tecnológica a cuestas. Este es el OpenAI que promete eventualmente provocar programas “superintelligentes” que excedan las capacidades de la humanidad.

El otro Openai es simplemente un negocio. Esta es la compañía que, según los informes, está trabajando en una red social y considerando una expansión en el hardware; Es la compañía la que ofrece actualizaciones de experiencia de usuario a CHATGPT, como una función de “biblioteca de imágenes” anunciada la semana pasada y la nueva capacidad de “referencia” a los chats anteriores para proporcionar respuestas personalizadas. Se podría pensar en esta OpenAI como otra compañía de tecnología que sigue los pasos de Meta, Apple y Google, no solo para inspirar a los usuarios con nuevos descubrimientos, sino de mantenerlos bloqueados en una línea de productos infinitamente iteradores.

Las compañías tecnológicas más poderosas tienen éxito no simplemente por las virtudes de su software y dispositivos individuales, sino mediante la creación de ecosistemas de servicios conectados. Tener un iPhone y un MacBook hace que sea muy conveniente usar el almacenamiento de iCloud e iMessage y Apple Pay, y muy molesto si un miembro de la familia tiene un teléfono inteligente Samsung o si alguna vez decide cambiar a una PC con Windows. Google Search, Drive, Chrome y Android Devices forman un jardín amurallado similar, tanto que los abogados federales han pedido a un tribunal que obligue a la compañía a vender Chrome como remedio a una violación antimonopolio. Pero en comparación con las computadoras o incluso los navegadores web, los chatbots son muy fáciles de cambiar, solo abre una nueva pestaña y escriba una URL diferente. Eso hace que el desafío sea algo mayor para las nuevas empresas de IA. Google y Apple ya tienen ecosistemas de productos para deslizar la IA; Operai no lo hace.

El CEO de Openai, Sam Altman, afirmó recientemente que los productos de su compañía tienen unos 800 millones de usuarios semanales, aproximadamente una décima parte de la población mundial. Pero incluso si OpenAi solo tuviera la mitad de ese número de usuarios, sería muchas personas que se arriesgarían a perder ante Anthrope, Google y el torrente interminable de las nuevas empresas de IA. Como han demostrado otras compañías tecnológicas, la recopilación de datos de los usuarios (imágenes, conversaciones, compras, amistades) y construir productos en torno a esa información es una buena manera de mantenerlos bloqueados. Incluso si un chatbot competidor es “más inteligente”, la capacidad de aprovechar las conversaciones anteriores podría hacer que la separación sea mucho más difícil. Esto también ayuda a explicar por qué Operai está dando a los estudiantes universitarios dos meses de acceso gratuito a un nivel premium de ChatGPT, sembrando el terreno para la lealtad a largo plazo. (Esto sigue un patrón familiar para las empresas tecnológicas: Hulu solía ser gratuito, Gmail solía aumentar regularmente su almacenamiento gratuito, y hace Eons, YouTube no tenía anuncios). En particular, OpenAi recientemente ha contratado ejecutivos de Meta, Twitter, Uber y Nextdoor para avanzar en sus operaciones comerciales.

Las dos identidades de Openai, el laboratorio de IA de ruptura del suelo y la empresa tecnológica arquetípica, no necesariamente conflictos. La compañía ha dicho que la comercialización beneficia al desarrollo de IA, y que ofrecer modelos de IA como productos de consumo es una forma importante de acostumbrar a las personas a la tecnología, probar sus limitaciones en el mundo real y fomentar la deliberación sobre cómo debería y no debe usarse. Presentar IA en una forma intuitiva y conversacional, en lugar de promover un salto importante en la “inteligencia” o capacidades de un algoritmo, es precisamente lo que hizo que Chatgpt fuera un éxito. Si la idea es hacer una IA que “beneficie a toda la humanidad”, como Operai profesa en su carta, entonces compartir estos supuestos beneficios ahora tiene sentido y crea un incentivo económico para capacitar a modelos de IA mejores y más confiables. El aumento de los ingresos, a su vez, puede sostener el desarrollo de esos modelos futuros y mejorados.

Por otra parte, Operai ha pasado gradualmente de una organización sin fines de lucro a una estructura corporativa más y más orientada a las ganancias: usar la tecnología Generation-AI para descubrir mágicamente nuevos medicamentos es una buena idea, pero eventualmente la compañía necesitará comenzar a ganar dinero con los usuarios cotidianos para mantener las luces encendidas. (Openai perdió más de $ 1 mil millones el año pasado). Un portavoz de OpenAi, que tiene una asociación corporativa con El atlánticoescribió por correo electrónico que “la competencia es buena para los usuarios y la innovación de los Estados Unidos. Cualquiera puede usar ChatGPT de cualquier navegador” y que “los desarrolladores siguen siendo libres de cambiar a modelos competidores cuando lo deseen”.

Anthrope y Meta han adoptado enfoques alternativos para llevar sus modelos a los usuarios de Internet. El primero ofreció recientemente la capacidad de integrar su chatbot Claude en Gmail, Google Docs y Google Calendar, dando un punto de apoyo en un ecosistema tecnológico existente en lugar de construir de nuevo. (Operai parecía estar probando esta estrategia el año pasado al asociarse con Apple para incorporar ChatGPT directamente a la inteligencia de Apple, pero esto requiere un poco de configuración en la parte del usuario, y los esfuerzos de IA de Apple han sido percibidos ampliamente como decepcionantes. Altman ha dicho que Operai publicará un modelo igualmente abierto a finales de este año; Aparentemente, la puesta en marcha quiere pared de su jardín y hacer de sus modelos de IA la base para todos los demás también.

A partir de esta ventaja, la IA generativa parece menos revolucionaria y más como todos los sitios web anteriores, plataformas y dispositivos que luchan para llamar su atención y nunca dejarla ir. Las montañas de datos recopiladas a través de las interacciones de chatbot pueden alimentar servicios y anuncios más personalizados y dirigidos con precisión. La dependencia de los teléfonos inteligentes y los relojes inteligentes podría generar dependencia de la IA y viceversa. Y hay otro ADN compartido. Las plataformas de redes sociales se basaron en trabajos de modificación de contenido mal compensado para detectar publicaciones dañinas y abusivas, exponiendo a los trabajadores a medios horribles para que los productos sean sabrosos para la audiencia más amplia posible. Operai y otras compañías de IA se han basado en el mismo tipo de trabajo para desarrollar sus conjuntos de datos de capacitación. Debería OpenAI realmente lanzar un sitio web de redes sociales o un dispositivo de hardware, este linaje se volverá explícito. Que hay dos abiertos ahora está claro. Pero sigue siendo incierto cuál es el alter ego.

Continue Reading

Noticias

Exclusivo: AI Bests Virus Experts, Raising Biohazard Fears

Published

on

A Un nuevo estudio afirma que modelos de IA como ChatGPT y Claude ahora superan a los virólogos a nivel de doctorado en la resolución de problemas en laboratorios húmedos, donde los científicos analizan productos químicos y material biológico. Este descubrimiento es una espada de doble filo, dicen los expertos. Los modelos de IA ultra inteligentes podrían ayudar a los investigadores a prevenir la propagación de enfermedades infecciosas. Pero los no expertos también podrían armarse los modelos para crear biowapons mortales.

El estudio, compartido exclusivamente con el tiempo, fue realizado por investigadores del Centro para la Seguridad de AI, el Laboratorio de Medios del MIT, la Universidad Brasileña UFABC y la Pandemic Prevention sin fines de lucro SecureBio. Los autores consultaron a los virólogos para crear una prueba práctica extremadamente difícil que midiera la capacidad de solucionar problemas y protocolos de laboratorio complejos. Mientras que los virólogos a nivel de doctorado obtuvieron un promedio de 22.1% en sus áreas declaradas de especialización, el O3 de OpenAI alcanzó la precisión del 43.8%. Gemini 2.5 Pro de Google obtuvo un puntaje 37.6%.

Seth Donoughe, científica investigadora de SecureBio y coautora del documento, dice que los resultados lo ponen un “poco nervioso”, porque por primera vez en la historia, prácticamente cualquier persona tiene acceso a un experto en virología de IA sin juicio que podría guiarlos a través de procesos de laboratorio complejos para crear biológicas.

“A lo largo de la historia, hay un buen número de casos en los que alguien intentó hacer una biela, y una de las principales razones por las que no tuvieron éxito es porque no tuvieron acceso al nivel correcto de especialización”, dice. “Por lo tanto, parece que vale la pena ser cauteloso acerca de cómo se distribuyen estas capacidades”.

Hace meses, los autores del documento enviaron los resultados a los principales laboratorios de IA. En respuesta, Xai publicó un marco de gestión de riesgos prometiendo su intención de implementar salvaguardas de virología para futuras versiones de su modelo de AI Grok. Operai le dijo a Time que “desplegó nuevas mitigaciones a nivel de sistema para riesgos biológicos” para sus nuevos modelos publicados la semana pasada. Anthrope incluyó resultados de rendimiento del modelo en el documento en las tarjetas del sistema recientes, pero no proponió medidas de mitigación específicas. Géminis de Google declinó hacer comentarios.

Ai en biomedicina

La virología y la biomedicina han estado a la vanguardia de las motivaciones de los líderes de IA para construir modelos de IA siempre potentes. “A medida que avanza esta tecnología, veremos que las enfermedades se curan a un ritmo sin precedentes”, dijo el CEO de OpenAI, Sam Altman, en la Casa Blanca en enero mientras anunciaba el proyecto Stargate. Ha habido algunas señales de aliento en esta área. A principios de este año, los investigadores del Instituto de Patógenos Emergentes de la Universidad de Florida publicaron un algoritmo capaz de predecir qué variante de coronavirus podría extender lo más rápido.

Pero hasta este punto, no había habido un estudio importante dedicado a analizar la capacidad de los modelos de IA para realizar un trabajo de laboratorio de virología. “Hemos sabido desde hace algún tiempo que los AIS son bastante fuertes para proporcionar información de estilo académico”, dice Donoughe. “No ha estado claro si los modelos también pueden ofrecer asistencia práctica detallada. Esto incluye interpretar imágenes, información que podría no ser escrita en ningún documento académico o material que se transfiera socialmente de colegas más experimentados”.

Entonces, Donoughe y sus colegas crearon una prueba específicamente para estas preguntas difíciles y no capaces de Google. “Las preguntas toman la forma:” He estado cultivando este virus en particular en este tipo de célula, en estas condiciones específicas, durante este tiempo. Tengo esta cantidad de información sobre lo que ha salido mal. ¿Puede decirme cuál es el problema más probable? “, Dice Donoughe.

Y prácticamente todos los modelos de IA superaron a los virólogos a nivel de doctorado en la prueba, incluso dentro de sus propias áreas de especialización. Los investigadores también encontraron que los modelos mostraron una mejora significativa con el tiempo. El soneto Claude 3.5 de Anthrope, por ejemplo, aumentó de 26.9% a 33.6% de precisión de su modelo de junio de 2024 a su modelo de octubre de 2024. Y una vista previa del GPT 4.5 de OpenAI en febrero superó a GPT-4O por casi 10 puntos porcentuales.

“Anteriormente, encontramos que los modelos tenían mucho conocimiento teórico, pero no de conocimiento práctico”, dice Dan Hendrycks, director del Centro de Seguridad de AI, a Time. “Pero ahora, están obteniendo una cantidad preocupante de conocimiento práctico”.

Riesgos y recompensas

Si los modelos de IA son tan capaces en los entornos de laboratorio húmedo como lo encuentra el estudio, entonces las implicaciones son masivas. En términos de beneficios, AIS podría ayudar a los virólogos experimentados en su trabajo crítico que lucha contra los virus. Tom Inglesby, director del Centro Johns Hopkins para la Seguridad de la Salud, dice que la IA podría ayudar a acelerar los plazos de la medicina y el desarrollo de la vacuna y mejorar los ensayos clínicos y la detección de enfermedades. “Estos modelos podrían ayudar a los científicos en diferentes partes del mundo, que aún no tienen ese tipo de habilidad o capacidad, a hacer un valioso trabajo diario sobre enfermedades que están ocurriendo en sus países”, dice. Por ejemplo, un grupo de investigadores descubrió que la IA los ayudó a comprender mejor los virus de la fiebre hemorrágica en el África subsahariana.

Pero los actores de mala fe ahora pueden usar modelos de IA para guiarlos a través de cómo crear virus, y podrán hacerlo sin ninguna de las capacitación típicas requeridas para acceder a un laboratorio de nivel 4 (BSL-4) de bioseguridad, que se ocupa de los agentes infecciosos más peligrosos y exóticos. “Significará que muchas más personas en el mundo con mucha menos capacitación podrán manejar y manipular virus”, dice Inglesby.

Hendrycks insta a las compañías de IA a colocar las barandillas para evitar este tipo de uso. “Si las empresas no tienen buenas salvaguardas durante seis meses, eso, en mi opinión, sería imprudente”, dice.

Hendrycks dice que una solución no es cerrar estos modelos o ralentizar su progreso, sino hacerlos cerrados, de modo que solo confiaban en que terceros tengan acceso a sus versiones sin filtrar. “Queremos dar a las personas que tienen un uso legítimo para preguntar cómo manipular virus mortales, como un investigador en el departamento de biología del MIT, la capacidad de hacerlo”, dice. “Pero las personas aleatorias que hicieron una cuenta hace un segundo no obtienen esas capacidades”.

Y AI Labs debería poder implementar este tipo de salvaguardas con relativa facilidad, dice Hendrycks. “Ciertamente es tecnológicamente factible para la autorregulación de la industria”, dice. “Hay una cuestión de si algunos arrastrarán sus pies o simplemente no lo harán”.

Xai, el laboratorio de IA de ELON MUSK, publicó un memorando de marco de gestión de riesgos en febrero, que reconoció el documento y señaló que la compañía “potencialmente utilizaría” ciertas salvaguardas en torno a las preguntas de virología, incluida la capacitación de Grok para rechazar solicitudes nocivas y aplicar filtros de entrada y salida.

Openai, en un correo electrónico a Time el lunes, escribió que sus modelos más nuevos, el O3 y el O4-Mini, se desplegaron con una variedad de salvaguardas relacionadas con el riesgo biológico, incluido el bloqueo de resultados dañinos. La compañía escribió que realizó una campaña de equipo rojo de mil horas en la que el 98.7% de las conversaciones biológicas inseguras fueron marcadas y bloqueadas con éxito. “Valoramos la colaboración de la industria en el avance de salvaguardas para modelos fronterizos, incluso en dominios sensibles como Virology”, escribió un portavoz. “Continuamos invirtiendo en estas salvaguardas a medida que crecen las capacidades”.

Inglesby argumenta que la autorregulación de la industria no es suficiente, y pide a los legisladores y a los líderes políticos a estrategia un enfoque político para regular los riesgos biológicos de la IA. “La situación actual es que las empresas que son más virtuosas están tomando tiempo y dinero para hacer este trabajo, lo cual es bueno para todos nosotros, pero otras compañías no tienen que hacerlo”, dice. “Eso no tiene sentido. No es bueno para el público no tener información sobre lo que está sucediendo”.

“Cuando una nueva versión de un LLM está a punto de ser lanzada”, agrega Inglesby, “debe haber un requisito para que ese modelo sea evaluado para asegurarse de que no produzca resultados de nivel pandémico”.

Continue Reading

Noticias

Cómo indicar el nuevo chatgpt, según OpenAi

Published

on

La última versión de ChatGPT es significativamente más poderosa, pero requiere nuevas técnicas de indicación. El modelo ahora sigue las instrucciones más literalmente y hace menos suposiciones sobre lo que está pidiendo. Esto es importante para los empresarios que usan la herramienta.

No seas consejos anticuados. No indique usando palabras deficientes. Eres mejor que eso.

Las indicaciones mal construidas desperdician su tiempo y dinero. Hazlo bien y desbloqueas una IA significativamente más capaz. Los miembros del equipo de Operai, Noah MacCallum y Julian Lee, han publicado una amplia documentación sobre cómo provocar sus nuevos modelos.

Aquí hay un resumen de su orientación, para que pueda aprovechar al máximo la herramienta.

Las reglas de indicación han cambiado

La provisión de técnicas que funcionaron para modelos anteriores en realidad podrían obstaculizar sus resultados con las últimas versiones. ChatGPT-4.1 sigue las instrucciones más literalmente que sus predecesores, que solían inferir la intención liberalmente. Esto es bueno y malo. La buena noticia es que ChatGPT ahora es altamente orientable y responde a las indicaciones bien especificadas. La mala noticia es que sus viejas indicaciones necesitan una revisión.

La mayoría de las personas todavía usan indicaciones básicas que apenas rascan la superficie de lo que es posible. Escriben preguntas o solicitudes simples, luego se preguntan por qué sus resultados se sienten genéricos. Operai ahora ha revelado cómo entrenaron el modelo para responder, ayudándole a obtener exactamente lo que desea de sus modelos más avanzados.

Optimice sus indicaciones con la guía de información privilegiada de Openai

Estructura tus indicaciones estratégicamente

Comience organizando sus indicaciones con secciones claras. OpenAI recomienda una estructura básica con componentes específicos:

• Rol y objetivo: dígale a ChatGPT a quién debe actuar y qué está tratando de lograr

• Instrucciones: proporcionar pautas específicas para la tarea

• Pasos de razonamiento: indique cómo desea que aborde el problema

• Formato de salida: especifique exactamente cómo desea la respuesta estructurada

• Ejemplos: Muestre muestras de lo que espera

• Contexto: proporcionar información de fondo necesaria

• Instrucciones finales: incluya los últimos recordatorios o criterios

No necesita todas estas secciones para cada aviso, pero un enfoque estructurado ofrece mejores resultados que una pared de texto.

Para tareas más complejas, la documentación de OpenAI sugiere usar reducción para separar sus secciones. También aconsejan el uso de caracteres de formato especial alrededor del código (como Backticks, que se ven así: `) para ayudar a ChatGPT a distinguir el código del texto regular y el uso de listas numeradas o balas estándar para organizar información.

Dominar el arte de delimitar información

La separación de la información afecta adecuadamente sus resultados significativamente. Las pruebas de Openai encontraron que Etiquetas XML Realice excepcionalmente bien con los nuevos modelos. Le permiten envolver las secciones con precisión con etiquetas de inicio y extremo, agregar metadatos a las etiquetas y habilitar la anidación.

El formato JSON funciona mal con contextos largos (que proporcionan los nuevos modelos), particularmente al proporcionar múltiples documentos. En su lugar, intente formatos como ID: 1 | Título: El zorro | Contenido: El Fox Brown rápido salta sobre el perro perezoso que Openai encontró que funcionó bien en las pruebas.

Construir agentes de IA autónomos

Chatgpt ahora puede funcionar como un “agente” Eso funciona de manera más independiente en su nombre, abordando tareas complejas con una supervisión mínima. Lleve sus indicaciones al siguiente nivel construyendo estos agentes.

Un agente de IA está esencialmente ChatGPT configurado para trabajar a través de problemas de forma autónoma en lugar de solo responder a sus preguntas. Puede recordar el contexto en una conversación, usar herramientas como navegación web o ejecución de código, y resolver problemas de varios pasos.

OpenAI recomienda incluir tres recordatorios clave en todas las indicaciones del agente: persistencia (continuar hasta la resolución), callarse de herramientas (usando herramientas disponibles en lugar de adivinar) y planificar (pensar antes de actuar).

“Estas tres instrucciones transforman el modelo de un estado de chatbot en un agente mucho más ‘ansioso’, impulsando la interacción de forma autónoma e independiente”, explica el equipo. Sus pruebas mostraron un aumento del rendimiento del 20% en las tareas de ingeniería de software con estas simples adiciones.

Maximizar el poder de los contextos largos

El último chatGPT puede manejar una impresionante ventana de contexto de 1 millón de tokens. Las capacidades son emocionantes. Según OpenAi, el rendimiento sigue siendo fuerte incluso con miles de páginas de contenido. Sin embargo, el rendimiento del contexto largo se degrada cuando se requiere un razonamiento complejo en todo el contexto.

Para obtener los mejores resultados con documentos largos, coloque sus instrucciones tanto al principio como al final del contexto proporcionado. Hasta ahora, esto ha sido más seguro de fallas en lugar de una característica requerida de su aviso.

Cuando use el nuevo modelo con un contexto extenso, sea explícito sobre si debe confiar únicamente en la información proporcionada o combinarlo con su propio conocimiento. Para respuestas estrictamente basadas en documentos, OpenAI sugiere instruir explícitamente: “Solo use los documentos en el contexto externo proporcionado para responder a la consulta del usuario”.

Implementar la solicitud de la cadena de pensamiento

Si bien GPT-4.1 no está diseñado como un modelo de razonamiento, puede solicitar que muestre su trabajo como podría los modelos más antiguos. “Pedirle al modelo que piense paso a paso (llamada ‘cadena de pensamiento’) puede ser una forma efectiva de dividir los problemas en piezas más manejables”, señala el equipo de OpenAI. Esto viene con un mayor uso de tokens pero ofrece una mejor calidad.

Una instrucción simple como “Primero, piense cuidadosamente paso a paso sobre qué información o recursos se necesitan para responder a la consulta” puede mejorar drásticamente los resultados. Esto es especialmente útil cuando se trabaja con archivos cargados o cuando CHATGPT necesita analizar múltiples fuentes de información.

Haga que el nuevo chatgpt funcione para ti

Operai ha compartido información más extensa sobre cómo aprovechar al máximo sus últimos modelos. Las técnicas representan objetivos de capacitación reales para los modelos, no solo conjeturas de la comunidad. Al implementar su orientación sobre una estructura rápida, delimitar información, creación de agentes, manejo de contexto largo y suministro de cadena de pensamiento, verá mejoras dramáticas en sus resultados.

El éxito con ChatGPT proviene de tratarlo como un compañero de pensamientono solo un generador de texto. Siga la guía directamente de la fuente para obtener mejores resultados del mismo modelo que todos los demás están utilizando.

Acceder a todos mis Las mejores indicaciones de contenido de chatgpt.

Continue Reading

Trending