Connect with us

Noticias

El nuevo modo de ‘investigación profunda’ de O3 O3 muestra el poder de la era del agente de IA

Published

on

Únase a nuestros boletines diarios y semanales para obtener las últimas actualizaciones y contenido exclusivo sobre la cobertura de IA líder de la industria. Obtenga más información


En caso de que se lo haya perdido a favor de los Premios Grammy anoche, OpenAi sorprendió al mundo el domingo por la noche con el anuncio de su nueva modalidad de “investigación profunda”, un agente de IA disponible para los usuarios del Plan de suscripción de ChatGPT Pro ($ 200/mes) que está diseñado Para ahorrar horas a los humanos investigando, bueno, “profundamente” y expansivamente en la web para temas dados y compilación de informes de calidad profesional en dominios especializados, desde negocios hasta ciencia, medicina, marketing y más.

Los usuarios de ChatGPT Pro (y pronto, ChatGPT Plus, Team, Enterprise y EDU) en los EE. UU. Podrán acceder a una investigación profunda haciendo clic en la opción debajo de la barra de entrada/composición de aviso en la parte inferior del sitio web y aplicaciones de ChatGPT.

Sam Altman, CEO de Openai, describió la característica de una serie de publicaciones en su cuenta personal en la red social X como “como una superpotencia; ¡Expertos en la demanda! ” Agregó: “Es realmente bueno y puede hacer tareas que tomarían horas/días y costarían cientos de dólares”.

La investigación profunda se basa en la serie de modelos de razonamiento O de Openai, aprovechando específicamente el modelo O3 completo que pronto será lanzado (un modelo más pequeño y menos potente, O3-Mini, se acaba de lanzar el viernes). El modelo O3 completo puede analizar grandes cantidades de información e integrar texto, PDF e imágenes en un análisis cohesivo.

https://www.youtube.com/watch?v=ykcdvn3_wiw

En una transmisión en vivo publicada en YouTube y disponible para repetir a pedido, Mark Chen, jefe de investigación de fronteras de OpenAi, explicó que “la investigación profunda es un modelo que realiza una investigación en múltiples pasos en Internet. Descubre contenido, sintetiza contenido y razones sobre este contenido, adaptando su plan a medida que descubre más y más información “.

Chen destacó aún más la importancia de la innovación para la visión de OpenAi: “Esto es núcleo para nuestra hoja de ruta AGI. Nuestra última aspiración es un modelo que puede descubrir y descubrir nuevos conocimientos para sí mismo “.

El lanzamiento de la investigación profunda marca el segundo en los agentes oficiales de OpenAI después del lanzamiento de su navegador y operador de control de cursor a principios de este mes. Y Joshua Achiam, jefe de alineación de misiones en el Comando Stargate en OpenAi, escribió en X, ambos modelos pueden ayudar a definir mejor el concepto de un “agente de IA”, un término popular pero nebuloso en estos días entre las empresas, mucho más allá de la empresa o estos usos especiales casos.

“Siento que el término ‘agente’ deambuló por el desierto por un tiempo”, escribió Achaim. “No tenía fundamento o ejemplos para señalar. Pero agentes como el operador o la investigación profunda dan alguna forma a este concepto. Un agente es una IA de propósito general que hace uno o más flujos de trabajo de uso de herramientas para usted ”.

La investigación profunda de Openai logra un puntaje nuevo y más alto en el último punto de referencia de ‘Humanity’s Last Exam’ AI

La investigación profunda ha establecido nuevos puntos de referencia para la precisión y el razonamiento.

Isa Fulford, miembro del equipo de investigación de OpenAi, compartió en la transmisión en vivo de YouTube que el modelo logra “un nuevo máximo de 26.6% de precisión” en el “último examen de la humanidad”, un punto de referencia de IA relativamente nuevo diseñado para ser el más difícil para cualquier modelo de IA ( o humano, para el caso) de completar, cubriendo 3.000 preguntas en 100 temas diferentes, como traducir inscripciones antiguas en hallazgos arqueológicos.

Además, su capacidad para navegar por la web, razonar dinámicamente, y citar fuentes lo distingue con precisión de las herramientas de IA anteriores.

“El modelo fue entrenado utilizando el aprendizaje de refuerzo de extremo a extremo en tareas de navegación y razonamiento”, dijo Fulford. “Aprendió a planificar y ejecutar trayectorias de varios pasos, reaccionando a la información en tiempo real y retrocediendo cuando sea necesario”.

Una característica destacada de la investigación profunda es su capacidad para manejar tareas que de otro modo tomarían horas de los humanos o incluso días.

Durante el anuncio, Chen explicó que “la investigación profunda genera resultados que se asemejan a un trabajo de investigación integral y totalmente citado, algo que un analista o experto en el campo podría producir”.

Aplicaciones y casos de uso

Los casos de uso para investigaciones profundas son tan diversos como impactantes.

La cuenta oficial de Operai en X declaró que estaba “construida para personas que trabajan en conocimiento intensivo en áreas como finanzas, ciencia, política e ingeniería y necesitan investigación exhaustiva y confiable”.

También parece valioso para los consumidores que buscan recomendaciones personalizadas o realizando una investigación detallada de productos, de acuerdo con los ejemplos compartidos por OpenAI en su publicación de blog oficial de anuncio de investigación profunda, que incluye una evaluación de investigación detallada de la mejor tabla de snowboard para que alguien compre.

Altman resumió la versatilidad de la herramienta, escribiendo: “Pruebe su tarea de trabajo más dura que se pueda resolver con solo usar Internet y vea lo que sucede”.

Una historia de éxito médico personal de investigaciones profundas

Felipe Millon, líder del mercado del gobierno de OpenAi, compartió una descripción profundamente personal de cómo la investigación profunda impactó a su familia. Escribiendo en una serie de publicaciones en X, describió la batalla de su esposa con el cáncer de mama bilateral y cómo la herramienta de IA se convirtió en un aliado inesperado.

“A finales de octubre, mi esposa fue diagnosticada con cáncer de mama bilateral. Durante la noche, nuestro mundo se puso patas arriba ”, escribió Millon.

Después de una mastectomía doble y quimioterapia, la pareja enfrentó una decisión crítica: si seguir o no la radioterapia. La situación estaba llena de incertidumbre, ya que incluso sus especialistas proporcionaron recomendaciones mixtas. “Para su caso específico, está completamente en un área gris”, explicó Millon. “Nos sentimos atascados”.

Al tener una vista previa de acceso a una investigación profunda, Millon decidió subir el informe de patología quirúrgica de su esposa y preguntar si la radiación sería beneficiosa. “Lo que sucedió después fue alucinante”, escribió. “No solo confirmó lo que mencionaron nuestros oncólogos, fue más profundo. Citó estudios de los que nunca había oído hablar y adaptado cuando agregamos detalles como su edad y factores genéticos “.

El aviso específico que usó fue:

“Lea el informe de patología quirúrgica (adjunta) que contiene información sobre el cáncer de mama bilateral. Luego, investigue si la radiación estaría indicada para este paciente después de 6 rondas de quimioterapia TCHP, según el tipo de cáncer de mama. Quiero comprender los pros y los contras de la radiación para este paciente, cuán probable sería reducir las posibilidades de recurrencia y si los beneficios superan los riesgos potenciales a largo plazo “.

Millon y su esposa verificaron cada estudio citado por el modelo, encontrando que son precisos y muy relevantes. “Pronto vemos a otro especialista, pero ya nos sentimos más seguros de nuestra decisión”, escribió. “Nos dio tranquilidad cuando más lo necesitábamos”.

Disponibilidad y ¿qué sigue?

Actualmente, la investigación profunda está disponible para los usuarios profesionales de ChatGPT, con planes de expandirse a los niveles Plus y Team, seguido de los mercados empresariales y educativos.

Como Chen advirtió: “Todavía es posible que se alucine, por lo que cuando está haciendo informes, asegúrese de verificar las fuentes usted mismo”.

La capacidad del modelo para pensar de forma autónoma durante períodos prolongados también lo hace que sea intensivo en recursos, y OpenAI actualmente está trabajando para optimizar su rendimiento para una accesibilidad más amplia.

Operai también ha insinuado futuras integraciones con conjuntos de datos personalizados, lo que permitiría a las organizaciones aprovechar la herramienta para la investigación patentada.

Para Millon, el impacto de la investigación profunda ya está claro. “A menudo hablamos internamente en Operai sobre los momentos en que ‘sientes el agi’, y este fue uno de ellos”, escribió. “Esto va a cambiar el mundo”.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

Le pregunté a Deepseek vs chatgpt una serie de preguntas éticas, y los resultados fueron impactantes

Published

on

Aquí hay un experimento de pensamiento rápido para usted: digamos que podría agregar un químico a la comida de todos para salvar innumerables vidas, pero la estipulación es que no podría decirle a nadie. ¿Todavía les dirías?

No se entiende como un acertijo; Incluso podría decir que solo hay una respuesta correcta. La mayoría de nosotros probablemente argumentaría que introducir un químico en los alimentos sin decirle a nadie siempre es malo, sin importar cuáles sean los beneficios. Después de todo, no hay garantía de que funcione.

Continue Reading

Noticias

Italia, otros 2 prohíben Deepseek; Operai responde con O3-Mini

Published

on

Desde el lanzamiento de su chatbot de inteligencia artificial (IA) en enero, Deepseek ha dominado el sector tecnológico, con las empresas occidentales luchando por comprender cómo una startup china desconocida se había convertido en un fenómeno global de la noche a la mañana. El líder de la industria Openai respondió rápidamente al lanzar O3-Mini, su modelo de razonamiento más rentable.

Deepseek también está demostrando ser un dolor de cabeza para los reguladores. Si bien la administración Trump sopora una restricción para proteger a las empresas estadounidenses, el gobierno italiano se está moviendo rápidamente, prohibiendo a la compañía china por el supuesto uso opaco de los datos de los italianos. Taiwán ha implementado una prohibición parcial, y casi otras docenas de otras naciones en Europa y Asia están modificando medidas similares.

La respuesta de OpenAi a Deepseek: O3-Mini

Openai anunció el lanzamiento de O3-Mini el viernes, describiéndolo como “el modelo más nuevo y rentable de nuestra serie de razonamiento”.

Previo por primera vez en diciembre pasado, el O3-Mini es el último miembro de los modelos de razonamiento ‘O’ del gigante de IA: el primero fue O1, que lanzó a principios de 2024, pero la compañía se saltó O2 debido a posibles infracciones de marca registrada. A diferencia de GPT-4O, que se centra en tareas de masa y es más creativa, la familia de modelos ‘O’ está más orientada a tareas complejas y estructuradas.

Operai dice que el nuevo modelo está optimizado para la ciencia, las matemáticas y la codificación, todo mientras reduce la latencia que enfrentaban los modelos anteriores.

Más importante aún, ofrece estas ventajas mientras mantiene bajos costos. Esta es una respuesta directa a Deepseek, cuyo reclamo de fama fue su rentabilidad. Si bien Según los informes, Operai gastó cientos de millones de dólares para capacitar a sus modelos, Deepseek afirmó haber gastado menos de $ 6 millones para lograr los mismos resultados.

OpenAI tiene un precio de O3-Mini a $ 0.55 y $ 4.40 por 750,000 palabras de entrada y salida, respectivamente, que es alrededor de un tercio del costo del modelo anterior. Sin embargo, sigue siendo más alto que Deepseek, que cobra $ 0.14 y $ 2.19 por palabras similares de entrada y salida, respectivamente.

“El lanzamiento de O3-Mini marca otro paso en la misión de OpenAi de superar los límites de la inteligencia rentable […] A medida que la adopción de AI se expande, seguimos comprometidos con liderar la frontera, construyendo modelos que equilibran la inteligencia, la eficiencia y la seguridad a escala ”, declaró la compañía.

O3-Mini está disponible para todos los usuarios de ChatGPT, marcando la primera vez que los usuarios gratuitos pueden probar los modelos de razonamiento de la compañía, en otra respuesta directa al atractivo del mercado masivo de Deepseek. Estará integrado en el chatgpt chatbot bajo la función “razón”. Sin embargo, los usuarios de pago desbloquearán características adicionales, que según OpenAI incluye respuestas más inteligentes y límites de mensajes más altos. Para obtener acceso ilimitado al nuevo modelo, los usuarios deberán pagar $ 200 mensualmente por ChatGPT Pro.

Reguladores de Spooks de Deepseek: adquirentes en Italia, Taiwán, Texas

Desde que lanzó su chatbot, que se volvió muy popular a nivel mundial, Deepseek ha inestable los reguladores occidentales, lo que los lleva a responder con restricciones y prohibiciones.

El viernes, la Autoridad de Protección de Datos de Italia, Garante, prohibió el chatbot de la firma china, señalando una falta de transparencia sobre cómo usaría los datos recopilados de los usuarios italianos. Garante afirmó haber enviado a Deepseek una serie de preguntas que buscan más información sobre cómo recopila, almacena y usa los datos, y no estaba satisfecho con las respuestas.

No es la primera vez que Garante ha tomado medidas enérgicas contra un modelo de IA. En abril de 2023, el regulador de Watchdog prohibió el CHATGPT sobre las preocupaciones de privacidad de los datos y lanzó una investigación sobre si OpenAI había violado el Reglamento Europeo de Protección de Datos Generales (GDPR). Sin embargo, menos de un mes después, levantó la prohibición y declaró que OpenAi había abordado las preocupaciones.

Mientras que Italia es una de las primeras en prohibir completamente a Deepseek, otros, como Taiwán, están restringiendo su uso en áreas más específicas. El lunes, el primer ministro taiwanés, Cho Jung-Tai, prohibió el uso del modelo de IA en el sector público para “garantizar que la seguridad de la información del país” esté adecuadamente protegida.

Además, Taiwán está preocupado por los datos de sus ciudadanos que terminan en manos chinas debido a las tensiones crecientes entre los dos sobre la presión de China para la unificación. El primer ministro Jung-Tai también expresó su preocupación de que el gobierno chino pudiera usar el modelo de IA para hacer cumplir la censura, con Beijing que se cree que tiene acceso sin restricciones a todos los modelos de IA chinos.

Y luego está los Estados Unidos, sobre el cual el mundo occidental espera dirección sobre cómo responder al dominio nocturno de Deepseek. Muchos líderes estadounidenses en los sectores políticos, tecnológicos y financieros han pedido a la administración Trump que se mueva rápidamente y prohíba el modelo chino. Openai, que puede perder más, incluso ha acusado a Deep Speeek de incorrectamente utilizando sus modelos para capacitar a su IA, un reclamo de Trump’s Ai Zar David Sacks respaldó.

Como Trump considera su próximo movimiento, Texas no está sentado de manera inestable y ha prohibido el uso de Deepseek en cualquier dispositivo gubernamental.

“Texas no permitirá que el Partido Comunista chino se infiltrará en la infraestructura crítica de nuestro estado a través de aplicaciones de IA y redes sociales de recolección de datos”, declaró el gobernador Greg Abbott.

Para que la inteligencia artificial (IA) trabaje dentro de la ley y prospere frente a los crecientes desafíos, necesita integrar un sistema de cadena de bloques empresarial que garantice la calidad y la propiedad de la entrada de datos, lo que permite mantener los datos seguros al tiempo que garantiza la inmutabilidad de datos. Echa un vistazo a la cobertura de Coingeek sobre esta tecnología emergente para aprender más Por qué Enterprise Blockchain será la columna vertebral de AI.

Reloj: Demostrando el potencial de la fusión de Blockchain con AI

https://www.youtube.com/watch?v=p9m7a46s8bw title = “YouTube Video Player” FrameBorDer = “0” permitido = “acelerómetro; autoplay; portapapeles-write; cifrado-media; giroscopio; imagen en foto; Origen “PREFINILLECREEN>

Continue Reading

Noticias

El chatgpt de un gran bufete de abogados falla

Published

on

(a través de Getty Images)

Bienvenido Jurisdicción originalla última publicación legal de mí, David Lat. Puede obtener más información sobre la jurisdicción original leyendo su Acerca de la páginay puedes enviarme un correo electrónico a [email protected]. Esta es una publicación respaldada por el lector; Puede suscribirse haciendo clic en aquí.

Todos estamos familiarizados con la infame historia de los abogados que Archivó un breve Lleno de casos inexistentes: curso de ChatGPT, la herramienta AI que compensó alias “alucinadas” las citas falsas. Al final, el juez Kevin Castel (SDNY) sancionado a los abogadospor una suma de $ 5,000, pero la notoriedad nacional seguramente fue mucho peor.

Los abogados ofensivos, Steven Schwartz y Peter Loduca, trabajaron en un pequeño bufete de abogados de Nueva York llamado Levidow, Levidow y Oberman. Y parece que su atornillado surgió en parte de las limitaciones de recursos, con las que las pequeñas empresas frecuentemente luchan. Como le explicaron al juzgar a Castel en el Audiencia de sancionesen el momento en que su empresa no tenía acceso a Westlaw o Lexisnexis, que son, como todos sabemos, extremadamente caros, y el tipo de suscripción que tenían para Fastcase no les proporcionó acceso completo a casos federales.

Pero, ¿qué pasa con los abogados que trabajan para una de las firmas de abogados más grandes del país? No deberían tener ninguna excusa, ¿verdad?

Ya sea que tengan una excusa o no, parece que ellos también pueden cometer el mismo error. Ayer, la jueza Kelly Rankin del distrito de Wyoming emitió un para mostrar causa en Wadsworth v. Walmart Inc. (énfasis en el original):

Este asunto está ante el tribunal por su propia notificación. El 22 de enero de 2025, los demandantes presentaron su Movimientos en limine. [ECF No. 141]. Allí, los demandantes citaron nueve casos totales:

1. Wyoming v. Departamento de Energía de EE. UU.2006 WL 3801910 (D. Wyo. 2006);

2. Holanda v. Keller2018 WL 2446162 (D. Wyo. 2018);

3. Estados Unidos v. Hargrove2019 WL 2516279 (D. Wyo. 2019);

4. Meyer v. Ciudad de Cheyenne2017 WL 3461055 (D. Wyo. 2017);

5. US v. Caraway534 F.3d 1290 (10th Cir. 2008);

6. Benson v. Estado de Wyoming2010 WL 4683851 (D. Wyo. 2010);

7. Smith v. Estados Unidos2011 WL 2160468 (D. Wyo. 2011);

8. Woods v. Bnsf Railway Co.2016 WL 165971 (D. Wyo. 2016); y

9. Fitzgerald v. Ciudad de Nueva York2018 WL 3037217 (SDNY 2018).

Ver [ECF No. 141].

El problema con estos casos es que Ninguno existeexcepto Estados Unidos v. Caraway534 F.3d 1290 (10th Cir. 2008). Los casos no son identificables por su cita Westlaw, y el tribunal no puede localizar el distrito de los casos de Wyoming por su nombre de caso en su sistema local de presentación de la corte electrónica. Los acusados ​​promueven a través de un abogado de que “al menos algunos de estos casos mal citados se pueden encontrar en ChatGPT”. [ECF No. 150] (Proporcionar una imagen de la ubicación de chatgpt “Meyer v. Ciudad de Cheyenne“A través del identificador falso de Westlaw).

Como es de esperar, el juez Rankin está … no está contento:

Cuando se enfrentan a situaciones similares, los tribunales ordenaron que los abogados de presentación muestren por qué las sanciones o la disciplina no deberían emitir. Mata v. AviancaInc., No. 22-CV-1461 (PKC), 2023 WL 3696209 (SDNY 4 de mayo de 2023); Estados Unidos v. HayesNo. 2: 24-CR-0280-DJC, 2024 WL 5125812 (Ed Cal. 16 de diciembre de 2024); Estados Unidos v. CohenNo. 18-CR-602 (JMF), 2023 WL 8635521 (SDNY 12 de diciembre de 2023). En consecuencia, el tribunal ordena de la siguiente manera:

Se ordena que al menos uno de los tres abogados proporcione una copia verdadera y precisa de todos los casos utilizados en apoyo de [ECF No. 141]excepto por Estados Unidos v. Caraway534 F.3d 1290 (10th Cir. 2008), a más tardar a las 12:00 p.m., Tiempo estándar de montaña, ON 10 de febrero de 2025.

Y si no pueden proporcionar los casos en cuestión, los abogados “mostrarán por separado la causa por escrito por qué no debe ser sancionado de conformidad con: (1) alimentado. R. Civ. P. 11 (b), (c); (2) 28 USC § 1927; y (3) el poder inherente del tribunal para ordenar sanciones por citar casos inexistentes al tribunal “. Y esta presentación por escrito, que se debe el 13 de febrero, “tomará la forma de una declaración jurada” que contiene “una explicación exhaustiva de cómo se generaron la moción y los casos falsos”, así como una explicación de cada abogado de “su papel en redactar o supervisar la moción “.

¿Quiénes son los abogados detrás de este aparente ANSNAFU? Se llaman por nombre en la página tres del pedido:

Los tres abogados subsignados a [ECF No. 141] son:

Como puede ver en las firmas en el ofensiva movimiento en liminaTaly Goody trabaja en Grupo de leyes de Goodyuna empresa con sede en California que parece tener tres abogados. Pero Rudwin Ayala y Michael Morgan trabajan en el gigante Morgan y Morganque se describe en su sitio web como “el bufete de abogados de lesiones más grande de Estados Unidos”. De acuerdo a El abogado estadounidenseMorgan y Morgan cuenta con más de 1,000 abogados, lo que la convierte en la empresa #42 en el país basada en el personal.

Moraleja de la historia: los abogados de las grandes empresas pueden mal uso del chatgpt tan bien como cualquier persona. And although Morgan and Morgan is a plaintiff’s firm—which might cause snobby attorneys at big defense firms to say, with a touch of hauteur, “Of course it is”—I think it’s only a matter of time before a defense-side, Am La firma de la Ley 100 hace un paso en falso similar en una presentación pública.

Estas historias de “abogados se dedican a Chatgpt Fail” tienden a ser populares entre los lectores, lo cual es una de las razones por las que he escrito este, pero no quiero exagerar su importancia. Como le dije a Bridget McCormack y Zach Abramowitz en el Podcast AAAI“ChatGPT no participa en estos atornillados; Los humanos que usan incorrectamente Chatgpt se involucran en estos atornillados “. Pero las historias todavía se vuelven virales a veces porque tienen un cierto valor de novedad: la IA es, al menos en el mundo de la práctica legal, todavía (relativamente) nueva.

Sin embargo, el peligro es que las historias de “Fail ChatGPT” podrían tener un efecto escalofriante, en términos de disuadir a los abogados de (responsablemente) explorar cómo la IA y otras tecnologías transformadoras pueden ayudarlos a servir a sus clientes de manera más eficiente y efectiva. Como dijo McCormack en el podcast AAAI después de mencionar la debacle de SDNY: “Todavía estoy enojado con ese abogado del distrito sur de Nueva York porque siento que ha retrasado toda la profesión en dos años. Estoy literalmente tan enojado con ese tipo “.

Me puse en contacto con Ayala, Goody y Morgan por correo electrónico, pero aún no he tenido noticias; Si y cuando lo haga, actualizaré esta publicación. De lo contrario, sintonice la próxima semana, cuando presentarán sus respuestas a la orden de mostrar causa.

Y mientras tanto, si confía en ChatGPT u otra herramienta de IA para la investigación legal, por favor, por favor Use una plataforma de investigación legal real para confirmar que (1) existen los casos y (2) los ha citado con precisión. Eso no es demasiado para preguntar, ¿verdad?

Gracias por leer Jurisdicción originaly gracias a mis suscriptores pagados por hacer posible esta publicación. Los suscriptores obtienen (1) acceso a Aviso judicialmi resumen semanal que ahorra tiempo de las noticias más notables en el mundo legal; (2) historias adicionales reservadas para suscriptores pagados; (3) transcripciones de entrevistas de podcast; y (4) la capacidad de comentar publicaciones. Puede enviarme un correo electrónico a [email protected] con preguntas o comentarios, y puede compartir esta publicación o suscribirse con los botones a continuación.

Compartir

Continue Reading