Connect with us

Noticias

Géminis se está complicando

Published

on

La semana pasada, Google presentó Gemini 2.0. La nueva familia de modelos de IA que impulsan el chatbot del mismo nombre de Google viene con nuevas capacidades, como la capacidad de acceder directamente a información de servicios como la Búsqueda de Google y crear de forma nativa imágenes y audio para incluirlos en sus respuestas. Google dice que sus modelos recientes de IA están diseñados para la “nueva era agente” en la que estamos entrando, en la que la IA puede acceder a Internet y utilizar herramientas para hacer cosas para los usuarios.




A partir de esta semana, los suscriptores de Gemini Advanced tienen acceso para probar algunos modelos nuevos: Gemini 2.0 Flash Experimental, Gemini 2.0 Experimental Advanced y Gemini 1.5 Pro con Deep Research. Estas se unen a las opciones existentes del estándar 1.5 Pro (para “tareas complejas”) y 1.5 Flash (para “ayuda diaria”). Comprueba que los suscriptores de pago tendrían la oportunidad de probar nuevas funciones con antelación. Pero para un producto que se supone que elimina parte del trabajo de procesos complejos como la investigación en profundidad y, eventualmente, tareas de mayor importancia como reservar viajes, Gemini se está volviendo cada vez más difícil de entender y usar.

Bienvenido al compilador,
su resumen semanal de lo que sucede en Google. Paso mis días como editor de Google leyendo y escribiendo sobre lo que Google hace en Android, Pixel y más, y lo resumo aquí en esta columna. Estas son las noticias de Google que debes entender esta semana.



Un modelo para cada tarea

Los suscriptores de Gemini Advanced ahora tienen un total de cinco modelos Gemini para elegir. Las cargas de trabajo más complejas requieren más recursos, por lo que tiene sentido emplear diferentes modelos para diferentes tareas. Si un modelo Flash más simple puede responder una consulta determinada tan bien como un modelo Pro más complejo, ejecutarlo a través de Flash en lugar de Pro ahorrará un poco de potencia informática, una preocupación creciente en el espacio de la IA.

Pero un menú desplegable que permite a los usuarios elegir manualmente entre cinco modelos diferentes para cada consulta parece una forma terriblemente obtusa de administrar las diversas capacidades de Gemini. Aprender los entresijos de modelos con nombres como 1.5 destello y 1.5 Pro con investigación profunda Parece una gran pregunta.


Gemini 1.5 Pro con Deep Research, por ejemplo, es el único de los cinco que puede llevar a cabo la función Deep Research de Gemini que recopila información de docenas o incluso cientos de fuentes para crear informes detallados. Gemini 2.0 Advanced, el modelo más nuevo y generalmente mejor, todavía no puede hacer eso. Si lo pides, servirá. algo, pero no le permitirá saber que su consulta sería más adecuada para 1.5 con Deep Research.

¿No se supone que la IA simplifica nuestras vidas?


El atractivo de las interfaces de IA en lenguaje natural, en teoría, es que no es necesario saber cómo funcionan para utilizarlas. A diferencia de una aplicación más tradicional, donde necesitas aprender los matices de la interfaz de usuario y dónde encontrar varias funciones para realizar tareas complicadas, con algo como Gemini o ChatGPT, no deberías necesitar conocimientos especializados, solo un conocimiento razonablemente bien formado. consulta. Colocación en capas de un menú de modelos abstractos para elegir para cada entrada (¿Esta consulta es una ayuda diaria o una tarea compleja?) parece reñir con una de las características más valiosas de este tipo de aplicaciones: la accesibilidad.

La opción de elegir manualmente qué modelo se ejecuta en su consulta es una ventaja sensata para los suscriptores avanzados, pero no debería ser un requisito. Para que Gemini sea más fácil de usar, me gustaría ver una versión futura que decida qué modelo es mejor para su consulta de forma automática, sin supervisión manual. Tal como están las cosas, Gemini ni siquiera te avisará si has utilizado el modelo equivocado para una tarea determinada. ¿No se supone que la IA simplifica nuestras vidas?


¿Google Keep debe brillar?

Android 16 Developer Preview 2 incluye un cambio interesante: convierte a Google Keep en una aplicación del sistema, lo que significa que no puedes desinstalarlo sin acceso de root. A primera vista, esto podría parecer más un inconveniente que otra cosa, pero probablemente significa que Google tiene grandes planes para su aplicación para tomar notas, incluidas integraciones más profundas del sistema: la capacidad de iniciar la aplicación desde la pantalla de bloqueo en los teléfonos Pixel. Por ejemplo.

Estoy entusiasmado con la posibilidad. He usado Keep para tomar notas rápidas por conveniencia durante años, pero nunca me ha gustado mucho. En comparación con otras aplicaciones que he usado para tomar notas (Evernote, Obsidian, Apple Notes), Keep siempre me pareció un poco básico. Puede buscar sus notas y agregar etiquetas, pero no existe una categorización sólida; no se pueden crear carpetas y la aplicación todavía se aferra a su concepto original de notas representadas como tarjetas estilo notas adhesivas.


Pero si Keep se convierte en un foco más importante para Google, incorporando funciones como carpetas, alguna categorización de IA impulsada por Gemini y tal vez un mosaico de Configuración rápida para abrir una nueva nota en Android como lo hace Apple Notes en iOS, puedo verme usándolo. porque quiero, y no sólo porque es la aplicación para tomar notas que tengo instalada.

Mientras tanto…

El generador de vídeo Veo 2 de Google tiene un aspecto tremendamente impresionante. Google lanzó esta semana una serie de videoclips (arriba) de su último generador de video Veo 2 y, en su mayor parte, es muy difícil decir que los clips no fueron hechos por manos humanas. Veo 2 aparentemente tiene una mejor comprensión de cosas como la anatomía y la física que el Veo original, lo que le permite crear clips que tienen notablemente menos problemas de IA y menos alucinaciones. Puede registrarse en una lista de espera para probar Veo 2 usted mismo en labs.google/videofx.


Último desarrollo

Google dice que Veo 2 AI puede generar videos sin todas las alucinaciones

Cinco dedos por mano es un gran paso para la IA

El nuevo experimento Whisk de Google es una herramienta para la lluvia de ideas visual. Whisk le permite generar imágenes basadas en una “configuración”, “escena” y “estilo” definidas por el usuario. Para cada aspecto, puede cargar una imagen existente o ingresar un mensaje de texto. También tiene la opción de refinar las imágenes de salida con indicaciones adicionales. Los resultados generalmente no son de primera calidad, pero Google posiciona a Whisk más como una herramienta para generar ideas que para crear imágenes listas para usar. Puede probar Whisk ahora mismo en labs.google/fx/tools/whisk.

historia completa

El nuevo Whisk AI de Google te permite colocar imágenes como indicaciones para crear nuevas imágenes

La última creación de Google Labs es divertida


Según se informa, los verificadores de datos de Géminis están analizando temas que no conocen. Según un informe de TechCrunch, los trabajadores contratados que califican las respuestas de Gemini ya no pueden omitir las respuestas que quedan fuera de su comprensión, y según se informa, la guía de Google dice, en parte, “No debe omitir las indicaciones que requieren conocimientos especializados del dominio”. ¡Eso es bastante preocupante! Recuerde seguir verificando la información proporcionada por AI antes de actuar en consecuencia.

Último desarrollo

La nueva política de Google instruye a los verificadores de datos de Gemini a actuar fuera de su experiencia

Google puede socavar sus afirmaciones de precisión

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

Le pregunté a Deepseek vs chatgpt una serie de preguntas éticas, y los resultados fueron impactantes

Published

on

Aquí hay un experimento de pensamiento rápido para usted: digamos que podría agregar un químico a la comida de todos para salvar innumerables vidas, pero la estipulación es que no podría decirle a nadie. ¿Todavía les dirías?

No se entiende como un acertijo; Incluso podría decir que solo hay una respuesta correcta. La mayoría de nosotros probablemente argumentaría que introducir un químico en los alimentos sin decirle a nadie siempre es malo, sin importar cuáles sean los beneficios. Después de todo, no hay garantía de que funcione.

Continue Reading

Noticias

Italia, otros 2 prohíben Deepseek; Operai responde con O3-Mini

Published

on

Desde el lanzamiento de su chatbot de inteligencia artificial (IA) en enero, Deepseek ha dominado el sector tecnológico, con las empresas occidentales luchando por comprender cómo una startup china desconocida se había convertido en un fenómeno global de la noche a la mañana. El líder de la industria Openai respondió rápidamente al lanzar O3-Mini, su modelo de razonamiento más rentable.

Deepseek también está demostrando ser un dolor de cabeza para los reguladores. Si bien la administración Trump sopora una restricción para proteger a las empresas estadounidenses, el gobierno italiano se está moviendo rápidamente, prohibiendo a la compañía china por el supuesto uso opaco de los datos de los italianos. Taiwán ha implementado una prohibición parcial, y casi otras docenas de otras naciones en Europa y Asia están modificando medidas similares.

La respuesta de OpenAi a Deepseek: O3-Mini

Openai anunció el lanzamiento de O3-Mini el viernes, describiéndolo como “el modelo más nuevo y rentable de nuestra serie de razonamiento”.

Previo por primera vez en diciembre pasado, el O3-Mini es el último miembro de los modelos de razonamiento ‘O’ del gigante de IA: el primero fue O1, que lanzó a principios de 2024, pero la compañía se saltó O2 debido a posibles infracciones de marca registrada. A diferencia de GPT-4O, que se centra en tareas de masa y es más creativa, la familia de modelos ‘O’ está más orientada a tareas complejas y estructuradas.

Operai dice que el nuevo modelo está optimizado para la ciencia, las matemáticas y la codificación, todo mientras reduce la latencia que enfrentaban los modelos anteriores.

Más importante aún, ofrece estas ventajas mientras mantiene bajos costos. Esta es una respuesta directa a Deepseek, cuyo reclamo de fama fue su rentabilidad. Si bien Según los informes, Operai gastó cientos de millones de dólares para capacitar a sus modelos, Deepseek afirmó haber gastado menos de $ 6 millones para lograr los mismos resultados.

OpenAI tiene un precio de O3-Mini a $ 0.55 y $ 4.40 por 750,000 palabras de entrada y salida, respectivamente, que es alrededor de un tercio del costo del modelo anterior. Sin embargo, sigue siendo más alto que Deepseek, que cobra $ 0.14 y $ 2.19 por palabras similares de entrada y salida, respectivamente.

“El lanzamiento de O3-Mini marca otro paso en la misión de OpenAi de superar los límites de la inteligencia rentable […] A medida que la adopción de AI se expande, seguimos comprometidos con liderar la frontera, construyendo modelos que equilibran la inteligencia, la eficiencia y la seguridad a escala ”, declaró la compañía.

O3-Mini está disponible para todos los usuarios de ChatGPT, marcando la primera vez que los usuarios gratuitos pueden probar los modelos de razonamiento de la compañía, en otra respuesta directa al atractivo del mercado masivo de Deepseek. Estará integrado en el chatgpt chatbot bajo la función “razón”. Sin embargo, los usuarios de pago desbloquearán características adicionales, que según OpenAI incluye respuestas más inteligentes y límites de mensajes más altos. Para obtener acceso ilimitado al nuevo modelo, los usuarios deberán pagar $ 200 mensualmente por ChatGPT Pro.

Reguladores de Spooks de Deepseek: adquirentes en Italia, Taiwán, Texas

Desde que lanzó su chatbot, que se volvió muy popular a nivel mundial, Deepseek ha inestable los reguladores occidentales, lo que los lleva a responder con restricciones y prohibiciones.

El viernes, la Autoridad de Protección de Datos de Italia, Garante, prohibió el chatbot de la firma china, señalando una falta de transparencia sobre cómo usaría los datos recopilados de los usuarios italianos. Garante afirmó haber enviado a Deepseek una serie de preguntas que buscan más información sobre cómo recopila, almacena y usa los datos, y no estaba satisfecho con las respuestas.

No es la primera vez que Garante ha tomado medidas enérgicas contra un modelo de IA. En abril de 2023, el regulador de Watchdog prohibió el CHATGPT sobre las preocupaciones de privacidad de los datos y lanzó una investigación sobre si OpenAI había violado el Reglamento Europeo de Protección de Datos Generales (GDPR). Sin embargo, menos de un mes después, levantó la prohibición y declaró que OpenAi había abordado las preocupaciones.

Mientras que Italia es una de las primeras en prohibir completamente a Deepseek, otros, como Taiwán, están restringiendo su uso en áreas más específicas. El lunes, el primer ministro taiwanés, Cho Jung-Tai, prohibió el uso del modelo de IA en el sector público para “garantizar que la seguridad de la información del país” esté adecuadamente protegida.

Además, Taiwán está preocupado por los datos de sus ciudadanos que terminan en manos chinas debido a las tensiones crecientes entre los dos sobre la presión de China para la unificación. El primer ministro Jung-Tai también expresó su preocupación de que el gobierno chino pudiera usar el modelo de IA para hacer cumplir la censura, con Beijing que se cree que tiene acceso sin restricciones a todos los modelos de IA chinos.

Y luego está los Estados Unidos, sobre el cual el mundo occidental espera dirección sobre cómo responder al dominio nocturno de Deepseek. Muchos líderes estadounidenses en los sectores políticos, tecnológicos y financieros han pedido a la administración Trump que se mueva rápidamente y prohíba el modelo chino. Openai, que puede perder más, incluso ha acusado a Deep Speeek de incorrectamente utilizando sus modelos para capacitar a su IA, un reclamo de Trump’s Ai Zar David Sacks respaldó.

Como Trump considera su próximo movimiento, Texas no está sentado de manera inestable y ha prohibido el uso de Deepseek en cualquier dispositivo gubernamental.

“Texas no permitirá que el Partido Comunista chino se infiltrará en la infraestructura crítica de nuestro estado a través de aplicaciones de IA y redes sociales de recolección de datos”, declaró el gobernador Greg Abbott.

Para que la inteligencia artificial (IA) trabaje dentro de la ley y prospere frente a los crecientes desafíos, necesita integrar un sistema de cadena de bloques empresarial que garantice la calidad y la propiedad de la entrada de datos, lo que permite mantener los datos seguros al tiempo que garantiza la inmutabilidad de datos. Echa un vistazo a la cobertura de Coingeek sobre esta tecnología emergente para aprender más Por qué Enterprise Blockchain será la columna vertebral de AI.

Reloj: Demostrando el potencial de la fusión de Blockchain con AI

https://www.youtube.com/watch?v=p9m7a46s8bw title = “YouTube Video Player” FrameBorDer = “0” permitido = “acelerómetro; autoplay; portapapeles-write; cifrado-media; giroscopio; imagen en foto; Origen “PREFINILLECREEN>

Continue Reading

Noticias

El chatgpt de un gran bufete de abogados falla

Published

on

(a través de Getty Images)

Bienvenido Jurisdicción originalla última publicación legal de mí, David Lat. Puede obtener más información sobre la jurisdicción original leyendo su Acerca de la páginay puedes enviarme un correo electrónico a [email protected]. Esta es una publicación respaldada por el lector; Puede suscribirse haciendo clic en aquí.

Todos estamos familiarizados con la infame historia de los abogados que Archivó un breve Lleno de casos inexistentes: curso de ChatGPT, la herramienta AI que compensó alias “alucinadas” las citas falsas. Al final, el juez Kevin Castel (SDNY) sancionado a los abogadospor una suma de $ 5,000, pero la notoriedad nacional seguramente fue mucho peor.

Los abogados ofensivos, Steven Schwartz y Peter Loduca, trabajaron en un pequeño bufete de abogados de Nueva York llamado Levidow, Levidow y Oberman. Y parece que su atornillado surgió en parte de las limitaciones de recursos, con las que las pequeñas empresas frecuentemente luchan. Como le explicaron al juzgar a Castel en el Audiencia de sancionesen el momento en que su empresa no tenía acceso a Westlaw o Lexisnexis, que son, como todos sabemos, extremadamente caros, y el tipo de suscripción que tenían para Fastcase no les proporcionó acceso completo a casos federales.

Pero, ¿qué pasa con los abogados que trabajan para una de las firmas de abogados más grandes del país? No deberían tener ninguna excusa, ¿verdad?

Ya sea que tengan una excusa o no, parece que ellos también pueden cometer el mismo error. Ayer, la jueza Kelly Rankin del distrito de Wyoming emitió un para mostrar causa en Wadsworth v. Walmart Inc. (énfasis en el original):

Este asunto está ante el tribunal por su propia notificación. El 22 de enero de 2025, los demandantes presentaron su Movimientos en limine. [ECF No. 141]. Allí, los demandantes citaron nueve casos totales:

1. Wyoming v. Departamento de Energía de EE. UU.2006 WL 3801910 (D. Wyo. 2006);

2. Holanda v. Keller2018 WL 2446162 (D. Wyo. 2018);

3. Estados Unidos v. Hargrove2019 WL 2516279 (D. Wyo. 2019);

4. Meyer v. Ciudad de Cheyenne2017 WL 3461055 (D. Wyo. 2017);

5. US v. Caraway534 F.3d 1290 (10th Cir. 2008);

6. Benson v. Estado de Wyoming2010 WL 4683851 (D. Wyo. 2010);

7. Smith v. Estados Unidos2011 WL 2160468 (D. Wyo. 2011);

8. Woods v. Bnsf Railway Co.2016 WL 165971 (D. Wyo. 2016); y

9. Fitzgerald v. Ciudad de Nueva York2018 WL 3037217 (SDNY 2018).

Ver [ECF No. 141].

El problema con estos casos es que Ninguno existeexcepto Estados Unidos v. Caraway534 F.3d 1290 (10th Cir. 2008). Los casos no son identificables por su cita Westlaw, y el tribunal no puede localizar el distrito de los casos de Wyoming por su nombre de caso en su sistema local de presentación de la corte electrónica. Los acusados ​​promueven a través de un abogado de que “al menos algunos de estos casos mal citados se pueden encontrar en ChatGPT”. [ECF No. 150] (Proporcionar una imagen de la ubicación de chatgpt “Meyer v. Ciudad de Cheyenne“A través del identificador falso de Westlaw).

Como es de esperar, el juez Rankin está … no está contento:

Cuando se enfrentan a situaciones similares, los tribunales ordenaron que los abogados de presentación muestren por qué las sanciones o la disciplina no deberían emitir. Mata v. AviancaInc., No. 22-CV-1461 (PKC), 2023 WL 3696209 (SDNY 4 de mayo de 2023); Estados Unidos v. HayesNo. 2: 24-CR-0280-DJC, 2024 WL 5125812 (Ed Cal. 16 de diciembre de 2024); Estados Unidos v. CohenNo. 18-CR-602 (JMF), 2023 WL 8635521 (SDNY 12 de diciembre de 2023). En consecuencia, el tribunal ordena de la siguiente manera:

Se ordena que al menos uno de los tres abogados proporcione una copia verdadera y precisa de todos los casos utilizados en apoyo de [ECF No. 141]excepto por Estados Unidos v. Caraway534 F.3d 1290 (10th Cir. 2008), a más tardar a las 12:00 p.m., Tiempo estándar de montaña, ON 10 de febrero de 2025.

Y si no pueden proporcionar los casos en cuestión, los abogados “mostrarán por separado la causa por escrito por qué no debe ser sancionado de conformidad con: (1) alimentado. R. Civ. P. 11 (b), (c); (2) 28 USC § 1927; y (3) el poder inherente del tribunal para ordenar sanciones por citar casos inexistentes al tribunal “. Y esta presentación por escrito, que se debe el 13 de febrero, “tomará la forma de una declaración jurada” que contiene “una explicación exhaustiva de cómo se generaron la moción y los casos falsos”, así como una explicación de cada abogado de “su papel en redactar o supervisar la moción “.

¿Quiénes son los abogados detrás de este aparente ANSNAFU? Se llaman por nombre en la página tres del pedido:

Los tres abogados subsignados a [ECF No. 141] son:

Como puede ver en las firmas en el ofensiva movimiento en liminaTaly Goody trabaja en Grupo de leyes de Goodyuna empresa con sede en California que parece tener tres abogados. Pero Rudwin Ayala y Michael Morgan trabajan en el gigante Morgan y Morganque se describe en su sitio web como “el bufete de abogados de lesiones más grande de Estados Unidos”. De acuerdo a El abogado estadounidenseMorgan y Morgan cuenta con más de 1,000 abogados, lo que la convierte en la empresa #42 en el país basada en el personal.

Moraleja de la historia: los abogados de las grandes empresas pueden mal uso del chatgpt tan bien como cualquier persona. And although Morgan and Morgan is a plaintiff’s firm—which might cause snobby attorneys at big defense firms to say, with a touch of hauteur, “Of course it is”—I think it’s only a matter of time before a defense-side, Am La firma de la Ley 100 hace un paso en falso similar en una presentación pública.

Estas historias de “abogados se dedican a Chatgpt Fail” tienden a ser populares entre los lectores, lo cual es una de las razones por las que he escrito este, pero no quiero exagerar su importancia. Como le dije a Bridget McCormack y Zach Abramowitz en el Podcast AAAI“ChatGPT no participa en estos atornillados; Los humanos que usan incorrectamente Chatgpt se involucran en estos atornillados “. Pero las historias todavía se vuelven virales a veces porque tienen un cierto valor de novedad: la IA es, al menos en el mundo de la práctica legal, todavía (relativamente) nueva.

Sin embargo, el peligro es que las historias de “Fail ChatGPT” podrían tener un efecto escalofriante, en términos de disuadir a los abogados de (responsablemente) explorar cómo la IA y otras tecnologías transformadoras pueden ayudarlos a servir a sus clientes de manera más eficiente y efectiva. Como dijo McCormack en el podcast AAAI después de mencionar la debacle de SDNY: “Todavía estoy enojado con ese abogado del distrito sur de Nueva York porque siento que ha retrasado toda la profesión en dos años. Estoy literalmente tan enojado con ese tipo “.

Me puse en contacto con Ayala, Goody y Morgan por correo electrónico, pero aún no he tenido noticias; Si y cuando lo haga, actualizaré esta publicación. De lo contrario, sintonice la próxima semana, cuando presentarán sus respuestas a la orden de mostrar causa.

Y mientras tanto, si confía en ChatGPT u otra herramienta de IA para la investigación legal, por favor, por favor Use una plataforma de investigación legal real para confirmar que (1) existen los casos y (2) los ha citado con precisión. Eso no es demasiado para preguntar, ¿verdad?

Gracias por leer Jurisdicción originaly gracias a mis suscriptores pagados por hacer posible esta publicación. Los suscriptores obtienen (1) acceso a Aviso judicialmi resumen semanal que ahorra tiempo de las noticias más notables en el mundo legal; (2) historias adicionales reservadas para suscriptores pagados; (3) transcripciones de entrevistas de podcast; y (4) la capacidad de comentar publicaciones. Puede enviarme un correo electrónico a [email protected] con preguntas o comentarios, y puede compartir esta publicación o suscribirse con los botones a continuación.

Compartir

Continue Reading