Connect with us

Noticias

Llega la búsqueda profunda abierta para desafiar la perplejidad y la búsqueda de chatgpt

Published

on

Únase a nuestros boletines diarios y semanales para obtener las últimas actualizaciones y contenido exclusivo sobre la cobertura de IA líder de la industria. Obtenga más información


Los investigadores de la Fundación Sentient han publicado Open Deep Search (ODS), un marco de código abierto que puede igualar la calidad de las soluciones de búsqueda de IA patentadas, como la perplejidad y la búsqueda de CHATGPT. ODS equipa modelos de idiomas grandes (LLM) con agentes de razonamiento avanzado que pueden usar la búsqueda web y otras herramientas para responder preguntas.

Para las empresas que buscan herramientas de búsqueda de IA personalizables, ODS ofrece una alternativa convincente y de alto rendimiento a las soluciones comerciales cerradas.

El paisaje de búsqueda de IA

Las herramientas de búsqueda de IA modernas como Perplexity y ChatGPT Search pueden proporcionar respuestas actualizadas combinando las capacidades de conocimiento y razonamiento de LLMS con la búsqueda web. Sin embargo, estas soluciones son típicamente patentadas y de código cerrado, lo que dificulta la personalización de ellas y adoptarlas para aplicaciones especiales.

“La mayoría de la innovación en la búsqueda de IA ha sucedido a puerta cerrada. Los esfuerzos de código abierto se han retrasado históricamente en usabilidad y rendimiento”, dijo a VentureBeat de Himanshu Tyagi, cofundador de Sentient. “ODS tiene como objetivo cerrar esa brecha, mostrando que los sistemas abiertos pueden competir, e incluso superar, las contrapartes cerradas sobre la calidad, la velocidad y la flexibilidad”.

Arquitectura de búsqueda profunda (ODS) abierta

Open Deep Search (ODS) está diseñado como un sistema plug-and-play que puede integrarse con modelos de código abierto como Deepseek-R1 y modelos cerrados como GPT-4O y Claude.

ODS comprende dos componentes centrales, ambos aprovechando la base elegida LLM:

Herramienta de búsqueda abierta: Este componente toma una consulta y recupera información de la web que se puede dar al LLM como contexto. La herramienta de búsqueda Open realiza algunas acciones clave para mejorar los resultados de búsqueda y asegurarse de que proporcione un contexto relevante para el modelo. Primero, reformula la consulta original de diferentes maneras para ampliar la cobertura de búsqueda y capturar diversas perspectivas. Luego, la herramienta obtiene resultados de un motor de búsqueda, extrae el contexto de los resultados superiores (fragmentos y páginas vinculadas), y aplica técnicas de fragmentación y reanimación para filtrar el contenido más relevante. También tiene un manejo costumbre para fuentes específicas como Wikipedia, ARXIV y PubMed, y puede solicitarse a priorizar fuentes confiables al encontrar información contradictoria.

Agente de razonamiento abierto: Este agente recibe la consulta del usuario y utiliza la base LLM y varias herramientas (incluida la herramienta de búsqueda abierta) para formular una respuesta final. Sentient proporciona dos arquitecturas de agentes distintos dentro de ODS:

ODS-V1: Esta versión emplea un marco de agente React combinado con el razonamiento de la cadena de pensamiento (COT). Los agentes reaccionados intercalan pasos de razonamiento (“pensamientos”) con acciones (como usar la herramienta de búsqueda) y las observaciones (los resultados de las herramientas). ODS-V1 usa reaccionar iterativamente para llegar a una respuesta. Si el agente React lucha (según lo determinado por un modelo de juez separado), es predeterminado a una autoconsistencia de COT, que muestra varias respuestas de cuna del modelo y usa la respuesta que aparece con más frecuencia.

ODS-V2: Esta versión aprovecha la cadena de código (COC) y un agente CodeAct, implementado utilizando la biblioteca de Sumolagents Face. COC utiliza la capacidad de LLM para generar y ejecutar fragmentos de código para resolver problemas, mientras que CodeAct usa la generación de código para las acciones de planificación. ODS-V2 puede orquestar múltiples herramientas y agentes, lo que le permite abordar tareas más complejas que pueden requerir una planificación sofisticada y iteraciones de búsqueda potencialmente múltiples.

Agente de razonamiento abierto ODS
Crédito de arquitectura ODS: ARXIV

“Si bien herramientas como ChatGPT o Grok ofrecen ‘investigación profunda’ a través de agentes de conversación, ODS opera en una capa diferente, más similar a la infraestructura detrás de la perplejidad de IA, que proporciona la arquitectura subyacente que impulsa la recuperación inteligente, no solo los resúmenes”, dijo Tyagi.

Rendimiento y resultados prácticos

Sentient evaluó ODS emparejándolo con el modelo de código abierto Deepseek-R1 y probándolo contra competidores populares de código cerrado como Perplexity AI y la vista previa de búsqueda GPT-4O de OpenAI, así como LLMS independientes como GPT-4O y LLAMA-3.1-70B. Usaron los marcos y los puntos de referencia de SimpleQA Pregunta-Respuesta, adaptándolos para evaluar la precisión de los sistemas de IA habilitados para la búsqueda.

Los resultados demuestran la competitividad de ODS. Tanto ODS-V1 como ODS-V2, cuando se combinan con Deepseek-R1, superaron a los productos insignia de Perplexity. En particular, ODS-V2 combinado con Deepseek-R1 superó la vista previa de búsqueda GPT-4O en el complejo punto de referencia de marcos y casi lo coincidió en SimpleQA.

Una observación interesante fue la eficiencia del marco. Los agentes de razonamiento en ambas versiones de ODS aprendieron a usar la herramienta de búsqueda juiciosamente, a menudo decidieron si era necesaria una búsqueda adicional en función de la calidad de los resultados iniciales. Por ejemplo, ODS-V2 utilizó menos búsquedas web en las tareas SimpleQA más simples en comparación con las consultas más complejas y múltiples en marcos, optimizando el consumo de recursos.

Implicaciones para la empresa

Para las empresas que buscan potentes capacidades de razonamiento de IA basadas en información en tiempo real, ODS presenta una solución prometedora que ofrece una alternativa transparente, personalizable y de alto rendimiento a los sistemas de búsqueda de IA patentados. La capacidad de enchufar LLM y herramientas de código abierto preferidos brinda a las organizaciones un mayor control sobre su pila de IA y evita el bloqueo del proveedor.

“ODS fue construido con modularidad en mente”, dijo Tyagi. “Selecciona qué herramientas usar dinámicamente, en función de las descripciones proporcionadas en la solicitud. Esto significa que puede interactuar con herramientas desconocidas con fluidez, siempre y cuando estén bien descritadas, sin requerir exposición previa”.

Sin embargo, reconoció que el rendimiento de ODS puede degradarse cuando el conjunto de herramientas se hincha, “un diseño tan cuidadoso importa”.

Sensient ha lanzado el código para ODS en GitHub.

“Inicialmente, la fuerza de la perplejidad y el chatgpt era su tecnología avanzada, pero con ODS, hemos nivelado este campo de juego tecnológico”, dijo Tyagi. “Ahora nuestro objetivo es superar sus capacidades a través de nuestra estrategia de ‘Entradas abiertas y salidas abiertas’, lo que permite a los usuarios integrar sin problemas a los agentes personalizados en un chat sensible”.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

¿El nuevo generador de imágenes de Chatgpt es realmente bueno?

Published

on

Continue Reading

Noticias

Ghibli Chatgpt Feature Drives Surge: lo que debes saber

Published

on

  • El arte al estilo de Ghibli empuja la actividad de Chatgpt a nuevos máximos.
  • Operai dice que trabajar a la capacidad de escala para herramientas de imagen GPT-4O.

El tráfico de Internet de ChatGPT se ha disparado debido a un aumento en el interés por las imágenes generadas por IA diseñadas después de las animaciones de Studio Gibli.

Operai notó un gran aumento en el compromiso después del lanzamiento de su herramienta de generación de imágenes, que permite a los usuarios crear obras de arte que recuerden a títulos clásicos como Spirited Away y mi vecino Totoro. Los datos de SimilarWeb muestran que los usuarios activos semanales pasaron 150 millones por primera vez este año.

El CEO de Openai, Sam Altman, dijo en las redes sociales que la plataforma agregó un millón de usuarios en una sola hora, superando los registros de crecimiento anteriores. Sensortower informó que las descargas e ingresos a través de la aplicación ChatGPT también aumentaron. Las descargas semanales aumentaron en un 11%, usuarios activos en un 5%e ingresos por compra en la aplicación en un 6%en comparación con el mes anterior.

El rápido aumento en el uso ejerció presión sobre la infraestructura de la plataforma. Los usuarios informaron desaceleraciones y interrupciones breves, lo que obligó a Altman a advertir que las características futuras pueden enfrentar retrasos, mientras que OpenAI administra la capacidad

Los usuarios promedio semanales de ChatGPT alcanzan el registro alto (fuente – Similarweb)

Preocupaciones legales y de derechos de autor con el chatgpt x ghibli

La tendencia viral ha provocado una discusión sobre los derechos de autor. Algunos expertos legales han planteado preguntas sobre si los estilos de animación distintivos muy replantadores podrían cruzar la infracción.

“El panorama legal de las imágenes generadas por la IA que imitan el estilo distintivo de Studio Ghibli es un terreno incierto. La ley de derechos de autor generalmente ha protegido solo expresiones específicas en lugar de estilos artísticos en sí”, dijo Evan Brown, socio de abogados de abogados Neal & McDevitt.

Operai no respondió a las preguntas sobre cómo se capacitaban sus modelos o si los materiales con derechos de autor influyeron en su generador de imágenes. Studio Ghibli no ha emitido una declaración formal, pero los comentarios de sus cofundadores han resurgido.

La reacción de 2016 de Hayao Miyazaki a una imagen temprana generada por IA llamó la atención la semana pasada. En un video ampliamente circulado, describió la tecnología como “un insulto a la vida misma”. El clip completo lo muestra respondiendo específicamente a un render de IA de zombie, que llamó “extremadamente desagradable”.

En una entrevista reciente, el director gerente de Studio Ghibli, Goro Miyazaki, reconoció las crecientes capacidades de la IA. Afirmó que las películas generadas por IA podrían convertirse en realidad en los próximos años, pero cuestionó si el público las aceptaría. También reconoció que si bien la nueva tecnología podría conducir a nuevas voces creativas, puede ser difícil replicar las sensibilidades de las generaciones anteriores. “Hoy en día, el mundo está lleno de oportunidades para ver cualquier cosa, en cualquier momento, en cualquier lugar”, dijo, sugiriendo que los artistas más jóvenes pueden no compartir las mismas experiencias que dieron forma a los trabajos anteriores de Gibli.

Preocupaciones de estudio y cambios de la industria

Japón enfrenta una escasez de animadores capacitados, en parte debido a largas horas y bajos salarios en la industria. Goro señaló que la generación Z puede estar menos inclinada a seguir la carrera tradicionalmente intensiva de la animación dibujada a mano.

Las herramientas de IA están emergiendo como una alternativa más rápida y de menor costo a la narración visual. El legado de Studio Ghibli incluye una serie de películas que combinan temas fantásticos con reflexiones personales e históricas. El último trabajo de Miyazaki, The Boy and the Heron, obtuvo un Premio de la Academia y puede ser su proyecto final. Goro ha contribuido con sus propios esfuerzos de dirección, incluidos cuentos de Earthsea y de Up On Poppy Hill, y ayudó a desarrollar el Museo Gibli y el Parque Gibli.

Privacidad del usuario y seguridad de datos

A medida que más usuarios suben imágenes personales para generar retratos estilizados, los defensores de la privacidad están generando preocupaciones sobre cómo se recopilan y usan esos datos. “Cuando subes una foto a un generador de arte de IA, estás regalando tus datos biométricos (tu cara). Algunas herramientas de IA almacenan esos datos, Úselo para entrenar modelos futuros, o incluso venderlos a terceros, ninguno de los cuales puede ser plenamente consciente a menos que leas la letra pequeña”, dijo Christoph C. Cemper, fundador de AIPRM.

La Política de privacidad de OpenAI confirma que la plataforma recopila datos proporcionados por el usuario y generados automáticamente, incluidas las imágenes. A menos que los usuarios opten por no participar o soliciten la eliminación de datos, el contenido puede conservarse y usarse para capacitar a futuros modelos.

https://www.youtube.com/watch?v=bt-7yinbvle

Cemper dijo que las imágenes cargadas podrían ser mal utilizadas. Los datos personales pueden aparecer en conjuntos de datos públicos, como Laion-5b, que se ha relacionado con la capacitación de herramientas como la difusión estable y Google Imagen. Un caso reportado involucró a un usuario que encontraba imágenes médicas privadas en un conjunto de datos públicos. Cemper dijo que el contenido generado por IA ya se ha utilizado para producir documentos e imágenes fabricados, y agregó que los riesgos de defake están aumentando. “Hay demasiados flujos de verificación del mundo real que dependen de las ‘imágenes reales’ como prueba. Esa era ha terminado”, escribió un usuario en las redes sociales.

Navegar por licencias y derechos de usuario entre chatgpt y ghibli

Cemper instó a los usuarios a conocer los términos de licencia amplios enterrados en las políticas de la plataforma de IA. Términos como “no exclusivo”, “libre de regalías” y “licencia irrevocable” pueden dar a las plataformas derechos amplios sobre contenido cargado. Los derechos pueden extenderse incluso después de que el usuario deje de usar el servicio.

Crear arte de IA al estilo de marcas conocidas también podría presentar desafíos legales. Los estilos artísticos como los de Studio Ghibli, Disney y Pixar están estrechamente asociados con sus creadores originales, e imitarlos pueden caer bajo protecciones laborales derivadas.

A finales de 2022, varios artistas presentaron demandas contra las empresas de IA, alegando que su trabajo se usó sin permiso para capacitar a los generadores de imágenes. Los desafíos legales en curso resaltan la tensión entre la libertad creativa y los derechos de propiedad intelectual.

Cemper added: “The rollout of ChatGPT’s 4o image generator shows just how powerful AI has become as it replicates iconic artistic styles with just a few clicks. But this unprecedented capability comes with a growing risk – the lines between creativity and copyright infringement are increasingly blurred, and the risk of unintentionally violating intellectual property laws continues to grow. While these trends may seem harmless,creators must be aware that what may appear Como un experimento divertido podría cruzar fácilmente al territorio legal.

“El ritmo rápido del desarrollo de la IA también plantea preocupaciones significativas sobre la privacidad y la seguridad de las citas. Con más usuarios relacionados con las herramientas de IA, existe una necesidad apremiante de políticas de privacidad más claras y transparentes. Los usuarios deben estar facultados para tomar decisiones informadas sobre la carga de sus fotos o datos personales cuando pueden no darse cuenta de cómo se está almacenando, compartir o utilizar su información”.

Continue Reading

Noticias

La consolidación de la demanda de derechos de autor de OpenAI presagia la consistencia, el riesgo

Published

on

Operai Inc. La victoria táctica que consolida una docena de demandas de derechos de autor en su contra, sin embargo, conlleva riesgos para la compañía, ya que los asuntos proceden ante un juez que ya ha fallado en contra de la compañía en decisiones clave.

El Panel Judicial de EE. UU. Sobre litigios multidistritales la semana pasada, los casos centralizados en todo el país en el Tribunal de Distrito de los Estados Unidos para el Distrito Sur de Nueva York para la actividad previa al juicio, que podrían incluir mociones dispositivas que incluyen juicio sumario, así como disputas de descubrimiento contenciosas que han sido comunes entre los casos.

“Esto ayudará a crear más consistencia en los resultados previos al juicio, pero también significa que obtendrá menos intentos de diferentes demandantes para encontrar un conjunto de argumentos ganadores”, dijo Peter Henderson, profesor asistente de la Universidad de Princeton, en un correo electrónico.

El juez Sidney H. Stein y el juez magistrado Ona T. Wang, quien supervisará el MDL, ya habían sido asignados a seis de las demandas presentadas por New York Times Co.Daily News LP, Autors Guild, periodistas y autores. Eso ahora incluye trajes de autores como Sarah Silverman y Paul Tremblay.

Si bien se optimizó, los procedimientos previos al juicio creen que permaneceré contenciosos a medida que las partes presionen preguntas novedosas sobre cómo las leyes de derechos de autor se aplican a la tecnología de IA generativa que cambia el juego. Las disputas tienen grandes ramificaciones para las empresas que dependen de millones de trabajos con derechos de autor para capacitar a sus modelos.

Operai aún tiene que informar a los tribunales sobre una defensa de uso justo, ya que Meta Platforms Inc. y Antropic PBC tienen en otros casos de IA generativos, aunque se dice que sus modelos se basan en el principio. Los autores y editores argumentan que no hay una exención de uso justo para cosechar el trabajo protegido para capacitar a la tecnología comercial lucrativa de forma gratuita. Un tribunal ha rechazado una defensa de uso justo para una herramienta de búsqueda de IA no generativa y aceleró una apelación.

Las decisiones anteriores de Stein dan una idea de su pensamiento sobre los temas y dónde está de acuerdo o divergió de otros jueces.

Por ejemplo, negó la moción de OpenAI para desestimar una reclamación de la Ley de Derechos de Autor del Milenio Digital presentado por el Centro para Investigative Reporting Inc. y Daily News, al tiempo que desestimó otras reclamaciones de DMCA de esos medios y el New York Times. Permitió acusaciones de infracción de los tres para avanzar.

La decisión de Stein cita uno por el juez de su colega de distrito Jed S. Rakoff que permite que el reclamo de DMCA de Intercept Media Inc. contra Operai continúe. Pero eso choca con la orden de noviembre del juez Colleen McMahon que desestima el reclamo de Raw Story Media Inc. y su posterior negación de una intento por enmendar sus acusaciones. La semana pasada, le dijo a los demandantes si pensaban que Rakoff tenía razón y que estaba equivocada, deberían apelar al Segundo Circuito.

“Las compañías tecnológicas querrán que la perspectiva del juez McMahon sea la visión ganadora”, dijo Henderson. “La asignación de MDL al juez Stein arroja una llave en eso”.

Operai declinó hacer comentarios, y el abogado de los demandantes en demandas transferidos a Stein no respondió de inmediato a las solicitudes de comentarios.

Lugar elegido

Operai en diciembre solicitó que los casos se transfieran al Distrito Norte de California, argumentando que es donde se encuentran la “abrumadora mayoría de los documentos relevantes” y donde tuvo lugar el diseño y la capacitación de los modelos de idiomas grandes. Cuatro de los casos consolidados se presentaron en California, con ocho en Nueva York.

Aunque Operai no logró aterrizar en su lugar preferido, el Segundo Circuito todavía tiene un precedente favorable, dijo el profesor de derecho de la Universidad de Santa Clara, Tyler T. Ochoa. Señaló su decisión de 2015 en Autors Guild v. Google Inc., que mantuvo la copia de libros de Google para permitir que el público busque digitalmente los textos calificados como uso justo en virtud de la Ley de Derechos de Autor.

Contrasta eso con otro caso de Segundo Circuito, Andy Warhol encontró. v. Goldsmitheso fue más favorable para los propietarios de derechos de autor.

“El caso de Warhol distingue específicamente Libros de Googley creo Libros de Google está mucho más de cerca “a los casos de OpenAi, dijo.

Sin embargo, el Tribunal de Nueva York puede ser preferible a los demandantes, porque el Distrito Norte de California “generalmente se considera como un lugar amigable para las disputas tecnológicas”, dijo el abogado de McKool Smith, Avery Williams.

El profesor de derecho de Stanford, Mark Lemley, quien anteriormente representó a Meta en un caso de derechos de autor de IA, acordó, diciendo en un correo electrónico que cambiar “el centro de gravedad en los casos generales” a Nueva York crea un “riesgo significativo” para OpenAi.

Señaló que las decisiones de juicio sumario en los casos en contra Meta Y el antrópico en California aún podría hacerse primero.

En cualquier caso, el Tribunal Superior probablemente tendrá la última palabra.

“Una decisión sobre el estándar de uso justo aplicado a la capacitación generativa de IA está destinada a la revisión de la Corte Suprema de una forma u otra”, dijo Williams, y agregó que la consolidación de OpenAi “podría acelerar el proceso” al mirarlo en un caso grande.

Desafíos de los demandantes

Si bien la elección del lugar puede ser un lado positivo para los demandantes, los abogados dijeron que es probable que haya problemas de coordinación.

“Veo un desafío potencial en la fusión de lo que parece ser un tipo muy diferente de contenido creativo entre los demandantes”, dijo Bhamati Viswanathan, profesora de New England Law, en un correo electrónico. “Los artículos de noticias de NYT tienen que eliminar la división de hecho/expresión, mientras que los libros de Franzen, Gresham, Martin, et al. Están más cerca de la” creativa “pura que generalmente obtiene una protección más escrupulosa bajo un uso justo”.

Los abogados de los propietarios de derechos de autor que presentaron sus demandas en California también pueden tener que renunciar a algún control a los abogados de los demandantes de Nueva York.

“Si alguien se pierde aquí, creo que son los abogados de los demandantes en los casos de Tremblay y Silverman”, dijo Ochoa. Dijo que esperaría que “los demandantes en los casos de Nueva York tendrán más de decir sobre cómo se realiza el descubrimiento”.

Sin embargo, la consolidación podría aumentar la probabilidad de asentamiento, dijo el decano de Santa Clara Law, Michael Kaufman.

“Todas las partes que tienen reclamos comunes están en un foro, en un jurisdicción, frente a un juez, un magistrado”, dijo Kaufman. “Por lo tanto, es probable que tenga un acuerdo global u omnibus”.

El caso está en re: Openai, Inc., Litigio de infracción de derechos de autor, JPML, No. 3143.

Continue Reading

Trending