Connect with us

Noticias

Ex-Openai Personal File Amicus Brief oponiéndose a la transición con fines de lucro de la compañía

Published

on

Un grupo de ex empleados de Openai presentó el viernes un informe amicus propuesto en apoyo de Elon Musk en su demanda contra OpenAi, oponiéndose a la conversión planificada de OpenAi de una organización sin fines de lucro a una corporación con fines de lucro.

El breve nombra doce ex empleados de Operai: Steven Adler, Rosemary Campbell, Neil Chowdhury, Jacob Hilton, Daniel Kokotajlo, Gretchen Krueger, Todor Markov, Richard Ngo, Girish Sastry, William Saunders, Carrol Wainwright y Jeffrey Wu. Enfecta el caso de que, si la organización sin fines de lucro de OpenAI cedió el control de las operaciones comerciales de la organización, “violaría fundamentalmente su misión”.

Varios de los ex-personal han hablado en contra de las prácticas de OpenAi antes. Krueger ha pedido a la compañía que mejore su responsabilidad y transparencia, mientras que Kokotajlo y Saunders advirtieron previamente que OpenAi está en una carrera “imprudente” por el dominio de la IA. Wainwright ha dicho que Openai “no debería [be trusted] cuando promete hacer lo correcto más tarde “.

En un comunicado, un portavoz de OpenAI dijo que la organización sin fines de lucro de Openai “no va a ninguna parte” y que la misión de la organización “seguirá siendo la misma”.

“Nuestra junta ha sido muy clara”, dijo el portavoz a TechCrunch por correo electrónico. “Estamos convirtiendo nuestro brazo con fines de lucro existente en una Corporación de Beneficios Públicos (PBC), la misma estructura que otros laboratorios de IA como Anthrope, donde algunos de estos ex empleados ahora trabajan, y [Musk’s AI startup] xai. “

OpenAi fue fundada como una organización sin fines de lucro en 2015, pero se convirtió en una “fines de lucro limitada” en 2019, y ahora está tratando de reestructurarse una vez más en un PBC. Cuando hizo la transición a una perfil limitada, Operai retuvo su ala sin fines de lucro, que actualmente tiene una participación de control en el brazo corporativo de la organización.

La demanda de Musk contra Openai acusa a la startup de abandonar su misión sin fines de lucro, que tenía como objetivo garantizar que su investigación de IA beneficie a toda la humanidad. Musk había buscado una orden judicial preliminar para detener la conversión de Openai. Un juez federal negó la solicitud, pero permitió que el caso fuera a un juicio con jurado en la primavera de 2026.

Según la estructura actual de los ex empleados de los empleados abiertos, la estructura actual de OpenAI, una organización sin fines de lucro que controla a un grupo de otras subsidiarias, es una “parte crucial” de su estrategia general y “crítico” para la misión de la organización. La reestructuración que elimina el papel controlador de la organización sin fines de lucro no solo contradeciría la misión y los compromisos de la carta de OpenAi, sino que también “violaría la confianza de los empleados, los donantes y otras partes interesadas que se unieron y apoyaron a la organización en función de estos compromisos”, afirma el informe.

“OpenAi se comprometió con varios principios clave para ejecutar en [its] Misión en su documento charter “, dice el breve.” Estos compromisos fueron tomados extremadamente en serio dentro de la empresa y fueron comunicados y tratados repetidamente como vinculantes. El tribunal debe reconocer que mantener la gobernanza de la organización sin fines de lucro es esencial para preservar la estructura única de OpenAI, que fue diseñada para garantizar que la inteligencia general artificial beneficie a la humanidad en lugar de atender intereses financieros estrechos “.

La inteligencia general artificial, o AGI, se entiende ampliamente como IA que puede completar cualquier tarea que un humano pueda.

Según el breve, Operai a menudo usaba su estructura como herramienta de reclutamiento, y le aseguró repetidamente al personal que el control sin fines de lucro era “crítico” en la ejecución de su misión. El breve cuenta una reunión de OpenAI para todas las manos hacia fines de 2020 durante la cual el CEO de OpenAI, Sam Altman, supuestamente enfatizó que la gobernanza y la supervisión de las organizaciones sin fines de lucro fueron “primordiales” en “garantizar que la seguridad y los amplios beneficios sociales se priorizaran sobre las ganancias financieras a corto plazo”.

“Al reclutar conversaciones con candidatos, era común citar la estructura de gobernanza única de OpenAI como un factor de diferenciación crítico entre OpenAI y competidores como Google o Anthrope y una razón importante por la que deberían considerar unirse a la empresa”, se lee en el informe. “Esta misma razón también se usaba a menudo para persuadir a los empleados que estaban considerando irse para que los competidores se queden en OpenAI, incluidos algunos de nosotros”.

El breve advierte que, se debe permitir que se pueda convertir a una con fines de lucro, podría incentivarse a “[cut] esquinas “en el trabajo de seguridad y desarrollar una poderosa IA” concentrada entre sus accionistas “. Un OpenAI con fines de lucro tendría pocas razones para cumplir con la cláusula de “fusión y asistencia” en la carta actual de OpenAi, que promete que OpenAi dejará de competir y ayudará a cualquier proyecto de “valor alineado y consciente de la seguridad” que logra AGI antes de que lo haga, afirma el informe.

Los ex empleados de Openai, algunos de los cuales eran líderes de investigación y políticas de la compañía, se unen a una creciente cohorte que expresa una fuerte oposición a la transición de Openi.

A principios de esta semana, un grupo de organizaciones, incluidos organizaciones sin fines de lucro y grupos laborales como los Teamsters de California, solicitó al Fiscal General de California Rob Bonta que impida que Operai se convierta en un fin de lucro con fines de lucro. Afirmaron que la compañía “no ha podido proteger sus activos de caridad” y está “subvirtiendo activamente su misión caritativa para avanzar en la inteligencia artificial segura”.

ENCODE, una organización sin fines de lucro que copatrocinó la desafortunada legislación de seguridad SB 1047 AI SB 1047, citó preocupaciones similares en un informe Amicus presentado en diciembre.

Operai ha dicho que su conversión preservaría su brazo sin fines de lucro e infundiría con recursos que se gastarán en “iniciativas caritativas” en sectores como la atención médica, la educación y la ciencia. A cambio de su participación de control en la empresa de Operai, la organización sin fines de lucro supuestamente costaría miles de millones de dólares.

“En realidad, nos estamos preparando para construir la organización sin fines de lucro mejor equipada que el mundo haya visto, no la estamos convirtiendo”, escribió la compañía en una serie de publicaciones en X el miércoles.

Las apuestas son altas para OpenAI, que necesita completar su conversión con fines de lucro a fines de este año o al siguiente o arriesgar a renunciar a parte del capital que ha recaudado en los últimos meses, según los informes.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

Informe de chatgpt para marketing

Published

on

Continue Reading

Noticias

Operai supera a Deepseek en el razonamiento a nivel de oración

Published

on

Chatgpt y otros chatbots de IA basados ​​en modelos de idiomas grandes se sabe que ocasionalmente inventa cosas, incluidas las citas científicas y legales. Resulta que medir cuán precisas son las citas de un modelo AI es una buena manera de evaluar las habilidades de razonamiento del modelo.

Un modelo de IA “razones” descomponiendo una consulta en pasos y trabajando a través de ellos en orden. Piense en cómo aprendió a resolver problemas de palabras matemáticas en la escuela.

Idealmente, para generar citas, un modelo de IA comprendería los conceptos clave en un documento, generaría una lista clasificada de documentos relevantes para citar y proporcionaría un razonamiento convincente sobre cómo cada documento sugerido respalda el texto correspondiente. Destacará las conexiones específicas entre el texto y la investigación citada, aclarando por qué cada fuente importa.

La pregunta es, ¿se puede confiar en los modelos de hoy para hacer estas conexiones y proporcionar un razonamiento claro que justifique sus elecciones de origen? La respuesta va más allá de la precisión de las citas para abordar cuán útiles y precisos son los modelos de lenguaje grande para cualquier propósito de recuperación de información.

Soy un informático. Mis colegas, investigadores del Instituto AI de la Universidad de Carolina del Sur, la Universidad Estatal de Ohio y el Condado de Baltimore del Condado de Baltimore, y he desarrollado las razones de referencia para probar qué tan bien modelos de idiomas pueden generar automáticamente citas de investigación y proporcionar un razonamiento comprensible.

Utilizamos el punto de referencia para comparar el rendimiento de dos modelos de razonamiento de IA populares, Deepseek’s R1 y OpenAI’s O1. Aunque Deepseek fue en los titulares con su impresionante eficiencia y rentabilidad, el advenedizo chino tiene un camino por recorrer para que coincida con el rendimiento de razonamiento de OpenAI.

Oración específica

La precisión de las citas tiene mucho que ver con si el modelo AI está razonando sobre la información a nivel de oración en lugar del párrafo o a nivel de documentos. Se puede considerar que las citas a nivel de párrafo y a nivel de documentos arrojan una gran parte de la información a un modelo de idioma grande y le piden que proporcione muchas citas.

En este proceso, el modelo de lenguaje grande se generaliza e incorporan las oraciones individuales. El usuario termina con citas que explican todo el párrafo o documento, no la información de grano relativamente fino en la oración.

Además, el razonamiento sufre cuando le pide al modelo de idioma grande que lea un documento completo. Estos modelos se basan principalmente en memorizar patrones que típicamente son mejores para encontrar al principio y al final de los textos más largos que en el medio. Esto les dificulta comprender completamente toda la información importante a lo largo de un documento largo.

Los modelos de idiomas grandes se confunden porque los párrafos y documentos tienen mucha información, lo que afecta la generación de citas y el proceso de razonamiento. En consecuencia, el razonamiento de los modelos de idiomas grandes sobre los párrafos y los documentos se vuelve más como resumir o parafrasear.

Las razones por las que Benchmark aborde esta debilidad al examinar la generación y el razonamiento de las citas de los modelos de idiomas grandes.

https://www.youtube.com/watch?v=kqzzymhre0u

Cómo Deepseek R1 y OpenAI O1 se comparan generalmente con los problemas lógicos.

Prueba de citas y razonamiento

Tras el lanzamiento de Deepseek R1 en enero de 2025, queríamos examinar su precisión en la generación de citas y su calidad de razonamiento y compararlo con el modelo O1 de OpenAI. Creamos un párrafo que tenía oraciones de diferentes fuentes, dio a los modelos oraciones individuales de este párrafo y pedimos citas y razonamiento.

Para comenzar nuestra prueba, desarrollamos un pequeño lecho de prueba de aproximadamente 4,100 artículos de investigación alrededor de cuatro temas clave que están relacionados con el cerebro humano y la informática: neuronas y cognición, interacción humana-computadora, bases de datos e inteligencia artificial. Evaluamos los modelos utilizando dos medidas: la puntuación F-1, que mide cuán precisa es la cita proporcionada, y la tasa de alucinación, que mide cuán sonido es el razonamiento del modelo, es decir, con qué frecuencia produce una respuesta inexacta o engañosa.

Nuestras pruebas revelaron diferencias de rendimiento significativas entre OpenAI O1 y Deepseek R1 en diferentes dominios científicos. El O1 de OpenAI conectó bien la información entre los diferentes sujetos, como comprender cómo la investigación sobre neuronas y cognición se conecta con la interacción humana y la computadora y luego con los conceptos en inteligencia artificial, sin dejar de ser precisa. Sus métricas de rendimiento superaron constantemente a Deepseek R1 en todas las categorías de evaluación, especialmente para reducir las alucinaciones y completar con éxito las tareas asignadas.

Operai O1 fue mejor para combinar ideas semánticamente, mientras que R1 se centró en asegurarse de que generara una respuesta para cada tarea de atribución, lo que a su vez aumentó la alucinación durante el razonamiento. Openai O1 tenía una tasa de alucinación de aproximadamente 35% en comparación con la tasa de Deepseek R1 de casi el 85% en la tarea de razonamiento basada en la atribución.

En términos de precisión y competencia lingüística, Openai O1 obtuvo alrededor de 0.65 en la prueba F-1, lo que significa que era correcto aproximadamente el 65% del tiempo al responder preguntas. También obtuvo alrededor de 0.70 en la prueba BLEU, que mide qué tan bien un modelo de lenguaje escribe en lenguaje natural. Estos son puntajes bastante buenos.

Deepseek R1 obtuvo un puntaje más bajo, con aproximadamente 0.35 en la prueba F-1, lo que significa que era correcto aproximadamente el 35% del tiempo. Sin embargo, su puntaje Bleu fue solo alrededor de 0.2, lo que significa que su escritura no era tan natural como la O1 de OpenAI. Esto muestra que O1 fue mejor al presentar esa información en un lenguaje claro y natural.

OpenAi tiene la ventaja

En otros puntos de referencia, Deepseek R1 se desempeña a la par con OpenAi O1 en tareas de matemáticas, codificación y razonamiento científico. Pero la diferencia sustancial en nuestro punto de referencia sugiere que O1 proporciona información más confiable, mientras que R1 lucha con la consistencia objetiva.

Aunque incluimos otros modelos en nuestras pruebas integrales, la brecha de rendimiento entre O1 y R1 resalta específicamente el panorama competitivo actual en el desarrollo de IA, con la oferta de OpenAI que mantiene una ventaja significativa en las capacidades de razonamiento e integración del conocimiento.

Estos resultados sugieren que OpenAi todavía tiene una ventaja cuando se trata de atribución y razonamiento de origen, posiblemente debido a la naturaleza y el volumen de los datos en los que fue entrenado. La compañía anunció recientemente su herramienta de investigación profunda, que puede crear informes con citas, hacer preguntas de seguimiento y proporcionar razonamiento para la respuesta generada.

El jurado todavía está en el valor de la herramienta para los investigadores, pero la advertencia permanece para todos: verifique todas las citas que le brinda una IA.

Continue Reading

Noticias

Me mudé y Géminis me ayudó de más formas que puedas imaginar

Published

on

Ryan Haines / Android Authority

Estoy en el proceso de mudarme a mi nuevo apartamento y, sinceramente, toda la experiencia ha sido estresante, por decir lo menos. Entre tratar de descifrar todo el papeleo legal vinculado a mi compra de bienes raíces y descubrir cómo decorar el espacio para que no se sienta apretado o pegajoso, ha habido muchos desafíos que superar.

Afortunadamente, no estaba solo en esto. Tuve la ayuda de mi buen amigo, AI. Me encontré inclinado fuertemente en Géminis para la gran mayoría de los problemas que me encontré, aunque cambié a Notebooklm para una tarea específica y muy importante.

Simplificando la jerga legal

Manual de autos de cuaderno

Andy Walker / Android Authority

El papeleo involucrado con mi compra de bienes raíces fue desalentador: más de cien páginas, gran parte llena de jerga legal densa que era increíblemente difícil de entender. Aquí es donde AI realmente me ayudó.

Para la mayoría de mis preguntas relacionadas con el documento, recurrí a Géminis. Podría cargar los archivos y hacer preguntas específicas sobre cláusulas o términos que me confundieron. Por ejemplo, la política de garantía no estaba claramente explicada; Acaba de hacer referencia a leyes específicas. Géminis fue un salvavidas aquí. Con una consulta rápida, explicó las leyes relevantes y respondió pacientemente todas mis preguntas de seguimiento, aclarando exactamente lo que estaba cubierto y por cuánto tiempo.

Sin embargo, para las inmersiones profundas en todo el conjunto de documentos, cambié a Notebooklm. Su capacidad para trabajar dentro de un conjunto definido de fuentes lo hizo perfecto para esto. Creé un cuaderno dedicado que contiene todos los documentos relacionados con mi compra. Cada vez que una pregunta aparecía en mi cabeza, ya sea legal o simplemente práctica, Notebooklm podría escanear mis documentos y proporcionar la respuesta en segundos. Esto me ahorró una increíble cantidad de tiempo; De lo contrario, fácilmente habría pasado media hora o más cavando a través de esas más de 100 páginas tratando de encontrar una sola información. La tranquilidad de saber que podría verificar rápidamente los detalles fue invaluable.

Abordar el diseño de interiores con Géminis

Géminis también fue de gran ayuda con el diseño interior. Si alguna vez has intentado decorar una casa desde cero sin mucha experiencia, sabes lo complicado que es. Es sorprendentemente fácil terminar con un espacio que se siente frío y estéril o simplemente pegajoso.

Géminis actuó como mi consultor de diseño personal. Ofrecía consejos sobre todo, desde esquemas de color que funcionarían bien en mis condiciones de iluminación específicas hasta mantener el equilibrio visual y las proporciones entre los muebles adyacentes, como garantizar que un gran armario no haya dominado por completo la cómoda de los cajones al lado.

Géminis fue mi consultor de diseño personal.

También ayudó con una planificación espacial práctica, sugiriendo cosas como la distancia mínima cómoda necesaria entre el mostrador de la cocina y la mesa del comedor en mi espacio relativamente estrecho, y asesorando en las dimensiones correctas de la alfombra para anclar la sala de estar sin abrumarla. Utilicé una herramienta 3D Home Design Planner para visualizar estas recomendaciones, y tengo que decir que el diseño realmente se unió maravillosamente gracias a la entrada de Gemini.

Consejos iluminadores sobre iluminación

Aidot Linkind Bulb de luz inteligente A19 RGBTW Luces y caja 2

Edgar Cervantes / Android Authority

Luego hay iluminación, otro tema sorprendentemente complejo si no está familiarizado con los tecnicismos. Tuve que descubrir y comprender la diferencia entre lúmenes (brillo) y los celví (temperatura de color), y lo que podría funcionar para mí. Planificación de la iluminación perfecta en un apartamento completo, especialmente teniendo en cuenta las diferentes necesidades (luz más brillante y más blanca en la cocina para la visibilidad frente a la luz más cálida, más suave en el dormitorio para relajarse), se sintió abrumadora.

Géminis entró aquí también. Calculó fácilmente cuántas lúmenes probablemente necesitaría para áreas específicas en función de su tamaño y función, sugirió niveles de brillo apropiados (rangos de kelvin) para diferentes habitaciones y más. Incluso me ayudó a comprender los entresijos del sistema de iluminación del hogar inteligente IKEA que estaba considerando, explicando cómo funciona, dando una idea de los costos involucrados e incluso estimando el impacto potencial en mi factura de electricidad.

Antes de tener un asistente de IA como Gemini, habría pasado horas buscando en Google, dando docenas de artículos y publicaciones de foro, y probablemente aún terminaba con preguntas sin respuesta o consejos contradictorios.

Resolver problemas inesperados

Mudarse a un nuevo lugar rara vez va perfectamente suavemente. Me encontré con problemas inesperados, como manchas obstinadas en el piso del baño que realmente no deberían haber estado allí. Gemini me ayudó a hacer una lluvia de ideas sobre el tipo de mancha más probable en función de su apariencia y ubicación, y luego sugirió una gama de métodos de limpieza para probar, desde opciones suaves hasta soluciones más fuertes.

Desafortunadamente, varios defectos menores también formaron parte de mi “nueva” experiencia inmobiliaria, y hacer que Gemini proporcione resúmenes rápidos de mis derechos basados ​​en los documentos legales (como las cláusulas de garantía) fue increíblemente útil al comunicarse con el desarrollador.

Dando un paso más allá: Análisis de plano de planta

Moto G Power 2025 Imagen de revisión que muestra el cuadro de inmediato de Ask Gemini

Rushil Agrawal / Android Authority

Sintiéndome ambicioso, tomé las cosas un poco al proporcionar a Géminis el plano de planta real de mi apartamento y solicitando consejos de posicionamiento de muebles. Estaba realmente impresionado con las sugerencias.

La IA recomendó ideas prácticas como “Zoning” mi sala de estar. Dado que es parte de un área de planta abierta que combina la vida, la comida y la cocina, Géminis sugirió usar la disposición de muebles y posiblemente una alfombra para separar visualmente el espacio vital y hacer que se sienta más distinta. Dado que mi área de vida principal es larga y relativamente estrecha, también sugirió inteligentemente el uso de espejos para crear una ilusión de amplitud y optar por muebles de color más ligero para mejorar esa sensación de aire.

Algunos de estos consejos que podría haber encontrado eventualmente, pero Gemini definitivamente provocó ideas que no había considerado y ayudó a confirmar algunos de mis propios instintos.

Lo que deseo que Géminis pueda hacer a continuación

Aplicación Géminis iOS

Robert Triggs / Android Authority

Si bien aprecié la ayuda de Gemini durante todo este proceso, la experiencia también destacó las áreas donde deseé que AI pudiera hacer aún más.

La función de sueño? Subir mi plano de planta y hacer que Gemini genere un modelo 3D interactivo del apartamento. Imagine una IA que luego podría sugerir automáticamente esquemas de decoración basados ​​en preferencias personales (estilo, color, presupuesto) y le permita modificar todo a los detalles más pequeños dentro de ese espacio virtual. Terminé usando Homestyler para crear mi modelo 3D y planificar el diseño, lo cual fue divertido pero definitivamente un proceso que requiere mucho tiempo. Si Gemini tuviera esta capacidad incorporada, me habría ahorrado horas e hizo que el proceso de visualización fuera sin problemas.

Todavía se parece un poco a la ciencia ficción, pero realmente creo que llegaremos a ese punto más temprano que tarde. ¿Una IA que no solo puede aconsejar sino también visualizar e implementar ideas de diseño en un espacio virtual? Ese será un cambio de juego para cualquiera que cree un nuevo hogar.

Continue Reading

Trending