Una importante demanda por derechos de autor contra Meta ha revelado un tesoro de comunicaciones internas sobre los planes de la compañía para desarrollar sus modelos de IA de código abierto, Llama, que incluyen discusiones sobre cómo evitar “la cobertura de los medios que sugiera que hemos utilizado un conjunto de datos que sabemos que es pirateado”.
Noticias
OpenAI y The New York Times debaten la infracción de derechos de autor de las empresas de tecnología de IA en los argumentos del primer juicio
El juicio por infracción de derechos de autor entre The New York Times y OpenAI comenzó en una audiencia en un tribunal federal el martes.
Un juez escuchó los argumentos de ambas partes en una moción de desestimación presentada por OpenAI y su patrocinador financiero Microsoft. El New York Times, así como The New York Daily News y el Center for Investigative Reporting, que han presentado sus propias demandas contra OpenAI y Microsoft, afirman que OpenAI y Microsoft utilizaron el contenido de los editores para entrenar sus grandes modelos de lenguaje que impulsaban su IA generativa. chatbots. Hacerlo significa que las empresas de tecnología están compitiendo con esos editores utilizando su contenido responde a las preguntas de los usuarios, eliminando el incentivo para que un usuario visite sus sitios en busca de esa información y, en última instancia, perjudicando su capacidad de monetizar a esos usuarios a través de publicidad digital y suscripciones, afirman.
OpenAI y Microsoft dicen que lo que están haciendo está cubierto por el “uso justo”, una ley que permite el uso de material protegido por derechos de autor para crear algo nuevo que no compita con el trabajo original.
El resultado de esta demanda tiene grandes implicaciones para todo el ecosistema de medios digitales y determinará la legalidad de las herramientas de inteligencia artificial generativa que utilizan el trabajo protegido por derechos de autor del editor sin su consentimiento para la capacitación.
Estos fueron los principales argumentos durante el juicio:
El argumento del New York Times
Usar contenido protegido por derechos de autor
OpenAI está utilizando el contenido del New York Times para entrenar sus grandes modelos de lenguaje, a veces haciendo copias de ese contenido, afirman los demandantes. A veces, se devuelven varios párrafos o artículos completos que forman parte de ese conjunto de datos de entrenamiento en respuesta a la solicitud de un usuario. Y en algunos casos, el LLM también regurgita contenido nuevo que el LLM no usó para su capacitación (debido a una fecha límite) en respuesta a una solicitud. Los demandantes dieron ejemplos de resultados que contienen lenguaje literal o resúmenes de artículos sin atribución del New York Times.
Los LLM copian contenido porque no pueden procesar información como los humanos
Los humanos pueden leer algo, comprender la información subyacente y aprender algo nuevo, lo que no se considera copiar información. Pero los LLM no tienen la capacidad de hacer eso porque son máquinas, lo que significa que los modelos absorben la “expresión” de los hechos, no los hechos en sí, lo que debería considerarse una infracción de derechos de autor, según los abogados del New York Times.
La búsqueda generativa con IA es diferente de un motor de búsqueda tradicional
A diferencia de un motor de búsqueda tradicional (donde se proporcionan enlaces a la fuente original y un editor puede monetizar ese tráfico a través de publicidad o suscripciones), un motor de búsqueda generativo proporciona la respuesta a una pregunta con fuentes en las notas a pie de página. Las notas a pie de página, argumentan los abogados del New York Times, pueden contener una variedad de fuentes, lo que perjudica la capacidad del editor para llevar a ese usuario a su sitio.
Evadiendo los muros de pago
OpenAI tiene GPT personalizados en su tienda con productos que ayudan a los usuarios a eliminar los muros de pago. “Los usuarios publicaban en foros de Reddit y en las redes sociales cómo habían sorteado un muro de pago utilizando un producto llamado SearchGPT y, de hecho, OpenAI retiró el producto después de darse cuenta de que se estaban utilizando productos para infringir la ley”, dijo Ian Crosby, socio de Susman Godfrey y el abogado principal del New York Times.
El contenido urgente se elimina sin atribución
Los abogados del New York Times dijeron que se estaba utilizando contenido del sitio de recomendación de productos Wirecutter del Times sin la atribución adecuada, lo que significa que Wirecutter perdió ingresos debido a que las personas no hicieron clic en el sitio y en los enlaces de afiliados. Y ese contenido eliminado a veces era urgente, como las recomendaciones de productos durante el Black Friday. Afirman que el contenido debería estar protegido por una doctrina de “noticias candentes”, parte de la ley de derechos de autor que protege las noticias urgentes del uso de los competidores. Los abogados argumentaron que ChatGPT citó algunos productos como respaldados por Wirecutter cuando no lo estaban, lo que daña la reputación de la marca.
OpenAI y los argumentos de Microsoft
Doctrina de uso legítimo
Los abogados de OpenAI y Microsoft dijeron que los materiales protegidos por derechos de autor en cuestión están permitidos según la doctrina del uso justo. Las empresas de inteligencia artificial han sido firmes defensoras de la doctrina, que permite el uso de materiales protegidos por derechos de autor sin permiso siempre que el uso sea diferente de su propósito principal, se use en contextos no comerciales y no se use de una manera que pueda dañar a quien posee los derechos de autor. .
Annette Hurst, abogada que representa a Microsoft, dijo que los LLM entienden el lenguaje y las ideas que pueden adaptarse para “todo, desde curar el cáncer hasta la seguridad nacional: “Los demandantes, en sus propias palabras, han alegado que esta tecnología es capaz de comercializarse por una suma de miles de millones. de dólares sin tener en cuenta ninguna capacidad de cómo”.
Cómo funcionan los LLM
Los abogados defensores tampoco estuvieron de acuerdo con sus homólogos demandantes a la hora de describir cómo funcionan los modelos de lenguaje grandes. Por ejemplo, el abogado de OpenAI dijo que los LLM de la compañía en realidad no almacenan contenido protegido por derechos de autor, sino que simplemente dependen del peso de los datos derivados del proceso de capacitación.
“Si os digo: ‘Ayer todos mis problemas me parecían así’, todos pensaremos para nosotros mismos [think] “lejos” porque hemos estado expuestos a ese texto muchas veces”, dijo Joe Gratz, abogado de Morrison & Foerster que representó a OpenAI. “Eso no significa que tengas una copia de esa canción en algún lugar de tu cerebro”.
Estatuto de limitaciones
Los abogados afirmaron que la demanda no debería permitirse debido al plazo de prescripción de tres años para los casos de infracción de derechos de autor. Sin embargo, los abogados del Times señalan que en abril de 2021 no era posible saber si OpenAI utilizaría el contenido de los editores de forma que pudiera dañarlo.
Ejemplos ‘engañosos’
Los abogados del Times dicen que han encontrado millones de ejemplos para fundamentar su caso. Sin embargo, OpenAI argumentó que los demandantes han sido engañosos con ejemplos de cómo ChatGPT replica contenido protegido por derechos de autor y con ejemplos de cómo el contenido generado por IA cita al Times en respuestas inexactas. Los abogados defensores también afirman que el Times explotó aspectos de ChatGPT que ayudaron a utilizar indicaciones para generar contenido de IA que violaba los términos de OpenAI. (Los abogados también señalaron que OpenAI ha tratado de abordar las debilidades).
No hay pruebas de daño
Las afirmaciones del Times incluyen que OpenAI elimine la información de gestión de derechos de autor (CMI), como cabeceras, firmas de autores y otra información identificable. Sin embargo, OpenAI y Microsoft dicen que los demandantes no han demostrado cómo se vieron perjudicados al eliminar CMI. También afirman que los demandantes no han demostrado que OpenAI y Microsoft hayan infringido voluntariamente obras protegidas por derechos de autor. Sin embargo, los abogados demandantes dijeron que fallos judiciales anteriores han reconocido que copiar contenido protegido por derechos de autor era una infracción en sí misma sin necesidad de probar la difusión o la pérdida económica.
“Su mayor problema es que no tienen una historia plausible de cómo estarían mejor si el CMI que dicen que fue eliminado, en realidad lo fuera”, dijo Gratz. “… No hay manera en la que el mundo sería mejor para ellos en la forma en que dicen que el mundo no es bueno para ellos si el CMI que dicen que fue eliminado nunca fue eliminado”.
¿Qué viene después?
La demanda del Times es sólo una de las muchas demandas que enfrenta OpenAI. Si bien OpenAI ganó un caso en noviembre, otras demandas en curso incluyen quejas de un grupo de editores de noticias canadienses, un grupo de periódicos estadounidenses propiedad de Alden Capital y una demanda colectiva presentada por un grupo de autores. (OpenAI, Perplexity y Microsoft se involucraron en la demanda antimonopolio de búsqueda en curso de Google después de que Google envió citaciones a las tres empresas).
Otros gigantes y nuevas empresas tecnológicas importantes tienen sus propias batallas legales relacionadas con la inteligencia artificial y los derechos de autor. Meta se enfrenta a una demanda colectiva presentada por un grupo de escritores, entre ellos Sarah Silverman. Perplexity es uno de los acusados en una demanda presentada en octubre por News Corp. Google se enfrenta a una demanda presentada en su contra por el Authors Guild.
No está claro cuándo el juez estadounidense Sidney Stein emitirá su decisión sobre si se debe permitir que el caso avance. Megan Gray, abogada y fundadora de GrayMatters Law & Policy, asistió a la audiencia en persona y señaló que Stein parecía estar “en esto por mucho tiempo” y era poco probable que lo descartara tan pronto.
“El juez Stein estaba comprometido y curioso, algo notable dada su edad y su falta de sofisticación técnica”, dijo Gray. “Él entendió los casos y las posiciones, además tiene control estricto sobre su sala del tribunal. Normalmente no proporciona una línea de audio para el público y el hecho de que lo haya hecho aquí indica que está muy familiarizado con la importancia del caso y su impacto en la sociedad”.
Noticias
OpenAI Statistics 2025 By Features, Revenue And Demographics
Introduction
OpenAI Statistics: OpenAI is a leading company in artificial intelligence (AI) research and development. The main goal is to create AI tools that help people solve real-world problems. OpenAI is known for its advanced technologies, such as language models that can write, explain, and create content.
These tools are used in many industries like healthcare, education, and business. OpenAI also shares research and encourages the safe use of AI worldwide. Recent data and statistics show how OpenAI’s systems perform, improve, and benefit users. This helps build trust and transparency. The company continues to grow, improving its technology and providing insights into how AI can make a positive impact on society.
Editor’s Choice
- In October 2024, following a USD 6.6 billion funding round, OpenAI’s valuation nearly doubled to USD 157 billion.
- OpenAI Statistics show that the company projected UISD’s revenues to be USD 3.7 billion in 2024 and anticipates they will reach USD 11.6 billion in 2025.
- OpenAI’s workforce grew from 335 employees in 2022 to approximately 624 in 2024.
- ChatGPT, OpenAI’s popular AI chatbot, reached 250 million weekly active users by October 2024.
- Since its inception, OpenAI has raised over USD 16 billion in funding, with significant contributions from investors like Microsoft and Thrive Capital.
- Despite substantial revenue, OpenAI faced projected losses of USD 5 billion in 2024.
- OpenAI Statistics further elaborated that in December 2024, OpenAI introduced the o3 model, designed to enhance reasoning capabilities in AI applications.
- OpenAI’s valuation places it among the top privately held companies globally, surpassing 87% of S and P 500 companies as of October 2024.
- The company has established key partnerships with tech giants like Microsoft and Nvidia.
General OpenAI Statistics
- In 2024, OpenAI’s USD 100 billion valuation will make it about 4% of the USD 500 billion AI industry.
- OpenaAI Statistics reveal over 209 educational institutions use OpenAI’s tools.
- More than 3 million developers use DALL-E to train algorithms.
- Large companies with 10,000+ employees are OpenAI’s main users.
- In May 2024, OpenAI released GPT-4o, a model capable of analysing and generating text, images, and sound, enhancing its AI capabilities.
- The platform operates in 156 countries, offering features like recipe creation from ingredients.
- However, OpenAI is unavailable in 40 countries, including China, Russia, Ukraine, and Iran.
- User demographics show 69.59% male and 30.41% female visitors to openai.com.
- In the 2023 Hurun Global Unicorn Index, OpenAI ranked 17th out of 100.
- OpenAI Codex supports over 12 programming languages.
Features of OpenAI
- GPT-4o: A multimodal AI model capable of processing and generating text, images, and audio, enhancing human-like interactions.
- DALL·E 3: An AI system that creates detailed images from textual descriptions, enabling users to generate intricate visuals based on prompts.
- Whisper: A general-purpose speech recognition model trained on diverse audio data, capable of multilingual speech recognition, translation, and language identification.
- CLIP: A model trained to understand the relationship between text and images, facilitating tasks such as image classification and enhancing the accuracy of AI-generated content.
- ChatGPT: An AI chatbot provides conversational interfaces, allowing users to engage in natural language dialogues for various applications, including customer support and information retrieval.
- OpenAI API: A versatile API that grants developers access to OpenAI’s AI models, enabling the integration of advanced language understanding and generation capabilities into applications.
OpenAI Revenue and Financial Analyses
(Source: googleusercontent.com)
- OpenAI is expected to make about USD 3.4 billion in revenue by the end of 2024.
- In 2024, OpenAI’s USD 100 billion valuation will make it 4% of the USD 500 billion AI industry.
- In late 2024, Thrive Capital led funding raised OpenAI’s valuation to USD 157 billion.
- In 2019, Microsoft invested USD 1 billion in OpenAI, followed by another USD 10 billion in 2023.
- OpenaAI Statistics In 2024, OpenAI made most of its money from partnerships and investments, with a smaller share coming from ChatGPT+ subscriptions (USD 20/month).
- OpenAI aims for a USD 180 billion valuation, which would make it one of the most valuable companies in the United States.
OpenaAI Business Revenue Statistics
- OpenAI statistics show that by the end of 2024, 282 companies will be the biggest users of OpenAI, earning over USD 1 billion annually.
- Medium-sized companies with USD 1 to 10 million in revenue come next.
- Smaller businesses, around 56 with less than USD 1 million in revenue, have also started using OpenAI.
Funding of Machine Learning Operations/Platform Startups Statistics
(Reference: statista.com)
- OpenAI, which created DALL-E and ChatGPT in 2022, received the most funding among machine learning platforms in 2024.
- OpenAI Statistics state that OpenAI secured USD 11,300.1 million, far surpassing its closest competitor, Scale AI, which raised just over USD 602.6 million.
- Furthermore, other funding sources for ML operations or startups were Adept (USD 415 million), Cohere.ai (USD 414.9 million), Anyscale (USD 259 million), Inflection AI (USD 225 million), Weights & Biases (USD 200 million), Hugging Face (USD 160.2 million), OctoML (USD 131.9 million), and AI21 Labs (USD 118.5 million).
OpenAI Adoption Statistics in Finance Business
(Reference: statista.com)
- Companies in finance are expected to adopt AI more widely from 2022 to 2025.
- It is estimated that by the end of 2025, piloting use cases will account for 10% of the market, followed by limited adoption (22%) and widescale adoption (21%).
- Similarly, 43% of financial businesses claimed AI is very critical, but 3% will still not use it.
OpenAI Employee Statistics
- In 2022, OpenAI had 335 employees, but this grew by about 1000%.
- OpenaAI Statistics also show that in 2024, OpenAI had 3,400 employees.
- It started as a non-profit with only 624 workers, but as the company grew, it hired more people for different roles.
- Over 475 engineers work in the AI department, driving innovation and development.
- On average, OpenAI employees earn USD 925,000 per year.
OpenAI User Statistics
- In July 2024, OpenAI.com attracted an incredible 1.7 billion visitors, highlighting its massive popularity.
- In 2024, “ChatGPT” became the most searched keyword on openai.com, with 32.5 million searches.
(Reference: googleusercontent.com)
- OpenaAI Statistics depicts that every day, users worldwide create more than 1.5 million images using DALL.E 2’s powerful tool.
- Others are followed by Midjourney (1.4 million), Stable Diffusion (1.2 million), Craiyon (0.5 million) and Wombo Dream (0.3 million).
OpenAI Usage Statistics
- According to OpenAI statistics, in 2024, OpenAI products were available in 156 countries, but over 40 countries and territories still couldn’t access them.
- Some of these countries included China, Russia, Belarus, Afghanistan, Venezuela, Iran, Ukraine, and North Korea.
- The top five users of OpenAI products were the United States, India, France, Spain, and the United Kingdom.
- Together, these five nations made up 39.96% of all visits to OpenAI’s website.
- The other 151 countries with access contributed the remaining 60.04% of visits.
Furthermore, the table below shows that OpenAI Products Widely used in the U.S. are detailed in the table below:
Country | A number of companies used OpenAI |
California |
167 |
New York |
54 |
Texas |
27 |
Illinois |
22 |
Virginia |
20 |
Georgia |
6 |
Missouri |
5 |
South Carolina |
4 |
By Industry, 2024
Number of businesses/ organizations/ institutions that used OpenAI
Sectors | |
Education sector |
209 |
General business services |
98 |
Manufacturing |
89 |
Finance |
44 |
Retail |
345 |
Healthcare |
24 |
Various governments |
18 |
Media and internet |
17 |
Construction |
15 |
Various types of organizations |
14 |
Telecommunication |
13 |
Transportation, Entertainment, and consumer services |
10 |
Real estate, insurance, hospitality, and energy utilities and waste management |
9 |
Wholesale |
6 |
Law firms and legal services, cultural and agriculture |
1 |
OpenAI Website Traffic Statistics
(Source: similarweb.com)
- As of December 2024, the total number of website visits to openai.com had reached 556.2 million, up by 1.76% from last month and securing a 56.73% bounce rate.
- OpenAI Statistics further report that the website’s global rank at the same time is #88, followed by the U.S. rank (#129) and category rank (#6).
By Country
(Reference: similarweb.com)
- OpenAI Statistics in 2024 show that the United States had 19.57% of the website’s total traffic, up by 3.66% from 2023.
- As of December 2024, other country’s traffic contributions are: India: 10.36% (+3.21%), Brazil: 4.87% (-18.09%), United Kingdom: 3.82% (-0.41%) and Canada: 3.31% (-8.43%)
- Other countries jointly made up around 58.08% of visitors shared on openai.com.
By Demographics
(Reference: similarweb.com)
- As of December 2024, the share of male and female openai.com users was 55.53% and 44.47%, respectively.
- Similarly, OpenAI Statistics by age group represents the highest number of website users between 25 and 34 years old, with a share of 30.49%.
- Around 24.66% of OpenAI website users are aged 18 to 24 years.
- In contrast, 19.15% and 12.81% belong to individuals aged 35 to 44 and 45 to 54, respectively.
- Besides, 7.87% of website users are between 55 and 64 years old.
- 65+ users contributed a share of 5.02% on openai.com
By Traffic Source
(Reference: similarweb.com)
- Direct search generated the highest traffic to openai.com, accounting for 55.44% of the website share.
- Almost 33.65% of the share comprises organic searches, while 10.44% is from referrals.
- OpenAI Statistics also show that others are followed by paid search (0.01%), social (0.30%), mail (0.04%) and display (0.03%).
By Social Media Statistics
(Reference: similarweb.com)
- OpenAI Statistics elaborates that YouTube had the highest social media referral rate, with a 35.4% share, compared to Twitter’s 23.75% share.
- Reddit, WhatsApp and Facebook each contributed a website share of 11.15%, 8.37% and 6.6%, respectively, on openai.com.
- Similarly, in December 2024, other social media segments collectively accounted for 14.73% of the OpenAI website.
OpenAI’s Fastest-growing Platform Statistics
Platforms | Duration to gain 1 million users |
Netflix |
41 months |
|
29 months |
24 months |
|
|
10 months |
Spotify |
5 months |
OpenaAI Present Partnerships
- In 2024, OpenAI made several big announcements and faced notable events.
- On January 18, it partnered with Arizona State University, granting the university full access to ChatGPT Enterprise.
- In February, the U.S. Securities and Exchange Commission began investigating OpenAI over potential investor miscommunication by CEO Sam Altman.
- On February 15, OpenAI introduced “Sora,” a text-to-video model, with a public release date yet to be decided.
- In response, OpenAI stated on March 11 that they were thriving without Musk, who left in 2018.
- There were leadership changes in May. Chief Scientist Ilya Sutskever stepped down on May 15 and was replaced by Jakub Pachocki.
- Shortly after, on May 19, OpenAI teamed up with Reddit to integrate its content into ChatGPT.
- A month later, at WWDC 2024, OpenAI partnered with Apple to bring ChatGPT features to Apple Intelligence and iPhones.
- On June 24, OpenAI acquired Multi, a startup focused on collaboration tools.
- In July, reports surfaced about OpenAI’s secret project, Strawberry, which aims to improve AI reasoning.
- On August 5, cofounder John Schulman left to join Anthropic, a rival AI company. By September 25, CTO Mira Murati also departed to explore new opportunities.
- In October, OpenAI secured USD 6.6 billion in funding, raising its valuation to USD 157 billion.
- In November, it acquired Chat.com and redirects it to ChatGPT’s site. Finally, in December, OpenAI launched several new features as part of its “12 Days of OpenAI” event, marking the end of the year with innovation.
Sustainable Initiatives of OpenAI Statistics
- OpenAI has implemented advanced cooling and power management technologies, reducing energy consumption by 25%.
- The organization invests in reforestation and renewable energy projects, offsetting 40% of its carbon emissions.
- OpenAI sources 70% of its energy from renewable sources, including solar (40%) and wind (30%).
- By prioritizing eco-friendly suppliers and monitoring sustainability metrics, it also aims to reduce carbon emissions by 30% by 2025.
- OpenAI leverages AI to track environmental parameters, aiding in climate change mitigation and conservation efforts.
- They also engage with communities to ensure their technologies positively impact society, focusing on transparency and ethical AI development.
Conclusion
OpenAI is transforming how we interact with technology by developing advanced AI systems. These tools can solve problems, improve learning, and make daily tasks easier. However, responsible use is essential to ensure AI benefits everyone.
OpenAI focuses on safety, transparency, and fairness while advancing its technology. As AI continues to grow, businesses, governments, and individuals need to work together. With careful guidance, AI can create a future that supports innovation and improves lives worldwide.
How does OpenAI make money?
OpenAI makes money by offering paid services like ChatGPT, APIs, and partnerships with companies.
What are the uses of OpenAI’s technology?
OpenAI’s technology helps with tasks like writing, translating, customer support, coding, and creating images.
OpenAI works hard to make its tools safe by using protections and guidelines, but users should still be responsible.
How much does OpenAI cost?
OpenAI offers both free and paid plans. The free plan has limited features, while the paid plan provides more access.
What are the ethical concerns surrounding OpenAI?
The main ethical concerns with OpenAI include fairness, preventing bias, avoiding harmful content, and ensuring AI doesn’t mislead or harm people.
Barry Elad
Barry Elad is a tech enthusiast passionate about exploring various technology topics. He collects key statistics and facts to make tech easier to understand. Barry focuses on software and its benefits for everyday life. In his free time, he enjoys creating healthy recipes, practicing yoga, meditating, and walking in nature with his child. Barry’s mission is to simplify complex tech information for everyone.
More Posts By Barry Elad
Noticias
Por qué la gente culpa a ChatGPT por los infiernos – Firstpost
La ciudad de Los Ángeles se ha enfrentado a una serie de devastadores incendios forestales que han provocado la pérdida de 25 vidas, la destrucción de más de 12.000 estructuras y la evacuación de casi 100.000 residentes de sus hogares.
Con más de 17,200 acres, los incendios han desplazado a decenas de miles y provocado intensos debates sobre políticas climáticas y gestión del agua, cambiando las conversaciones sobre las prioridades ambientales y de infraestructura de California.
LEA TAMBIÉN | Incendios forestales en California: ¿los millonarios de Los Ángeles pagan 1,7 lakh de rupias por hora a los bomberos privados?
¿Por qué se vincula ChatGPT a las discusiones sobre los incendios forestales?
Quizás sientas curiosidad por saber cómo ChatGPT se encuentra en el centro de este debate. Vamos a desglosarlo:
Por qué se culpa a ChatGPT de los incendios forestales de Los Ángeles
¿Sabías que las actividades en línea, incluidos los modelos de inteligencia artificial como ChatGPT, consumen cantidades significativas de energía que proviene principalmente de combustibles fósiles? Un informe de Goldman Sachs reveló que una sola consulta ChatGPT utiliza 2,9 vatios-hora de electricidad en comparación con los 0,3 vatios-hora de una búsqueda en Google.
HECHO: cada vez que solicitas chatgpt, se inicia otro incendio forestal en California
-gdl (@gdelujo) 10 de enero de 2025
Esto contribuye a la enorme huella de carbono de los sistemas de IA, que, según Mashableconduce al cambio climático. Las condiciones más secas y el aumento de las temperaturas provocado por el cambio climático crean un entorno que conduce a incendios forestales, especialmente cuando hay fuertes vientos.
Dado que Los Ángeles está en llamas y parte del sur está congelada, creo que es un buen momento para recordarles a todos o contarles por primera vez que ChatGPT y otras formas de IA están contribuyendo al rápido calentamiento de nuestro planeta.
— Todo está conectado. (@clarichawrites) 8 de enero de 2025
Shaolei Ren, profesor asociado de UC Riverside, descubrió que escribir un correo electrónico con ChatGPT consume 17 onzas de agua. Cuando se multiplican los usos frecuentes y diversos de los chatbots de IA, el impacto se vuelve mucho mayor.
LEA TAMBIÉN | ¿Fue un incendio provocado o Sean Diddy Combs? Las teorías de la conspiración se extienden como los incendios forestales de Los Ángeles
En 2023, Microsoft informó un aumento del 29 % en las emisiones y un 23 % más en el uso de agua debido a “nuevas tecnologías, incluida la IA generativa”, mientras que Google reveló un aumento del 48 % en las emisiones en cinco años, en gran parte debido a los centros de datos impulsados por IA. de acuerdo a Revista PC.
Ren afirmó que “la mayor parte del crecimiento se debe a la IA”, incluidas las inversiones en IA generativa y asociaciones OpenAI. Estima que una sesión de ChatGPT que involucra de 5 a 50 mensajes utiliza aproximadamente 500 mililitros de agua, dependiendo de la ubicación del servidor y la temporada. Esto incluye el uso de agua no medido para enfriar plantas de energía que suministran electricidad a los centros de datos.
¿Cómo utiliza ChatGPT el ‘agua’?
Construir un modelo de lenguaje grande como ChatGPT implica analizar patrones en cantidades masivas de texto escrito por humanos. Este proceso requiere una enorme potencia informática, que genera un calor extremo. Para evitar el sobrecalentamiento, los centros de datos dependen de sistemas de refrigeración, que a menudo utilizan agua bombeada a torres de refrigeración fuera de sus instalaciones del tamaño de un almacén, según un estudio. Prensa asociada informe.
Microsoft dijo AP que está invirtiendo en investigación para medir la huella energética y de carbono de la IA mientras explora formas de hacer que los sistemas grandes sean más eficientes tanto durante el entrenamiento como durante la aplicación.
HP Newquist, un historiador de la inteligencia artificial, explicó a HuffPost que las computadoras y los chipsets densamente empaquetados en los servidores generan un calor inmenso. “Ejecutar aplicaciones complejas de IA como ChatGPT requiere inmensas cantidades de potencia informática, lo que genera mucho calor las 24 horas del día”, dijo.
LEA TAMBIÉN | ¿Por qué los incendios forestales de California son imparables?
Los sistemas de refrigeración, que a menudo dependen del agua, son esenciales para regular las temperaturas de los centros de datos y evitar caídas de los servidores. Mia Montoya Hammersley, experta en derecho ambiental, dijo a la publicación que con frecuencia se usa agua para enfriar físicamente los servidores de IA.
En particular, OpenAI ha reconocido el problema del consumo de agua y se ha comprometido a mejorar la eficiencia energética en el desarrollo y operación de grandes modelos lingüísticos.
Entonces, ¿ChatGPT provocó los incendios forestales de Los Ángeles?
No, ChatGPT no provocó los incendios forestales en Los Ángeles, ni es la razón por la que la ciudad se quedó sin agua. Sin embargo, su impacto ambiental, como parte de una conversación más amplia sobre el papel de la IA en el cambio climático, la hace indirectamente relevante para las discusiones sobre los incendios.
Martin Adams, ex director general del Departamento de Agua y Energía de Los Ángeles, dijo al Los Ángeles Times, “El [water] El sistema nunca ha sido diseñado para combatir un incendio forestal que luego envuelve a una comunidad”.
Los bomberos enfrentaron escasez de agua porque el sistema no estaba equipado para bombear cantidades tan grandes durante períodos prolongados, no porque los centros de datos desviaran el agua, dijo.
El debate en línea que vincula ChatGPT con los incendios forestales no pretendía culpar a los modelos de IA por iniciar incendios. En cambio, señaló las crecientes preocupaciones ambientales relacionadas con el consumo de energía y agua de la IA.
Mía Montoya Hammersley dijo HuffPost: “Dado que California ya está experimentando una sequía constante, el agua necesaria para combatir estos incendios está agotando aún más el suministro de agua del estado”.
Según un informe de El corte publicación, los hidrantes en Pacific Palisades se secaron debido a la alta demanda y no debido al uso de agua relacionado con la IA. Los sistemas municipales simplemente no fueron diseñados para manejar la naturaleza generalizada y de rápido avance de estos incendios.
LEA TAMBIÉN | Incendios forestales en Los Ángeles: cómo una mansión de 9 millones de dólares se convirtió en la ‘última casa en pie’ en Malibú
Los incendios forestales: ¿Cuál es la actualización reciente?
Los meteorólogos dijeron que los vientos estaban por debajo de niveles peligrosos el martes por la noche, pero advirtieron que se fortalecerían durante la noche, lo que podría propagar aún más los incendios. Se emitieron advertencias de bandera roja desde el centro de California hasta la frontera con México, que duraron hasta el miércoles por la tarde.
Casi 90.000 hogares se quedaron sin electricidad cuando las empresas de servicios públicos cortaron el suministro para evitar que sus líneas provocaran nuevos incendios.
Los residentes permanecieron en alerta máxima, listos para evacuar en cualquier momento. La policía informó de alrededor de 50 detenciones por saqueos, vuelo de drones en zonas de incendio, violación de toques de queda y otros delitos, mientras las comunidades cansadas y ansiosas vigilaban atentamente sus alrededores.
Con aportes de agencias
Noticias
Dentro de la carrera de Meta para vencer a OpenAI: “Necesitamos aprender a construir fronteras y ganar esta carrera”
Los mensajes, que formaban parte de una serie de pruebas reveladas por un tribunal de California, sugieren que Meta utilizó datos protegidos por derechos de autor cuando entrenó sus sistemas de inteligencia artificial y trabajó para ocultarlos, mientras corría para vencer a rivales como OpenAI y Mistral. Partes de los mensajes se revelaron por primera vez la semana pasada.
En un correo electrónico de octubre de 2023 al investigador de Meta AI Hugo Touvron, Ahmad Al-Dahle, vicepresidente de IA generativa de Meta, escribió que el objetivo de la compañía “debe ser GPT4”, refiriéndose al modelo de lenguaje grande OpenAI anunciado en marzo de 2023. Meta Teníamos que “aprender a construir fronteras y ganar esta carrera”, añadió Al-Dahle. Esos planes aparentemente involucraban al sitio de piratería de libros Library Genesis (LibGen) para entrenar sus sistemas de inteligencia artificial.
Un correo electrónico sin fecha del director de producto de Meta, Sony Theakanath, enviado a la vicepresidenta de investigación de IA, Joelle Pineau, sopesó si usar LibGen solo internamente, para los puntos de referencia incluidos en una publicación de blog o para crear un modelo entrenado en el sitio. En el correo electrónico, Theakanath escribe que “GenAI ha sido aprobado para usar LibGen para Llama3… con una serie de mitigaciones acordadas” después de escalarlo a “MZ”, presumiblemente el CEO de Meta, Mark Zuckerberg. Como se señala en el correo electrónico, Theakanath creía que “Libgen es esencial para cumplir con SOTA [state-of-the-art] números”, y agregó “se sabe que OpenAI y Mistral están utilizando la biblioteca para sus modelos (de boca en boca)”. Mistral y OpenAI no han declarado si utilizan o no LibGen. (El borde contacté a ambos para obtener más información).
Los documentos judiciales surgen de una demanda colectiva que el autor Richard Kadrey, la comediante Sarah Silverman y otros presentaron contra Meta, acusándola de utilizar contenido protegido por derechos de autor obtenido ilegalmente para entrenar sus modelos de IA, en violación de las leyes de propiedad intelectual. Meta, al igual que otras empresas de inteligencia artificial, ha argumentado que el uso de material protegido por derechos de autor en datos de entrenamiento debería constituir un uso legítimo y legal. El borde Se comunicó con Meta para solicitar comentarios, pero no recibió respuesta de inmediato.
Algunas de las “mitigaciones” para el uso de LibGen incluían estipulaciones de que Meta debía “eliminar los datos claramente marcados como pirateados/robados”, evitando al mismo tiempo citar externamente “el uso de cualquier dato de entrenamiento” del sitio. El correo electrónico de Theakanath también decía que la compañía necesitaría “equipar” los modelos de la compañía “para armas biológicas y CBRNE”. [Chemical, Biological, Radiological, Nuclear, and Explosives]“Riesgos.
El correo electrónico también repasaba algunos de los “riesgos políticos” que plantea el uso de LibGen, incluyendo cómo los reguladores podrían responder a la cobertura de los medios que sugiere el uso de contenido pirateado por parte de Meta. “Esto puede socavar nuestra posición negociadora con los reguladores sobre estos temas”, decía el correo electrónico. Una conversación de abril de 2023 entre el investigador de Meta Nikolay Bashlykov y el miembro del equipo de IA David Esiobu también mostró que Bashlykov admitió que “no está seguro de que podamos usar las IP de Meta para cargar torrents”. [of] contenido pirata”.
Otros documentos internos muestran las medidas que tomó Meta para ocultar la información de derechos de autor en los datos de entrenamiento de LibGen. Un documento titulado “observaciones sobre LibGen-SciMag” muestra los comentarios dejados por los empleados sobre cómo mejorar el conjunto de datos. Una sugerencia es “eliminar más encabezados de derechos de autor e identificadores de documentos”, lo que incluye cualquier línea que contenga “ISBN”, “Copyright”, “Todos los derechos reservados” o el símbolo de copyright. Otras notas mencionan eliminar más metadatos “para evitar posibles complicaciones legales”, así como considerar la posibilidad de eliminar la lista de autores de un artículo “para reducir la responsabilidad”.
El pasado mes de junio, Los New York Times informó sobre la frenética carrera dentro de Meta después del debut de ChatGPT, revelando que la compañía se había topado con un muro: había agotado casi todos los libros, artículos y poemas en inglés disponibles que pudo encontrar en línea. Desesperados por obtener más datos, los ejecutivos supuestamente discutieron la compra directa de Simon & Schuster y consideraron contratar contratistas en África para resumir libros sin permiso.
En el informe, algunos ejecutivos justificaron su enfoque señalando el “precedente de mercado” de OpenAI de utilizar obras protegidas por derechos de autor, mientras que otros argumentaron que la victoria judicial de Google en 2015 estableciendo su derecho a escanear libros podría proporcionar cobertura legal. “Lo único que nos impide ser tan buenos como ChatGPT es, literalmente, el volumen de datos”, dijo un ejecutivo en una reunión, según Los New York Times.
Se ha informado que laboratorios de vanguardia como OpenAI y Anthropic se han topado con un muro de datos, lo que significa que no tienen suficientes datos nuevos para entrenar sus grandes modelos de lenguaje. Muchos líderes lo han negado, el director ejecutivo de OpenAI, Sam Altman, dijo claramente: “No hay ningún muro”. El cofundador de OpenAI, Ilya Sutskever, que dejó la empresa en mayo pasado para iniciar un nuevo laboratorio de frontera, ha sido más directo sobre el potencial de un muro de datos. En una importante conferencia sobre IA el mes pasado, Sutskever dijo: “Hemos alcanzado el pico de datos y no habrá más. Tenemos que lidiar con los datos que tenemos. Sólo hay una Internet”.
Esta escasez de datos ha dado lugar a muchas formas nuevas y extrañas de obtener datos únicos. Bloomberg informó que laboratorios de vanguardia como OpenAI y Google han estado pagando a los creadores de contenido digital entre $ 1 y $ 4 por minuto por sus secuencias de video no utilizadas a través de un tercero para capacitar a los LLM (ambas compañías tienen productos de generación de video de IA de la competencia).
Dado que empresas como Meta y OpenAI esperan hacer crecer sus sistemas de inteligencia artificial lo más rápido posible, es probable que las cosas se pongan un poco complicadas. Aunque un juez desestimó parcialmente la demanda colectiva de Kadrey y Silverman el año pasado, las pruebas descritas aquí podrían fortalecer partes de su caso a medida que avanza en los tribunales.
-
Startups8 meses ago
Remove.bg: La Revolución en la Edición de Imágenes que Debes Conocer
-
Recursos8 meses ago
Cómo Empezar con Popai.pro: Tu Espacio Personal de IA – Guía Completa, Instalación, Versiones y Precios
-
Recursos8 meses ago
Suno.com: La Revolución en la Creación Musical con Inteligencia Artificial
-
Recursos8 meses ago
Perplexity aplicado al Marketing Digital y Estrategias SEO
-
Tutoriales8 meses ago
Cómo Comenzar a Utilizar ChatGPT: Una Guía Completa para Principiantes
-
Estudiar IA8 meses ago
Curso de Inteligencia Artificial de UC Berkeley estratégico para negocios
-
Startups6 meses ago
Startups de IA en EE.UU. que han recaudado más de $100M en 2024
-
Eventos8 meses ago
La nueva era de la inteligencia artificial por el Washington Post – Mayo 2024