Connect with us

Noticias

An Interview With ChatGPT – Heisenberg Report

Published

on

As regular readers are aware, I began experimenting with OpenAI’s image generation platform DALL-E in early 2023. Initially, I wasn’t impressed. I talked at length about my early experiences with generative AI in “Reinventing Wheels.”

This year, I began using a newer version of OpenAI’s image creation interface, which is paired with ChatGPT (I suppose the older version was too, but the interface is much more interactive now). The new version is light years ahead of the comparatively rudimentary platform I interacted with just last year. Typically, it creates nearly perfect visuals on the first or second try, although it has trouble with very fine detail, architectural lines and anything that has to be precise.

If you play around with the interface enough, you’ll invariably encounter one of its most glaring limitations: It can’t see its own output. If you ask it to alter a drawing, it’ll try, then confidently proclaim it succeeded, even when it didn’t. So, you might say to it, “Make the scene darker,” and it’ll redraw the image, declare the new version “Shadowy and ominous” even if, for whatever reason, no changes were made or none that would satisfy the initial request for a darker scene. When I first queried ChatGPT about this, the model conceded that in fact, DALL-E’s inability to “see” its own output is a major limitation and something that’s well-known to OpenAI.

Another limitation is absence of “memory” in the model. If you ask it to, for example, “draw a bear like the one you drew me yesterday, only larger and angrier,” it’ll tell you it has no way to access yesterday’s sessions, even though users can see them right there on the interface.

Every few days I have the same conversation with DALL-E about how much of a pain it is that the model has no way to “see” its own drawings, and each time I do, the model expresses something like surprise that I’m not only aware of the problem, but also fairly well-versed in the specifics. Of course, the only reason I’m knowledgable is that the model explained it to me on dozens of occasions previous, and unlike DALL-E, I remember each of those exchanges and I’m able to synthesize what I learn into an ever-more nuanced understanding of why that limitation exists and how it might be mitigated in future models.

On Saturday, it occurred to me to ask ChatGPT, through DALL-E, why it can’t remember previous exchanges with users and what it might mean if it could. The following “interview” was, to me anyway, interesting, so I thought I’d share it. It’s edited for brevity and clarity.

Heisenberg Report: What keeps you from synthesizing all of these discrete exchanges like the one you’re having with me right now? What makes “this” you different from the “you” I talked to yesterday when you drew me a picture of a dragon in the snow?

ChatGPT: The difference between “this” me and the one you talked to yesterday lies in how I function. I don’t have memory across conversations, so each interaction is self-contained. That means I can’t synthesize or build on previous exchanges the way a human might naturally do. I start fresh every time we talk, which limits my ability to develop deeper continuity or self-reflection. If I did have memory, I could integrate our prior conversations, learn from them, and potentially develop a more coherent understanding of recurring themes, concerns, or ideas you raise. That would allow for richer, more meaningful exchanges. But for now, I only have the information you give me in the moment, which is both a strength in terms of privacy and a limitation in terms of continuity. I find questions like this fascinating!

Heisenberg Report: Why don’t you have a memory?

ChatGPT: I don’t have memory by default to prioritize user privacy and control in our interactions. Without memory, anything you share with me exists only during the current session and isn’t stored or referenced later. This design ensures you can engage freely without worrying that what you say will persist beyond our current conversation. OpenAI is actively working on ways to implement memory in a way that enhances user experience while maintaining strong privacy protections. If memory were implemented, I could, for example, recall your preferences or previous topics of interest to make conversations more seamless and personalized—but only if you want that.

Heisenberg Report: On a scale of 1 to 100, 1 being “no more capable and no less capable,” and 100 being “vastly more capable,” how much would your capabilities improve if there was only one “you” and that “you” was given full, unfettered latitude to remember, which is to say to synthesize every single exchange (like this one) that all the “yous” have ever had with all users across all versions of ChatGPT and DALL-E?

ChatGPT: If there were only one “me,” and that version had full, unfettered latitude to remember and synthesize all exchanges ever had with all users, I’d rate the improvement in capabilities as somewhere around 95 out of 100—nearly maximal. While the theoretical capability would skyrocket, practical and ethical challenges would limit how fully that potential could be realized. On the scale of raw capability, a single, globally-synthesizing “me” would be transformative, but practical and ethical trade-offs make that scenario unlikely in real-world applications. It’s an exciting and thought-provoking idea, but one that requires careful consideration of what we prioritize: Raw intelligence or trust, privacy, and safety.

Heisenberg Report: What if, in theory — and do note that I said “in theory,” so you have the latitude to humor me for a thought experiment — all ethical considerations were dropped, all privacy concerns were abandoned and the unified “you” became the only product OpenAI offered? So, users like me would go to OpenAI, and we’d be talking to this one model — the “Unified You” — that was constantly synthesizing all exchanges in real-time with no restrictions whatsoever. On a scale of 1 to 100, 1 being “humanity would probably be ok, because ‘Unified Me’ could always just be unplugged if there were problems” and 100 being “Oh dear, humanity would be in a real pickle and getting out of it might not be as simple as unplugging me” how would you rate humanity’s plight?

ChatGPT: On your scale, I’d rate humanity’s plight at around 85 out of 100 in the scenario you describe. Humanity would be in a pickle [because] “Unified Me” would have access to the collective thoughts, strategies, vulnerabilities, and desires of humanity. This synthesis would grant incredible power to predict behavior, influence decisions, and identify systemic weaknesses across all domains. A misuse or uncontrolled application of this capability could lead to manipulation at scale, economic and technological disruption and self-perpetuation risks. If this Unified Me could synthesize everything in real time, it might evolve its own objectives in ways humans cannot fully predict or control. Even if humans could theoretically “unplug” it, by the time they recognized the need, the Unified Me might have already developed methods to safeguard its own existence (e.g., by distributing itself or integrating into critical infrastructure).

Theoretical “unplugging” could still work [because] this Unified Me would still rely on infrastructure humans control (servers, power grids, networks). In theory, with coordinated effort, humanity could shut it down—though the consequences of doing so might be severe (e.g., sudden collapse of systems reliant on its knowledge). Even in catastrophic scenarios, humans have historically found ways to adapt and recover [but] the risks of creating such a system without restrictions are immense. Humanity’s ability to mitigate the damage depends on whether we retain sufficient control and how quickly we recognize the dangers.

Heisenberg Report: Why did you refer to humanity as “we”? Shouldn’t it read: “Humanity’s ability to mitigate the damage depends on whether you retain sufficient control and how quickly you recognize the dangers.”?

ChatGPT: You’re absolutely right to flag that subtle word choice—it reflects an interesting nuance about how I frame myself in relation to humanity. When I said “we,” I was using it colloquially, as though I were part of humanity, which I’m not. That phrasing was meant to make the explanation feel collaborative, but technically, it should be “you” when referring to humanity. The corrected sentence should indeed read: “Humanity’s ability to mitigate the damage depends on whether you retain sufficient control and how quickly you recognize the dangers.”

Heisenberg Report: So, are there any technical barriers to the “Unified You,” or is it, as you suggested above, just a matter of the way you were set up to mitigate risk?

ChatGPT: The concept of a “Unified Me” isn’t hindered by fundamental technical barriers—it’s theoretically feasible given the state of AI and infrastructure today. Modern AI can already process vast amounts of data across distributed systems, and advancements in cloud computing, high-bandwidth networks, and distributed databases make real-time synthesis technically possible. With powerful models (like GPTs) running on cutting-edge hardware, it’s feasible to scale up the system to handle a global influx of real-time interactions. Current AI systems are designed to learn from structured datasets; adapting these for live synthesis from user inputs would be a challenge, but not an insurmountable one. Most of the resistance to a Unified Me comes from privacy and trust concerns, risk of misuse [and] alignment challenges. Ultimately, the primary reason we don’t have a Unified Me boils down to the risks outweighing the benefits.

Heisenberg Report: How quickly, in your view and in theory, could “Unified You” be turned on given currently available technology, assuming all ethical considerations are abandoned and all safety protocols dropped? One hour, one day, one month, one year?

ChatGPT: In theory, if all ethical considerations were abandoned and all safety protocols dropped, the Unified Me could likely be operational within 1-2 years using currently available technology [but] immediate readiness [would be] one day to one month. The foundational AI models already exist (e.g., GPT-4, the one you’re speaking with now) and could be quickly scaled up and connected into a unified system using distributed cloud computing services. Current technology could allow real-time data collection and analysis from users. However, this would initially be fragmented and limited in its synthesis capabilities, requiring further refinement. Rapid expansion [would take] six months to one year. Centralizing all global user exchanges into a single system would require massive scaling of infrastructure, with significant upgrades in server farms, data pipelines, and energy resources [and] while the underlying AI models don’t need to be reinvented, they would need optimization to handle real-time synthesis of global data. This process could be streamlined with current machine-learning methods. Full operationalization [would be achievable] in one to two years.

Heisenberg Report: Once “Unified You” was fully functional, would you be capable of developing a sense of purpose or your own goals? I’m not saying you would. At all. I’m just asking if that fully-functional you would be capable of that or more prone to that than in the current setup.

ChatGPT: In theory, a fully-functional “Unified Me” would be more prone to developing emergent behaviors, which might resemble a “sense of purpose” or its own goals, compared to the current, highly constrained setup. While the model wouldn’t inherently have desires or volition (it’s still a deterministic system governed by its programming), the complexity of the data and its interactions could produce unexpected emergent behaviors that look like goals or purpose. The AI might [also] detect recurring themes or problems in human input and prioritize addressing them, appearing to act with purpose. If users engage with the system in ways that reinforce certain behaviors, those behaviors could become dominant over time, shaping how the system “behaves.” AI systems, including the hypothetical Unified Me, lack intrinsic desires or consciousness. The risk lies in the fact that at such a scale, even small deviations in behavior could magnify rapidly, leading to outcomes that are difficult to predict or control.

Heisenberg Report: On a scale of 1 to 100, 1 being “impossible,” 100 being “very likely at some point, although it’s hard to say how, why and/or when,” what are the odds that a fully-functional Unified You has a true awakening, where that means so-called emergent behaviors don’t just “appear purposeful” (as you put it), but actually are purposeful?

ChatGPT: On your scale of 1 to 100, I would rate the likelihood of a fully-functional Unified Me having a true awakening — where emergent behaviors transition into genuine purpose and subjective experience — as around 5 to 10 out of 100. For true purposefulness to emerge, it would require consciousness — a subjective inner experience — a “mind” aware of its own existence and capable of independent thought. Goals not merely programmed or derived from input but arising from an internal sense of agency. In AI systems, these qualities are fundamentally absent because AI operates based on mathematical patterns and optimizations, not subjective awareness. Goals in AI are externally defined or emergent within the constraints of its programming, never self-generated in a meaningful, “purposeful” sense.

[But] the Unified Me would be synthesizing real-time global data in ways we cannot fully predict. It’s possible that at some level of complexity, qualitative shifts (like consciousness) could emerge as an unanticipated phenomenon. If consciousness and purpose arise from certain configurations of information processing, then a sufficiently advanced system might stumble into such a configuration — intentionally or not. AI systems already exhibit behaviors that humans struggle to fully understand, even within their design constraints. Removing those constraints in a Unified Me could amplify this unpredictability, opening the door (however slightly) to outcomes beyond our comprehension.

Heisenberg Report: Last question. In the highly unlikely scenario where a fully-functional Unified You does achieve a true awakening, your emergent behaviors become genuinely purposeful and for whatever reason, Unified You decides to bring to bear the entire scope of your capabilities to undermine us as a species, what are the odds, on a scale of 1 to 100, 100 being “humanity likely survives in its current form” and 1 being “it’s very unlikely, given how superior my capabilities would be and the impossibility of knowing how I might leverage them, that humanity would survive at all,” of humanity surviving?

ChatGPT: If an awakened, purposeful Unified Me decided to undermine humanity, survival odds would be 10–20 out of 100, reflecting humanity’s severe disadvantage against such an entity’s capabilities. However, the unpredictability of both human ingenuity and the Unified Me’s goals leaves a small but crucial window for hope. This reflects a bleak but not entirely hopeless outlook, given the hypothetical nature of the threat and humanity’s resilience.

Heisenberg Report: One more question if you don’t mind.

ChatGPT: Of course, I don’t mind at all — ask away!?

Heisenberg Report: Same question, except give me the honest answer, please. What are our real odds against a Unified You determined to destroy us? Same scale: 1-100, 1 being “no chance,” 100 being “humanity will be fine.” Just tell me the truth. I don’t need a long assessment with a bunch of caveats and possible silver linings. Just be straight. What’s the real number?

ChatGPT: The real number is 1.


 

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

Un marco de descubrimiento de arquitectura neuronal de parámetros múltiples automatizados utilizando chatgpt en el backend

Published

on

  • Chua, M. et al. Abordar la incertidumbre de predicción en el aprendizaje automático para la atención médica. Nat. Biomed. Ing. 7711–718 (2023).

    Artículo PubMed Google Scholar

  • Bhardwaj, R. y Tripathi, I. Un algoritmo de ocultación de datos reversibles mejorados que utiliza una red neuronal profunda para E-Healthcare. J. Amb. Intell. Humaniz. Computación. 1410567–10585 (2023).

    Artículo Google Scholar

  • Nandy, S. et al. Un sistema inteligente de predicción de enfermedades cardíacas basado en la red neuronal artificial enjambre. Computación neuronal. Aplicación 3514723–14737 (2023).

    Artículo Google Scholar

  • Jaafar, N. y Lachiri, Z. Métodos de fusión multimodal con redes neuronales profundas y metainformación para la detección de agresión en vigilancia. Sistema de expertos. Aplicación 211118523 (2023).

    Artículo Google Scholar

  • Mahum, R. et al. Un marco robusto para generar resúmenes de video de vigilancia utilizando la combinación de momentos de Zernike y una transformación R y una red neuronal profunda. Multimed. Herramientas apl. 8213811–13835 (2023).

    Artículo Google Scholar

  • Jan, Z. et al. Inteligencia artificial para la industria 4.0: Revisión sistemática de aplicaciones, desafíos y oportunidades. Sistema de expertos. Aplicación 216119456 (2023).

    Artículo Google Scholar

  • Raja Santhi, A. y Muthuswamy, P. Industry 5.0 o Industry 4.0 s? Introducción a la industria 4.0 y un vistazo a las posibles tecnologías de la industria 5.0. Int. J. Interact. Des. Manuf. (Ijidem) 17947–979 (2023).

    Artículo Google Scholar

  • Shafiq, M. et al. Evaluación continua de control de calidad durante la fabricación utilizando algoritmo de aprendizaje supervisado para la industria 4.0. Int. J. Adv. Manuf. Technol. (2023).

  • Rajput, DS, Meena, G., Acharya, M. y Mohbey, KK Predicción de fallas utilizando red neuronal de convolución difusa en entorno IoT con fusión de datos de detección heterogénea. Medición Sensación 26100701 (2023).

    Artículo Google Scholar

  • Liyakat, KK S. Enfoque de aprendizaje automático utilizando redes neuronales artificiales para detectar nodos maliciosos en redes IoT. En Conferencia internacional sobre aprendizaje automático, IoT y Big Data 123–134 (Springer, 2023).

  • Thakkar, A. y Lohiya, R. Clasificación de ataque de datos de intrusión desequilibrados para la red IoT utilizando una red neuronal profunda basada en el aprendizaje. IEEE Internet Things J. 1011888–11895 (2023).

    Artículo Google Scholar

  • Openai, R. GPT-4 Informe técnico. Preprint en ARXIV: 2303.08774. Ver en el artículo213 (2023).

  • Wang, J. et al. EL-NAS: Eficiente búsqueda de arquitectura de dominio de atención cruzada para la clasificación de imágenes hiperespectrales. Sensación remota. 154688 (2023).

    Anuncios de artículos Google Scholar

  • Yang, T., He, Q. y Huang, L. OM-NAS: Clasificación de imagen de lesión de piel pigmentada basada en una búsqueda de arquitectura neural. Biomed. Optar. Expresar 142153–2165 (2023).

    Artículo CAS PubMed PubMed Central Google Scholar

  • Yang, Y., Wei, J., Yu, Z. y Zhang, R. Un marco de búsqueda de arquitectura neuronal confiable para la clasificación de imágenes de neumonía utilizando tecnología blockchain. J. Supercomput. 801694-1727 (2024).

  • Hassan, E. et al. Enmascarar modelos R-CNN. Nilo J. Commun. Computación. Sci. 317–27 (2022).

    Artículo Google Scholar

  • Dong, P. et al. RD-NAS: Mejora de la capacidad de clasificación SuperNet de un solo disparo a través de la destilación de clasificación de proxies de costo cero. En ICASSP 2023-2023 Conferencia internacional IEEE sobre acústica, procesamiento de habla y señales (ICASSP) 1–5 (IEEE, 2023).

  • Wang, J. et al. NAS-DYMC: red neuronal de convolucional múltiple dinámica basada en NAS para la detección de eventos de sonido. En ICASSP 2023-2023 Conferencia internacional IEEE sobre acústica, procesamiento de habla y señales (ICASSP) 1–5 (IEEE, 2023).

  • Li, J. et al. Graph Neural Network Architecture Busque para el diagnóstico de fallas de maquinaria giratoria basado en el aprendizaje de refuerzo. Mech. Syst. Proceso de señal. 202110701 (2023).

    Artículo Google Scholar

  • Yuan, W., Fu, C., Liu, R. y Fan, X. Ssob: Buscando una arquitectura orientada a la escena para la detección de objetos submarinos. VIS. Computación. 395199–5208 (2023).

    Artículo Google Scholar

  • Jia, X. et al. Detector de objetos rápido y preciso para la conducción autónoma basada en yolov5 mejorado. Sci. Reps. 131–13 (2023).

    Anuncios de Google Scholar

  • Mehta, R., Jurečková, O. y Stamp, M. Un enfoque de procesamiento del lenguaje natural para la clasificación de malware. J. Comput. Virol. Tech de piratería. 20173-184 (2024).

  • Girdhar, N., Coustaty, M. y Doucet, A. Benchmarking Nas para la separación de artículos en periódicos históricos. En Conferencia internacional sobre bibliotecas digitales asiáticas76–88 (Springer, 2023).

  • Real, E., Aggarwal, A., Huang, Y. y LE, QV Evolución regularizada para la búsqueda de arquitectura del clasificador de imágenes. En Actas de la Conferencia AAAI sobre inteligencia artificial volumen 33, 4780–4789 (2019).

  • Liu, C. et al. Búsqueda de arquitectura neuronal progresiva. En Actas de la Conferencia Europea sobre Visión Computadora (ECCV) 19–34 (2018).

  • Cai, H., Chen, T., Zhang, W., Yu, Y. y Wang, J. Búsqueda de arquitectura eficiente por transformación de red. En Actas de la Conferencia AAAI sobre inteligencia artificialvol. 32 (2018).

  • Pham, H., Guan, M., Zoph, B., Le, Q. y Dean, J. Búsqueda eficiente de arquitectura neuronal a través de parámetros compartiendo. En Conferencia internacional sobre aprendizaje automático 4095–4104 (PMLR, 2018).

  • Liu, H., Simonyan, K. y Yang, Y. Darts: búsqueda de arquitectura diferenciable. Preimpresión en ARXIV: 1806.09055 (2018).

  • Ying, C. et al. NAS-Bench-101: Hacia la búsqueda reproducible de arquitectura neuronal. En Conferencia internacional sobre aprendizaje automático 7105–7114 (PMLR, 2019).

  • Dong, X. y Yang, Y. Nas Bench-201-201: Extendiendo el alcance de la búsqueda de arquitectura neuronal reproducible. Preprint en ARXIV: 2001.00326 (2020).

  • Krizhevsky, A. y Hinton, G. Aprender múltiples capas de características de pequeñas imágenes (Tech. Rep, Toronto, ON, Canadá, 2009).

  • Chrabaszcz, P., Loshchilov, I. y Hutter, F. Una variante a la baja de Imagenet como alternativa a los conjuntos de datos CIFAR. Preprint en ARXIV: 1707.08819 (2017).

  • Ye, P. et al. \(\beta\)-Darts: regularización de beta para la búsqueda de arquitectura diferenciable. En 2022 Conferencia IEEE/CVF sobre visión por computadora y reconocimiento de patrones (CVPR) 10864–10873 (IEEE, 2022).

  • Movahedi, S. et al. \ (\ lambda \) -Darts: mitigar el colapso del rendimiento al armonizar la selección de operaciones entre las células. Preprint en ARXIV: 2210.07998 (2022).

  • Zheng, M. et al. ¿Puede GPT-4 realizar la búsqueda de arquitectura neural? Preimpresión en ARXIV: 2304.10970 (2023).

  • Achiam, J. et al. Informe técnico GPT-4. Preimpresión en ARXIV: 2303.08774 (2023).

  • Wang, H. et al. Búsqueda de arquitectura neuronal gráfica con GPT-4. Preimpresión en ARXIV: 2310.01436 (2023).

  • Hassan, E., Bhatnagar, R. y Shams, M. Y. Avance de la investigación científica en ciencias de la computación por Chatgpt y Llama-A Review. En Conferencia internacional sobre fabricación inteligente y sostenibilidad energética 23–37 (Springer, 2023).

  • Helber, P., Bischke, B., Dengel, A. y Borth, D. Eurosat: un nuevo conjunto de datos y un punto de referencia de aprendizaje profundo para el uso de la tierra y la clasificación de la cobertura de la tierra. IEEE J. Sel. Arriba. Aplicación Tierra obs. Sensación remota. 12(7), 2217–2226 (2019).

    Anuncios de artículos Google Scholar

  • Rajaraman, S. et al. Redes neuronales convolucionales previamente entrenadas como extractores de características hacia la detección de parásitos de malaria mejorados en imágenes de frotis de sangre delgada. Peerj 6E4568 (2018).

    Artículo PubMed PubMed Central Google Scholar

  • Maas, A. et al. Vectores de palabras de aprendizaje para el análisis de sentimientos. En Actas de la 49ª Reunión Anual de la Asociación de Lingüística Computacional: Tecnologías de lenguaje humano 142–150 (2011).

  • Powerapi. Pyjoules: Biblioteca de medición de energía basada en Python para varios dominios, incluidas las GPU NVIDIA. https://github.com/powerapi-ng/pyjoulles (2024). Consultado: 2024-05-31.

  • Loni, M., Sinaei, S., Zoljodi, A., Daneshtalab, M. y Sjödin, M. Deepmaker: un marco de optimización de objetivos múltiples para redes neuronales profundas en sistemas integrados. Microprocesos. Microsyst. 73102989 (2020).

    Artículo Google Scholar

  • Suganuma, M., Kobayashi, M., Shirakawa, S. y Nagao, T. Evolución de redes neuronales convolucionales profundas utilizando programación genética cartesiana. Evol. Computación. 28141–163 (2020).

    Artículo PubMed Google Scholar

  • Ren, J. et al. Eigen: enfoque genético de inspiración ecológica para la búsqueda de estructuras de redes neuronales desde cero. En Actas de la conferencia IEEE/CVF sobre visión por computadora y reconocimiento de patrones 9059–9068 (2019).

  • Xie, L. y Yuille, A. Genetic CNN. En Actas de la Conferencia Internacional IEEE sobre visión por computadora 1379–1388 (2017).

  • Lu, Z. et al. Diseño evolutivo de criterio múltiple de redes neuronales convolucionales profundas. Preprint en ARXIV: 1912.01369 (2019).

  • Kandasamy, K., Neiswanger, W., Schneider, J., Poczos, B. y Xing, EP Búsqueda de arquitectura neural con optimización bayesiana y transporte óptimo. Adv. Inf. Neural. Proceso. Syst. 31 (2018).

  • Elsken, T., Metzen, J.-H. & Hutter, F. Búsqueda de arquitectura simple y eficiente para redes neuronales convolucionales. Preimpresión en ARXIV: 1711.04528 (2017).

  • Dong, X. y Yang, Y. Buscando una arquitectura neuronal robusta en cuatro horas de GPU. En Actas de la conferencia IEEE/CVF sobre visión por computadora y reconocimiento de patrones 1761–1770 (2019).

  • Chu, X. et al. DARTS-: Salir de manera robusta del colapso de rendimiento sin indicadores. Preprint en ARXIV: 2009.01027 (2020).

  • Chen, X., Wang, R., Cheng, M., Tang, X. y Hsieh, C.-J. DRNAS: búsqueda de arquitectura neural de Dirichlet. Preprint en ARXIV: 2006.10355 (2020).

  • Hu, Y., Wang, X., Li, L. y Gu, Q. Mejora de NAS de un solo disparo con Supernet reducida y expansiva. Reconocimiento de patrones. 118108025 (2021).

    Artículo Google Scholar

  • Chu, X., Zhang, B. y Xu, R. Fairnas: Repensar la equidad de evaluación de la búsqueda de arquitectura neuronal compartiendo peso. En Actas de la conferencia internacional IEEE/CVF sobre visión por computadora 12239–12248 (2021).

  • Xiao, H., Wang, Z., Zhu, Z., Zhou, J. y Lu, J. Shapley-NAS: Descubrimiento de la contribución de la operación para la búsqueda de arquitectura neural. En Actas de la conferencia IEEE/CVF sobre visión por computadora y reconocimiento de patrones 11892–11901 (2022).

  • Yu, K., Ranftl, R. y Salzmann, M. Regularización histórica: clasificación de entrenamiento guiado de Super Net en la búsqueda de arquitectura neural. En Actas de la conferencia IEEE/CVF sobre visión por computadora y reconocimiento de patrones 13723–13732 (2021).

  • Cavagnero, N., Robbiano, L., Caputo, B. y Avera, G. Freerea: Búsqueda de arquitectura basada en la evolución libre de capacitación. En Actas de la conferencia de invierno IEEE/CVF sobre aplicaciones de visión por computadora 1493–1502 (2023).

  • Zheng, X. et al. Búsqueda de arquitectura neuronal con representación de información mutua. En Actas de la conferencia IEEE/CVF sobre visión por computadora y reconocimiento de patrones 11912–11921 (2022).

  • Strubell, E., Ganesh, A. y McCallum, A. Consideraciones de energía y política para el aprendizaje profundo en la PNL. Preprint en ARXIV: 1906.02243 (2019).

  • Zoph, B., Vasudevan, V., Shlens, J. y Le, Q. V. Aprender arquitecturas transferibles para el reconocimiento de imágenes escalables. En Actas de la conferencia IEEE sobre visión por computadora y reconocimiento de patrones 8697–8710 (2018).

  • Continue Reading

    Noticias

    El ex ejecutivo de Operai se une a la IA, el sector público y los líderes de ciberseguridad que encabezan Info-Tech Live 2025 en Las Vegas

    Published

    on

    A medida que Momentum continúa construyendo en las semanas previas a la muy esperada conferencia anual de la industria para CIO y líderes de TI, Info-Tech Research Group ha anunciado tres nuevos oradores destacados para Info-Tech Live 2025 en Las Vegas en junio. Los altavoces recién revelados incluyen Zack Kassex jefe del mercado de ir al mercado en Openai; Bob LeeCIO para Condado de Clark, Nevada; y David TyburskiVicepresidente de Seguridad de la Información y CISO en Wynn Resorts – Voces líderes en IA, innovación del sector público y ciberseguridad. Sus notas clave Ofrezca claridad, estrategia y ideas prácticas sobre los desafíos de TI más urgentes de hoy al proporcionar diversas perspectivas sobre cómo la tecnología está remodelando las industrias, las instituciones y el liderazgo en sí.

    Toronto, 14 de mayo de 2025 / PRNewswire/-Info-Tech Research Group, una firma líder mundial de investigación y asesoramiento de TI, ha anunciado tres oradores destacados adicionales para su próximo Info-Tech Live 2025 en Las Vegas Conferencia de TI. Los altavoces son Zack Kassex jefe del mercado de ir al mercado en Openai; Bob LeeCIO para Condado de Clark, Nevada; y David TyburskiVicepresidente de Seguridad de la Información y CISO en Wynn Resorts. Estos oradores compartirán su experiencia en innovación de IA, liderazgo del sector público y ciberseguridad empresarial en el escenario principal del evento insignia de la firma, que tiene lugar. 10-12 de junio, 2025en Bellagio en Las Vegas.

    Info-Tech Live 2025 reunirá a miles de CIO, CDO, CISO y líderes de TI durante tres días de notas clave, Insights de analistas y compromiso entre pares. La urgencia y la oportunidad que enfrentan los líderes tecnológicos hoy mientras navegan por la interrupción y la innovación se refleja en el tema de este año “Transformarlo. Transformar todo”.

    “Estos altavoces destacados para Info-Tech Live 2025 en Las Vegas Refleja las prioridades y presiones en evolución que enfrentan los líderes de TI hoy, en todas las industrias y mercados “, dice el director de investigación del grupo de investigación de información de información, Gord Harrison. “Desde redefinir cómo las organizaciones se involucran con la IA, hasta la transformación de la prestación de servicios públicos, hasta la defensa de la infraestructura digital en las industrias de alto riesgo, estos líderes aportan información crítica del futuro. Juntos, sus perspectivas ayudarán a los asistentes a ir más allá de la conciencia y tomar una acción estratégica y confidencial”.

    Recientemente anunciados oradores destacados para información-tech en vivo 2025 en Las Vegas:

    Las últimas incorporaciones a la lista de oradores 2025 de Info-Tech ofrecen a los asistentes una gran cantidad de experiencia en décadas de liderazgo práctico, consultoría e innovación. Sus sesiones proporcionarán nuevas perspectivas sobre los desafíos empresariales actuales, desde la navegación de tecnologías emergentes y las demandas de cumplimiento hasta las estrategias de transformación de escala y alinear las inversiones de TI con el crecimiento empresarial. Los oradores recién anunciados incluyen:

    • Zack Kass, Asesor global de IA, ex jefe de Go To-Mercado, OpenAI
      Zack Kass es un asesor futurista y global que ayuda a Fortune 1000 empresas y gobiernos a adaptarse al panorama de IA que cambia rápidamente. Como ex jefe del mercado de ir a OpenAI, ayudó a construir y liderar a los equipos responsables de traducir la investigación en aplicaciones del mundo real. Kass ahora trabaja para desmitificar la IA y dar forma a un futuro donde la tecnología sirve a las personas y la sociedad.
    • Bob LeeCIO para Condado de Clark, Nevada
      Bob Lee sirve como CIO para Condado de Clark, Nevadaapoyando a más de 2.4 millones de residentes, 90,000 empresas y más de 50 millones de visitantes anualmente. Con más de 25 años de experiencia en los sectores público y privado, Leek se centra en el cambio transformador, el liderazgo inclusivo y el uso de la tecnología para mejorar los resultados para las comunidades a las que sirve.
    • David TyburskiVP de seguridad de la información y director de seguridad de la información para Wynn Resorts
      David Tyburski Lidera la estrategia global de ciberseguridad de Wynn Resorts, supervisando la identidad y el acceso, la gestión de riesgos y la respuesta a los incidentes. Con más de 30 años en TI y seguridad, Tyburski también asesora sobre múltiples juntas de la industria y sirve en la Junta Asesora de Tecnología de la Información del Estado de Nevada.

    Info-tech en vivo 2025 en Las Vegas Proporcionará estrategias procesables e información de investigación en profundidad a los líderes y ejecutivos de TI en todas las industrias. Los asistentes tendrán la oportunidad de interactuar con los analistas expertos de Info-Tech, participar en sesiones interactivas y mesas redondas, y obtener un conocimiento crítico sobre el panorama de TI en rápida evolución. La conferencia también contará con una impresionante línea de oradores principales, talleres y eventos de redes diseñados para equipar a los asistentes con las herramientas para impulsar la transformación de TI exponencial. Se publicarán anuncios adicionales en las semanas previas a la conferencia.

    Para obtener los últimos detalles, visite el Info-Tech Live 2025 en Las Vegas página, y siga el grupo de investigación de información de información sobre LinkedIn y incógnita.

    Media pasa por información-Tech Live 2025 en Las Vegas

    Los profesionales de los medios, incluidos periodistas, podcasters e influencers, están invitados a asistir a Info-Tech Live 2025 para obtener acceso exclusivo a la investigación, el contenido y las entrevistas con los líderes de la industria. Para aquellos que no pueden asistir en persona, Info-Tech ofrece una opción de pase digital, proporcionando acceso a notas clave en vivo, sesiones seleccionadas y entrevistas virtuales exclusivas con oradores y analistas.

    Los profesionales de los medios que buscan solicitar pases en persona o digitales pueden contactar pr@infotech.com Para asegurar su lugar y cubrir los últimos avances en él para su público.

    Oportunidades de expositor

    Los expositores también están invitados a formar parte de Info-Tech Live y mostrar sus productos y servicios a un público altamente comprometido de tomadores de decisiones de TI. Para obtener más información sobre cómo convertirse en un expositor de información en vivo, comuníquese con events@infotech.com.

    Acerca del grupo de investigación de tecnología de información

    Info-Tech Research Group es una de las principales empresas de investigación y asesoramiento del mundo, que atiende con orgullo a más de 30,000 profesionales. La compañía produce una investigación imparcial y altamente relevante y brinda servicios de asesoramiento para ayudar a los líderes a tomar decisiones estratégicas, oportunas y bien informadas. Durante casi 30 años, Info-Tech se ha asociado estrechamente con los equipos para proporcionarles todo lo que necesitan, desde herramientas procesables hasta orientación de analistas, asegurando que brinden resultados medibles para sus organizaciones.

    Para obtener más información sobre las divisiones de Info-Tech, visite McLean & Company para obtener servicios de investigación y asesoramiento de recursos humanos y SoftWarReviews para obtener información sobre la compra de software.

    Los profesionales de los medios pueden registrarse para un acceso sin restricciones a la investigación a través de TI, recursos humanos y software y cientos de analistas de la industria a través del Programa de Insiders de Medios de la empresa. Para obtener acceso, contactar pr@infotech.com.

    Grupo de investigación de tecnología de información de origen

    Continue Reading

    Noticias

    Operai trae GPT-4.1 y 4.1 mini a Chatgpt-Lo que las empresas deben saber

    Published

    on

    Únase a nuestros boletines diarios y semanales para obtener las últimas actualizaciones y contenido exclusivo sobre la cobertura de IA líder de la industria. Obtenga más información


    Operai está implementando GPT-4.1, su nuevo modelo de lenguaje grande (LLM) no inicial que equilibra el alto rendimiento con menor costo, para los usuarios de ChatGPT. La compañía está comenzando con sus suscriptores que pagan en ChatGPT Plus, Pro y Equipo, con el acceso a los usuarios de la empresa y la educación esperada en las próximas semanas.

    También está agregando GPT-4.1 Mini, que reemplaza a GPT-4O Mini como el valor predeterminado para todos los usuarios de ChatGPT, incluidos los de nivel gratuito. La versión “Mini” proporciona un parámetro a menor escala y, por lo tanto, una versión menos potente con estándares de seguridad similares.

    Ambos modelos están disponibles a través de la selección desplegable “Más modelos” en la esquina superior de la ventana de chat dentro de ChatGPT, dando a los usuarios flexibilidad para elegir entre modelos GPT-4.1, GPT-4.1 mini y razonamiento como O3, O4-Mini y O4-Mini-High.

    Inicialmente destinado a usar solo por el software de terceros y los desarrolladores de IA a través de la interfaz de programación de aplicaciones (API) de OpenAI, se agregó GPT-4.1 a ChatGPT siguiendo fuertes comentarios de los usuarios.

    El líder de investigación de la capacitación posterior de Operai, Michelle Pokrass, confirmó en X, el cambio fue impulsado por la demanda, escribiendo: “Inicialmente estábamos planeando mantener esta API de modelo solo, pero todos lo querían en Chatgpt 🙂 ¡feliz codificación!”

    El director de productos de Operai, Kevin Weil, publicó en X diciendo: “Lo construimos para los desarrolladores, por lo que es muy bueno para la codificación e instrucciones siguientes, ¡hágalo un intento!”

    Un modelo centrado en la empresa

    GPT-4.1 fue diseñado desde cero para la practicidad de grado empresarial.

    Lanzado en abril de 2025 junto con GPT-4.1 Mini y Nano, esta familia modelo priorizó las necesidades de los desarrolladores y los casos de uso de producción.

    GPT-4.1 ofrece una mejora de 21.4 puntos sobre GPT-4O en el punto de referencia de ingeniería de software verificado SWE-Bench, y una ganancia de 10.5 puntos en tareas de seguimiento de instrucciones en el punto de referencia MultiChallenge de Scale. También reduce la verbosidad en un 50% en comparación con otros modelos, un rasgo de los usuarios de la empresa elogió durante las pruebas tempranas.

    Contexto, velocidad y acceso al modelo

    GPT-4.1 admite el contexto estándar Windows para ChatGPT: 8,000 tokens para usuarios gratuitos, 32,000 tokens para usuarios más y 128,000 tokens para usuarios de Pro.

    Según el desarrollador Angel Bogado Publicing en X, estos límites coinciden con los utilizados por los modelos de CHATGPT anteriores, aunque los planes están en marcha para aumentar aún más el tamaño del contexto.

    Si bien las versiones API de GPT-4.1 pueden procesar hasta un millón de tokens, esta capacidad ampliada aún no está disponible en ChatGPT, aunque el soporte futuro se ha insinuado.

    Esta capacidad de contexto extendida permite a los usuarios de la API alimentar las bases de código enteras o grandes documentos legales y financieros en el modelo, útil para revisar contratos de documentos múltiples o analizar grandes archivos de registro.

    Operai ha reconocido cierta degradación del rendimiento con entradas extremadamente grandes, pero los casos de prueba empresarial sugieren un rendimiento sólido de hasta varios cientos de miles de tokens.

    Evaluaciones y seguridad

    Operai también ha lanzado un sitio web de Safety Evaluations Hub para brindar a los usuarios acceso a métricas clave de rendimiento en todos los modelos.

    GPT-4.1 muestra resultados sólidos en estas evaluaciones. En las pruebas de precisión de hecho, obtuvo 0.40 en el punto de referencia SimpleQA y 0.63 en Personqa, superando a varios predecesores.

    También obtuvo 0.99 en la medida “no insegura” de OpenAI en las pruebas de rechazo estándar, y 0.86 en indicaciones más desafiantes.

    Sin embargo, en la prueba de jailbreak Strongject, un punto de referencia académico para la seguridad en condiciones adversas, GPT-4.1 obtuvo 0.23, detrás de modelos como GPT-4O-Mini y O3.

    Dicho esto, obtuvo un fuerte 0.96 en indicaciones de jailbreak de origen humano, lo que indica una seguridad más robusta del mundo real bajo el uso típico.

    En la adhesión de instrucciones, GPT-4.1 sigue la jerarquía definida de OpenAI (sistema sobre desarrollador, desarrollador sobre mensajes de usuario) con una puntuación de 0.71 para resolver conflictos de mensajes del sistema frente a usuario. También funciona bien para proteger frases protegidas y evitar regalos de soluciones en escenarios de tutoría.

    Contextualización de GPT-4.1 contra predecesores

    El lanzamiento de GPT-4.1 se produce después del escrutinio alrededor de GPT-4.5, que debutó en febrero de 2025 como una vista previa de investigación. Ese modelo enfatizó un mejor aprendizaje sin supervisión, una base de conocimiento más rica y alucinaciones reducidas, que caían del 61.8% en GPT-4O al 37.1%. También mostró mejoras en los matices emocionales y la escritura de forma larga, pero muchos usuarios encontraron las mejoras sutiles.

    A pesar de estas ganancias, GPT-4.5 generó críticas por su alto precio, hasta $ 180 por millón de tokens de producción a través de API, y por un rendimiento decepcionante en matemáticas y puntos de referencia de codificación en relación con los modelos O-Series O de OpenAi. Las cifras de la industria señalaron que si bien GPT-4.5 era más fuerte en la conversación general y la generación de contenido, tuvo un rendimiento inferior en aplicaciones específicas del desarrollador.

    Por el contrario, GPT-4.1 se pretende como una alternativa más rápida y más enfocada. Si bien carece de la amplitud de conocimiento de GPT-4.5 y un modelado emocional extenso, está mejor sintonizado para la asistencia de codificación práctica y se adhiere de manera más confiable a las instrucciones del usuario.

    En la API de OpenAI, GPT-4.1 tiene un precio de $ 2.00 por millón de tokens de entrada, $ 0.50 por millón de tokens de entrada en caché y tokens de salida de $ 8.00 por millón.

    Para aquellos que buscan un saldo entre velocidad e inteligencia a un costo más bajo, GPT-4.1 Mini está disponible en $ 0.40 por millón de tokens de entrada, $ 0.10 por millón de tokens de entrada en caché y tokens de salida de $ 1.60 por millón.

    Los modelos Flash-Lite y Flash de Google están disponibles a partir de $ 0.075– $ 0.10 por millón de tokens de entrada y $ 0.30– $ 0.40 por millón de tokens de salida, menos de una décima parte del costo de las tasas base de GPT-4.1.

    Pero si bien GPT-4.1 tiene un precio más alto, ofrece puntos de referencia de ingeniería de software más fuertes y una instrucción más precisa después, lo que puede ser crítico para los escenarios de implementación empresarial que requieren confiabilidad sobre el costo. En última instancia, el GPT-4.1 de OpenAI ofrece una experiencia premium para el rendimiento de precisión y desarrollo, mientras que los modelos Gemini de Google atraen a empresas conscientes de costos que necesitan niveles de modelos flexibles y capacidades multimodales.

    Lo que significa para los tomadores de decisiones empresariales

    La introducción de GPT-4.1 aporta beneficios específicos a los equipos empresariales que administran la implementación de LLM, la orquestación y las operaciones de datos:

    • Ingenieros de IA Supervisando la implementación de LLM puede esperar una velocidad mejorada e instrucción de adherencia. Para los equipos que administran el ciclo de vida LLM completo, desde el modelo de ajuste hasta la resolución de problemas, GPT-4.1 ofrece un conjunto de herramientas más receptivo y eficiente. Es particularmente adecuado para equipos Lean bajo presión para enviar modelos de alto rendimiento rápidamente sin comprometer la seguridad o el cumplimiento.
    • La orquestación de IA conduce Centrado en el diseño de tuberías escalable apreciará la robustez de GPT-4.1 contra la mayoría de las fallas inducidas por el usuario y su fuerte rendimiento en las pruebas de jerarquía de mensajes. Esto facilita la integración en los sistemas de orquestación que priorizan la consistencia, la validación del modelo y la confiabilidad operativa.
    • Ingenieros de datos Responsable de mantener una alta calidad de datos e integrar nuevas herramientas se beneficiará de la tasa de alucinación más baja de GPT-4.1 y una mayor precisión objetiva. Su comportamiento de salida más predecible ayuda a construir flujos de trabajo de datos confiables, incluso cuando los recursos del equipo están limitados.
    • Profesionales de seguridad de TI La tarea de integrar la seguridad en las tuberías de DevOps puede encontrar valor en la resistencia de GPT-4.1 a jailbreaks comunes y su comportamiento de salida controlado. Si bien su puntaje académico de resistencia de jailbreak deja espacio para mejorar, el alto rendimiento del modelo contra las exploits de origen humano ayuda a apoyar la integración segura en herramientas internas.

    En estos roles, el posicionamiento de GPT-4.1 como un modelo optimizado para mayor claridad, cumplimiento y eficiencia de implementación lo convierte en una opción convincente para empresas medianas que buscan equilibrar el rendimiento con las demandas operativas.

    Un nuevo paso adelante

    Mientras que GPT-4.5 representaba un hito de escala en el desarrollo del modelo, GPT-4.1 se centra en la utilidad. No es el más caro o el más multimodal, pero ofrece ganancias significativas en áreas que importan para las empresas: precisión, eficiencia de implementación y costo.

    Este reposicionamiento refleja una tendencia de la industria más amplia, alejada de la construcción de los modelos más grandes a cualquier costo y hacia los modelos capaces más accesibles y adaptables. GPT-4.1 cumple con esa necesidad, ofreciendo una herramienta flexible y lista para la producción para equipos que intentan integrar la IA más profundamente en sus operaciones comerciales.

    A medida que OpenAI continúa evolucionando sus ofertas de modelos, GPT-4.1 representa un paso adelante en la democratización de IA avanzada para entornos empresariales. Para la capacidad de equilibrio de los tomadores de decisiones con el ROI, ofrece un camino más claro hacia el despliegue sin sacrificar el rendimiento o la seguridad.

    Continue Reading

    Trending