La IA se acaba de volver 99,99 por ciento más barata
Gale L. Pooley sostiene que al optimizar la eficiencia, reducir los requisitos de hardware y adoptar un enfoque de sistema experto, DeepSeek ejemplifica cómo el progreso tecnológico impulsa la abundancia.
Escucha la noticia
Por Gale L. Pooley1
Resumen: Al igual que el telégrafo puso fin al Pony Express a través de una repentina innovación transformadora, los avances de la IA de DeepSeek suponen un salto adelante que desafía a gigantes de la industria como OpenAI. Al optimizar la eficiencia, reducir los requisitos de hardware y adoptar un enfoque de sistema experto, DeepSeek ejemplifica cómo el progreso tecnológico impulsa la abundancia.
La innovación puede producirse en ráfagas espectaculares, como cuando el telégrafo sustituyó al Pony Express. Este emblemático cartero redujo a la mitad los tiempos de entrega anteriores y reinó durante 18 meses como la forma más rápida de hacer llegar información a todo Estados Unidos. El Pony Express se introdujo el 3 de abril de 1860 y repartía correo entre St. Joseph, Missouri, y Sacramento, California. Joseph, Missouri, y Sacramento, California. La ruta de 3.000 kilómetros duraba aproximadamente 10 días, con jinetes que recorrían entre 75 y 100 kilómetros cada uno y cambiaban de caballo cada 10 ó 15 kilómetros.
Western Union erigió los primeros postes telegráficos el 4 de julio de 1861. La construcción tardó 112 días en completar el primer sistema electrónico de comunicación transcontinental el 24 de octubre de 1861. Dos días después, el Pony Express dejó de funcionar.
El telégrafo redujo el tiempo necesario para entregar un mensaje en un 99,93%, de 10 días a 10 minutos. Enviar un mensaje se hizo un 1.439.900 por ciento más rápido.
¿Estamos asistiendo a otra innovación de ponis a electrones entre OpenAI y DeepSeek? Tal vez.
Peter Diamandis ha señalado que DeepSeek se fundó hace menos de dos años. Con sólo 200 empleados y 5 millones de dólares, DeepSeek ha desarrollado un nuevo sistema de inteligencia artificial (IA). En comparación, OpenAI se fundó hace 10 años, tiene unos 4.500 empleados y ha recaudado 6.600 millones de dólares en capital. Gigantes de la tecnología de IA como OpenAI y Anthropic han gastado 100 millones de dólares o más para entrenar sus modelos. DeepSeek ha igualado sus sistemas por un 95 por ciento del costo. Una reducción del 95 por ciento en el costo significa que ahora se obtienen 20 por el precio de uno, lo que supone un aumento del 1.900 por ciento en abundancia. DeepSeek ha hecho esto con tres innovaciones:
1. Precisión reimaginada. En lugar de utilizar un exceso computacional (32 decimales), han demostrado que 8 decimales son suficientes. ¿El resultado? Un 75% menos de memoria. A veces, las innovaciones más poderosas surgen de cuestionar los supuestos más básicos.
2. La revolución de la velocidad. La IA tradicional se lee como un niño de primer grado: “El… gato… se sentó…”. Pero el sistema multitoken de DeepSeek procesa frases enteras simultáneamente: 2 veces más rápido con un 90 por ciento de precisión. Cuando estás procesando miles de millones de palabras, esto es transformador.
3. El sistema experto. En lugar de una IA masiva que intenta saberlo todo (imagina que una persona fuera médico, abogado e ingeniero), construyeron un sistema de especialistas. Los modelos tradicionales se basan en 1,8 billones de parámetros activos todo el tiempo. DeepSeek, en cambio, depende de 671.000 millones en total, pero sólo 37.000 millones están activos a la vez (un 97,9% menos).
Diamandis señala más resultados asombrosos de las innovaciones de DeepSeek:
- Los costos de entrenamiento se han reducido de 100 a 5 millones de dólares;
- Reducción de los requisitos de GPU de 100.000 a 2.000 GPU;
- reducción del 95 por ciento de los costos del API (interfaz de programación de aplicaciones);
- se ejecuta en GPU de juegos en lugar de hardware especializado; y
- se ha hecho con un equipo de menos de 200 personas, no de miles.
El sistema DeepSeek es de código abierto, lo que significa que cualquiera puede verificar, desarrollar e implantar estas innovaciones. Puedes descargarte la nueva aplicación en tu iPhone.
Beneficio adicional: la IA tiene ahora un contrapunto a los ecologistas que dicen que la IA consume mucha electricidad. DeepSeek acaba de reducir el costo de la inferencia en un 97%.
Cathie Wood, de ARK Investment, ha observado que “en los últimos años, los costos de entrenamiento e inferencia de la IA han disminuido un 75% y un 85-90%, respectivamente. Puede que DeepSeek esté acelerando el ritmo del cambio, pero los descensos ya son espectaculares. Un descenso más rápido de los costos se sumará a la demanda, más para la inferencia, un espacio de GPU más competitivo que la formación, y uno de los matices”.
La ley de Moore sugiere que la abundancia de transistores de ordenador se duplica cada dos años. Eso indicaría una tasa compuesta de alrededor del 41, 4% anual. El costo de entrenar un sistema de IA para reconocer imágenes cayó un 99,59 por ciento, de 1.112,64 dólares en 2017 a 4,59 dólares en 2021. Esto indicaría una tasa compuesta del 295 por ciento anual. La IA está creciendo más de siete veces más rápido que la ley de Moore.
Nvidia lidera el desarrollo de estos sistemas y su CEO, Jensen Huang, ha afirmado que el rendimiento del procesamiento de IA ha aumentado en “nada menos que un millón en los últimos 10 años”. Esto supone una tasa anual compuesta del 298%. Espera que este ritmo continúe durante los próximos 10 años. Eso significaría que pasaremos de uno a un billón en veinte años. Estaremos 976 millones de veces por delante de la ley de Moore. Bastante asombroso.
El Pony Express necesitaba muchos caballos rápidos y jinetes flacos. El telégrafo era una plataforma totalmente nueva que utilizaba cables, baterías y postes. DeepSeek podría ser la Western Union del Pony Express.
¿Y qué hay de Stargate, una iniciativa estadounidense de 500.000 millones de dólares para infraestructuras de IA liderada por Sam Altman, de OpenAI, Larry Ellison, de Oracle, y Masayoshi Son, de Softbank? Quieren gastar 100.000 veces más de lo que DeepSeek ha gastado hasta ahora. ¿Será su producto 100.000 veces más valioso?
Satya Nadella, CEO de Microsoft, mencionó la paradoja de Jevon en relación con DeepSeek. El 26 de enero de 2025, en X, dijo: “¡La paradoja de Jevons ataca de nuevo! A medida que la IA se haga más eficiente y accesible, veremos cómo su uso se dispara, convirtiéndola en una mercancía de la que nunca tendremos suficiente”.
El 6 de enero, Nvidia anunció su nueva línea Nano de hardware de desarrollo de IA a partir de 259 dólares y su nuevo Proyecto DIGITS como el “superordenador de IA más pequeño del mundo capaz de ejecutar modelos de 200-B parámetros” y cuyo precio se espera que ronde los 3.000 dólares. Entre el software de código abierto de DeepSeek y el hardware de Nvidia, el mundo podría experimentar una brillante eflorescencia de superabundancia en el aprendizaje.
Esperamos ver cómo la IA consigue avances espectaculares en nuestra capacidad para descubrir nuevos conocimientos valiosos, pero también nos daremos cuenta de que la única inteligencia artificial hasta ahora ha sido la humana. Si los seres humanos tienen libertad para innovar, el potencial de creación de recursos es infinito.
Más información sobre el trabajo de Gale en su Substack, Gale Winds.
1Gale L. Pooley es un profesor asociado de economía en Brigham Young University, Hawaii.
*Artículo publicado en elcato.org el 13 de febrero de 2025