El mercado global de tecnología y semiconductores está viviendo una jornada histórica tras las pérdidas millonarias de NVIDIA Corporation, cuyas acciones se desplomaron más de un 11% en las operaciones previas a la apertura del mercado. En estos momentos que los mercados ya han abierto, está en un 13% en negativo, cotizando en $124. Este retroceso, que equivale a una pérdida de capitalización bursátil de aproximadamente 385000 millones de dólares, se atribuye al impacto del modelo R1 de DeepSeek, una startup china de inteligencia artificial que ha demostrado ser capaz de entrenar modelos avanzados con costes drásticamente inferiores a los de NVIDIA y otros competidores occidentales.
Mientras algunos analistas expresan preocupación por las consecuencias de los avances de DeepSeek, otros consideran que el impacto será positivo para empresas como NVIDIA. Basándonos en la paradoja de Jevons -que sugiere que mayores eficiencias pueden conducir a un incremento en el consumo-, quizás la demanda de computación podría seguir creciendo. Pero otros adoptan una visión más cautelosa, ya que el éxito de DeepSeek podría reducir la necesidad de los grandes grupos de GPU que dominan actualmente la industria.
Como hemos publicado hace unas horas, el modelo R1 de DeepSeek tiene un coste de entrenamiento de apenas 6 millones de dólares -sobre 1/50 de lo que requieren los modelos líderes en Estados Unidos y Europa-, este modelo se posicionó como una amenaza directa a los gigantes de la industria, mostrando resultados incluso superiores al modelo o1 de OpenAI en algunas métricas. Además, la aplicación basada en R1 se convirtió en la más descargada de la AppStore durante el fin de semana, lo que acrecentó la percepción de los inversores sobre la demanda futura de hardware de alta gama.
Caída generalizada en el sector tecnológico
El desplome de NVIDIA arrastró a otras empresas del sector. ASML, el principal proveedor global de máquinas avanzadas para la fabricación de chips EUV, sufrió una caída del 11% en sus acciones europeas. Desde octubre del año pasado, ASML ya había reportado una disminución acumulada del 22% tras prever una baja en la demanda de equipos para 2025.
Broadcom, otro gigante de los semiconductores, registró pérdidas del 10,5%, lo que equivale a una reducción de 100K millones de dólares en su valoración. Esto contrasta con su desempeño en diciembre pasado, cuando sus acciones subieron un 38% tras anunciar expectativas de ingresos multimillonarios provenientes de ventas de chips para inteligencia artificial en 2027. Sin embargo, los inversores ahora dudan de que esta demanda se materialice, sobre todo tras las revelaciones sobre la eficiencia de los modelos de DeepSeek.
En el caso de AMD, un rival directo de NVIDIA, las acciones bajaron un 5,5%, mientras que Arm Ltd, el británico diseñador de chips, sufrió una caída de casi el 10%. Incluso empresas tecnológicas como Microsoft y Meta se vieron afectadas, con caídas del 6% y 5% respectivamente, al cuestionarse la viabilidad de sus inversiones multimillonarias en infraestructuras relacionadas con la inteligencia artificial. Por su parte, Apple apenas sufrió una pérdida del 1%, al estar menos expuesta a la dinámica del hardware para IA.
La eficiencia del modelo R1 de DeepSeek
Utilizando únicamente 2000 GPU H800, R1 logró resultados equivalentes o superiores a los modelos más avanzados de OpenAI, y con un coste operativo que representa apenas el 3% de lo que normalmente cobra la empresa estadounidense por servicios de computación intensiva.
DeepSeek ha logrado esta eficiencia aplicando métodos novedosos, como:
- Flotantes de 8 bits, que reducen el uso de memoria en un 75%.
- Procesamiento simultáneo de tokens, aumentando la velocidad de cálculo.
- Parámetros activos limitados, optimizando recursos computacionales.
- Aprendizaje por refuerzo con sistemas de recompensa basados en reglas, que permiten al modelo abordar problemas de manera más estructurada.
Estas características reducen los costes de entrenamiento y democratizan el acceso a modelos avanzados de inteligencia artificial, al ser R1 una solución de código abierto.
¿Cómo ejecutar DeepSeek R1 en local con LM Studio?
- Descarga gratis e instala LM Studio 0.3.8 o posterior en tu PC, Mac o Linux.
- A continuación, inicia LM Studio y ves a la ventana de búsqueda en el panel izquierdo.
- Allí, en Búsqueda de modelos, encontrarás el modelo “DeepSeek R1 Distill (Qwen 7B)” (Hugging Face). Haz clic en Descargar. Debes tener al menos 5 GB de espacio de almacenamiento y 8 GB de RAM para utilizar este modelo.
- Una vez descargado, cambia a la ventana “Chat” y carga el modelo. Simplemente selecciona el modelo y haz clic en el botón “Cargar modelo”. Si aparece un error, reduce la “Descarga de GPU” a 0 y continúa.
Ejecuta DeepSeek R1 en local con Ollama
- Descarga gratis e instala Ollama en tu Windows, macOS o Linux.
- Ahora, inicia el Terminal y ejecuta el siguiente comando para ejecutar DeepSeek R1 localmente:
ollama run deepseek-r1:1.5b
Se trata de un modelo pequeño de 1,5 GB derivado de DeepSeek R1 y basado en Qwen para ordenadores de gama baja. Solo utiliza 1,1 GB de memoria. Pero, si tienes una gran cantidad de memoria con un hardware potente, puedes ejecutar modelos de 7B, 14B, 32B o 70B extraídos de DeepSeek R1. Aquí puede encontrar los comandos.
Si quieres ejecutar el modelo destilado 7B DeepSeek R1 en tu ordenador, utiliza 4,7 GB de memoria y ejecuta este comando: ollama run deepseek-r1:7b
Ahora ya puedes chatear con DeepSeek R1 localmente en tu PC directamente desde la Terminal.
Para dejar de chatear con el modelo de IA y salir, utiliza el atajo “Ctrl + D”.
China y su apuesta IA
Al mismo tiempo, China ha redoblado su apuesta por la inteligencia artificial con la promesa de un billón de yuanes (aproximadamente 135K millones de euros) en financiación durante los próximos cinco años. Este esfuerzo tiene como objetivo reforzar la autosuficiencia del país en el ámbito tecnológico, mejorar la infraestructura de datos y acelerar el desarrollo de su industria de inteligencia artificial.
Esta apuesta rivaliza con el proyecto Stargate, en el que Estados Unidos ha invertido 500K millones de dólares para consolidar la infraestructura de IA en los próximos cuatro años.
El “momento Sputnik” de la IA
El modelo R1 de DeepSeek ha sido descrito como el “momento Sputnik” para la inteligencia artificial, en referencia al impacto que tuvo el lanzamiento del primer satélite artificial en la carrera espacial. Esto ha trastocado la complacencia de las empresas tecnológicas occidentales, que durante años habían confiado en los controles de exportación estadounidenses para limitar las capacidades de China en el desarrollo de chips avanzados.
Con una solución más económica y eficiente, DeepSeek ha demostrado que es posible competir con las grandes potencias tecnológicas y ha abierto la puerta a un nuevo desarrollo de inteligencia artificial.