Deep Seek, una IA para profundizar el enfrentamiento entre China y Estados Unidos

27 de enero; de la noche a la mañana, NVIDIA, compañía líder en el diseño de tarjetas gráficas, pierde casi 600 billones de euros en el mercado, un 17 % de su valor. Millones de personas muy ricas se levantan siendo algo menos ricas. ¿La razón? Un artículo científico de la empresa china DeepSeek demuestra que es capaz de entrenar un modelo de inteligencia artificial que alcanza el mismo nivel de rendimiento con un coste 100 veces inferior al del último modelo de la estadounidense OpenAI. Además, la empresa china lanza el modelo de forma abierta y disponible para todo el mundo, justo al contrario que los modelos de OpenAI, que de «open» tienen solo el nombre. Así, con este artículo científico, DeepSeek pone en duda dos consensos dentro del mundo de la inteligencia artificial: primero, la supremacía americana en la IA; segundo, la necesidad de mayor capacidad de computación, es decir, de más y mejores tarjetas gráficas, para entrenar los nuevos modelos de razonamiento que habían empezado a ser publicados a finales de 2024.

Para entender este terremoto y sus profundas ramificaciones en las relaciones entre bloques imperialistas hay que remontarse a principios de 2012, cuando estalla la revolución de las redes neuronales artificiales profundas y, posteriormente, la de los primeros modelos generadores de lenguaje. Estos modelos son capaces de predecir cuál es la siguiente palabra más probable a partir de un conjunto de palabras anteriores. Estas capacidades de predicción los dotan de ciertas habilidades de resolución de problemas con potencialidad de automatizar numerosas tareas. Por ejemplo, imaginemos una novela policíaca en la que la última palabra de toda la novela es el nombre del asesino. Su predicción correcta implica cierto grado de razonamiento. OpenAI saltó a la fama gracias al desarrollo de este tipo de modelos, convirtiéndose en líder del campo tras la publicación de GPT3 y firmando una alianza estratégica con Microsoft que ha hecho que sus modelos se incorporen en múltiples productos de esta compañía.

Hay que recordar, porque es fácil olvidarlo, que todo sistema informático funciona sobre un sustrato físico. Si bien las redes neuronales profundas se conocían desde los años 60, su desarrollo masivo se da a partir de 2010 debido a que las tarjetas gráficas, en principio diseñadas especialmente para softwares de simulación y videojuegos, se habían desarrollado lo suficiente como para entrenar redes neuronales con muchos más parámetros, esto es, más grandes. La empresa clave en este componente físico de la IA es NVIDIA, una compañía americana dedicada al diseño de las tarjetas gráficas que puso mucho empeño en hacer que sus tarjetas fueran fácilmente configurables por los programadores. Los aciertos de NVIDIA provocaron que adquiriese una posición prácticamente de monopolio. Muestra de ello es que, de 2012 a 2025, las acciones de NVIDIA aumentaron su valor un 40.881,25%. Este aumento ha sido correlativo al desarrollo de las redes neuronales profundas que, conforme iban demostrando su capacidad de fulminar problemas en reconocimiento de patrones, resolución de problemas y en generación de contenido, también iban produciendo un aumento de la demanda de tarjetas gráficas.

En este contexto de modelos cada vez más hábiles y una necesidad de mayor capacidad de cómputo y con ello de tarjetas gráficas, surge en verano de 2024 una nueva técnica que vuelve a revolucionar el paradigma de los modelos generativos. Resumiendo, esta técnica consiste en que cuando se pide una respuesta al modelo, ya sea ChatGPT, Gemini o DeepSeek, este se toma un «tiempo extra» para pensar la respuesta. Inspirados por esta idea, OpenAI saca su primer modelo de razonamiento o1 en septiembre de 2024, mejorando de manera salvaje las puntuaciones en distintos exámenes diseñados para comprobar la capacidad de razonamiento de estas inteligencias artificiales. Esta mejora tiene un coste: un aumento general de computación, para lo que se requiere gastar mucha más energía, comprar más gráficas y, con ello, más negocio para NVIDIA. Si el camino hacia una IA más potente va a ser siempre hacer computaciones más intensivas, quien produzca las gráficas tiene el futuro asegurado.

Es aquí cuando DeepSeek rompe la baraja en enero. La compañía china ya había desarrollado modelos competitivos, pero inferiores a los de OpenAI, situándose como un actor relevante en el mundo de la IA en el último año. Al sacar su modelo de razonamiento r1 y desvelar su precio y capacidades, similares a las del modelo o1, pasaron de actor relevante a competidor directo. El secreto de su éxito, lejos de las acusaciones propagandísticas y técnicamente estúpidas de copiar o usar respuestas de ChatGPT para entrenar al modelo, está en haber optimizado de forma brillante y altamente sofisticada el código de la IA, de forma que consiguen hacer más con menos y, por tanto, bajar los precios mientras que se mantienen las capacidades. Con esto demuestran que el tener más tarjetas gráficas más potentes no es el único camino que se puede seguir para mejorar los actuales modelos, sino que existe un amplio margen para la optimización del código, relajando así las aspiraciones comerciales de NVIDIA.

Más allá del avance técnico, por primera vez en el desarrollo de este tipo de modelos es un equipo chino el que lleva la delantera. Además, un equipo con pocas vinculaciones con el exterior en términos de empleados que hayan recibido su formación en los EE.UU. o Europa y con financiación exclusivamente china. De esta manera, China demuestra que es capaz de desarrollar talento científico y tecnológico al nivel de sus competidores sin necesidad de pasar por las instituciones occidentales, un hito en su carrera a primera potencia mundial que ningún otro de los llamados países en desarrollo ha podido igualar.

Este éxito de China supone además una crisis de confianza en la estrategia de EE.UU. hacia la inteligencia artificial. El Gobierno de Biden impuso en 2022 fuertes restricciones en las importaciones de tarjetas gráficas de NVIDIA a China para limitar su avance en tecnología. Esto ha hecho que los rumores de cómo DeepSeek ha conseguido entrenar pese a estas restricciones se hayan disparado: ¿se ha saltado China las restricciones por medio de la compra de tarjetas a Singapur? ¿Han provocado estas restricciones que las empresas chinas busquen optimizar al máximo estas tarjetas? En cualquier caso, se puede decir que la estrategia de EE.UU. de torpedear el avance en IA a China mediante la imposición de restricciones no ha funcionado. Es más, la liberación del modelo por parte de DeepSeek de manera que lo puede usar todo el mundo amenaza directamente a la estrategia comercial de OpenAI, y con ello, a una parte de las empresas cuyos beneficios descansan en el rentismo tecnológico.

Los magnates tecnológicos de EE.UU. reciben la mayoría de sus ingresos a través de la protección de la propiedad intelectual y de su condición de monopolios naturales, situación muy común en el campo digital. Si los modelos privados como Gemini de Google o ChatGPT de OpenAI eran los únicos modelos de IA disponibles y de mayor calidad, esto les permitía fijar las condiciones de venta fácilmente y extraer rentas de todo el mundo a través de internet. De esta manera, el que exista un modelo tan bueno como estos dos, pero libre, y que se puede ejecutar en sus versiones más ligeras en ordenadores de sobremesa, torpedea la estrategia de OpenAI y, por tanto, las expectativas de negocio de sus inversores. De esta manera, la libre competencia empieza a ser un problema cuando el competidor es el país que te disputa el puesto número uno en la pirámide imperialista, y es ahí donde entran el Estado y la política proteccionista.

La proximidad que han mostrado todos los grandes empresarios tecnológicos a Trump durante y tras su investidura no ha sido casualidad. En un contexto de mayor competitividad donde China está dispuesta a luchar por apropiarse de parte de las rentas que se redirigen de todo el mundo a EE.UU., la regulación estatal actúa como palanca para contrarrestar los efectos de la libre competencia. En consecuencia, durante este año y los que vienen, es posible que veamos llamamientos constantes a la regulación de la inteligencia artificial, a veces de formas bastante esotéricas, que tendrán de fondo esta intención de limitar la libre competencia. Unos llamamientos que no serán uniformes entre los empresarios, ya que también existen empresas como Meta que apuestan por una IA libre que garantice una mayor velocidad de innovación. También veremos mayores capacidades de nuestros teléfonos móviles y ordenadores para ejecutar modelos de IA gracias a las optimizaciones impulsadas por todos esos capitales que intentan huir del rentismo en la nube de Google o de la dependencia en NVIDIA. Aunque parezca contradictorio, la posición de NVIDIA en el mercado seguirá asentándose y creciendo, pues si algo demuestra el capitalismo es que cada mejora en eficiencia energética sirve para aumentar el consumo en el largo plazo.

Para concluir, este conflicto creciente en las tecnologías de IA entre EE.UU. y China no deja de ser uno de los muchos campos de batalla entre estas dos potencias. Conforme se acentúa esta batalla, Silicon Valley va perdiendo progresivamente su idealizado espíritu hippie, liberal y a favor de la competencia sustituyéndolo por el conservadurismo ideológico, el proteccionismo y la regulación del mercado. Así, que a nadie le extrañe si cada vez más gurús tecnológicos cambian las microdosis de LSD comunes entre los programadores de San Francisco por las misas evangélicas masivas y el odio a las personas trans de los predicadores extremistas del Bible Belt.

Uso de cookies

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.plugin cookies

ACEPTAR
Aviso de cookies