Satya Nadella, el director general de Microsoft, lo tiene muy claro: "El nuevo modelo de DeepSeek es realmente impresionante tanto por cómo han logrado desarrollar de una manera efectiva un modelo de inteligencia artificial (IA) de código abierto que realiza cálculos en tiempo de inferencia como por su increíble eficiencia computacional. Debemos tomarnos los desarrollos procedentes de China muy, muy en serio [...] A medida que la IA se vuelve más eficiente y accesible veremos que su uso se dispara, convirtiéndose en una mercancía de la que no podremos prescindir".
En esta declaración a Fortune, Nadella da crédito al triunfo tecnológico que ha alcanzado la compañía china DeepSeek. Y le honra que lo reconozca sin ambigüedad, especialmente si tenemos presente que Microsoft es uno de los competidores de la industria de la IA que hace apenas unas horas ha presenciado cómo su valor en la Bolsa ha caído de una forma abrupta después de la irrupción de DeepSeek R1. Sea como sea podemos estar seguros de que en gran medida este modelo de IA es el resultado de la presión que las sanciones de EEUU están ejerciendo sobre las empresas chinas.
Jensen Huang, el fundador y director general de NVIDIA, lo anticipó en una de las declaraciones que hizo a finales de mayo de 2023 en Computex: "China está dedicando unos recursos masivos a la puesta en marcha de empresas emergentes especializadas en el desarrollo de GPU. No las subestiméis". Esta advertencia estaba dirigida al Gobierno de EEUU en un claro intento de prevenirle acerca de las consecuencias que tendrán las sanciones que persiguen frenar el desarrollo tecnológico de China. Huang habla de los diseñadores chinos de GPU, pero su declaración puede extrapolarse a las empresas chinas que desarrollan modelos de IA. Al fin y al cabo en este ámbito las GPU y los grandes modelos de lenguaje van de la mano.
EEUU va a seguir liderando en IA
Buena parte de las sanciones aprobadas por la Administración liderada por Joe Biden a partir del 7 de octubre de 2022 persigue ralentizar el desarrollo de la industria de los semiconductores china, y también de su tecnología de IA. De hecho, como acabamos de ver, los circuitos integrados y la IA van de la mano. Estas prohibiciones impiden a NVIDIA, AMD o Intel, entre otros fabricantes de chips para aplicaciones de IA, vender a sus clientes chinos sus GPU más avanzadas. Este es presumiblemente el germen del mayor logro de DeepSeek.
Según DeepSeek la infraestructura utilizada para entrenar su modelo de IA aglutina 2.048 chips H800 de NVIDIA
Si nos ceñimos a la información que ha hecho pública esta compañía china la infraestructura utilizada para entrenar DeepSeek R1 aglutina 2.048 chips H800 de NVIDIA. Y el entrenamiento con 671.000 millones de parámetros ha costado 5,6 millones de dólares. Esto es, precisamente, de lo que habla Satya Nadella en las declaraciones que hemos revisado unas líneas más arriba. Estas cifras son extremadamente comedidas. Algunos analistas defienden que, en realidad, su infraestructura aglutina 50.000 GPU H100 compradas a través de intermediarios, pero por el momento es solo una conjetura.
Si damos por buenas las declaraciones que han hecho los portavoces de DeepSeek a Financial Times, y por el momento es razonable hacerlo, la razón por la que sus ingenieros han montado su infraestructura de entrenamiento sobre las GPU H800 de NVIDIA es que las sanciones de EEUU les han impedido acceder a los chips H100, que son más potentes. Las prohibiciones del 16 de noviembre de 2023 impiden a NVIDIA entregar a sus clientes chinos las GPU H800, pero presumiblemente en ese momento DeepSeek ya tenía montada su infraestructura. En cualquier caso, en esta coyuntura lo meritorio es que con un chip para IA relativamente modesto esta empresa china ha materializado un logro notable.
El indiscutible éxito de DeepSeek es una victoria para China, pero se trata de una victoria parcial. Esta guerra tecnológica por el momento la va ganando EEUU. Su ventaja reside en una realidad inapelable: el país liderado por Donald Trump controla tanto la mayor parte de los fabricantes de GPU como muchas de las empresas que se dedican a desarrollar modelos de IA. Y estas últimas tienen acceso sin restricciones a las GPU más avanzadas producidas por NVIDIA y otras compañías.
China cuenta con las GPU de Huawei, que parecen ser muy competitivas en procesos de inferencia, y también con las de empresas como Moore Threads, MetaX, Biren Technology, Innosilicon, Zhaoxin, Iluvatar CoreX, DenglinAI o Vast AI Tech, entre otras. Pero, por el momento, se encuentra en una posición de clara desventaja. Aun así, esta confrontación va para largo, por lo que cualquier conclusión a la que lleguemos acerca de qué país va a imponerse finalmente en el dominio de la IA, si es que lo logra alguno, sería prematura.
Imagen | NVIDIA
Más información | Fortune | Financial Times
Ver 15 comentarios