Por Efrén Páez Jiménez

La introducción del modelo fundacional chino DeepSeek causó una mayor disrupción en los mercados financieros al demostrar que se podían ejecutar cargas de trabajo de Inteligencia Artificial Generativa de forma más eficiente, sin tener que gastar miles de millones de dólares en infraestructura.

Aunque su llegada ya provocó una fuerte caída en los principales proveedores de chips, también se está viendo como una nueva oportunidad de ingreso al mercado para aprovechar los beneficios, además de un nuevo incentivo que lo revigorizará.

Tras la liberación de DeepSeek v3 a través de la popular plataforma Hugging Face, el modelo compuesto por 671 mil millones de parámetros rápidamente se colocó entre los primeros números por rendimiento, superando incluso a otros modelos como Llama 3.1 de Meta y Qwen de Alibaba.

La principal novedad es que, a través de diversas técnicas introducidas por los desarrolladores chinos, se logra que el modelo pueda funcionar con sólo unos parámetros seleccionados a la vez, sin perder precisión, pero aumentando significativamente su eficiencia.

Amenaza china

La introducción de DeepSeek, y la aparente muestra de que es tan eficiente y exacto como modelos como ChatGPT de OpenAI, pegó con sorpresa al mercado financiero. Por un lado, esto demostraría que las restricciones de chips no han cumplido totalmente el objetivo de retrasar el avance chino en Inteligencia Artificial (IA), y al mismo tiempo, que tal vez no son tan necesarias las millonarias inversiones en chips que han anunciado algunas compañías estadounidenses para el entrenamiento de sus propios modelos.

Pese a las advertencias de algunos expertos, la expectativa era que las restricciones para el acceso a chips avanzados en contra de China provocarían el retraso del país en sus esfuerzos para el desarrollo de IA.

Sin embargo, desde la imposición de estas restricciones, expertos tanto de Estados Unidos como de China habían advertido que lo único que el gobierno estadounidense provocaría con dichas medidas sería impulsar la innovación del país asiático, la creatividad en el uso de recursos ante el limitado acceso a infraestructura clave y, posiblemente, el desacoplamiento tecnológico entre ambas potencias.

“El último control de las exportaciones sobre la tecnología de Inteligencia Artificial de vanguardia motivará a las empresas chinas a intensificar las inversiones en investigación y desarrollo, mejorar sus capacidades de innovación independientes y lograr avances tecnológicos”, dijo Xiang Ligang, director general de la Alianza Tecnológica de la Industria de Aplicaciones de Consumo de Información Moderna de Zhongguancun, según cita el diario China Daily.

El propio Pat Gelsinger, exCEO de Intel, señaló en un post reciente en LinkedIn, que “la ingeniería se basa en las limitaciones”. Advirtió que pese a ellas, DeepSeek “encontró formas creativas de ofrecer una solución de primera clase en todos los aspectos a un coste entre 10 y 50 veces menor. Las leyes de exportación limitaban los recursos disponibles, por lo que los ingenieros chinos tuvieron que ser creativos y lo hicieron. No necesitaban 10 mil millones de dólares en hardware y los últimos chips, ni un presupuesto de formación de varios miles de millones de dólares”.

En ese sentido, DeepSeek se considera como la última muestra de que China probablemente esté más avanzada en sus ambiciones de desarrollo de IA, que lo estimado por el propio gobierno estadounidense, y con o sin las restricciones impuestas para el acceso a infraestructura.

El propio Eric Schmidt, exCEO de Google, había advertido a principios del año pasado que la industria de Inteligencia Artificial de los Estados Unidos se encontraba al menos 2 a 3 años por delante de China, confiando en que las restricciones de acceso a chips tendrían un mayor efecto. No obstante, el mismo directivo reconoció su sorpresa del avance del país asiático al ver los avances en IA de empresas como Alibaba y Tencent, según cita Time.

Cabe recordar que desde 2023, la propia industria de semiconductores de Estados Unidos había criticado severamente las restricciones impuestas para la exportación de chips a China. En el corto plazo limitaba el acceso a fabricantes estadounidenses a uno de los mercados más grandes a nivel global, pero en el largo plazo amenazaba con limitar la hegemonía de la tecnología estadounidense en el resto del mundo.

En ese sentido, no es descabellado pensar que la llegada de un modelo como DeepSeek, que además trabaja bajo el modelo Open Source, podría atraer el interés de ciertas naciones por la tecnología china, especialmente si ofrece una mayor eficiencia de recursos frente a los demandantes modelos estadounidenses.

Al respecto, se puede citar también la última ronda de restricciones impuestas por el gobierno de Joe Biden, que limitó significativamente la capacidad de cómputo que regiones como Europa del Este o América Latina pueden adquirir de los Estados Unidos. Frente a la restricción de acceso a tecnología estadounidense y la posibilidad de utilizar tecnología china más económica y menos demandante de recursos, la elección no parece tan complicada.

Posible oportunidad

La introducción de DeepSeek, y su formato de operación más eficiente, también provocó dudas entre los inversionistas sobre el potencial de crecimiento de ciertas compañías diseñadoras de chips como Nvidia y AMD, que en el último par de años han apalancado el crecimiento de sus ingresos sobre la demanda de cómputo para Inteligencia Artificial. Estas dudas se sumaron a las ya existentes provocadas por las restricciones de ventas a China.

Desde la introducción de ChatGPT, modelo fundacional de OpenAI al mercado, ha crecido la fascinación de empresas y usuarios por el uso de la IA Generativa, que ahora puede realizar múltiples tareas, desde una simple redacción o corrección de un correo electrónico, hasta la generación de código. Rápidamente, otras tecnológicas como Microsoft, Google y Meta introdujeron sus propios asistentes que buscaban atender nuevos casos de uso dentro de sus propias plataformas.

Esta fascinación por la IA Generativa vino acompañada de un fuerte gasto en infraestructura, principalmente unidades de procesamiento gráfico (GPU) y neuronal (NPU) instalados en masivos centros de datos para proveer la capacidad de procesamiento necesaria para atender toda clase de peticiones de los usuarios. Se estima que tan sólo en 2023, se invirtieron 23 mil millones de dólares en IA Generativa, monto que continuó en aumento con fuertes anuncios de gasto por parte del sector.

Compañías como Nvidia, AMD y Broadcom, algunos de los principales fabricantes de chips y aceleradores para IA, se beneficiaron de este creciente interés en la IA. En el último año, los títulos de Nvidia duplicaron su valor (111%), mientras que los de Broadcom se elevaron en 72 por ciento. La lógica era que a más demanda de IA, continuaría la demanda de chips, y por tanto, las utilidades seguirían fluyendo de estas compañías. Hasta su último año fiscal de 2024, Nvidia generó un margen bruto superior al 72 por ciento y un margen neto de 48 por ciento.

El propio Mark Zuckerberg, presidente y CEO de Meta, había revelado que Llama 4, la próxima generación de su modelo grande de lenguaje (LLM), requeriría hasta 10 veces más capacidad de procesamiento que su modelo actual, Llama 3.1. Claramente, eran buenas noticias para los fabricantes de chips y otra infraestructura requerida para atender esta demanda.

Por un lado, la posibilidad de que existan modelos como DeepSeek, que demandarían una menor cantidad de infraestructura, puso en alerta a los inversionistas respecto al potencial de empresas de chips. Sin embargo, el recorte a las cotizaciones que sucedió recientemente y la realización de que China estaría más avanzada de lo estimado, son también consideradas como un incentivo para el continuo crecimiento de la industria.

“El r1 de DeepSeek es un modelo impresionante, sobre todo teniendo en cuenta lo que ofrece por el precio. Obviamente, ofreceremos modelos mucho mejores y, además, ¡es estimulante tener un nuevo competidor! Sacaremos algunos lanzamientos”, declaró Sam Altman, CEO de OpenAI.

De hecho, mientras que había algunas advertencias de que títulos como los de Nvidia ya se consideraban caros, la reciente caída provocada por China fue vista por algunos inversionistas y analistas como la oportunidad para aprovechar las utilidades generadas por la IA a un menor precio de entrada. Los títulos de Nvidia recuperaron 9 por ciento de su valor al día siguiente del pánico provocado por DeepSeek.

El grupo de inversión Oakoff Investments indicó en una nota a inversionistas que subiría la calificación de Nvidia a “Comprar”, “al considerar la caída como una oportunidad de compra en medio del pánico del mercado por los avances de DeepSeek en Inteligencia Artificial”.

El grupo de inversión señala que, aun cuando el modelo chino demuestra una mayor eficiencia, la realidad es que su éxito se basa también en el uso de las GPU H800 de Nvidia, lo que “pone de relieve el papel fundamental de Nvidia en la IA”, y “sugiere un aumento de la demanda futura de sus GPU por parte de las empresas tecnológicas estadounidenses”.

Cantor, grupo financiero estadounidense, coincide en que la eficiencia de DeepSeek no significa menos venta de GPUs. Los avances en IA probablemente conducirán a que “la industria de la IA quiera más computación, no menos”, señala el grupo, según cita CNBC. De la misma forma, subieron su recomendación a “Compra” para Nvidia.

“Las GPU de Nvidia siguen siendo las mejores de su clase; el avance de DeepSeek tiene más que ver con la capacidad de ingeniería que con el hardware, lo que podría impulsar más inversiones en infraestructura de IA”, añadió el fondo Oakoff.

Las recientes inversiones anunciadas por OpenAI y SoftBank de 500 mil millones de dólares para la joint venture Stargate, así como 65 mil millones de dólares adicionales de Meta para la construcción de un centro de datos con capacidad de 1 GW, sin duda apuntan a que continuará el gasto en infraestructura de IA. Y mientras permanece la amenaza del liderazgo chino, esto sólo servirá como un incentivo más para la industria estadounidense de acelerar sus inversiones.

“DeepSeek es una increíble obra de ingeniería que marcará el comienzo de una mayor adopción de la IA. Ayudará a reajustar la industria en su visión de la innovación abierta. Hizo falta un equipo muy limitado de China para recordarnos todas estas lecciones fundamentales de la historia de la computación”, puntualizó Gelsinger.

Save
Cookies user preferences
We use cookies to ensure you to get the best experience on our website. If you decline the use of cookies, this website may not function as expected.
Accept all
Decline all
Analytics
Tools used to analyze the data to measure the effectiveness of a website and to understand how it works.
Google Analytics
Accept
Decline
Unknown
Unknown
Accept
Decline