«Mayor inversión no necesariamente es igual a mayor innovación”. El autor de la frase, pronunciada en 2023 cuando Microsoft anunciaba un plan de inversión de 13.000 millones de dólares en OpenAI, es Liang Wenfeng, creador de DeepSeek, la startup china que amenaza con dar vuelta la provisión mundial de inteligencia artificial y pone en duda el liderazgo de Estados Unidos en la innovación tecnológica.
Nadie sabe a ciencia cierta cuánto costó crear DeepSeek, pero según un informe de Incred Research, las técnicas avanzadas de procesamiento de datos desarrolladas por el unicornio chino le permiten entrenar su modelo con costos estimados de sólo seis millones de dólares. Una cantidad que resulta ínfima comparada con otros indicadores del mercado de la IA. Por caso, en enero, Microsoft anunció que proyecta invertir 80.000 millones de dólares en centros de procesamiento de datos.
Liang, un ingeniero que nunca salió a estudiar o trabajar fuera de China continental, fundó DeepSeek en 2023 luego de un fracaso: un año antes su fondo de cobertura quant Zhejiang High-Flyer Asset Management —que proponía inversiones basadas en predicciones IA— tuvo que disculparse con sus inversores por una descomunal caída en los rendimientos de sus activos, que se redujeron en más de un tercio, desde un máximo de 12.000 millones de dólares.
DeepSeek se convirtió en la app gratuita más descargada en los Estados Unidos, superó a ChatGPT de OpenAI y provocó un desplome de las acciones de varios gigantes tecnológicos americanos.
El 27 de enero, a 20 meses de su fundación y una semana después de su lanzamiento en el mundo occidental, DeepSeek se convirtió en la app gratuita más descargada en los Estados Unidos, superó a ChatGPT de OpenAI y provocó un desplome de las acciones de varios gigantes tecnológicos americanos, como Microsoft, Meta y el fabricante de chips de IA Nvidia.
Mientras el publicitado bajo costo de DeepSeek gana fanáticos en todos los continentes, sus rivales planean contraatacar con dólares. OpenAI se unió a otros magnates de inteligencia artificial occidentales y se comprometió a invertir 500.000 millones de dólares en infraestructura IA en Estados Unidos.
Menos es más
¿Qué es lo que hace a DeepSeek un gol de marketing? “Hace más con menos, lo que la vuelve extremadamente competitiva frente a otras IA similares”, resumió Eduardo Laens, CEO de Varegos, una empresa especializada en hiperautomatización de procesos y gestiones. Asegura que DeepSeek pateó el tablero en varios sentidos. “Como punto de partida, tiene un alto desempeño comparativo con respecto de sus competidores, como ChatGPT, Claude, Llama o Gemini. En evaluaciones independientes ha obtenido resultados equivalentes o superiores a los de los modelos antes citados en tareas de matemáticas, programación y razonamiento complejo”, explicó.
DeepSeek logra ese rendimiento utilizando mucho menos recursos y presupuesto. “La empresa afirma haber entrenado su modelo principal con sólo seis millones de dólares, frente a los más de 100 millones que costó entrenar GPT-4 de OpenAI, y usó 2.000 chips de GPU en lugar de los 25.000 que empleó OpenAI. En la práctica, esto se traduce en un servicio hasta 40 veces más barato que alternativas similares, lo que forzó, incluso, a competidores a bajar sus precios”, siguió Laens.
“Es como si alguien hubiera encontrado la forma de fabricar un Ferrari con el costo de un Fiat 600”, definió Alan Daitch, CEO de la plataforma de créditos Tasa Tasa y especialista en IA. “La empresa china implementó estrategias técnicamente brillantes y opacó el campo de la IA en un terreno en el que parecía que solamente era Estados Unidos quien lideraba. El resultado es contundente: modelos que compiten de igual a igual con los gigantes del sector, pero requiriendo apenas el 2% de las GPU (procesadoras)”, detalló.
La eficiencia de la startup china no sólo se traduce en costos. El modelo significa una opción más sostenible en un mundo que ya empieza a cuestionarse las emisiones de la IA y sus apps masivas, como Chat GPT. El consumo de energía de GPT-4 alcanza, e incluso supera, los 400 MWh (megavatio-hora) en su entrenamiento. En cambio, DeepSeek necesita unos 100 MWh para su aprendizaje, lo que supone un ahorro del 75% de energía.
Y como si todo esto no fuera suficiente, se lanzó como una plataforma de código abierto. “Esto significa que sus modelos están disponibles para que cualquiera en el mundo los examine, utilice, adapte libremente y los ejecute localmente en sus propios servidores. Esta apertura tiene dos ventajas: por un lado, acelera la innovación colaborativa, porque atrae talentos globales para mejorarlo; por otro, democratiza el acceso a la IA avanzada, porque permite que investigadores individuales, startups o pequeñas organizaciones aprovechen herramientas poderosas que antes estaban fuera de su alcance por costo”, explicó Laens.
“Hoy por hoy, DeepSeek está en boca de todo el mundo porque, en términos de costos, muestra un diferencial, también porque es un nuevo jugador que salió con mucha fuerza a la cancha pero creo que, por sobre todas las cosas, la alta exposición tiene más que ver con cuestiones políticas internacionales que por los otros motivos”, analizó Juan Pablo Di Tommaso, cofundador y CEO de Centum, una empresa tecnológica de gestión empresarial con más de 950 módulos integrados para profesionalizar los procesos de las compañías.
“La llegada de DeepSeek fue un golpe para las plataformas de generative AI existentes y una sorpresa para todos, no la vimos venir. Y todos pensamos: rompieron el molde. El tiempo pasó y DeepSeek comenzó a mostrar la hilacha”, afirmó Julio César Blanco, miembro de Interact, una asociación argentina que nuclea a más de 90 agencias, consultoras y productoras del ecosistema digital.
Blanco aseguró que la app china presentó varias desventajas que generaron preocupación entre los usuarios y, principalmente, entre los expertos. “En primer lugar, la gestión de la privacidad y seguridad de los datos es un tema crítico, ya que toda la información recopilada se almacena en servidores ubicados en China, lo que ha generado investigaciones en varios países, incluso ya se habla de bloqueo en su uso”.
Hay un sesgo en las respuestas del DeepSeek “Pruebas muy sencillas han demostrado que el modelo ha sido adoctrinado con sesgos propios del gobierno chino, como evitar contestar sobre ciertas cuestiones de geopolítica o debates que infrinjan lo que ese país define como sus bases primordiales. Debido a esto, se recomienda usar estas herramientas con supervisión humana, especialmente en caso de uso críticos, donde pueda haber un costo moral, ético, monetario o legal”, agregó Laens.
“Mientras OpenAI sigue avanzando con sus modelos cerrados, DeepSeek apuesta por un enfoque más abierto, eso permite a la comunidad explorar sus límites. Me pregunto si no estamos ante una nueva ola de innovación colaborativa”, destacó Daniel Jejcic, CEO de avenida+, una empresa argentina especializada en la creación de marketplaces y líder en tiendas bancarias.