DeepSeek ha sido noticia, y por una buena razón. La controvertida afirmación de que la startup china utilizó sólo 6 millones de dólares en dos meses para construir un modelo de IA conmocionó a los desarrolladores de todo el mundo.
Hizo que las partes interesadas se cuestionaran los miles de millones de dólares gastados en proyectos similares por las empresas tecnológicas estadounidenses.
Sin embargo, empiezan a surgir nuevos datos sobre el coste real del entrenamiento de un modelo de IA como DeepSeek.
La realidad multimillonaria detrás del entrenamiento de IA de DeepSeek
En una actualización compartida con sus 1,2 millones de seguidores en X, David Sacks, Zar de la Inteligencia Artificial y las Criptomonedas de la Casa Blanca, ha rebatido la afirmación.
Sacks calificó de engañoso que la informática de IA de DeepSeek costara sólo 6 millones de dólares.
Sacks hizo referencia a un informe de Dylan Patel, analista de semiconductores conocido por su trabajo en SemiAnalysis.

Patel afirma que DeepSeek habría gastado más de 1.000 millones de dólares en su clúster informático. Esto supone cientos de millones más que la cifra de 6 millones de dólares de la que se ha informado ampliamente.
El Zar de la Inteligencia Artificial y la Criptografía de la Casa Blanca mantuvo que la cifra de 6 millones de dólares sólo corresponde a la última carrera de entrenamiento.
Esta cantidad no tiene en cuenta aspectos críticos de los principales gastos de DeepSeek.
Algunos gastos notables excluidos de la cantidad declarada incluyen los gastos de capital.
Es el coste de comprar y montar el hardware para DeepSeek. También ignora los costes de Investigación y Desarrollo (I+D).
Todos los gastos relacionados con la investigación del modelo de IA, su desarrollo y la optimización de DeepSeek no se calcularon supuestamente en 6 millones de dólares.
Sacks da a entender que el coste de construir el modelo de IA de DeepSeek se sitúa en el rango de los mil millones de dólares.
Calificó los informes sobre los 6 millones de dólares de falsos y engañosos, posiblemente sólo para ganar puntos.
El semianálisis proporciona un desglose más caro
Curiosamente, SemiAnalysis proporcionó un desglose de las supuestas afirmaciones engañosas de DeepSeek.
Insistió en que los 6 millones de dólares sólo corresponden al preentrenamiento de la Unidad de Procesamiento Gráfico (GPU).
Sitúa el coste total real de la infraestructura y los gastos de capital en I+D y servidores en unos 1.300 millones de dólares.
Otra afirmación notable que desacreditó se refiere a los chips. SemiAnalysis señaló que, aunque DeepSeek opera con 50.000 GPU Hopper, no todas son H100 de primer nivel.
Se trata más bien de una mezcla de H100, H800 y H20. Las H20 son la versión china debido a la restricción de exportación de EEUU.
Por rendimiento, el modelo R1 de DeepSeek es comparable al o1 de OpenAI en cuanto a razonamiento de tareas.
Sin embargo, no pasa como líder indiscutible en todos los estándares. Mientras tanto, Gemini Flash 2.0 de Google tiene una capacidad similar y podría decirse que es más barato para el acceso a la API.
En cuanto a la eficiencia de la innovación, la Atención Latente Multicabezal (MLA) reduce enormemente el coste al disminuir el uso de la caché KV en un 93,3%.
En general, el coste de DeepSeek podría caer unas 5 veces a finales de año, lo que favorece a la startup. En particular, este descenso de los costes podría permitir a DeepSeek escalar más rápido que otras empresas del sector.
Sin embargo, SemiAnalysis destacó las restricciones a la exportación de Estados Unidos como un posible obstáculo a las ambiciones de expansión de DeepSeek.
Impacto en el Cripto Sector
Los analistas han opinado que, independientemente del coste real del entrenamiento del modelo de IA de DeepSeek, podría suponer un cambio de juego en el sector de las criptomonedas.
Las cadenas de bloques y los diferentes proyectos de criptomonedas exigirán más eficacia y rentabilidad a los desarrolladores, ya que sugieren que se puede hacer más por menos.
Algunos han sugerido que el sector de las criptomonedas podría ser testigo de nuevas actualizaciones que busquen la escalabilidad y la eficiencia.
Tras la actualización, los tokens de IA entraron en una racha de repuntes. Internet Computer subió un 2,80% a 9,9336 $, Injective subió un 1,82% a 20,40 $, y Near Protocol saltó un 2,2% a 4,616 $.