spot_img
google-news-img

DeepSeek Faktencheck: Das sind die wahren Kosten für das Training von KI-Modellen

DeepSeek war in den Nachrichten, und das aus gutem Grund. Die umstrittene Behauptung, dass das chinesische Startup innerhalb von zwei Monaten nur 6 Millionen Dollar für den Aufbau eines KI-Modells verwendet hat, hat Entwickler auf der ganzen Welt schockiert.

Das brachte die Beteiligten dazu, die Milliarden von Dollar in Frage zu stellen, die von amerikanischen Technologieunternehmen für ähnliche Projekte ausgegeben werden.

Es gibt jedoch neue Erkenntnisse über die tatsächlichen Kosten des Trainings eines KI-Modells wie DeepSeek.

- Advertisement -

Die Milliarden-Dollar-Realität hinter dem KI-Training von DeepSeek

In einem Update, das er mit seinen 1,2 Millionen Followern auf X teilte, hat David Sacks, der KI- und Krypto-Zar des Weißen Hauses, die Behauptung zurückgewiesen.

Sacks bezeichnete es als irreführend, dass die KI-Berechnungen von DeepSeek nur 6 Millionen Dollar gekostet haben.

Sacks verwies auf einen Bericht von Dylan Patel, einem Halbleiteranalysten, der für seine Arbeit bei SemiAnalysis bekannt ist.

- Advertisement -
Quelle: X

Patel behauptet, dass DeepSeek mehr als 1 Milliarde Dollar für seinen Compute-Cluster ausgegeben hätte. Das sind Hunderte von Millionen mehr als die weithin kolportierte Zahl von 6 Millionen Dollar, die angegeben wurde.

Der KI- und Krypto-Zar des Weißen Hauses behauptete, dass die Zahl von 6 Millionen Dollar nur für den letzten Trainingslauf gilt.

In diesem Betrag sind kritische Aspekte der großen Ausgaben von DeepSeek nicht berücksichtigt.

Zu den bemerkenswerten Ausgaben, die von dem ausgewiesenen Betrag ausgenommen sind, gehören Investitionsausgaben.

Das sind die Kosten für den Kauf und die Einrichtung der Hardware für DeepSeek. Außerdem werden die Kosten für Forschung und Entwicklung (F&E) nicht berücksichtigt.

Alle Ausgaben im Zusammenhang mit der Erforschung des KI-Modells, seiner Entwicklung und der Optimierung von DeepSeek wurden angeblich nicht mit 6 Millionen Dollar berechnet.

Sacks deutet an, dass die Kosten für den Aufbau des KI-Modells von DeepSeek im Milliarden-Dollar-Bereich liegen.

Er wies die Berichte über die 6 Millionen Dollar als unwahr und irreführend zurück, möglicherweise nur um Punkte zu machen.

SemiAnalysis bietet eine teurere Aufschlüsselung

Interessanterweise hat SemiAnalysis eine Aufschlüsselung der angeblich irreführenden Behauptungen von DeepSeek geliefert.

Das Unternehmen bestand darauf, dass die 6 Millionen Dollar nur für das Training der Graphics Processing Unit (GPU) verwendet werden.

Die tatsächlichen Gesamtkosten für die Infrastruktur und die Investitionen in Forschung und Entwicklung sowie Server belaufen sich auf etwa 1,3 Milliarden Dollar.

Eine weitere bemerkenswerte Behauptung, die entkräftet wurde, betrifft die Chips. SemiAnalysis stellte fest, dass DeepSeek zwar 50.000 Hopper-GPUs betreibt, dass es sich dabei aber nicht um H100-Chips der Spitzenklasse handelt.

Vielmehr ist es eine Mischung aus H100, H800 und H20. Die H20 sind die chinesische Version aufgrund der US-Exportbeschränkungen.

In Bezug auf die Leistung ist das R1-Modell von DeepSeek mit dem o1-Modell von OpenAI vergleichbar, was das Task Reasoning angeht.

Allerdings ist es nicht bei allen Standards eindeutig führend. Googles Gemini Flash 2.0 verfügt über ähnliche Funktionen und ist für den API-Zugang wohl günstiger.

Was die Innovationseffizienz betrifft, so senkt Multi-Head Latent Attention (MLA) die Kosten erheblich, indem es die Nutzung des KV-Caches um 93,3% reduziert.

Insgesamt könnten die Kosten von DeepSeek bis zum Jahresende um etwa das Fünffache sinken, was das Startup begünstigt. Diese Kostensenkung könnte DeepSeek in die Lage versetzen, schneller zu skalieren als andere Akteure in diesem Bereich.

SemiAnalysis wies jedoch darauf hin, dass die US-Exportbeschränkungen ein potenzielles Hindernis für die Expansionsbestrebungen von DeepSeek darstellen.

Auswirkungen auf den Krypto-Sektor

Analysten sind der Meinung, dass DeepSeek unabhängig von den tatsächlichen Kosten für das Training der KI-Modelle einen Wendepunkt in der Kryptobranche darstellen könnte.

Blockchains und andere Krypto-Projekte werden von den Entwicklern mehr Effizienz und ein besseres Preis-Leistungs-Verhältnis verlangen, da sie suggerieren, dass mehr für weniger Geld getan werden kann.

Einige haben vorgeschlagen, dass der Kryptosektor neue Upgrades erleben könnte, die auf Skalierbarkeit und Effizienz abzielen.

Nach dem Update erholten sich die KI-Token. Internet Computer sprang um 2,80% auf $9,9336, Injective stieg um 1,82% auf $20,40 und Near Protocol um 2,2% auf $4,616.

Disclaimer

The contents of this page are intended for general informational purposes and do not constitute financial, investment, or any other form of advice. Investing in or trading crypto assets carries the risk of financial loss. The forecasted data (also called “price prediction”) on this page are subject to change without notice and are not guaranteed to be accurate.

Our Newsletter

Subscribe to our newsletter to get the latest news and promotions.

Godfrey Benjamin
Godfrey Benjaminhttps://www.thecoinrepublic.com/
Godfrey Benjamin is an experienced crypto journalist whose main goal is to educate everyone around him about the prospects of Web 3.0. His love for crypto was birthed when, as a former banker, he discovered the obvious advantages of decentralized money over traditional payments. With his vast experience covering various aspects of Web3, Godfrey's articles has been featured on Blockchain.news, Cryptonews and Coingape, among others.