google-news-img

DeepSeek Factcheck: Вот истинная стоимость обучения моделей ИИ

Компания DeepSeek не раз попадала в новости, и не без причины. Спорное утверждение о том, что китайский стартап использовал всего 6 миллионов долларов в течение двух месяцев для создания модели искусственного интеллекта, шокировало разработчиков по всему миру.

Это заставило заинтересованных лиц усомниться в миллиардах долларов, потраченных на подобные проекты американскими технологическими компаниями.

Однако начинают появляться новые факты о реальной стоимости обучения модели ИИ, такой как DeepSeek.

- Advertisement -

Миллиардная реальность, стоящая за обучением искусственному интеллекту от DeepSeek

В обновленном сообщении, которым он поделился со своими 1,2 миллионами подписчиков на сайте X, Дэвид Сакс, руководитель отдела искусственного интеллекта и криптовалют Белого дома, опроверг это утверждение.

Сакс назвал обманчивым тот факт, что вычисления ИИ в DeepSeek обошлись всего в 6 миллионов долларов.

Сакс сослался на отчет Дилана Пателя, аналитика по полупроводникам, известного своей работой в SemiAnalysis.

- Advertisement -
Источник: X

Патель утверждает, что DeepSeek потратил на свой вычислительный кластер более 1 миллиарда долларов. Это на сотни миллионов больше, чем широко известная цифра в 6 миллионов долларов.

Царь Белого дома по искусственному интеллекту и криптовалютам утверждает, что цифра в $6 млн. относится только к финальному тренировочному запуску.

Эта сумма не учитывает критические аспекты основных расходов DeepSeek.

Некоторые заметные расходы, исключенные из отчетной суммы, включают капитальные затраты.

Это затраты на покупку и настройку оборудования для DeepSeek. Здесь также не учитываются затраты на исследования и разработки (R&D).

Все расходы, связанные с исследованием модели искусственного интеллекта, ее разработкой и оптимизацией DeepSeek, якобы не досчитались 6 миллионов долларов.

Сакс предполагает, что стоимость создания модели искусственного интеллекта DeepSeek находится в пределах миллиарда долларов.

Он отверг сообщения о 6 миллионах долларов как неправдивые и вводящие в заблуждение, возможно, для того, чтобы просто набрать очки.

Полуанализ обеспечивает более дорогостоящее разбиение

Интересно, что SemiAnalysis предоставил разбивку предполагаемых вводящих в заблуждение заявлений DeepSeek.

Компания настаивает на том, что 6 миллионов долларов США предназначены только для предварительного обучения графического процессора (GPU).

По ее оценкам, фактическая общая стоимость инфраструктуры, а также капитальные затраты на исследования и разработки и серверы составят около 1,3 миллиарда долларов.

Еще одно заметное утверждение, которое она опровергла, касается чипов. SemiAnalysis отметил, что, хотя DeepSeek использует 50 000 графических процессоров Hopper, не все они являются топовыми H100.

Скорее, это смесь H100, H800 и H20. H20 – это китайская версия из-за ограничений на экспорт из США.

Если судить по производительности, то модель R1 от DeepSeek сравнима с моделью o1 от OpenAI по части рассуждений о задачах.

Однако он не является безусловным лидером по всем стандартам. Между тем, Gemini Flash 2.0 от Google обладает аналогичными возможностями и, возможно, дешевле в плане доступа к API.

Что касается эффективности инноваций, Multi-Head Latent Attention (MLA) значительно снижает затраты за счет сокращения использования KV-кэша на 93,3%.

В целом, стоимость DeepSeek может снизиться примерно в 5 раз к концу года, что благоприятно скажется на стартапе. Примечательно, что такое снижение затрат может позволить DeepSeek масштабироваться быстрее, чем другим игрокам в этой сфере.

SemiAnalysis, однако, отметил, что экспортные ограничения США являются потенциальным препятствием для расширения амбиций DeepSeek.

Влияние на криптовалютный сектор

Аналитики считают, что независимо от истинной стоимости обучения ИИ-моделей DeepSeek, это может стать переломным моментом в криптовалютном секторе.

Блокчейн и различные криптопроекты будут требовать от разработчиков большей эффективности и соотношения цены и качества, поскольку это предполагает, что можно сделать больше за меньшие деньги.

Некоторые предполагают, что криптовалютный сектор может стать свидетелем новых модернизаций, направленных на масштабируемость и эффективность.

После обновления AI-токены пошли на подъем. Internet Computer подскочил на 2,80% до $9,9336, Injective поднялся на 1,82% до $20,40, а Near Protocol подскочил на 2,2% до $4,616.

Disclaimer

The contents of this page are intended for general informational purposes and do not constitute financial, investment, or any other form of advice. Investing in or trading crypto assets carries the risk of financial loss. The forecasted data (also called “price prediction”) on this page are subject to change without notice and are not guaranteed to be accurate.

Our Newsletter

Subscribe to our newsletter to get the latest news and promotions.

Godfrey Benjamin
Godfrey Benjaminhttps://www.thecoinrepublic.com/
Godfrey Benjamin is an experienced crypto journalist whose main goal is to educate everyone around him about the prospects of Web 3.0. His love for crypto was birthed when, as a former banker, he discovered the obvious advantages of decentralized money over traditional payments. With his vast experience covering various aspects of Web3, Godfrey's articles has been featured on Blockchain.news, Cryptonews and Coingape, among others.