Компанія стверджувала, що витратила лише 6 мільйонів доларів і використала 2 048 графічних процесорів (GPU) для навчання нейромережі DeepSeek V3. Та схоже це не зовсім так, повідомляє 24 Канал з посиланням на дані SemiAnalysis. В ході розслідування виявилося, що реальні масштаби обчислювальної інфраструктури DeepSeek набагато більші, а загальні інвестиції у розвиток компанії перевищують 1,6 мільярда доларів.
За даними SemiAnalysis, DeepSeek управляє величезною обчислювальною інфраструктурою, що налічує близько 50 000 відеокарт Nvidia Hopper. Серед них:
- 10 000 H800
- 10 000 H100
- Додаткові партії H20
Ці ресурси розподілені між кількома дата-центрами та використовуються для навчання ШІ, досліджень і фінансового моделювання.
DeepSeek розпочав свою діяльність як дочірній проєкт китайського хедж-фонду High-Flyer, який у 2023 році виокремив стартап у самостійний бізнес, орієнтований на розвиток ШІ. На відміну від багатьох компаній, що орендують потужності у хмарних провайдерів, DeepSeek має власні дата-центри. Це забезпечує повний контроль над оптимізацією ШІ-моделей та дозволяє швидше впроваджувати інновації.
Кадрова стратегія та високі зарплати
На додаток DeepSeek проводить закриту кадрову політику, набираючи спеціалістів виключно з Китаю. Основну увагу компанія приділяє професійним навичкам і здатності розв’язувати складні задачі, а не формальній освіті.
Зарплати дослідників DeepSeek можуть перевищувати 1,3 мільйона доларів на рік, що дає змогу залучати найкращі таланти з провідних китайських університетів.
Попри заяви DeepSeek про "революційний бюджет", аналітики SemiAnalysis наголошують, що успіх компанії ґрунтується на багатомільярдних інвестиціях, технологічних проривах і сильній команді. Це ставить під сумнів початкові твердження про створення конкурентного ШІ з мінімальними витратами.