Акції NVIDIA впали на 13% на передринкових торгах, оскільки світ захопили ШІ-моделі китайського стартапу DeepSeek.
Модель DeepSeek V3, представлена торік, вже перебила ChatGPT в американському AppStore, тоді як нова модель міркування R1, випущена минулого тижня, стала найпопулярнішою ШІ-моделлю в HuggingFace. Інтерес в цьому випадку був спровокований тим, що обидві розробки — моделі з відкритим кодом, доступні публічно без жодних передплат і дублюють (чи навіть перевершують) останні версії ШІ від таких компаній, як Meta чи OpenAI.
Водночас, головна перевага (як і причина падіння акції провідних виробників чипів) криється саме у методі їх навчання, який не передбачає мільярдних вливань і багато часу.
У грудневій дослідницькій статті DeepSeek зазначала, що її V3 була розроблена всього за 2 місяці, використала кластер із 2000 спеціалізованих чипів від Nvidia й обійшлась всього у $6 млн. Для порівняння: для навчання сучасних моделей зазвичай потрібні 16 000+ чипів і лише GPT-4, за словами гендиректора OpenAI Сема Альтмана, обійшлась у понад $100 млн.
«DeepSeek явно не має доступу до такої кількості обчислювальних ресурсів, як американські компанії, і якимось чином їм вдалося розробити модель, яка виглядає дуже конкурентоспроможною», — каже аналітик із напівпровідників Raymond James Сріні Паджурі, натякаючи на експортні обмежені, накладені США ще у 2021 році.
Видання CNBC стверджує, що широкомовна модель DeepSeek «спонукала інвесторів запитувати про вартість навчання» і поставити під сумнів інтенсивний обчислювальний підхід, якому віддають перевагу провідні світові компанії ШІ. У результаті: акції NVIDIA, яка торік забезпечила собі космічне зростання розробкою ШІ-чипів, впали на 13% на премаркеті, приєднавшись до європейського виробника мікросхем ASML, який повідомив про однозначні відсоткові втрати ціни акцій. Так само падіння (-8,32% на японських ринках) фіксував японський інвестиційний конгломерат Softbank, який нещодавно потрапив у заголовки через ініціативу президента Трампа, яка передбачає залучення $500 млрд інвестицій для будівництва датацентрів для ШІ в США.
Варто зазначити, що сума у $6 млн, заявлена DeepSeek, поки мало чим підтверджена, і, за словами експертів, «не включає витрати, пов’язані з попередніми дослідженнями та експериментами з архітектурами, алгоритмами або даними».