/https%3A%2F%2Fs3.eu-central-1.amazonaws.com%2Fmedia.my.ua%2Ffeed%2F434%2Fbcb1992ee409c1daae6e41bb662f0145.jpg)
DeepSeek оновила модель V3, покращивши її програмувальні навички
DeepSeek випустила оновлення ШІ-моделі V3, що отримала назву V3-0324, яке, як повідомляється, надає найкращі можливості для програмування, одночасно встановлюючи нові стандарти точності та ефективності, пише Bloomberg.
Відкрита ШІ-модель DeepSeek V3 була представлена наприкінці минулого року. Модель побудована на архітектурі Mixture of Experts (MoE, набір експертів) із загальною кількістю параметрів 671 млрд і 37 млрд параметрів, що активуються на кожен токен.
Як повідомила тоді компанія, на навчання DeepSeek V3 пішло $5,5 млн, що значно нижче за витрати інших технологічних компаній, таких як OpenAI, на навчання аналогічних моделей. Через кілька тижнів DeepSeek випустила відкриту модель R1, яка, незважаючи на скромний бюджет на розробку, перевершила ШІ-модель o1 від компанії OpenAI в деяких бенчмарках за рядом ключових показників.
У січні 2025 року програма DeepSeek випередила ШІ-чат-бот ChatGPT і вийшла на перше місце в рейтингу найпопулярніших безкоштовних програм в інтернет-магазині Apple App Store в США. Досягнення китайського стартапу викликали питання в інвесторів щодо обґрунтованості величезних витрат американських компаній на розробку ШІ-технологій, що призвело до обвалення ШІ-ринку, внаслідок якого його учасники зіткнулися зі значним падінням акцій. Зокрема лідер ринку Nvidia втратила за день $593 млрд ринкової вартості, що було найбільшим одноденним падінням в історії фондового ринку.

