Meta розгадує таємниці
Штучний інтелект R1 від DeepSeek миттєво змінив ландшафт штучного інтелекту в США. Всього за кілька тижнів після запуску своєї моделі DeepSeek обігнав ChatGPT й став додатком номер один в App Store. Зростання популярності DeepSeek викликало шок у технологічній індустрії, що призвело до втрати ринкової капіталізації NVIDIA на 600 мільярдів доларів. Компанія також випустила Janus-Pro 7B, революційну модель генерації зображень, яка перевершила конкурентні моделі, такі як DALL-E від OpenAI. Тож не дивно, що великі корпорації хочуть знати, як так могло статися, повідомляє 24 Канал з посиланням на The Information.
Популярність DeepSeek привернула увагу Meta, і, як повідомляється, щоб зрозуміти успіх цього китайського ШІ-стартапу, компанія Марка Цукерберга зібрала чотири спеціалізовані команди, які називає "бойовими кімнатами". Вони складаються з інженерів, які повинні будуть зрозуміти, як китайський ШІ-стартап зміг досягти продуктивності на рівні або навіть вище, ніж у провідних конкурентів, таких як ChatGPT, за менші гроші.
Компанія DeepSeek стверджує, що інвестувала менше 6 мільйонів доларів у навчання своєї моделі, порівняно з більш ніж 100 мільйонами доларів, вкладеними OpenAI у навчання ChatGPT. У бойових кімнатах Meta буде проведено мозковий штурм для пошуку шляхів подолання потенційної загрози, пов'язаної з проривом DeepSeek.
- Дві з чотирьох кімнат будуть присвячені вивченню того, як DeepSeek вдалося скоротити витрати на розробку і запуск моделей R1, з надією застосувати ту ж стратегію до власної моделі штучного інтелекту Llama, розробленої Meta.
- Ще одна команда досліджуватиме навчальні дані, які використовувала DeepSeek.
- Остання команда зосередиться на вивченні способів перепроектування архітектури Llama, щоб конкурувати з китайськими технологіями штучного інтелекту.
Хоча компанія Meta не коментує це рішення, представник Meta заявив в інтерв'ю виданню The Information: "Ми регулярно оцінюємо всі конкурентні моделі в процесі розробки і робимо це з моменту створення генеративного ШІ. Llama відіграла важливу роль у створенні екосистеми для моделей штучного інтелекту з відкритим початковим кодом, і ми з нетерпінням чекаємо на вихід Llama 4, щоб продовжити це лідерство".
Meta знаходиться в стані підвищеної готовності, тому що директор інфраструктури Meta AI Метью Олдхем повідомив колегам, що новітня модель DeepSeek може перевершити навіть майбутній Llama AI, який, як очікується, буде запущений на початку 2025 року. Навіть генеральний директор OpenAI Сем Альтман відреагував на зростання DeepSeek і назвав його "вражаючим". NVIDIA, яка є однією з найбільших жертв раптової популярності DeepSeek, також похвалила китайський ШІ, а також підкреслила, що в програмному забезпеченні DeepSeek використовуються графічні процесори NVIDIA.