Китайський стартап DeepSeek, що схвилював ринок, закрив доступ до свого ШІ через кіберінцидент
Китайський стартап DeepSeek, що схвилював ринок, закрив доступ до свого ШІ через кіберінцидент

Китайський стартап DeepSeek, що схвилював ринок, закрив доступ до свого ШІ через кіберінцидент

Нові моделі

Моделі, які можна завантажити з платформи для розробки ШІ Hugging Face, є частиною абсолютно нового набору, який DeepSeek називає Janus-Pro. Вони мають від 1 мільярда до 7 мільярдів параметрів. Ці параметри приблизно відповідають навичкам моделі виконувати завдання: моделі з більшою кількістю параметрів працюють краще, ніж варіанти з меншою кількістю. Зазначимо, що нові моделі – це не те саме, що й застосунок DeepSeek, який надає доступ до мовної моделі R1 у вигляді традиційного чат-бота. Він став першим за кількістю завантажень в App Store цими вихідними. Але дуже швидко компанія була змушена призупинити реєстрацію нових користувачів, повідомляє 24 Канал з посиланням на TechCrunch.

Janus-Pro має ліцензію Массачусетського технологічного інституту й дозволяє використовувати свої ресурси в комерційних цілях без обмежень.

Компанія каже, що Janus-Pro може як аналізувати, так і створювати нові зображення. За її власними даними, у двох тестах оцінки ШІ (GenEval і DPG-Bench), найбільша модель Janus-Pro під назвою Janus-Pro-7B перевершує DALL-E 3, а також такі моделі, як PixArt-alpha, Emu3-Gen і Stability AI's Stable Diffusion XL.

Варто зазначити, що деякі з цих моделей, з якими DeepSeek порівнює свою розробку, є застарілими. До того ж Janus-Pro може аналізувати лише невеликі зображення з роздільною здатністю до 384x384. Однак це все одно вельми хороша продуктивність, враховуючи компактні розміри (1-7 мільярда параметрів – це насправді досить мало за сучасними мірками).

Janus-Pro перевершує попередню уніфіковану модель і відповідає або перевищує продуктивність моделей для конкретних завдань. Простота, висока гнучкість і ефективність Janus-Pro роблять його сильним кандидатом на створення уніфікованих мультимодальних моделей наступного покоління,
– пише DeepSeek у публікації на Hugging Face.

DeepSeek закриває реєстрацію

Приблизно в цей же час компанія опублікувала повідомлення на своєму сайті, де заявила, що змушена обмежити реєстрацію користувачів після того, як зазнала "масштабних зловмисних атак".

Поточні користувачі можуть заходити як зазвичай,
– зазначили в оголошенні.

Наразі незрозуміло, хто стоїть за цими атаками і якого вони характеру. DeepSeek каже, що "продовжує досліджувати цю проблему".

Але час, імовірно, невипадковий. Астрономічний ріст популярності додатка, який затьмарив ChatGPT у рейтингу Apple App Store, сколихнув Кремнієву долину та фондовий ринок. Застосунок, який обіцяє всі ті ж, або навіть кращі, можливості при нижчій ціні, ніж у конкурентів, змусив десятки компаній втратити мільярди доларів капіталізації.

Теги по теме
Техно
Источник материала
loader
loader