Новий DeepSeek V3.1 з Китаю зіштовхнули з ChatGPT: який ШІ виявився кращим і чому
Новий DeepSeek V3.1 з Китаю зіштовхнули з ChatGPT: який ШІ виявився кращим і чому

Новий DeepSeek V3.1 з Китаю зіштовхнули з ChatGPT: який ШІ виявився кращим і чому

19 серпня китайський стартап DeepSeek випустив нову версію однойменної моделі штучного інтелекту V3.1, яка кидає виклик західним конкурентам завдяки своїй потужності та дешевизні.У Китаї випустили нову версію ШІ DeepSeek V3.1: чому він виявився набагато кращим за ChatGPT

Компанія з Ханчжоу, підтримувана High-Flyer Capital Management, без зайвого галасу завантажила DeepSeek V3.1 на онлайн-платформу Hugging Face, де міститься бібліотека ШІ-моделей і зібралося співтовариство фахівців у цій галузі. Попередні тести показали, що не поступається ChatGPT 5 від OpenAI і Claude Opus від Anthropic. Подробиці повідомляє видання Venturebeat.

DeepSeek проти ChatGPT і Claude: який ШІ кращий

Ліцензія з відкритим вихідним кодом забезпечує глобальний доступ до неї, тому DeepSeek V3.1 швидко завоювала популярність. Модель набрала 71,6% балів у престижному тесті кодування Aider, зарекомендувавши себе як одна з найпродуктивніших моделей на ринку.

"На 1% краще, ніж Claude Opus 4, при цьому в 68 разів дешевше", — прокоментував дослідник штучного інтелекту Ендрю Крістіансон у соцмережі X.

DeepSeek V3.1, вартістю близько 1,01 долара США за повне завдання кодування, забезпечує результати, які можна порівняти з системами вартістю майже 70 доларів США за еквівалентне робоче навантаження. Для корпоративних користувачів, яким потрібні послуги ШІ тисячі разів на день, така різниця дасть змогу заощадити мільйони доларів.

Аманда Касвелл з Tom's Guide провела низку тестів, порівнявши ChatGPT-5 і DeepSeek V3.1. За підсумками дев'яти завдань вона віддала пальму першості DeepSeek за покрокові пояснення, реалістичне планування і ґрунтовний підхід.

На його тлі ChatGPT дає одноманітні та поверхневі відповіді. При цьому ChatGPT-5 довів свою перевагу в галузях, що вимагають уваги до деталей, плавності мови і розуміння культури, де природність так само важлива, як правильні відповіді.

Новий DeepSeek являє собою систему з 685 мільярдами параметрами. На відміну від попередніх версій, V3.1 органічно поєднує функції чату, міркувань і програмування в єдину, цілісну модель.

Вона обробляє до 128 000 токенів контексту, що приблизно еквівалентно об'єму книги об'ємом 400 сторінок, забезпечуючи водночас швидкість відгуку, яка значно перевершує повільніші рішення, засновані на логічному аналізі. Модель підтримує різні формати точності, від стандартного BF16 до експериментального FP8, що дає змогу розробникам оптимізувати продуктивність з урахуванням конкретних апаратних обмежень.

Китай проти Заходу

Як звернули увагу аналітики, добре DeepSeek розрахувала час, випустивши версії 3.1 лише за кілька тижнів після того, як OpenAI представила GPT-5, а Anthropic — Claude 4. Зрівнявшись із ними за продуктивністю і зберігши при цьому відкритий вихідний код, китайський ШІ кинув виклик західним бізнес-моделям, що може мати далекосяжні стратегічні наслідки.

Тоді як американські компанії суворо контролюють свої найпередовіші системи, вимагаючи дорогого доступу до API і накладаючи обмеження на використання, DeepSeek надає аналогічні можливості для безоплатного завантаження, модифікації та розгортання в будь-якій точці світу.

Раніше писали, щоDeepSeek зіткнувся з проблемами через китайські чипи. Влада Китаю заохочувала компанію використовувати Ascend від Huawei замість американських аналогів від Nvidia, але тренування моделі ШІ провалилося.

У травні стало відомо, що Китай перетворив ШІ DeepSeek на військового командира. Він змоделював 10 000 потенційних ситуацій на полі бою всього за 48 секунд. За словами вчених, у людей на це пішло б близько 48 годин.

Теги за темою
Китай
Джерело матеріала
loader