DeepSeek запустила «думаючу» ШІ-модель R1 — як o1 від OpenAI, але безплатно

21 січня, 08:31

Кадр з фільму «Я, робот» / 20th Century Fox

Китайська лабораторія штучного інтелекту DeepSeek випустила модель міркування R1, яка продублювала, а то й перевершила результати o1 від OpenAI в деяких тестах.

З плюсів — DeepSeek R1 доступна безплатно із лімітом до 50 повідомлень на день. Після реєстрації чи авторизації потрібно обрати опцію «DeepThink».

За даними DeepSeek, R1 перевершує o1 у тестах AIME, MATH-500 і SWE-bench Verified (перший порівнює модель з іншими для оцінки ефективності, другий є збіркою текстових задач, а третій зосереджується на завданнях програмування).

DeepSeek запустила «думаючу» ШІ-модель R1 — Тести R1 / DeepSeek

Моделі міркування вирізняються тим, що можуть ефективно перевіряти факти й уникати деяких «пасток», на яких зазвичай «гальмують» звичайні моделі, а також показувати надійніші результати у природничих науках, фізичних та математичних задачах. Водночас, у порівнянні зі стандартними, моделям міркуванням необхідно трохи більше часу для пошуку рішення.

DeepSeek R1 містить 671 млрд параметрів, утім доступні й «простіші» версії, які мають від 1,5 млрд до 79 млрд параметрів — при цьому найменша може працювати й на ПК, тоді як для потужніших версій знадобиться сильне обладнання (утім і воно доступне через API DeepSeek за ціною на 90% нижчою, ніж OpenAI o1).

Зважаючи, що DeepSeek R1 — це китайська модель, тут є й певні мінуси. Її робота має бути схвалена китайським регулятором, який повинен переконатися, що відповіді моделі «втілюють основні соціалістичні цінності» (тобто R1 не відповідатиме на питання про площу Тяньаньмень чи автономію Тайваню).

Цікаво, що одна з попередніх ШІ-моделей DeepSeek так само перевершувала багатьох конкурентів за популярними тестами (зокрема в програмуванні й написанні есе), однак мала цікавішу особливість — вважала, що вона ChatGPT (ймовірно, через те, що навчалась на даних американської конкурентки).

Спецпроєкти

Джерело: TechCrunch

Джерело матеріала

ITC

Поділитися сюжетом

Технології

Наука Космос Гаджети Ігри Інтернет Інші

10 головних загроз кібербезпеки у 2025 році: як захистити свої дані

InternetUA

4 хвилини тому

Вивчення практик медіаспоживання та оцінка рівня медіаграмотності підлітків віком 12-18 років

Детектор М

5 хвилин тому

Live Switcher Mobile: Canon випустила застосунок для багатокамерних стримів… який не працює з камерами Canon

ITC

7 хвилин тому

Найпотужнішою платформою для підлітків є ютуб, — дослідження «Детектора медіа»

Детектор М

21 хвилину тому

Ноутбуки за $199: Energizer виходить на новий ринок з бюджетною лінійкою EnergyBook

ITC

38 хвилин тому

Покращить безпеку пасажирів: Continental представила інноваційну систему автомобільної біометрії

AutoGeek

53 хвилини тому

Вчені відродили перший у світі чат-бот, розроблений у 1966 році

InternetUA

1 годину тому

У що пограти: названо найпопулярніші ігри в Steam

Фокус

1 годину тому

Сила магнітної бурі зменшилась, але пляма-монстр досі активна. Що буде найближчими днями

Telegraf

1 годину тому