XAI Ілона Маска випускає свою останню флагманську модель Grok 3
XAI Ілона Маска випускає свою останню флагманську модель Grok 3

XAI Ілона Маска випускає свою останню флагманську модель Grok 3

Компанія Ілона Маска, що займається штучним інтелектом, xAI, випустила свою останню флагманську модель штучного інтелекту Grok 3 і оприлюднила нові можливості для Grok iOS і веб-додатків.

XAI Ілона Маска випускає свою останню флагманську модель Grok 3 - Фото 1

Grok , відповідь xAI на такі моделі, як  GPT-4o від OpenAI  і  Gemini від Google , може аналізувати зображення та відповідати на запитання, а також підтримує ряд функцій у соціальній мережі Маска X. Grok 3, який розроблявся кілька місяців,  оптимістично планувався  до випуску в 2024 році, але пропустив цей термін.

xAI використовує величезний центр обробки даних у Мемфісі, який містить близько 200 000 графічних процесорів, щоб навчати Grok 3. У  публікації  на X Маск стверджував, що Grok 3 було розроблено з «у 10 разів» (приблизно) більшою обчислювальною потужністю, ніж його попередник, Grok 2, з використанням розширеного навчального набору, який включає матеріали судових справ — і багато іншого.

xAI Grok 3
Члени команди xAI, включаючи Маска (крайній праворуч), під час презентації Grok 3, що транслювалася в прямому ефірі.Авторство зображення: xAI

«Grok 3 на порядок потужніший, ніж Grok 2», — сказав Маск під час презентації, що транслювалася в прямому ефірі в понеділок. «[Це] ШІ, який максимально шукає правду, навіть якщо ця правда іноді суперечить тому, що є політично коректним».

Grok 3 - це сімейство моделей, якщо бути точним. Менша версія Grok 3, Grok 3 mini, відповідає на запитання швидше шляхом певної точності. Не всі моделі та відповідні функції Grok 3 ще доступні (деякі знаходяться в бета-версії), але вони почали розгортатися в понеділок.

xAI стверджує, що Grok 3 перевершує GPT-4o за тестами, включаючи AIME (який оцінює продуктивність моделі на основі вибірки математичних запитань) і GPQA (який оцінює моделі за допомогою проблем з фізики, біології та хімії рівня PhD). Згідно з xAI, рання версія Grok 3 також отримала конкурентоспроможні результати в Chatbot Arena , краудсорсинговому тесті, який протиставляє різні моделі штучного інтелекту та змушує користувачів голосувати за їхні відповіді.

xAI Grok 3
Авторство зображення: xAI

Дві моделі в новому сімействі Grok 3, Grok 3 Reasoning і Grok 3 mini Reasoning, можуть ретельно «продумувати» проблеми, подібно до моделей «роздумів», таких як o3-mini від OpenAI і R1 китайської компанії DeepSeek . Моделі міркувань намагаються перевірити факти, перш ніж видавати результати, що допомагає їм  уникнути деяких пасток  , які зазвичай спотикають моделі.

xAI стверджує, що Grok 3 Reasoning перевершує найкращу версію o3-mini — o3-mini-high — за кількома популярними тестами, включаючи новіший математичний тест під назвою AIME 2025.

xAI Grok 3
Авторство зображення: xAI

Доступ до цих моделей міркувань можна отримати через додаток Grok. Користувачі можуть попросити Grok 3 «Думати» або — для більш складних запитів — використовувати режим «Великий мозок» для міркувань, які залучають додаткові обчислення. xAI описує моделі міркування як найкраще відповідний для питань математики, науки та програмування.

Маск сказав, що деякі «думки» моделей міркувань приховані в додатку Grok, щоб запобігти дистиляції, методу, який використовується розробниками моделей ШІ для отримання знань з інших моделей. Нещодавно DeepSeek звинуватили в перегонці моделей OpenAI для створення власних.

Моделі міркування Grok лежать в основі нової функції в додатку Grok під назвою DeepSearch, відповіді xAI дослідницьким інструментам на основі штучного інтелекту, таким як глибокі дослідження OpenAI . DeepSearch сканує Інтернет і X, щоб проаналізувати інформацію та надати реферат у відповідь на запитання.

Передплатники рівня Premium+ від X (50 доларів на місяць) спочатку отримають доступ до Grok 3, а інші функції будуть закриті за новим планом, який xAI називає SuperGrok. За ціною 30 доларів США на місяць або 300 доларів США на рік ( якщо вірити витокам інформації ) SuperGrok розблоковує додаткові міркування та запити DeepSearch, а також створює необмежену кількість зображень.

Авторство зображення: xAI

У майбутньому — приблизно через тиждень — програма Grok отримає «голосовий режим», сказав Маск, що дасть моделям Grok синтезований голос. Через кілька тижнів після цього моделі Grok 3 будуть доступні через корпоративний API xAI разом із можливістю DeepSearch.

За словами Маска, xAI планує відкрити Grok 2 у найближчі місяці.

«Наш загальний підхід полягає в тому, що ми відкриємо вихідний код останньої версії [Grok], коли буде повністю випущена наступна версія», — продовжив він. «Коли Grok 3 стане зрілим і стабільним, а це, мабуть, протягом кількох місяців, тоді ми запустимо Grok 2 з відкритим кодом».

Коли Маск анонсував Grok приблизно два роки тому, він представив модель штучного інтелекту як різку, нефільтровану та проти «пробудження» — загалом, готовий відповідати на суперечливі запитання, які інші системи ШІ не дадуть. Він виконав частину цієї обіцянки. Наприклад, Grok і Grok 2, які вважаються вульгарними, із задоволенням підкоряться, викидаючи яскраву мову, яку ви, швидше за все, не почуєте від  ChatGPT .

Але моделі Grok до Grok 3  стосувалися  політичних тем і не переходили  певних меж . Фактично,  одне дослідження  показало, що Грок схилявся до політичних лівих у таких питаннях, як права трансгендерів, програми різноманітності та нерівність.

Маск звинуватив у такій поведінці навчальні дані Грока — загальнодоступні веб-сторінки — і  пообіцяв  «наблизити Грока до політично нейтрального». Поки що незрозуміло, чи xAI досяг цієї мети та якими можуть бути наслідки.

Джерело матеріала
loader