Маск презентував чат-бот Grok 3: що вміє нова нейромережа
Стартап Ілона Маска представив нову версію свого чат-бота Grok, яку сам бізнесмен назвав «найрозумнішим штучним інтелектом на Землі».
Розробники стверджують, що в деяких завданнях він перевершив інші передові моделі, такі як GPT-4o, Claude 3.5 Sonnet, Gemini -2 Pro та DeepSeek-V3. Про це пише CNN.
Що таке модель Grok 3
Grok 3 – це просунута версія чат-бота від xAI, яка, як стверджують розробники, «допоможе зрозуміти природу Всесвіту». По суті, це ціле сімейство моделей, яке включає також версії Grok 3 Reasoning та Grok 3 mini Reasoning з опціями міркування. Штучний інтелект використовує ресурси гігакомп'ютера xAI Colossus з 200 тис. чіпів Nvidia H100. Розробники заявили, що Grok 3 у десять разів розумніший за Grok 2.
Як зазначив Маск, модель навчали із використанням розширеного набору даних, який включав навіть документи із судових справ. «Grok 3 на порядок здатніший, ніж Grok 2. Це націлений на пошук істини штучний інтелект, навіть якщо ця істина іноді суперечить тому, що вважається політично коректним», – сказав під час презентації бізнесмен.
xAI стверджує, що Grok 3 перевершує GPT-4o у тестах, включаючи AIME (оцінює продуктивність моделі на вибірці математичних питань) та GPQA (оцінює моделі з використанням завдань з фізики, біології та хімії на рівні доктора наук). Загалом нова версія перевершила GPT-4o, Claude 3.5 Sonnet, Gemini-2 Pro та DeepSeek-V3 у математиці, завданнях програмування та наукової роботи.
Як заявили в xAI, Grok 3 Reasoning перевершує кращу версію моделі OpenAI – o3-mini-high – у кількох популярних тестах, включаючи математичний тест AIME 2025. Раніше DeepSeek звинуватили в дистиляції моделей OpenAI для створення своїх власних.
Нарешті, рання версія Grok 3 показала конкурентоспроможні результати у Chatbot Arena – краудсорсинговому тесті, в якому користувачам пропонують оцінювати відповіді різних моделей штучного інтелекту.
Що може новий Grok 3?
Нова нейромережа, подібно до попередників, здатна аналізувати зображення і відповідати на запитання. Крім того, Grok 3 може:
- вирішувати завдання з математики та програмування, проводити наукові дослідження;
- здійснювати складні розрахунки. Під час презентації чат-бот обчислив час запуску ракети на Марс та її повернення на Землю з урахуванням усіх нюансів;
- «міркувати» і перевіряти себе перед видачею результатів подібно o3-mini від OpenAI і R1 від DeepSeek;
- активувати режим Big Brain для міркувань, які потребують додаткових обчислень;
- працювати в режимі Deep Research для пошуку необхідних даних в Інтернеті та їх аналізу;
- створювати ігри – під час презентації штучний інтелект показав варіант «Тетріса» з механіками «три в ряд».
