Маск презентував чат-бот Grok 3: що вміє нова нейромережа

19 лютого, 10:21

Стартап Ілона Маска представив нову версію свого чат-бота Grok, яку сам бізнесмен назвав «найрозумнішим штучним інтелектом на Землі».

Розробники стверджують, що в деяких завданнях він перевершив інші передові моделі, такі як GPT-4o, Claude 3.5 Sonnet, Gemini -2 Pro та DeepSeek-V3. Про це пише CNN.

Що таке модель Grok 3

Grok 3 – це просунута версія чат-бота від xAI, яка, як стверджують розробники, «допоможе зрозуміти природу Всесвіту». По суті, це ціле сімейство моделей, яке включає також версії Grok 3 Reasoning та Grok 3 mini Reasoning з опціями міркування. Штучний інтелект використовує ресурси гігакомп'ютера xAI Colossus з 200 тис. чіпів Nvidia H100. Розробники заявили, що Grok 3 у десять разів розумніший за Grok 2.

Як зазначив Маск, модель навчали із використанням розширеного набору даних, який включав навіть документи із судових справ. «Grok 3 на порядок здатніший, ніж Grok 2. Це націлений на пошук істини штучний інтелект, навіть якщо ця істина іноді суперечить тому, що вважається політично коректним», – сказав під час презентації бізнесмен.

xAI стверджує, що Grok 3 перевершує GPT-4o у тестах, включаючи AIME (оцінює продуктивність моделі на вибірці математичних питань) та GPQA (оцінює моделі з використанням завдань з фізики, біології та хімії на рівні доктора наук). Загалом нова версія перевершила GPT-4o, Claude 3.5 Sonnet, Gemini-2 Pro та DeepSeek-V3 у математиці, завданнях програмування та наукової роботи.

Як заявили в xAI, Grok 3 Reasoning перевершує кращу версію моделі OpenAI – o3-mini-high – у кількох популярних тестах, включаючи математичний тест AIME 2025. Раніше DeepSeek звинуватили в дистиляції моделей OpenAI для створення своїх власних.

Нарешті, рання версія Grok 3 показала конкурентоспроможні результати у Chatbot Arena – краудсорсинговому тесті, в якому користувачам пропонують оцінювати відповіді різних моделей штучного інтелекту.

Що може новий Grok 3?

Нова нейромережа, подібно до попередників, здатна аналізувати зображення і відповідати на запитання. Крім того, Grok 3 може:

вирішувати завдання з математики та програмування, проводити наукові дослідження;
здійснювати складні розрахунки. Під час презентації чат-бот обчислив час запуску ракети на Марс та її повернення на Землю з урахуванням усіх нюансів;
«міркувати» і перевіряти себе перед видачею результатів подібно o3-mini від OpenAI і R1 від DeepSeek;
активувати режим Big Brain для міркувань, які потребують додаткових обчислень;
працювати в режимі Deep Research для пошуку необхідних даних в Інтернеті та їх аналізу;
створювати ігри – під час презентації штучний інтелект показав варіант «Тетріса» з механіками «три в ряд».

Джерело матеріала

ГЛАВКОМ

Поділитися сюжетом

Технології

Наука Космос Гаджети Ігри Інтернет Інші

Нова схема шахрайства у Viber: як крадуть особисті дані користувачів

Хвиля

46 хвилин тому

Площа морського льоду Землі сягла історичного мінімуму

ГЛАВКОМ NET

51 хвилину тому

ПК-версія GTA 5 отримає масштабне оновлення з новим контентом і поліпшеною графікою

InternetUA

56 хвилин тому

Нове покоління відеокарт NVIDIA має проблеми з продуктивністю в деяких старих іграх

InternetUA

3 години тому

Маск закликав повернути з орбіти Міжнародну космічну станцію

УкраинФорм

3 години тому

Нову модель OpenAI можуть запустити вже наступного тижня - ЗМІ

УкраинФорм

3 години тому

"Безпечний" месенджер атакували хакери: як викрадають дані через Signal, — розслідування

Фокус

3 години тому

Google додав новий спосіб пошуку на iPhone

InternetUA

4 години тому

Сонячна панель без рідкоземельних елементів: розробили нову дешевшу модель

24tv

4 години тому