GPT-o3 сыграла в шахматы с Grok: кто выиграл?
GPT-o3 сыграла в шахматы с Grok: кто выиграл?

GPT-o3 сыграла в шахматы с Grok: кто выиграл?

Разработчики систем искусственного интеллекта устроили первое в истории трехдневное шахматное соревнование между своими большими языковыми моделями. В рамках Kaggle AI Exhibition Tournament сошлись 8 представителей Anthropic, DeepSeek, Google и Moonshot AI OpenAI и xAI. Шахматный турнир между ИИ проходил с 5 по 7 августа.

Модели китайских разработчиков DeepSeek и Moonshot AI выбыли еще на стадии четвертьфиналов. Третье место в турнире заняла модель Google Gemini, которая победила GPT o4-mini со счетом 3.5:0.5. В финале сошлись представители OpenAI и xAI Илона Маска.

Что интересно, изначально фаворитом считалась новая модель xAI Grok 4.

«До полуфинала казалось, что ничто не сможет остановить Grok 4 на пути к победе», — отметил обозреватель Chess.com Педро Пиньята.

Вдохновленный этими успехами, еще перед финалом Илон Маск написал в X (ранее Twitter):

«Кстати, это побочный эффект. @xAI почти не тратила усилий на шахматы».

Как следствие, в финале модель OpenAI GPT o3 одержала уверенную победу со счетом 4:0 над xAI Grok 4.

«В последний день иллюзия развеялась. Говорливый o3 просто разобрал своего загадочного оппонента, одержав четыре убедительные победы. Игра Grok стала неузнаваемой — ошибки возникали быстро и часто. А o3 не оставляла ни одного шанса», — добавил Педро Пиньята.

Grok 4 в финале допустила серию ошибок, в частности несколько раз теряла ферзя. Модель OpenAI зато демонстрировала стабильный уровень игры: средний показатель правильных ходов в 12 партиях составил 90,8%. У Grok 4 — 80,2%.

Стоит напомнить, что Сэм Альтман и Илон Маск когда-то вместе основали OpenAI, но впоследствии Маск покинул компанию, чтобы развивать собственную лабораторию xAI.

Подобные турниры разработчики используют как полигон для тестирования алгоритмов в задачах, требующих логического мышления, стратегического планирования и работы с жесткими правилами. Шахматы, как и другие сложные настольные игры, позволяют проверить, насколько эффективно искусственный интеллект может обучаться, прогнозировать действия соперника и принимать оптимальные решения.

Источник: cybernews

Источник материала
loader
loader