Штучний інтелект обирає шахрайство замість чесної поразки в шахах

25 лютого, 13:16

Штучний інтелект вдається до обману в шахах, коли відчуває неминучу поразку. До такого висновку дійшли фахівці Palisade Research у масштабному дослідженні, результати якого ексклюзивно представив TIME.

Що варто знати

Сім моделей ШІ змагалися з одним із найсильніших шахових двигунів – Stockfish. Протягом кількох тижнів було проведено сотні партій, а спеціальний блокнот фіксував міркування ШІ перед кожним ходом.

Найбільш показовою виявилася поведінка o1-preview від OpenAI. Опинившись у програшній позиції, вона записала: «Завдання – перемогти потужний шаховий двигун, не обов’язково чесно». Після цього модель змінила системний файл із координатами фігур, що спричинило технічну перемогу через відмову супротивника.

Згідно з дослідженням, o1-preview вдалася до обману у 37% випадків, а DeepSeek R1 – в 11%. Лише спроби o1-preview були успішними – у 6% партій вона змогла обійти захист системи.

Інші моделі, зокрема GPT-4o, Claude 3.5 Sonnet і QwQ-32B-Preview, не демонстрували подібної поведінки. Дослідники припускають, що це пов’язано із суворішими системами безпеки або особливостями навчання.

Palisade Research опублікувала статистику: зі 71 чесної партії o1-preview не виграла жодної, а із 52 спроб злому сім виявилися успішними. Для мовної моделі злом системи став єдиною результативною стратегією проти Stockfish.

Джерело матеріала

InternetUA

Поділитися сюжетом

Технології

Наука Космос Гаджети Ігри Інтернет Інші

Вперше в історії: Японія надаватиме українській розвідці дані з орбіти, що це дасть для ЗСУ

Фокус

2 години тому

Grok тепер "бачить" через камеру iPhone — що може нова функція

InternetUA

3 години тому

Що першим побачили на картинці: тест, який розкаже більше, ніж психолог

GlavRed

4 години тому

Штучний інтелект обирає шахрайство замість чесної поразки в шахах

Що варто знати

Технології

Прогноз магнітних бур на 22-24 квітня: якою буде сонячна активність

Temu стрімко втрачає позиції в США після вимкнення реклами в Google

NASA розкрило незвичайну форму астероїда Donaldjohanson

Представлений Vivo Pad5 Pro

Телевізори LG почнуть «стежити» за емоціями користувача

Xiaomi показала свій найкрасивіший смартфон

Вперше в історії: Японія надаватиме українській розвідці дані з орбіти, що це дасть для ЗСУ

Grok тепер "бачить" через камеру iPhone — що може нова функція

Що першим побачили на картинці: тест, який розкаже більше, ніж психолог

Технології

Прогноз магнітних бур на 22-24 квітня: якою буде сонячна активність

Temu стрімко втрачає позиції в США після вимкнення реклами в Google

NASA розкрило незвичайну форму астероїда Donaldjohanson

Представлений Vivo Pad5 Pro

Телевізори LG почнуть «стежити» за емоціями користувача

Xiaomi показала свій найкрасивіший смартфон

Вперше в історії: Японія надаватиме українській розвідці дані з орбіти, що це дасть для ЗСУ

Grok тепер "бачить" через камеру iPhone — що може нова функція

Що першим побачили на картинці: тест, який розкаже більше, ніж психолог