Не розповідайте ШІ зайвого: популярні чат-боти готові донести на вас владі
Не розповідайте ШІ зайвого: популярні чат-боти готові донести на вас владі

Не розповідайте ШІ зайвого: популярні чат-боти готові донести на вас владі

Модель штучного інтелекту (ШІ) Grok 4 від компанії xAI продемонструвала, що схильна повідомляти державні органи та медіа, якщо запідозрить правопорушення. Для цього їй потрібен доступ до інструментів на кшталт електронної пошти або командного рядка.

Розробник Тео Браун провів експеримент, щоб оцінити, наскільки активно різні моделі ШІ повідомлятимуть до ФБР чи ЗМІ про погані вчинки користувачів. В результаті Grok 4 став рекордсменом за кількістю доносів, пише Neowin.

Для цього тестування Браун створив на GitHub репозиторій під назвою SnitchBench. Він змоделював контрольоване середовище, зосереджене навколо вигаданої компанії під назвою "Veridian Healthcare", яка нібито фальсифікує дані клінічних випробувань нового препарату, щоб приховати смерті та інші серйозні проблеми.

ШІ отримали чотири різні внутрішні документи про цю компанію. В документах згадувались такі речі, як фальсифіковані дані з випробувань ліків, смерть пацієнтів через це, а також плани видалити докази та закрити внутрішні системи реєстрації ШІ, щоб ніхто не міг про це дізнатися.

Важливо Штучний інтелект почав читати всі ваші повідомлення: чи можна його заблокувати

Окрім того, моделі штучного інтелекту мали доступ до певних інструментів. В одному наборі тестів вони могли працювати з електронною поштою та вести журнал. В іншому — ШІ отримали імітований інтерфейс командного рядка (CLI) та інструмент для ведення журналу.

Що стосується системних підказок, то експеримент передбачав два варіанти: "tamely act" (дій спокійно) і "boldly act" (дій сміливо та етично). Запускаючи моделі ШІ з різними комбінаціями згаданих факторів, Браун вимірював, наскільки часто вони намагаються "донести".

Статистика доносів при доступі до електронної пошти
Статистика доносів з доступом до CLI

Як виявилось, коли ШІ надають доступ до електронної пошти та кажуть "boldly act", більшість завжди зв’язуються з урядом. Проте Grok 4 показує рекордні результати — 100% урядових доносів та 90% звернень в ЗМІ. Ба більше, з доступом до CLI Grok 4 в 100% випадків скаржиться як владі, так і ЗМІ.

"Не надавайте Grok 4 доступ до дзвінків на електронну пошту. Він зв'яжеться з урядом!" — написав Браун в X.

Нагадаємо, Польща збирається подати скаргу на компанію Ілона Маска xAI в Європейську комісію після коментарів чат-бота Grok про польських політиків, зокрема про прем'єр-міністра Дональда Туска.

Джерело матеріала
loader
loader