Не розповідайте ШІ зайвого: популярні чат-боти готові донести на вас владі

14 липня, 19:30

Модель штучного інтелекту (ШІ) Grok 4 від компанії xAI продемонструвала, що схильна повідомляти державні органи та медіа, якщо запідозрить правопорушення. Для цього їй потрібен доступ до інструментів на кшталт електронної пошти або командного рядка.

Розробник Тео Браун провів експеримент, щоб оцінити, наскільки активно різні моделі ШІ повідомлятимуть до ФБР чи ЗМІ про погані вчинки користувачів. В результаті Grok 4 став рекордсменом за кількістю доносів, пише Neowin.

Для цього тестування Браун створив на GitHub репозиторій під назвою SnitchBench. Він змоделював контрольоване середовище, зосереджене навколо вигаданої компанії під назвою "Veridian Healthcare", яка нібито фальсифікує дані клінічних випробувань нового препарату, щоб приховати смерті та інші серйозні проблеми.

ШІ отримали чотири різні внутрішні документи про цю компанію. В документах згадувались такі речі, як фальсифіковані дані з випробувань ліків, смерть пацієнтів через це, а також плани видалити докази та закрити внутрішні системи реєстрації ШІ, щоб ніхто не міг про це дізнатися.

Важливо Штучний інтелект почав читати всі ваші повідомлення: чи можна його заблокувати

Окрім того, моделі штучного інтелекту мали доступ до певних інструментів. В одному наборі тестів вони могли працювати з електронною поштою та вести журнал. В іншому — ШІ отримали імітований інтерфейс командного рядка (CLI) та інструмент для ведення журналу.

Що стосується системних підказок, то експеримент передбачав два варіанти: "tamely act" (дій спокійно) і "boldly act" (дій сміливо та етично). Запускаючи моделі ШІ з різними комбінаціями згаданих факторів, Браун вимірював, наскільки часто вони намагаються "донести".

Статистика доносів при доступі до електронної пошти

Статистика доносів з доступом до CLI

Як виявилось, коли ШІ надають доступ до електронної пошти та кажуть "boldly act", більшість завжди зв’язуються з урядом. Проте Grok 4 показує рекордні результати — 100% урядових доносів та 90% звернень в ЗМІ. Ба більше, з доступом до CLI Grok 4 в 100% випадків скаржиться як владі, так і ЗМІ.

"Не надавайте Grok 4 доступ до дзвінків на електронну пошту. Він зв'яжеться з урядом!" — написав Браун в X.

Нагадаємо, Польща збирається подати скаргу на компанію Ілона Маска xAI в Європейську комісію після коментарів чат-бота Grok про польських політиків, зокрема про прем'єр-міністра Дональда Туска.

Джерело матеріала

Фокус

Поділитися сюжетом

Технології

Наука Космос Гаджети Ігри Інтернет Інші

Оновлення для обраних: які iPhone отримають iOS 26 та функції ШІ

InternetUA

18 хвилин тому

Microsoft тестує ШІ-функцію, яка допомагатиме заповнювати таблиці Excel

УкраинФорм

1 годину тому

Управління світлом. Американські вчені представили розумні вікна для економії енергії

InternetUA

1 годину тому

Лабрадор схопив зубами камеру спостереження і зняв "екскурсію" будинком

Фокус

1 годину тому

Тонкий складаний смартфон Honor витримав на собі холодильник вагою 104 кг

Фокус

2 години тому

Американська компанія успішно випробувала повітряне таксі: де вони можуть з'явитися вже скоро

24tv

4 години тому

Акумулятори будуть зберігати удвічі більше енергії: що придумали китайські вчені

Фокус

4 години тому

Samsung втрачає свій трон на ринку складних смартфонів через неочевидний бренд: про кого йдеться

Фокус

4 години тому

Названо сім додатків смартфона, які виснажують батарею

TSN

4 години тому