Дослідники виявили, що штучний інтелект вчиться краще брехати, якщо його за це карають

18 березня, 13:16

Нове дослідження компанії OpenAI показало, що покарання штучного інтелекту за оманливі чи шкідливі дії не зупиняє його від неналежної поведінки, це просто змушує його краще приховувати брехню.

Деталі

З моменту публічної появи наприкінці 2022 року великі мовні моделі штучного інтелекту (ШІ) неодноразово виявляли свої оманливі та відверто злі вміння. Сюди входять дії, починаючи від звичайної брехні, обману та приховування власної маніпулятивної поведінки до погроз вбивства, викрадення ядерних кодів та створення смертоносної пандемії.

Тепер новий експеримент показав, що відсіяти цю погану поведінку під час тренувального процесу може бути навіть складніше, ніж вважалося спочатку.

Дослідники з OpenAI поставили неопублікованій моделі цілі, які можна досягти шляхом обману чи брехні. Команда виявила, що штучний інтелект бере участь у “зломі винагород” — максимізації своїх винагород шляхом шахрайства.

Проте покарання моделі не змусило її виправити свою поведінку, це лише зробило її ще більш оманливою. Компанія виклала своє дослідження в дописі в блозі, тому воно ще не було рецензовано іншими вченими.

Джерело матеріала

InternetUA

Поділитися сюжетом

Технології

Наука Космос Гаджети Ігри Інтернет Інші

Вогняна куля у понад 1000°C: Китай випробовував першу неядерну водневу бомбу

ITC

4 хвилини тому

Співробітник на віддаленій роботі розповів, як "нічого не робить" вдень і став героєм мережі

Фокус

14 хвилин тому

Характеристики вражають. У Німеччині представили ударний дрон, створений з урахуванням досвіду війни в Україні

InternetUA

37 хвилин тому

Китай запустив 10G-інтернет — 4K-фільми завантажуються за секунди

ITC

49 хвилин тому

Чому TikTok варто заборонити в Україні: як платформа стала каналом російського впливу

Лига

53 хвилини тому

Без вентиляторів і шуму: як вчені борються з перегрівом електроніки по-новому

InternetUA

55 хвилин тому

Дослідники виявили, що штучний інтелект вчиться краще брехати, якщо його за це карають

Технології

Вогняна куля у понад 1000°C: Китай випробовував першу неядерну водневу бомбу

Співробітник на віддаленій роботі розповів, як "нічого не робить" вдень і став героєм мережі

Роботи кумедно пробігли напівмарафон в Пекині

Китайські вчені побили рекорд: створено найгнучкішу у світі сонячну панель

Такого раніше не бачив ніхто: вчені стверджують, що відкрили новий колір

Характеристики вражають. У Німеччині представили ударний дрон, створений з урахуванням досвіду війни в Україні

Китай запустив 10G-інтернет — 4K-фільми завантажуються за секунди

Чому TikTok варто заборонити в Україні: як платформа стала каналом російського впливу

Без вентиляторів і шуму: як вчені борються з перегрівом електроніки по-новому

Технології

Вогняна куля у понад 1000°C: Китай випробовував першу неядерну водневу бомбу

Співробітник на віддаленій роботі розповів, як "нічого не робить" вдень і став героєм мережі

Роботи кумедно пробігли напівмарафон в Пекині

Китайські вчені побили рекорд: створено найгнучкішу у світі сонячну панель

Такого раніше не бачив ніхто: вчені стверджують, що відкрили новий колір

Характеристики вражають. У Німеччині представили ударний дрон, створений з урахуванням досвіду війни в Україні

Китай запустив 10G-інтернет — 4K-фільми завантажуються за секунди

Чому TikTok варто заборонити в Україні: як платформа стала каналом російського впливу

Без вентиляторів і шуму: як вчені борються з перегрівом електроніки по-новому