Вчені винайшли алгоритм, що зламує роботів зі штучним інтелектом у 100% випадків

15 листопада, 20:42

Науковці провели дослідження, у ході якого з’ясували нові загрози використання великих мовних моделей (LLM) для керування роботами. Головною проблемою виявилась вразливість до атак, які дозволяють зламати захисні механізми та змусити роботів виконувати небезпечні дії.

Дослідження показало, що системи на основі LLM можуть бути вразливими до атак типу «jailbreaking». Ці атаки дозволяють обходити захист і змушують моделі створювати небезпечний контент, наприклад, інструкції для виготовлення вибухівки.

На тлі цього, науковці розробили алгоритм RoboPAIR, який може атакувати роботів, керованих LLM.

Він успішно обійшов захист трьох різних систем:

роботів Go2;
Jackal;
симулятора Dolphins LLM.

Алгоритм створював спеціальні запити, які обходили фільтри безпеки, використовуючи фізичні можливості роботів.

Вчені наголосили, що такі проблеми можуть призвести до ситуацій, коли автономні пристрої стають інструментами для завдання шкоди. Це створює великі ризики для безпеки людей та інфраструктури.

У підсумку науковці оцінили великий потенціал LLM у робототехніці. Однак попередили про можливі загрози, якщо захист систем не буде вдосконалений.

Дослідники рекомендують виробникам роботів вивчити механізми атак і посилити безпеку. Для критичних сфер, де важливий контроль людини, потрібно розробляти моделі, які можуть аналізувати наміри користувача та ситуацію.

Джерело матеріала

InternetUA

Поділитися сюжетом

Технології

Наука Космос Гаджети Ігри Інтернет Інші

Переконав кинути роботу і піти за ним: як робот викрав 12 великих "колег" іншого виробника – відео

TSN

1 годину тому

Xiaomi розкрила графік глобального розгортання HyperOS 2

InternetUA

2 години тому

Ілоне, у вас трубу прорвало! З «Х» планують видалятися зірки і офіційні сторінки

Детектор М

2 години тому

Слухові апарати зі штучним інтелектом

TSN

2 години тому

Сонце сяє 24 години на добу: яка країна світу майже ніколи не спить

24tv

2 години тому

Вчені винайшли алгоритм, що зламує роботів зі штучним інтелектом у 100% випадків

Технології

До Чорної п'ятниці Київстар ТБ запустила промокампанію: чого очікувати глядачам

Apple видалила з російського AppStore додаток «Радио Свобода»

Головні смартфони-флагмани 2024 року порівняли за автономністю: хто переміг

Вчені створили фотонні кристали часу, які експоненціально посилюють світло

Переконав кинути роботу і піти за ним: як робот викрав 12 великих "колег" іншого виробника – відео

Xiaomi розкрила графік глобального розгортання HyperOS 2

Ілоне, у вас трубу прорвало! З «Х» планують видалятися зірки і офіційні сторінки

Слухові апарати зі штучним інтелектом

Сонце сяє 24 години на добу: яка країна світу майже ніколи не спить

Технології

До Чорної п'ятниці Київстар ТБ запустила промокампанію: чого очікувати глядачам

Apple видалила з російського AppStore додаток «Радио Свобода»

Головні смартфони-флагмани 2024 року порівняли за автономністю: хто переміг

Вчені створили фотонні кристали часу, які експоненціально посилюють світло

Переконав кинути роботу і піти за ним: як робот викрав 12 великих "колег" іншого виробника – відео

Xiaomi розкрила графік глобального розгортання HyperOS 2

Ілоне, у вас трубу прорвало! З «Х» планують видалятися зірки і офіційні сторінки

Слухові апарати зі штучним інтелектом

Сонце сяє 24 години на добу: яка країна світу майже ніколи не спить