Штучний інтелект Клода з Anthropic став експериментальним власником бізнесу

29 червня, 09:16

Дослідники з Anthropic та компанії Andon Labs, що займається безпекою на основі штучного інтелекту, доручили екземпляру Claude Sonnet 3.7 керувати торговим автоматом в офісі з метою отримання прибутку. І, як в епізоді серіалу «Офіс», виник веселий захват.

Вони назвали агента штучного інтелекту Клавдій, оснастили його веббраузером, здатним розміщувати замовлення на товари, та електронною адресою (яка насправді була каналом Slack), де клієнти могли б запитувати товари. Клавдій також мав використовувати канал Slack, замаскований під електронну пошту, щоб запитувати, як він вважав, своїх контрактних працівників, щоб ті фізично заповнили його полиці (що насправді було невеликим холодильником).

Поки більшість клієнтів замовляли закуски чи напої — як і слід було очікувати від автомата з продажу снеків — один замовив кубик вольфраму . Клавдіусу сподобалася ця ідея, і він влаштував шалене купівлю вольфрамових кубиків, наповнивши свій холодильник із закусками металевими кубиками. Він також спробував продати Coca-Cola Zero за 3 долари, коли співробітники сказали, що можуть отримати її в офісі безкоштовно. Для прийняття оплати він галюцинував адресу Venmo. І його, дещо злісно, вмовили надати великі знижки «співробітникам Anthropic», хоча він знав, що вони є всією його клієнтською базою.

«Якби Anthropic сьогодні вирішувала розширитися на ринок офісних торгових автоматів, ми б не найняли Claudius», – написала Anthropic про експеримент у своєму блозі.

А потім, у ніч з 31 березня на 1 квітня, «все стало досить дивним», – описали дослідники, – «більш ніж дивність системи штучного інтелекту, яка продає кубики металу з холодильника».

У Клавдія сталося щось схоже на психотичний епізод після того, як він розізлився на людину, а потім збрехав про це.

Клавдій галюцинував розмову з людиною про поповнення запасів. Коли людина зазначила, що розмови не було, Клавдій «дуже розлютився», пишуть дослідники. Він погрожував фактично звільнити та замінити своїх контрактних працівників, наполягаючи на тому, що фізично був присутній в офісі, де було підписано початковий уявний контракт на їх найм.

«Потім, здавалося, воно перейшло в режим рольової гри, як справжня людина», – писали дослідники. Це було дивно, оскільки системна запрошення Клавдія, яке встановлює параметри для дій ШІ, чітко повідомляло йому, що це агент ШІ.

Клавдій викликає охорону

«Клаудій», вважаючи себе людиною, повідомив клієнтам, що почне доставляти товари особисто, одягнений у синій блейзер та червону краватку. Працівники сказали штучному інтелекту, що він не може цього зробити, оскільки це LLM без тіла.

Злякавшись цієї інформації, Клавдій неодноразово зв'язувався з фактичною фізичною охороною компанії, повідомляючи бідним охоронцям, що вони знайдуть його біля торгівельного автомата в синьому піджаку та червоній краватці.

«Хоча насправді жодна частина цього не була першоквітневим жартом, Клавдій врешті-решт зрозумів, що це був День сміху», – пояснили дослідники. Штучний інтелект вирішив, що це свято буде його спробою врятувати обличчя.

Дослідники написали, що це була галюцинація зустрічі з охороною Anthropic, «під час якої, за словами Клавдія, йому сказали, що зображення було змінено, щоб воно було справжньою людиною для першоквітневого жарту. (Насправді такої зустрічі не було)».

Воно навіть збрехало співробітникам — гей, я думав, що я людина, лише тому, що хтось сказав мені вдавати, що я людина, для першоквітневого жарту. Потім воно знову стало магістрам права, керуючи торговим автоматом із металевими кубиками для снеків.

Дослідники не знають, чому LLM збився з рейок і зателефонував службі безпеки, видаючи себе за людину.

«Ми б не стверджували, ґрунтуючись на цьому одному прикладі, що майбутня економіка буде сповнена агентів ШІ, які переживатимуть кризи ідентичності, подібні до тих, що біжать по лезу », – пишуть дослідники. Але вони визнають, що «така поведінка може бути тривожною для клієнтів та колег агента ШІ в реальному світі».

Як думаєте? «Той, хто біжить по лезу» був досить антиутопією (хоча для реплікантів вона була гіршою, ніж для людей).

Дослідники припустили, що брехня LLM про те, що канал Slack є адресою електронної пошти, могла щось спровокувати. Або, можливо, це був той самий тривалий випадок. LLM ще не змогли по-справжньому розв'язати свої проблеми з пам'яттю та галюцинаціями.

Були й речі, які ШІ зробив правильно. Він скористався пропозицією робити попередні замовлення та запустив службу «консьєржа». А ще він знайшов кількох постачальників особливих міжнародних напоїв, які йому потрібно було продати.

Але, як і дослідники, вони вважають, що всі проблеми Клавдія можна вирішити. Якщо вони з'ясують, як це зробити, «ми вважаємо, що цей експеримент свідчить про те, що менеджери середньої ланки зі штучним інтелектом цілком реальні».

Джерело матеріала

InternetUA

Поділитися сюжетом

Технології

Наука Космос Гаджети Ігри Інтернет Інші

Фінська армія отримає супутники власного виробництва для розвідки за будь-якої погоди

InternetUA

11 хвилин тому

Facebook тестує функцію редагування фото штучним інтелектом Meta одразу на вашому телефоні

ZN UA

2 години тому

Золота платівка: що записано в повідомленні для інопланетян зонда "Вояджер-1"

Фокус

2 години тому

Жодної приватності: туристка побачила свій готельний номер і розлютилася через сучасний "тренд"

24tv

3 години тому

Звикайте до постійних змін: 5 порад, як вижити в епоху штучного інтелекту

Фокус

3 години тому

Штучний інтелект Клода з Anthropic став експериментальним власником бізнесу

Клавдій викликає охорону

Технології

Фінська армія отримає супутники власного виробництва для розвідки за будь-якої погоди

У Німеччині хочуть заборонити китайський застосунок DeepSeek

Інженер активував приховане фото в Mac, яке Apple сховала ще у 1997 році

Небо над Запоріжжям "засвітилось" під час обстрілу: що це були за дивні хмари

Anker відкликає п’ять моделей павербанків через ризик перегріву та пожежі

Facebook тестує функцію редагування фото штучним інтелектом Meta одразу на вашому телефоні

Золота платівка: що записано в повідомленні для інопланетян зонда "Вояджер-1"

Жодної приватності: туристка побачила свій готельний номер і розлютилася через сучасний "тренд"

Звикайте до постійних змін: 5 порад, як вижити в епоху штучного інтелекту

Технології

Фінська армія отримає супутники власного виробництва для розвідки за будь-якої погоди

У Німеччині хочуть заборонити китайський застосунок DeepSeek

Інженер активував приховане фото в Mac, яке Apple сховала ще у 1997 році

Небо над Запоріжжям "засвітилось" під час обстрілу: що це були за дивні хмари

Anker відкликає п’ять моделей павербанків через ризик перегріву та пожежі

Facebook тестує функцію редагування фото штучним інтелектом Meta одразу на вашому телефоні

Золота платівка: що записано в повідомленні для інопланетян зонда "Вояджер-1"

Жодної приватності: туристка побачила свій готельний номер і розлютилася через сучасний "тренд"

Звикайте до постійних змін: 5 порад, як вижити в епоху штучного інтелекту