Компанія зі ШІ-співробітниками: чому експеримент виявився провальним

1 травня, 18:24

Експеримент, який полягав у повному заміщенні людської, штучним інтелектом показує, що говорити про це зарано. Про це пише 24 Канал із посиланням на Futurism.

Жодного справжнього працівника

Навіть найпотужніші моделі ШІ далекі від досконалості.

Вчені створили фіктивну ІТ-компанію під назвою TheAgentCompany. У ній не було жодного справжнього працівника – усі "співробітники" були віртуальними агентами, створеними на базі моделей штучного інтелекту від провідних компаній: Google, OpenAI, Anthropic, Meta та інших.

Вони отримали ролі фінансових аналітиків, менеджерів проєктів, HR-фахівців і програмістів – тобто мали імітувати роботу реального офісу в галузі розробки програмного забезпечення.

Агенти ШІ мали вирішувати типові робочі завдання: аналізувати документи, навідуватися у віртуальні офіси, переглядати файли та писати відгуки на основі зібраного фідбеку. Проте результати виявилися досить скромними.

Як ШІ впорався

Найуспішнішою серед віртуальних працівників стала модель Claude 3.5 Sonnet від Anthropic — вона змогла виконати лише 24% завдань. Щоб упоратися з одним завданням, їй доводилося робити в середньому 30 кроків.

ШІ не може замінити людей / Фото Pexels

Модель Gemini 2.0 Flash від Google показала ще слабший результат – 11,4% успішних завдань, із середньою складністю в 40 дій. А найгіршою виявилася Nova Pro v1 від Amazon, яка справлялася тільки з 1,7% поставлених задач, роблячи близько 20 спроб на кожне.

Де виникло найбільше труднощів

Дослідники пояснили: попри технічну потужність, ці моделі мають спільні вади — відсутність інтуїції, низький рівень соціальних навичок і погане розуміння інтернет-середовища. Крім того, агенти часто самі собі заважали, вигадуючи "короткі шляхи", які в результаті лише ускладнювали процес.

У межах одного із завдань ШІ-модель не змогла знайти потрібну людину для уточнення інформації, тому вирішила просто перейменувати іншого користувача, щоб виконати умову. Такий "креатив" лише підкреслив, наскільки штучному інтелекту поки не вистачає людського глузду.

Джерело матеріала

24tv

Поділитися сюжетом

Технології

Наука Космос Гаджети Ігри Інтернет Інші

Прощавай, Skype: Microsoft переходить на Teams

Факти ICTV

17 хвилин тому

Не будьте як Волтц: як безпечно користуватися Signal

Telegraf

21 хвилину тому

Ілон Маск: ініціатива DOGE зі скорочення витрат поки що не є успішною, але все попереду

InternetUA

41 хвилину тому

Вчені знайшли "кришку", що стримує вибух супервулкана Єллоустоун

Telegraf

41 хвилину тому

На Землю звалиться радянський супутник розміром з автомобіль: коли це станеться і чим загрожує

Telegraf

56 хвилин тому

Інженери створили дрон зі складними крилами, як у білки-летяги: чим він стане нагоді ЗСУ

InternetUA

58 хвилин тому

Цикад перетворили на "музичні інструменти": на них учені зіграли класичну музику

Фокус

1 годину тому

Вікіпедія буде використовувати ШІ: чи замінить він людей

InternetUA

1 годину тому

Samsung запатентувала смартфон з модульною камерою та змінним об'єктивом

InternetUA

2 години тому