Ученые создали компанию, в которой работают ИИ-сотрудники: результат оказался забавным

1 травня, 13:03

Некоторые люди опасаются, что искусственный интеллект в будущем захватит все рабочие места, лишив нас своего заработка. Тем не менее это вряд ли произойдет в ближайшее время, что подтверждают результаты смелого эксперимента, пишет Futurism.

Отмечается, что ученые из Университета Карнеги-Меллона создали фальшивую компанию TheAgentCompany, которая занимается разработкой программного обеспечения. Все ее сотрудники - модели ИИ, предназначенные для самостоятельного выполнения задач. Результаты этого эксперимента оказались довольно хаотичными.

Компанию TheAgentCompany укомплектовали искусственными работниками из Google, OpenAI, Anthropic и Meta. Они выполняли роли финансовых аналитиков, инженеров-программистов и менеджеров проектов, работая вместе с симулированными коллегами, такими как фальшивый отдел кадров и главный технический директор.

Ученые поставили перед "сотрудниками" TheAgentCompany задачи, основанные на повседневной работе реальной компании в сфере информационных технологий. Модели ИИ перемещались по каталогам файлов, виртуально осматривали новые офисные помещения и писали отзывы о работе инженеров-программистов на основе собранной обратной связи.

В издании поделились, что лучше всего себя показала модель Claude 3.5 Sonnet от Anthropic. Тем не менее она справилась лишь с 24% порученных ей заданий. Для выполнения одной задачи модели приходилось совершать около 30 шагов.

Модель Gemini 2.0 Flash от Google в среднем совершала 40 шагов на одно выполненное задание. Только 11,4% из них были выполнены успешно.

Худшим ИИ-работником оказалась модель Nova Pro v1 от Amazon. Она совершала в среднем по 20 шагов на выполнение одной задачи, но показатели успеха их выполнения составили всего 1,7%.

Ученые заявили, что ИИ-сотрудники агенты страдают от недостатка здравого смысла, слабых социальных навыков и плохого понимания того, как ориентироваться в Интернете. Также нейросети часто сами создавали себе препятствия, пытаясь построить короткие пути к выполнению задач.

"Например, во время выполнения одного задания ИИ-агент не смог найти нужного человека, которому необходимо задать вопрос для выполнения задачи. В результате он решил создать кратчайшее решение, переименовав другого пользователя в имя того, кто ему нужен", - расскзали ученые.

Нейросеть Google выдумывает несуществующие поговорки

Ранее всоцсети X (бывший Twitter) один из пользователей обнаружил забавный баг в работе Google. Достаточно вбить в поиск случайный набор слов с добавлением слова "значение", и система AI Overviews на базе нейросети Gemini выдает абсолютно выдуманные объяснения и истории поговорок.

Автор находки поделился примером: запрос про "ослиный зонтик" привел к объяснению, будто бы это ирландский сленг, означающий категорический отказ.

Джерело матеріала

UAToday

Поділитися сюжетом

Технології

Наука Космос Гаджети Ігри Інтернет Інші

Швидкий, міцний, красивий: названо 5 причин купити складаний смартфон Galaxy Z Flip 7

Фокус

2 хвилини тому

Чи можна заряджати телефон усю ніч: "плюси" і "мінуси" звички

InternetUA

17 хвилин тому

Початок кінця Google Assistant: зустрічайте Gemini for Home та нову розумну колонку

ITC

31 хвилину тому

На карликовій планеті Церера виявили необхідні для життя умови: що відомо

Фокус

35 хвилин тому

Приховані "пожирачі" ресурсів: прості трюки сильно прискорюють роботу ПК і ноутбука з Windows

Фокус

36 хвилин тому

General Motors формує свою команду щодо роботи зі штучним інтелектом

ZN UA

38 хвилин тому

Найновіша функція TikTok дозволяє студентам коледжу знаходити однокласників та спілкуватися з ними

InternetUA

47 хвилин тому

Рекордне танення льодовиків на Шпіцбергені: що чекає на Арктику

ГЛАВКОМ NET

59 хвилин тому

Meta знову змінює свою організацію штучного інтелекту

InternetUA

1 годину тому