Ученые создали компанию, в которой работают ИИ-сотрудники: результат оказался забавным
Ученые создали компанию, в которой работают ИИ-сотрудники: результат оказался забавным

Ученые создали компанию, в которой работают ИИ-сотрудники: результат оказался забавным

Некоторые люди опасаются, что искусственный интеллект в будущем захватит все рабочие места, лишив нас своего заработка. Тем не менее это вряд ли произойдет в ближайшее время, что подтверждают результаты смелого эксперимента, пишет Futurism.

Отмечается, что ученые из Университета Карнеги-Меллона создали фальшивую компанию TheAgentCompany, которая занимается разработкой программного обеспечения. Все ее сотрудники - модели ИИ, предназначенные для самостоятельного выполнения задач. Результаты этого эксперимента оказались довольно хаотичными.

Компанию TheAgentCompany укомплектовали искусственными работниками из Google, OpenAI, Anthropic и Meta. Они выполняли роли финансовых аналитиков, инженеров-программистов и менеджеров проектов, работая вместе с симулированными коллегами, такими как фальшивый отдел кадров и главный технический директор.

Ученые поставили перед "сотрудниками" TheAgentCompany задачи, основанные на повседневной работе реальной компании в сфере информационных технологий. Модели ИИ перемещались по каталогам файлов, виртуально осматривали новые офисные помещения и писали отзывы о работе инженеров-программистов на основе собранной обратной связи.

В издании поделились, что лучше всего себя показала модель Claude 3.5 Sonnet от Anthropic. Тем не менее она справилась лишь с 24% порученных ей заданий. Для выполнения одной задачи модели приходилось совершать около 30 шагов.

Модель Gemini 2.0 Flash от Google в среднем совершала 40 шагов на одно выполненное задание. Только 11,4% из них были выполнены успешно.

Худшим ИИ-работником оказалась модель Nova Pro v1 от Amazon. Она совершала в среднем по 20 шагов на выполнение одной задачи, но показатели успеха их выполнения составили всего 1,7%.

Ученые заявили, что ИИ-сотрудники агенты страдают от недостатка здравого смысла, слабых социальных навыков и плохого понимания того, как ориентироваться в Интернете. Также нейросети часто сами создавали себе препятствия, пытаясь построить короткие пути к выполнению задач.

"Например, во время выполнения одного задания ИИ-агент не смог найти нужного человека, которому необходимо задать вопрос для выполнения задачи. В результате он решил создать кратчайшее решение, переименовав другого пользователя в имя того, кто ему нужен", - расскзали ученые.

Нейросеть Google выдумывает несуществующие поговорки

Ранее всоцсети X (бывший Twitter) один из пользователей обнаружил забавный баг в работе Google. Достаточно вбить в поиск случайный набор слов с добавлением слова "значение", и система AI Overviews на базе нейросети Gemini выдает абсолютно выдуманные объяснения и истории поговорок.

Автор находки поделился примером: запрос про "ослиный зонтик" привел к объяснению, будто бы это ирландский сленг, означающий категорический отказ.

Джерело матеріала
loader