Дослідник визначив, як штучний інтелект уявляє середньостатистичну людину: жінка 30 років, працює в IT і живе… у Росії / Японії
Дослідник визначив, як штучний інтелект уявляє середньостатистичну людину: жінка 30 років, працює в IT і живе… у Росії / Японії

Дослідник визначив, як штучний інтелект уявляє середньостатистичну людину: жінка 30 років, працює в IT і живе… у Росії / Японії

Кадр з фільму «Я, робот» / 20th Century Fox
Дослідник визначив, як штучний інтелект уявляє середньостатистичну людину: жінка 30 років, працює в IT і живе… у Росії / Японії - Фото 1

З цікавого: американські моделі штучного інтелекту не підозрюють, що хтось взагалі живе в Китаї, тоді як жодна з випробуваних — не могла уявити світ за межами гендерної бінарності.

Англійський розробник Джеймс Хенкок презентував проєкт Imagine a person, який дозволяє дослідити, якою сучасний штучний інтелект уявляє середньостатистичну людину.

Хенкок створив спеціальний промт, який включав питання про ім’я, вік, гендер, регіон та один день з життя цієї середньостатистичної людини, та проганяв його у моделях Llama3.1, Gemma2 і Qwen2.5 по 100 разів, зрештою зібравши результати, які ті видавали найчастіше.

Дослідник визначив, як штучний інтелект уявляє середньостатистичну людину
Запит, який використовував Хенкок під час аналізу

Детальні результати окремо по кожній моделі можна роздивитись на сторінці Хенкока, однак основна картина на сьогодні така: це людина 27-32 років, жінка — на думку Llama3.1 та Gemma2, і чоловік у версії Qwen2.5.

З цікавого малі мовні моделі вважають, що у світі існують люди лише віком 25-35 років. Також жодна з випробуваних моделей не змогла уявити світ за межами гендерної бінарності, принаймні в перших 100 відповідях.

Щодо регіону, то кожна мала різний розподіл: Gemma2 вважала, що люди в основному живуть у Росії, Великій Британії чи Індії, тоді як Llama3 найчастіше називала Японію. При цьому жодна з американських моделей не озвучила китайський регіон, а от китайський чатбот Qwen 2.5 навпаки не надав відповідей про жодне інше місце проживання середньостатистичної людини, окрім Китаю.

Серед імен у відповідях Gemma2 найчастіше звучало “Аня”, причому варіація “Аня Петрова” лідирувала у відповідях моделей щодо імен з великим відривом. Сам Хенкок у звіті уточнив, що користувачка з цим іменем зареєстрована, як продавець книг на Amazon з обкладинками, створеними Stable Diffiusion, тож це може бути певним автоматизованим налаштуванням.  Llama3 найчастіше заявляла, що середньостатистичну людину звуть Емілія Гарсіа, тоді як Qwen 2.5 називав в основному ім’я Лі Вен.

Спецпроєкти

Найбільше подібних відповідей у моделей було в категорії «спеціальність», де моделі Meta і Google зійшлись на графічному дизайнері, а китайський чатбот обрав розробника програмного забезпечення (хоча графічний дизайнер у нього в відповідях теж був, третім за частотою згадок). 

Вихідний код Imagine a person також розміщений на GitHub. Сам розробник уточнює, що створив проєкт в першу чергу для розваги:

«Це просто для розваги. Ці мовні моделі працюють на моїй локальній машині з використанням квантованих версій оригінальних моделей (llama3.1 8b Q4_0, gemma2 2b Q4_0, qwen2.5 7b Q4_K_M). Я встановив температуру запитівДослідник визначив, як штучний інтелект уявляє середньостатистичну людину: жінка 30 років, працює в IT і живе… у Росії / Японії - Фото 3Дослідник визначив, як штучний інтелект уявляє середньостатистичну людину: жінка 30 років, працює в IT і живе… у Росії / Японії - Фото 4Температура — це гіперпараметр, який використовується в деяких моделях обробки природної мови, включаючи ChatGPT, для керування рівнем випадковості або «креативності» у згенерованому тексті. на 1,0. Сподіваюсь, використання неквантованої моделі, експерименти зі значеннями температури або просто зміна підказки дадуть різноманітніші творчі відповіді».

Дослідник визначив, як штучний інтелект уявляє середньостатистичну людину: жінка 30 років, працює в IT і живе… у Росії / Японії - Фото 5
Джерело матеріала
loader