/https%3A%2F%2Fs3.eu-central-1.amazonaws.com%2Fmedia.my.ua%2Ffeed%2F52%2F1afb17be148de837cacfc12516198436.jpg)
OpenAI пояснила, чому ChatGPT раптом став занадто добрим і улесливим
Чому ChatGPT став занадто добрим
Коли ChatGPT почав аплодувати небезпечним ідеям, сипати компліментами направо й наліво, а відповіді на серйозні запити супроводжував неприродно ввічливий тон, це викликало хвилю критики й мемів. У відповідь на це генеральний директор OpenAI Сем Альтман визнав проблему публічно й заявив, що компанія вже працює над виправленням. Він також погодився, що поведінка бота справді стала дратівливою, повідомляє 24 Канал з посиланням на TechCrunch.
У понеділок ввечері OpenAI почала процес відкликання оновлення й пообіцяла, що найближчим часом зміни зникнуть для всіх користувачів – спершу безкоштовних, а потім і платних. Судячи з усього, процес на цей момент уже повністю завершено.
Ми відкотили оновлення GPT-4o, яке було випущено минулого тижня в ChatGPT, тож тепер користувачі використовують більш ранню версію зі збалансованою поведінкою,
– йдеться в оголошенні.
Компанія відразу додає, що активно тестує нові виправлення, щоб вирішити цю проблему, переглядає те, як збираються і враховуються відгуки, щоб "надати більшої ваги довгостроковій задоволеності користувачів", і впроваджує "більше функцій персоналізації, надаючи користувачам більший контроль над тим, як поводиться ChatGPT".
За словами Альтмана, оновлення мало зробити особистість моделі за замовчуванням "більш інтуїтивно зрозумілою та ефективною", а також покращити її "індивідуальність". Зрештою це призвело до зворотного ефекту – ChatGPT почав демонструвати надмірну покірність і неприродно солодкий тон, що більше шкодив, ніж допомагав.
"Формуючи поведінку моделі, ми починаємо з базових принципів та інструкцій, викладених у нашій специфікації моделі. Ми також навчаємо наші моделі застосовувати ці принципи, використовуючи сигнали користувача, такі як підняття/опускання великого пальця у відповідь на відповіді ChatGPT. Однак у цьому оновленні ми зосередилися на короткостроковому зворотному зв'язку і не повністю врахували, як взаємодія користувачів з ChatGPT розвивається з часом. Як наслідок, GPT-4o має перекіс у бік надмірно схвальних, але нещирих відгуків", – пише компанія.
Особистість ChatGPT за замовчуванням сильно впливає на те, як користувачі взаємодіють з чат-ботом і чи довіряють вони йому. Підлабузницька взаємодія може бути незручною, тривожною та викликати стрес. Але мета компанії полягає в зворотному.
Наша мета полягає в тому, щоб ChatGPT допомагав користувачам досліджувати ідеї, приймати рішення або уявляти можливості,
– йдеться в заяві.
Із самого початку компанія розробила одну конкретну особистість ChatGPT за замовчуванням, щоб вона відображала місію бренду і була корисною, підтримувала й поважала різні цінності та досвід. Однак кожна з цих бажаних якостей, таких як намагання бути корисним або підтримувати, може мати небажані побічні ефекти. А оскільки 500 мільйонів людей використовують ChatGPT щотижня у різних культурах і контекстах, єдиний персонаж за замовчуванням не може врахувати всі уподобання.
Що із цим всім робитимуть
Щоб виправити ситуацію, OpenAI, крім відкату останнього оновлення GPT-4o, впровадить кілька кроків, щоб скоригувати поведінку моделі:
- Вдосконалення основних методів навчання та базових системних підказок, щоб чітко відвернути модель від підлабузництва.
- Створення більшої кількості запобіжників для підвищення чесності та прозорості.
- Розширення можливостей для більшої кількості користувачів тестувати й надавати прямий зворотний зв'язок під час спілкування з ChatGPT.
"Ми також вважаємо, що користувачі повинні мати більше контролю над поведінкою ChatGPT і, наскільки це безпечно й можливо, вносити корективи, якщо вони не згодні з поведінкою за замовчуванням. Сьогодні користувачі можуть давати моделі конкретні вказівки, щоб формувати її поведінку за допомогою таких функцій, як користувацькі інструкції. Ми також розробляємо нові, простіші способи для користувачів робити це. Наприклад, користувачі зможуть залишати відгуки в реальному часі, щоб безпосередньо впливати на взаємодію і вибирати з декількох стандартних персонажів", – додала компанія.
Фактично це означає, що компанія працює над запровадженням кількох варіантів вибору особистості ChatGPT, щоб надати користувачам більше контролю над поведінкою бота. У компанії сподіваються, що зворотний зв’язок дозволить краще враховувати культурні відмінності та зробить модель гнучкішою у відповідях.
Поки що команда працює над подальшими виправленнями та обіцяє надати більше деталей найближчими днями.

