ChatGPT «думає» китайською — користувачі помітили ієрогліфи в обґрунтованнях моделі
ChatGPT «думає» китайською — користувачі помітили ієрогліфи в обґрунтованнях моделі

ChatGPT «думає» китайською — користувачі помітили ієрогліфи в обґрунтованнях моделі

Презентація GPT-o1 / OpenAI

ChatGPT з мовною моделлю o1 витрачає «більше часу на роздуми» для кращої відповіді. Користувачі виявили, що «роздуми» іноді відбуваються китайською, незалежно від мови запиту.

Схоже, алгоритм «мислить» не лише англійською, а й іншими мовами, зокрема китайською. Більшість звертає увагу лише на кінцеву відповідь, але користувачі мають можливість подивитися, як ChatGPT її формує та обґрунтовує. У цьому місці багато людей помітили, що LLM почала включати мандаринську та кантонську у процес. Також модель використовує й інші мови.

«Чому o1 pro випадково почав думати китайською? Жодна частина розмови (5+ повідомлень) не була китайською… дуже цікаво… вплив тренувальних даних», — запитав в X Рішаб Джайн. Інші користувачі з аналогічними питаннями тегали OpenAI та ChatGPT у своїх дописах, але відповідей не було.

Найпростішим, що може спасти на думку, є використання китайських даних для навчання. Представники індустрії, зокрема Ілон Маск, визнають дефіцит даних для навчання моделей. Але складніше пояснення полягає у принципі роботи мовних моделей, які недарма називаються саме так. Можливо, суть у тому, що інші мови працюють інакше, та можуть виявитися більше ефективними у формування відповіді. Модель виявляє, що у якійсь ситуації китайські чи інші конструкції працюватимуть краще, а користувачу надають кінцеву відповідь тією мовою, якою він ставить запит.

Справжню причину складно з’ясувати з огляду на закритість мовних моделей, і справа не лише в корпоративних обмеженнях. OpenAI свого часу визнала, що насправді не знає, як працює модель GPT. Справді, розробникам відома лише технічна сторона, і меншою мірою як саме «мислить» модель. Наразі ж OpenAI не надала відповідей на питання користувачів та запити журналістів. Не виключено, що компанія просто не знає їх.

Спецпроєкти

Джерело: Gizmodo

Джерело матеріала
loader