Модель штучного інтелекту o1 від OpenAI перевершила всіх конкурентів в авторитетному норвезькому IQ-тесті Mensa.
Модель o1 правильно відповіла на 25 із 35 запитань IQ-тесту. У ньому використовували запитання, котрі ніколи не публікувалися в Інтернеті, до якого мають доступ пошукові системи. Цей результат дозволив моделі набрати 120 балів IQ. Для порівняння, модель штучного інтелекту Claude від Anthropic змогла б досягти такого результату лише через 1,5−2,5 роки.
«Claude-1 … дав 6 правильних відповідей, що дало приблизно 64 IQ. Claude-2 набрав 6 додаткових балів за тест (приблизно 18 балів IQ). Claude-3 набрав ще 6,5 балів, що вартує ще приблизно на 19 балів IQ, і що перевищує середній показник для людини. … Дуже проста екстраполяція припускає, що ми повинні очікувати на Claude-4 через 12−16 місяців, і що він матиме відповідати приблизно на 25 запитань на тест», — пише дослідник штучного інтелекту Макс Лотт, який провів тестування нової моделі.
Найскладніший тест, який розв’язала o1, включає аналіз шаблонів і здатність ідентифікувати відсутні елементи в сітці. Модель продемонструвала вдосконалене розуміння геометричних візерунків. Попри деякі помилки щодо схожих типових запитань, o1 показала, що OpenAI досягла значного прогресу у розробці високопродуктивного ШІ. Результат тесту також дає змогу припустити, що у найближчі роки ШІ перевищить позначку 140 балів IQ.