Нова ШІ-модель OpenAI показала приголомшливий результат в авторитетному IQ-тесті

17 вересня, 11:16

Модель штучного інтелекту o1 від OpenAI перевершила всіх конкурентів в авторитетному норвезькому IQ-тесті Mensa.

Модель o1 правильно відповіла на 25 із 35 запитань IQ-тесту. У ньому використовували запитання, котрі ніколи не публікувалися в Інтернеті, до якого мають доступ пошукові системи. Цей результат дозволив моделі набрати 120 балів IQ. Для порівняння, модель штучного інтелекту Claude від Anthropic змогла б досягти такого результату лише через 1,5−2,5 роки.

«Claude-1 … дав 6 правильних відповідей, що дало приблизно 64 IQ. Claude-2 набрав 6 додаткових балів за тест (приблизно 18 балів IQ). Claude-3 набрав ще 6,5 балів, що вартує ще приблизно на 19 балів IQ, і що перевищує середній показник для людини. … Дуже проста екстраполяція припускає, що ми повинні очікувати на Claude-4 через 12−16 місяців, і що він матиме відповідати приблизно на 25 запитань на тест», — пише дослідник штучного інтелекту Макс Лотт, який провів тестування нової моделі.

Найскладніший тест, який розв’язала o1, включає аналіз шаблонів і здатність ідентифікувати відсутні елементи в сітці. Модель продемонструвала вдосконалене розуміння геометричних візерунків. Попри деякі помилки щодо схожих типових запитань, o1 показала, що OpenAI досягла значного прогресу у розробці високопродуктивного ШІ. Результат тесту також дає змогу припустити, що у найближчі роки ШІ перевищить позначку 140 балів IQ.

Джерело матеріала

InternetUA

Поділитися сюжетом

Технології

Наука Космос Гаджети Ігри Інтернет Інші

Нова ШІ-модель OpenAI показала приголомшливий результат в авторитетному IQ-тесті

Технології

Геймдиректор Mass Effect 5 натякнув на сюжет гри: «Не пропустить це DLC»

Для S.T.A.L.K.E.R. 2 вже вийшов третій патч за п’ять днів: що покращили

Перші 43 хвилини геймплею Kingdom Come: Deliverance 2 від IGN

STALKER 2 отримав новий патч: що принесли зміни в 1․0․3

Відкрито новий вид вимерлих людей з великою головою

Як зарядити телефон за 30 хвилин: найефективніші способи

Венера ніколи не була здатна підтримувати життя

Астероїд C0WEPC5 впав у російській Якутії

Можуть говорити про серйозну поломку: звуки в котлі, які не варто ігнорувати

Технології

Геймдиректор Mass Effect 5 натякнув на сюжет гри: «Не пропустить це DLC»

Для S.T.A.L.K.E.R. 2 вже вийшов третій патч за п’ять днів: що покращили

Перші 43 хвилини геймплею Kingdom Come: Deliverance 2 від IGN

STALKER 2 отримав новий патч: що принесли зміни в 1․0․3

Відкрито новий вид вимерлих людей з великою головою

Як зарядити телефон за 30 хвилин: найефективніші способи

Венера ніколи не була здатна підтримувати життя

Астероїд C0WEPC5 впав у російській Якутії

Можуть говорити про серйозну поломку: звуки в котлі, які не варто ігнорувати