Найрозумніші моделі штучного інтелекту не склали українське ЗНО, - дослідження

18 липня, 08:01

Хоча штучний інтелект уже давно обганяє людей у швидкості обробки даних і точності обчислень, його логічне мислення та аналітичний підхід, як і раніше, залишає бажати кращого. Ба більше, ChatGPT і інші популярні моделі ШІ не склали б українського ЗНО.

Як пише Dev.ua, команда українських дослідників представила ZNOVision – перший багатоформатний тест для ШІ, що перевіряє знання з 13 предметів ЗНО українською мовою. До тестування залучили шість 6 великих мовних моделей різних розробників, включаючи OpenAI, Google та Claude.

Бенчмарк складається з більш ніж 4300 питань і охоплює 12 академічних дисциплін, включаючи математику, фізику, хімію та гуманітарні науки. Більше половини з них містять візуальний компонент – схеми, діаграми, малюнки. Частина питань потребує логічного виведення (reasoning), інша – точної інтерпретації інструкцій українською мовою.

Результати тесту показали, що штучному інтелекту не вдалось подолати поріг у 70% правильних відповідей. Найкращий бал (67,5%) – у Gemini Pro і 64,3% у Claude 3.5, тоді як GPT-4o набрав лише 47%. Для порівняння, вибір навмання дав би ≈ 22%.

За словами дослідників, найбільші труднощі для ШІ викликали візуально-текстові завдання: моделі не розпізнавали українські слова на картинках, плутали одиниці виміру, ігнорували частину формулювання.

У спеціальному наборі VQAUA (візуальні запитання українською) показники були ще нижчими: Claude – 26,7%, GPT-4o – 29%. Це майже вдвічі гірше, ніж середні результати для англомовних аналогів (60%+), що свідчить про слабку підтримку української мови на рівні мультимодальних представлень.

Джерело матеріала

InternetUA

Поділитися сюжетом

Суспільство

Українське суспільство Світове суспільство Армія Релігія

Каратимуть за інші речі: у ТЦК підтвердили, що не буде штрафів за неоновлення даних, але є нюанс

Фокус

3 хвилини тому

Найрозумніші моделі штучного інтелекту не склали українське ЗНО, - дослідження

Суспільство

Каратимуть за інші речі: у ТЦК підтвердили, що не буде штрафів за неоновлення даних, але є нюанс

Бійці полку «Ахіллес» знищили біля Купʼянська північнокорейську РСЗВ

Українців запросили на відзначення Дня Незалежності України в Копенгагені

Дрони Darts стали ще небезпечнішими: що відомо про оновлені ударні БПЛА

Армія РФ щодоби втрачає на фронті 1251 військового - Сирський

Федоров оцінив роботу МОН і заявив про трансформацію відомства

В Україні через війну зникають птахи. Орнітолог назвав вразливі види

Україна може випробовувати західну зброю в бойових умовах: як це працюватиме

Смертність в Україні майже утричі перевищила народжуваність

Суспільство

Каратимуть за інші речі: у ТЦК підтвердили, що не буде штрафів за неоновлення даних, але є нюанс

Бійці полку «Ахіллес» знищили біля Купʼянська північнокорейську РСЗВ

Українців запросили на відзначення Дня Незалежності України в Копенгагені

Дрони Darts стали ще небезпечнішими: що відомо про оновлені ударні БПЛА

Армія РФ щодоби втрачає на фронті 1251 військового - Сирський

Федоров оцінив роботу МОН і заявив про трансформацію відомства

В Україні через війну зникають птахи. Орнітолог назвав вразливі види

Україна може випробовувати західну зброю в бойових умовах: як це працюватиме

Смертність в Україні майже утричі перевищила народжуваність