/https%3A%2F%2Fs3.eu-central-1.amazonaws.com%2Fmedia.my.ua%2Ffeed%2F137%2F5629a19316927a593d4a83dd325b7a4b.jpg)
ШІ навчився розпізнавати дані як людина, — дослідження
/https%3A%2F%2Fs3.eu-central-1.amazonaws.com%2Fmedia.my.ua%2Ffeed%2F137%2F39fe626fd55bc137ce624c113bebda6c.png)
Китайські дослідники стверджують, що сучасні моделі ШІ вже здатні розпізнавати та сортувати різні категорії інформації подібно до людини.
За словами науковців з Китайської академії наук та Південно-Китайського технологічного університету в Гуанчжоу, деякі моделі ШІ копіюють ключові функції людського мозку під час виконання завдань з сортування інформації. Науковці прагнули з’ясувати, чи можуть великі мовні моделі, такі як ChatGPT або Gemini, розуміти та обробляти інформацію про різні об’єкти подібно до людей.
Для цього вчені дали моделям ШІ ChatGPT-3.5 та Gemini Pro Vision завдання, прибрати з низких текстових та візуальних об’єктів зайві. Для цього було зібрано 4,7 млн відповідей стосовно 1 тис. 854 різних об’єктів, серед яких, собаки, стільці, яблука, автомобілі, таке інше.
За результатами дослідження науковці встановили, що зі створених ШІ моделей, 66 були створені на основі того, як це роблять люди. Ці моделі включали в себе доволі складні атрибути, такі як: текстура, емоційна значущість та доступність для дітей.
Дослідники з’ясували, що мультимодальні моделі, здатні поєднувати текст і зображення, ще більше копіюють людське мислення. Крім того, команда виявила, що дані сканування мозку виявили збіг між тим, як ШІ та людський мозок реагують на об’єкти.
За словами китайських науковців, результати їхнього дослідження свідчать, що ШІ дійсно здатні до наближеного до людського розуміння, а не просто імітації відповідей. Майбутні моделі ШІ можуть отримати більш інтуїтивні, сумісні з людиною міркування, що необхідно для робототехніки, освіти та співпраці людини та систем на базі штучного інтелекту.
Однак великі мовні моделі, все ж таки, не розуміють об’єкти так само як люди на емоційному або емпіричному рівні. Моделі ШІ працюють, розпізнаючи шаблони у тексті або візуальному контенті, однак, на відміну від людей, це базується не на життєвому досвіді та сенсорно-моторній взаємодії. Великі мовні моделі більше схожі на дзеркало, що відображує мільйони джерел текстової та візуальної інформації для користувача на основі опанованих шаблонів.
Результати дослідження опубліковані у журналі Nature
Джерело: Interesting Engineering
/https%3A%2F%2Fs3.eu-central-1.amazonaws.com%2Fmedia.my.ua%2Ffeed%2F137%2F39fe626fd55bc137ce624c113bebda6c.png)
