Штучний інтелект DeepMind перевершив людей у ​​вирішенні математичних завдань
Штучний інтелект DeepMind перевершив людей у ​​вирішенні математичних завдань

Штучний інтелект DeepMind перевершив людей у ​​вирішенні математичних завдань

Штучний інтелект (ШІ), створений на основі великих мовних моделей (LLMs), продемонстрував здатність генерувати нові рішення математичних завдань, натхнених картковою гроюSet. Система, що отримала назву FunSearch, просунула дослідження в галузі комбінаторики - галузі математики, що вивчає способи підрахунку можливих розташування множин з кінцевою кількістю об'єктів.

Як заявив Пушміт Кохлі, керівник команди "ШІ для науки" в Google DeepMind у Лондоні: "Це перший випадок, коли система, заснована на LLM, змогла перевершити те, що було відомо математикам та комп'ютерним ученим. Це не просто новинка, це найефективніше, що існує сьогодні."

На відміну від попередніх експериментів, де дослідники використовували великі мовні моделі для вирішення математичних завдань з відомими рішеннями, FunSearch автоматично створює запити до спеціально навченої LLM, просить її написати короткі комп'ютерні програми для створення рішень певної математичної задачі. Потім система швидко перевіряє, чи перевершують ці рішення відомі. Якщо ні, вона надає зворотний зв'язок LLM, щоб вона могла покращитися в наступному раунді.

"Ми використовуємо LLM як двигун творчості", - каже Бернардіно Ромера-Паредес, комп'ютерний вчений з DeepMind. Не всі програми, створені LLM, корисні і деякі з них настільки погані, що навіть не можуть бути запущені. Але інша програма може швидко відкинути некоректні та перевірити правильні результати.

Команда випробувала FunSearch на "проблемі кеп-сету", що походить з гри Set, винайденої в 1970-х роках генетиком Маршою Фалко. Колода Set містить 81 карту, кожна з яких відображає один, два або три символи, ідентичні за кольором, формою та відтінком - і для кожної з цих характеристик існує три можливі варіанти.

Математики показали, що гравці гарантовано знайдуть набір, якщо кількість перевернутих карток становить не менше 21. Вони також знайшли рішення для більш складних версій гри, в яких абстрактні версії карток мають п'ять або більше властивостей. Проте, деякі таємниці залишаються. Наприклад, якщо є n властивостей, де n – будь-яке ціле число, то існує 3n можливих карт – але мінімальна кількість карт, які мають бути розкриті для гарантії рішення, невідомо.

Ця проблема може бути виражена у термінах дискретної геометрії. Там це еквівалентно знаходженню певних розташувань трьох точок у n-мірному просторі. Математики змогли встановити межі можливого загального рішення - враховуючи n, вони виявили, що необхідна кількість "карт на столі" має бути більше, ніж дано за певною формулою, але менше, ніж за іншою.

FunSearch змогла покращити нижню межу для n = 8, згенерувавши набори карток, які відповідають усім вимогам. "Ми не доводимо, що не можемо покращити це, але ми отримуємо конструкцію, яка виходить за рамки того, що було відомо раніше", - каже Алхуссейн Фавзі, комп'ютерний вчений з DeepMind.

Однією з важливих особливостей FunSearch є те, що люди можуть бачити успішні програми, створені LLM, і вчитися на них, каже співавтор дослідження Джордан Елленберг, математик Університету Вісконсін-Медісон. Це відрізняє техніку від інших додатків, де ШІ є "чорною скринькою".

"Найзахоплююче для мене - моделювання нових режимів співпраці людини та машини", - додає Елленберг. "Я не розглядаю їх як заміну математикам-людям, а скоріше, як силу, що збільшує."

Источник материала
loader
loader