Піонери штучного інтелекту отримали нагороду Тюрінга

6 марта, 09:01

Двоє інноваційних вчених-комп’ютерників отримали нагороду Тюрінга 2024 року за свою роботу в навчанні з підкріпленням, дисципліні, в якій машини навчаються за допомогою підходу на основі винагороди методом проб і помилок, який дозволяє їм адаптуватися в обмеженому або динамічному середовищі.

Ендрю Г. Барто , почесний професор Массачусетського університету Амгерст; та Річард С. Саттон , професор Університету Альберти, розробив ключові алгоритми та теорії через серію фундаментальних робіт, починаючи з 1980-х років . Це включає в себе роботу над технікою підкріплення, що називається навчанням часових відмінностей ; пізніше цей дует опублікував академічний підручник під назвою Reinforcement Learning: An Introduction .

Шановний математик Алан Тюрінг (на фото вище), на честь якого названо Премію Тюрінга, також підготував статтю в 1950-х роках під назвою « Обчислювальна техніка та інтелект» , у якій ставилося під сумнів, чи можуть комп’ютери мислити, і торкався подібних концепцій щодо навчання на досвіді.

В останні роки навчання з підкріпленням привернуло більше уваги після того, як Google Deepmind використав цю техніку для створення ШІ, який переміг найкращих у світі гравців AlphaGo . А за останні кілька місяців китайська вискочка зі штучного інтелекту DeepSeek потрапила в заголовки газет завдяки своїй революційній моделі міркування R1, яка значною мірою спиралася на навчання з підкріпленням для створення більш економічно ефективних базових моделей.

Ендрю Г. Барто та Річард С. Саттон**Авторство зображення:** ACM

«Нобелівська премія з обчислювальної техніки»

Премію Тьюрінга, яку вручає Асоціація обчислювальної техніки (ACM), часто називають «Нобелівською премією з обчислювальної техніки». Однак сама Нобелівська премія вторгається в сферу обчислень, особливо навколо ШІ; Минулого року Джефф Хінтон і Джон Хопфілд отримали Нобелівську премію з фізики за свою роботу в галузі штучного інтелекту. Невдовзі за цим послідували Деміс Хассабіс і Джон Джампер із DeepMind, які отримали Нобелівську премію з хімії за роботу над AlphaFold .

«На розвиток навчання з підкріпленням надихнули різні галузі досліджень, починаючи від когнітивної науки та психології та закінчуючи неврологією, що заклало основу для деяких найважливіших досягнень у галузі штучного інтелекту та дало нам змогу краще зрозуміти, як працює мозок», — сказав у прес-релізі президент ACM Янніс Іоаннідіс . «Робота Барто і Саттон — це не сходинка, від якої ми зараз рухаємось далі. Навчання з підкріпленням продовжує розвиватися та пропонує великий потенціал для подальшого прогресу в обчислювальній техніці та багатьох інших дисциплінах. Це доречно, що ми вшановуємо їх найпрестижнішою нагородою в нашій галузі».

Серед інших видатних піонерів штучного інтелекту, які отримали нагороду Тюрінга, — головний науковець Meta з штучного інтелекту Ян ЛеКун , який отримав нагороду в 2018 році разом із Джеффом Хінтоном і Йошуа Бенгіо за роботу над глибокими нейронними мережами.

Барто та Саттон поділять грошовий приз у розмірі 1 мільйон доларів, який був наданий за підтримки Google.

Источник материала