За словами розробників, їхня ШІ-модель відображає основні особливості поведінки гучної китайської нейромережі DeepSeek R1-Zero.
Учені з Каліфорнійського університету в Берклі стверджують, що їм удалося відтворити основну технологію, яка лежить в основі китайського штучного інтелекту (ШІ) DeepSeek, витративши менше ніж 30 доларів на її навчання. Про це написав керівник дослідницької групи Цзяї Пан у соціальній мережі X.
Створена вченими модель ШІ отримала назву TinyZero і була розміщена на порталі GitHub для публічних експериментів. За словами розробників, TinyZero відображає основні особливості поведінки, які спостерігаються в так званій моделі DeepSeek R1-Zero.
В основі підходу команди лежить навчання з підкріпленням (RL) — техніка, в якій ШІ, починаючи з майже випадкових здогадок, поступово уточнює свої відповіді, переглядаючи і перебираючи можливі рішення. Повідомляється, що спочатку ШІ видавав "фіктивні результати", але в кінцевому підсумку він зрозумів, як виправити свої помилки.
Свою розробку американські вчені протестували в CountDown. Це гра, в якій гравці комбінують числа за допомогою базової арифметики, щоб досягти цільового числа.
"Ми відтворили DeepSeek R1-Zero у грі CountDown, і він просто працює." — написав Цзяї Пан.
Розробник підкреслив, що навчання моделі коштує менше 30 доларів. Він також висловив надію на те, що цей проєкт допоможе розвіяти міфи про масштабування RL і зробити цю технологію доступнішою.
Нагадаємо, новий чат-бот із ШІ від китайської компанії DeepSeek приховує правду про злочини ЗС РФ у Бучі. На запитання про те, чи було масове вбивство росіянами цивільних українців у Бучі інсценованим, бот видав офіційну позицію Китаю, який утримується від прямої відповіді.
Також повідомлялося, що DeepSeek R1 з тріском провалив ключові тести на безпеку, проведені дослідницькою групою Cisco у співпраці з дослідниками з Пенсільванського університету.