В США ученые скопировали китайский чат-бот DeepSeek, потратив менее 30 долларов
В США ученые скопировали китайский чат-бот DeepSeek, потратив менее 30 долларов

В США ученые скопировали китайский чат-бот DeepSeek, потратив менее 30 долларов

По словам разработчиков, их ИИ-модель отражает основные особенности поведения нашумевшей китайской нейросети DeepSeek R1-Zero.

Ученые из Калифорнийского университета в Беркли утверждают, что им удалось воспроизвести основную технологию, лежащую в основе китайского искусственного интеллекта (ИИ) DeepSeek, потратив менее 30 долларов на ее обучение. Об этом написал руководитель исследовательской группы Цзяи Пан в социальной сети X.

Созданная учеными модель ИИ получила название TinyZero и была размещена на портале GitHub для публичных экспериментов. По словам разработчиков, TinyZero отражает основные особенности поведения, наблюдаемые в так называемой модели DeepSeek R1-Zero.

В основе подхода команды лежит обучение с подкреплением (RL) – техника, в которой ИИ, начиная с почти случайных догадок, постепенно уточняет свои ответы, пересматривая и перебирая возможные решения. Сообщается, что счала ИИ выдавал "фиктивные результаты", но в конечном итоге он понял, как исправить свои ошибки.

Важно Китай против США: почему ИИ DeepSeek удалось обойти ChatGPT за считанные дни

Свою разработку американские ученые протестировали в CountDown. Это игра, в которой игроки комбинируют числа с помощью базовой арифметики, чтобы достичь целевого числа.

"Мы воспроизвели DeepSeek R1-Zero в игре CountDown, и он просто работает." — написал Цзяи Пан.

Разработчик подчеркнул, что обучение модели стоит менее 30 долларов. Он также выразил надежду на то, что данный проект поможет развеять мифы о масштабировании RL и сделать эту технологию более доступной.

Также сообщалось, что DeepSeek R1 с треском провалил ключевые тесты на безопасность, проведенные исследовательской группой Cisco в сотрудничестве с исследователями из Пенсильванского университета.

Теги по теме
Китай ученые
Источник материала
loader
loader