«Найкращий ШІ для айтішників»: Anthropic представила гібридну модель, яка «думає»
«Найкращий ШІ для айтішників»: Anthropic представила гібридну модель, яка «думає»

«Найкращий ШІ для айтішників»: Anthropic представила гібридну модель, яка «думає»

«Найкращий ШІ для айтішників»: Anthropic представила гібридну модель, яка «думає»

Разом з тим вона може генерувати і швидкі відповіді.

Компанія Anthropic випустила нову модель штучного інтелекту Claude 3.7 Sonnet, яка здатна "думати" над відповіддю, якщо користувач попросить її про це. Сама компанія називає свій ШІ "гібридною моделлю міркувань", яка може давати як швидкі, так і більш "зважені" відповіді на поставлені питання, повідомляє TechCrunch.

Користувач може сам вибирати, чи активувати процес «обдумування», який може відбуватися швидко чи повільно.

Нова модель стала доступна для всіх користувачів 24 лютого, але тільки користувачі платної версії зможуть отримати доступ до «ШІ, що думає». Для тих, хто користується безкоштовною, доступна стандартна версія Claude 3.7 Sonnet без міркувань, яка, як стверджує Anthropic, перевершує її попередню передову модель ШІ Claude 3.5 Sonnet.

Як заявила керівник відділу досліджень та розробок Anthropic Даянна Пенн, кінцева мета – зробити так, щоб Claude сам з'ясовував, як довго він може «думати» над тією чи іншою відповіддю, не вимагаючи від користувачів вибору елементів управління.

«Подібно до того, як у людей немає двох окремих мізків для питань, на які можна відповісти негайно, і для тих, які вимагають роздумів. Ми розглядаємо міркування просто як одну з можливостей, яку має мати прикордонна модель, яка має бути плавно інтегрована з іншими можливостями, а не як щось, що має бути представлене в окремій моделі», — йдеться у повідомленні Anthropic у блозі.

За словами Пенн, користувачі зможуть побачити більшу частину роздумів, але деякі частини можуть бути видалені з точки зору безпеки.

Компанія також стверджує, що оптимізувала режим мислення Claude для завдань реального світу, наприклад складних проблем кодування. Так, в одному тесті для вимірювання задач кодування в реальному тексті, SWE-Bench, точність Claude 3.7 Sonnet склала 62,3% порівняно з моделлю OpenAI o3-mini, яка набрала 49,3%.

За словами розробників, їхній ШІ демонструє помітні покращення у кодингу та у фронтенд-розробці, а також математиці. Співробітникам Anthropic вдалося успішно використовувати його під час створення сайтів та ігор.

Крім Claude 3.7 Sonnet, Anthropic також випускає агентний інструмент кодування під назвою Claude Code. Поки що він доступний лише в обмеженому попередньому перегляді. Інструмент позиціонується як «активний співавтор, що може читати код, редагувати файли, фіксувати та відправляти код на GitHub, а також використовувати інструменти командного рядка».

Раніше стало відомо, що чат-бот Grok, який позиціонується Ілоном Маском як конкурент ChatGPT, тимчасово відмовився відповідати, використовуючи джерела, які стверджують, що "Маск/Дональд Трамп поширюють дезінформацію".

Джерело матеріала
loader