Amazon представляє Nova Act - агент ШІ, що може керувати веб-браузером
Amazon представляє Nova Act - агент ШІ, що може керувати веб-браузером

Amazon представляє Nova Act - агент ШІ, що може керувати веб-браузером

Amazon представила Nova Act, універсальний агент зі штучним інтелектом, який може керувати веб-браузером і самостійно виконувати деякі прості дії. Разом із новою моделлю агентського штучного інтелекту Amazon випускає Nova Act SDK, набір інструментів, який дозволяє розробникам створювати прототипи агентів за допомогою Nova Act.

Nova Act, розроблена нещодавно відкритою лабораторією Amazon AGI, що базується в Сан-Франциско , також забезпечить ключові функції майбутнього оновлення компанії Alexa+, генеративної версії популярного голосового помічника Amazon, розширеної зі штучним інтелектом. Однак версія Nova Act, доступна сьогодні, трохи менш відшліфована. Amazon називає це попереднім переглядом дослідження.

Розробники можуть отримати доступ до набору інструментів Nova Act на новому веб-сайті nova.amazon.com , який також служить вітриною для різних моделей основи Amazon Nova.

Nova Act — це спроба Amazon протистояти Operator OpenAI і Computer Use від Anthropic за допомогою власної технології агентів штучного інтелекту загального призначення. Кілька провідних технологічних компаній вважають, що агенти штучного інтелекту, які можуть орієнтуватися в Інтернеті для користувачів, зроблять сучасні чат-боти штучного інтелекту значно кориснішими.

Можливо, Amazon не першим розробив таку агентську технологію, але через Alexa+ вона може мати найширше охоплення.

Amazon каже, що розробники, які створюють за допомогою Nova Act SDK, повинні мати можливість автоматизувати основні дії від імені користувачів, такі як замовлення салатів у Sweetgreen або бронювання вечері. За допомогою набору інструментів Nova Act розробники можуть об’єднати інструменти, які дозволяють агенту ШІ переміщатися по веб-сторінках, заповнювати форми або вибирати дати в календарі.

Amazon стверджує, що Nova Act перевершує агентів OpenAI і Anthropic у кількох внутрішніх тестах компанії. Наприклад, на ScreenSpot Web Text, який вимірює, як агент штучного інтелекту взаємодіє з текстом на екрані, Nova Act набрав 94%, перевершивши CUA від OpenAI (який набрав 88%) і Claude 3.7 Sonnet від Anthropic (90%).

Однак Amazon не порівнював Nova Act за допомогою більш поширених оцінок агентів, таких як WebVoyager.

Nova Act є першим загальнодоступним продуктом, який вийшов із згаданої вище лабораторії Amazon AGI, ініціативи, яку спільно очолювали колишні дослідники OpenAI Девід Луан і Пітер Аббіл. Обидва раніше засновували власні стартапи — Луан створив Adept , а Еббіл був співзасновником Covariant — до того, як минулого року Amazon найняв їх, щоб очолити роботу агента ШІ.

Хоча це може здатися дивним, коли лабораторія AGI створює агентів ШІ, які можуть замовляти салати, Луан сказав TechCrunch, що він бачить агентів як ключовий крок до створення суперінтелектуальних систем ШІ. Луан визначає AGI як «систему ШІ, яка може допомогти вам робити все, що робить людина на комп’ютері».

Луан каже, що його команда розробила Nova Act SDK, щоб надійно автоматизувати короткі прості завдання та надати розробникам інструменти для точного визначення, коли вони хочуть, щоб людина втрутилася в агентський робочий процес. Він сподівається, що це дозволить розробникам створювати більш надійні агентські програми, хоча й не обов’язково повністю автономні.

Amazon випускає свого першого агента штучного інтелекту широкого профілю в переповненому просторі, але це важлива технологія, на якій компанія багато чого використовує. Ранні випробування Nova Act могли дати можливість зазирнути в деякі з можливостей Alexa+, яка довго відкладалася, — це визначальний момент для зусиль Amazon у сфері штучного інтелекту.

Головною проблемою ранніх агентів штучного інтелекту від OpenAI, Google і Anthropic є їх надійність у різних доменах. Згідно з тестами TechCrunch, системи повільні, важко працювати незалежно протягом дуже тривалого часу, і вони схильні до помилок, яких людина не зробила б. Невдовзі ми побачимо, чи Amazon зламала код, чи її агенти страждають від тих самих недоліків, що й конкуренти.

Джерело матеріала
loader