Google представляє нову модель Gemini, заявляючи, що вона розумніша за GhatGPT та DeepSeek

26 березня, 11:03

Gemini 2.5 Pro Experimental вже доступна на платформі для розробників Google AI Studio, а також у додатку Gemini для передплатників тарифного плану Gemini Advanced вартістю 20 доларів на місяць. У майбутньому, як заявляє Google, всі нові моделі ШІ матимуть вбудовані можливості міркування, повідомляє 24 Канал з посиланням на блог Google.

Найкращий з найкращих

Відтоді, як у вересні 2024 року OpenAI запустила першу модель міркувань ШІ o1, технологічна індустрія змагалася, щоб зрівнятися або перевершити можливості цієї моделі у своїх розробках. Сьогодні Anthropic, DeepSeek, Google та xAI мають моделі міркувань, які використовують додаткову обчислювальну потужність і час для перевірки фактів і міркувань над проблемами перед тим, як надати відповідь.

Методи міркувань допомогли моделям ШІ досягти нових висот у вирішенні математичних і кодувальних завдань. Багато хто у світі технологій вважає, що моделі міркувань стануть ключовим компонентом ШІ-агентів – автономних систем, здатних виконувати завдання практично без втручання людини. Однак ці моделі також і дорожчі.

Google і раніше експериментував з моделями міркувань ШІ, випустивши в грудні "мислячу" версію Gemini. Але Gemini 2.5 – це найсерйозніша спроба компанії перевершити моделі OpenAI серії "o".

Розробники стверджують, що Gemini 2.5 Pro перевершує попередні передові моделі ШІ, а також деякі з провідних конкуруючих моделей ШІ за кількома показниками. Зокрема, компанія каже, що розробила Gemini 2.5 для створення візуально привабливих веб-додатків і додатків з агентним кодуванням.

Gemini 2.5 – це модель мислення, розроблена для вирішення дедалі складніших завдань. Наша перша модель 2.5, Gemini 2.5 Pro Experimental, випереджає загальноприйняті бенчмарки зі значним відривом і демонструє сильні міркування та можливості коду,
– йдеться в заяві компанії.

У тесті Aider Polyglot, який вимірює можливості редагування коду, Gemini 2.5 Pro набрав 68,6%, випередивши найкращі моделі штучного інтелекту від OpenAI, Anthropic та китайської лабораторії DeepSeek.
В іншому тесті, що вимірює здібності розробників програмного забезпечення, SWE-bench Verified, Gemini 2.5 Pro набрав 63,8%, випередивши o3-mini від OpenAI і R1 від DeepSeek, але відстає від Claude 3.7 Sonnet компанії Anthropic, який набрав 70,3%.
На так званому "останньому іспиті людства", мультимодальному тесті, що складається з тисяч різних питань з математики, гуманітарних та природничих наук, Gemini 2.5 Pro набрав 18,8%, що є кращим результатом, ніж у більшості конкуруючих флагманських моделей.

Результати тестів
Результати тестів / Фото Google

Gemini 2.5 Pro Experimental також лідирує в математичних тестах і тестах генерації коду AIME 2025 і LiveCodeBench v5. Компанія стверджує, що 2.5 являє собою "великий стрибок" в продуктивності кодування в порівнянні з попередньою версією.

Порівняння різних моделей від різних розробників
Порівняння різних моделей від різних розробників / Фото Google

Модель Google сприймає запити за допомогою тексту, аудіо, відео та зображень, але видає результат лише текстом. Її знання обриваються в січні 2025 року.

Google заявляє, що Gemini 2.5 Pro постачається з контекстним вікном на 1 мільйон токенів, що означає, що ШІ-модель може сприймати приблизно 750 000 слів за один прохід. Це більше, ніж вся серія книг "Володар перснів". Незабаром Gemini 2.5 Pro буде підтримувати вдвічі більшу довжину вхідних даних – 2 мільйони токенів.

Google не опублікував ціни на API для Gemini 2.5 Pro. Компанія каже, що надасть більше інформації в найближчі тижні.

Теги за темою

Google Техно

Джерело матеріала

24tv

Поділитися сюжетом

Технології

Наука Космос Гаджети Ігри Інтернет Інші

Як виміряти швидкість інтернету вдома та на смартфоні

InternetUA

17 хвилин тому

В Україні з’явилась перша держпослуга зі штучним інтелектом

ГЛАВКОМ NET

20 хвилин тому

NVIDIA показала DLSS 4 і RTX в Resident Evil Requiem, Cinder City, Black State та інших нових іграх

ITC

21 хвилину тому

У WhatsApp тестують ШІ-функцію, що допомагає редагувати тон і стиль повідомлень

Детектор М

32 хвилини тому

Били молотком і не тільки. Новий смартфон Redmi пройшов тести на міцність

InternetUA

38 хвилин тому

Видалити повідомлення навіть із чужого телефону: Google нарешті запустила вкрай корисну функцію

Фокус

1 годину тому

5 найвідоміших українських кіберспортивних команд, які знають в усьому світі

24tv

1 годину тому

Nvidia розробляє для Китаю новий потужний чип на основі штучного інтелекту - Reuters

InternetUA

1 годину тому

Єдина у світі комаха використовує Чумацький Шлях замість компаса: як їй це вдається

InternetUA

2 години тому