Google представляє нову модель Gemini, заявляючи, що вона розумніша за GhatGPT та DeepSeek
Google представляє нову модель Gemini, заявляючи, що вона розумніша за GhatGPT та DeepSeek

Google представляє нову модель Gemini, заявляючи, що вона розумніша за GhatGPT та DeepSeek

Gemini 2.5 Pro Experimental вже доступна на платформі для розробників Google AI Studio, а також у додатку Gemini для передплатників тарифного плану Gemini Advanced вартістю 20 доларів на місяць. У майбутньому, як заявляє Google, всі нові моделі ШІ матимуть вбудовані можливості міркування, повідомляє 24 Канал з посиланням на блог Google.

Найкращий з найкращих

Відтоді, як у вересні 2024 року OpenAI запустила першу модель міркувань ШІ o1, технологічна індустрія змагалася, щоб зрівнятися або перевершити можливості цієї моделі у своїх розробках. Сьогодні Anthropic, DeepSeek, Google та xAI мають моделі міркувань, які використовують додаткову обчислювальну потужність і час для перевірки фактів і міркувань над проблемами перед тим, як надати відповідь.

Методи міркувань допомогли моделям ШІ досягти нових висот у вирішенні математичних і кодувальних завдань. Багато хто у світі технологій вважає, що моделі міркувань стануть ключовим компонентом ШІ-агентів – автономних систем, здатних виконувати завдання практично без втручання людини. Однак ці моделі також і дорожчі.

Google і раніше експериментував з моделями міркувань ШІ, випустивши в грудні "мислячу" версію Gemini. Але Gemini 2.5 – це найсерйозніша спроба компанії перевершити моделі OpenAI серії "o".

Розробники стверджують, що Gemini 2.5 Pro перевершує попередні передові моделі ШІ, а також деякі з провідних конкуруючих моделей ШІ за кількома показниками. Зокрема, компанія каже, що розробила Gemini 2.5 для створення візуально привабливих веб-додатків і додатків з агентним кодуванням.

Gemini 2.5 – це модель мислення, розроблена для вирішення дедалі складніших завдань. Наша перша модель 2.5, Gemini 2.5 Pro Experimental, випереджає загальноприйняті бенчмарки зі значним відривом і демонструє сильні міркування та можливості коду,
– йдеться в заяві компанії.

  • У тесті Aider Polyglot, який вимірює можливості редагування коду, Gemini 2.5 Pro набрав 68,6%, випередивши найкращі моделі штучного інтелекту від OpenAI, Anthropic та китайської лабораторії DeepSeek.
  • В іншому тесті, що вимірює здібності розробників програмного забезпечення, SWE-bench Verified, Gemini 2.5 Pro набрав 63,8%, випередивши o3-mini від OpenAI і R1 від DeepSeek, але відстає від Claude 3.7 Sonnet компанії Anthropic, який набрав 70,3%.
  • На так званому "останньому іспиті людства", мультимодальному тесті, що складається з тисяч різних питань з математики, гуманітарних та природничих наук, Gemini 2.5 Pro набрав 18,8%, що є кращим результатом, ніж у більшості конкуруючих флагманських моделей.

Результати тестів
Результати тестів / Фото Google

Gemini 2.5 Pro Experimental також лідирує в математичних тестах і тестах генерації коду AIME 2025 і LiveCodeBench v5. Компанія стверджує, що 2.5 являє собою "великий стрибок" в продуктивності кодування в порівнянні з попередньою версією.

Порівняння різних моделей від різних розробників
Порівняння різних моделей від різних розробників / Фото Google

Модель Google сприймає запити за допомогою тексту, аудіо, відео та зображень, але видає результат лише текстом. Її знання обриваються в січні 2025 року.

Google заявляє, що Gemini 2.5 Pro постачається з контекстним вікном на 1 мільйон токенів, що означає, що ШІ-модель може сприймати приблизно 750 000 слів за один прохід. Це більше, ніж вся серія книг "Володар перснів". Незабаром Gemini 2.5 Pro буде підтримувати вдвічі більшу довжину вхідних даних – 2 мільйони токенів.

Google не опублікував ціни на API для Gemini 2.5 Pro. Компанія каже, що надасть більше інформації в найближчі тижні.

Теги за темою
Google Техно
Джерело матеріала
loader
loader