Google представляет модель ИИ Gemini 1.5 — огромное контекстное окно, способное обрабатывать несколько часов видео, но не для всех

15 февраля, 23:54, 2024

Вскоре после запуска Gemini, большой языковой модели, которую Google надеется вывести на вершину индустрии искусственного интеллекта, компания уже объявляет ее преемника. Сегодня Google запускает Gemini 1.5 и делает его доступным для разработчиков и корпоративных пользователей перед полным развертыванием для потребителей. Компания позиционирует Gemini как бизнес-инструмент, личного помощника и инструмент для всего, что лежит между ними.

Gemini 1.5 Pro, модель общего назначения в системе Google, очевидно, не уступает Gemini Ultra, которую компания недавно выпустила, и превосходит Gemini 1.0 Pro на 87% в тестах. Модель была создана с помощью методики, известной как «Смесь экспертов» или MoE. Это означает, что она запускает только часть общей модели, когда вы отправляете запрос, а не обрабатывает запрос всей мощностью все время. Такой подход должен сделать модель более быстрой в использовании и эффективной для работы Google.

Gemini 1.5 имеет огромное контекстное окно, что означает, что модель может обрабатывать гораздо большие запросы и просматривать гораздо больше информации одновременно. Это окно составляет колоссальный 1 миллион токенов по сравнению со 128 000 в GPT-4 и 32 000 в актуальном Gemini Pro. CEO Google Сундар Пичаи объясняет это: «Это примерно 10 или 11 часов видео, десятки тысяч строк кода». Размер контекстного окна означает, что вы можете спросить бота AI обо всем этом контенте одновременно. Пичаи также сообщил, что исследователи Google тестируют контекстное окно с 10 млн токенов — это как будто все серии «Игры престолов» одновременно.

Сундар Пичаи также считает, что большое контекстное окно будет очень полезным для бизнеса. «Это полезно в случаях, когда вы можете добавить много личного контекста и информации в момент запроса». Например, кинематографисты могут загрузить весь свой фильм и спросить Gemini, что скажут рецензенты. Компании смогут использовать Gemini для одновременного просмотра массы финансовых записей. «Я считаю это одним из самых больших прорывов, которые мы сделали».

На данный момент Gemini 1.5 будет доступен только для бизнес-пользователей и разработчиков через Vertex AI и AI Studio от Google. Со временем она заменит Gemini 1.0, а стандартной версией Gemini Pro, доступной для всех на gemini.google.com и в приложениях компании, будет 1.5 Pro с контекстным окном в 128 000 маркеров. Придется доплатить, чтобы получить миллион. Google также проверяет безопасность модели и этические границы, в частности относительно нового большего контекстного окна.

Сейчас Google участвует в гонке, чтобы создать лучший инструмент искусственного интеллекта, поскольку компании во всем мире пытаются определить собственную стратегию искусственного интеллекта: заключать соглашения с OpenAI, Google или кем-то другим. Только на этой неделе OpenAI объявила о памяти для ChatGPT и собирается внедрить собственный веб-поиск. Пока Gemini кажется удивительным, особенно для тех, кто уже работает в экосистеме Google, но впереди еще много работы со всех сторон.

Со временем все эти версии 1.0 или 1.5, плюсы и ультра не будут иметь значения для пользователей. «Люди просто будут потреблять этот опыт. Это как использовать смартфон, не обращая внимания на процессор в нем», — говорит Сундар Пичаи. Но сейчас, по его словам, мы все еще находимся на этапе, когда каждый знает чип в своем телефоне, потому что это имеет значение.

Источник: The Verge

Теги по теме

Google

Источник материала

ITC

Поделиться сюжетом

Технологии

Наука Космос Гаджеты Игры Интернет Другие

Больше всего "мотают" электроэнергии: эксперты назвали разоряющие вас приборы

Знай

16 августа 2025

Конец эпохи ветряных турбин: что такое Hercules, производящий 5000 кВтч в домашних условиях

Фокус

2 дня назад

Критики в восторге от Resident Evil Requiem — хоррор Capcom лидирует по количеству наград на Gamescom 2025

GameMag

30 минут назад

Цифровая головоломка, которая захватила сеть: найдите число 16 за 7 секунд

Gazeta UA

15 августа 2025

Казаки спасают Россию: Cyberia Nova провела пресс-показ игры «Земский Собор»

GameMag

54 минуты назад

Столкновение галактик показало будущее Млечного пути и изменило представление о строении Вселенной

TSN

1 час назад

Google представляет модель ИИ Gemini 1.5 — огромное контекстное окно, способное обрабатывать несколько часов видео, но не для всех

Технологии

Больше всего "мотают" электроэнергии: эксперты назвали разоряющие вас приборы

Конец эпохи ветряных турбин: что такое Hercules, производящий 5000 кВтч в домашних условиях

Полнолуние и новолуние в августе 2025: лунный календарь

Ограничения в мессенджерах: Россия усиливает цифровой контроль

В Україні подешевшала капуста

Критики в восторге от Resident Evil Requiem — хоррор Capcom лидирует по количеству наград на Gamescom 2025

Цифровая головоломка, которая захватила сеть: найдите число 16 за 7 секунд

Казаки спасают Россию: Cyberia Nova провела пресс-показ игры «Земский Собор»

Столкновение галактик показало будущее Млечного пути и изменило представление о строении Вселенной

Технологии

Больше всего "мотают" электроэнергии: эксперты назвали разоряющие вас приборы

Конец эпохи ветряных турбин: что такое Hercules, производящий 5000 кВтч в домашних условиях

Полнолуние и новолуние в августе 2025: лунный календарь

Ограничения в мессенджерах: Россия усиливает цифровой контроль

В Україні подешевшала капуста

Критики в восторге от Resident Evil Requiem — хоррор Capcom лидирует по количеству наград на Gamescom 2025

Цифровая головоломка, которая захватила сеть: найдите число 16 за 7 секунд

Казаки спасают Россию: Cyberia Nova провела пресс-показ игры «Земский Собор»

Столкновение галактик показало будущее Млечного пути и изменило представление о строении Вселенной