Google представляет модель ИИ Gemini 1.5 — огромное контекстное окно, способное обрабатывать несколько часов видео, но не для всех

15 февраля, 23:54, 2024

Вскоре после запуска Gemini, большой языковой модели, которую Google надеется вывести на вершину индустрии искусственного интеллекта, компания уже объявляет ее преемника. Сегодня Google запускает Gemini 1.5 и делает его доступным для разработчиков и корпоративных пользователей перед полным развертыванием для потребителей. Компания позиционирует Gemini как бизнес-инструмент, личного помощника и инструмент для всего, что лежит между ними.

Gemini 1.5 Pro, модель общего назначения в системе Google, очевидно, не уступает Gemini Ultra, которую компания недавно выпустила, и превосходит Gemini 1.0 Pro на 87% в тестах. Модель была создана с помощью методики, известной как «Смесь экспертов» или MoE. Это означает, что она запускает только часть общей модели, когда вы отправляете запрос, а не обрабатывает запрос всей мощностью все время. Такой подход должен сделать модель более быстрой в использовании и эффективной для работы Google.

Gemini 1.5 имеет огромное контекстное окно, что означает, что модель может обрабатывать гораздо большие запросы и просматривать гораздо больше информации одновременно. Это окно составляет колоссальный 1 миллион токенов по сравнению со 128 000 в GPT-4 и 32 000 в актуальном Gemini Pro. CEO Google Сундар Пичаи объясняет это: «Это примерно 10 или 11 часов видео, десятки тысяч строк кода». Размер контекстного окна означает, что вы можете спросить бота AI обо всем этом контенте одновременно. Пичаи также сообщил, что исследователи Google тестируют контекстное окно с 10 млн токенов — это как будто все серии «Игры престолов» одновременно.

Сундар Пичаи также считает, что большое контекстное окно будет очень полезным для бизнеса. «Это полезно в случаях, когда вы можете добавить много личного контекста и информации в момент запроса». Например, кинематографисты могут загрузить весь свой фильм и спросить Gemini, что скажут рецензенты. Компании смогут использовать Gemini для одновременного просмотра массы финансовых записей. «Я считаю это одним из самых больших прорывов, которые мы сделали».

На данный момент Gemini 1.5 будет доступен только для бизнес-пользователей и разработчиков через Vertex AI и AI Studio от Google. Со временем она заменит Gemini 1.0, а стандартной версией Gemini Pro, доступной для всех на gemini.google.com и в приложениях компании, будет 1.5 Pro с контекстным окном в 128 000 маркеров. Придется доплатить, чтобы получить миллион. Google также проверяет безопасность модели и этические границы, в частности относительно нового большего контекстного окна.

Сейчас Google участвует в гонке, чтобы создать лучший инструмент искусственного интеллекта, поскольку компании во всем мире пытаются определить собственную стратегию искусственного интеллекта: заключать соглашения с OpenAI, Google или кем-то другим. Только на этой неделе OpenAI объявила о памяти для ChatGPT и собирается внедрить собственный веб-поиск. Пока Gemini кажется удивительным, особенно для тех, кто уже работает в экосистеме Google, но впереди еще много работы со всех сторон.

Со временем все эти версии 1.0 или 1.5, плюсы и ультра не будут иметь значения для пользователей. «Люди просто будут потреблять этот опыт. Это как использовать смартфон, не обращая внимания на процессор в нем», — говорит Сундар Пичаи. Но сейчас, по его словам, мы все еще находимся на этапе, когда каждый знает чип в своем телефоне, потому что это имеет значение.

Источник: The Verge

Теги по теме

Google

Источник материала