Google только анонсировала Gemini, свой самый мощный набор моделей искусственного интеллекта, а компанию уже обвинили во лжи относительно его производительности.
В статье от Bloomberg утверждается, что Google исказил мощность Gemini в недавнем видеоролике. Во время своего анонса Google показала демонстрационное видео и обозреватель Парми Олсон утверждает, что у видео продукт выглядел чрезвычайно мощным — возможно даже слишком.
Шестиминутное видео демонстрирует мультимодальные возможности Gemini (например, разговорные подсказки в сочетании с распознаванием изображений). Кажется, Gemini распознает изображение быстро — даже на картинке, где нужно соединить точки — и реагирует в течение нескольких секунд, а также отслеживает пачку бумаги в чашке и игру с мячом в реальном времени. Конечно, все это может делать человек, но это искусственный интеллект, способный распознавать и предполагать, что произойдет дальше, передает The Verge.
Но если нажать на описание видео на YouTube, то Google содержит важную оговорку:
Для целей этой демонстрации задержка была уменьшена, а ответы Gemini были сокращены для краткости.
Вакансии
Журналіст, автор історій про IT, бізнес та людей в MC.today MC.today
Senior/Lead Python Engineer Impressit, з/п 7000
Senior DevOps (Solutions Architect) Hygge Software
Java Developer Go Interactive, Віддалено
Именно это возмущает Олсон. Согласно ее статье, Google признал, когда его попросили прокомментировать, что видеодемонстрация не происходила в реальном времени с голосовыми подсказками, а использовались неподвижные кадры из необработанного материала, а затем выписывались текстовые подсказки, на которые Gemini реагировал.
Google не соглашается. На вопрос о правдивости демонстрации, компания указала на пост Ориола Виньялса, вице-президента по исследованиям и руководителя направления глубокого обучения в Google DeepMind (также соруководителя Gemini), в котором объясняется, как команда создала видеоролик.
Все подсказки и результаты работы пользователя в видео подлинны, сокращены для краткости. Видео иллюстрирует, как может выглядеть многорежимный опыт, созданный с помощью Gemini. Мы создали его, чтобы вдохновить разработчиков.
Он добавил, что команда предоставила Gemini изображения и тексты и попросила его ответить, предсказав, что будет дальше.
Really happy to see the interest around our “Hands-on with Gemini” video. In our developer blog yesterday, we broke down how Gemini was used to create it. https://t.co/50gjMkaVc0
We gave Gemini sequences of different modalities — image and text in this case — and had it respond… pic.twitter.com/Beba5M5dHP
— Oriol Vinyals (@OriolVinyalsML) December 7, 2023