/https%3A%2F%2Fs3.eu-central-1.amazonaws.com%2Fmedia.my.ua%2Ffeed%2F434%2F9ea94955baae4c3b0d6a90797d4b75be.jpg)
Google Gemini навчився перетворювати звичайні фото на відео з озвученням: як це працює
Компанія Google представила нову функцію у своєму АІ-сервісі Gemini - тепер користувачі можуть перетворювати звичайні фотографії на короткі відеоролики з озвученням.
Про це повідомляє РБК-Україна з посиланням на американський сайт про комп'ютерну техніку The Verge.
Деталі оновлення
Новинка заснована на відеомоделі Veo 3 і дає змогу створювати восьмисекундні ролики із зображень, додаючи звуковий супровід, включно з фоновими шумами, звуками довкілля і навіть мовою.
За даними Google, оновлення вже доступне підписникам Gemini AI Ultra і Pro в "окремих регіонах". На веб-платформі функція почала розгортатися сьогодні, а в мобільних додатках з'явиться протягом тижня.
Щоб скористатися можливістю, потрібно натиснути кнопку "tools" (інструменти) в рядку введення, вибрати "video", завантажити зображення і додати текстовий опис того, як картинка має "ожити". Можна також вказати аудіодеталі - від реплік до звукових ефектів і атмосфери. Google стверджує, що звук буде "повністю синхронізований із зображенням".
Підсумкове відео формується у форматі MP4, з роздільною здатністю 720p і співвідношенням сторін 16:9. Усі згенеровані відео отримують помітний водяний знак і невидиму цифрову мітку SynthID, що підтверджує використання ШІ.
"Ви можете анімувати повсякденні предмети, оживити малюнки або додати руху до природних сцен", - зазначають у Google.
Подібний функціонал уже є в інструменті Flow - платформі для створення відео за допомогою ШІ, яку Google представив у березні. Тепер же користувачам Gemini не потрібно відкривати окремий додаток - анімація доступна безпосередньо. Крім того, Google розширює доступ до Flow ще в 75 країнах.

