Nvidia представила ШІ-модель Fugatto, яка «розуміє і генерує звук так само, як це роблять люди»

25 листопада, 18:11

Nvidia представила новий експериментальний генеративний ШІ, який вони називають «універсальним інструментом для роботи зі звуком».

Ця модель, відома як Foundational Generative Audio Transformer Opus 1 (або Fugatto), може сприймати текстові підказки та використовувати їх для створення аудіо або зміни наявних музичних, голосових і звукових файлів. Над розробкою моделі працювала міжнародна команда дослідників ШІ, що, за словами NVIDIA, зробило її «багатоакцентні та багатомовні можливості» ще сильнішими.

Рафаель Валле, один із дослідників проєкту та менеджер із прикладних аудіодосліджень у NVIDIA, зазначив: «Ми хотіли створити модель, яка розуміє і генерує звук так само, як це роблять люди».

Компанія навела кілька прикладів, де Fugatto може бути корисною. Наприклад, музичні продюсери зможуть швидко створювати прототипи пісень, які потім легко редагувати, змінюючи стилі, голоси та інструменти.

Люди зможуть використовувати Fugatto для створення матеріалів для вивчення мов з обраним голосом. А розробники відеоігор зможуть створювати різні варіанти заздалегідь записаних звуків, щоб вони відповідали змінам у грі залежно від вибору та дій гравців.

Крім того, дослідники виявили, що модель може виконувати завдання, яких її не навчали, з невеликим додатковим налаштуванням. Наприклад, вона може поєднувати окремо засвоєні команди, щоб генерувати сердитий голос із певним акцентом або звук співу пташок під час грози. Модель також здатна створювати звуки, які змінюються з часом, як-от звук дощу, що наближається.

NVIDIA не повідомила, чи надасть публічний доступ до Fugatto. Але ця модель ШІ — не перша генеративна модель, здатна створювати звуки з текстових підказок. Раніше Meta випустила відкритий ШІ-інструментарій, який може генерувати звуки з текстових описів. А Google має власний ШІ під назвою MusicLM, який перетворює текст на музику.

Спецпроєкти

Джерело: Nvidia, Engadget

Nvidia представила ШІ-модель Fugatto, яка «розуміє і генерує звук так само, як це роблять люди» - Фото 2

Джерело матеріала

ITC

Поділитися сюжетом

Технології

Наука Космос Гаджети Ігри Інтернет Інші

Американські розробники представили новітню кінетичну антидронову систему

InternetUA

6 хвилин тому

Учені не змогли вберегти зразки астероїда Рюгу від забруднення земними бактеріями

24tv

43 хвилини тому

Після випуску власної пошукової системи OpenAI складе конкуренцію Google зі ще одним продуктом

24tv

2 години тому

Nvidia представила ШІ-модель Fugatto, яка «розуміє і генерує звук так само, як це роблять люди»

Технології

Американські розробники представили новітню кінетичну антидронову систему

Учені не змогли вберегти зразки астероїда Рюгу від забруднення земними бактеріями

Шахраї маскуються під UNICEF для крадіжки даних українців

Зміна клімату посилила силу ураганів

Топ-6 способів зарядити смартфон, якщо вимкнули світло

У мережі шириться фейк про «різдвяні набори» від Червоного Хреста України

Як зробити скриншот на Android: три найзручніші та найлегші способи

Google Play Store може попередити про завантаження програм низької якості

Після випуску власної пошукової системи OpenAI складе конкуренцію Google зі ще одним продуктом

Технології

Американські розробники представили новітню кінетичну антидронову систему

Учені не змогли вберегти зразки астероїда Рюгу від забруднення земними бактеріями

Шахраї маскуються під UNICEF для крадіжки даних українців

Зміна клімату посилила силу ураганів

Топ-6 способів зарядити смартфон, якщо вимкнули світло

У мережі шириться фейк про «різдвяні набори» від Червоного Хреста України

Як зробити скриншот на Android: три найзручніші та найлегші способи

Google Play Store може попередити про завантаження програм низької якості

Після випуску власної пошукової системи OpenAI складе конкуренцію Google зі ще одним продуктом