Команда дослідників розробила нову модель штучного інтелекту під назвою Fugatto, яка здатна генерувати звуки, що ніколи раніше не були почуті. Розробка, здійснена компанією Nvidia, спеціалізується на створенні аудіо з текстових підказок і є, за словами розробників, своєрідним “швейцарським армійським ножем” для звуків. Модель здатна створювати унікальні звукові композиції, які можуть бути використані для редагування, а також для генерації нових звуків, що раніше були неможливими.
Як пояснив Річард Керріс із Nvidia, Fugatto є більш спритною і універсальною моделлю, ніж інші аналогічні технології. Вона здатна генерувати звуки, такі як “гавкіт труби” або “нявкання саксофона”. Наприклад, на основі текстової підказки “Глибокі, гуркітливі басові імпульси в парі з переривчастим, високочастотним цифровим щебетанням, як звук масивної розумної машини, що прокидається”, модель створила новий унікальний звук, який не можна було б відтворити звичайними інструментами.
Крім того, Fugatto здатна трансформувати звуки з одного типу в інший, наприклад, перетворюючи звук поїзда на струнний оркестр. Продюсер Ідо Змішлані, який бере участь у програмі Nvidia Inception, зазначив: “Ця штука дика. Звук – це моє натхнення. Ідея про те, що я можу створювати абсолютно нові звуки на льоту в студії – неймовірна.”
Розробка Fugatto зайняла понад рік, і для її навчання було використано мільйони аудіо-семплів. Однак, незважаючи на її потенціал у музиці та звуковому дизайні, є побоювання щодо впливу цієї технології на традиційних творців та їхнє мистецтво.