Nvidia демонструє нову модель ШІ, що може змінювати голоси
Nvidia демонструє нову модель ШІ, що може змінювати голоси

Nvidia демонструє нову модель ШІ, що може змінювати голоси

Nvidia продемонструвала нову модель штучного інтелекту для генерування музики та аудіо, яка може змінювати голоси та генерувати нові звуки – технологія, призначена для виробників музики, фільмів та відеоігор.

Nvidia, найбільший у світі постачальник чіпів і програмного забезпечення, що використовується для створення систем штучного інтелекту, заявила, що не має найближчих планів публічного випуску технології, яку вона називає Fugatto, скорочення від Foundational Generative Audio Transformer Opus 1.

Він приєднується до інших технологій, продемонстрованих стартапами, такими як Runway, і більшими гравцями, такими як Meta Platforms який може генерувати аудіо або відео з текстової підказки.

Версія Nvidia із Санта-Клари, штат Каліфорнія, генерує звукові ефекти та музику з текстового опису, включаючи нові звуки, такі як звуки труби, як собака.
Що відрізняє її від інших технологій штучного інтелекту, так це її здатність отримувати та змінювати наявний звук, наприклад, беручи рядок, зіграний на фортепіано, і перетворюючи його на рядок, який співає людський голос, або беручи запис вимовленого слова та змінюючи його. використаний акцент і виражений настрій.
«Якщо ми подумаємо про синтетичне аудіо за останні 50 років, музика зараз звучить по-іншому через комп’ютери, через синтезатори», — сказав Брайан Катанцаро, віце-президент із досліджень прикладного глибокого навчання Nvidia. «Я думаю, що генеративний штучний інтелект надасть нові можливості музиці, відеоіграм і звичайним людям, які хочуть щось створювати».
Поки такі компанії, як OpenAI, ведуть переговори з голлівудськими студіями про те, чи можна використовувати штучний інтелект в індустрії розваг і як, відносини між технікою та Голлівудом стали напруженими, особливо після того, як голлівудська зірка Скарлетт Йоханссон звинуватила OpenAI в імітації її голосу.
Нова модель Nvidia була навчена на відкритих даних, і компанія заявила, що все ще обговорює, чи опублікувати її публічно.
«Будь-яка генеративна технологія завжди несе певні ризики, тому що люди можуть використовувати її для створення речей, які ми б не хотіли, щоб вони робили це», — сказав Катандзаро. «Нам потрібно бути обережними з цим, тому ми не маємо найближчих планів випускати це».
Творцям генеративних моделей штучного інтелекту ще належить визначити, як запобігти зловживанню технологією, наприклад, створенню користувачем дезінформації або порушенню авторських прав шляхом створення захищених авторським правом символів.
Джерело матеріала
loader