/https%3A%2F%2Fs3.eu-central-1.amazonaws.com%2Fmedia.my.ua%2Ffeed%2F434%2Fa73cf9e134398513406212f76006261f.jpg)
Google додає нову голосову модель Chirp 3 до своєї платформи Vertex AI
Основна увага в генеративному штучному інтелекті була зосереджена на текстових інтерфейсах, які використовуються для створення тексту, зображень тощо. Наступна хвиля, здається, голосова, і вона швидко накочується. В останній розробці Google сьогодні оголосила, що з наступного тижня вона додасть Chirp 3 — моделі синтезу мовлення в текст і HD-тексту в мовлення — до своєї платформи розробки Vertex AI.
Минулого тижня Google тихо оголосив , що Chirp 3 випустить 8 нових голосів для 31 мови. Варіанти використання платформи включають створення голосових помічників, створення аудіокниг, розробку агентів підтримки та голос за кадром для відео. Про це було оголошено на заході в офісі Google DeepMind у Лондоні.
Його зусилля відбуваються водночас, коли інші також стрибають вперед у своїй роботі з голосовим штучним інтелектом. Минулого тижня Sesame — стартап, який створив вірусні додатки зі штучним інтелектом «Maya» та «Miles» з дуже реалістичним звучанням — оголосив про запуск своєї моделі, за допомогою якої розробники створюють власні програми та сервіси на основі його технологій.
Примітно, що навколо Chirp 3 будуть обмеження на використання, щоб спробувати уникнути зловживання. «Ми просто працюємо над деякими з цих речей з нашою командою безпеки», — сказав Томас Куріан, генеральний директор Google Cloud, на сьогоднішньому заході новин.
ElevenLabs є одним із найбільших стартапів, які зібрали сотні мільйонів фінансування для розширення своєї роботи в голосових сервісах ШІ.
Ці новини переведуть Chirp 3 у ту саму стабільність, що й нові версії його флагманського LLM, Gemini, які тестуються, а також його модель генерації зображень Imagen і його дорогий інструмент генерації відео Veo 2 .
Залишається підтвердити, чи буде те, що Google випускає з Chirp 3, таким же «реалістичним», як деякі інші спроби штучного інтелекту створити «людські» голоси (робота Sesame виділяється зокрема). Але, як підкреслив Деміс Хассабіс, генеральний директор DeepMind, це залишається марафоном, а не спринтом.
«У найближчій перспективі… ця ідея про те, що [ШІ] є срібною кулею для всього в наступні пару років, я поки що не бачу, щоб це сталося. Вважаю, що до появи чогось на зразок AGI залишилося ще кілька років», — сказав він. «Це змінить речі... протягом наступного десятиліття, тобто в середньостроковій та довгостроковій перспективі. Це один із тих цікавих моментів у часі».
Google запустив Vertex AI ще в 2021 році як платформу для розробників для створення сервісів машинного навчання в хмарі. Звичайно, це було задовго до вибуху інтересу до штучного інтелекту, зокрема генеративного штучного інтелекту, який прийшов із запуском служб OpenAI GPT.
Відтоді компанія частково схиляється до Vertex AI, намагаючись наздогнати інші компанії , такі як Microsoft і Amazon — вони також створюють інструменти генеративного штучного інтелекту для розробників. Окрім створення генеративного ШІ на основі Gemini, розробники можуть використовувати Vertex AI для класифікації даних, навчання моделей і налаштування моделей для виробництва. Буде цікаво, чи планує компанія розширити свій огороджений сад моделями, окрім тих, які створив сам Google.
Google створював голосові служби «Chirp» роками, повертаючись до використання цієї назви як кодової назви для своїх ранніх спроб конкурувати з службою Alexa Amazon.
