Нова функція: тепер користувачі ChatGPT можуть генерувати зображення
Нова функція: тепер користувачі ChatGPT можуть генерувати зображення

Нова функція: тепер користувачі ChatGPT можуть генерувати зображення

OpenAI оголосили, що Sora та ChatGPT об’єднують зусилля для генерації зображень, про це пише Tech Crunch. Розповідаємо, що відомо про нову функцію. 

Що сталося

CEO OpenAI Сем Альтман оголосив про перше велике оновлення можливостей генерації зображень ChatGPT. Тепер чат-бот може використовувати модель GPT-4o для створення та редагування зображень і фотографій. GPT-4o вже давно імплементований до платформи чат-ботів, але досі ця модель могла створювати та редагувати лише текст, а не зображення. Альтман сказав, що власне створення зображень GPT-4o вже доступне для деяких користувачів в ChatGPT і Sora. 

Sora — це також продукт OpenAI для створення відео зі штучним інтелектом, для передплатників компанії у версії Pro за $200 на місяць. Можливість створювати відео та зображення незабаром стане доступним для користувачів Plus і безкоштовних користувачів ChatGPT, а також розробників, які використовують службу API компанії.

GPT-4o, хоча й трохи повільніший за DALL-E 3 (ще один помічник  компанії для генерації зображень), але він забезпечує створення більш точних та деталізованих зображень. Також нофа функція дозволяє:

  • редагувати зображення;
  • змінювати та доповнювати деталі;

Ця функція стала можливою завдяки навчанню моделі на великому обсязі загальнодоступних та приватних даних, отриманих від партнерів, таких як Shutterstock.

Чому це цікаво

Постачальники генеративного штучного інтелекту, такі як OpenAI, стикаються з дилемою: з одного боку, навчальні дані є їхньою конкурентною перевагою, тому вони намагаються зберігати їх у таємниці, а з іншого — ці ж дані можуть стати причиною судових позовів щодо інтелектуальної власності. Такі компанії, як OpenAI, намагаються знайти баланс, пропонуючи форми відмови для творців, чиї роботи використовуються в навчальних моделях, та заявляють про повагу до прав художників, забороняючи пряму імітацію їхніх робіт.

Оновлена функція генерації зображень ChatGPT, що є аналогом експериментальної функції Google Gemini 2.0 Flash, швидко стала популярною в соцмережах, але не без проблем. Користувачі виявили, що система Gemini 2.0 Flash має вразливості, які дозволяють видаляти водяні знаки та створювати зображення персонажів, захищених авторським правом.

Джерело матеріала
loader
loader