Нова функція: тепер користувачі ChatGPT можуть генерувати зображення

26 березня, 15:19

OpenAI оголосили, що Sora та ChatGPT об’єднують зусилля для генерації зображень, про це пише Tech Crunch. Розповідаємо, що відомо про нову функцію.

Що сталося

CEO OpenAI Сем Альтман оголосив про перше велике оновлення можливостей генерації зображень ChatGPT. Тепер чат-бот може використовувати модель GPT-4o для створення та редагування зображень і фотографій. GPT-4o вже давно імплементований до платформи чат-ботів, але досі ця модель могла створювати та редагувати лише текст, а не зображення. Альтман сказав, що власне створення зображень GPT-4o вже доступне для деяких користувачів в ChatGPT і Sora.

Sora — це також продукт OpenAI для створення відео зі штучним інтелектом, для передплатників компанії у версії Pro за $200 на місяць. Можливість створювати відео та зображення незабаром стане доступним для користувачів Plus і безкоштовних користувачів ChatGPT, а також розробників, які використовують службу API компанії.

GPT-4o, хоча й трохи повільніший за DALL-E 3 (ще один помічник компанії для генерації зображень), але він забезпечує створення більш точних та деталізованих зображень. Також нофа функція дозволяє:

редагувати зображення;
змінювати та доповнювати деталі;

Ця функція стала можливою завдяки навчанню моделі на великому обсязі загальнодоступних та приватних даних, отриманих від партнерів, таких як Shutterstock.

Чому це цікаво

Постачальники генеративного штучного інтелекту, такі як OpenAI, стикаються з дилемою: з одного боку, навчальні дані є їхньою конкурентною перевагою, тому вони намагаються зберігати їх у таємниці, а з іншого — ці ж дані можуть стати причиною судових позовів щодо інтелектуальної власності. Такі компанії, як OpenAI, намагаються знайти баланс, пропонуючи форми відмови для творців, чиї роботи використовуються в навчальних моделях, та заявляють про повагу до прав художників, забороняючи пряму імітацію їхніх робіт.

Оновлена функція генерації зображень ChatGPT, що є аналогом експериментальної функції Google Gemini 2.0 Flash, швидко стала популярною в соцмережах, але не без проблем. Користувачі виявили, що система Gemini 2.0 Flash має вразливості, які дозволяють видаляти водяні знаки та створювати зображення персонажів, захищених авторським правом.

Джерело матеріала

InternetUA

Поділитися сюжетом

Згадувані персони

Сем Альтман

Знаменитість

2 згадки

Технології

Наука Космос Гаджети Ігри Інтернет Інші

Дуров пригрозив виходом Telegram з ринку: яка причина такого категоричного рішення

InternetUA

5 годин тому

Жінка знайшла замкнені двері у своєму 200-річному будинку, шокована тим, що за ними ховалось

24tv

5 годин тому

Нова функція: тепер користувачі ChatGPT можуть генерувати зображення

Що сталося

Чому це цікаво

Технології

США випробовують конкурента нейроімпланта Neuralink: у чому його особливість

Вдруге за тиждень: популярний стримінговий сервіс знову зазнав масштабного збою

Українські айтівці опинилися під прицілом хакерів

Час ще є: коли і де дивитися метеоритний потік Лірид

Кіберполіція попереджає про шахрайства: фішингові посилання

Ілон Маск готується піти з уряду

ОАЕ першими в світі використовуватимуть ШІ для написання законів

Дуров пригрозив виходом Telegram з ринку: яка причина такого категоричного рішення

Жінка знайшла замкнені двері у своєму 200-річному будинку, шокована тим, що за ними ховалось

Технології

США випробовують конкурента нейроімпланта Neuralink: у чому його особливість

Вдруге за тиждень: популярний стримінговий сервіс знову зазнав масштабного збою

Українські айтівці опинилися під прицілом хакерів

Час ще є: коли і де дивитися метеоритний потік Лірид

Кіберполіція попереджає про шахрайства: фішингові посилання

Ілон Маск готується піти з уряду

ОАЕ першими в світі використовуватимуть ШІ для написання законів

Дуров пригрозив виходом Telegram з ринку: яка причина такого категоричного рішення

Жінка знайшла замкнені двері у своєму 200-річному будинку, шокована тим, що за ними ховалось