OpenAI запускає обробку Flex для дешевших і повільніших завдань ШІ
OpenAI запускає обробку Flex для дешевших і повільніших завдань ШІ

OpenAI запускає обробку Flex для дешевших і повільніших завдань ШІ

У спробі агресивніше конкурувати з конкуруючими компаніями штучного інтелекту, такими як Google, OpenAI запускає обробку Flex , опцію API, яка забезпечує нижчі ціни на використання моделі штучного інтелекту в обмін на менший час відгуку та «часову недоступність ресурсів».

За словами OpenAI, обробка Flex, доступна в бета-версії для нещодавно випущених моделей міркувань OpenAI o3 і o4-mini , спрямована на виконання завдань з нижчим пріоритетом і «невиробничих» завдань, таких як оцінювання моделі, збагачення даних і асинхронні робочі навантаження.

Це зменшує витрати на API рівно вдвічі. Для o3 обробка Flex становить 5 доларів США за мільйон вхідних токенів (~750 000 слів) і 20 доларів США за мільйон вихідних токенів проти стандартних 10 доларів США за мільйон вхідних токенів і 40 доларів США за мільйон вихідних токенів. Для o4-mini Flex знижує ціну до 0,55 доларів США за мільйон вхідних токенів і 2,20 доларів США за мільйон вихідних токенів із 1,10 доларів США за мільйон вхідних токенів і 4,40 доларів США за мільйон вихідних токенів.

Запуск обробки Flex відбувається в той час, як ціни на передовий AI продовжують зростати, а конкуренти випускають дешевші та ефективніші бюджетні моделі. У четвер Google випустив Gemini 2.5 Flash , модель міркування, яка відповідає або перевершує R1 DeepSeek з точки зору продуктивності за нижчої вартості вхідних токенів.

В електронному листі для клієнтів, який оголосив про запуск цінової політики Flex, OpenAI також зазначив, що розробники на рівнях 1-3 ієрархії рівнів використання повинні будуть пройти нещодавно введений процес перевірки ідентифікатора для доступу до o3. Рівні визначаються кількістю грошей, витрачених на послуги OpenAI. Підсумки міркувань O3 — та інших моделей — і підтримка API потокової передачі також закриті перевіркою.

Раніше OpenAI заявляв, що перевірка ідентифікатора призначена для того, щоб зловмисники не порушували політику використання.

Источник материала
loader
loader