OpenAI впроваджує нову версію ChatGPT Images, яка обіцяє краще дотримання інструкцій, більш точне редагування та до 4 разів швидшу генерацію зображень.
Нова модель, названа GPT-Image-1.5, доступна з вівторка для всіх користувачів ChatGPT і через API. Це останній етап загострення конкуренції з Google Gemini після того, як минулого місяця CEO OpenAI Сем Альтман оголосив «червоний код» у витоку внутрішнього меморандуму. У меморандумі детально описувалися плани OpenAI повернути собі лідерство в сфері ШІ після того, як Google почав відбирати частку ринку завдяки випуску Gemini 3, своєї новітньої флагманської моделі, та Nano Banana Pro, останньої версії вірусного генератора зображень Google — обидві моделі очолили рейтинг LMArena за кількома бенчмарками.
Google зберігає лідерство навіть після того, як OpenAI відповіла на її успіх минулого тижня запуском GPT-5.2, позиціонуючи її як свою найпросунутішу модель для розробників і щоденного професійного використання. За повідомленнями, OpenAI планувала випустити новий генератор зображень на початку січня, але прискорила ці плани з оголошенням цього тижня. Останній реліз моделі зображень був GPT-Image-1 у квітні.
GPT-Image-1.5 з'являється в той час, коли генератори зображень і відео виходять за межі прототипів і отримують більше можливостей для виробничого використання. Як і Nano Banana Pro, ChatGPT Images пропонує функції постпродакшн, надаючи більш детальні засоби редагування для збереження візуальної послідовності, такі як схожість обличчя, освітлення, композиція та колірна гама під час редагування.
Те саме зображення, показане вище, з різними редагуваннями для демонстрації покращеного дотримання інструкцій у GPT-Image-1.5. Image Credits:OpenAI Більшість інструментів GenAI для зображень погано справляються з ітераціями, тому це буде величезний крок вперед. Якщо попросити внести конкретну зміну, наприклад, «змінити вираз обличчя» або «зробити освітлення холоднішим», моделі часто переосмислюють усе зображення, що призводить до втрати послідовності.
Оновлення стосується не лише нових функцій. ChatGPT Images тепер також буде доступний через окремий пункт у бічній панелі ChatGPT, який працює «більше як креативна студія», написала Фіджі Сімо, CEO OpenAI з додатків, у блозі у вівторок.
«Нові екрани перегляду та редагування зображень полегшують створення зображень, які відповідають вашому баченню, або отримання натхнення з популярних підказок і попередньо встановлених фільтрів», — написала Сімо.
Приєднуйтесь до списку очікування Disrupt 2026
Додайте себе до списку очікування Disrupt 2026, щоб першими дізнатися про старт продажу квитків Early Bird. Минулі заходи Disrupt збирали на сцені Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil та Vinod Khosla — частину понад 250 лідерів індустрії, які проводили понад 200 сесій для вашого розвитку та підвищення конкурентоспроможності. Також ви зможете познайомитися з сотнями стартапів, що впроваджують інновації у всіх секторах.
Приєднуйтесь до списку очікування Disrupt 2026
Додайте себе до списку очікування Disrupt 2026, щоб першими дізнатися про старт продажу квитків Early Bird. Минулі заходи Disrupt збирали на сцені Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil та Vinod Khosla — частину понад 250 лідерів індустрії, які проводили понад 200 сесій для вашого розвитку та підвищення конкурентоспроможності. Також ви зможете познайомитися з сотнями стартапів, що впроваджують інновації у всіх секторах.
Окрім нового генератора зображень, OpenAI впроваджує нові способи покращення досвіду ChatGPT з більшою кількістю візуальних елементів. План полягає в тому, щоб пошукові запити відображали більше візуалізацій із чіткими джерелами, що може бути корисним для таких завдань, як конвертація одиниць вимірювання чи перевірка спортивних результатів, за словами Сімо.
«Коли ви створюєте, ви повинні мати змогу бачити та формувати те, що створюєте. Коли візуальні елементи розповідають історію краще, ніж слова, ChatGPT має їх включати», — написала Сімо. «Коли вам потрібна швидка відповідь або наступний крок знаходиться в іншому інструменті, він має бути поруч. Роблячи це, ми можемо ще більше скоротити відстань між тим, що у вас в голові, і вашою здатністю втілити це в життя».

