Będzie szybciej i ładniej. OpenAI prezentuje GPT Image 1.5
OpenAI ogłasza GPT Image 1.5 — nową wersję generatora obrazów w ChatGPT. Model ma lepiej wykonywać instrukcje, precyzyjniej edytować i generować grafiki zauważalnie szybciej od poprzednika. Do tego szybko trafi do odbiorców.
OpenAI udostępnił GPT Image 1.5 we wtorek wszystkim użytkownikom ChataGPT oraz za pośrednictwem API. To kolejny ruch po ogłoszeniu "czerwonego kodu" przy okazji premiery GPT-5.2 i próba odzyskania przewagi po premierach Google. Firma oficjalnie uznała narzędzia Gemini 3 oraz generator obrazków Nano Banana Pro za największe zagrożenie.
Od premiery GPT Image 1 minęło sporo czasu. Gdy firma prezentowała ten model w kwietniu, Google nie oferowało jeszcze swojego rozwiązania Nano Banana. Od tego czasu firma zaimplementowała między innymi narzędzia Adobe z poziomu ChataGPT, udostępniła także otwarty model o niewielkich potrzebach sprzętowych - GPT OSS. Jednocześnie premiera modelu GPT-5 nie okazała się takim sukcesem, jakiego mógł spodziewać się Sam Altman i dlatego inicjuje on kontrofensywę.
Generowanie zdjęć w ChatGPT zyska dodatkowy stopień edycji
Model jest częścią ChatGPT Images i ma skrócić czas oczekiwania nawet czterokrotnie. OpenAI podkreśla, że usprawnienia dotyczą również edycji: użytkownicy mają zachować spójność elementów takich jak mimika, oświetlenie, kompozycja i kolorystyka między kolejnymi wersjami.
Dotąd wiele narzędzi GenAI słabo radziło sobie z iteracją. Przy prośbie typu „zmień wyraz twarzy” albo „uczyń oświetlenie cieplejszym” obraz często był interpretowany na nowo. OpenAI przekonuje, że nowe, narzędzia kontroli i sposób rozumienia poleceń mają ograniczyć te problemy i utrzymać konsekwencję w serii edycji.