Będzie szybciej i ładniej. OpenAI prezentuje GPT Image 1.5
OpenAI ogłasza GPT Image 1.5 — nową wersję generatora obrazów w ChatGPT. Model ma lepiej wykonywać instrukcje, precyzyjniej edytować i generować grafiki zauważalnie szybciej od poprzednika. Do tego szybko trafi do odbiorców.
OpenAI udostępnił GPT Image 1.5 we wtorek wszystkim użytkownikom ChataGPT oraz za pośrednictwem API. To kolejny ruch po ogłoszeniu "czerwonego kodu" przy okazji premiery GPT-5.2 i próba odzyskania przewagi po premierach Google. Firma oficjalnie uznała narzędzia Gemini 3 oraz generator obrazków Nano Banana Pro za największe zagrożenie.
Od premiery GPT Image 1 minęło sporo czasu. Gdy firma prezentowała ten model w kwietniu, Google nie oferowało jeszcze swojego rozwiązania Nano Banana. Od tego czasu firma zaimplementowała między innymi narzędzia Adobe z poziomu ChataGPT, udostępniła także otwarty model o niewielkich potrzebach sprzętowych - GPT OSS. Jednocześnie premiera modelu GPT-5 nie okazała się takim sukcesem, jakiego mógł spodziewać się Sam Altman i dlatego inicjuje on kontrofensywę.
Generowanie zdjęć w ChatGPT zyska dodatkowy stopień edycji
Model jest częścią ChatGPT Images i ma skrócić czas oczekiwania nawet czterokrotnie. OpenAI podkreśla, że usprawnienia dotyczą również edycji: użytkownicy mają zachować spójność elementów takich jak mimika, oświetlenie, kompozycja i kolorystyka między kolejnymi wersjami.
Dotąd wiele narzędzi GenAI słabo radziło sobie z iteracją. Przy prośbie typu „zmień wyraz twarzy” albo „uczyń oświetlenie cieplejszym” obraz często był interpretowany na nowo. OpenAI przekonuje, że nowe, narzędzia kontroli i sposób rozumienia poleceń mają ograniczyć te problemy i utrzymać konsekwencję w serii edycji.
Zmienia się także interfejs ChatGPT. Aplikacje OpenAI zyskują dedykowany punkt wejścia do edycji obrazów na bocznym pasku, otwierając w ten sposób studio kreatywne. "Nowe ekrany podglądu i edycji ułatwiają tworzenie obrazów zgodnych z twoją wizją lub czerpanie inspiracji z trendujących promptów i gotowych filtrów" - napisała Fidji Simo, szefowa działu aplikacji OpenAI, w firmowym wpisie.
OpenAI zapowiada również więcej elementów wizualnych w wynikach wyszukiwania ChatGPT. Według Simo, ma to pomóc w zadaniach takich jak przeliczanie jednostek czy sprawdzanie wyników sportowych, gdzie czytelne grafiki ze źródłami mogą przyspieszyć pracę.
Michał Mielnik, dziennikarz Wirtualnej Polski