Będzie szybciej i ładniej. OpenAI prezentuje GPT Image 1.5

OpenAI ogłasza GPT Image 1.5 — nową wersję generatora obrazów w ChatGPT. Model ma lepiej wykonywać instrukcje, precyzyjniej edytować i generować grafiki zauważalnie szybciej od poprzednika. Do tego szybko trafi do odbiorców.

ChatGPT - zdjęcie poglądowe
ChatGPT - zdjęcie poglądowe
Źródło zdjęć: © GETTY | SOPA Images

OpenAI udostępnił GPT Image 1.5 we wtorek wszystkim użytkownikom ChataGPT oraz za pośrednictwem API. To kolejny ruch po ogłoszeniu "czerwonego kodu" przy okazji premiery GPT-5.2 i próba odzyskania przewagi po premierach Google. Firma oficjalnie uznała narzędzia Gemini 3 oraz generator obrazków Nano Banana Pro za największe zagrożenie.

Od premiery GPT Image 1 minęło sporo czasu. Gdy firma prezentowała ten model w kwietniu, Google nie oferowało jeszcze swojego rozwiązania Nano Banana. Od tego czasu firma zaimplementowała między innymi narzędzia Adobe z poziomu ChataGPT, udostępniła także otwarty model o niewielkich potrzebach sprzętowych - GPT OSS. Jednocześnie premiera modelu GPT-5 nie okazała się takim sukcesem, jakiego mógł spodziewać się Sam Altman i dlatego inicjuje on kontrofensywę.

Generowanie zdjęć w ChatGPT zyska dodatkowy stopień edycji

Model jest częścią ChatGPT Images i ma skrócić czas oczekiwania nawet czterokrotnie. OpenAI podkreśla, że usprawnienia dotyczą również edycji: użytkownicy mają zachować spójność elementów takich jak mimika, oświetlenie, kompozycja i kolorystyka między kolejnymi wersjami.

Dotąd wiele narzędzi GenAI słabo radziło sobie z iteracją. Przy prośbie typu „zmień wyraz twarzy” albo „uczyń oświetlenie cieplejszym” obraz często był interpretowany na nowo. OpenAI przekonuje, że nowe, narzędzia kontroli i sposób rozumienia poleceń mają ograniczyć te problemy i utrzymać konsekwencję w serii edycji.

ChatGPT ułatwi dostęp do edycji zdjęć (fot. Fidji Simo, OpenAI)
ChatGPT ułatwi dostęp do edycji zdjęć (fot. Fidji Simo, OpenAI)© dobreprogramy

Zmienia się także interfejs ChatGPT. Aplikacje OpenAI zyskują dedykowany punkt wejścia do edycji obrazów na bocznym pasku, otwierając w ten sposób studio kreatywne. "Nowe ekrany podglądu i edycji ułatwiają tworzenie obrazów zgodnych z twoją wizją lub czerpanie inspiracji z trendujących promptów i gotowych filtrów" - napisała Fidji Simo, szefowa działu aplikacji OpenAI, w firmowym wpisie.

OpenAI zapowiada również więcej elementów wizualnych w wynikach wyszukiwania ChatGPT. Według Simo, ma to pomóc w zadaniach takich jak przeliczanie jednostek czy sprawdzanie wyników sportowych, gdzie czytelne grafiki ze źródłami mogą przyspieszyć pracę.

Cyfrowy Polak
Cyfrowy Polak© Cyfrowy Polak

Michał Mielnik, dziennikarz Wirtualnej Polski

Programy

Zobacz więcej

Wybrane dla Ciebie

Komentarze (0)