OpenAI zbliża się do premiery nowego modelu generowania obrazów, powszechnie uważanego za GPT Image 2, zaprojektowanego w celu tworzenia bardziej realistycznych efektów wizualnych i czystszego tekstu. Ten raport, oparty na informacjach z The Information, podkreśla przewagę konkurencyjną Google i Adobe w sektorze generowania obrazów AI.
Nowy model jest następstwem ostatnich testów społeczności i wycieków wideo. 4 kwietnia na LM Arena pojawiły się trzy modele o kryptonimach maskingtape-alpha, gaffertape-alpha i pakowanietape-alpha. Zostały szybko usunięte, ale zrzuty ekranu szeroko rozpowszechniły się w serwisie Reddit. Testerzy zgłosili niemal idealne renderowanie tekstu, obsługę natywnej rozdzielczości 4K i fotorealizm, które w ślepych testach podobno przewyższały Nano Banana Pro firmy Google.
Ten nowy model podobno wykorzystuje zupełnie nową architekturę, odbiegającą od potoku obrazu GPT-4o, który zasilał poprzednie iteracje, GPT Image 1 i GPT Image 1.5. W projekcie odchodzi się również od wnioskowania dwuetapowego na generowanie jednoprzebiegowe, co poprawia zarówno jakość, jak i szybkość przetwarzania. Do 14 kwietnia modele pojawiły się ponownie w LM Arena, a niektórzy użytkownicy ChatGPT zauważyli poprawę w generowaniu obrazów dzięki testom A/B.
Konieczność wprowadzenia na rynek dodatkowo zwiększa ogłoszenie OpenAI o zaprzestaniu produkcji DALL-E 2 i DALL-E 3 12 maja. Zmiany te mają miejsce w obliczu wzmożonej konkurencji, gdy Adobe integruje modele obrazów OpenAI i Google ze swoją aplikacją Firefly, a Google ustanawia standardy dzięki modelowi Nano Banana Pro.
OpenAI początkowo wypuściło obraz GPT Image 1 w marcu 2025 r., a następnie w grudniu GPT Image 1.5 z ulepszonymi możliwościami renderowania i edycji. GPT Image 1 osiągnął kamień milowy w postaci wygenerowania ponad 700 milionów obrazów w ciągu pierwszego tygodnia.
Chociaż OpenAI nie potwierdziło harmonogramu wydania GPT Image 2, analitycy przewidują, że pojawi się on między końcem kwietnia a połową maja 2026 r., prawdopodobnie wraz z aktualizacją GPT-5.4. „Konkurencja przesuwa się z prostego generowania obrazów na rzecz wysoce użytecznej, multimodalnej inteligencji” – stwierdził jeden z analityków, podkreślając ewoluujący wyścig między OpenAI a Google w krajobrazie sztucznej inteligencji.








