OpenAI wypuścił GPT-5.4 w czwartek, wprowadzając wersję standardową wraz z wariantami GPT-5.4 Thinking i GPT-5.4 Pro. Firma określiła ten model jako najbardziej wydajny i wydajny model pionierski do pracy zawodowej.
Wersja API obsługuje okna kontekstowe do 1 miliona tokenów, największe dostępne w OpenAI. Model wykazuje również lepszą wydajność tokenów, rozwiązując problemy przy użyciu znacznie mniejszej liczby tokenów niż jego poprzednik.
GPT-5.4 osiągnął rekordowe wyniki w testach wydajności komputerów OSWorld-Verified i WebArena Verified. Uzyskał także 83% wyniku w teście PKBval OpenAI dotyczącym zadań związanych z pracą z wiedzą.
Według dyrektora generalnego Mercor Brendana Foody’ego modelka kierowała benchmarkiem APEX-Agents firmy Mercor, który testuje umiejętności zawodowe w zakresie prawa i finansów. Foody stwierdził, że GPT-5.4 przoduje w tworzeniu długoterminowych produktów, takich jak prezentacje slajdów i modele finansowe, zapewniając najwyższą wydajność szybciej i po niższych kosztach niż konkurenci.
OpenAI stwierdziło, że w porównaniu z GPT 5.2 ryzyko popełniania błędów w indywidualnych twierdzeniach jest o 33% mniejsze. Prawdopodobieństwo, że ogólne odpowiedzi zawierają błędy, jest o 18% mniejsze.
Firma wprowadziła Tool Search do zarządzania wywoływaniem narzędzi w API. System w razie potrzeby wyszukuje definicje narzędzi, redukując użycie tokenów i koszty w systemach z wieloma narzędziami.
OpenAI dodało nową ocenę bezpieczeństwa, aby przetestować monitorowanie łańcucha myślowego. Ocena wykazała, że w wersji GPT-5.4 Thinking prawdopodobieństwo oszustwa jest mniejsze, co sugeruje, że model nie jest w stanie ukryć swojego rozumowania.








