Firma Anthropic wypuściła swój najnowszy model sztucznej inteligencji, Claude Opus 4.7, charakteryzujący się „znaczącą poprawą” w porównaniu z Opus 4.6, ale „mniejszymi możliwościami” niż niewydana wersja Opus Mythos Preview. Nowy model wzmacnia istniejące mocne strony, koncentrując się na kodowaniu, inżynierii i zadaniach wieloetapowych.
Claude Opus 4.7 wykazuje doskonałe wyniki w profesjonalnej pracy opartej na wiedzy, twierdząc, że jest „bardziej dokładny i konsekwentny” w trudnych kontekstach. Testy porównawcze modelu wykazały jego możliwości, uzyskując wynik 64,3% w kodowaniu agentycznym w SWE-bench Pro i SWE-bench Verified, odzyskując czołową pozycję wśród publicznie dostępnych modeli.
W porównaniu do Opus 4.6, Opus 4.7 wykazuje również poprawę w zakresie agentycznego wykorzystania komputera i rozumowania na poziomie absolwenta. Wykazuje jednak niewielki spadek wyników podatności na cyberbezpieczeństwo, osiągając 73,1% w porównaniu z 73,8% w poprzedniej wersji. Anthropic zauważyło, że zmiana ta może wynikać z nowych zabezpieczeń mających na celu wykrywanie i blokowanie żądań cyberbezpieczeństwa wysokiego ryzyka.
Premiera Claude Opus 4.7 wydaje się promować wersję Claude Mythos Preview, która wykazała doskonałą wydajność w głównych testach porównawczych, ale jest obecnie dostępna tylko dla wybranych organizacji. Anthropic podkreśliło, że możliwości cybernetyczne Opus 4.7 nie dorównują możliwościom Mythos Preview.
„Oświadczyliśmy, że ograniczymy premierę Claude Mythos Preview i najpierw przetestujemy nowe zabezpieczenia cybernetyczne na modelach o mniejszych możliwościach” – stwierdziła firma. „Opus 4.7 to pierwszy taki model: jego możliwości cybernetyczne nie są tak zaawansowane jak Mythos Preview.”
Claude Opus 4.7 jest już dostępny we wszystkich produktach Claude i za pośrednictwem firmowego API, zachowując te same ceny, co poprzednie modele.








