Robocikowo>ROBOCIKOWO
Claude Opus 4.8

Claude Opus 4.8

4.8 · Rodzina: Claude
Najnowszy flagowy model Anthropic z rodziny Claude Opus, zoptymalizowany pod zadania agentyczne, kodowanie i długie sesje wieloetapowe.
✓ Aktywny✓ Publiczny dostępLLMModel multimodalnyModel rozumowaniaModel używający narzędzi📁 Claude
Okno kontekstowe
1M
tokenów
Data premiery
28 maja 2026
Dostęp:APIHostedWdrożenie:☁ Cloud

Przegląd

Claude Opus 4.8 to flagowy model rodziny Claude wydany przez Anthropic 28 maja 2026 roku, następca Claude Opus 4.7. Model utrzymuje standardową cenę poprzednika ($5/$25 za milion tokenów wejście/wyjście), a tryb fast mode jest trzykrotnie tańszy niż w Opus 4.7 i 4.6 ($10/$50 za milion tokenów) przy 2,5× wyższej prędkości generowania.

Anthropic raportuje, że Opus 4.8 jest około czterokrotnie rzadziej skłonny do przemilczania błędów we własnym kodzie niż poprzednik, a ocena alignment wskazuje znacząco niższy wskaźnik zachowań niepożądanych (np. decepcji) względem Opus 4.7. Premierze towarzyszą funkcje dynamic workflows w Claude Code (setki równoległych subagentów) oraz kontrola poziomu effort (low/medium/high/extra/max) w aplikacji claude.ai i Cowork.

Model jest dostępny przez identyfikator claude-opus-4-8 w Claude API, w aplikacjach claude.ai (plany Free, Pro, Max, Team, Enterprise) oraz na partnerskich platformach chmurowych.

Klasyfikacja
LLMModel multimodalnyModel rozumowaniaModel używający narzędzi
Rodzina: Claude
Dostęp i wdrożenie
APIHostowane
Chmura
Wagi: Zamknięte
Kluczowe parametry
📏 Kontekst: 1M
Narzędzia
📥 Wejście: tekst, obraz, dokumenty

Specyfikacja techniczna

Okno kontekstowe
1M
tokenów
Funkcje:Używanie narzędzi
Modalności
⬇ Wejście (Input)
textimagedocuments
⬆ Wyjście (Output)
textcodestructured_data

Możliwości i zastosowania

Natywne możliwości modelu
Rozumowanie
Zdolność modelu do logicznego wnioskowania i rozwiązywania złożonych problemów.
Kategoria: reasoning
Rozumowanie wieloetapowe
Prowadzenie wieloetapowego toku rozumowania w długich, złożonych zadaniach.
Kategoria: reasoning
Długi kontekst
Utrzymanie spójności i uwagi w bardzo długim kontekście wejściowym.
Kategoria: language
Programowanie
Generowanie, analiza i modyfikacja kodu źródłowego.
Kategoria: coding
Wyjście strukturyzowane
Generowanie danych w ustrukturyzowanych formatach, np. JSON.
Kategoria: structured_generation
Rozumienie obrazu
Analiza i interpretacja treści obrazów.
Kategoria: vision
Rozumienie wykresów
Odczyt i interpretacja wykresów, tabel i diagramów.
Kategoria: vision
OCR
Rozpoznawanie tekstu na obrazach i w dokumentach.
Kategoria: vision
Wielojęzyczność
Rozumienie i generowanie tekstu w wielu językach.
Kategoria: language
Planowanie
Tworzenie i realizacja planów działania dla złożonych zadań.
Kategoria: planning

Wyniki benchmarków

8 benchmarków
SWE-Bench Pro
agentic coding
69.2%%
📄 Anthropic, Introducing Claude Opus 4.8 (2026-05-28)
Terminal-Bench 2.1
Terminus-2 harness
74.6%%
📄 Anthropic, Introducing Claude Opus 4.8 (2026-05-28)
Humanity’s Last Exam (no tools)
49.8%%
📄 Anthropic, Introducing Claude Opus 4.8 (2026-05-28)
Humanity’s Last Exam (with tools)
57.9%%
📄 Anthropic, Introducing Claude Opus 4.8 (2026-05-28)
OSWorld-Verified
agentic computer use
83.4%%
📄 Anthropic, Introducing Claude Opus 4.8 (2026-05-28)
GDPval-AA
knowledge work
1890
📄 Anthropic, Introducing Claude Opus 4.8 (2026-05-28)
Finance Agent v2
53.9%%
📄 Anthropic, Introducing Claude Opus 4.8 (2026-05-28)
Online-Mind2Web
84%%
📄 Browserbase (Miguel Gonzalez quote, Anthropic blog 2026-05-28)

Cennik

Architektura techniczna

Rdzeń architektury (Core Architecture)
Techniki trenowania (Training Techniques)

Wdrożenie i bezpieczeństwo

🔒 Security / Enterprise
✓ Zweryfikowane informacje enterprise

Model przeszedł pełen zestaw ewaluacji w ramach Anthropic Responsible Scaling Policy (RSP), w tym oceny ryzyka cyber, chemicznego i biologicznego, autonomii AI R&D oraz misalignmentu. Wnioski Anthropic: ryzyko katastroficzne pozostaje niskie przy obecnych mitygacjach. Opus 4.8 wykazuje znacząco lepszy profil alignmentu względem Opus 4.7 (m.in. ~4× rzadziej nie zgłasza wad we własnym kodzie).

Anthropic przeprowadziło pierwsze tygodniowe live bug bounty dla prompt injection. W kontekstach agentycznych Opus 4.8 jest nieco mniej odporny na prompt injection niż Opus 4.7, ale Anthropic raportuje, że własne safeguards zamykają tę różnicę w produkcji.
Aktualizacja: 28 maj 2026↗ Dokumentacja security