
Otwarty multimodalny model agentowy Moonshot AI typu MoE z 1 bln parametrów (32 mld aktywnych), 256K oknem kontekstu i natywną kwantyzacją INT4.
✓ Aktywny✓ Publiczny dostęp⚖ Open weightsModel multimodalnyModel rozumowaniaModel używający narzędzi
Okno kontekstowe
256K
tokenów
Parametry
1T total / 32B active
parametrów
Max output
98 304
tokenów
Data premiery
21 kwietnia 2026
Dostęp:APIDownloadHostedWdrożenie:☁ Cloud💻 Lokalnie
Przegląd
Klasyfikacja
Model multimodalnyModel rozumowaniaModel używający narzędzi
Dostęp i wdrożenie
APIPobieranieHostowane
ChmuraLokalnie
Wagi: Open weights
Kluczowe parametry
📏 Kontekst: 256K
🧩 Parametry: 1T total / 32B active
✓ Narzędzia · ✓ Fine-tuning
📥 Wejście: tekst, obraz, wideo
Specyfikacja techniczna
Okno kontekstowe
256K
tokenów
Parametry
1T total / 32B active
parametrów
Max output tokens
98 304
tokenów na odpowiedź
Licencja
Modified MIT License
Wymagania sprzętowe
Rekomendowane silniki inferencji: vLLM, SGLang, KTransformers. Wymaga środowiska transformers >=4.57.1, <5.0.0. Wagi dostępne w formatach safetensors / compressed-tensors z natywną kwantyzacją INT4.
Funkcje:✓ Używanie narzędzi✓ Fine-tuning
Modalności
⬇ Wejście (Input)
textimagevideo
⬆ Wyjście (Output)
textcode
Możliwości i zastosowania
Natywne możliwości modelu
Rozumowanie
Zdolność modelu do logicznego wnioskowania i rozwiązywania złożonych problemów.
Kategoria: reasoning
Rozumowanie wieloetapowe
Prowadzenie wieloetapowego toku rozumowania w długich, złożonych zadaniach.
Kategoria: reasoning
Programowanie
Generowanie, analiza i modyfikacja kodu źródłowego.
Kategoria: coding
Długi kontekst
Utrzymanie spójności i uwagi w bardzo długim kontekście wejściowym.
Kategoria: language
Zdolności agentowe
Zdolność modelu do autonomicznego planowania i wykonywania wieloetapowych zadań poprzez sekwencyjne użycie narzędzi, utrzymywanie kontekstu i adaptację do wyników pośrednich.
Kategoria: planning
Rozumienie multimodalne
Zdolność modelu do łączenia i interpretowania informacji z więcej niż jednej modalności, np. tekstu i obrazu.
Kategoria: multimodal
Rozumienie obrazu
Analiza i interpretacja treści obrazów.
Kategoria: vision
Rozumienie wideo
Zdolność modelu do analizy i interpretacji treści wideo — rozpoznawania akcji, ruchu, zdarzeń oraz relacji między obiektami w czasie.
Kategoria: video
Obsługa komputera
Zdolność modelu do obsługi interfejsu komputera poprzez interpretację zrzutów ekranu oraz generowanie akcji takich jak kliknięcia, wpisywanie tekstu i nawigacja po aplikacjach.
Kategoria: planning
Równoległe wywołania narzędzi
Zdolność do jednoczesnego wywoływania wielu narzędzi zewnętrznych w trakcie generowania odpowiedzi.
Kategoria: reasoning
Planowanie
Tworzenie i realizacja planów działania dla złożonych zadań.
Kategoria: planning
Rozumienie wykresów
Odczyt i interpretacja wykresów, tabel i diagramów.
Kategoria: vision
Wielojęzyczność
Rozumienie i generowanie tekstu w wielu językach.
Kategoria: language
Enkoder wizyjny
Zdolność modelu do kodowania obrazów i klatek wideo w gęste reprezentacje (embeddingi), wykorzystywane do dalszych zadań lub jako backbone dla modeli wizyjno-językowych.
Kategoria: vision
Wyjście strukturyzowane
Generowanie danych w ustrukturyzowanych formatach, np. JSON.
Kategoria: structured_generation
Wyniki benchmarków
13 benchmarków
Humanity's Last Exam (HLE)
accuracy · z narzędziami (search, code-interpreter, web-browsing); HLE-Full
54.0%
📅 21 kwi 2026📄 Oficjalna karta modelu Moonshot AI na Hugging Face (moonshotai/Kimi-K2.6)
Humanity's Last Exam (HLE)
accuracy · bez narzędzi; HLE-Full
34.7%
📅 21 kwi 2026📄 Oficjalna karta modelu Moonshot AI na Hugging Face (moonshotai/Kimi-K2.6)
SWE-bench
resolved · in-house framework SWE-agent, średnia z 10 niezależnych runów
80.2%
📅 21 kwi 2026📄 Oficjalna karta modelu Moonshot AI na Hugging Face (moonshotai/Kimi-K2.6)
SWE-bench
resolved
58.6%
📅 21 kwi 2026📄 Oficjalna karta modelu Moonshot AI na Hugging Face (moonshotai/Kimi-K2.6)
SWE-bench
resolved
76.7%
📅 21 kwi 2026📄 Oficjalna karta modelu Moonshot AI na Hugging Face (moonshotai/Kimi-K2.6)
LiveCodeBench
pass@1
89.6%
📅 21 kwi 2026📄 Oficjalna karta modelu Moonshot AI na Hugging Face (moonshotai/Kimi-K2.6)
GPQA
accuracy
90.5%
📅 21 kwi 2026📄 Oficjalna karta modelu Moonshot AI na Hugging Face (moonshotai/Kimi-K2.6)
MMMU
accuracy
79.4%
📅 21 kwi 2026📄 Oficjalna karta modelu Moonshot AI na Hugging Face (moonshotai/Kimi-K2.6)
OSWorld
success_rate
73.1%
📅 21 kwi 2026📄 Oficjalna karta modelu Moonshot AI na Hugging Face (moonshotai/Kimi-K2.6)
AIME 2026
accuracy
96.4%
📅 21 kwi 2026📄 Oficjalna karta modelu Moonshot AI na Hugging Face (moonshotai/Kimi-K2.6)
BrowseComp
accuracy · z narzędziami (search, web-browsing)
83.2%
📅 21 kwi 2026📄 Oficjalna karta modelu Moonshot AI na Hugging Face (moonshotai/Kimi-K2.6)
Terminal-Bench 2.0 (Terminus-2)
success_rate · default agent framework (Terminus-2), preserve_thinking mode
66.7%
📅 21 kwi 2026📄 Oficjalna karta modelu Moonshot AI na Hugging Face (moonshotai/Kimi-K2.6)
MathVision
accuracy
87.4%
📅 21 kwi 2026📄 Oficjalna karta modelu Moonshot AI na Hugging Face (moonshotai/Kimi-K2.6)
Architektura techniczna
Rdzeń architektury (Core Architecture)
Forma modelu (Model Form)
Techniki trenowania (Training Techniques)