Otwartowagowy, gęsty model językowy Meta AI o 405 mld parametrów, oknie kontekstu 128K tokenów i obsłudze narzędzi, wydany 23 lipca 2024.
Okno kontekstowe
128K tokenów
tokenów
Parametry
405B
parametrów
Data premiery
23 lipca 2024
Dostęp:APIDownloadWdrożenie:☁ Cloud💻 Lokalnie
Przegląd
Dostęp i wdrożenie
APIPobieranie
ChmuraLokalnie
Wagi: Open weights
Kluczowe parametry
📏 Kontekst: 128K tokenów
🧩 Parametry: 405B
✓ Narzędzia · ✓ Fine-tuning
📥 Wejście: tekst, obraz
Specyfikacja techniczna
Okno kontekstowe
128K tokenów
tokenów
Parametry
405B
parametrów
Licencja
Llama 3.1 Community License
Wymagania sprzętowe
Brak oficjalnych minimalnych wymagań.
Uruchamianie lokalne wymaga klastra GPU klasy datacenter (np. NVIDIA H100 / A100).
Funkcje:✓ Używanie narzędzi✓ Fine-tuning
Modalności
⬇ Wejście (Input)
textimage
⬆ Wyjście (Output)
textcodestructured_data
Możliwości i zastosowania
Natywne możliwości modelu
Rozumowanie
Zdolność modelu do logicznego wnioskowania i rozwiązywania złożonych problemów.
Kategoria: reasoning
Rozumowanie wieloetapowe
Prowadzenie wieloetapowego toku rozumowania w długich, złożonych zadaniach.
Kategoria: reasoning
Długi kontekst
Utrzymanie spójności i uwagi w bardzo długim kontekście wejściowym.
Kategoria: language
Programowanie
Generowanie, analiza i modyfikacja kodu źródłowego.
Kategoria: coding
Wywoływanie funkcji
Natywne wsparcie dla ustrukturyzowanego wykorzystania narzędzi, umożliwiające przepływy pracy oparte na agentach.
Kategoria: planning
Wyjście strukturyzowane
Generowanie danych w ustrukturyzowanych formatach, np. JSON.
Kategoria: structured_generation
Rozumienie obrazu
Analiza i interpretacja treści obrazów.
Kategoria: vision
Rozumienie wykresów
Odczyt i interpretacja wykresów, tabel i diagramów.
Kategoria: vision
OCR
Rozpoznawanie tekstu na obrazach i w dokumentach.
Kategoria: vision
Wielojęzyczność
Rozumienie i generowanie tekstu w wielu językach.
Kategoria: language
Planowanie
Tworzenie i realizacja planów działania dla złożonych zadań.
Kategoria: planning
Wyjście strumieniowe
Wiadomości strumieniowe umożliwiają pobieranie treści w czasie rzeczywistym, gdy model generuje odpowiedzi, bez czekania na wygenerowanie całej odpowiedzi. Takie podejście może znacząco poprawić doświadczenie użytkownika, zwłaszcza podczas tworzenia długich treści tekstowych, ponieważ użytkownicy mogą od razu zobaczyć, że odpowiedź zaczyna się pojawiać.
Kategoria: reasoning
Wyniki benchmarków
7 benchmarków
MMLU
88.6
📄 Meta AI – Llama 3.1 Technical Report
GSM8K
96.8
📄 Meta AI – Llama 3.1 Technical Report
HumanEval
89.0
📄 Meta AI – Llama 3.1 Technical Report
MATH
73.8
📄 Meta AI – Llama 3.1 Technical Report
GPQA
0-shot accuracy · Instruction-tuned model (Llama 3.1 405B Instruct), 0-shot
50.7%
📄 Meta Llama 3.1 model card (Hugging Face), July 2024
MMLU-Pro
5-shot accuracy · Instruction-tuned model, 5-shot
73.3%
📄 Meta Llama 3.1 model card (Hugging Face), July 2024
DROP
3-shot F1 · Pre-trained base model (Llama 3.1 405B Base)
84.8%
📄 IBM analysis referencing Meta Llama 3.1 model card, July 2024
Wynik dotyczy modelu bazowego (pre-trained), nie instruction-tuned.
Źródła i powiązane strony
8 źródeł
RaportThe Llama 3.1 Model FamilyWebIntroducing Llama 3.1Repometa-llama modelsDocsLlama 3.1 405B – Hugging Face Model Card (base)DocsLlama 3.1 405B Instruct – Hugging Face Model CardBlogIntroducing Llama 3.1 – Meta AI BlogWebLlama 3.1 Official Page – llama.comRepoLlama 3.1 Eval Details – meta-llama/llama-models GitHub
Przeglądaj powiązane tematy
