Uzywany wewnetrznie przez Databricks do badan efektywnosci treningu MoE. Osiaga wynik Databricks Gauntlet 30.5% przy 3.7x mniejszym koszcie FLOP niz MPT-7B.
Okno kontekstowe
32K
tokenów
Parametry
7.7B total / 2.2B active
parametrów
Data premiery
27 marca 2024
Dostęp:APIWdrożenie:☁ Cloud
Przegląd
Zastosowania
Dostęp i wdrożenie
API
Chmura
Wagi: Zamknięte
Kluczowe parametry
📏 Kontekst: 32K
🧩 Parametry: 7.7B total / 2.2B active
📥 Wejście: tekst
Specyfikacja techniczna
Okno kontekstowe
32K
tokenów
Parametry
7.7B total / 2.2B active
parametrów
Licencja
Databricks internal / research
Wymagania sprzętowe
Wewnetrzny model badawczy Databricks; brak publicznego checkpointu.
Modalności
⬇ Wejście (Input)
text
⬆ Wyjście (Output)
textcode
Możliwości i zastosowania
Dziedziny zastosowań
Wyniki benchmarków
1 benchmark
Databricks Model Gauntlet v0.3
avg score
30.5%
📄 Databricks DBRX blog (2024-03-27)
Architektura techniczna
Rdzeń architektury (Core Architecture)
Forma modelu (Model Form)
Źródła i powiązane strony
1 źródło
Przeglądaj powiązane tematy
