UnifoLM-WMA-0

0 (Base / Dual)

Otwarty world-model-action od Unitree: generatywny model wideo jako symulator i wzmacniacz polityki sterowania robotami.

🔬 Research🔬 Research only⚖ Open weightsModel świataBazowy model robotycznyModel wzrok-język-akcja

Data premiery

15 września 2025

🏢Unitree RoboticsProducent

Dostęp:DownloadWdrożenie:💻 Lokalnie☁ Cloud

Przegląd

UnifoLM-WMA-0 to otwarty (CC BY-NC-SA 4.0) framework klasy World-Model-Action od Unitree Robotics, łączący generatywny model świata (wideo) z głowicą akcji. Model uczy się fizyki interakcji robot–środowisko z dużych zbiorów danych (m.in. Open-X-Embodiment) i działa w dwóch trybach: (1) Symulatora — generuje przyszłe klatki wideo warunkowane akcjami robota, dostarczając tani, fotorealistyczny silnik symulacyjny do treningu i ewaluacji polityk; (2) Policy Enhancement — wewnętrzny world-model „wyobraża sobie" konsekwencje akcji i poprawia jakość polityki sterowania. Dostępne są warianty UnifoLM-WMA-0-Base oraz UnifoLM-WMA-0-Dual.

Klasyfikacja

Model świataBazowy model robotycznyModel wzrok-język-akcja

Zastosowania

Symulacja i dane syntetyczne Generowanie światów 3D Projektowanie środowisk gier i VFX Trening polityk robotów Manipulacja robotyczna

Dostęp i wdrożenie

Pobieranie

LokalnieChmura

Wagi: Open weights

Kluczowe parametry

✓ Fine-tuning

📥 Wejście: wideo, obraz, dane stanu robota, sensory robota

Robotyka