ShengShu prezentuje Motubrain – jeden mózg dla wszystkich robotów

Chińskie ShengShu Technology ogłosiło 29 kwietnia 2026 roku premierę Motubrain — modelu klasy World Action Model (WAM) zbudowanego na architekturze Mixture-of-Transformers. System ma działać jako niezależny od sprzętu „mózg" dla zróżnicowanych platform robotycznych: przemysłowych, komercyjnych i domowych. Jego cechą wyróżniającą jest jednoczesne uczenie percepcji, prognozowania świata i sterowania akcją w jednym modelu — bez podziału na oddzielne podsystemy. Motubrain jest wspierany przez rundę Series B wartości 293 mln dolarów (2 mld juanów), przeprowadzoną przez Alibaba Cloud z udziałem Baidu Ventures i Luminous Ventures.

Poza modelem VLA: architektura Mixture-of-Transformers

Branżę zdominowały w ostatnich latach modele Vision-Language-Action (VLA), łączące możliwości językowe z wyjściami motorycznymi. ShengShu odchodzi od tego wzorca na rzecz architektury Mixture-of-Transformers (MoT), w której trzy strumienie danych — wideo, model świata i sterowanie akcją — są przetwarzane wspólnie. Model korzysta z fundamentów generatywnych platformy wideo Vidu, co pozwala mu „wyobrażać" przyszłe stany środowiska i wyznaczać odwrotną dynamikę potrzebną do ich osiągnięcia.

Wyniki na benchmarkach

ShengShu przedstawiło wyniki na dwóch niezależnych benchmarkach: WorldArena — globalny ranking oceniający fizyczne rozumowanie i prognozowanie — Motubrain uzyskał 63,77 EWM Score, plasując się w pierwszej trójce. RoboTwin 2.0 — 50 losowo rozmieszczonych zadań manipulacji: Motubrain osiągnął 96,0% skuteczności, jako jedyny model przekraczający 95% w warunkach losowych (zmienione oświetlenie i pozycje obiektów).

W testach skalowania zadaniowego skuteczność Motubrain rosła wraz z liczbą zadań, osiągając 92% przy 50 zadaniach i przewyższając Pi-0.5 o ok. 37%. Model ShengShu deklaruje również 13,55-krotną poprawę efektywności danych względem tradycyjnych metod.

Niezależność sprzętowa i wdrożenia

Motubrain jest zaprojektowany jako warstwa inteligencji niezależna od platformy. Model nie wymaga pełnego przekształcenia przy zmianie sprzętu — przenosi umiejętności między różnymi typami robotów. W obecnym stanie jest już stosowany w programach szkoleniowych firm Astribot, SimpleAI i Anyverse Dynamics.

W testach realnych roboty wyposażone w Motubrain wykazały emergentne zachowania „retry": gdy robot próbujący nabrać zawartość łyżką wychodzi z pustymi rękami, samoczynnie powtarza próbę — bez jawnego treningu na takich przypadkach niepowodzenia.

Dlaczego to ważne?

Motubrain reprezentuje inną filozofię skalowania robotyki niż dominujące podejście VLA. Zamiast dodawać głowicę akcji do modelu językowego, ShengShu buduje model, który traktuje ruch i percepcję jako jednolity problem generatywny. Wyniki benchmarkowe sugerują, że to podejście lepiej radzi sobie z heterogenicznością zadań — co jest kluczowym wymaganiem dla robotów przemysłowych obsługujących setki scenariuszy jednocześnie. Otwarte pytanie: czy 13,55-krotna poprawa efektywności danych przełoży się na porównywalny skok w warunkach pełnego wdrożenia produkcyjnego?

Co dalej?

ShengShu zapowiedziało rozszerzenie partnerów OEM i wdrożenia w nowych segmentach robotyki. Kluczowym testem będzie skalowanie od środowisk laboratoryjnych do pełnych wdrożeń przemysłowych z wymaganiami niezawodności 24/7. Środki z rundy Series B zostaną przeznaczone na dalszy rozwój modelu i budowę infrastruktury danych.

Źródła

Indeks techniczny

Udostępnij ten artykuł

Poprzedni

Następny

Czytaj następny

News29 kwietnia 2026

World Action Models — czym są i jak działają modele uczące robotów z wideo

Modele VLA (Vision-Language-Action) stały się w ostatnich latach podstawowym podejściem do budowania robotycznych systemów sterowania opartych na sztucznej inteligencji. Ich następca — World Action Model (WAM) — to nowa kategoria architektury, która zamiast opierać naukę wyłącznie na parach obraz–instrukcja–akcja, wykorzystuje generowanie wideo jako pośredni mechanizm planowania ruchu. DreamZero, opracowany przez zespół NVIDIA i opublikowany w lutym 2026 roku jako praca naukowa na arXiv, jest pierwszym publicznie opisanym systemem tej klasy działającym w czasie rzeczywistym na prawdziwym robocie. Warto go zrozumieć, bo wyznacza kierunek, w którym może zmierzać projektowanie robotycznych modeli fundamentalnych.

World Action Models Vision-Language-Action VLA

Powiązane artykuły

News29 kwietnia 2026

OpenAI i Microsoft kończą ekskluzywność. Modele trafią na AWS

OpenAI i Microsoft ogłosiły 27 kwietnia 2026 roku nowe warunki partnerstwa, które kończą ekskluzywny dostęp Microsoftu do API i produktów firmy. Zmiana rozwiązuje kolizję prawną między dotychczasową umową a kontraktem OpenAI z Amazonem wartym do 50 miliardów dolarów.

AI Artificial Intelligence OpenAI

News28 kwietnia 2026

Kinetix AI prezentuje KAI – humanoid ze 115 stopniami swobody

Startup Kinetix AI z Shenzhen zaprezentowal robota humanoidalnego KAI z 115 stopniami swobody, dotykowa skora z 18 tys. czujnikow i wlasnym modelem swiata. Firma celuje w rynek uslugowy i domowy z cena ponizej 40 tys. dolarow.

Humanoid Robots Humanoid robotics

News27 kwietnia 2026

Google zamyka erę Vertex AI. Gemini Enterprise Agent Platform przejmuje całą infrastrukturę dla agentów

Google ogłosił podczas konferencji Cloud Next '26 w Las Vegas nową platformę, która całkowicie zastępuje Vertex AI jako centralne środowisko do budowania i wdrażania agentów AI w przedsiębiorstwach. Gemini Enterprise Agent Platform jest dostępna od 22 kwietnia 2026 roku i od tej chwili przejmuje wszystkie dalsze aktualizacje i plany rozwojowe Vertex AI.

Google Gemini Enterprise Vertex AI

News25 kwietnia 2026

Foundation Future Industries i robot Phantom: humanoid dla wojska, który trafia do Pentagonu

Foundation Future Industries to start-up z San Francisco zajmujący się budową humanoidalnych robotów przeznaczonych do zastosowań obronnych. W kwietniu 2026 roku firma znalazła się w centrum uwagi, gdy ujawniono, że posiada łącznie 24 miliony dolarów (ok. 96 mln zł) w kontraktach badawczych z kilkoma gałęziami amerykańskiej armii — a jej doradcą strategicznym jest Eric Trump, syn urzędującego prezydenta Stanów Zjednoczonych. To połączenie technologii wojskowej i polityki rodzinnej wywołało w USA debatę wykraczającą daleko poza samą robotykę.

foundation future industries Phantom MK-1 humanoid robot