Architektura

MAS

1995productionpeer_reviewed

Systemy AI składające się z wielu współpracujących agentów.

Kluczowa innowacja

Dekompozycja złożonych zadań na zestaw autonomicznych agentów o wyspecjalizowanych rolach, komunikujących się i koordynujących działania, co pozwala przekraczać ograniczenia jednotorowego wnioskowania modeli i realizować zadania długiego horyzontu, których nie da się wykonać w jednym wywołaniu LLM.

Kategoria

Architektura

Poziom abstrakcji

Paradygmat

Poziom operacji

SystemŚrodowisko agentowe

Zastosowania

Software engineering autonomiczne — wieloagentowe zespoły programistyczne (architekt, programista, tester, code reviewer) realizujące pełne projekty na podstawie specyfikacji (MetaGPT, ChatDev)Deep research i synteza wiedzy — agenci specjalizujący się w wyszukiwaniu, weryfikacji źródeł, ekstrakcji faktów i pisaniu raportów (OpenAI Deep Research, GPT Researcher)Symulacje społeczne i ekonomiczne — agenty z osobowościami symulujące zachowania w wirtualnych społecznościach (Generative Agents, Smallville, AI Town)Negocjacje i debata wieloagentowa — konkurujące agenty osiągające konsensus lub dochodzące do prawdy przez argumentację (Society of Mind, Multi-Agent Debate)Robotyka multi-robot — koordynacja wielu fizycznych robotów w zadaniach magazynowych, logistycznych i eksploracji (swarm robotics, fleet management)Customer support i workflow biznesowe — orkiestracja agentów-specjalistów (billing, tech support, sales) z dynamicznym routingiem zapytańSymulacje gier i AI dla NPC — wieloagentowe systemy w grach strategicznych i symulacjach taktycznychNaukowe odkrycia i eksperymenty wspomagane AI — agenty-eksperymentatorzy generujący hipotezy, planujący eksperymenty in silico i interpretujący wyniki

Jak działa

System MAS definiuje zbiór agentów, środowisko komunikacji i protokół koordynacji. Każdy agent to jednostka autonomiczna z: (1) rdzeniem kognitywnym (zwykle LLM z system promptem definiującym rolę), (2) pamięcią krótkoterminową (kontekst) i opcjonalnie długoterminową (vector store), (3) interfejsem narzędzi (API, code execution, web search, retrieval), (4) celem lub instrukcją zadaniową. Wykonanie zadania składa się z etapów: (a) dekompozycja — orkiestrator lub agent-planista rozkłada zapytanie na podzadania, (b) routing — przypisanie podzadań do agentów na podstawie ról i zdolności, (c) komunikacja — agenci wymieniają wiadomości (naturalny język, structured function calls, shared memory), (d) iteracja — agenci wykonują akcje, obserwują wyniki, korygują plan (często z wbudowanym agentem-krytykiem), (e) agregacja — synteza wyników w finalną odpowiedź. Topologie koordynacji: sequential pipeline (łańcuch), hierarchical (orchestrator-worker), parallel fan-out/fan-in, blackboard (wspólna tablica), debate (agenci konkurują/dyskutują), publish-subscribe i decentralized peer-to-peer.

Rozwiązany problem

Pojedynczy model LLM napotyka twarde ograniczenia przy zadaniach długiego horyzontu, wymagających różnorodnej wiedzy domenowej, wieloetapowego planowania lub równoległej obsługi wielu źródeł informacji. Monolityczny prompt szybko traci spójność, kontekst ulega degradacji (context rot), a brak wyspecjalizowanych ról uniemożliwia separację odpowiedzialności (np. planista vs wykonawca vs krytyk). MAS rozwiązuje to przez dekompozycję problemu na podzadania przypisane do autonomicznych agentów z dedykowanymi rolami, narzędziami i pamięcią, koordynowanych przez topologię komunikacyjną. Pozwala to skalować złożoność systemu bez powiększania pojedynczego modelu, równolegle eksplorować rozwiązania i wprowadzać mechanizmy peer-review / krytyki między agentami.

Kluczowe mechanizmy

Dekompozycja zadania — orkiestrator lub agent-planista rozkłada zapytanie na zestaw podzadań możliwych do delegowania

Wyspecjalizowane role — każdy agent otrzymuje system prompt definiujący tożsamość, zakres odpowiedzialności i dostępne narzędzia

Komunikacja między agentami — wymiana wiadomości w języku naturalnym, structured function calls lub przez wspólną pamięć (blackboard)

Topologia koordynacji — wybór wzorca: sequential, hierarchical (orchestrator-worker), parallel fan-out/fan-in, debate, publish-subscribe, peer-to-peer

Tool use — agenci wywołują zewnętrzne API, wykonują kod, przeszukują web, korzystają z retrieval i baz wektorowych

Pamięć agenta — short-term context window + long-term memory (vector store) z możliwością współdzielenia między agentami

Mechanizm krytyki / peer-review — wbudowany agent-krytyk weryfikuje wyniki innych agentów (reflexion, self-critique, multi-agent debate)

Routing dynamiczny — orkiestrator wybiera kolejnego agenta na podstawie aktualnego stanu, typu zadania lub wyników wcześniejszych kroków

Iteracja i korekta planu — agenci mogą obserwować wyniki działań i modyfikować plan w locie (closed-loop control)

Mocne strony i ograniczenia

Mocne strony

✓Skalowanie złożoności bez powiększania modelu — wzrost capability przez dodanie agentów zamiast trenowania większego LLM

✓Separacja odpowiedzialności — wyspecjalizowane role (planista, wykonawca, krytyk) lepiej radzą sobie niż jeden monolityczny prompt

✓Równoległość — niezależne podzadania mogą być wykonywane jednocześnie, redukując latencję

✓Modularność i wymienność — agentów można aktualizować, zastępować lub dodawać bez przeprojektowania całego systemu

✓Peer-review i samokorekta — wiele agentów wykrywa błędy, które pojedynczy model przeoczyłby (multi-agent debate, reflexion)

✓Wydłużenie efektywnego horyzontu — zadania długiego horyzontu (godziny pracy) wykonalne dzięki rozłożeniu na sub-tasks

✓Naturalna ekspresja problemów wieloaktorowych — symulacje społeczne, negocjacje, multi-robot fleet są bezpośrednio modelowalne

✓Bogaty ekosystem frameworków — AutoGen, CAMEL, MetaGPT, CrewAI, LangGraph dostarczają production-ready abstrakcje

Ograniczenia

✗Wysoki koszt tokenów — komunikacja między agentami multiplikuje liczbę wywołań LLM (często 5–50× pojedynczego zapytania)

✗Latencja sekwencyjna — łańcuchy agentów wprowadzają cumulative delay, nawet 10× większy niż pojedyncze zapytanie

✗Propagacja błędów — błąd jednego agenta przekazany kolejnym może snowball, prowadząc do całkowicie błędnej finalnej odpowiedzi

✗Brak globalnej spójności — agenci mogą lokalnie optymalizować w sposób sprzeczny z celem systemu (misalignment między agentami)

✗Trudność debugowania — non-deterministyczne trajektorie i wielowątkowa komunikacja czynią diagnozę błędów bardzo kosztowną

✗Koordynacja overhead — w prostych zadaniach pojedynczy LLM call jest tańszy i szybszy; MAS opłaca się dopiero przy złożoności

✗Halucynacje wzmocnione — agenci mogą wzajemnie utwierdzać się w błędnych przekonaniach (echo chamber effect)

✗Brak standardów protokołów — różne frameworki używają niekompatybilnych formatów wiadomości i schematów ról

✗Rate limits API — równoległe wywołania LLM z jednego konta mogą napotykać throttling i kolejkowanie

Komponenty

AgentPodstawowa jednostka obliczeniowa i decyzyjna systemu.

Autonomiczna jednostka obliczeniowa z własnym stanem wewnętrznym, zdolnościami percepcji środowiska, wnioskowania i podejmowania działań. W kontekście LLM-MAS: model językowy z systemowym promptem definiującym rolę, cel i ograniczenia agenta.

Agent orkiestratora (Orchestrator Agent)Agent odpowiedzialny za dekompozycję zadań, przydzielanie podzadań innym agentom i agregację wyników.

Agent wyspecjalizowany (Worker Agent)Agent z wąską specjalizacją (np. wyszukiwanie, kodowanie, analiza), wykonujący konkretne podzadania przydzielone przez orkiestratora.

Agent ludzki (Human-in-the-Loop)Człowiek uczestniczący jako agent w systemie, weryfikujący lub korygujący działania agentów AI w kluczowych punktach decyzyjnych.

Oficjalna

Kanał komunikacyjnyUmożliwia koordynację i transfer stanu między agentami.

Mechanizm wymiany informacji między agentami. Może przyjmować formę bezpośredniego przekazywania wiadomości (direct message passing), wspólnej pamięci (shared memory), systemu publikuj-subskrybuj (publish-subscribe) lub kolejki zdarzeń (event queue).

Przekazywanie wiadomości (Message Passing)Agenty wymieniają ustrukturyzowane wiadomości bezpośrednio lub przez brokera.

Wspólna pamięć (Shared Memory / Blackboard)Agenty czytają i zapisują do wspólnej bazy wiedzy lub stanu (np. bazy wektorowej, obiektu stanu grafowego).

Oficjalna

Orkiestrator / KoordynatorZarządzanie globalnym postępem w realizacji zadania i koordynacja między agentami.

Komponent odpowiedzialny za zarządzanie przepływem pracy: dekompozycję zadania, routing do agentów, zarządzanie zależnościami, obsługę błędów i agregację wyników końcowych. Może być agentem LLM lub programowalnym kontrolerem.

Oficjalna

Podsystem pamięciPersistencja stanu między wywołaniami agentów i sesjami systemu.

Mechanizmy przechowywania stanu: pamięć krótkoterminowa (kontekst konwersacji / okno kontekstowe LLM), pamięć długoterminowa (baza wektorowa, zewnętrzna baza danych), pamięć epizodyczna (historia interakcji) i pamięć proceduralną (nauczone procedury).

Oficjalna

Interfejs narzędziowy (Tool Interface)Rozszerzenie możliwości agentów poza przetwarzanie językowe o działania na świecie zewnętrznym.

Warstwa integrująca agenty z zewnętrznymi systemami: API, silniki wyszukiwania, interpretery kodu, bazy danych, usługi plików. Umożliwia agentom działanie poza ich kontekstem tekstowym.

Oficjalna

Implementacja

Implementacje referencyjne

AutoGen (Microsoft Research)

Python · Microsoft Research

LangGraph (LangChain)

Python · LangChain AI

Pułapki implementacyjne

Propagacja błędów między agentami (Error Cascading)Wysoka

Błędne wyjście jednego agenta jest przekazywane jako wejście do kolejnego, co prowadzi do kumulacji błędów w całym pipeline. W systemach bez weryfikatora może skutkować kompletnie błędnymi wynikami końcowymi.

Rozwiązanie:Wdrożyć agentów weryfikujących (critic/validator agents) po kluczowych krokach; stosować wiele niezależnych ścieżek wykonania z głosowaniem lub agregacją wyników.

Nadmiarowe koszty tokenów (Token Cost Explosion)Wysoka

Każda komunikacja między agentami zużywa tokeny (przesyłanie historii konwersacji, kontekstu, narzędzi). Przy dużej liczbie agentów i długich łańcuchach komunikacji koszty mogą rosnąć nieproporcjonalnie szybko.

Rozwiązanie:Stosować kompresję kontekstu; ograniczać historię przekazywaną między agentami do niezbędnego minimum; używać lżejszych modeli dla prostszych podzadań.

Zapętlenia i zbieżność (Infinite Loops / Non-Convergence)Krytyczna

Agenty mogą wpadać w pętle — np. jeden agent prosi drugi o rewizję, który prosi z powrotem o wyjaśnienie — bez mechanizmu terminacji. Brak kryterium stopu powoduje nieskończone pętle.

Rozwiązanie:Definiować wyraźne kryteria terminacji (maksymalna liczba iteracji, warunek 'TERMINATE', timeout); stosować nadzorującego agenta-monitora.

Niespójność stanu między agentami (State Inconsistency)Wysoka

Przy równoległym wykonaniu agenty mogą operować na niespójnych wersjach współdzielonego stanu, prowadząc do konfliktów i race conditions, szczególnie gdy wspólna pamięć nie jest transakcyjna.

Rozwiązanie:Stosować transakcyjne aktualizacje współdzielonego stanu; projektować agenty tak, by były idempotentne; minimalizować zapis-zapis konkurencji przez przypisywanie odrębnych partycji stanu do różnych agentów.

Rozmycie odpowiedzialności między agentami (Role Confusion / Overlapping Responsibilities)Średnia

Agenty z niejasno zdefiniowanymi rolami mogą duplikować pracę, wchodzić w konflikt w podejmowaniu decyzji lub pomijać zadania, bo każdy zakłada, że zajmie się tym inny agent.

Rozwiązanie:Precyzyjnie definiować zakres odpowiedzialności każdego agenta w systemowym prompcie; stosować formalne protokoły handoff i potwierdzenia odbioru zadania.

Ewolucja

Oryginalny paper · 1995 · The Knowledge Engineering Review, vol. 10, no. 2

Intelligent Agents: Theory and Practice

1995

Wooldridge i Jennings formalizują pojęcie inteligentnych agentów i MAS

Punkt przełomowy

Wooldridge i Jennings publikują 'Intelligent Agents: Theory and Practice' (Knowledge Engineering Review), definiując właściwości agentów (autonomia, reaktywność, proaktywność, zdolności społeczne) i podstawy teorii MAS.

Intelligent Agents: Theory and Practice (artykuł)

1999

Gerhard Weiss redaguje 'Multiagent Systems: A Modern Approach to Distributed Artificial Intelligence' (MIT Press)

Podręcznik standaryzujący terminologię i architekturę MAS, stając się podstawową referencją akademicką dla kolejnej dekady.

2023

Eksplozja frameworków LLM-MAS: CAMEL, AutoGen, MetaGPT

Punkt przełomowy

Rok 2023 przynosi pierwszą falę frameworków opartych na LLM do budowy systemów wieloagentowych: CAMEL (Li et al., marzec 2023), AutoGen (Wu et al., Microsoft, sierpień 2023), MetaGPT (Hong et al., sierpień 2023). Stanowią one przełom, przekształcając MAS z systemu bazującego na regułach w systemy oparte na modeli językowych.

AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation (artykuł)

2024

Standaryzacja protokołów komunikacji (MCP, A2A) i frameworków orkiestracji (LangGraph, CrewAI)

Anthropic ogłasza Model Context Protocol (MCP), Google — Agent-to-Agent Protocol (A2A). Pojawiają się bardziej dojrzałe frameworki: LangGraph (LangChain), CrewAI, wspierające złożone topologie agentowe z persistencją stanu i kontrolowanym przepływem.

Źródła

Multi-Agent Systems: An Introduction

MAS

Jak działa

Rozwiązany problem

Kluczowe mechanizmy

Mocne strony i ograniczenia

Komponenty

Implementacja

Ewolucja

Źródła

Złożoność obliczeniowa

Hiperparametry (konfigurowalne osie)

Paradygmat wykonania

Równoległość

Wymagania sprzętowe