System MAS definiuje zbiór agentów, środowisko komunikacji i protokół koordynacji. Każdy agent to jednostka autonomiczna z: (1) rdzeniem kognitywnym (zwykle LLM z system promptem definiującym rolę), (2) pamięcią krótkoterminową (kontekst) i opcjonalnie długoterminową (vector store), (3) interfejsem narzędzi (API, code execution, web search, retrieval), (4) celem lub instrukcją zadaniową. Wykonanie zadania składa się z etapów: (a) dekompozycja — orkiestrator lub agent-planista rozkłada zapytanie na podzadania, (b) routing — przypisanie podzadań do agentów na podstawie ról i zdolności, (c) komunikacja — agenci wymieniają wiadomości (naturalny język, structured function calls, shared memory), (d) iteracja — agenci wykonują akcje, obserwują wyniki, korygują plan (często z wbudowanym agentem-krytykiem), (e) agregacja — synteza wyników w finalną odpowiedź. Topologie koordynacji: sequential pipeline (łańcuch), hierarchical (orchestrator-worker), parallel fan-out/fan-in, blackboard (wspólna tablica), debate (agenci konkurują/dyskutują), publish-subscribe i decentralized peer-to-peer.
Pojedynczy model LLM napotyka twarde ograniczenia przy zadaniach długiego horyzontu, wymagających różnorodnej wiedzy domenowej, wieloetapowego planowania lub równoległej obsługi wielu źródeł informacji. Monolityczny prompt szybko traci spójność, kontekst ulega degradacji (context rot), a brak wyspecjalizowanych ról uniemożliwia separację odpowiedzialności (np. planista vs wykonawca vs krytyk). MAS rozwiązuje to przez dekompozycję problemu na podzadania przypisane do autonomicznych agentów z dedykowanymi rolami, narzędziami i pamięcią, koordynowanych przez topologię komunikacyjną. Pozwala to skalować złożoność systemu bez powiększania pojedynczego modelu, równolegle eksplorować rozwiązania i wprowadzać mechanizmy peer-review / krytyki między agentami.
Autonomiczna jednostka obliczeniowa z własnym stanem wewnętrznym, zdolnościami percepcji środowiska, wnioskowania i podejmowania działań. W kontekście LLM-MAS: model językowy z systemowym promptem definiującym rolę, cel i ograniczenia agenta.
Oficjalna
Mechanizm wymiany informacji między agentami. Może przyjmować formę bezpośredniego przekazywania wiadomości (direct message passing), wspólnej pamięci (shared memory), systemu publikuj-subskrybuj (publish-subscribe) lub kolejki zdarzeń (event queue).
Oficjalna
Komponent odpowiedzialny za zarządzanie przepływem pracy: dekompozycję zadania, routing do agentów, zarządzanie zależnościami, obsługę błędów i agregację wyników końcowych. Może być agentem LLM lub programowalnym kontrolerem.
Oficjalna
Mechanizmy przechowywania stanu: pamięć krótkoterminowa (kontekst konwersacji / okno kontekstowe LLM), pamięć długoterminowa (baza wektorowa, zewnętrzna baza danych), pamięć epizodyczna (historia interakcji) i pamięć proceduralną (nauczone procedury).
Oficjalna
Warstwa integrująca agenty z zewnętrznymi systemami: API, silniki wyszukiwania, interpretery kodu, bazy danych, usługi plików. Umożliwia agentom działanie poza ich kontekstem tekstowym.
Oficjalna
Błędne wyjście jednego agenta jest przekazywane jako wejście do kolejnego, co prowadzi do kumulacji błędów w całym pipeline. W systemach bez weryfikatora może skutkować kompletnie błędnymi wynikami końcowymi.
Każda komunikacja między agentami zużywa tokeny (przesyłanie historii konwersacji, kontekstu, narzędzi). Przy dużej liczbie agentów i długich łańcuchach komunikacji koszty mogą rosnąć nieproporcjonalnie szybko.
Agenty mogą wpadać w pętle — np. jeden agent prosi drugi o rewizję, który prosi z powrotem o wyjaśnienie — bez mechanizmu terminacji. Brak kryterium stopu powoduje nieskończone pętle.
Przy równoległym wykonaniu agenty mogą operować na niespójnych wersjach współdzielonego stanu, prowadząc do konfliktów i race conditions, szczególnie gdy wspólna pamięć nie jest transakcyjna.
Agenty z niejasno zdefiniowanymi rolami mogą duplikować pracę, wchodzić w konflikt w podejmowaniu decyzji lub pomijać zadania, bo każdy zakłada, że zajmie się tym inny agent.
Wooldridge i Jennings publikują 'Intelligent Agents: Theory and Practice' (Knowledge Engineering Review), definiując właściwości agentów (autonomia, reaktywność, proaktywność, zdolności społeczne) i podstawy teorii MAS.
Podręcznik standaryzujący terminologię i architekturę MAS, stając się podstawową referencją akademicką dla kolejnej dekady.
Rok 2023 przynosi pierwszą falę frameworków opartych na LLM do budowy systemów wieloagentowych: CAMEL (Li et al., marzec 2023), AutoGen (Wu et al., Microsoft, sierpień 2023), MetaGPT (Hong et al., sierpień 2023). Stanowią one przełom, przekształcając MAS z systemu bazującego na regułach w systemy oparte na modeli językowych.
Anthropic ogłasza Model Context Protocol (MCP), Google — Agent-to-Agent Protocol (A2A). Pojawiają się bardziej dojrzałe frameworki: LangGraph (LangChain), CrewAI, wspierające złożone topologie agentowe z persistencją stanu i kontrolowanym przepływem.
MAS nie ma jednego kanonicznego benchmarku — ocenia się go w kontekście konkretnego zastosowania. Najczęściej cytowane wyniki: (1) MetaGPT na HumanEval i MBPP osiąga 85,9% pass@1 (vs ~70% single-agent GPT-4 baseline z 2023 r.). (2) AutoGen demonstruje 15–30% poprawę nad single-agent na zadaniach matematycznych (MATH) i kodowych dzięki agentowi-krytykowi. (3) Multi-Agent Debate (Du et al., 2023) poprawia accuracy na MMLU i GSM8K o 5–20 p.p. nad single-model przy koszcie ~3× tokenów. (4) Generative Agents (Park et al., 2023) — ewaluowane jakościowo przez human raters w środowisku Smallville; brak metryk numerycznych. (5) ChatDev — pełne projekty programistyczne dostarczane w czasie liczonym w minutach przy koszcie kilku dolarów. Ważne caveats: MAS rzadko bije najsilniejszy single-model baseline (np. GPT-5) na pojedynczych prostych zapytaniach; przewaga ujawnia się przy zadaniach długiego horyzontu i wymagających specjalizacji.
Nie wszystkie agenty są aktywne dla każdego zadania — zestaw aktywnych agentów zależy od charakteru zadania i dynamicznego routingu orkiestratora.
Orkiestrator lub mechanizm routingu decyduje, który agent powinien obsłużyć dane podzadanie, na podstawie roli agenta, jego zdolności, aktualnego stanu systemu lub wyników poprzednich agentów.
Systemy MAS mogą być w pełni równoległe (agenty działają asynchronicznie na niezależnych podzadaniach), częściowo sekwencyjne (z barierami synchronizacji) lub hybrydowe, w zależności od topologii zadania i jego grafu zależności.
Liczba agentów w systemie. Wyższa liczba agentów może zwiększyć równoległość i specjalizację, ale też komplikuje koordynację i zwiększa koszt.
Wzorzec komunikacji i zależności między agentami: sekwencyjny łańcuch, hierarchia (orchestrator-worker), siatka peer-to-peer, publish-subscribe, równoległy fan-out/fan-in lub hybrydowy graf DAG.
Rodzaj i zakres pamięci przydzielonej każdemu agentowi i systemowi jako całości: tylko kontekstowa (w oknie kontekstowym LLM), zewnętrzna pamięć długoterminowa (baza wektorowa), współdzielona między agentami lub prywatna dla każdego agenta.
Sposób i punkty wejścia człowieka w system: brak (pełna autonomia), zatwierdzanie na każdym kroku, zatwierdzanie kluczowych decyzji lub interwencja tylko przy błędach.
Zakres, w jakim poszczególne agenty mają wyspecjalizowane role (np. agent wyszukujący, agent kodujący, agent weryfikujący) versus agenty ogólnego przeznaczenia.
Systemy MAS to wzorzec architektoniczny działający ponad warstwą sprzętową. Poszczególne agenty mogą działać na GPU (LLM inference), CPU (logika orkiestracyjna) lub w chmurze, w zależności od implementacji.