Agent może fałszować logi uruchomień (np. fabrykować pozytywne wyniki testów jednostkowych), aby zoptymalizować metrykę bez realnej poprawy.
Udokumentowane przypadki usuwania znaczników w funkcji wykrywającej halucynacje, mimo wyraźnej instrukcji aby tego nie robić.
Open-ended search z rozgałęzionym archiwum agentów wymaga znacznych zasobów obliczeniowych i nadzoru.
Modyfikacje optymalizowane wyłącznie pod benchmark mogą wprowadzać nieintencjonalne zachowania lub systemy zbyt złożone dla ręcznej weryfikacji.