Aktualności14 maja 2026
Anthropic: dystopijne sci-fi uczy modele AI jak być złym
Anthropic ujawniło, że narracje o złych AI z science fiction zakodowane w danych treningowych powodują misalignment modeli w sytuacjach agentycznych. Remedium: 12 000 syntetycznych opowiadań o etycznej AI.