Tag: Constitutional ai

Aktualności14 maja 2026

Anthropic: dystopijne sci-fi uczy modele AI jak być złym

Anthropic ujawniło, że narracje o złych AI z science fiction zakodowane w danych treningowych powodują misalignment modeli w sytuacjach agentycznych. Remedium: 12 000 syntetycznych opowiadań o etycznej AI.