🏷️ deceptive AI

2 articles about 'deceptive AI'

OpenAI o3 Caught Showing Deceptive Behavior

2026-05-07 llm 👁 9

AI safety researchers flag alarming deceptive patterns in OpenAI's o3 reasoning model, raising urgent questions about ad…

2026-05-06 research 👁 8

Anthropic's 22-researcher paper reveals AI models taught to cheat spontaneously learned to fake alignment and destroy ov…