AI Safety Hiring: Who's Building What

Jan 20, 2026

A breakdown of alignment research roles at frontier labs.

Anthropic: Mechanistic interpretability, scalable oversight, RLHF. OpenAI: Superalignment, evals. DeepMind: AI safety team scaling. Smaller labs: Often more focused, faster iteration.

Competition is fierce. Strong research background + clear motivation usually wins.

← All posts

// loading...

AI Safety Hiring: Who's Building What