ProgramBench (Anthropic Harness)

Metadata

Best hidden test pass rate, Lowest reported hidden test pass rate

Rank	Subject	Best hidden test pass rate	Model Match	Provenance	Sampled
1	Claude Opus 4.8	88%	Claude Opus 4.8 anthropic-claude-opus-4.8	Self-reported	2026-05-28
2	Claude Opus 4.7	84%	Claude Opus 4.7 anthropic-claude-opus-4.7	Self-reported	2026-05-28