HealthBench Professional

Metadata

Score

Rank	Subject	Score	Model Match	Provenance	Sampled
1	Claude Opus 4.8	55.8%	Claude Opus 4.8 anthropic-claude-opus-4.8	Self-reported	2026-05-28
2	Claude Opus 4.7	51.9%	Claude Opus 4.7 anthropic-claude-opus-4.7	Self-reported	2026-05-28
3	Claude Sonnet 4.6	41.7%	Claude Sonnet 4.6 anthropic-claude-sonnet-4.6	Self-reported	2026-05-28