Global MMLU | BenchmarkList

Metadata

Score

Rank	Subject	Score	Model Match	Provenance	Sampled
1	Gemini 3.1 Pro Preview	92.2%	Gemini 3.1 Pro Preview google-gemini-3.1-pro-preview	Self-reported	2026-05-28
2	GPT-5.4	90.6%	GPT-5.4 openai-gpt-5.4	Self-reported	2026-05-28
3	Claude Opus 4.8	90.4%	Claude Opus 4.8 anthropic-claude-opus-4.8	Self-reported	2026-05-28
4	Claude Opus 4.7	89.9%	Claude Opus 4.7 anthropic-claude-opus-4.7	Self-reported	2026-05-28
5	Claude Sonnet 4.6	86.1%	Claude Sonnet 4.6 anthropic-claude-sonnet-4.6	Self-reported	2026-05-28