HMMT February 2026 | BenchmarkList

Metadata

Score

Showing 2 latest source slices.

Rank	Subject	Score	Model Match	Provenance	Sampled
1	Qwen3.7 Max	97.1%	Qwen3.7 Max qwen-qwen3.7-max	Self-reported	2026-05-28
2	Claude Opus 4.6 Max	96.2%	Claude Opus 4.6 anthropic-claude-opus-4.6	Self-reported	2026-05-28
3	DeepSeek V4 Pro Max	95.2%	DeepSeek V4 Pro deepseek-deepseek-v4-pro	Self-reported	2026-05-28
4	Kimi K2.6 Thinking	92.7%	KIMI MoonshotAI: Kimi K2.6 moonshotai-kimi-k2.6	Self-reported	2026-05-28
5	GLM-5.1 Thinking	89.4%	GLM GLM 5.1 z-ai-glm-5.1	Self-reported	2026-05-28
6	Qwen3.6 Plus	87.8%	Qwen3.6 Plus qwen-qwen3.6-plus	Self-reported	2026-05-28
1	Qwen/Qwen3.5-397B-A17B	87.88	Qwen3.5 397B A17B qwen-qwen3.5-397b-a17b	Imported	2026-05-06
2	moonshotai/Kimi-K2.5	87.12	KIMI MoonshotAI: Kimi K2.5 moonshotai-kimi-k2.5	Imported	2026-05-06
3	stepfun-ai/Step-3.5-Flash	86.36	—	Imported	2026-05-06
4	zai-org/GLM-5	86.36	GLM GLM 5 z-ai-glm-5	Imported	2026-05-06
5	nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-BF16	84.85	Nemotron 3 Super nvidia-nemotron-3-super-120b-a12b	Imported	2026-05-06
6	deepseek-ai/DeepSeek-V3.2	84.09	DeepSeek V3.2 deepseek-deepseek-v3.2	Imported	2026-05-06
7	Qwen/Qwen3.5-35B-A3B	81.82	Qwen3.5-35B-A3B qwen-qwen3.5-35b-a3b	Imported	2026-05-06
8	Qwen/Qwen3.5-27B	81.06	Qwen3.5-27B qwen-qwen3.5-27b	Imported	2026-05-06
9	Qwen/Qwen3-30B-A3B-Thinking-2507	78.79	Qwen3 30B A3B Thinking 2507 qwen-qwen3-30b-a3b-thinking-2507	Imported	2026-05-06
10	Qwen/Qwen3.5-9B	71.21	Qwen3.5-9B qwen-qwen3.5-9b	Imported	2026-05-06
11	lm-provers/QED-Nano	62.88	—	Imported	2026-05-06
12	Qwen/Qwen3-4B-Thinking-2507	53.03	—	Imported	2026-05-06