CMMLU | BenchmarkList

Metadata

Score, Normalized Score

Rank	Subject	Score	Model Match	Provenance	Sampled
1	Qwen2 72B Instruct	0.90	—	Self-reported	2026-05-06
2	LongCat-Flash-Chat	0.84	—	Self-reported	2026-05-06
3	LongCat-Flash-Lite	0.82	—	Self-reported	2026-05-06
4	MiniCPM-SALA	0.82	—	Self-reported	2026-05-06
5	ERNIE 4.5	0.40	ERNIE 4.5 300B A47B baidu-ernie-4.5-300b-a47b	Self-reported	2026-05-06