CLUEWSC | BenchmarkList

Metadata

Score, Normalized Score

Rank	Subject	Score	Model Match	Provenance	Sampled
1	Kimi-k1.5	0.91	—	Self-reported	2026-05-06
2	DeepSeek-V3	0.91	DeepSeek V3 deepseek-deepseek-chat	Self-reported	2026-05-06
3	ERNIE 4.5	0.49	ERNIE 4.5 300B A47B baidu-ernie-4.5-300b-a47b	Self-reported	2026-05-06