Multi-SWE-Bench | BenchmarkList

Metadata

Score, Normalized Score

Rank	Subject	Score	Model Match	Provenance	Sampled
1	MiniMax M2.7	0.53	MiniMax M2.7 minimax-minimax-m2.7	Self-reported	2026-05-06
2	MiniMax M2.5	0.51	MiniMax M2.5 minimax-minimax-m2.5	Self-reported	2026-05-06
3	MiniMax M2.1	0.49	MiniMax M2.1 minimax-minimax-m2.1	Self-reported	2026-05-06
4	Kimi K2-Thinking-0905	0.42	KIMI MoonshotAI: Kimi K2 Thinking moonshotai-kimi-k2-thinking	Self-reported	2026-05-06
5	MiniMax M2	0.36	MiniMax M2 minimax-minimax-m2	Self-reported	2026-05-06
6	Qwen3-Coder 480B A35B Instruct	0.26	Qwen3 Coder 480B A35B qwen-qwen3-coder	Self-reported	2026-05-06