FRAMES | BenchmarkList

Metadata

Score, Normalized Score

Rank	Subject	Score	Model Match	Provenance	Sampled
1	Kimi K2-Thinking-0905	0.87	KIMI MoonshotAI: Kimi K2 Thinking moonshotai-kimi-k2-thinking	Self-reported	2026-05-06
2	DeepSeek-V3	0.73	DeepSeek V3 deepseek-deepseek-chat	Self-reported	2026-05-06