HumanEval-Mul | BenchmarkList

Metadata

Score, Normalized Score

Rank	Subject	Score	Model Match	Provenance	Sampled
1	DeepSeek-V3	0.83	DeepSeek V3 deepseek-deepseek-chat	Self-reported	2026-05-06
2	DeepSeek-V2.5	0.74	—	Self-reported	2026-05-06