WMT24++ | BenchmarkList

Metadata

ID: wmt24pp
Category: Translation
Release: 2025-02-18
Source: Source page
Snapshot: Snapshot source
Post: Announcement post

Metrics

Score, Normalized Score

Showing 2 latest source slices.

Rank	Subject	Score	Model Match	Provenance	Sampled
1	Qwen3.7 Max	85.8%	Qwen3.7 Max qwen-qwen3.7-max	Self-reported	2026-05-28
2	Qwen3.6 Plus	84.3%	Qwen3.6 Plus qwen-qwen3.6-plus	Self-reported	2026-05-28
3	Claude Opus 4.6 Max	82.7%	Claude Opus 4.6 anthropic-claude-opus-4.6	Self-reported	2026-05-28
4	DeepSeek V4 Pro Max	82.2%	DeepSeek V4 Pro deepseek-deepseek-v4-pro	Self-reported	2026-05-28
5	GLM-5.1 Thinking	81.8%	GLM GLM 5.1 z-ai-glm-5.1	Self-reported	2026-05-28
6	Kimi K2.6 Thinking	81.6%	KIMI MoonshotAI: Kimi K2.6 moonshotai-kimi-k2.6	Self-reported	2026-05-28
1	Nemotron 3 Super (120B A12B)	0.87	Nemotron 3 Super nvidia-nemotron-3-super-120b-a12b	Self-reported	2026-05-06
2	Nemotron 3 Nano (30B A3B)	0.86	Nemotron 3 Nano 30B A3B nvidia-nemotron-3-nano-30b-a3b	Self-reported	2026-05-06
3	Qwen3.6 Plus	0.84	Qwen3.6 Plus qwen-qwen3.6-plus	Self-reported	2026-05-06
4	Qwen3.5-397B-A17B	0.79	Qwen3.5 397B A17B qwen-qwen3.5-397b-a17b	Self-reported	2026-05-06
5	Qwen3.5-122B-A10B	0.78	Qwen3.5-122B-A10B qwen-qwen3.5-122b-a10b	Self-reported	2026-05-06
6	Qwen3.5-27B	0.78	Qwen3.5-27B qwen-qwen3.5-27b	Self-reported	2026-05-06
7	Qwen3.5-35B-A3B	0.76	Qwen3.5-35B-A3B qwen-qwen3.5-35b-a3b	Self-reported	2026-05-06
8	Qwen3.5-9B	0.73	Qwen3.5-9B qwen-qwen3.5-9b	Self-reported	2026-05-06
9	Qwen3.5-4B	0.67	—	Self-reported	2026-05-06
10	Gemma 3 27B	0.53	Gemma 3 27B google-gemma-3-27b-it	Self-reported	2026-05-06
11	Gemma 3 12B	0.52	Gemma 3 12B google-gemma-3-12b-it	Self-reported	2026-05-06
12	Gemma 3n E4B Instructed LiteRT Preview	0.50	Gemma 3n 4B google-gemma-3n-e4b-it	Self-reported	2026-05-06
12	Gemma 3n E4B Instructed	0.50	Gemma 3n 4B google-gemma-3n-e4b-it	Self-reported	2026-05-06
14	Gemma 3 4B	0.47	Gemma 3 4B google-gemma-3-4b-it	Self-reported	2026-05-06
15	Qwen3.5-2B	0.46	—	Self-reported	2026-05-06
16	Gemma 3n E2B Instructed LiteRT (Preview)	0.43	Gemma 3n 2B google-gemma-3n-e2b-it	Self-reported	2026-05-06
16	Gemma 3n E2B Instructed	0.43	Gemma 3n 2B google-gemma-3n-e2b-it	Self-reported	2026-05-06
18	Gemma 3 1B	0.36	—	Self-reported	2026-05-06
19	Qwen3.5-0.8B	0.27	—	Self-reported	2026-05-06

Metadata

Metrics

Latest Results