AITZ_EM | BenchmarkList

Metadata

Score, Normalized Score

Rank	Subject	Score	Model Match	Provenance	Sampled
1	Qwen2.5 VL 72B Instruct	0.83	Qwen2.5 VL 72B Instruct qwen-qwen2.5-vl-72b-instruct	Self-reported	2026-05-06
2	Qwen2.5 VL 32B Instruct	0.83	—	Self-reported	2026-05-06
3	Qwen2.5 VL 7B Instruct	0.82	—	Self-reported	2026-05-06