InfoVQAtest | BenchmarkList

Metadata

Score, Normalized Score

Rank	Subject	Score	Model Match	Provenance	Sampled
1	Kimi K2.5	0.93	KIMI MoonshotAI: Kimi K2.5 moonshotai-kimi-k2.5	Self-reported	2026-05-06
2	Qwen3 VL 235B A22B Thinking	0.90	Qwen3 VL 235B A22B Thinking qwen-qwen3-vl-235b-a22b-thinking	Self-reported	2026-05-06
3	Qwen3 VL 32B Thinking	0.89	—	Self-reported	2026-05-06
3	Qwen3 VL 235B A22B Instruct	0.89	Qwen3 VL 235B A22B Instruct qwen-qwen3-vl-235b-a22b-instruct	Self-reported	2026-05-06
5	Qwen3 VL 32B Instruct	0.87	Qwen3 VL 32B Instruct qwen-qwen3-vl-32b-instruct	Self-reported	2026-05-06
6	Qwen3 VL 8B Thinking	0.86	Qwen3 VL 8B Thinking qwen-qwen3-vl-8b-thinking	Self-reported	2026-05-06
6	Qwen3 VL 30B A3B Thinking	0.86	Qwen3 VL 30B A3B Thinking qwen-qwen3-vl-30b-a3b-thinking	Self-reported	2026-05-06
8	Qwen2-VL-72B-Instruct	0.84	—	Self-reported	2026-05-06
9	Qwen3 VL 8B Instruct	0.83	Qwen3 VL 8B Instruct qwen-qwen3-vl-8b-instruct	Self-reported	2026-05-06
10	Qwen3 VL 4B Thinking	0.83	—	Self-reported	2026-05-06
11	Qwen3 VL 30B A3B Instruct	0.82	Qwen3 VL 30B A3B Instruct qwen-qwen3-vl-30b-a3b-instruct	Self-reported	2026-05-06
12	Qwen3 VL 4B Instruct	0.80	—	Self-reported	2026-05-06