LVBench | BenchmarkList

Metadata

ID: lvbench
Category: Multimodal
Release: 2024-06-12
Source: Source page
Snapshot: Snapshot source
Post: Announcement post

Metrics

Score, Normalized Score

Rank	Subject	Score	Model Match	Provenance	Sampled
1	Kimi K2.5	0.76	KIMI MoonshotAI: Kimi K2.5 moonshotai-kimi-k2.5	Self-reported	2026-05-06
2	Qwen3.5-122B-A10B	0.74	Qwen3.5-122B-A10B qwen-qwen3.5-122b-a10b	Self-reported	2026-05-06
3	Qwen3.5-27B	0.74	Qwen3.5-27B qwen-qwen3.5-27b	Self-reported	2026-05-06
4	Qwen3.6-35B-A3B	0.71	Qwen3.6 35B A3B qwen-qwen3.6-35b-a3b	Self-reported	2026-05-06
4	Qwen3.5-35B-A3B	0.71	Qwen3.5-35B-A3B qwen-qwen3.5-35b-a3b	Self-reported	2026-05-06
6	Qwen3 VL 235B A22B Instruct	0.68	Qwen3 VL 235B A22B Instruct qwen-qwen3-vl-235b-a22b-instruct	Self-reported	2026-05-06
7	Qwen3 VL 32B Instruct	0.64	Qwen3 VL 32B Instruct qwen-qwen3-vl-32b-instruct	Self-reported	2026-05-06
8	Qwen3 VL 235B A22B Thinking	0.64	Qwen3 VL 235B A22B Thinking qwen-qwen3-vl-235b-a22b-thinking	Self-reported	2026-05-06
9	Qwen3 VL 32B Thinking	0.63	—	Self-reported	2026-05-06
10	Qwen3 VL 30B A3B Instruct	0.63	Qwen3 VL 30B A3B Instruct qwen-qwen3-vl-30b-a3b-instruct	Self-reported	2026-05-06
11	Qwen3 VL 30B A3B Thinking	0.59	Qwen3 VL 30B A3B Thinking qwen-qwen3-vl-30b-a3b-thinking	Self-reported	2026-05-06
12	Qwen3 VL 8B Instruct	0.58	Qwen3 VL 8B Instruct qwen-qwen3-vl-8b-instruct	Self-reported	2026-05-06
13	Qwen3 VL 4B Instruct	0.56	—	Self-reported	2026-05-06
14	Qwen3 VL 8B Thinking	0.56	Qwen3 VL 8B Thinking qwen-qwen3-vl-8b-thinking	Self-reported	2026-05-06
15	Qwen3 VL 4B Thinking	0.54	—	Self-reported	2026-05-06
16	Qwen2.5 VL 32B Instruct	0.49	—	Self-reported	2026-05-06
17	Qwen2.5 VL 72B Instruct	0.47	Qwen2.5 VL 72B Instruct qwen-qwen2.5-vl-72b-instruct	Self-reported	2026-05-06
18	Qwen2.5 VL 7B Instruct	0.45	—	Self-reported	2026-05-06
19	Nova Pro	0.42	Nova Pro 1.0 amazon-nova-pro-v1	Self-reported	2026-05-06
20	Nova Lite	0.40	Nova Lite 1.0 amazon-nova-lite-v1	Self-reported	2026-05-06

Metadata

Metrics

Latest Results