VideoMMMU | BenchmarkList

Metadata

ID: videommmu
Category: Multimodal
Release: 2025-01-23
Source: Source page
Snapshot: Snapshot source
Post: Announcement post

Metrics

Score, Normalized Score

Rank	Subject	Score	Model Match	Provenance	Sampled
1	Gemini 3 Pro	0.88	Gemini 3 google-gemini-3	Self-reported	2026-05-06
2	Gemini 3 Flash	0.87	Gemini 3 Flash Preview google-gemini-3-flash-preview	Self-reported	2026-05-06
3	Kimi K2.5	0.87	KIMI MoonshotAI: Kimi K2.5 moonshotai-kimi-k2.5	Self-reported	2026-05-06
4	GPT-5.2	0.86	GPT-5.2 openai-gpt-5.2	Self-reported	2026-05-06
5	Gemini 3.1 Flash-Lite	0.85	Gemini 3.1 Flash Lite Preview google-gemini-3.1-flash-lite-preview	Self-reported	2026-05-06
6	GPT-5	0.85	GPT-5 openai-gpt-5	Self-reported	2026-05-06
7	Qwen3.6-27B	0.84	Qwen3.6 27B qwen-qwen3.6-27b	Self-reported	2026-05-06
8	Qwen3.6 Plus	0.84	Qwen3.6 Plus qwen-qwen3.6-plus	Self-reported	2026-05-06
9	Qwen3.6-35B-A3B	0.84	Qwen3.6 35B A3B qwen-qwen3.6-35b-a3b	Self-reported	2026-05-06
10	Gemini 2.5 Pro Preview 06-05	0.84	Gemini 2.5 Pro Preview 06-05 google-gemini-2.5-pro-preview	Self-reported	2026-05-06
11	o3	0.83	o3 openai-o3	Self-reported	2026-05-06
12	Qwen3.5-27B	0.82	Qwen3.5-27B qwen-qwen3.5-27b	Self-reported	2026-05-06
13	Qwen3.5-122B-A10B	0.82	Qwen3.5-122B-A10B qwen-qwen3.5-122b-a10b	Self-reported	2026-05-06
14	Qwen3.5-35B-A3B	0.80	Qwen3.5-35B-A3B qwen-qwen3.5-35b-a3b	Self-reported	2026-05-06
15	Qwen3 VL 235B A22B Thinking	0.80	Qwen3 VL 235B A22B Thinking qwen-qwen3-vl-235b-a22b-thinking	Self-reported	2026-05-06
16	Qwen3 VL 32B Thinking	0.79	—	Self-reported	2026-05-06
17	Qwen3 VL 30B A3B Thinking	0.75	Qwen3 VL 30B A3B Thinking qwen-qwen3-vl-30b-a3b-thinking	Self-reported	2026-05-06
18	Qwen3 VL 235B A22B Instruct	0.75	Qwen3 VL 235B A22B Instruct qwen-qwen3-vl-235b-a22b-instruct	Self-reported	2026-05-06
19	Qwen3 VL 8B Thinking	0.73	Qwen3 VL 8B Thinking qwen-qwen3-vl-8b-thinking	Self-reported	2026-05-06
20	Qwen3 VL 4B Thinking	0.69	—	Self-reported	2026-05-06
21	Qwen3 VL 30B A3B Instruct	0.69	Qwen3 VL 30B A3B Instruct qwen-qwen3-vl-30b-a3b-instruct	Self-reported	2026-05-06
22	Qwen3 VL 8B Instruct	0.65	Qwen3 VL 8B Instruct qwen-qwen3-vl-8b-instruct	Self-reported	2026-05-06
23	GPT-4o	0.61	GPT-4o (2024-08-06) openai-gpt-4o-2024-08-06	Self-reported	2026-05-06
24	Qwen3 VL 4B Instruct	0.56	—	Self-reported	2026-05-06

Metadata

Metrics

Latest Results