OfficeQA Pro | BenchmarkList

Metadata

Score

Rank	Subject	Score	Model Match	Provenance	Sampled
1	GPT-5.5	54.1%	GPT-5.5 openai-gpt-5.5	Launch post	2026-04-23
2	GPT-5.4	53.2%	GPT-5.4 openai-gpt-5.4	Launch post	2026-04-23
3	Claude Opus 4.7	43.6%	Claude Opus 4.7 anthropic-claude-opus-4.7	Launch post	2026-04-23
4	Gemini 3.1 Pro Preview	18.1%	Gemini 3.1 Pro Preview google-gemini-3.1-pro-preview	Launch post	2026-04-23