BrowseComp Long Context 128k | BenchmarkList

Metadata

ID: browsecomp_long_128k
Category: Search
Release: Unknown
Source: Source page
Snapshot: Snapshot source

Metrics

Score, Normalized Score

Rank	Subject	Score	Model Match	Provenance	Sampled
1	GPT-5.2	0.92	GPT-5.2 openai-gpt-5.2	Self-reported	2026-05-06
2	GPT-5.1	0.90	GPT-5.1 openai-gpt-5.1	Self-reported	2026-05-06
2	GPT-5.1 Instant	0.90	GPT-5.1 openai-gpt-5.1	Self-reported	2026-05-06
2	GPT-5.1 Thinking	0.90	GPT-5.1 openai-gpt-5.1	Self-reported	2026-05-06
2	GPT-5	0.90	GPT-5 openai-gpt-5	Self-reported	2026-05-06