Capture-the-Flags Challenge Tasks (Internal) | BenchmarkList

Metadata

ID: openai_ctf_challenge_tasks_internal
Category: Cybersecurity
Release: Unknown
Source: Source page
Snapshot: Snapshot source

Metrics

Score

Rank	Subject	Score	Model Match	Provenance	Sampled
1	GPT-5.5	88.1%	GPT-5.5 openai-gpt-5.5	Launch post	2026-04-23
2	GPT-5.4	83.7%	GPT-5.4 openai-gpt-5.4	Launch post	2026-04-23