vexp-swe-bench | BenchmarkList

Metadata

ID: vexp_swe_bench
Category: Coding
Release: Unknown
Source: Source page
Snapshot: Snapshot source

Metrics

Pass@1, Cost per Task (lower is better), Unique Wins Lower Bound

Rank	Subject	Pass@1	Model Match	Provenance	Sampled
1	vexp + Claude Code	73	—	Imported	2026-05-06
2	Live-SWE-Agent	72	—	Imported	2026-05-06
3	OpenHands	70	—	Imported	2026-05-06
4	Sonar Foundation	70	—	Imported	2026-05-06