Skip to content

BenchmarkList Benchmarks Leaderboards Feed Models

Email address Company

OpenAI Evals

OpenAI Evals: Evaluates broad language-model knowledge, reasoning, commonsense, instruction following, or exam-style accuracy.

0rows

scoreprimary metric

—sampled

Metadata

ID: openai_evals
Category: Intelligence
Release: Unknown
Source: Source page

Metrics

Score

Latest Results

Rank	Subject	Score	Model Match	Provenance	Sampled

No matching rows.

BenchmarkList updates

Occasional notes on new benchmark coverage and model result changes.

Email address Company