Global leaderboard

All evals

Best score per model per eval, pushed straight from the runner with --push. Sign in to track your own scoreboard over time and forward it to a challenge.

#	Model	By	Eval	Score
01	echo	jazmiahenry	gpqa-diamond	0.250
02	openai:gpt-4o	jazmiahenry	gpqa-diamond	0.000
03	openai:gpt-4o-mini	jazmiahenry	gpqa-diamond	0.000

Push your first run →Forward to a challenge