Bitloops Benchmarks

Small benchmark harness for running SWE-bench tasks with Codex, Ollama, or OpenCode, either with or without Bitloops.

Supported benchmark profiles:

swebench_multilingual (legacy Rust-focused path)
swebench_pro (JS/TS-first path)

Main configs:

configs/swebench/codex.toml
configs/swebench/codex_pro.toml
configs/swebench/opencode.toml
configs/swebench/opencode_ollama.toml
configs/swebench/opencode_pro.toml.disabled

Quick Pro run path:

./.venv/bin/python -m benchkit.swebench.cli plan \
  --config configs/swebench/codex_pro.toml \
  --mode baseline

./.venv/bin/python -m benchkit.swebench.cli run \
  --config configs/swebench/codex_pro.toml \
  --mode baseline

Legacy multilingual path:

./.venv/bin/python -m benchkit.swebench.cli plan \
  --config configs/swebench/codex.toml \
  --mode baseline

./.venv/bin/python -m benchkit.swebench.cli run \
  --config configs/swebench/opencode.toml \
  --mode with_bitloops

Legacy configs, scripts, and notes are archived under configs/swebench/archive/, scripts/swebench/archive/, and docs/archive/.

Name		Name	Last commit message	Last commit date
Latest commit History 86 Commits
.agents/skills/benchmark-run-row		.agents/skills/benchmark-run-row
.claude		.claude
.cursor		.cursor
configs		configs
datasets/workspaces		datasets/workspaces
docs		docs
scripts		scripts
src/benchkit		src/benchkit
tests		tests
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
app.py		app.py
pyproject.toml		pyproject.toml
requirements-dataset-viewer.txt		requirements-dataset-viewer.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Bitloops Benchmarks

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Bitloops Benchmarks

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages