KernelBench project

See original KernelBench repo. Original README is KernelBench.md.

Implementations of test-time scaling methods are in main directory. The following methods are implemented:

Best-of-N (KernelBench): sample $N$ independent kernels and pick best performance.
Iterative Refinement (KernelBench): sample kernel and get execution feedback to iteratively refine for $N$ steps.
METR: Initially, independently generate $N_0$ kernels. New kernel is generated by sampling based on efficiency from previously generated kernels and evolving it. Repeat until $N$ kernels total.
Stanford (Beam-search): From current kernel, generate $P$ independent NL ideas -> kernel. Pick best performing kernel to use for the next step. Repeat for $N$ steps.

Name		Name	Last commit message	Last commit date
Latest commit History 314 Commits
KernelBench		KernelBench
assets/figures		assets/figures
main		main
plots		plots
results/timing		results/timing
scripts		scripts
src		src
verifiers		verifiers
verifiers_docs @ 316b78d		verifiers_docs @ 316b78d
.gitignore		.gitignore
.gitmodules		.gitmodules
KernelBench.md		KernelBench.md
LICENSE		LICENSE
README.md		README.md
cleanup.sh		cleanup.sh
requirements.txt		requirements.txt
setup.py		setup.py

Provide feedback