Tags · instructlab/eval

v0.6.0

Merge pull request #234 from RobotSail/add-leaderboard

Implement leaderboard as a benchmark

Apr 16, 2025
cea8acd
zip
tar.gz
Notes
Downloads

v0.5.1

Merge pull request #212 from alimaredia/bump-ragas-version

Jan 18, 2025
bdece44
zip
tar.gz
Notes
Downloads

v0.5.0

Merge pull request #208 from RobotSail/update-changelog

chore: update changelog for 0.5.0

Jan 9, 2025
e31d19b
zip
tar.gz
Notes
Downloads

v0.4.2

Merge pull request #197 from RobotSail/fix-mmlu

Allows MMLU to have the system_prompt provided to it

Dec 13, 2024
c086116
zip
tar.gz
Notes
Downloads

v0.4.1

Merge pull request #179 from danmcp/handlenoresult

Handle no valid eval results for mt_bench

Nov 14, 2024
4bde0b3
zip
tar.gz
Notes
Downloads

v0.4.0

Merge pull request #174 from danmcp/modeladapterunits

Add model adapter unit tests

Nov 11, 2024
8e32704
zip
tar.gz
Notes
Downloads

v0.3.1

Merge pull request #143 from danmcp/aggfix

Remove task logic with lm_eval 0.4.4 for agg_score

Oct 1, 2024
c05af4d
zip
tar.gz
Notes
Downloads

v0.3.0

Merge pull request #138 from alimaredia/mtbench-branch-judgement-retu…

…rn-overall-score

return overall_score from MTBenchBranch.generate_judgement()

Sep 28, 2024
40cc370
zip
tar.gz
Notes
Downloads

v0.2.1

Merge pull request #98 from danmcp/removefastchatdep

Remove fastchat dependency

Sep 23, 2024
53d6abf
zip
tar.gz
Notes
Downloads

v0.1.2

Merge pull request #110 from danmcp/singleanswerfile

Use single answer file and model list

Aug 27, 2024
ff54038
zip
tar.gz
Notes
Downloads

PreviousNext

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

v0.6.0

v0.5.1

v0.5.0

v0.4.2

v0.4.1

v0.4.0

v0.3.1

v0.3.0

v0.2.1

v0.1.2

Tags: instructlab/eval