GitHub - chrishayuk/mlx-finetune-record

python merge_jsonl.py ./json/calculator/train.jsonl ./json/general/train.jsonl ./json/test/train.jsonl

Qwen2.5-Coder-7B-Instruct

Fine Tuning

Full Fine Tune

mlx_lm.lora \
    --model "Qwen/Qwen2.5-Coder-7B-Instruct" \
    --train \
    --data "./jsonl/calculator-non-diverse" \
    --learning-rate 1e-5 \
    --iters 100 \
    --fine-tune-type full

Lora Fine Tune

mlx_lm.lora \
    --model "Qwen/Qwen2.5-Coder-7B-Instruct" \
    --train \
    --data "./jsonl/calculator-non-diverse" \
    --num-layers 4 \
    --learning-rate 1e-5 \
    --iters 100 \
    --fine-tune-type lora

Testing the Adapters

python -m mlx_lm.generate --model "Qwen/Qwen2.5-Coder-7B-Instruct" --max-tokens 500 --adapter-path adapters --prompt "could you add 2665 to 1447?"

python -m mlx_lm.generate --model "Qwen/Qwen2.5-Coder-7B-Instruct" --max-tokens 500 --adapter-path adapters --prompt "could you add 2665 to 1447?"

python -m mlx_lm.generate --model "Qwen/Qwen2.5-Coder-7B-Instruct" --max-tokens 500 --adapter-path adapters --prompt "what's 254-7?"

python -m mlx_lm.generate --model "Qwen/Qwen2.5-Coder-7B-Instruct" --max-tokens 500 --adapter-path adapters --prompt "who is ada lovelace?"

python -m mlx_lm.generate --model "Qwen/Qwen2.5-Coder-7B-Instruct" --max-tokens 500 --adapter-path adapters --prompt "which number is bigger 3.9 or 3.11?"

No Adapters

python -m mlx_lm.generate --model "Qwen/Qwen2.5-Coder-7B-Instruct" \
                --max-tokens 500 \
                --prompt "could you add 2665 to 1447?"

python -m mlx_lm.generate --model "Qwen/Qwen2.5-Coder-7B-Instruct" \
                --max-tokens 500 \
                --prompt "what's 254-7?"

python -m mlx_lm.generate --model "Qwen/Qwen2.5-Coder-7B-Instruct" \
                --max-tokens 500 \
                --prompt "who is ada lovelace?"

Qwen2.5-Coder-7B-Instruct

Fine Tuning

Full Fine Tune

mlx_lm.lora \
    --model "Qwen/Qwen2.5-Coder-0.5B-Instruct" \
    --train \
    --data "./jsonl/calculator-non-diverse" \
    --learning-rate 1e-5 \
    --iters 100 \
    --fine-tune-type full

Lora Fine Tune

mlx_lm.lora \
    --model "Qwen/Qwen2.5-Coder-0.5B-Instruct" \
    --train \
    --data "./jsonl/calculator-non-diverse" \
    --num-layers 4 \
    --learning-rate 1e-5 \
    --iters 100 \
    --fine-tune-type lora

mlx_lm.lora
--model "Qwen/Qwen2.5-Coder-7B-Instruct"
--train
--data "./json/test"
--num-layers 4
--learning-rate 1e-5
--iters 100
--fine-tune-type lora

python -m mlx_lm.generate --model "Qwen/Qwen2.5-Coder-0.5B-Instruct"
--max-tokens 500
--adapter-path adapters
--prompt "What is 990 * 75 + 12?"

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
jsonl		jsonl
samples		samples
verifiers		verifiers
.gitignore		.gitignore
README.md		README.md
cli.py		cli.py
infer.py		infer.py
merge_jsonl.py		merge_jsonl.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Qwen2.5-Coder-7B-Instruct

Fine Tuning

Full Fine Tune

Lora Fine Tune

Testing the Adapters

No Adapters

Qwen2.5-Coder-7B-Instruct

Fine Tuning

Full Fine Tune

Lora Fine Tune

About

Uh oh!

Releases

Packages

Uh oh!

Languages

chrishayuk/mlx-finetune-record

Folders and files

Latest commit

History

Repository files navigation

Qwen2.5-Coder-7B-Instruct

Fine Tuning

Full Fine Tune

Lora Fine Tune

Testing the Adapters

No Adapters

Qwen2.5-Coder-7B-Instruct

Fine Tuning

Full Fine Tune

Lora Fine Tune

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages