-
open-r1-reprod Public
这是一个open-r1的复现项目,对0.5B、1.5B、3B、7B的qwen模型进行GRPO训练,观察到一些有趣的现象。
-
mini_qwen Public
这是一个从头训练大语言模型的项目,包括预训练、微调和直接偏好优化,模型拥有1B参数,支持中英文。
-
mini_qwen_further_analysis Public
本项目是mini_qwen项目的后续实验,是为了探究大模型复读机现象的成因与微调阶段模型知识注入现象的普遍性。
-
Multimodal-Fake-News-Detection Public
Forked from faiazrahman/Multimodal-Fake-News-DetectionMulti-Modal Fine-Grained Fake News Detection with Dialogue Summarization
Python UpdatedJan 14, 2022