-
R1-Nature Public
最简易的R1结果在小模型上的复现,阐述类O1与DeepSeek R1最重要的本质。Think is all your need。利用实验佐证,对于强推理能力,think思考过程性内容是AGI/ASI的核心。
-
R1-CDL Public
Continuous Distillation Learning持续蒸馏学习,在类DeepSeek-R1知识蒸馏强化的基础上,意图小模型能够以极低成本且简易的方式复制繁殖目标模型的强壮思维,在获取高价值蒸馏数据的同时,让小模型通过类人的在线持续学习,以继承目标模型的强推理能力。以此期待,成为AGI与硅基生命演化的一种新实现范式。
5 UpdatedJan 29, 2025 -
asal Public
Forked from SakanaAI/asalAutomating the Search for Artificial Life with Foundation Models!
Jupyter Notebook Apache License 2.0 UpdatedDec 24, 2024 -
Genesis Public
Forked from Genesis-Embodied-AI/GenesisA generative world for general-purpose robotics & embodied AI learning.
Python Apache License 2.0 UpdatedDec 19, 2024 -
ALM-Agent Public
目标为打造的一体型高度拟人心智化的智能体工程,拥有与生物智能相似的脑神经科学结构原理机制与学习认知规律,同时是一款可用于研究各种人体或类人体行为及心理的模拟器,当前版本为ALM版,即Automatic learning machine
-
wenda Public
Forked from wenda-LLM/wenda闻达:一个LLM调用平台。目标为针对特定环境的高效内容生成,同时考虑个人和中小企业的计算资源局限性,以及知识安全和私密性问题
JavaScript GNU Affero General Public License v3.0 UpdatedSep 27, 2024 -
Linly-Talker Public
Forked from Kedreamix/Linly-TalkerDigital Avatar Conversational System - Linly-Talker. 😄✨ Linly-Talker is an intelligent AI system that combines large language models (LLMs) with visual models to create a novel human-AI interaction…
Python MIT License UpdatedSep 27, 2024 -
llama3-Chinese-chat Public
Forked from CrazyBoyM/llama3-Chinese-chatLlama3、Llama3.1 中文仓库(随书籍撰写中... 各种网友及厂商微调、魔改版本有趣权重 & 训练、推理、评测、部署教程视频 & 文档)
Python UpdatedSep 16, 2024 -
-
ChatGPTX-Uni Public
实现一种多Lora权值集成切换+Zero-Finetune零微调增强的跨模型技术方案,LLM-Base+LLM-X+Alpaca,初期,LLM-Base为Chatglm6B底座模型,LLM-X是LLAMA增强模型。该方案简易高效,目标是使此类语言模型能够低能耗广泛部署,并最终在小模型的基座上发生“智能涌现”,力图最小计算代价达成ChatGPT、GPT4、ChatRWKV等人类友好亲和效果。当…
-
MiniRWKV-4 Public
实现Blip2RWKV+QFormer的多模态图文对话大模型,使用Two-Step Cognitive Psychology Prompt方法,仅3B参数的模型便能够出现类人因果思维链。对标MiniGPT-4,ImageBind等图文对话大语言模型,力求以更小的算力和资源实现更好的智能效果。
-
Dlip-RWKV Public
一种基于Clip改进的,通用HF格式的冻结LLM语言模型进行图文对齐的方案,以RWKV-4-World-0.4B的LLM模型为例,Cifar10为数据集。
-
HF-For-RWKVWorld-LoraAlpaca Public
将RWKV World/World-CHN系列模型由原生pth转为HF格式,并进行基于peft库的Lora增量微调+Alpaca全量微调。
-
HF-For-RWKVRaven-Alpaca Public
将RWKV Raven/Pile/PilePlus系列模型由原生pth转为HF格式,并进行Alpaca全量微调。
Python Apache License 2.0 UpdatedJul 17, 2023 -
RingRWKV Public
修复Transformer官方库中RWKV的适配问题,支持RWKV所有系列模型在转换后,通过RingRWKV库,与其他transfomer模型一样简单方便地部署和微调。
-
MiLu-GPT Public
麋鹿(MiLu),基于GPT2+BERT的语言模型,以少量的纯中文语料从头训练,验证小模型在ChatGPT类似友好能力
-
MultiModal-Next-Web Public
Forked from ChatGPTNextWeb/NextChat一键拥有你自己的跨平台 多模态上传文档+文本+语音ChatGPT 应用,支持PC/移动/平板等诸多平台。
TypeScript Other UpdatedJul 6, 2023