10000 GitHub - ciallothu/LaWGPT: 🎉 Repo for LaWGPT, Chinese-Llama tuned with Chinese Legal knowledge. 基于中文法律知识的大语言模型
[go: up one dir, main page]
More Web Proxy on the site http://driver.im/
Skip to content

🎉 Repo for LaWGPT, Chinese-Llama tuned with Chinese Legal knowledge. 基于中文法律知识的大语言模型

License

Notifications You must be signed in to change notification settings

ciallothu/LaWGPT

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

47 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

LaWGPT:基于中文法律知识的大语言模型

LaWGPT 是一系列基于中文法律知识的开æºå¤§è¯­è¨€æ¨¡åž‹ã€‚

该系列模型在通用中文基座模型(如 Chinese-LLaMAã€ChatGLM 等)的基础上扩充法律领域专有è¯è¡¨ã€å¤§è§„模中文法律语料预训练,增强了大模型在法律领域的基础语义ç†è§£èƒ½åŠ›ã€‚åœ¨æ­¤åŸºç¡€ä¸Šï¼Œæž„é€ æ³•å¾‹é¢†åŸŸå¯¹è¯é—®ç­”æ•°æ®é›†ã€ä¸­å›½å¸æ³•考试数æ®é›†è¿›è¡ŒæŒ‡ä»¤ç²¾è°ƒï¼Œæå‡äº†æ¨¡åž‹å¯¹æ³•律内容的ç†è§£å’Œæ‰§è¡Œèƒ½åŠ›ã€‚

详细内容请å‚考技术报告。


本项目æŒç»­å¼€å±•,法律领域数æ®é›†åŠç³»åˆ—模型åŽç»­ç›¸ç»§å¼€æºï¼Œæ•¬è¯·å…³æ³¨ã€‚

æ›´æ–°

  • 🌟 2023/05/30:公开å‘布

    • LaWGPT-7B-beta1.1ï¼šæ³•å¾‹å¯¹è¯æ¨¡åž‹ï¼Œæž„造 35w é«˜è´¨é‡æ³•律问答数æ®é›†åŸºäºŽ Chinese-alpaca-plus-7B 指令精调
  • 📣 2023/05/26:开放 Discussions 讨论区,欢迎朋å‹ä»¬äº¤æµæŽ¢è®¨ã€æå‡ºæ„è§ã€åˆ†äº«è§‚点ï¼

  • ðŸ› ï¸ 2023/05/22:项目主分支结构调整,详è§é¡¹ç›®ç»“构;支æŒå‘½ä»¤è¡Œæ‰¹é‡æŽ¨ç†

  • 🪴 2023/05/15:å‘布 ä¸­æ–‡æ³•å¾‹æ•°æ®æºæ±‡æ€»ï¼ˆAwesome Chinese Legal Resources) å’Œ 法律领域è¯è¡¨

  • 🌟 2023/05/13:公开å‘布

    • Legal-Base-7B:法律基座模型,使用 50w 中文è£åˆ¤æ–‡ä¹¦æ•°æ®äºŒæ¬¡é¢„训练

    • LaWGPT-7B-beta1.0ï¼šæ³•å¾‹å¯¹è¯æ¨¡åž‹ï¼Œæž„造 30w é«˜è´¨é‡æ³•律问答数æ®é›†åŸºäºŽ Legal-Base-7B 指令精调

  • 🌟 2023/04/12:内部测试

    • LaWGPT-7B-alpha:在 Chinese-LLaMA-7B 的基础上直接构造 30w 法律问答数æ®é›†æŒ‡ä»¤ç²¾è°ƒ

快速开始

  1. 准备代ç ï¼Œåˆ›å»ºçŽ¯å¢ƒ

    # 下载代ç 
    git clone git@github.com:pengxiao-song/LaWGPT.git
    cd LaWGPT
    
    # 创建环境
    conda create -n lawgpt python=3.10 -y
    conda activate lawgpt
    pip install -r requirements.txt
  2. å¯åЍ web ui(å¯é€‰ï¼Œæ˜“äºŽè°ƒèŠ‚å‚æ•°ï¼‰

    • 首先,执行æœåŠ¡å¯åŠ¨è„šæœ¬ï¼šbash scripts/webui.sh

    • 其次,访问 http://127.0.0.1:7860 :

  3. 命令行推ç†ï¼ˆå¯é€‰ï¼Œæ”¯æŒæ‰¹é‡æµ‹è¯•)

    • 首先,å‚考 resources/example_infer_data.json 文件内容构造测试样本集;

    • 其次,执行推ç†è„šæœ¬ï¼šbash scripts/infer.sh。其中 --infer_data_path 傿•°ä¸ºæµ‹è¯•样本集路径,如果为空或者路径出错,则以交互模å¼è¿è¡Œã€‚

注æ„,以上步骤的默认模型为 LaWGPT-7B-alpha ,如果您想使用 LaWGPT-7B-beta1.0 模型:

  • 由于 LLaMA å’Œ Chinese-LLaMA 凿œªå¼€æºæ¨¡åž‹æƒé‡ã€‚æ ¹æ®ç›¸åº”å¼€æºè®¸å¯ï¼Œæœ¬é¡¹ç›®åªèƒ½å‘布 LoRA æƒé‡ï¼Œæ— æ³•å‘布完整的模型æƒé‡ï¼Œè¯·å„ä½è°…解。

  • 本项目给出åˆå¹¶æ–¹å¼ï¼Œè¯·å„ä½èŽ·å–原版æƒé‡åŽè‡ªè¡Œé‡æž„模型。

项目结构

LaWGPT
├── assets    # 陿€èµ„æº
├── resources # 项目资æº
├── models    # åŸºåº§æ¨¡åž‹åŠ lora æƒé‡
│   ├── base_models
│   └── lora_weights
├── outputs   # 指令微调的输出æƒé‡
├── data      # 实验数æ®
├── scripts   # 脚本目录
│   ├── finetune.sh # 指令微调脚本
│   â””â
9E76
”€â”€ webui.sh    # å¯åЍæœåŠ¡è„šæœ¬
├── templates # prompt 模æ¿
├── tools     # 工具包
├── utils
├── train_clm.py  # 二次训练
├── finetune.py   # 指令微调
├── webui.py      # å¯åЍæœåŠ¡
├── README.md
└── requirements.txt

æ•°æ®æž„建

本项目基于中文è£åˆ¤æ–‡ä¹¦ç½‘公开法律文书数æ®ã€å¸æ³•考试数æ®ç­‰æ•°æ®é›†å±•开,详情å‚è€ƒä¸­æ–‡æ³•å¾‹æ•°æ®æºæ±‡æ€»ï¼ˆAwesome Chinese Legal Resources)。

  1. åˆçº§æ•°æ®ç”Ÿæˆï¼šæ ¹æ® Stanford_alpaca å’Œ self-instruct æ–¹å¼ç”Ÿæˆå¯¹è¯é—®ç­”æ•°æ®
  2. 知识引导的数æ®ç”Ÿæˆï¼šé€šè¿‡ Knowledge-based Self-Instruct æ–¹å¼åŸºäºŽä¸­æ–‡æ³•å¾‹ç»“æž„åŒ–çŸ¥è¯†ç”Ÿæˆæ•°æ®ã€‚
  3. 引入 ChatGPT 清洗数æ®ï¼Œè¾…åŠ©æž„é€ é«˜è´¨é‡æ•°æ®é›†ã€‚

模型训练

LawGPT 系列模型的训练过程分为两个阶段:

  1. 第一阶段:扩充法律领域è¯è¡¨ï¼Œåœ¨å¤§è§„æ¨¡æ³•å¾‹æ–‡ä¹¦åŠæ³•典数æ®ä¸Šé¢„训练 Chinese-LLaMA
  2. 第二阶段:构造法律领域对è¯é—®ç­”æ•°æ®é›†ï¼Œåœ¨é¢„训练模型基础上指令精调

二次训练æµç¨‹

  1. å‚考 resources/example_instruction_train.json 构造二次训练数æ®é›†
  2. è¿è¡Œ scripts/train_clm.sh

指令精调步骤

  1. å‚考 resources/example_instruction_tune.json 构造指令微调数æ®é›†
  2. è¿è¡Œ scripts/finetune.sh

计算资æº

8 张 Tesla V100-SXM2-32GB :二次训练阶段耗时约 24h / epoch,微调阶段耗时约 12h / epoch

模型评估

输出示例

问题:酒驾撞人怎么判刑?

问题:请给出判决æ„è§ã€‚

问题:请介ç»èµŒåšç½ªçš„定义。

问题:请问加ç­å·¥èµ„怎么算?

问题:民间借贷å—å›½å®¶ä¿æŠ¤çš„åˆæ³•åˆ©æ¯æ˜¯å¤šå°‘?

问题:欠了信用å¡çš„钱还ä¸ä¸Šè¦å牢å—?

问题:你能å¦å†™ä¸€æ®µæŠ¢åŠ«ç½ªç½ªå的案情æè¿°ï¼Ÿ

局陿€§

由于计算资æºã€æ•°æ®è§„模等因素é™åˆ¶ï¼Œå½“å‰é˜¶æ®µ LawGPT å­˜åœ¨è¯¸å¤šå±€é™æ€§ï¼š

  1. æ•°æ®èµ„æºæœ‰é™ã€æ¨¡åž‹å®¹é‡è¾ƒå°ï¼Œå¯¼è‡´å…¶ç›¸å¯¹è¾ƒå¼±çš„æ¨¡åž‹è®°å¿†å’Œè¯­è¨€èƒ½åŠ›ã€‚å› æ­¤ï¼Œåœ¨é¢å¯¹äº‹å®žæ€§çŸ¥è¯†ä»»åŠ¡æ—¶ï¼Œå¯èƒ½ä¼šç”Ÿæˆä¸æ­£ç¡®çš„结果。
  2. 该系列模型åªè¿›è¡Œäº†åˆæ­¥çš„人类æ„图对é½ã€‚因此,å¯èƒ½äº§ç”Ÿä¸å¯é¢„测的有害内容以åŠä¸ç¬¦åˆäººç±»å好和价值观的内容。
  3. 自我认知能力存在问题,中文ç†è§£èƒ½åŠ›æœ‰å¾…å¢žå¼ºã€‚

请诸å›åœ¨ä½¿ç”¨å‰äº†è§£ä¸Šè¿°é—®é¢˜ï¼Œä»¥å…造æˆè¯¯è§£å’Œä¸å¿…è¦çš„麻烦。

å作者

如下å„ä½åˆä½œå¼€å±•(按字æ¯åºæŽ’列):@cainiaoã€@njuyxwã€@pengxiao-song

å…责声明

请å„ä½ä¸¥æ ¼éµå®ˆå¦‚下约定:

  1. 本项目任何资æºä»…供学术研究使用,严ç¦ä»»ä½•商业用途。
  2. 模型输出å—多ç§ä¸ç¡®å®šæ€§å› ç´ å½±å“ï¼Œæœ¬é¡¹ç›®å½“å‰æ— æ³•ä¿è¯å…¶å‡†ç¡®æ€§ï¼Œä¸¥ç¦ç”¨äºŽçœŸå®žæ³•律场景。
  3. æœ¬é¡¹ç›®ä¸æ‰¿æ‹…任何法律责任,亦ä¸å¯¹å› ä½¿ç”¨ç›¸å…³èµ„æºå’Œè¾“出结果而å¯èƒ½äº§ç”Ÿçš„任何æŸå¤±æ‰¿æ‹…责任。

问题å馈

如有问题,请在 GitHub Issue 中æäº¤ã€‚

  • æäº¤é—®é¢˜ä¹‹å‰ï¼Œå»ºè®®æŸ¥é˜… FAQ åŠä»¥å¾€çš„ issue 看是å¦èƒ½è§£å†³æ‚¨çš„问题。
  • 请礼貌讨论,构建和è°ç¤¾åŒºã€‚

å作者科研之余推进项目进展,由于人力有é™éš¾ä»¥å®žæ—¶å馈,给诸å›å¸¦æ¥ä¸ä¾¿ï¼Œæ•¬è¯·è°…è§£ï¼

致谢

本项目基于如下开æºé¡¹ç›®å±•开,在此对相关项目和开å‘人员表示诚挚的感谢:

此外,本项目基于开放数æ®èµ„æºï¼Œè¯¦è§ Awesome Chinese Legal Resources,一并表示感谢。

引用

如果您觉得我们的工作对您有所帮助,请考虑引用该项目

About

🎉 Repo for LaWGPT, Chinese-Llama tuned with Chinese Legal knowledge. 基于中文法律知识的大语言模型

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 93.2%
  • Shell 6.8%
0