CBLUEbenchmark_NER

本仓库为基于CBLUEbenchmark/CBLUE更改的，对CMeEE-V2数据集进行命名实体识别（NER）任务的代码。更改主要体现在：

更换数据集：只保留了对CMeEE数据集进行NER任务的代码，并改为处理CMeEE-V2数据集。
传参方式：为了便于调试run_classifier.py时不传参，直接写了参数的默认值。并将do_train与do_predict的传参逻辑进行了调整。
目录结构：调整了run_classifier.py文件的位置和data目录的位置。

目录结构

├─CBLUEbenchmark_NER
│  │  .gitignore
│  │  README.md
│  │  run_classifier.py
│  │  run_ee.sh
│  ├─cblue
│  └─CBLUEDatasets
│      └─CMeEE-V2 
├─data
│  ├─model_data
│  │  └─chinese-wwm-ext-pytorch
│  │          config.json
│  │          pytorch_model.bin
│  │          vocab.txt
│  ├─output
│  └─result_output

运行环境

python3 / pytorch 1.7 / transformers 4.5.1 / jieba / gensim / sklearn

运行样例

在准备好所需环境、预训练模型和语料数据集后，调整参数并运行run_classifier.py即可：

方式1，不传参，使用默认参数：直接运行run_classifier.py。默认训练、不预测。
方式2，传参，覆盖默认参数：在Linux环境下，修改run_ee.sh中的参数。运行bash run_ee.sh训练，或bash run_ee.sh predict预测。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

CBLUEbenchmark_NER

目录结构

运行环境

运行样例

About

Uh oh!

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 90 Commits
cblue		cblue
.gitignore		.gitignore
README.md		README.md
run_classifier.py		run_classifier.py
run_ee.sh		run_ee.sh

Esirn/CBLUEbenchmark_NER

Folders and files

Latest commit

History

Repository files navigation

CBLUEbenchmark_NER

目录结构

运行环境

运行样例

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages