pytorch_version

Sanchez2020

Jun 1, 2020

c1b4539 · Jun 1, 2020

This branch is 5 commits behind CLUEbenchmark/CLUENER2020:master.

Name	Name	Last commit message	Last commit date
parent directory ..
CLUEdatasets/cluener	CLUEdatasets/cluener	add file	Jan 11, 2020
callback	callback	加速crf层解码速度	Apr 26, 2020
datasets/cluener	datasets/cluener	加速crf层解码速度	Apr 26, 2020
losses	losses	加速crf层解码速度	Apr 26, 2020
metrics	metrics	加速crf层解码速度	Apr 26, 2020
models	models	加速crf层解码速度	Apr 26, 2020
outputs	outputs	加速crf层解码速度	Apr 26, 2020
prev_trained_model/bert-base	prev_trained_model/bert-base	加速crf层解码速度	Apr 26, 2020
processors	processors	加速crf层解码速度	Apr 26, 2020
scripts	scripts	Update run_ner_crf.sh	Jun 1, 2020
tools	tools	加速crf层解码速度	Apr 26, 2020
README.md	README.md	加速crf层解码速度	Apr 26, 2020
__init__.py	__init__.py	加速crf层解码速度	Apr 26, 2020
run_ner_crf.py	run_ner_crf.py	加速crf层解码速度	Apr 26, 2020
run_ner_crf.sh	run_ner_crf.sh	add pytorch version	Jan 11, 2020
run_ner_softmax.py	run_ner_softmax.py	add pytorch version	Jan 11, 2020
run_ner_softmax.sh	run_ner_softmax.sh	add pytorch version	Jan 11, 2020
run_ner_span.py	run_ner_span.py	add pytorch version	Jan 11, 2020
run_ner_span.sh	run_ner_span.sh	add pytorch version	Jan 11, 2020

README.md

数据介绍

数据详细描述: https://www.cluebenchmarks.com/introduce.html

运行方式

下载CLUE_NER数据集，运行以下命令：

python tools/download_clue_data.py --data_dir=./datasets --tasks=cluener

预训练模型文件格式，比如:

├── prev_trained_model　# 预训练模型
|  └── bert-base
|  | └── vocab.txt
|  | └── config.json
|  | └── pytorch_model.bin

训练：

直接执行对应shell脚本，如：

sh scripts/run_ner_crf.sh

预测

当前默认使用最后一个checkpoint模型作为预测模型，你也可以指定--predict_checkpoints参数进行对应的checkpoint进行预测，比如：

CURRENT_DIR=`pwd`
export BERT_BASE_DIR=$CURRENT_DIR/prev_trained_model/bert-base
export CLUE_DIR=$CURRENT_DIR/datasets
export OUTPUR_DIR=$CURRENT_DIR/outputs
TASK_NAME="cluener"

python run_ner_span.py \
  --model_type=bert \
  --model_name_or_path=$BERT_BASE_DIR \
  --task_name=$TASK_NAME \
  --do_predict \
  --predict_checkpoints=100 \
  --do_lower_case \
　...

模型列表

model_type目前支持bert和albert

注意: bert ernie bert_wwm bert_wwwm_ext等模型只是权重不一样，而模型本身主体一样，因此参数model_type=bert其余同理。

结果

在dev上为F1分数为0.8076

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Files

pytorch_version

pytorch_version

README.md

数据介绍

运行方式

模型列表

结果

Files

pytorch_version

Directory actions

More options

Directory actions

More options

Latest commit

History

pytorch_version

Folders and files

parent directory

README.md

数据介绍

运行方式

模型列表

结果