Hướng dẫn sử dụng PaddleOCR

0. Cài đặt môi trường

Load Docker Image (trttung1610/bkai_paddle:latest)

cd PaddleOCR 
pip install -r requirements.txt

1. Chuẩn bị data

Chuân bị data như sau vào thư mục PaddleOCR/:

train.txt, val.txt có dạng sau: img_path <tab> text_label

img/im3671.jpg_box0.jpg	Trà
img/im3671.jpg_box1.jpg	m
img/im3671.jpg_box2.jpg	ĐC:
img/im3671.jpg_box3.jpg	K

Tại đậy , đội sẽ chia bộ new_train được BTC cung cấp với tỉ lệ là train : 0.95 , val : 0.05

2. Train model

2.1 Train

ABInet :

sh scripts/train_ABInet.sh

SVTR :

sh scripts/train_SVTR.sh

2.2 Export model

Weight được cung cấp đã được chọn là ckpt để dự đoán :

ABInet : epoch thứ 10
SVTR : epoch thứ 82

Vì vậy ckpt của của 2 mô hình trên sẽ được chọn để xuất ra phục vụ việc dự đoán :

ABInet :

sh scripts/export_ABInet.sh

-SVTR :

sh scripts/export_SVTR.sh

Kết quả được xuất ra tại thư mục {tên mô hình} / Inference

3. Predict model

3.1. Predict with CLI

ABInet :

sh scripts/pred_ABInet.sh

SVTR :

sh scripts/pred_SVTR.sh

3.2. Format

Sau khi có file 2 prediction_log.txt từ 2 mô hình , file dự đoán sẽ được đưa qua mytools/paddle2txt.py để lấy kết quả dự đoán và sau đó file prediction_log.txt của mỗi mô hình

python mytools/paddle2txt.py --input prediction_log.txt --ouput prediction.txt

python mytools/format_pred.py prediction.txt predictions/{tên mô hình}/prediction.txt

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
PPOCRLabel		PPOCRLabel
StyleText		StyleText
applications		applications
benchmark		benchmark
configs		configs
deploy		deploy
doc		doc
mytools		mytools
ppocr		ppocr
ppstructure		ppstructure
scripts		scripts
test_tipc		test_tipc
tools		tools
.gitignore		.gitignore
.pre-commit-config.yaml		.pre-commit-config.yaml
.style.yapf		.style.yapf
LICENSE		LICENSE
MANIFEST.in		MANIFEST.in
README.md		README.md
__init__.py		__init__.py
paddleocr.py		paddleocr.py
requirements.txt		requirements.txt
setup.py		setup.py
train.sh		train.sh
vi_vietnam.txt		vi_vietnam.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Hướng dẫn sử dụng PaddleOCR

0. Cài đặt môi trường

1. Chuẩn bị data

2. Train model

2.1 Train

2.2 Export model

3. Predict model

3.1. Predict with CLI

3.2. Format

About

Releases

Packages

Languages

License

trttungdev/Paddle-Vietnamese

Folders and files

Latest commit

History

Repository files navigation

Hướng dẫn sử dụng PaddleOCR

0. Cài đặt môi trường

1. Chuẩn bị data

2. Train model

2.1 Train

2.2 Export model

3. Predict model

3.1. Predict with CLI

3.2. Format

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages