김성민 | 박지민 | 박진형 | 심세령 | 윤하정 |
---|---|---|---|---|
- 편집 툴에 영상을 넣고 "Send Current Frame" 버튼을 눌러주면 선택한 프레임 속 텍스트를 자동번역 해주는 프로그램
- 모델이 구한 글자와 배경색을 같이 계산하여 최대한 영상에 자연스럽게 적용될 수 있도록 결과를 출력
- 번역된 자막을 원하는 내용만 선택 적용할 수 있어 영상 편집 시 유용하게 사용할 수 있음
- 효율적인 배포를 위해 Github Action과 Docker를 사용하여 CI/CD를 진행
- 영상 편집이라는 상황에 맞게 inference가 빠르고 가벼운 모델 선정
종류 | 모델 |
---|---|
Detector | EAST |
Recognizer | CRNN or R-Net |
데이터셋 | |
---|---|
Train dataset | ICDAR 2015 & ICDAR2017 |
Test dataset | ICDAR_2017_valid |
- 기능
- 이미지 POST
- OCR Model Inference
- Get background & word color
- Text Translate with Papago
- CI & CD
- Github Action과 Docker사용
- CI & CD 결과를 즉각적으로 알 수 있게 Slack으로 결과 전송
- base Docker Image 생성하여 재배포 시간 30초 이내 시행
├──models # model & trainer
| ├──configs
| ├──modules # crnn & rnet
| ├──config.json
| ├──eval.py
| └──train.py
├──openshot-qt # front OpenShot Video Editor
| ├──doc
| ├──images
| ├──installer
| ├──xdg
| └──src
├──server # fastAPI server
| ├──modules
| ├──saved/new
| ├──scripts
| └──server
└──.github/workflows
Install packages : pip install -r requirements.txt