Skip to content

Commit

Permalink
Update docs
Browse files Browse the repository at this point in the history
  • Loading branch information
SWHL authored Nov 22, 2023
1 parent 2c6e556 commit 327d188
Showing 1 changed file with 17 additions and 0 deletions.
17 changes: 17 additions & 0 deletions content/docs/overview.md
Original file line number Diff line number Diff line change
Expand Up @@ -25,3 +25,20 @@ description: ""
该仓库是用来对文档中表格做结构化识别的推理库,包括来自PaddleOCR的表格结构识别算法模型、来自阿里读光有线和无线表格识别算法模型等。

该仓库将表格识别前后处理做了完善,并结合OCR,保证表格识别部分可用。

该仓库会持续关注表格识别这一领域,集成最新最好用的表格识别算法,争取打造最具有落地价值的表格识别工具库。

欢迎大家持续关注。

### 表格结构化识别
表格结构识别(Table Structure Recognition, TSR)旨在提取表格图像的逻辑或物理结构,从而将非结构化的表格图像转换为机器可读的格式。

逻辑结构:表示单元格的行/列关系(例如同行、同列)和单元格的跨度信息。

物理结构:不仅包含逻辑结构,还包含单元格的包围框、内容等信息,强调单元格的物理位置。

<div align='center'>
<img src="https://github.com/RapidAI/TableStructureRec/releases/download/v0.0.0/TSRFramework.jpg" width=70%>
</div>

图来自: [Improving Table Structure Recognition with Visual-Alignment Sequential Coordinate Modeling](https://openaccess.thecvf.com/content/CVPR2023/html/Huang_Improving_Table_Structure_Recognition_With_Visual-Alignment_Sequential_Coordinate_Modeling_CVPR_2023_paper.html)

0 comments on commit 327d188

Please sign in to comment.