このライブラリは、様々な形式のテキストデータ(PDF、テキストファイル、文字列など)を入力とし、それを構造化されたMarkdown形式のテキストに変換するためのツールです。具体的には、入力テキストから目次(TOC)を自動生成し、その目次に基づいて本文を抽出し、整形します。
This library is a tool designed to transform text data from various formats (PDF, text files, strings, etc.) into structured Markdown text. Specifically, it automatically generates a Table of Contents (TOC) from the input text and then extracts and formats the main content based on that TOC.