English version is here.
これは軽量な LLM を利用して danbooru タグを生成/補完することで、プロンプトをアップサンプルすることができる Stable Diffusion WebUI 向けの拡張機能です。
長いプロンプトを考えたくない場合や、何も考えないで多様かつ自然で高品質な画像を見ていたいという場合に便利です。
- 2024/2/29: v0.2.0。新機能: 生成オプション、多様性レベル、範囲禁止タグの実装。
- 2024/2/25: v0.1.1。シード値の処理、括弧のエスケープ処理、軽微な不具合が修正されました。
- 2024/2/23: 最初のバージョンである v0.1.0 をリリースしました
Danbooru Tags Upsampler
と書かれたアコーディオンを開き、Enabled
チェックボックスにチェックをいれることで拡張機能を有効化できます。
パラメーターの説明:
パラメーター名 | 説明 | 例 |
---|---|---|
Total tag length | これは タグの補完後のプロンプト内のタグの総量を指定します。 補完するタグの量ではありません。 very short は「タグ10個以下」, short は「タグ20個以下」, long は「タグ40個以下」、 very long は「それよりも多い」を意味します。 |
推奨は long です |
Ban tags | ここで指定された全てのタグは補完時に出現しなくなります。出てきて欲しくないタグがあるときに便利です。* は全ての文字列にマッチします。(例: * background は simple background 、white background 等にマッチします) |
official alternate costume, english text, * background, ... |
Seed for upsampling tags | この値とポジティブプロンプトが固定された場合、補完されるタグも固定されます。-1 は毎回ことなるシードで補完することを意味します。 |
毎回異なる補完をしてほしい場合は -1 に設定します。 |
Upsampling timing | sd-dynamic-prompts や webui の styles 機能などの、他のプロンプト加工処理が実行される前にアップサンプルするか、後にアップサンプルするかどうかです。 | After applying other prompt processing |
Variety level | このパラメーターは Generation config のプリセットです。アップサンプルされるタグの多様度を指定できます。 |
varied |
Generation config | タグの生成に利用される LLM のパラメーターです。言語モデルの生成パラメーターに詳しくない場合は触らず、 Variety level を使うことをおすすめします。 |
生成設定:
- モデル: AnimagineXL 3.0
- ネガティブプロンプト (animaginexl 3.0 公式の推奨設定と同じ):
nsfw, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, artist name
アップサンプル設定:
- Total tag length:
long
- Ban tags: 指定なし
- Seed:
-1
- When to perform the process:
Before applying styles
(シードは同じではないです。)
入力プロンプト | Very unvaried | Unvaried | Normal | Varied | Very varied |
1girl, solo, from side | |||||
1girl, frieren, sousou no frieren, | |||||
no humans, scenery |
Very unvaried
, Unvaried
は多様性が低いことを意味しますが、同時に入力プロンプトに忠実であり、比較的無難なタグを生成します。また、Very varied
, Varied
はより多様なタグが生成されますが、入力プロンプトに従わなかったり不自然な生成になったりしやすくなります。
この拡張機能では次のモデルを使用しています:
p1atdev/dart-v1-sft
: 🤗 HuggingFace
🤗 Space 上にデモがあるのでインストール不要で試すことができます:
デモ: https://huggingface.co/spaces/p1atdev/danbooru-tags-transformer
[webui のルート]/ui-config.json
を開き、customscript/dart_upsampler.py/
で始まるパラメーターを探して編集してください。
もしデフォルト値が壊れていると感じたら、それらのパラメータを削除することでデフォルト値をリセットできます。
このプロジェクトは以下のプロジェクトや研究の影響を受けています。 これらのプロジェクトの開発者および貢献者に敬意と感謝の意を表します:
- succinctly/text2image-prompt-generator: https://huggingface.co/succinctly/text2image-prompt-generator
- Gustavosta/MagicPrompt-Stable-Diffusion: https://huggingface.co/Gustavosta/MagicPrompt-Stable-Diffusion
- FredZhang7/anime-anything-promptgen-v2: https://huggingface.co/FredZhang7/anime-anything-promptgen-v2
- sd-dynamic-prompts: https://github.com/adieyal/sd-dynamic-prompts
- DALL-E 3: https://cdn.openai.com/papers/dall-e-3.pdf
- caption-upsampling: https://github.com/sayakpaul/caption-upsampling
- StableDiffusionWebUI: https://github.com/AUTOMATIC1111/stable-diffusion-webui とその派生物