このライブラリは複数のテキストを渡すことで自動でパターンを検出し出力してくれるコードです。
パターンを検出するテキストを多く入れ過ぎると処理に時間がかかるときがあります。
また、run
関数を実行すると正規表現が返されますが、MeCabの使用上スペースなどは除去されます。
よって、同じパターンかどうか確認するときは 必ずis_true
関数を使用 してください。
使い方
from RegexGeneratorJa.generator import run,is_true
#パターンを検出するためのテキストは3つぐらいがオススメ
texts = ["a testだあああああああ!!!asfdaa testだあああああああ!!! ","a testだあああああああ!!!barbhah ethbe testだあああああああ!!!","a testだあああああああ!!!agfnl testだあああああああ!!!"]
#パターンを取得する
pattern = run(texts)
#同じパターンかチェックする
check = is_true("a testだあああああああ!!!asfdaasdaedea testだあああああああ!!! ",pattern=pattern)
print(check)