以下のような環境で動作させることを前提とする。
- Windows 10 バージョン1803以降
- Windows Subsystem for Linux
- Ubuntu 18.04 LTS
単体の Ubuntu や他の Linux デストリビューションでも同様の手順で動作する。
ビルド済みの Sudachi ファイルと、ビルド済みの Sudachi 辞書ファイルがあるので、それをダウンロードし、組み合わせて実行する。
- リリースページに行く
- 最新のビルド済みファイル(ここでは
sudachi-0.7.3-executable.zip
)をダウンロード - 展開
- ダウンロードした zip ファイルを右クリックし、
すべて展開
をクリック
- ダウンロードした zip ファイルを右クリックし、
- リリースページに行く
- 最新のビルド済み辞書(ここでは
sudachi-dictionary-20240409-core.zip
)をダウンロード- ここで full, core, small は、それぞれ辞書サイズが大、中、小であることを示している。
- 展開
- ダウンロードした zip ファイルを右クリックし、
すべて展開
をクリック
- ダウンロードした zip ファイルを右クリックし、
- ステップ2 で展開したファイルの中の、辞書ファイル(
system_core.dic
)をステップ1 で展開したフォルダ(sudachi-0.7.3-executable\
の下)に移動
移動
> cd sudachi-0.7.3-executable\
実行
sudachi-0.7.3-executable>java -jar sudachi-0.7.3.jar
国会議事堂
国会議事堂 名詞,固有名詞,一般,*,*,* 国会議事堂
EOS
または以下でも可
sudachi-0.7.3-executable>echo 国会議事堂| java -jar sudachi-0.7.3.jar
国会議事堂 名詞,固有名詞,一般,*,*,* 国会議事堂
EOS
- リリースページに行く
- 最新のビルド済みファイル(ここでは
sudachi-0.7.3-executable.zip
)をダウンロード - 展開
$ unzip sudachi-0.7.3-executable.zip
- リリースページに行く
- 最新のビルド済み辞書(ここでは
sudachi-dictionary-20240409-core.zip
)をダウンロード- ここで full, core, small は、それぞれ辞書サイズが大、中、小であることを示している。
- 展開
$ unzip sudachi-dictionary-20240409-core.zip
- ステップ2で展開したファイルの中の、辞書ファイル(
system_core.dic
)をステップ1で展開したフォルダ($PWD
の下)に移動$ mv sudachi-dictionary-20240409/system_core.dic ./
実行
$ java -jar sudachi-0.7.3.jar
国会議事堂
国会議事堂 名詞,固有名詞,一般,*,*,* 国会議事堂
EOS
または以下でも可
$ echo 国会議事堂 | java -jar sudachi-0.7.3.jar
国会議事堂 名詞,固有名詞,一般,*,*,* 国会議事堂
EOS
$ git clone https://github.com/WorksApplications/Sudachi
$ cd Sudachi/
ビルド
$ ./gradlew build
配布用アーカイブの展開
$ unzip build/distributions/sudachi-executable-0.7.4.zip -d ./target
# もしくは
$ mkdir ./target
$ tar -xf build/distributions/sudachi-executable-0.7.4.tar --directory ./target
この時点で実行すると、辞書がないという以下のエラーが発生する。
$ java -jar target/sudachi-0.7.4.jar
Exception in thread "main" java.lang.IllegalArgumentException: Failed to resolve file: system_core.dic
Tried roots: [Classpath{prefix=}, None{}]
at com.worksap.nlp.sudachi.Config$Resource$NotFound.makeException(Config.java:1060)
at com.worksap.nlp.sudachi.Config$Resource$NotFound.consume(Config.java:1040)
at com.worksap.nlp.sudachi.dictionary.BinaryDictionary.loadSystem(BinaryDictionary.java:85)
at com.worksap.nlp.sudachi.JapaneseDictionary.setupSystemDictionary(JapaneseDictionary.java:78)
at com.worksap.nlp.sudachi.JapaneseDictionary.<init>(JapaneseDictionary.java:44)
at com.worksap.nlp.sudachi.DictionaryFactory.create(DictionaryFactory.java:52)
at com.worksap.nlp.sudachi.SudachiCommandLine.main(SudachiCommandLine.java:294)
core 辞書をダウンロードし、実行ディレクトリに配置
http://sudachi.s3-website-ap-northeast-1.amazonaws.com/sudachidict/
$ ls
... system_core.dic ...
実行
$ java -jar target/sudachi-0.7.4.jar
国会議事堂
国会議事堂 名詞,固有名詞,一般,*,*,* 国会議事堂
EOS