- Hugging Face – библиотека предобученных моделей на базе архитектуры «трансформер»
- pymorphy2 – морфологический анализатор для русского языка на основе словаря OpenCorpora
- youtokentome: инструмент для быстрой токенизации текста от команды ВК
- ruGPT-3 – вариант Сбербанка (статья на Хабре о процессе обучения)
- gensim библиотека обработки естественного языка предназначения для «тематического моделирования»
- NLTK – пакет библиотек и программ для символьной и статистической обработки естественного языка (вики)
- deepPavlov – фреймворк для разговорных систем
- spaCy, spacy-ru – репозиторий моделей spaCy для русского языка
- thinc – легкая библиотека глубокого обучения c API функционального программирования с проверкой типов для создания моделей с поддержкой слоев, определенных в других средах, таких как PyTorch, TensorFlow и MXNet
- fastText