worder.py

#coding:utf-8
import regex as re
import codecs
import string
import importlib


def get_occurences(alphabet):
    uniques = set(alphabet)
    occurences = {}
    for unique in uniques:
        occurences[unique] = len(re.findall(unique, alphabet))
    return occurences


def get_limited(alphabet, words):
    occurences = get_occurences(alphabet)
    banned = []
    for word in words:
        for char, occurence in occurences.items():
            if len(re.findall(char, word)) > occurence:
                banned.append(word)
    return words - set(banned)


def search(alphabet, language, regex='', wildcards=0):
    settings = importlib.import_module('settings.settings_%s' % language)
    regex_set = ''.join(filter(lambda x: x in string.ascii_lowercase, regex))
    alphabet += regex_set
    matcher = re.compile(
        '(?e)([' + alphabet + ']{2,}){s<=%s}$' % wildcards, re.I).match
    words = set(word.replace('\n', '')
                for word in codecs.open('data/%s.txt' % language, 'r', 'utf-8')
                if matcher(word))
    calculated = []
    for word in get_limited(alphabet, words):
        if re.match(r'%s' % regex, word):
            calculated.append(
                (word, sum([settings.CHAR_POINTS[char] for char in word])))

    return sorted(calculated, key=lambda x: x[1], reverse=True)


if __name__ == '__main__':
    alphabet = input('Enter letters: ')
    language = input('Enter language (en):') or 'en'
    regex = input('Enter regex (optional):')
    wildcards = len(re.findall('\*', alphabet))
    alphabet = alphabet.replace('*', '')

    for word in search(alphabet, language, regex, wildcards):
        print(f'{word[0]} - {word[1]} points')