carpedm20 · hoopinwhoopin · Jan 31, 2025 · Jan 31, 2025 · Jan 31, 2025 · Jan 31, 2025
diff --git a/emoji/tokenizer.py b/emoji/tokenizer.py
@@ -319,58 +319,13 @@ def get_search_tree() -> Dict[str, Any]:
     """
     Generate a search tree for demojize().
     Example of a search tree::
-
-        EMOJI_DATA =
-        {'a': {'en': ':Apple:'},
-        'b': {'en': ':Bus:'},
-        'ba': {'en': ':Bat:'},
-        'band': {'en': ':Beatles:'},
-        'bandit': {'en': ':Outlaw:'},
-        'bank': {'en': ':BankOfEngland:'},
-        'bb': {'en': ':BB-gun:'},
-        'c': {'en': ':Car:'}}
-
-        _SEARCH_TREE =
-        {'a': {'data': {'en': ':Apple:'}},
-        'b': {'a': {'data': {'en': ':Bat:'},
-                    'n': {'d': {'data': {'en': ':Beatles:'},
-                                'i': {'t': {'data': {'en': ':Outlaw:'}}}},
-                        'k': {'data': {'en': ':BankOfEngland:'}}}},
-            'b': {'data': {'en': ':BB-gun:'}},
-            'data': {'en': ':Bus:'}},
-        'c': {'data': {'en': ':Car:'}}}
-
-                   _SEARCH_TREE
-                 /     |        ⧵
-               /       |          ⧵
-            a          b             c
-            |        / |  ⧵          |
-            |       /  |    ⧵        |
-        :Apple:   ba  :Bus:  bb     :Car:
-                 /  ⧵         |
-                /    ⧵        |
-              :Bat:    ban     :BB-gun:
-                     /     ⧵
-                    /       ⧵
-                 band       bank
-                /   ⧵         |
-               /     ⧵        |
-            bandi :Beatles:  :BankOfEngland:
-               |
-            bandit
-               |
-           :Outlaw:
-
-
+        ...
     """
     if not _SEARCH_TREE:
-        for emj in unicode_codes.EMOJI_DATA:
+        for emj, data in unicode_codes.EMOJI_DATA.items():
             sub_tree = _SEARCH_TREE
-            lastidx = len(emj) - 1
-            for i, char in enumerate(emj):
-                if char not in sub_tree:
-                    sub_tree[char] = {}
-                sub_tree = sub_tree[char]
-                if i == lastidx:
-                    sub_tree['data'] = unicode_codes.EMOJI_DATA[emj]
+            for char in emj[:-1]:  # get all characters except the last one
+                sub_tree = sub_tree.setdefault(char, {})
+            # assign the data to the last character
+            sub_tree.setdefault(emj[-1], {})['data'] = data
     return _SEARCH_TREE