From 6ad8ca9fe2419f8de5687e453cc6c49dcc2f95a5 Mon Sep 17 00:00:00 2001 From: xxyzz Date: Mon, 28 Oct 2024 16:56:15 +0800 Subject: [PATCH] [nl] translate some tag templates in "Categorie:Lemmasjablonen" --- src/wiktextract/extractor/nl/pos.py | 5 --- src/wiktextract/extractor/nl/tags.py | 54 ++++++++++++++++++++++++---- 2 files changed, 48 insertions(+), 11 deletions(-) diff --git a/src/wiktextract/extractor/nl/pos.py b/src/wiktextract/extractor/nl/pos.py index 726ccd9e2..c16de7472 100644 --- a/src/wiktextract/extractor/nl/pos.py +++ b/src/wiktextract/extractor/nl/pos.py @@ -118,11 +118,6 @@ def extract_pos_section_nodes( ) -# https://nl.wiktionary.org/wiki/Categorie:Lemmasjablonen -# https://nl.wiktionary.org/wiki/Categorie:Werkwoordsjablonen -GLOSS_TAG_TEMPLATES = frozenset(["auxl", "erga", "inerg"]) - - def extract_gloss_list_item( wxr: WiktextractContext, word_entry: WordEntry, list_item: WikiNode ) -> None: diff --git a/src/wiktextract/extractor/nl/tags.py b/src/wiktextract/extractor/nl/tags.py index 8a6a2978d..fbc1f118b 100644 --- a/src/wiktextract/extractor/nl/tags.py +++ b/src/wiktextract/extractor/nl/tags.py @@ -1,12 +1,32 @@ from .models import WordEntry +# https://nl.wiktionary.org/wiki/Categorie:Lemmasjablonen # https://nl.wiktionary.org/wiki/Categorie:Werkwoordsjablonen -VERB_TAGS = { - "ergatief": "ergative", # Sjabloon:erga - "inergatief": "unergative", # Sjabloon:inerg - "hulpwerkwoord": "auxiliary", # Sjabloon:auxl -} +GLOSS_TAG_TEMPLATES = frozenset( + [ + "absol", + "accus", + "auxl", + "copl", + "deponens", + "ditr", + "erga", + "inerg", + "intr", + "modl", + "onpr", + "ov", + "rcpq", + "refl", + "s-verb", + "plurt", + "singt", + "versterkend voorvoegsel", + ] +) + +# https://nl.wiktionary.org/wiki/Categorie:Werkwoordsjablonen # https://nl.wiktionary.org/wiki/Categorie:WikiWoordenboek:Contextlabels GLOSS_TAGS = { "figuurlijk": "figuratively", @@ -55,6 +75,23 @@ "zegswijze": "idiomatic", "zeldzaam": "rare", "Latijns-Amerika": "Latin-America", + "absoluut": "absolute", # Sjabloon:absol + "accusatief": "accusative", # Sjabloon:accus + "hulpwerkwoord": "auxiliary", # Sjabloon:auxl + "koppelwerkwoord": "copulative", # Sjabloon:copl + "deponens": "deponent", + "ditransitief": "ditransitive", # Sjabloon:ditr + "ergatief": "ergative", # Sjabloon:erga + "inergatief": "unergative", # Sjabloon:inerg + "onovergankelijk": "intransitive", # Sjabloon:intr + "modaal werkwoord": ["modal", "verb"], # Sjabloon:modl + "onpersoonlijk": "impersonal", # Sjabloon:onpr + "overgankelijk": "transitive", # Sjabloon:ov + "wederkerig": "reciprocal", # Sjabloon:rcpq + "wederkerend": "reflexive", # Sjabloon:refl + "alleen meervoud": "plural-only", # Sjabloon:plurt + "geen meervoud": "no-plural", # Sjabloon:singt + "versterkend voorvoegsel": ["intensifier", "prefix"], } TABLE_TAGS = { @@ -89,7 +126,12 @@ } -TAGS = {**VERB_TAGS, **GLOSS_TAGS, **TABLE_TAGS} +HEADER_LINE_TAGS = { + "dim. tant.": ["diminutive", "noun"], # Sjabloon:dimt +} + + +TAGS = {**GLOSS_TAGS, **TABLE_TAGS, **HEADER_LINE_TAGS} # https://nl.wiktionary.org/wiki/Categorie:WikiWoordenboek:Contextlabels TOPICS = {