Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Návrh propojení TermItu a OFN slovníku #465

Open
lindatothova opened this issue May 22, 2024 · 2 comments
Open

Návrh propojení TermItu a OFN slovníku #465

lindatothova opened this issue May 22, 2024 · 2 comments
Labels
enhancement New feature or request IPR Initiated/requested by IPR

Comments

@lindatothova
Copy link
Collaborator

Prosím o přípravu návrhu pracnosti propojení TermItu na standard slovníku (OFN).

@lindatothova lindatothova added enhancement New feature or request IPR Initiated/requested by IPR labels May 22, 2024
@ledsoft ledsoft added this to TermIt May 24, 2024
@ledsoft ledsoft moved this to 🏗 In progress in TermIt May 24, 2024
@ledsoft
Copy link
Contributor

ledsoft commented May 24, 2024

OFN Slovníky (draft): https://ofn.gov.cz/slovníky

Možnosti:

1. Upravit stávající SKOS export/import

  • Nutné relativně malé změny
    • dc:title -> skos:prefLabel u názvu slovníku
    • created property místo jednoduchého xsd:dateTime používá komplexní owl:time typ
  • Adekvátně by bylo třeba upravit i import
  • Netřeba migrovat existující data

2. Upravit vnitřní datový model TermItu dle OFN

  • Datový model se zásadně neliší, naopak by se zjednodušil (v tuto chvíli entita Model stejně nic v rámci systému neznamená, ale TermIt ji ukládá, entita Glossary slouží v podstatě jen jako kolekce root pojmů slovníku, nemá žádné vlastnosti)
    • Stávající trio typů Vocabulary, Glossary a Model by se sjednotilo do typu Vocabulary
    • Třídy a properties založené na ontologii pro popis dat by zřejmě byly nahrazeny čistě SKOS/DC Terms apod. třídami a properties
  • Bylo by třeba upravit import/export (viz výše)
  • Bylo by třeba migrovat existující data

Obecně

Celkově jde asi o to se rozhodnout, jakou filozofii podoby slovníku budeme dále vyznávat. Pokud se budeme chtít přidržet původní myšlenky, že slovník se skládá z glosáře a modelu, dává smysl varianta 1. Je jednoduchá na implementaci a zachová stávající datový model.
Pokud se rozhodneme tuto myšlenku opustit, dává smysl jít variantou 2. Je to sice více práce (hlavně migrace), ale zase bude datový model odpovídat tomu, jak se na doménu díváme.
Je také vhodné si uvědomit, že z hlediska uživatele TermIta není mezi glosářem a slovníkem v podstatě rozdíl. UI je nerozlišuje, import/export také pracuje pouze se SKOS scheme, tj. glosářem. Pouze při přístupu přes API je poznat, že slovník obsahuje glosář a nějaký model, který je ale v rámci TermIta (a zběžným pohledem do dat instance výrobní linky se zdá, že i v rámci stávajících součástí výrobní linky) zcela irelevantní.
Dále je vhodné si uvědomit, že vzhledem k přístupu DIA by TermIt byl asi na dlouho jediný nástroj, který by uvedenou OFN implementoval. Navíc v současné době ani sémantický slovník pojmů (SSP), který by TermIt měl číst, není kompatibilní s OFN.
OFN je také ve stavu draftu a ačkoliv DIA tvrdí, že se s publikací čeká na nějaké politické kroky a není v plánu ji měnit, nemůžeme se na to spolehnout, a tudíž musíme být připraveni na případné změny reagovat. Např. se zdá stále nevyřešený vztah mezi typy Slovník, Tezaurus (pro nás glosář) a Konceptuální model. Např. v diskuzi datagov-cz/otevrene-formalni-normy#439 jsou k tomuto členění připomínky, ale bez nějakého závěru.
Obecně by bylo fajn vědět, jaká byla motivace v OFN změnit vztahy slovníku, glosáře a modelu. Pokud si pamatuji, vznesli jsme tento dotaz při setkání s DIA a byť nám slíbena odpověď, žádné jsme se, pokud vím, nedočkali. Tato informace by nám mohla dát lepší představu o tom, jak dlouho tento pohled na slovník vydrží.

@MichalMed @psiotwo

@lindatothova
Copy link
Collaborator Author

@ledsoft díky za reakci a popis současné situace.

Vzhledem k tomu, že OFN slovníku je zatím ve stavu draftu, rozhodli jsme se tuto problematiku v současné době opustit. Počkáme, jak se situace vyvine celkově, tedy i ve vztahu k podpoře SW nástrojů pro tvorbu slovníků.

@ledsoft ledsoft moved this from 🏗 In progress to 🆕 New in TermIt May 27, 2024
@ledsoft ledsoft removed this from TermIt Jun 19, 2024
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
enhancement New feature or request IPR Initiated/requested by IPR
Projects
None yet
Development

No branches or pull requests

2 participants