Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[LINT] Vernieuwde diagramweergave #30

Closed
oktaal opened this issue May 27, 2021 · 2 comments
Closed

[LINT] Vernieuwde diagramweergave #30

oktaal opened this issue May 27, 2021 · 2 comments

Comments

@oktaal
Copy link
Contributor

oktaal commented May 27, 2021

Maak staafdiagrammen bij ‘tekstkenmerken’ leesbaarder door:

  • De regel met de ‘normgenres’ verder omhoog te plaatsen, zodat hij niet meer door de eerste balk heen loopt
  • De twee genre-aanduidingen verder naar buiten te plaatsen, zodat ze elkaar niet meer overlappen.

Het helpt ook om deze aanduidingen korter te maken:

Bekende woorden

  • Complex: wetenschappelijke artikelen (4,08) > Wetenschap (4,08)
  • Eenvoudig: reisblogs (4,87) > Reisblogs (4,87)

Concrete woorden

  • Abstract: wetenschappelijke artikelen (0,26) > Wetenschap (0,26)
  • Concreet: reisblogs (0,70) > Reisblogs (0,70)

Mensen

  • Onpersoonlijk: verkiezingsprogramma (54) > Partijprogramma’s (54)
  • Persoonlijk: roddelberichten (166) > Roddelberichten (166)

Persoonlijke voornaamwoorden

  • Onpersoonlijk: verkiezingsprogramma (27) > Partijprogramma’s (27)
  • Persoonlijk: roddelberichten (75) > Roddelberichten (75)

Zinslengte

  • Makkelijk: vmbo-boeken (10,4) > Vmbo-boeken (10,4)
  • Moeilijk: wetenschappelijke artikelen (23,8) > Wetenschap (23,8)

Bijzinnen

  • Makkelijk: vmbo-boeken (0,33) > Vmbo-boeken (0,33)
  • Moeilijk: wetenschappelijke artikelen (1,19) > Wetenschap (1,19)

Lengte van deelzinnen

  • Makkelijk: vmbo-boeken (8,3) > Vmbo-boeken (8,3)
  • Moeilijk: wetenschappelijke artikelen (13,2) > Wetenschap (13,2)

Bijvoeglijke bepalingen

  • Makkelijk: roddelberichten (0,88) > Roddelberichten (0,88)
  • Moeilijk: wetenschappelijke artikelen (2,11) > Wetenschap (2,11)

Opsommingen

  • Makkelijk: roddelberichten (0,17) > Roddelberichten (0,17)
  • Moeilijk: wetenschappelijke artikelen (0,56) > Wetenschap (0,56)

Woordherhaling

  • Moeilijk: verkiezingsprogramma’s (7,8%) > Partijprogramma’s (7,8%)
  • Makkelijk: roddelberichten (13.0%) > Roddelberichten (13.0%)
  • Zorg dat in het landschap (genrevergelijking) ook de aanduiding ‘roddelberichten’ onder zijn stipje komt te staan. Dat kan waarschijnlijk door dat woord niet boven maar onder zijn stipje te zetten.
  • Bij de roll-overs over balkjes verschijnen de waarden met veel cijfers achter de komma. Afronden op twee decimalen.
  • Geef LiNT-scores weer in een staaf van 1-100, met vier kleurenintervallen per tekstniveau

"De informatie over het moeilijkheidsniveau kan genuanceerder worden gevisualiseerd door een balk aan te bieden met vier gekleurde intervallen die staan voor de leesniveaus. Daarin kan de tekst worden geplaatst, zodat duidelijker wordt of een tekst laag of hoog scoort in een bepaald niveau-interval."

@oktaal
Copy link
Contributor Author

oktaal commented Jun 3, 2021

Over de vier moeilijkheidsniveaus

Op dit moment staat er dit:

Hierboven ziet u het moeilijkheidsniveau van uw tekst(en). LiNT deelt teksten in vier niveaus: niveau 1 is het eenvoudigst, niveau 4 het moeilijkst.

De indeling is gebaseerd op een onderzoek naar de begrijpelijkheid van 120 teksten, die zijn getest onder 2700 leerlingen in het voortgezet onderwijs. Dat onderzoek leidde tot een formule met vier tekstkenmerken: woordfrequentie, bijvoeglijke bepalingen, algemene naamwoorden en tangconstructies. Meer informatie over het onderzoek en de formule

Dat moet worden:

Hierboven ziet u het moeilijkheidsniveau van uw tekst(en). LiNT deelt teksten in vier niveaus: niveau 1 is het eenvoudigst, niveau 4 het moeilijkst. Naast het moeilijkheidsniveau staat ook een meer verfijnde score, de tekstmoeilijkheid. De tekstmoeilijkheid loopt van 1 tot 100 (1 is het makkelijkst, 100 het moeilijkst). Beneden de 34 is de tekstmoeilijkheid van niveau 1, tussen 34 en 53 gaat het om niveau 2, tussen 53 en 61 om niveau 3 en boven de 61 om niveau 4.

De indeling is gebaseerd op een onderzoek naar de begrijpelijkheid van 120 teksten, die zijn getest onder 2700 leerlingen in het voortgezet onderwijs. Dat onderzoek leidde tot een formule met vier tekstkenmerken: woordfrequentie, het aantal inhoudswoorden per deelzin, de proportie concrete zelfstandige naamwoorden en het voorkomen van zogenaamde tangconstructies. Meer informatie over het onderzoek en de formule

Onder de link meer informatie over het onderzoek en de formule komt ook een nieuw stuk tekst, als volgt:

Toelichting onderzoek

Elke leerling maakte clozetoetsen over vier teksten. In clozetoetsen moeten weggelaten tekstwoorden worden ingevuld.

Vervolgens bekeken we welke tekstkenmerken de meeste invloed hebben op de gemiddelde clozescore per tekst. Dat leidde tot een formule met vier tekstkenmerken.

  • De woordfrequentie, waarbij we bij samenstellingen de frequentie van het basiswoord nemen in plaats van die van het gehele woord (dus bij haalbaarheidssubsidie gaan we af op de frequentie van subsidie). De woordfrequentie geeft aan hoe vertrouwd de woorden in de tekst zijn.
  • Het aantal inhoudswoorden per deelzin (dat wil zeggen, het aantal zelfstandige naamwoorden, werkwoorden, bijvoeglijke naamwoorden en bijwoorden). Deze maat geeft aan hoeveel informatie er per werkwoord in de tekst staat.
  • De proportie concrete zelfstandige naamwoorden: hoeveel van de naamwoorden in de tekst gaan over waarneembare zaken of over plaatsen en tijden. Concrete woorden geven aan dat de tekst over concrete thema’s gaat, of dat er zo concreet mogelijk wordt gepraat over het thema. Hoe concreter, hoe eenvoudiger de tekst.
  • De maximale lengte van grammaticale afhankelijkheden per zin; lange afhankelijkheden worden ook wel 'tangconstructies' genoemd. Hoe langer de langste afhankelijkheid in iedere zin, hoe moeilijker de tekst. Zie verder Pander Maat (2017).

Een regressieformule met deze vier kenmerken voorspelt de begripsscore goed: de correlatie tussen de voorspelling en de echte score was .87.

Het onderzoeksverslag is te lezen in Klein 2018. Zij presenteert in hoofdstuk 6 een iets complexere formule met vijf kenmerken, waaronder de vier hierboven. Maar omdat het weglaten van de vijfde voorspeller nauwelijks verlies oplevert, hebben we voor LiNT de eenvoudiger formule gekozen.

Literatuur

@oktaal
Copy link
Contributor Author

oktaal commented Jun 16, 2021

Zie ook: oktaal/tscan-issues#3

@oktaal oktaal transferred this issue from oktaal/tscan Dec 13, 2022
@oktaal oktaal transferred this issue from another repository Dec 13, 2022
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants