Skip to content

Commit

Permalink
out in the open Januar 2024
Browse files Browse the repository at this point in the history
  • Loading branch information
joergreichert committed Feb 2, 2024
1 parent 6698b71 commit 772a302
Show file tree
Hide file tree
Showing 3 changed files with 161 additions and 0 deletions.
161 changes: 161 additions & 0 deletions content/blog/2024-02-02-out-in-the-open-january-2024.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,161 @@
---
title: "If you can't fix it, you don't own it! – Out in the Open Januar 2024"
author: "Jörg Reichert (Code for Leipzig), Tim Fangmeyer (Code for Berlin), et al."
date: '2024-02-02T08:00:00+02:00'
excerpt: Monatlich erscheinender Überblick über Entwicklungen in der Open Data und Civic Tech Szene
topic: community
images:
- imgname: out-in-the-open-2024-01-header.jpg
attribution: <a href="https://unsplash.com/de/fotos/selektive-fokusfotografie-des-ladenschilds-das-an-der-tur-hangt-Np7V88Hd8Es">Foto</a> von <a href="https://unsplash.com/de/@belart84">Artem Beliaikin</a> auf <a href="https://unsplash.com/">Unsplash</a>
og_image: out-in-the-open-2024-01-header.jpg
type: blog
---

Wie auch in dieser Blogreihe schon mehrfach berichtet, müssen öffentliche Verwaltung hochwertige Daten ab dem 9. Juni 2024
gemäß den Vorgaben der Durchführungsverordnung zu Hochwertigen Datensätzen (EU) 2023/138 der Europäischen Kommission verpflichtend bereitstellen. Für alle, die sich fragen, was das für die Verwaltungen konkret bedeutet und wie die zu gehenden Schritte sind, ist die [Handreichung (pdf)](https://open.bydata.de/static/openbydata_HVD_Handreichung.pdf) des [Open-Data-Teams Bayern](https://open.bydata.de/) das geeignete Nachschlagewerk.

Einen Schritt weiter geht das nationale [Schweizer Datenportal opendata.swiss](https://opendata.swiss/), das nun flächendeckend für alle seine CSV-Dateien [Programmierschablonen anbietet](https://opendata.swiss/de/showcase/starter-code-fur-alle-csv-datensatze-auf-opendata-swiss), um so den Einstieg in die Programmierung mit den Datensätzen zu erleichtern.

Um überhaupt systematisch offene Daten veröffentlichen zu können, braucht es eine gute Grundlage. Das hat auch das Land Schleswig-Holstein erkannt und arbeitet momentan an einer modular aufgebauten Infrastruktur für offene Daten. [Aus welchen Komponenten diese konkret besteht, erläutert Mister Open Data in seinem neuen Blogbeitrag](https://open-north.de/blog/2024-01-08_infrastruktur/) und gibt bei einen lehrreichen Einblick die Open-Data-Infrastruktur des nördlichsten Bundeslandes.

Am 9. Juni stehen parallel zur Europawahl in 8 Bundesländern auch Kommunalwahlen an. [Code for Magedburg](https://codefor.de/magdeburg/) hat dafür mit [magdeburg-waehlt.de](https://magdeburg-waehlt.de) die technische Infrastruktur für einen eigenen WAHL-O-MAT geschaffen.Allerdings fehlen der Wahlhilfe noch aktuelle Inhalte - die gerne beigesteuert werden dürfen. Weiterhin [steht das Angebot von Code for Magedburg, den Wahl-Assistenten auch für die Stadt Halle umzusetzen](https://twitter.com/CodeForMD/status/1749131725144277281).

Séan Fobbe [hat Anfang Januar](https://fediscience.org/@seanfobbe/111715419479131593) den Datensatz [Corpus des Deutschen Bundesrechts](https://zenodo.org/records/10460056), eine möglichst vollständige Sammlung der konsolidierten Fassungen aller Gesetze und Verordnungen auf Bundesebene, wieder auf den aktuellen Stand gebracht. Der Datensatz ist mit CC0 lizensiert, also gemeinfrei.

## Alles, was unter dem Sammelbegriff Künstliche Intelligenz fällt
Benjamin Paaßen, Juniorprofessor für Wissensrepräsentation und Maschinelles Lernen an der Universität Bielefeld, setzt sich dafür ein, dass deutsche Universitäten [eigene Sprachmodelle, sogenante Large Language Models, auf ihren Servern bereit stellen sollten](https://www.jmwiarda.de/2024/01/26/warum-hochschulen-jetzt-selbst-sprachmodelle-hosten-sollten/), um zukünftige Abhängigkeiten von kommerziellen KI-Anbietern wie OpenAI zu vermeiden. Laut Paaßen stärkten sie damit als zukünftige Anbieter freier Sprachmodelle Lehre, Forschung und digitale Autonomie.

[Daniel Erenrichs Jupyter Notebook Beispiel](https://techhub.social/@derenrich/111761256885987346), Anfragen an die Wikidata-Datenbank in natürlicher Sprache zu stellen, nutzt leider ebenfalls OpenAPI. Wie Gleiches mit einem Open-Source-LLM, [Mistral 7B](https://mistral.ai/news/announcing-mistral-7b/), erreicht werden kann, zeigt Robert Timm mit seinem [Prototypen](https://github.com/rti/askwikidata) [in einer Präsentation](https://docs.google.com/presentation/d/1YgDmcvoXaqnYdRyX5RxewVkeioEJ92nb8Sfb_halBsM/edit#slide=id.g15105b408d_0_287) auf der Semantic MediaWiki Conference vom letzten Herbst, deren [Mitschnitt jetzt veröffentlicht wurde](https://www.youtube.com/watch?v=STG7VhdiyZw).

Auch der neue Prototyp des [CityLab Berlin](https://citylab-berlin.org/) nutzt ein KI-Sprachmodell. Mit [Parla](https://www.parla.berlin) kann man die Informationen in den Dokumenten der Hauptausschusssitzungen sowie der Schriftlichen Anfragen an das Berliner Abgeordnetenhaus nach Suchanfragen filtern, um am Ende die inhaltlich passenden Dokumente angezeigt und kurze Antworten generiert zu bekommen. Mehr zu den technischen Umsetzungsdetails [erzählt Jonas Jaszkowic](https://citylab-berlin.org/de/blog/parla-technische-entwicklung-des-neuen-ki-tools/) und verschweigt dabei auch nicht die Herausforderungen, die sie bei der Qualitätssicherung und den Halluzinationen des Sprachmodels hatten und immer noch haben. Der Quellcode der Anwendung steht offen auf [Github](https://github.com/technologiestiftung/parla-frontend). Auch er erwähnt das zukunftige Ziel, statt der OpenAI-Lösung lieber Open-Source-Sprachmodelle nutzen zu wollen, merkt aber auch an, dass es derzeit kaum welche gäbe, die eine akzeptable Qualität bei der Formulierung von Antworten in deutscher Sprache liefern.

Wie wichtig es ist, unabhängig von einzelnen Anbietern zu sein, sieht man an den Anstrengungen, die bei der Bekämpfung von Geldwäsche in Deutschland unternommen werden. So erhofft man sich mit den Informationen aus dem Transparenzregister und auch mit dem Einsatz von Machine Learning leichter verdächtigen Finanztransaktionen [auf die Spur zu kommen](https://www.heise.de/hintergrund/Missing-Link-Mit-Transparenzregister-und-KI-gegen-Geldwaesche-9589510.html?seite=all).

Dagegen ist es [Global Fishing Watch](https://globalfishingwatch.org) bereits gelungen, mit Hilfe von KI-Technik illegale Aktivitäten aufzudecken. So hat man mit der Auswertung von zwei Millionen Gigabyte an Satellitenbildern aus den Jahren 2017 bis 2021 so genannte "Dunkle Flotten", also Fischfänger, die ihre Positionen nicht melden, [identifizieren können](https://www.heise.de/news/Dank-Satellitenbildern-und-KI-Bislang-unbekannte-Fischereiflotten-entdeckt-9587935.html). Aus den Daten, die [auch offen heruntergeladen werden können](https://globalfishingwatch.org/datasets-and-code), konnte man beispielsweise ablesen, das in Asien 7-mal mehr Fischereischiffe im Einsatz sind als in Europa. Es wurden zahlreiche Schiffe gefunden, die in geschützten Gewässern aktiv waren.

KI-Bildgeneratoren sind oftmals mit Bildmaterial gefüttert worden, das zwar frei zugänglich im Internet stand, dabei aber dessen Lizenzierung geflissentlich ignoriert wurde. Mit [Nightshade](https://nightshade.cs.uchicago.edu/whatis.html) steht nun, wie [heise berichtet](https://www.heise.de/news/Nightshade-KI-Modelle-vergiften-eigene-Werke-schuetzen-9604398.html), ein Werkzeug zur Verfügung, das Bilddateien, visuell vom menschlichen Auge nicht zu erkennen, so verändert, dass es die Trainingsdaten von KI-Modellen in unvorsehbarerweise vergiftet. Es ist geplant, den Quellcode von Nightshade bald auch offen zu legen. Dann könnte neben den massenweisen Plagiaten, Fakenews, und anderen Spam, die jetzt schon durch generativer KI [mutwillig erzeugt werden](https://www.computerwoche.de/a/wie-ki-das-internet-kaputt-macht,3698324), die Qualität von Chatbots weiter absenken.

## Kultur
* Die Bayerische Staatsbibliothek stellt über 4 Millionen Digitalisate online!
https://openbiblio.social/@bsbmuenchen/111767014793896844
https://www.digitale-sammlungen.de/de/
* Neue Online-Plattform macht Plattdeutsch im öffentlichen Raum sichtbar
- interaktive Landkarte macht Plattdeutsch in unserer Umgebung sichtbar
- alle Interessierten können sich beteiligen und ihre Fundstücke eintragen
- die Website ist in verschiedene Kategorien untergliedert und erleichtert so die Suche
https://www.plattdeutsch-sammeln.de/
via https://chaos.social/@edlef/111782217916656280
* So helfen Wiki-Projekte bei der Öffnung von Kunst und Kulturgut
https://blog.wikimedia.de/2024/01/18/so-helfen-wiki-projekte-bei-der-offnung-von-kunst-und-kulturgut/
via https://social.wikimedia.de/@wikimediaDE/111803996158854828
* Museum öffne Dich: Trotz der Novellierung des Urheberrechts besteht bis heute beim Fotografieren gemeinfreier Werke eine rechtliche Unsicherheit
https://netzpolitik.org/2024/oeffentliches-geld-oeffentliches-gut-museum-oeffne-dich/

## Mobilität und Kartendaten
* Auf Deviantart wurde [eine detaillierte (inoffozielle) Karte des Regional-Schienennetzes der Deutschen Bahn veröffentlicht](https://www.deviantart.com/costamiri/art/Transit-diagram-of-regional-rail-in-Germany-2024-1006737243), die in mühevoller Detailarbeit von [@cstmrii](https://twitter.com/cstmrii) erstellt wurde. Auf der Karte sind selbst kleine und nicht häufig frequentierte Bahnhöfe abgebildet.

* Neue #opendata Anwendung: wl-tranit - eine simple Browser-Page (PWA), mit der man alle Abfahrtzeiten von Öffis der Wiener Linien in einem bestimmten Radius auf einen Blick sehen kann
https://www.data.gv.at/application/wl-transit/
via https://mastodon.social/@datagvat/111811797790638901
* Mobilität: 43 Prozent nutzen Sharing von Auto, Fahrrad oder E-Stehroller
https://www.heise.de/news/Mobilitaet-43-Prozent-nutzen-Sharing-von-Auto-Fahrrad-oder-E-Stehroller-9594155.html
* OpenStreetMap data is free, we only ask that you tell people about us in exchange. Some site use OSM without attribution, *and* hotlink to OSMF tile servers. Our data is free, but our servers cost time & money. It's now even easier for you to report naughty sites like that. They can (eventually) be blocked from freeloading. We hope this will increase visibility of OSM!
https://en.osm.town/@openstreetmap/111749237204284048
https://github.com/openstreetmap/tile-attribution/blob/main/README.md
* Link Wikidata and OpenStreetMap: This tool will help you link Wikidata items with the matching object on OpenStreetMap (OSM).
https://map.osm.wikidata.link/
via https://octodon.social/@edward/111823135513047825
* Foursquare mit ActivePub und Openstreetmap nachbauen:
https://shkspr.mobi/blog/2024/01/rebuilding-foursquare-for-activitypub-using-openstreetmap/

* Gitterkarten für die kommunale Wärmeplanung
https://wahlatlas.net/NIAM2024/
via https://norden.social/@wahlatlas/111775720582597059
* OpenBookCase: Die öffentlichen Bücherschränke
https://openbookcase.de/map
via https://geoobserver.wordpress.com/2024/01/29/openbookcase-die-offentlichen-bucherschranke/

* Radfahraktivist stirbt bei Verkehrsunfall: Als "Natenom" trat er auf Social Media auf – und postete Videos von gefährlichen Überholmanövern, die er als Radfahrer erlebte. Bei einem Verkehrsunfall ist der Aktivist nun gestorben, als er selbst auf dem Rad unterwegs war.
https://www.spiegel.de/panorama/baden-wuerttemberg-radfahr-aktivist-stirbt-offenbar-bei-verkehrsunfall-a-ffba9445-5d0b-4ffb-b544-3df59427e7ea
* https://wiki.natenom.de/docs/mobilitaet/projekte/abstandsmesser/openbikesensor/

## Wikiworld
* It's almost the weekend Looking for a good movie to watch? We've got you covered with @magnusmanske's WikiFlix! Public domain movies right at your finger tip from Wikimedia Commons, @internetarchive and more, powered by #Wikidata
https://wikis.world/@wikidata/111783165794394046
https://wikiflix.toolforge.org
* Early fork of #WikiFlix for audio files, #WikiVibes
https://wikivibes.toolforge.org/
via https://wikis.world/@magnusmanske/111776592587037891
passend dazu auch: listenbrainz.org/ mit Wikidata-Verknüpfung

## Linked Open Data
* Wie Linked Open Data für mehr Transparenz bei Haushaltsdaten sorgt – Interview mit Julia Schabos
https://www.technologiestiftung-berlin.de/profil/blog/wie-linked-open-data-fuer-mehr-transparenz-bei-haushaltsdaten-sorgt-interview-mit-julia-schabos
* passend dazu: auf https://bundeshaushalt.de/DE/Home/home.html den Bundeshalt interaktiv erkunden
* Citizen Knowledge Graph
https://citizen-knowledge-graph.github.io/ckg-site/en/
https://github.com/Citizen-Knowledge-Graph/ckg-fim-solid-experiment
https://www.youtube.com/watch?v=E9A5CuIhi58&list=PLyt46q60EbD_mT4BPbkHtHCaWCOCX-PlP&index=4
* Semantischer Netzwerkservice SNS
https://sns.uba.de/de

## OpenSource
* DK101: Die sächsische Open-Source-Strategie | Datenkanal
https://datenkanal.org/archives/142-DK101-Die-saechsische-Open-Source-Strategie.html
via https://podcasts.social/@datenkanal/111805027248995095
* eGovernment Podcast Monatsschau 01/24
https://egovernment-podcast.com/egov163-monatsschau-01-24/
* Missing Link: Open Source ist tot, es lebe Post-Open-Source - Bruce Perens, Mitgründer der Open-Source-Bewegung, wittert Verrat am Ideal der maximalen Nutzungsfreiheit freier Software. Er will Rückbesinnung und Neustart.
https://www.heise.de/hintergrund/Missing-Link-Open-Source-ist-tot-es-lebe-Post-Open-Source-9595891.html
* Algorithmus des Empfehlungssystems der ZDF-Mediathek Open Source
https://github.com/zdf-opensource/recommendations-pa-base
* BBSR Open Source Software in Kommunen:
https://www.bbsr.bund.de/BBSR/DE/veroeffentlichungen/sonderveroeffentlichungen/2024/open-source-software-kommunen.html
* A phrase I heard and loved when I was in a committee room in the UK Parliament this evening, for an Open Source event - “Open Source is the Right to Repair, for software.” 👏🏻 such a perfect way of describing it, I wish I'd been the one to say it!
https://macaw.social/@andypiper/111774169944729337

## Und sonst so
* Weltraumteleskop James Webb: Aufnahmen zeigen Sterne und Staub in 19 Galaxien
https://www.heise.de/news/Weltraumteleskop-James-Webb-Aufnahmen-zeigen-Sterne-und-Staub-in-19-Galaxien-9612699.html
https://webbtelescope.org/contents/media/images/2024/105/01HM9KGGP1EWFFSRRSKR8NZGWZ?news=true
"Unless otherwise specifically stated, no claim to copyright is being asserted by STScI and material on this site may be freely used as in the public domain in accordance with NASA's contract. However, it is requested that in any subsequent use of this work NASA and STScI be given appropriate acknowledgement." (https://webbtelescope.org/copyright)

## Termine
* Prototype Fund Förderrunde-Bewerbung von 01.02.2024 bis 31.03.2024
https://prototypefund.de/bewerbung/timeline/
* Open Data Day 2024 – Mini-Grants Open Call
https://blog.okfn.org/2024/01/24/open-data-day-2024-mini-grants-open-call/
* Call for action: Help shape the future interoperability assessment guidelines
https://joinup.ec.europa.eu/interoperable-europe/news/call-action-shape-future-interoperability-assessments
* Wir suchen eine:n Kommunikationsmanager:in für die OKF (Teilzeit, 20-28h/Woche)
https://okfn.de/jobs/gf-kommunikationsmanagerin-2024/
via https://chaos.social/@okfde/111817587687955145

## Veranstaltungen
* Freitag, 02.02.2024, bis Samstag, 03.02.2024, 08:00 - 20:00,
Mauerstraße 53, 10117 Berlin: **Civic Coding-InnovationCamp: Eure KI-Ideen für unser Gemeinwohl**
* https://www.civic-coding.de/angebote/veranstaltungen/civic-coding-innovationcamp-eure-ki-ideen-fuer-unser-gemeinwohl
* Samstag, 03.02.2024, bis Sonntag, 04.02.2024, Brüssel: **FOSDEM 2024**
* https://fosdem.org/2024/
* Dienstag, 06.02.2024, 19:30, Remote-Videokonferenz: **OpenStreetMap Verkehrswende Berlin Monatliches Meetup**
* https://wiki.openstreetmap.org/wiki/Berlin/Verkehrswende#Meetups
* Dienstag, 06.02.2024, 20:00 Uhr, c-base, Berlin und im Stream: **Netzpolitischer Abend zum Thema Daten und Flucht**
* https://digitalegesellschaft.de/2024/01/133-netzpolitischer-abend/
* Mittwoch, 07.02.2024, 20:00 - 21:30, online: **Open Transport Meetup mit Carl Fredlund zu Mobility Data**
* https://hackmd.okfn.de/opentransportmeetup
* Mittwoch, 07.02.2024, bis Donnerstag, 08.02.2024, Nürnberg: **Umweltdatenwerkstatt**
* https://datenschule.de/workshops/umweltdatenwerkstatt/
* Freitag, 16.02.2024, bis Sonntag, 18.02.2024, Wikimedia Deutschland, Raum "Mosaik", Tempelhofer Ufer 23, 10961 Berlin-Kreuzberg: **Berlinale Edit-a-thon 2024**
* https://www.wikimedia.de/veranstaltungen/berlinale2024/
* Freitag, 23.02.2024, bis Sonntag, 25.02.2024, WIR-Haus, Wilhelmstr. 189, 42489 Wülfrath: **Hack im Pott**
* https://hackimpott.de/
* Donnerstag, 29.02.2024, CityLAB Berlin, Platz der Luftbrücke 4, 12101 Berlin, ab 18 Uhr: **Maptime Meetup**
* https://citylab-berlin.org/de/events/maptime-meetup-2/
* Freitag, 01.03.2024, bis Samstag 02.03.2024, Casinotheater Winterthur, Stadthausstrasse 119, 8400 Winterthur und im Stream: **Winterkongress der Digitalen Gesellschaft Schweiz**,
* https://winterkongress.ch/2024/
* Samstag, 02.03.2024: **Open Data Day**
* https://opendataday.org/de/
* Samstag, 02.03.2024, bis Sonntag, 03.03.2024, Rathaus, Moers: **Hackday Niederrhein 2024**
* https://www.codeforniederrhein.de/hackday-2024/
* Samstag, 02.03.2024, bis Sonntag, 03.03.2024, Leipzig: **Umweltdatenwerkstatt**
* https://datenschule.de/workshops/umweltdatenwerkstatt/
1 change: 0 additions & 1 deletion data/netlify.toml

This file was deleted.

1 change: 1 addition & 0 deletions data/netlify.toml
Original file line number Diff line number Diff line change
@@ -0,0 +1 @@
../netlify.toml
Binary file added static/blog/out-in-the-open-2024-01-header.jpg
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.

0 comments on commit 772a302

Please sign in to comment.