Skip to content

Commit

Permalink
correct some spelling issues found by libre writer
Browse files Browse the repository at this point in the history
  • Loading branch information
joergreichert committed Feb 3, 2024
1 parent 2f4bd5c commit e276010
Showing 1 changed file with 6 additions and 6 deletions.
12 changes: 6 additions & 6 deletions content/blog/2024-02-02-out-in-the-open-january-2024.md
Original file line number Diff line number Diff line change
Expand Up @@ -20,20 +20,20 @@ Um überhaupt systematisch offene Daten veröffentlichen zu können, braucht es

Am 9. Juni stehen, parallel zur Europawahl in 8 Bundesländern, auch Kommunalwahlen an. [Code for Magdeburg](https://codefor.de/magdeburg/) hat dafür mit [magdeburg-waehlt.de](https://magdeburg-waehlt.de) die technische Infrastruktur für einen eigenen WAHL-O-MAT geschaffen. Allerdings fehlen der Wahlhilfe noch aktuelle Inhalte – die gerne beigesteuert werden dürfen. Weiterhin [steht das Angebot von Code for Magdeburg, den Wahl-Assistenten auch für die Stadt Halle umzusetzen](https://twitter.com/CodeForMD/status/1749131725144277281).

Séan Fobbe [hat Anfang Januar](https://fediscience.org/@seanfobbe/111715419479131593) den Datensatz [Corpus des Deutschen Bundesrechts](https://zenodo.org/records/10460056), eine möglichst vollständige Sammlung der konsolidierten Fassungen aller Gesetze und Verordnungen auf Bundesebene, wieder auf den aktuellen Stand gebracht. Der Datensatz ist mit CC0 lizensiert, also gemeinfrei.
Séan Fobbe [hat Anfang Januar](https://fediscience.org/@seanfobbe/111715419479131593) den Datensatz [Corpus des Deutschen Bundesrechts](https://zenodo.org/records/10460056), eine möglichst vollständige Sammlung der konsolidierten Fassungen aller Gesetze und Verordnungen auf Bundesebene, wieder auf den aktuellen Stand gebracht. Der Datensatz ist mit CC0 lizenziert, also gemeinfrei.

## Alles, was unter den Sammelbegriff Künstliche Intelligenz fällt
Benjamin Paaßen, Juniorprofessor für Wissensrepräsentation und Maschinelles Lernen an der Universität Bielefeld, setzt sich dafür ein, dass deutsche Universitäten [eigene Sprachmodelle, sogenante Large Language Models, auf ihren Servern bereit stellen sollten](https://www.jmwiarda.de/2024/01/26/warum-hochschulen-jetzt-selbst-sprachmodelle-hosten-sollten/), um zukünftige Abhängigkeiten von kommerziellen KI-Anbietern wie OpenAI zu vermeiden. Laut Paaßen stärkten sie damit als zukünftige Anbieter freier Sprachmodelle Lehre, Forschung und digitale Autonomie.
Benjamin Paaßen, Juniorprofessor für Wissensrepräsentation und Maschinelles Lernen an der Universität Bielefeld, setzt sich dafür ein, dass deutsche Universitäten [eigene Sprachmodelle, sogenannte Large Language Models, auf ihren Servern bereit stellen sollten](https://www.jmwiarda.de/2024/01/26/warum-hochschulen-jetzt-selbst-sprachmodelle-hosten-sollten/), um zukünftige Abhängigkeiten von kommerziellen KI-Anbietern wie OpenAI zu vermeiden. Laut Paaßen stärkten sie damit als zukünftige Anbieter freier Sprachmodelle Lehre, Forschung und digitale Autonomie.

[Daniel Erenrichs Jupyter Notebook Beispiel](https://techhub.social/@derenrich/111761256885987346), Anfragen an die Wikidata-Datenbank in natürlicher Sprache zu stellen, nutzt leider ebenfalls die OpenAI-Schnittstelle. Wie Gleiches mit einem Open-Source-LLM, [Mistral 7B](https://mistral.ai/news/announcing-mistral-7b/), erreicht werden kann, zeigt Robert Timm mit seinem [Prototypen](https://github.com/rti/askwikidata) [in einer Präsentation](https://docs.google.com/presentation/d/1YgDmcvoXaqnYdRyX5RxewVkeioEJ92nb8Sfb_halBsM/edit#slide=id.g15105b408d_0_287) auf der Semantic MediaWiki Conference vom letzten Herbst, deren [Mitschnitt jetzt veröffentlicht wurde](https://www.youtube.com/watch?v=STG7VhdiyZw).

Auch der neue Prototyp des [CityLab Berlin](https://citylab-berlin.org/) nutzt ein KI-Sprachmodell. Mit [Parla](https://www.parla.berlin) kann man die Informationen in den Dokumenten der Hauptausschusssitzungen sowie den Schriftlichen Anfragen an das Berliner Abgeordnetenhaus nach Suchanfragen filtern, um am Ende die inhaltlich passenden Dokumente angezeigt und kurze Antworten generiert zu bekommen. Mehr zu den technischen Umsetzungsdetails [erläutert Jonas Jaszkowic](https://citylab-berlin.org/de/blog/parla-technische-entwicklung-des-neuen-ki-tools/) und verschweigt dabei auch nicht die Herausforderungen, die das CityLab bei der Qualitätssicherung und den sprachlichen Halluzinationen des Sprachmodels hatten und immer noch haben. Der Quellcode der Anwendung steht offen auf [Github](https://github.com/technologiestiftung/parla-frontend). Auch er erwähnt das zukunftige Ziel, statt der OpenAI-Lösung lieber Open-Source-Sprachmodelle nutzen zu wollen, merkt aber an, dass es derzeit kaum welche gäbe, die eine akzeptable Qualität bei der Formulierung von Antworten in deutscher Sprache lieferten.
Auch der neue Prototyp des [CityLab Berlin](https://citylab-berlin.org/) nutzt ein KI-Sprachmodell. Mit [Parla](https://www.parla.berlin) kann man die Informationen in den Dokumenten der Hauptausschusssitzungen sowie den Schriftlichen Anfragen an das Berliner Abgeordnetenhaus nach Suchanfragen filtern, um am Ende die inhaltlich passenden Dokumente angezeigt und kurze Antworten generiert zu bekommen. Mehr zu den technischen Umsetzungsdetails [erläutert Jonas Jaszkowic](https://citylab-berlin.org/de/blog/parla-technische-entwicklung-des-neuen-ki-tools/) und verschweigt dabei auch nicht die Herausforderungen, die das CityLab bei der Qualitätssicherung und den sprachlichen Halluzinationen des Sprachmodels hatten und immer noch haben. Der Quellcode der Anwendung steht offen auf [Github](https://github.com/technologiestiftung/parla-frontend). Auch er erwähnt das zukünftige Ziel, statt der OpenAI-Lösung lieber Open-Source-Sprachmodelle nutzen zu wollen, merkt aber an, dass es derzeit kaum welche gäbe, die eine akzeptable Qualität bei der Formulierung von Antworten in deutscher Sprache lieferten.

Wie wichtig es ist, unabhängig von einzelnen Anbietern zu sein, sieht man an den Anstrengungen, die bei der Bekämpfung von Geldwäsche in Deutschland unternommen werden. So erhofft man sich mit den Informationen aus dem Transparenzregister – und auch mit dem Einsatz von Machine Learning – leichter verdächtigen Finanztransaktionen [auf die Spur zu kommen](https://www.heise.de/hintergrund/Missing-Link-Mit-Transparenzregister-und-KI-gegen-Geldwaesche-9589510.html?seite=all).

[Global Fishing Watch](https://globalfishingwatch.org) ist es bereits gelungen, mit Hilfe von KI-Technik illegale Aktivitäten aufzudecken. So hat man mit der Auswertung von zwei Millionen Gigabyte an Satellitenbildern aus den Jahren 2017 bis 2021 so genannte "Dunkle Flotten", also Fischfänger, die ihre Positionen nicht melden, [identifizieren können](https://www.heise.de/news/Dank-Satellitenbildern-und-KI-Bislang-unbekannte-Fischereiflotten-entdeckt-9587935.html). Aus den Daten, die [auch offen heruntergeladen werden können](https://globalfishingwatch.org/datasets-and-code), konnte man beispielsweise ablesen, dass in Asien siebenmal mehr Fischereischiffe im Einsatz sind als in Europa. Es wurden zahlreiche Schiffe gefunden, die in geschützten Gewässern aktiv waren.

KI-Bildgeneratoren sind oftmals mit Bildmaterial gefüttert worden, das zwar frei zugänglich im Internet stand, aber dessen Lizenz geflissentlich ignoriert wurde. Mit [Nightshade](https://nightshade.cs.uchicago.edu/whatis.html) steht nun, wie [heise berichtet](https://www.heise.de/news/Nightshade-KI-Modelle-vergiften-eigene-Werke-schuetzen-9604398.html), ein Werkzeug zur Verfügung, das Bilddateien, visuell vom menschlichen Auge nicht zu erkennen, so verändert, dass es die Trainingsdaten von KI-Modellen in unvorsehbarerweise unbrauchbar macht. Es ist geplant, den Quellcode von Nightshade bald auch offen zu legen. Dann könnte neben den massenweisen Plagiaten, Fakenews, und anderen Spam, die jetzt schon durch generative KI [mutwillig erzeugt werden](https://www.computerwoche.de/a/wie-ki-das-internet-kaputt-macht,3698324), die Qualität von Chatbots weiter absenken.
KI-Bildgeneratoren sind oftmals mit Bildmaterial gefüttert worden, das zwar frei zugänglich im Internet stand, aber dessen Lizenz geflissentlich ignoriert wurde. Mit [Nightshade](https://nightshade.cs.uchicago.edu/whatis.html) steht nun, wie [heise berichtet](https://www.heise.de/news/Nightshade-KI-Modelle-vergiften-eigene-Werke-schuetzen-9604398.html), ein Werkzeug zur Verfügung, das Bilddateien, visuell vom menschlichen Auge nicht zu erkennen, so verändert, dass es die Trainingsdaten von KI-Modellen in unvorsehbarer Weise unbrauchbar macht. Es ist geplant, den Quellcode von Nightshade bald auch offen zu legen. Dann könnte neben den massenweisen Plagiaten, Fakenews, und anderen Spam, die jetzt schon durch generative KI [mutwillig erzeugt werden](https://www.computerwoche.de/a/wie-ki-das-internet-kaputt-macht,3698324), die Qualität von Chatbots weiter absenken.

## Kultur
Eine neue [Online-Plattform](https://www.plattdeutsch-sammeln.de/) will Plattdeutsch mit einer interaktiven Landkarte im öffentlichen Raum sichtbarer machen. Interessierte können sich beteiligen und gerne ihre Fundstücke eintragen.
Expand Down Expand Up @@ -66,14 +66,14 @@ Auch wenn es verlockend ist, die Dienste von OpenStreetMap intensiv zu nutzen, s

Auf Deviantart wurde [eine detaillierte (inoffizielle) Karte des Regional-Schienennetzes der Deutschen Bahn veröffentlicht](https://www.deviantart.com/costamiri/art/Transit-diagram-of-regional-rail-in-Germany-2024-1006737243), die in mühevoller Detailarbeit von [@cstmrii](https://twitter.com/cstmrii) erstellt wurde. Auf der Karte sind selbst kleine und nicht häufig frequentierte Bahnhöfe abgebildet.

In Wien kan man sich mit der neuen [data.gv.at](https://www.data.gv.at/) Open-Data Anwendung [wl-tranit](https://www.data.gv.at/application/wl-transit/) alle Abfahrtszeiten der öffentlichen Verkehrsmittel in einem bestimmten Radius anzeigen lassen
In Wien kann man sich mit der neuen [data.gv.at](https://www.data.gv.at/) Open-Data Anwendung [wl-transit](https://www.data.gv.at/application/wl-transit/) alle Abfahrtszeiten der öffentlichen Verkehrsmittel in einem bestimmten Radius anzeigen lassen

Eine [Umfrage der Bitkom](https://www.heise.de/news/Mobilitaet-43-Prozent-nutzen-Sharing-von-Auto-Fahrrad-oder-E-Stehroller-9594155.html) hat ergeben, dass 43 Prozent der über 16-jährigen das Teilen von Auto, Fahrrad oder E-Scooter als Service nutzen.

Um so betrüblicher die [Nachricht vom Unfalltod](https://www.spiegel.de/panorama/baden-wuerttemberg-radfahr-aktivist-stirbt-offenbar-bei-verkehrsunfall-a-ffba9445-5d0b-4ffb-b544-3df59427e7ea) des Pforzheimer Radfahraktivisten Andreas Mandalka, besser bekannt als [natenom](https://natenom.de/), am Abend des 30. Januar. Er hatte sich unter anderem in den Bereichen Open Source, OpenStreetMap, Verkehrswende und [OpenBikeSensor](https://wiki.natenom.de/docs/mobilitaet/projekte/abstandsmesser/openbikesensor/) engagiert – er dokumentierte selbst mit Videos die gefährlichen Überholmanöver, denen er als Radfahrer ausgesetzt war.

## Open Source
Bruce Perens, Mitgründer der Open-Source-Bewegung, [möchte eine Rückbesinnung auf die ursprünglichen Werte](https://www.heise.de/hintergrund/Missing-Link-Open-Source-ist-tot-es-lebe-Post-Open-Source-9595891.html?seite=all) von Open-Source-Software. Es müsse sichergestellt werden, dass Unternehmen einen angemessenen Geldbetrag zahlen, den sie für die Vorteile, frei verfügbare Software nutzen zu können, erhalten. In den letzten Jahren wurde die Einhaltung der Bedingungen, die z.B. [GPL](https://de.wikipedia.org/wiki/GNU_General_Public_License) oder [AGPL](https://de.wikipedia.org/wiki/GNU_Affero_General_Public_License) lizensierte Software mit sich bringt, immer weiter verwässert, sodass kommerzielle Webanwendungen zum Teil auf mit AGPL lizensierten Software-Bausteinen basieren, aber dennoch ihren Quellcode nicht offenlegen müssen, obwohl die AGPL grundsätzlich auch für Webanwendungen gilt.
Bruce Perens, Mitgründer der Open-Source-Bewegung, [möchte eine Rückbesinnung auf die ursprünglichen Werte](https://www.heise.de/hintergrund/Missing-Link-Open-Source-ist-tot-es-lebe-Post-Open-Source-9595891.html?seite=all) von Open-Source-Software. Es müsse sichergestellt werden, dass Unternehmen einen angemessenen Geldbetrag zahlen, den sie für die Vorteile, frei verfügbare Software nutzen zu können, erhalten. In den letzten Jahren wurde die Einhaltung der Bedingungen, die z.B. [GPL](https://de.wikipedia.org/wiki/GNU_General_Public_License) oder [AGPL](https://de.wikipedia.org/wiki/GNU_Affero_General_Public_License) lizenzierte Software mit sich bringt, immer weiter verwässert, sodass kommerzielle Webanwendungen zum Teil auf mit AGPL lizenzierten Software-Bausteinen basieren, aber dennoch ihren Quellcode nicht offenlegen müssen, obwohl die AGPL grundsätzlich auch für Webanwendungen gilt.

Die Studie [Open Source Software in Kommunen](https://www.bbsr.bund.de/BBSR/DE/veroeffentlichungen/sonderveroeffentlichungen/2024/open-source-software-kommunen.html) des [BBSR](https://www.bbsr.bund.de/) klärt an Hand von Akteuren, die sich in der kommunalen Praxis intensiv mit Open-Source-Anwendungen auseinandersetzen, die grundlegende Begriffe und Zusammenhänge. Damit sollen Entscheidungsträgerinnen und -träger in Städten und Regionen bei der Planung, Beschaffung und Implementierung von Hard- und Softwarelösungen unterstützt werden. Ergänzend dazu helfen interkommunale Kooperationen und das Zusammenspiel von mit IT-Dienstleistern und Open-Source-Communitys den Kommunen.

Expand Down

0 comments on commit e276010

Please sign in to comment.