Bundesweites Mapping

Der Erfolg von Open Data wird in Deutschland vor allem in den Städten sichtbar. Aber auch in den ländlichen Regionen Deutschlands gibt’s doch mehr Open-Data-Beispiele als man denkt. Wir haben quer durch Deutschland ein umfangreiches Mapping der Open-Data und Geodatenlandschaft erstellt. Die Daten stehen als Download bereit. (CC-BY 3.0 || letzte Aktualisierung: 10/22)
Download des Mappings als csv (CC-BY 3.0)
Download des Mappings als ods (CC-BY 3.0)
Download des Mappings als xlsx (CC-BY 3.0)

Methodik

Wie sind wir beim Mapping der Open-Data und Geodaten-Portale vorgegangen?

Das deutschlandweite Mapping wurde von Juni 2021 bis Dezember 2021 durchgeführt. Im knapp 700 Zeilen großen Datensatz steht jede Zeile für eine Gebietskörperschaft (Landkreis, Landkreis, Stadt oder Gemeinde) oder ein Statistisches Landesamt, die offene Daten anbieten. Sollte das nicht der Fall sein, wurde die Kommune auf ein Geodatenportal-Angebot überprüft. Jede Spalte des Datensatzes erfasst ein bestimmtes Attribut, das für die Auswertung und der Vergleich der Kommunen untereinander relevant sein kann. Darüber hinaus sind die Kommunen nach Bundesländern gestaffelt.

Im ersten Schritt wurde auf der Basis von Internetrecherche überprüft, ob das jeweilige Bundesland über ein Landes-Open-Data- oder Geodatenportal verfügt. Regionalstatistiken und Datenportale der statistischen Landesämter wurden ebenfalls erfasst.

Das gleiche Vorgehen fand anschließend bei den Landkreisen und kreisfreien Städten statt. Hierauf folgend wurden weitere große Städte und Gemeinden aus dem Bundesland auf Open-Data-Aktivitäten überprüft. Die Überprüfung aller kleinen Gemeinden und Städte war aus zeitlich- und personalbedingten Gründen nicht möglich. Es konnten jedoch auch viele sehr kleine Gemeinden durch ein Schneeballsystem erfasst werden, da besonders Geoportale häufig von externen Anbietern programmiert und verwaltet werden, die alle von ihnen betreuten Kommunen als Referenz angeben (z.B. Tetraeder in NRW).

Wenn Open-Data-Portale in Kommunen vorhanden waren, wurden diese als Zeile in die Tabelle eingefügt und alle Spalten entsprechend der Informationslage ausgefüllt.

Divergenzen im Detailgrad zwischen unterschiedlichen Kommunen ergeben sich somit aus der unterschiedlichen “Auskunftsfreude” der Open-Data-Portale.

Die Erfassung von Geoportalen ist ähnlich aufgebaut, allerdings musste auf eine thematische Zuordnung in den einzelnen anzeigbaren Visualisierungen sowie in einigen Bundesländern auf die Überprüfung der Verfügbarkeit auf dem Landesgeoportal verzichtet werden, wenn die Landes-Geoportale die kommunalen Datenanbieter nicht angegeben haben (Thüringen, Bayern, Sachsen) .

Auf die Überprüfung der Verfügbarkeit der kommunalen Daten auf dem Geoportal des Bundes wird aufgrund des zeitlichen Aufwands und nur zweitrangigen Erkenntnisgewinn ebenfalls verzichtet.

Des Weiteren wurde auf die Publikation “Realsteuervergleich (Fachserie 14 Reihe 10.1)” des Statistischen Bundesamt (2020) für die Ermittlung von Gemeindeschlüssel und kommunaler Steuerkraft (Euro / Einwohner) der Landkreise und kreisfreien Städten zurückgegriffen. Zur Ermittlung der kommunalen Steuerkraft (Euro / Einwohner) von ​​Gemeinden und Gemeindeverbänden wurden Daten zur kommunalen Steuerkraft aus dem Landatlas des Thünen-Instituts aus den Jahren 2012 bis 2014 herangezogen. Bei der Bewertung der Ländlichkeit kommunaler Gebietskörperschaften greifen wir auf die Definition des Thünen-Instituts zurück. Das vorgestellte Mapping erhebt keinen Anspruch auf Vollständigkeit.

Herausforderung beim Erfassen der Open-Data und Geodatenportale

Bei der Überprüfung der Verfügbarkeit der kommunalen Open Data auf dem Bundesportal Govdata, stellte die mangelnde oder nicht funktionierende Filtermöglichkeit “Herkunft” der Daten eine wesentliche Herausforderung dar. Letztendlich konnte nur der Name der Kommune eingegeben werden, wodurch hunderte Treffer in willkürlicher Reihenfolge angezeigt wurden, bei denen es sich um Daten aus Bundes- und Landesbehörden sowie den kommunalen Beständen handelte, die meist, aber nicht zwangsläufig Daten der entsprechenden Kommune enthielten. Mangels Filter war es jedoch unmöglich genau zu überprüfen, welche und wie viele Daten von der Kommune selbst stammen. Eine Filtermöglichkeit mit Bundeslandbezug war aber immerhin bei NRW, Rheinland-Pfalz, Hamburg, Berlin und Bremen möglich.

Eine weitere Herausforderung war die genaue Zuordnung von verantwortlicher Stelle und herausgebender Stelle der Daten sowie der Betreiber und/oder technischen Betreuer. Insbesondere bei Verbundportalen (Landkreise) waren häufig mehrere herausgebende Stellen der Daten aufgeführt. In diesem Fall wurden bei einer Vielzahl an Datenbereitstellern die drei herausgebenden Stellen aufgenommen, die die höchste Zahl an Daten bereitstellen. Sofern dies sich aus dem nicht immer vorhandenen Impressum der Open-Data-Portale und Geoportale herauslesen ließ, sind die Angaben genau aufgeschlüsselt. War dies nicht möglich, wurden die Hauptverantwortlichen des Internetangebots ergo die Kommunen angeben.

Bei der darauf folgenden Feststellung der Lizenzen sind einige Fälle aufgetreten, bei denen nicht alle Datensätze des Open-Data-Portals die gleiche Lizenz hatten, hier wurden immer die Lizenzen eingetragen, unter der die Mehrheit der Datensätze veröffentlicht wurde. War keine Lizenz oder Copyright (meist bei Geoportalen) angegeben, ist das Feld frei geblieben. Das heißt, hier wurden ausschließlich offenen Lizenzen erfasst.

Zu Metadatenstandards sowie Downloadzahlen konnten kaum Daten erhoben werden. Downloadzahlen werden auf Open-Data-Portalen nicht erfasst. Bei den Metadatenstandards konnte überprüft werden, inwiefern Metadaten überhaupt vorliegen. Allerdings ist nur in Ausnahmefällen ersichtlich, dass eindeutig der DCAT-Standard vorliegt.