1. Herausgeber
Inhalt

Metadaten bereitstellen

In § 8 Abs. 1 S. 3 schreibt das SächsEGovG vor, dass Daten, die über öffentlich zugängliche Netze zur Verfügung gestellt werden, mit Informationen zu versehen sind, die Inhalte und Eigenschaften der Daten beschreiben. Ziel ist, die Daten leichter ermittelbar und nutzbar zu machen. Unter einem Datensatz wird hier eine von einer Behörde in einer oder mehreren Formaten veröffentlichte Sammlung strukturierter Dateneinheiten verstanden. Keine Datensätze in diesem Sinne sind im Allgemeinen Fließtexte, Video- und Audio-Datenströme, Daten von Foto- oder Grafiksoftware sowie ausführbare Dateien. Metadaten erfassen Merkmale (Attribute) eines Datensatzes. Sie ermöglichen es, zunächst nach geeigneten Datenquellen zu recherchieren, bevor man die so ermittelten Datenquellen in der beabsichtigten Weise nutzt. Insbesondere sollen die Metadaten dem Nutzer erlauben, abzuschätzen, welche Art der Nutzung unter welchen Bedingungen möglich ist. Bereits das E Government-Gesetz des Bundes sieht vor, dass die Metadaten so aufbereitet werden, dass sie in Verzeichnisse aufgenommen werden können. Solche Verzeichnisse sind z. B. govdata.de, das zentrale Datenportal für Verwaltungsdaten aus Bund, Ländern und Kommunen sowie open-data.europa.eu, das Open Data Portal der Europäischen Union.
Die wichtigsten Angaben zu jedem Datensatz sind – neben dem Titel – die Beschreibung, die verfügbaren Ressourcen (also Datendateien oder -dienste) nebst Format und URL, die Lizenz- bzw. Nutzungsbedingungen und ein Ansprechpartner für weitere Fragen. Aus den im SächsEGovG genannten Zielen der Veröffentlichung von Metadaten lassen sich einige notwendige Metadatenfelder unmittelbar ableiten:

Ziel: Aufnahme in Verzeichnisse

Ziel

Metadatenfeld

Bemerkung

Auf­nahme in Ver­zeich­nisse

Titel des Datensatzes

Dient der alphabetischen Sortierung (daher »Sächsisch« nicht voranstellen)

Veröffent­lichende Stelle

Anhand der veröffentlichenden Stelle können Verzeichnisse leichter Doubletten erkennen und ihre Ergebnisse konsolidieren.

Veröffentlichungsdatum

Anhand des Veröffentlichungsdatums können Verzeichnisse leichter Doubletten erkennen und ihre Ergebnisse konsolidieren.

Datum der letz­ten Änderung

Verzeichnisse benötigen einen Zeitstempel für Änderungen, um sich effizient aktuell halten zu können.

Ziel: Datenermittlung

Ziel

Metadatenfeld

Bemerkung

Daten­ermitt­lung

Titel des Datensatzes

Durch eindeutige und anschauliche Titel kann der Nutzer oft bereits auf den ersten Blick erkennen, welcher von mehreren Datensätzen für sein Anliegen relevant ist.

Beschreibung

Um zwischen einzelnen ähnlich benannten Datensätzen zu unterscheiden, benötigt der Nutzer eine kurze Beschreibung.

Kategorie

govdata.de nutzt das Feld Kategorie, um den Themenbereich zu kennzeichnen, aus dem die Daten stammen.

Schlagworte

Mit Hilfe von Schlagworten kann der Nutzer den Suchraum einschränken und ähnliche Datensätze finden, ohne die genaue Bezeichnung zu kennen.

Veröffent­lichende Stelle

Nutzer können über die veröffentlichende Stelle den Suchraum rasch verkleinern.

Bezeichnung der Distribution

Durch eindeutige und anschauliche Bezeichnungen kann der Nutzer die für sein Anliegen tauglichste / relevante Distribution erkennen.

Eine Distribution ist eine spezifische Form, in welcher der Datensatz veröffentlicht wird. Jeder Datensatz kann in ver­schiedenen Formen verfügbar sein, die sich z. B. hinsichtlich der Vertriebsform (wie CSV-Datei, API oder RSS feed), im Dateiformat oder dem betrachteten Zeitraum unterscheiden.

Ziel: Datennutzung

Ziel

Metadatenfeld

Bemerkung

Daten­nut­zung

Beschreibung

Kurze Hinweise in der Beschreibung beugen möglichen Fehlinterpretationen vor.

Lizenz

Eine nicht erkennbare oder restriktive Lizenzierung stellt ein Hindernis für Nutzung und Weiterverwendung von Daten dar.

Veröffent­lichende Stelle

In vielen Lizenzen ist die Angabe der veröffentlichenden Stelle vorgeschrieben.

Nutzungs­bedingungen

Neben den eigentlichen Nutzungsbedingungen müssen auch die Entgeltregelungen angegeben werden, um Rechtssicherheit bei der Datennutzung zu erzeugen.

Dateigröße der Distribution

Die erwartete Dateigröße ist wichtig für das Management des Datenbezugs.

Format der Distribution

Nutzer müssen entscheiden, ob sie ein bestimmtes Format verarbeiten können. Ggf. muss der Nutzer unter Distributionen mit unterschiedlichen Formaten wählen.

URL der Distribution

Zum Herunterladen der Daten.

Veröffent­lichungsdatum der Distribution

Wenn sich die zugrundeliegenden Daten häufiger ändern, gibt das Veröffentlichungsdatum der Distribution einen Hinweis darauf, wie aktuell die Daten sind.

Kontaktmöglich­keit Ansprech­partner (E‑Mail)

Bleiben Fragen zu Lizenzen, Nutzungsbedingungen oder den Daten offen, muss der Nutzer diese unkompliziert klären können.

Ein automatischer Austausch von Metadatensätzen lässt sich nur bewerkstelligen, wenn Struktur und Bedeutung der Metadaten hinreichend einheitlich sind. Die Open Knowledge Foundation hat ausgehend vom Data Catalog Vocabulary, einer Empfehlung des W3C Konsortiums, eigene Metadatenstrukturen für das Comprehensive Knowledge Archive Network (CKAN) entwickelt, die zusammen mit der entsprechenden Software weite Verbrei-tung in Europa und Amerika gefunden und sich so zum De-Facto-Standard entwickelt haben.
Auch das zentrale Datenportal für Verwaltungsdaten aus Bund, Ländern und Kommunen (govdata.de) nutzt die Metadatenstruktur von CKAN, hat darüber hinaus aber einige weitere Festlegungen getroffen, welche Informationen in welcher Form in den Metadaten abgelegt werden (Open-Government-Deutschland, OGD-Metadaten-Struktur). Die OGD-Metadaten-Struktur wird auf github.com gepflegt. Dort findet sich neben dem Schema auch eine tabellarische HTML-Darstellung. Es wird empfohlen, Metadaten dieser Struktur entsprechend zu veröffentlichen. Die Struktur ist nicht nur als Werkzeug gedacht, um valide Metadaten bestimmen zu können, sondern vielmehr als Kommunikationsmittel für Interessierte wie öffentliche Entscheider, Datenbereitsteller, Entwickler und andere Open-Data-Initiativen im deutschsprachigen Raum. Diesen Zwecken dient auch die frühzeitige Veröffentlichung im Beta-Stadium und die öffentlich nachvollziehbare Entwicklung auf github.com.

Marginalspalte

© Institution