1. Herausgeber
Inhalt

Was sind offene Verwaltungsdaten?

Befürworter von Open Data haben eine Reihe von Kriterien entwickelt, die darüber entscheiden ob Verwaltungsdaten wirklich »offen« sind. Dabei sind sicher nicht alle Kriterien vollständig zu erfüllen, um überhaupt von »offenen Daten« reden zu können. In manchen Fällen muss auch zwischen unterschiedlichen Kriterien abgewogen werden (so steht Aktualität in manchen Fällen in einem gewissen Spannungsverhältnis zur Aufbereitung für die Maschinenlesbarkeit), und Daten, die das ein oder andere Kriterium nicht erfüllen, sind immer noch »offener« als solche die gar nicht bereitgestellt werden.

Vollständigkeit

»Datensätze öffentlicher Einrichtungen sollten so vollständig wie möglich veröffentlicht werden, soweit dies die Regelungen zum Datenschutz zulassen. Die Daten sollen dabei in einem möglichst ursprünglichen Format inklusive beschreibender Metadaten veröffentlicht werden.« Die Metadaten dienen der ›Auffindbarkeit‹ der Daten, da diese so in zentralen Rechercheportalen erschlossen werden können.*

Primärquellen / Aggregierungsgrad

»Daten, die als offene Verwaltungsdaten bereitgestellt werden, sollten direkt aus den ursprünglichen Quellen veröffentlicht und mit Informationen zum Ablauf der Sammlung und zur Erstellung der Daten angereichert werden. Dies erlaubt es Dritten, die Datenerstellung nachzuvollziehen. Primärdaten umfassen Rohdaten und Basisdaten. Primärdaten liegen vor, solange die erhobenen Daten nicht akkumuliert und noch nicht bewertet wurden (Rohdaten). Im Einzelfall können die Daten bereits bearbeitet sein, um sie handhabbar zu machen oder um rechtliche Vorgaben (z.B. Datenschutz, Statistikgeheimnis) zu erfüllen (Basisdaten).«

Zeitliche Nähe / Aktualisierungsrhythmus

»Die Veröffentlichung der Daten soll möglichst zeitnah zur Entstehung oder Aktualisierung des Datensatzes erfolgen. Werden Daten externen Personen erst mit großer zeitlicher Verzögerung zur Nutzung bereitgestellt, können sie unter Umständen nur noch eingeschränkt Verwendung finden. Welcher Zeitraum als zeitnah zu verstehen ist, ist dabei vom Einzelfall abhängig. Statistische Daten sind beispielsweise anders einzuordnen als Daten zur Auslastung von Verkehrssystemen.« Ebenso wichtig wie die Aktualität der Daten selbst ist es, dass der Nutzer leicht erkennen kann, wie aktuell die Daten sind.*

Leichter Zugang

»Der Aufwand, um Zugang zu einem oder mehreren Datensätzen zu erhalten, soll möglichst gering sein. Hindernisse hierbei reichen von technischen Problemen wie unterschiedlichen Formaten oder fehlenden Metadaten über organisatorische Barrieren (z.B. Pflichtregistrierung) bis zu rechtlichen Vorgaben.« Zur Zugänglichkeit gehört auch, die Möglichkeit die Bedeutung der Daten zu verstehen (z.B. durch ausreichende Dokumentation)* und die möglichst hohe aber verlustfreie Kompression für die Übertragung.

Maschineninterpretierbarkeit

»Erst durch die Möglichkeit zur automatisierten Verarbeitung lassen sich viele Potenziale offener Daten ausschöpfen. Maschineninterpretierbarkeit eines Datensatzes erlaubt die einfache Einbindung in Softwareanwendungen. Große Mengen von Daten lassen sich dementsprechend in neuen Applikationen nutzbar machen. Dies setzt u. a. eine solide Auszeichnung mit Metadaten sowie die Verwendung einheitlicher Formate und Terminologien voraus. ›Grundsätzlich sind alle von Software interpretierbaren Daten maschinenlesbar. Im Zusammenhang mit Open Data werden darunter vor allem solche Datenformate verstanden, die eine Weiterverarbeitung ermöglichen. Die zugrunde liegende Datenstruktur und entsprechende Standards müssen öffentlich zugänglich sein und sollten vollständig publiziert und kostenfrei erhältlich sein.‹« Proprietäre Datenformate beschränken unter Umständen die Weiternutzung auf die in der Standardsoftware vorgegebenen Möglichkeiten.*

Diskriminierungsfreiheit

»Der Zugriff auf Daten muss beispielsweise ohne Ansehen der Person, zeitliche Restriktionen, die Anforderung, die eigene Identität nachzuweisen, oder eine Begründung für den Zugriff möglich sein. Beispiele für eine Diskriminierung beim Zugriff auf Daten wären eine notwendige Registrierung, Mitgliedschaft oder Beschränkung auf ausgewählte Softwareanwendungen.«

Verwendung offener Standards

»Mit dem Einsatz offener Standards ist die Verwendung von Formaten gemeint, die nicht nur von ausgewählten Programmen gelesen und verarbeitet werden können. Offene Standards gewährleisten die Freiheit, mit verschiedenen Programmen auf die Daten zugreifen zu können, ohne dass dafür Lizenzkosten an einzelne Hersteller abgeführt werden müssen.«

Lizenzierung / Nutzungsbedingungen

»Eine restriktive Lizenzierung stellt ein Hindernis für die Nutzung und Weiterver-wendung von Daten dar. Offene Verwaltungsdaten sollten eindeutig sichtbar mit einer Lizenz bzw. Nutzungsbedingungen versehen und durch Dritte nutzbar sein. Nutzungsbedingungen sind unabhängig von etwaigen Entgeltregelungen.« Dabei sollte man sich bewusst machen, dass schon die Pflicht, den Daten bei der Weiterverbreitung bestimmte Haftungsausschlüsse oder Verwendungshinweise beizufügen, eine nicht unerhebliche Belastung darstellen kann.* Um Lizenzprobleme bei Daten zu umgehen, die die Verwaltung von dritten erstellen lässt oder erwirbt ist bereits im Vorfeld eine entsprechende Vertragsgestaltung notwendig.

Dauerhaftigkeit / Verfügbarkeit

»Daten, die im Internet veröffentlicht werden, können flexibel vom Bereitsteller verändert werden, ohne dass dies für Dritte transparent wird. Offene Verwaltungsdaten sollten permanent verfügbar sein, Änderungen, Aktualisierungen und Löschungen mit Versionskontrollen und Archivierung nachvollziehbar gestaltet werden.«

Nutzungskosten

»Die kostenpflichtige Bereitstellung von Verwaltungsdaten behindert die Weiterverwendung dieser Daten. Die Erhebung von Geldleistungen beschränkt generell die Gruppe der Nutzer sowie den Einsatz der Daten zu wirtschaftlichen Zwecken.« Geldleistungen können in Form von privatrechlichen Entgelten oder öffentlich-rechtlichen Gebühren verlangt werden.

Sicherheit

Schließlich sollte die Nutzung offener Verwaltungsdaten auch sicher sein. Das bedeutet z.B. , dass der Nutzer sich auf die Herkunft der Daten verlassen können muss, und möglichst auf Formate verzichtet wird , die ausführbaren Code enthalten können.*

Bewegliche Daten

Ein Bericht der Unternehmensberatung McKinsey hat es so formuliert: Je größer der Kreis der Personen bzw. Organisationen ist, die Zugang zu bestimmten Daten erhalten, je leichter diese Daten sich von Computern laden und verarbeiten, je geringer die für die Nutzung erhobenen Kosten und je umfangreicher die eingeräumten Nutzungsformen, um so beweglicher werden die Informationen.

Marginalspalte

© Institution