Als Open Data (aus englischopen data‚offene Daten‘) werden Daten bezeichnet, die von allen zu jedem Zweck genutzt, weiterverbreitet und weiterverwendet werden dürfen.[1] Einschränkungen der Nutzung sind nur erlaubt, um Ursprung und Offenheit des Wissens zu sichern, beispielsweise durch Nennung des Urhebers oder die Verwendung einer Share-alike-Klausel.[2] Solch eine Einschränkung ist nur dann möglich, wenn die Daten durch Immaterialgüterrechte geschützt sind.[3][4]
Offene Daten sind sämtliche Datenbestände, die im Interesse der Allgemeinheit der Gesellschaft ohne jedwede Einschränkung zur freien Nutzung, zur Weiterverbreitung und zur freien Weiterverwendung frei zugänglich gemacht werden.[1] Die wissenschaftliche Literatur zitiert beispielhaft Lehrmaterial, Geodaten, Statistiken, Verkehrsinformationen, wissenschaftliche Publikationen, medizinische Forschungsergebnisse oder Hörfunk- und Fernsehsendungen.[1] Bei Open Data kann es sich über Datenbestände staatlicher Stellen hinaus auch um Daten privatwirtschaftlich agierender Unternehmen, Hochschulen sowie Non-Profit-Einrichtungen handeln.[5]
Eine ausführlichere Definition der Kriterien für offene Daten wurde erstmals 2006 von der Open Knowledge Foundation in der Offen-Definition veröffentlicht.[2] Hervorzuheben ist, dass offene Daten keine personenbezogenen Daten oder dem Datenschutz unterliegende Daten beinhalten dürfen.[6]
Um die freie Nutzbarkeit offener Daten zu kennzeichnen, können geeignete freie Lizenzen verwendet werden. Lizenzen, die die Nutzung der Daten einschränken, beispielsweise, indem sie Veränderungen oder kommerzielle Nutzung untersagen, entsprechen nicht der Vereinbarung der „Berliner Erklärung über offenen Zugang zu wissenschaftlichem Wissen“ und der Offen-Definition und gelten somit nicht als offene Daten.
Geschichte
Das Konzept hinter Open Data kann bis auf das Internationale Geophysikalische Jahr1957/-58 zurückgeführt werden. Damaliges Ziel war, durch die Einrichtung von Datenaustauschzentren und die Standardisierung von Metadaten den Austausch und die Nutzung wissenschaftlicher Daten zu erleichtern.[7]
In den 1970er Jahren wird der Begriff erstmals in einer Verordnung erwähnt. Wenn internationale Partner die NASA durch Bodenkontrollstationen beim Betrieb amerikanischer Satelliten unterstützten, erforderten die internationalen Vereinbarungen, dass diese Partner eine Open-Data-Richtlinie (im Original open data policy) einführten. Diese Richtlinie musste vergleichbare Anforderungen an die öffentliche Verfügbarkeit von Daten machen wie die hauseigenen Richtlinien der NASA und anderer teilnehmender US-Einrichtungen. Auch das Format, in dem die Daten bereitgestellt wurden, wurde darin spezifiziert.[8]
1995 ging ein Bericht der National Academy of Sciences auf diese und vergleichbare Vereinbarungen zum Austausch wissenschaftlicher Daten ein:[9]
“International programs for global change research and environmental monitoring crucially depend on the principle of full and open exchange …. Experience has shown that increased access to scientific data, information, and related products has often led to significant scientific discoveries and the opportunity for educational enhancement.”
„Internationale Programme zur Erforschung der Weltveränderung und zur Umweltüberwachung hängen entscheidend vom Prinzip des vollständigen und offenen Austauschs ab… Die Erfahrung zeigt, dass gesteigerter Zugang zu wissenschaftlichen Daten, Informationen und verwandten Ergebnissen häufig zu signifikanten wissenschaftlichen Entdeckungen und zu Gelegenheiten für die Verbesserung der Bildung geführt hat.“
– On the Full and Open Exchange of Scientific Data
Aus diesem Antrieb, wissenschaftliche Daten und Erkenntnisse frei teilen und nachnutzen zu können, entstand auch die Open-Access-Bewegung, die peer-reviewte Forschungsergebnisse der Allgemeinheit frei zugänglich machen möchte.
Der Open-Data-Begriff ist jedoch nicht nur auf wissenschaftliche Daten beschränkt. Die Konzepte Open Government und Open Data sind eng verwandt – in den Vereinigten Staaten wird zudem noch der Begriff Open Government Data verwendet, wobei dieser Begriff sowohl „Daten, die einer Open Government entstammen“ als auch „Offene Daten, die einer Regierung entstammen“ bedeuten kann.[8] In Ländern, in denen transparentes Regierungshandeln durch Informationsfreiheitsgesetze verbrieft ist, hatte die Bürgerschaft zwar rechtlichen Anspruch auf Daten aus Regierungshand, musste diese jedoch individuell anfragen. Ab der Verbreitung des World Wide Web in den 1990ern entstanden in Ländern mit Informationsfreiheitskultur Gesetzesinitiativen, Daten über Regierungshandeln auch ohne vorherige Anfrage maschinenlesbar im Netz zur Verfügung zu stellen.[8][10]
Rechtlicher Rahmen
Dieser Artikel oder Absatz stellt die Situation in Deutschland dar. Bitte hilf uns dabei, die Situation in anderen Staaten zu schildern.
Die Mitgliedsländer der Europäischen Union bekamen durch die PSI-Richtlinie vom 17. November 2003 den Auftrag, bis 1. Juli 2005 nationales Recht für die Weiterverwendung von Informationen des öffentlichen Sektors zu schaffen. Der österreichische Nationalrat setzte die Richtlinie zum 19. November 2005 im Informationsweiterverwendungsgesetz (IWG) um. Der Deutsche Bundestag verabschiedete das Informationsweiterverwendungsgesetz, das am 19. Dezember 2006 in Kraft trat.
Als Erweiterung dieser Regelung beschloss der deutsche Bundestag 2017 das sogenannte Open-Data-Gesetz, wodurch Daten von unmittelbarenBundesbehörden ab 13. Juli 2018 maschinenlesbar und entgeltfrei öffentlich zugänglich gemacht werden müssen.[11] Allerdings wurde kritisiert, dass es durch dieses Gesetz keinen Rechtsanspruch auf die Daten gibt und es weitreichende Ausnahmetatbestände für die Veröffentlichung von Daten gibt.[12] Die Bereitstellungspflicht für Open Data wurde mit dem Zweiten Open-Data-Gesetz (Gesetz zur Änderung des E-Government-Gesetzes und zur Einführung des Gesetzes für die Nutzung von Daten des öffentlichen Sektors) auch auf alle mittelbaren Bundesbehörden sowie Forschungsdaten ausgeweitet.[11] Der Gesetzentwurf für das Zweite Open-Data-Gesetz wurde vom Bundeskabinett am 10. Februar 2021 beschlossen[13] und trat am 23. Juli 2021 als Datennutzungsgesetz in Kraft.[14] Durch dieses Gesetz wurde das bisherige Informationsweiterverwendungsgesetz durch das Datennutzungsgesetz abgelöst.
Ebenfalls im Juli 2021 wurde die bisherige europäische PSI-Richtlinie durch die Richtlinie 2019/1024 ersetzt, die nun ausdrücklich „Open-Data-Richtlinie“ heißt.[15]
Die Koalitionsparteien der Ampel-Koalition einigten sich in ihrem Koalitionsvertrag 2021 auf mehrere Gesetzesvorhaben, die zu Open Data führen sollen. Neben einem Transparenzgesetz, einem Rechtsanspruch auf Open Data und einem Mobilitätsdatengesetz hoben sie die Bedeutung der Veröffentlichung von Forschungsdaten hervor und planten ein Forschungsdatengesetz.
„Das ungenutzte Potential, das in zahlreichen Forschungsdaten liegt, wollen wir effektiver für innovative Ideen nutzen. Den Zugang zu Forschungsdaten für öffentliche und private Forschung wollen wir mit einem Forschungsdatengesetz umfassend verbessern sowie vereinfachen und führen Forschungsklauseln ein.“[16]
Forderungen der Open-Data-Bewegung
Open Data bezieht sich speziell auf Informationen, außerhalb einer Textform, wie zum Beispiel Wetterdaten, Karten, Genomen oder medizinischen Daten. Da dieses Material von kommerziellem Interesse ist, kommt es hier oft zu Widerspruch. Befürworter von Open Data argumentieren jedoch, es handle sich dabei um Allgemeingut, und die freie Verwendung der Daten dürfe nicht durch Restriktionen behindert werden.
Ein typischer Fall, der die Notwendigkeit von Open Data zeigen soll:
“Numerous scientists have pointed out the irony that right at the historical moment when we have the technologies to permit worldwide availability and distributed process of scientific data, broadening collaboration and accelerating the pace and depth of discovery […] we are busy locking up that data and preventing the use of correspondingly advanced technologies on knowledge.”
„Viele Wissenschaftler haben die Ironie aufgezeigt, dass gerade jetzt, zu dem Zeitpunkt in der Geschichte, da wir die Technologien haben, die eine weltweite Verfügbarkeit von wissenschaftlichen Daten und verteilte Verarbeitung dieser ermöglichen, wo Zusammenarbeit vertieft werden und Entdeckungen beschleunigt werden können, dass genau zu diesem Zeitpunkt wir unsere Zeit darauf verwenden, ebendiese Daten verschlossen zu halten und dadurch die Anwendung ebenso fortschrittlicher Technologien zu ihrer Erschließung verhindern.“
– John Wilbanks, Executive Director, Science Commons[17]
Datenerzeuger vernachlässigen oftmals die Notwendigkeit, Benutzerrechte festzulegen. Zum Beispiel kann eine fehlende (eventuell freie) Lizenzierung Daten unnötig von einer weiteren freien Verwendung ausschließen. Befürworter von Open Data argumentieren jedoch, dass es sich bei vielen potenziellen Datensätzen ohnehin um Faktendaten handle. Das heißt, dass den Daten keine für einen urheberrechtlichen Schutz notwendige individuelle geistige Schöpfung innewohne, sondern es sich um möglichst akkurate Abbildungen der Realität, beispielsweise durch Messungen, handle.[18]
Die Open-Data-Bewegung fordert nicht nur den freien Zugang zu Daten, sondern generiert diese auch selber. Ein Beispiel dafür ist OpenStreetMap. Befürworter behaupten, dass durch das Open-Data-Konzept auch eine demokratischere Gesellschaft möglich sei – so ermöglicht beispielsweise die englische Webseite TheyWorkForYou.com, das Abstimmungsverhalten der britischen Abgeordneten nachzuverfolgen.[19] Im Zusammenhang mit Daten, die eine Regierung betreffen, wird auch von Open Government gesprochen. Rob McKinnon sagte bei einem Vortrag auf der re:publica, dass „der Verlust des Datenprivilegs zu neuen Machtstrukturen innerhalb einer Gesellschaft führen kann“.[20]
Ein weiteres Beispiel ist die Seite farmsubsidy.org, die zeigt, an wen EU-Agrarsubventionen gezahlt werden, die fast die Hälfte des Gesamtbudgets ausmachen. Speziell deutsche Politiker sperren sich seit langem, dass diese Informationen öffentlich werden.
Daten, die den Kriterien von Open Data genügen sollen, müssen strukturiert und maschinenlesbar zur Verfügung gestellt werden, so dass sie sich filtern, durchsuchen und von anderen Anwendungen weiterverarbeiten lassen können. Daten von Regierungsstellen zum Beispiel liegen oft als PDF vor und sind somit nicht ohne Probleme weiterzuverarbeiten.
Argumentationen für und gegen Open Data
Die folgenden Abschnitte ist nicht hinreichend mit Belegen (beispielsweise Einzelnachweisen) ausgestattet. Angaben ohne ausreichenden Beleg könnten demnächst entfernt werden. Bitte hilf Wikipedia, indem du die Angaben recherchierst und gute Belege einfügst.
Die Forderung nach Open Data wird unterschiedlich begründet. Einerseits wird argumentiert, dass Open Data Transparenz und Zusammenarbeit fördert.[21] An anderen Stellen wird der volkswirtschaftliche Wert offener Daten aus der öffentlichen Verwaltung hervorgehoben, der 2016 von der Konrad-Adenauer-Stiftung auf jährlich 43,1 Milliarden Euro geschätzt wurde.[22] Insbesondere bei Informationen der öffentlichen Hand lautet ein weiteres Argument, dass es sich um aus öffentlichen Mitteln finanzierte Daten handelt, die daher auch frei durch die Allgemeinheit verwendbar sein sollen.[23]
Argumente für Open Data
„Daten gehören den Menschen“ – typische Beispiele: Genome, medizinische Forschung, umweltwissenschaftliche Daten.
Öffentliche Gelder haben die Generierung der Daten erst ermöglicht, also müssen sie auch öffentlich zugänglich sein (tatsächlich treten Wissenschaftler in der Regel die Rechte an den von ihnen generierten Daten an private Verlage ab, wenn sie ihre Ergebnisse publizieren).
Die durch freien Zugang und Verwendung der Daten ermöglichte Zusammenarbeit erweitert die verwendbaren Daten und den Nutzen für die Allgemeinheit und den Autor. Berühmtestes Beispiel dafür ist die Wikipedia.
Innovationsschutz durch Marken- und Patentrecht. Der Urheber möchte seine neuen Ideen schützen.
Durch Open Data treten durch Steuergelder geförderte Informationssammlungen in Konkurrenz zu kommerziellen Angeboten (Wettbewerbsrecht, siehe auch Streit zur Tagesschau-App)
Durch die einfache Zugänglichkeit von Daten und eventuell sogar dem Recht, Änderungen daran vorzunehmen, besteht die Gefahr, dass die Daten absichtlich oder unabsichtlich verfälscht werden.
Durch das Offenlegen von Daten wird deren Missbrauch erleichtert. Beispiele sind Listen von Sicherheitslücken in IT-Systemen, Daten aus der Waffenforschung, oder Publikationen zu genmanipulierten hochansteckenden Vogelgrippeviren.[28]
Datenschutzrechtliche Bedenken, z. B. wenn das Verhalten von Individuen aufgezeichnet wird, und die Datensätze nicht ausreichend anonymisiert wurden.
Haftung: Je nachdem, ob die offenen Datensätze dem Kunden kostenlos oder kommerziell zugänglich gemacht werden, unterscheidet sich die Haftung wenn diese Datensätze genutzt werden, und es zu einem Schadensfall kommt. Die rechtliche Lage zur Haftung kann je nach Einzelfall stark variieren.[29]
Projekte, die Open Data anbieten
In diesem Artikel oder Abschnitt fehlen noch wichtige Informationen. Hilf der Wikipedia, indem du sie recherchierst und einfügst.
Der Hackathon „Coding da Vinci“ wird seit 2014 jährlich in Deutschland ausgerichtet und fordert Entwickler auf, Anwendungen zu erarbeiten, die Daten aus Kultureinrichtungen nutzbar machen. Im Gegensatz zu klassischen Hackathons haben die Teilnehmer des „Coding da Vinci“ sechs bis zehn Wochen Zeit für die Entwicklung der Softwareanwendung.[40] 2015 veranstaltete die Stadt Freiburg im Breisgau einen Open-Data-Hackathon zur besseren Nutzung der Open Data der Stadt.[41] Die Deutsche Bahn veranstaltete 2015 eine „DB Open Data-Train Challenge“ zur Entwicklung einer neuartigen Fahrplananzeige.[42]
Closed Data
Es existieren verschiedene Mechanismen, um den freien Zugang zu Daten und deren freie Weiterverwendung zu erschweren:
Lagerung der Daten in nicht-digitalisierter (d. h. Papier-) Form
Verwendung von proprietären Technologien (z. B. nicht-offene Dateiformate)
Zeitlich begrenzter oder kostenpflichtiger Zugang zu den Daten
Kommerzielle Anbieter, die versuchen, mit Lobbyarbeit Einfluss auf die Politik zu erlangen, und Open Data einzuschränken. Dies geschah z. B. bei PubChem, einer US-amerikanischen Datenbank zu chemischen Verbindungen.[43]
Thilo Hagendorff: Open Data. In: Jessica Heesen (Hrsg.): Handbuch Informations- und Medienethik. Metzler, Stuttgart 2016, S. 227–233.
H. Kudrnovsky: Open Data und freie und offene Geografische Informationssysteme (FOSSGIS) – ein Werkzeug für den (ehrenamtlichen) Naturschutz? – ANLiegen Natur 36(1), 2014, S. 103–107, Laufen. (anl.bayern.de PDF 0,5 MB)
↑ abcJörn von Lucke, Christian Geiger: Open Government Data (Frei verfügbare Daten des öffentlichen Sektors). Hrsg.: zeppelin university. Friedrichshafen 3. Dezember 2010 (zu.de [PDF]).
↑ abThe Open Definition. Open Knowledge Foundation, abgerufen am 18. Februar 2017 (englisch).
↑Peter Brettschneider, Alexandra Axtmann, Elisabeth Böker, Dirk Von Suchodoletz: Offene Lizenzen für Forschungsdaten. In: o-bib. Das offene Bibliotheksjournal / Herausgeber VDB. 28. September 2021, S.1–22 Seiten, doi:10.5282/O-BIB/5749 (o-bib.de [abgerufen am 6. Oktober 2021]).
↑Jörn von Lucke: Innovationsschub durch Open Data, Datenportale und Umsetzungswettbewerbe. In: Reinbert Schauer, Norbert Thom, Dennis Hilgers (Hrsg.): Innovative Verwaltung. Innovationsmanagement als Instrument von Verwaltungsreformen. Trauner, Johannes Kepler Universität Linz 2011, ISBN 978-3-85499-850-1, S.261–272.
↑Keith G Jeffery: Open Data – The Time has Come. Blogkommentar. In: petermr's blog. 3. Oktober 2006, abgerufen am 18. Februar 2017 (englisch): „Although the term open data is rather new, the concept is rather old. The International Geophysical Year of 1957-8 caused the setting up of several world data centres and – more importantly – set standards for descriptive metadata to be used for data exchange and utilisation.“
↑ abcHarlan Yu, David G. Robinson: The New Ambiguity of ‘Open Government’. ID 2012489. Social Science Research Network, Rochester, NY 28. Februar 2012, doi:10.2139/ssrn.2012489.
↑National Research Council: On the Full and Open Exchange of Scientific Data. 1995, doi:10.17226/18769.
↑AB 1624 (Bowen). 18. Mai 1993, abgerufen am 18. Februar 2017 (englisch).
↑Richtlinie (EU) 2019/1024 des Europäischen Parlaments und des Rates vom 20. Juni 2019 über offene Daten und die Weiterverwendung von Informationen des öffentlichen Sektors (Neufassung). Band172, 20. Juni 2019 (europa.eu [abgerufen am 2. Oktober 2023]).
↑Marcus M. Dapp, Dian Balta, Walter Palmetshofer, Helmut Krcmar, Pencho Kuzev: Open Data the benefits. Das volkswirtschaftliche Potential für Deutschland. Hrsg.: Konrad-Adenauer-Stiftung. Konrad-Adenauer-Stiftung e. V., Berlin 2016, ISBN 978-3-95721-202-3.
↑Deutsche Forschungsgemeinschaft: Open Science als Teil der Wissenschaftskultur. Positionierung der Deutschen Forschungsgemeinschaft. 17. Oktober 2022 (zenodo.org [abgerufen am 15. Dezember 2022]).
↑Folie 13.Open Data der Stadt Zürich. Was bringt es? 27. November 2014; abgerufen am 4. Februar 2015.
↑Folie 16.Open Data der Stadt Zürich. Was bringt es? 27. November 2014; abgerufen am 4. Februar 2015.
↑Folie 17.Open Data der Stadt Zürich. Was bringt es? 27. November 2014; abgerufen am 4. Februar 2015.