Für Datenbereitstellende: Antworten auf die wichtigsten Fragen rund um die Integration Ihrer Daten-/Informationsangebote in umwelt.info
Über die Anbindung von Daten
Welche Daten und Informationen werden angebunden?
Das angestrebte Daten- und Informationsspektrum des umwelt.info-Portals setzt sich aus amtlichen und nichtamtlichen Angeboten zusammen, die einen Umwelt- und Naturschutzbezug haben. Das umfasst zum Beispiel Metadaten, Dienste, Messtellen, Berichte, Forschungsergebnisse, Gutachten und Bildungsmaterialien sowie auch Informationen zu Rechts- und Verwaltungsvorschriften, Förderprogrammen oder Verfahren der Umwelt- und Naturschutzverwaltungen.
Aktuell legen wir keine definierte Abgrenzung über die Umweltrelevanz von Daten zugrunde, sondern vertrauen auf Ihre Expertise. Im Zweifel entscheiden wir fallspezifisch gemeinsam mit Ihnen über die Einbindung Ihrer Angebote. Eine portalspezifische Eingrenzung des Themenfelds ist jedoch vorgesehen und wird sich an aktuellen Umwelt- und Naturschutzfragen orientieren. Uns ist es wichtig, dass wir den dafür notwendigen Datenbestand sichtbar machen.
Im Rahmen dieses Minimum Viable Products wurden insgesamt über 100 Datenquellen integriert, darunter verstehen wir öffentlich verfügbare Websites oder spezifische Daten- und Informationsangebote, die wir in den Metadatensuchindex integrieren. Pro Institution sind daher mehrere Datenquellen möglich. Aktuell kommen diese Datenquellen zum Großteil aus der Bundes- und Landesumweltverwaltung.
Zusätzlich erweitern wir themenbezogen das Spektrum um nichtamtliche Daten und indexieren Datenquellen unterschiedlicher Institutionen. Den Anfang macht der Themenbereich Wasser, wobei wir uns konkret mit Extremereignissen wie z. B. Dürre oder Hochwasser beschäftigen. Für die erste umwelt.info Kartenanwendung wurden über 30 Informations- und Datenquellen zu Grundwassermessstellen angebunden.
Kann ich mich direkt an umwelt.info wenden?
Ja, insbesondere wenn Sie über offene Daten und Informationen mit Umweltschutzrelevanz verfügen und an der Indexierung dieser Inhalte interessiert sind, begrüßen wir Ihre Eigeninitiative! Wir freuen uns jederzeit über Ihre Nachricht: umwelt.info@uba.de.
Wann werden meine Daten angebunden?
Insgesamt wollen wir im Rahmen der Digitalstrategie des Bundes bis Ende der Legislaturperiode mindestens 300 Datenquellen integrieren. Wir verfolgen drei Säulen der Integration von Datenquellen:
- Indexierung zur Vorbereitung redaktioneller Beiträge: priorisiert nach Themengebieten ergänzen wir vorhandene Daten aus Behörden mit Datenquellen aus Wissenschaft und Zivilgesellschaft
- Indexierung aller Quellen des Bundesministeriums für Umwelt, Naturschutz, nukleare Sicherheit und Verbraucherschutz (BMUV), des Umweltbundesamts (UBA), des Bundesamts für Naturschutz (BfN), des Bundesamts für die Sicherheit der nuklearen Entsorgung (BASE) und des Bundesamts für Strahlenschutz (BfS)
- Erfassung aller Datenquellen der 16 Landesumweltverwaltungen
Welche Anforderungen müssen Daten erfüllen, damit sie auf umwelt.info eingebunden werden?
Für die auf umwelt.info eingebundenen Daten gibt es keine speziellen Anforderungen, wir wollen im Gegenteil möglichst alle Daten und digitalen Informationen mit Umwelt- und Naturschutzbezug erfassen und sichtbar machen, egal in welcher Form sie vorliegen. Das soll den Aufwand für Datenbereitstellende so unkompliziert wie möglich machen.
Wir freuen uns natürlich trotzdem über möglichst strukturierte Daten. Falls Sie also Kapazitäten und Interesse haben, hilft es zum Beispiel schon, wenn jeder Eintrag (egal ob Datenbank, Karte, oder Inhaltsangebot) eine eigene URL hat, auf die wir verweisen können.
Bei der Anbindung bemühen wir uns außerdem aus nicht maschinenlesbar vorliegenden Angeboten möglichst viele strukturierte Attribute wie Lizenzen oder Raumbezüge zu extrahieren, auch wenn diese nicht explizit angegeben waren.
Welches Metadatenformat wird genutzt?
Das Projekt setzt keinen bestimmten Metadatenstandard voraus und etabliert auch keinen neuen Metadatenstandard für den deutschsprachigen Raum. Unser Ziel ist, alle vorhandenen Formate verarbeiten zu können.
Um unseren Suchindex möglichst einheitlich aufzubereiten wird intern ein Metadatenschema verwendet, das sich zwar an DCAT-AP.de anlehnt, letztlich aber vor allem darauf abzielt, allen fachlich relevanten Datenquellen gerecht zu werden – also auch Strukturen und Werte abbilden zu können, die nicht den Vorgaben der Open-Data-Meldekette entsprechen. So können wir jederzeit unser Metadatenschema um zusätzliche Attribute erweitern, wenn fachlich relevante Informationen nicht mit den bestehenden Attributen abgebildet werden können.
Zu den Metadaten jedes Inhaltes gibt es außerdem eine Qualitätsbewertung, die wir als Punktzahl sichtbar machen.
Muss ich für umwelt.info eine Schnittstelle (API) bereitstellen?
Eine API (Programmierschnittstelle engl.: Application Programming Interface), idealerweise auf einem offenen Standard basierend und maschinenlesbar dokumentiert, ist für die Nachnutzung von Daten von großem Wert, aber keine notwendige Voraussetzung für die Integration einer Datenquelle in den Metadatenindex von umwelt.info.
Wir streben an, alle fachlich relevanten Datenangebote einzubinden und strukturiert durchsuchbar zu machen. Dazu erstellen wir neben reinen Harvestern zum Abrufen der Metadaten über APIs auch Crawler und Scraper, um Daten und Informationen, die unstrukturiert in Verzeichnisstrukturen oder als Websites vorliegen, entsprechend unseres internen Metadatenschemas zu erfassen.
Falls Sie sich gerade damit beschäftigen, Ihre Datenbestände über eine API verfügbar zu machen, stehen wir Ihnen mit unseren Erfahrungen aus der Integration verschiedener Datenquellen gerne beratend zur Verfügung.
Wie läuft der Prozess der Datenintegration genau ab? Welchen Aufwand habe ich?
Unser Anspruch ist, den Prozess der Integration mit minimalem Aufwand für die datenbereitstellenden Partner zu realisieren. Ein strukturierter Ablauf, den wir regelmäßig gemeinsam mit den involvierten Partnern evaluieren, gewährleistet größtmögliche Effizienz für alle Beteiligten. Dabei gehen wir in vier Schritten vor:
- Erstkontakt durch umwelt.info: Information über die geplante Anbindung und Übersendung einer vorbereitenden Liste der öffentlichen Datenquellen Ihrer Institution, die wir in einem ersten Aufschlag zusammengetragen haben.
- Gesprächsvorbereitung: Sichtung und Überarbeitung der Liste an Datenquellen durch Ihre Organisation. Diese Liste, die alle für die Indexierung notwendigen Detailinformationen zu den einzelnen Datenquellen enthalten soll, ist für uns das zentrale Werkzeug zur Planung der Anbindung Ihrer Angebote.
- Kurationsgespräch: Schlüsseltermin zur Absprache der inhaltlichen und organisatorischen Einzelheiten. Im Fokus stehen Art und Inhalte der Quellen, Schnittstellen, Ansprechpersonen und zukünftige Projekte mit Relevanz für umwelt.info. Anschließend sprechen wir über weitere Schritte und alle notwendigen Kommunikationsflüsse. Das Credo lautet: So wenig wie möglich, so viel wie nötig. Wir arbeiten nicht über Ihre Köpfe hinweg, schätzen Ihre Unterstützung und möchten Sie entsprechend Ihrer Bedürfnisse in den Prozess einbinden. Gleichzeitig ist uns ein wichtiges Anliegen, die Arbeitslast für Sie so gering wie möglich zu halten. Natürlich ist während des gesamten Gesprächs Zeit für Ihre Fragen, Anregungen, Bedarfe und Bedenken eingeplant.
- Technische Anbindung: Erschließung der besprochenen Datenquellen durch Scraping, Harvesting, Crawling und manuelle Einbindung. Dazu benötigen wir im Einzelfall für technische und redaktionelle Aspekte Ihre Hilfe. In dieser Phase erfolgt auch die Abstimmung fachlich sinnvoller Aktualisierungsintervalle, um eine Überlastung der Quellsysteme zu verhindern. Technisch-fachliche Mitarbeiter*innen Ihrer Institution sind jederzeit herzlich eingeladen, sich über unser OpenCoDE GitLab direkt an der Umsetzung der Integration ihrer Datenquellen zu beteiligen – ein Muss ist das aber nicht.
Bekomme ich bei umwelt.info Unterstützung zur Digitalisierung meiner analogen Datenbestände?
Wir verfügen nicht über die nötigen Personalkapazitäten und das Mandat, analoge Datenbestände und Informationen zu digitalisieren. Beratende Unterstützung zur offenen Bereitstellung dieser Inhalte bieten wir Ihnen aber gerne an!