zuletzt aktualisiert am:

Über die Anbindung von Daten

Für Datenbereitstellende: Antworten auf die wichtigsten Fragen rund um die Integration Ihrer Daten-/Informationsangebote in umwelt.info

Schnee im Wald und Sonnenstrahlen zwischen den Bäumen
Foto: Caleb Stokes; unsplash.com

Welche Daten/Informationen werden angebunden und in welcher Reihenfolge?

Das angestrebte Daten- und Informationsspektrum des umwelt.info-Portals umfasst sowohl amtliche als auch nicht amtliche Angebote mit Umweltbezug. Es wird unter anderem ⁠Metadaten⁠, Dienste, Berichte, Forschungsergebnisse, Gutachten und Bildungsmaterialien sowie auch Informationen zu Rechts- und Verwaltungsvorschriften, Förderprogrammen oder Verfahren der Umwelt- und Naturschutzverwaltungen beinhalten.

Im Rahmen des Minimal Viable Products wurden insgesamt über 100 Datenquellen integriert. Diese Datenquellen kommen zum Großteil aus der Bundes- und Landesumweltverwaltung. Wichtig: Wenn wir von Datenquellen sprechen, meinen wir öffentlich verfügbare Websites oder spezifische Daten-/Informationsangebote innerhalb dieser, die wir in den Metadatensuchindex integrieren. Pro Institution sind daher mehrere Datenquellen möglich.

Diese Zahl soll im Rahmen der Digitalstrategie des Bundes bis Ende der Legislaturperiode auf mindestens 300 Datenquellen steigen. Hierbei verfolgen wir drei Säulen der Integration von Datenquellen:

  • Indexierung aller Quellen des Bundesministeriums für Umwelt, Naturschutz, nukleare Sicherheit und Verbraucherschutz (BMUV), des Umweltbundesamts (⁠UBA⁠), des Bundesamts für Naturschutz (⁠BfN⁠), des Bundesamts für die Sicherheit der nuklearen Entsorgung (BASE) und des Bundesamts für Strahlenschutz (BfS)
  • Erfassung aller Datenquellen der 16 Landesumweltverwaltungen
  • Indexierung zur Vorbereitung redaktioneller Beiträge. 

    Für die themenbezogene Vorgehensweise erweitern wir das Spektrum auch um nicht-amtliche Daten. Hierbei erfassen wir alle Datenquellen der jeweiligen Institutionen, indexieren jedoch nach inhaltlichen Schwerpunkten. Den Anfang macht das Umweltkompartiment Wasser, wobei wir uns konkret mit Extremereignissen wie z. B. ⁠Dürre⁠ oder Hochwasser beschäftigen. Beispielsweise werden über 30 Informations-/Datenquellen zu Grundwassermessstellen für die erste umwelt.info Kartenanwendung technisch angebunden.

Die sich anschließenden Schwerpunkte werden in unseren Partizipationsformaten (z. B. Beirat, Arbeitskreis datenhaltender Stellen) erarbeitet und zu gegebener Zeit bekanntgegeben. 

Wann kann ich damit rechnen, dass umwelt.info mich bezüglich der Indexierung meiner Daten/Informationen kontaktiert?

Derzeit stehen wir vor allem mit den Bundes- und Landesbehörden der Umweltressorts im Austausch. Bis Ende des Jahres wollen wir in diesem Kontext alle Landesumweltverwaltungen kontaktiert haben, um den Prozess der Datenintegration anzustoßen. Ab Mitte 2024 möchten wir die Anbindung von Inhalten aus Wissenschaft und Zivilgesellschaft verstärken. Sobald wir zum weiteren Ablauf nähere Auskünfte erteilen können, erfahren Sie es hier – schauen Sie also regelmäßig vorbei, um auf dem Laufenden zu bleiben!

Sanduhr auf weißem Hintergrund
Foto: Gaelle Marcel, unsplash.com

Kann ich mich auch selbst an umwelt.info wenden, wenn ich über offene Daten-/Informationsangebote mit Umwelt-/Naturschutzrelevanz verfüge und interessiert an der Indexierung meiner Inhalte bin?

In diesem Fall begrüßen wir Ihre Initiative und freuen wir uns jederzeit über Ihre Nachricht! Sprechen Sie uns einfach an: umwelt.info@uba.de.

Wie läuft der Prozess der Datenintegration ab? Wie viele und welche Aufwände entstehen mir?

Datenintegration durch umwelt.info in 4 Schritten. Quelle: Stefan Krämer | Nationales Zentrum für Umwelt- und Naturschutzinformationen | Umweltbundesamt

Unser Anspruch ist, den Prozess der Daten-/Informationsintegration mit minimalem Aufwand für die datenbereitstellenden Partner zu realisieren. Ein strukturierter Ablauf, den wir regelmäßig gemeinsam mit den involvierten Partnern evaluieren, gewährleistet größtmögliche Effizienz für alle Beteiligten. Dabei gehen wir in vier Schritten vor:

Zuerst nehmen wir Kontakt zu Ihnen auf, um Sie über die geplante Integration Ihrer Angebote in unseren Metadatenindex zu informieren. Sie erhalten mit dieser Information auch eine vorbereitende Liste der öffentlichen Datenquellen Ihrer Institution, die wir nach bestem Wissen zusammengetragen haben. Diese Liste, die alle für die Indexierung notwendigen Detailinformationen zu den einzelnen Datenquellen enthält, ist für uns das zentrale Werkzeug zur Planung der Anbindung Ihrer Angebote.

Daher bitten wir Sie im nächsten Schritt, die Liste mit allen betroffenen Personen Ihrer Institution zu sichten, zu korrigieren und zu vervollständigen.

Die überarbeitete Liste dient dann als Ausgangspunkt für Schritt drei – das Kurationsgespräch. In diesem Termin, den wir organisieren und als Online-Veranstaltung ausrichten, möchten wir organisatorische Aspekte Ihrer Datenquellen im Detail mit Ihnen besprechen. Im Fokus stehen Art und Inhalte der Quellen, Schnittstellen, Ansprechpersonen und zukünftige Projekte mit Relevanz für umwelt.info. Gleichzeitig nutzen wir diese Gelegenheit, um uns und das Projekt vorzustellen und Ihnen tagesaktuelle Einblicke in unsere Arbeitsweise zu gewähren. Nach einer Einführung in die Hintergründe, Inhalte und Ziele des Projekts besteht in diesem Kontext die Option auf den gemeinsamen Blick ins OpenCoDE-GitLab. Anschließend sprechen wir über weitere Schritte und alle notwendigen Kommunikationsflüsse. Das Credo lautet: So wenig wie möglich, so viel wie nötig. Wir arbeiten nicht über Ihre Köpfe hinweg, schätzen Ihre Unterstützung und möchten Sie entsprechend Ihrer Bedürfnisse in den Prozess einbinden. Gleichzeitig ist uns ein wichtiges Anliegen, die Arbeitslast für Sie so gering wie möglich zu halten. Der offene Dialog im Kurationsgespräch ist der Schlüssel, um hier ein individuelles, passendes Maß zu identifizieren. Natürlich ist während des gesamten Gesprächs Zeit für Ihre Fragen, Anregungen, Bedarfe und Bedenken eingeplant.

Nun kann Schritt 4, die tatsächliche technische Anbindung durch die Mitarbeiter*innen des umwelt.info-Teams beginnen. In dieser Phase indexieren wir die besprochenen Datenquellen durch Scraping, Harvesting, Crawling oder manuelle Einbindung. Dazu benötigen wir im Einzelfall für technische und redaktionelle Aspekte Ihre Hilfe. In dieser Phase erfolgt auch die Abstimmung fachlich sinnvoller Aktualisierungsintervalle, um eine Überlastung der Quellsysteme zu verhindern. Technisch-fachliche Mitarbeiter*innen Ihrer Institution sind jederzeit herzlich eingeladen, sich über OpenCoDE direkt an der Umsetzung der Integration ihrer Datenquellen zu beteiligen – ein Muss ist das aber nicht.

Tor aus Zweigen im Herbstlaub
Foto: Tim Hufner, unsplash.com

Welches Metadatenformat nutzt umwelt.info?

Das Projekt setzt keinen bestimmten Metadatenstandard voraus und etabliert auch keinen neuen Metadatenstandard für den deutschsprachigen Raum. Unser Ziel ist, alle vorhandenen Formate verarbeiten zu können. Aus der Verschiedenheit der Datenquellen ergibt sich der Bedarf, diese für den Suchindex möglichst einheitlich aufzubereiten. Hierzu wird intern ein Metadatenschema verwendet, das sich zwar an DCAT-AP.de anlehnt, letztlich aber vor allem darauf abzielt, allen fachlich relevanten Datenquellen gerecht zu werden – also auch Strukturen und Werte abbilden zu können, die nicht den Vorgaben der Open-Data-Meldekette entsprechen.

Konkret bemühen wir uns bei der Anbindung, auch aus nicht maschinenlesbar vorliegenden Angeboten neben Standards wie Titel und Beschreibung zusätzliche strukturierte Attribute wie Lizenzen oder Raumbezüge zu extrahieren. Des Weiteren sind wir jederzeit bereit, unser Metadatenschema um zusätzliche Attribute zu erweitern, wenn fachlich relevante Informationen nicht mit den bestehenden Attributen abgebildet werden können.

Wofür steht der Begriff „Datenquelle“?

Unter Datenquellen verstehen wir öffentlich verfügbare Websites oder spezifische Daten-/Informationsangebote innerhalb dieser, die wir in den Metadatensuchindex integrieren. Pro Institution sind daher mehrere Datenquellen möglich.

Muss ich für umwelt.info eine API bereitstellen?

Eine API (Programmierschnittstelle engl.: Application Programming Interface), idealerweise auf einem offenen Standard basierend und maschinenlesbar dokumentiert, ist für die Nachnutzung von Daten von großem Wert, aber keine notwendige Voraussetzung für die Integration einer Datenquelle in den Metadatenindex von umwelt.info. 

Wir streben an, alle fachlich relevanten Datenangebote einzubinden und strukturiert durchsuchbar zu machen. Dazu erstellen wir neben reinen Harvestern zum Abrufen der ⁠Metadaten⁠ über APIs auch ⁠Crawler⁠ und Scraper, um Daten und Informationen, die unstrukturiert in Verzeichnisstrukturen oder als Websites vorliegen, entsprechend unseres internen Metadatenschemas zu erfassen. Falls Sie sich gerade damit beschäftigen, Ihre Datenbestände über eine API verfügbar zu machen, stehen wir Ihnen mit unseren Erfahrungen aus der Integration verschiedener Datenquellen gerne beratend zur Verfügung.  

Kleiner Wasserfall im Wald
Foto: 1DtLNRgv1Q6XWSY Asp1Qp2184WVFyR; unsplash.com
Blatt in Hand vor Laubbaum
Foto: Markus Spiske, unsplash.com

Auf welcher Basis entscheidet umwelt.info über die Umweltrelevanz von Daten und Informationen?

Aktuell legen wir dieser Entscheidung noch keine definierte Abgrenzung zugrunde, sondern vertrauen auf Ihre Expertise und entscheiden – wo nötig – fallspezifisch gemeinsam mit Ihnen über die Umweltrelevanz Ihrer Angebote. Eine portalspezifische Eingrenzung des Themenfelds ist jedoch vorgesehen und wird sich an aktuellen Umwelt- und Naturschutzfragen orientieren. Uns ist es wichtig, dass wir den dafür notwendigen Datenbestand sichtbar machen.

Bekomme ich bei umwelt.info Unterstützung zur Digitalisierung meiner analogen Datenbestände?

Wir verfügen nicht über die nötigen Personalkapazitäten und das Mandat, analoge Datenbestände und Informationen zu digitalisieren. Beratende Unterstützung zur offenen Bereitstellung dieser Inhalte bieten wir Ihnen aber gerne an!

Noch ein Portal? Verstärkt umwelt.info die Zersplitterung der Umweltdatenlandschaft nicht noch mehr, statt sie zu verringern?

Das umwelt.info-Portal fügt sich in die existierende Umweltinformationslandschaft ein, indem es den Auftrag verfolgt, existierende Inhalte besser auffindbar zu machen. Es wird nicht die Zersplitterung selbst bekämpfen, sondern ergänzt als umweltspezifische Suchmaschine eine übergeordnete Ebene, mit deren Hilfe die Navigation der vielfältigen Angebote deutlich erleichtert werden soll. Bestehende Portale wie z. B. GovData (das zentrale Portal für offene Verwaltungsdaten) oder das bundesweite Geoportal.de, aber auch kleinere Websites und Einzelangebote werden durch umwelt.info demnach weder ersetzt noch dupliziert – vielmehr ist das Ziel, ihre Reichweite zu erhöhen und sie zueinander in Relation zu setzen. So soll vorhandenes Wissen zu umwelt- und naturschutzbezogenen Fragestellungen ganzheitlich – d. h. sektoren-, anbieter- und ebenenübergreifend – abgebildet werden.

toter Baum im See
Foto: Philipp Deus, unsplash.com

Wird mein eigenes Portal durch umwelt.info überflüssig?

Nein, auf gar keinen Fall! Das umwelt.info-Portal wird bestehende Daten- und Informationsangebote weder duplizieren noch ersetzen. Existierende Websites, Datensätze und Apps sollen lediglich besser auffindbar gemacht werden, um ihnen zu noch mehr Reichweite und Wertschöpfung zu verhelfen. Der Suchindex beinhaltet daher nur Metadaten und verlinkt immer auf die Primärquelle.

Wie hat Ihnen der Beitrag gefallen?
Autor / Autorin
Webredaktion umwelt.info
Nationales Zentrum für Umwelt- und Naturschutzinformationen / Umweltbundesamt