zuletzt aktualisiert am:

Über die Metadatenqualität

Für Interessierte: Hier erklären wir Ihnen was die Punktzahlen an den Metadaten bedeuten.

Wie und warum wird auf umwelt.info Metadatenqualität bestimmt?

Auf umwelt.info findet sich zu den Metadaten jedes Inhaltes eine Qualitätsbewertung. Diese richtet sich zum einen an die Ersteller der Inhalte, da Metadaten wichtig sind um Inhalte schnell und gezielt zu finden. Zum anderen richtet sich die Bewertung an Dateninteressierte, um zu zeigen ob ein gefundener Inhalt bestimmte Merkmale erfüllt. Punkte wie:

  1. eine einfache Nachnutzbarkeit durch Verwendung offener Lizenzen, 
  2. ein offenes Dateiformat, oder
  3. die Möglichkeit, den Inhalt als Datensatz automatisiert herunterzuladen, sind oft wichtige Kriterien für eine Suche und werden hier übersichtlich dargestellt.

Die Bestimmung der Metadatenqualität orientiert sich an den vier FAIR-Prinzipien: Findable (Auffindbar), Accessible (Zugänglich), Interoperable (Interoperabel) und Reusable (Wiederverwendbar). Mehr zu den vier FAIR Prinzipien findet sich hier. Eine Übersicht über die Qualitätsbewertung findet sich in Tabelle 1. Die Einzelmerkmale schwanken entweder binär (gleichbedeutend mit Ja oder Nein), schrittweise (gleichbedeutend mit z.B. unspezifisch zu sehr spezifisch) oder kontinuierlich. Diese Übersicht ist auch als Factsheet herunterladbar (siehe unten).

Tabelle 1: Qualitätsmaße der Metadaten auf umwelt.info.
FAIR-Prinzip Kriterium Bewertungssystem Bedeutung
Auffindbar Kennung Ja oder nein Besitzt der Inhalt eine eindeutige Kennung?
Titel Kontinuierlich Wie gut ist die Lesbarkeit des Titels?
Beschreibung Kontinuierlich Wie gut ist die Lesbarkeit der Beschreibung?
Schlagwörter Kontinuierlich Wie gut stimmen die Schlagwörter mit dem Umweltthesaurus überein?
Raumbezug Keine Region, Allgemeine Region, Koordinatenbereich, Genaue Region, Punktkoordinate Wie präzise ist der Ortsbezug?
Zeitbezug Ja oder nein Ist ein Zeitbezug vorhanden?
Zugänglich Verweis Noch nicht auf umwelt.info implementiert.
Direktzugriff Ja oder nein Ist ein Link zum Inhalt vorhanden?
Öffentlich Ja oder nein Ist der Link ohne Anmeldung nutzbar?
Interoperabel Maschinenlesbare Daten Ja oder nein Ist der Datensatz automatisiert auslesbar?
Maschinenlesbare Metadaten Ja oder nein Sind die Metadaten automatisiert auslesbar?
Medientyp Ja oder nein Ist das Dateiformat des Datensatzes bekannt?
Offenes Dateiforma Ja oder nein Ist das Dateiformat des Datensatzes offen (z.B. .CSV)?
Wiederverwendbar Lizenz Keine Information, unklare Lizenz, Spezifische Lizenz, spezifische & offene Lizenz Ist die Lizenz bekannt und frei?
Kontakt Ja oder nein Sind Kontaktinformationen vorhanden?
Veröffentlicher*in Ja oder nein Ist der*die Herausgeber*in bekannt?
Downloads

Beispiel 1

Zur Veranschaulichung kann die Qualitätsbewertung eines Beispieltreffers zu einer Grundwassermessstelle dienen (siehe Abbildung 1). Die Auffindbarkeit hat in diesem Fall eine Punktzahl von 67. Da der Inhalt keine eindeutige Kennung hat, ist dieser Wert Null. Titel und Beschreibung haben 41 bzw. 82 Punkte was eine mittlere bzw. hohe Lesbarkeit gemäß des von uns verwendeten Lesbarkeitsindexes hat. Schlagwörter hat 80 Punkte, da vier der fünf vorhandenen Schlagwörter sich im Umweltthesaurus finden. Sowohl Raumbezug als auch Zeitbezug haben 100 Punkte, da sowohl die exakten Geodaten der Messtelle, sowie der Zeitraum der Messungen bekannt ist. Die Zugänglichkeit liegt bei 100 Punkten, da ein Direktzugriff auf den Inhalt per Link möglich ist und dieser öffentlich zugänglich ist. Die Interoperabilität liegt bei 75 Punkten, da drei der vier Einzelmerkmale voll zu treffen. Maschinenlesbare Daten werden für die Messstelle im CSV-Format angeboten, maschinenlesbare Metadaten hingegen keine. Der Medientyp ist bekannt (da ein CSV-Format verwendet wird) und es handelt sich um eine offenes Dateiformat. Die Wiederverwendbarkeit liegt bei 67 Punkten, da zwei der drei Einzelmerkmale voll zu treffen. Es wird eine bekannte, offene Lizenz verwendet (100 Punkte), es sind keine Informationen zum Kontakt vorhanden (Null Punkte) und der Herausgeber ist bekannt (100 Punkte).

Abbildung 1: Metadatenqualität eines Beispieltreffers

Beispiel 2

Um die Funktionenweise der stufenweise definierten Einzelmerkmale besser zu veranschaulichen, kann ein weiterer Beispieltreffer, diesmal von einer Schadstoffbestimmung in Tieren aus dem Pfälzerwald, dienen (siehe Abbildung 2). Im Gegensatz zum Beispiel in Abbildung 1 erzielt das Merkmal Raumbezug hier nur 50 Punkte, da nur ein größeres Gebiet (Pfälzerwald) und keine genauen Geodaten vorliegen. Auch die Lizenz hat nur 33 Punkte, da für den Inhalt zwar eine Lizenz angegeben ist, es sich jedoch nicht um eine bekannte Lizenz handelt. Ein bekannte aber unfreie Lizenz würde hierbei 66 Punkte erzielen, während das Fehlen einer Lizenzangabe mit 0 Punkten bewertet wird.

Abbildung 2: Metadatenqualität eines Beispieltreffers

Wie hat Ihnen der Beitrag gefallen?

Autor / Autorin
Webredaktion umwelt.info
Nationales Zentrum für Umwelt- und Naturschutzinformationen / Umweltbundesamt