Direkt zum Hauptinhalt

Validierung von EDM mit Metis Sandbox

Zur Validierung von EDM stellt Europeana die „Metis Sandbox“ unter metis-sandbox.europeana.eu/new bereit. Dort hochgeladene Datensets werden nicht nur auf Korrektheit überprüft, sondern auch gleich auf die Qualitätsstufen für Metadaten von Europeana untersucht.

Upload-Ansicht

Screenshot 2024-04-17 at 12.10.00.png

Wenn Sie Ihren Testdatensatz hochladen, müssen ein Name, das Land und die Sprache immer angegeben werden. Der Name bezieht sich auf das Testdatenset und ist frei wählbar, darf aber bis auf Unterstriche keine Sonderzeichen enthalten. Die Daten können über den Dateiupload („File upload“) direkt hochgeladen werden oder von einer OAI-PMH-Schnittstelle oder einer URL abgerufen werden. 

Format für den Dateiupload

Für den Dateiupload („File upload“) gibt es bestimmte Vorgaben, was das erwartete Format angeht:

  • Es muss eine ZIP-Datei hochgeladen werden.
  • Darin müssen alle zu testenden Datensätze als einzelne XML-Dateien liegen.
  • In diesen Dateien darf nur der EDM-Datensatz liegen (äußerstes Element rdf:RDF). Es darf also kein vollständiger OAI-PMH-Response sein.

Beispiel für einen fehlerhaften Datensatz

In der Metis Sandbox durchlaufen die Daten mehrere Phasen. Scheitert die Validierung, so wird dies bei der entsprechenden Phase angezeigt:

Screenshot 2024-04-17 at 15.24.01.png

In der Detailansicht über den Klick auf „view detail“ zeigt sich in diesem Fall recht schnell, dass der Record weder Titel noch Beschreibung aufweist, wobei eines der beiden verpflichtend gewesen wäre.

Screenshot 2024-04-17 at 15.24.39.png

Beispiel für eine erfolgreiche Validierung

Screenshot 2024-04-17 at 15.22.44.png

Verläuft die Validierung erfolgreich, können über einen Klick auf das Tortendiagramm-Icon Informationen zu den Europeana Content- und Metadata-Stufen („Content Tier“, „Metadata Tier“) eingesehen werden:

Screenshot 2024-04-17 at 15.29.56.png

Einschränkungen der Metis-Sandbox

  • Es werden pro Upload immer nur maximal 1.000 Datensätze validiert.
  • Nicht alle Fehler können abgefangen werden, nicht erfasst werden etwa:
    • rein inhaltliche Fehler,
    • wenn URLs zu Vokabularen wie GND als Feldinhalt anstatt als rdf:resource angegeben sind,
    • wenn gleiche Werte in rdf:about für unterschiedliche Elemente angegeben sind.

Linktipp