Direkt zum Hauptinhalt

Was ist ein PID?

Ein persistenter Identifikator (PID) ist eine eindeutige Kurzkennzeichnung für ein digitales Objekt. Er ist ein Aspekt für gute Datenqualität nach den FAIR-Prinzipien.

Ein PID ist eine Kennzeichnung für digitale Objekte, Dokumente oder Ressourcen im Internet. Dieser Identifikator beschreibt das Objekt eindeutig, einzigartig und persistent.

Identifikator – Bezeichnung eines Objekts
eindeutig – unmissverständliche Zuordnung
einzigartig – einmalige Verwendung, identifiziert genau ein Objekt
persistent – dauerhaft speicher- und abrufbar, unverändert über lange Zeiträume

Ein Identifikator bezeichnet ein digitales Objekt wie ein Name eine Person. Da es aber auch möglich ist, dass zwei Personen zufällig denselben Namen besitzen, hilft bei einem Objekt ein persistenter Identifikator (persistent identifier, PID) als eindeutige Referenz. Der persistente Identifikator eines Objekts lässt sich daher eher mit der Sozialversicherungsnummer vergleichen.

PIDs sind oft in einem Format, die eine Auflösung über das Internet ermöglichen, was bedeutet, dass man durch den PID auf das zugehörige Objekt zugreifen kann. Sie sind eine Kombination aus alphanumerischen Zeichen und verlinken meist auf eine Kontextseite mit Informationen über das Digitalisat und einem Link auf das Digitalisat selbst.

Verwaltet werden die PIDs von Registrierungsagenturen, die sicherstellen, dass die PIDs eindeutig und dauerhaft sind. Beispiele für bekannte PIDs sind DOI (Digital Object Identifier) für wissenschaftliche Publikationen, URN (Uniform Resource Identifier) für verschiedene Ressourcen oder HANDLE als allgemeines System für die Verwaltung von PIDs. Auch die ISBN (Internationale Standardbuchnummer) für Bücher kann man als eine Art PID verstehen.

Komponenten eines PIDs

Ein PID setzt sich aus zwei Bestandteilen zusammen:

  • einem Code für die Identifikation des Objekts (Name), z. B. Q131397
  • einem Code für die persistente Darstellung des Objekts und/oder relevanter Daten (Link), z. B. https://www.wikidata.org/wiki/Q131397

TeileEinesPIDs.pngDurch die Verbindung von Identifikator des Objekts sowie einer Basis-URL kann das Objekt eindeutig bei Wikidata aufgerufen werden.

Wie URN und URL zusammen die → URI ergeben, besteht auch der PID aus einem Namen und einem Link zum Objekt.

Ein digitales Objekt kann schließlich mehrere Identifikatoren und/oder PIDs besitzen. Wichtig ist, dass alle Objektkennungen in den Metadaten angeführt werden.

VerschiedenePIDs.png

Ein digitales Objekt kann mehrere verschiedene (persistente) Identifikatoren besitzen.

Mehrere verschiedene Identifikatoren und PIDs können dasselbe Objekt beschreiben. Etwa hat die Venus von Willendorf auf Wikidata viele persistente Identifikatoren. Im Link der jeweiligen Identifikatoren kann die verwendete Struktur abgelesen werden.

Zweck eines PIDs

Der Hauptzweck eines PIDs ist es, Informationen für die Identifizierung, Verifizierung und (digitale) Lokalisierung des beschriebenen Objekts bereitzustellen. Anstelle direkt auf das Objekt zu verlinken, kann der PID auch auf eine Kontextseite verweisen, auf der beschreibende Informationen und ein Link zum Medienobjekt zu finden sind. Dabei ist es auch wichtig, dass sich das referenzierte Objekt nicht verändert oder allenfalls eine Versionierung festgehalten wird.

PIDs gibt es für verschiedene Arten von Ressourcen; hauptsächlich werden zwei unterschiedliche Kategorien verwendet: PIDs für Objekte (Daten, Objekte, Publikationen …) und PIDs für Personen und Organisationen.

Unterschied zu lokalen Identifikatoren

Der entscheidende Unterschied zwischen PIDs und „normalen“ Identifikatoren ist, dass PIDs global verwendet werden und somit global eindeutig sein müssen. „Normale“ Identifikatoren sind oftmals nur lokal oder im eigenen System eindeutig. Die Verlinkung auf die Darstellung des digitalen Objekts kann dabei auch ein Dateipfad, der von außen nicht zugänglich ist, oder ein nur temporär verfügbarer Link sein. Wenn die Verlinkung sich ändert, kann mit einem regulären Identifikator das Objekt nicht mehr aufgefunden werden. Somit sind „normale“ Identifikatoren weniger zuverlässig für eine langfristige Auffindbarkeit und Identifizierung des Objekts.

Bekommt ein digitales Objekt einen (weltweit) eindeutigen Identifikator von der Institution und funktioniert die öffentliche Verlinkung auf dessen Darstellung auf unbestimmte Zeit, wirkt der normale Identifikator wie ein persistenter Identifikator.

Linktipps