Dateiformate

Empfehlungen für Dateiformate in Bild, Text, Ton, Film, 3D

Einstieg: Dateiformate

Digitalisate werden in mehreren Versionen gespeichert, um verschiedene zukünftige Abfragebedürfnisse bedienen zu können: eine für die Archivierung, eine für die Nutzung und eine für die Ansicht des Digitalisats in der Online-Sammlung. Dementsprechend gelten für die Archivkopie, die Nutzungskopie und die Ansichtskopie je nach Medientyp unterschiedliche Anforderungen.

In der Welt der digitalen Archive haben sich Begriffe wie „Archivkopie“, „Nutzungskopie“ und „Ansichtskopie“ durchgesetzt.

Archivkopie, Nutzungskopie und Ansichtskopie

Nach dem Erstellen des Digitalisats wird dieses als Archivkopie gespeichert und anschließend nicht mehr verändert. Für das Erstellen der Nutzungskopie (und folglich auch der Ansichtskopie) wird immer nur eine Kopie dieser Archivkopie verwendet.

Bildanzeige im Kulturpool

Anforderungen an Dateiformate

Digitalisate sollen das Original so getreu wie technisch möglich wiedergeben und über freie Software & offene Formate darstellbar und editierbar sein. So können (kosten-)effiziente Lösungen für Digitalisierungsvorhaben ermöglicht werden. Die langfristige Bewahrung der vollständigen und ursprünglichen Funktionalität bestimmter Dateiformate ist oftmals nicht praktikabel oder möglich. Die Wahrscheinlichkeit einer erfolgreichen langfristigen Bewahrung von digitalen Inhalten ist höher, wenn die Dateiformate die folgenden Merkmale aufweisen:

Im folgenden Abschnitt finden Sie Dateiformate für die fünf Bereiche Bild, Text, Ton, Video und 3D, die sich in der Arbeit mit Digitalisaten bereits bewährt haben.

Bild

Die Digitalisate in Bild, Text, Ton, Video und 3D brauchen unterschiedliche Dateiformate für je Archivkopie, Nutzungskopie und Ansichtskopie.

Bildformate für Rastergrafiken

Für die Archivkopie werden die offenen Formate TIFF v6 oder JPEG2000 Part-1 empfohlen. Falls die Originaldaten in einem Rohformat vorliegen, sollte eine Kopie im unkomprimierten TIFF 6.0-Format exportiert werden, um die langfristige Lesbarkeit in gängiger Software zu gewährleisten. Wenn die verfügbaren Digitalisierungsgeräte eine höhere Auflösung zulassen, soll die höchste Auflösung gewählt werden.

Empfohlene Auflösung 

3:2 Bildfeld: ≥ 20 Megapixel (≈ 5472 × 3648 px) 
1:1 Bildfeld: ≥ 13 Megapixel (≈ 3712 × 3712 px) 
16:9 Bildfeld: ≥ 17 Megapixel (≈ 5568 × 3128 px) 
mit 24-Bit True-color (= 3 × 8 Bit, entspricht 224 ≈ 16,78 Millionen Farben)

Mindestauflösung

Die höchstmögliche Auflösung wird empfohlen, ansonsten ≥ 4 Megapixel (≈ 2448 × 1632, 3:2) und 24-Bit True-Color (3 × 8 Bit, entspricht 224 ≈ 16,78 Millionen Farben), in begründeten Fällen ≥ 1 Megapixel.

Pyramid TIFF und JPEG2000 Part-1 sind für eine IIIF-konforme Ansichtskopie notwendig. 

Bilddigitalisate sollen IIIF-konform sein, um hochauflösende und zoombare Digitalisate mit einheitlichen Metadaten zu erhalten.

Rastergrafiken


Zweck Erwünschtes Dateiformat Dateiendung MIME-TYPE
Archivkopie
  • TIFF v6
  • JPEG2000 Part-1

.tiff, .tif

.jp2, .j2k, .jpf, .jpg2, .jpx, .jpm, .mj2, .mjp2

image/tiff, image/tiff-fx

image/jp2, image/jpx, image/jpmvideo/mj2

Nutzungskopie
  • TIFF v6
  • JPEG2000 Part-1
wie oben wie oben
Ansichtskopie
  • JPEG
  • PNG
  • WebP
  • AVIF

.jpeg, .jpg

.png

.webp

.avif

image/jpeg

image/png

image/webp

image/avif

 

 

Formate für gescannten Text

Ein gescannter Text ist ein Foto einer gedruckten Seite, das entweder mit einer Digitalkamera oder einem Scanner erstellt wurde.

Für die Archivkopie werden die offenen Formate TIFF v6, JPEG2000 Part-1, PDF/A-1 und PDF/A-2 empfohlen. Als Basis für Texterkennung (optical character recognition, OCR) werden mindestens 200 bis 300 dpi benötigt. Für zweitönige (bitonal, 1-Bit schwarz-weiß) Aufnahmen werden 300–600 dpi empfohlen, für Graustufenbilder (8-Bit) werden 400 dpi und für Farbaufnahmen (24-bit RGB) 400 dpi empfohlen.

Gescannter Text


Zweck Erwünscht Dateiendung MIME-Type
Archivkopie
  • TIFF v6
  • JPEG2000 Part-1
  • PDF/A-1
  • PNG

.tiff, .tif

.jp2, .j2k, .jpf, .jpg2, .jpx, .jpm, .mj2, .mjp2

.pdf

.png

image/tiff, image/tiff-fx

image/jp2, image/jpx, image/jpm, video/mj2

application/pdf

image/png

Nutzungskopie
  • TIFF v6
  • JPEG2000 Part-1
  • PDF/A-1
  • PNG
wie oben
wie oben
Ansichtskopie
  • JPEG
  • PNG
  • WebP
  • AVIF
  • PDF/A-1

.jpeg, .jpg

.png

.webp

.avif

.pdf


image/jpeg

image/png

image/webp

image/avif

application/pdf

Bildformate für Vektorgrafiken

Für Vektorgrafiken wird das vom W3C entwickelte Format SVG (Scalable Vector Graphics) unkomprimiert empfohlen.

Vektorgrafiken
Zweck Erwünschtes Dateiformat Dateiendung
MIME-Type
Archivkopie
  • SVG
.svg
image/svg+xml
Nutzungskopie
  • SVG

wie oben

 

wie oben
Ansichtskopie
  • SVG

wie oben

wie oben

Linktipps

Text

Die Digitalisate in Bild, Text, Ton, Video und 3D brauchen unterschiedliche Dateiformate für je Archivkopie, Nutzungskopie und Ansichtskopie.

Dateiformate für Text

Für den Archivmaster werden die offenen Formate Unicode Text, PDF/A-1, PDF/A-2, ODF, HTML empfohlen. Wenn eine Auswahl für die Kodierung möglich ist, wählen Sie bitte UTF-8 ohne Byte Order Mark (BOM).

Textformate
Zweck

Erwünschtes Dateiformat

Archivkopie
  • Unicode Text
  • PDF/A-1
  • PDF/A-2
  • ODF
  • HTML
Nutzungskopie
  • Unicode Text
  • PDF/A-1
  • PDF/A-2
  • ODF
  • HTML
Ansichtskopie
  • PDF
  • Unicode Text

Linktipps

Ton

Die Digitalisate in Bild, Text, Ton, Video und 3D brauchen unterschiedliche Dateiformate für je Archivkopie, Nutzungskopie und Ansichtskopie.

Für die Archivkopie werden die offenen verlustfreien Formate LPCM (Linear Pulse Code Modulation) in einem WAV-Container oder FLAC empfohlen. Eine Quantisierungsauflösung & Abtastrate (sample rate) von mindestens 24 Bit/48 kHz. 

Bei neu digitalisierten analogen Quellen werden 96 kHz Abtastrate empfohlen.

Audioformate
Zweck Erwünschtes Dateiformat Quantisierungsauflösung & Abtastrate (sample rate)
Archivkopie
  • LPCM (in WAV-Container)
  • FLAC
  • 24 Bit/48 kHz, 24 Bit/96 kHz
Nutzungskopie
  • LPCM (in WAV)
  • FLAC
  • MP3
  • 16 Bit/48 kHz
  •  mind. 192 kbit/s für MP3
Ansichtskopie
  • MP3
  • 128 kbit/s

WAV Dateien mit erweiterten Metadaten werden auch „BWF“ (Broadcast Wave Format) genannt. Im Zweifelsfall sind BWFs reinen WAVs vorzuziehen.

Linktipps

Video

Die Digitalisate in Bild, Text, Ton, Video und 3D brauchen unterschiedliche Dateiformate für je Archivkopie, Nutzungskopie und Ansichtskopie.

Für die Archivkopie wird die folgende Kombination von offenen verlustfreien AV-Formaten empfohlen: Container: Matroska (.mkv), Video-Codec: FFV1. Als Audioformat unkomprimiertes LPCM (Linear Pulse Code Modulation) mit 48 kHz, 16 oder 24 Bit. (LPCM wird umgangssprachlich oft auch „WAV“ genannt, da dies meistens das Format in WAV-Audiodateien ist.)

Dateiformat und Codec sind Teil der freien Codec-Sammlung „libavcodec“ des Projektes FFmpeg. Je nach Quellmedium können unterschiedliche Farbmodelle (z. B. RGB, YUV) und Subsampling (z. B. 4:2:2, 4:2:0, 4:4:4) vorkommen.

Videoformate
Zweck Container Video-Codec Audio-Codec
Archivkopie

Matroska (.mkv)

FFV1

PCM (linear)
48 kHz/ 16 oder 24 Bit

Nutzungskopie

Matroska (.mkv)

MPEG-2, AVC/H.264*1

AAC

Ansichtskopie

WebM, MP4

VP9, AVC/H.264*1, AV1

Opus

*1Lizenzkosten bei nicht freien und öffentlichen Inhalten: Via Licensing Alliance LLC via-la.com

Linktipps

3D

Die Digitalisate in Bild, Text, Ton, Video und 3D brauchen unterschiedliche Dateiformate für je Archivkopie, Nutzungskopie und Ansichtskopie.

Hochwertige und hochauflösende Daten können in den Formaten *.OBJ oder *.DAE gespeichert werden.

3D-Dateiformate
Zweck Erwünschtes Dateiformat
Archivkopie
  • glTF/GLB
  • X3D
  • STL
  • OBJ
  • DAE
  • PLY
  • WRL
  • DICOM
  • IFC
Nutzungskopie
  • glTF/GLB
  • X3D
  • STL
  • OBJ
  • DAE
  • PLY
  • WRL
  • DICOM
  • IFC
Ansichtskopie
  • glTF/GLB
  • X3D

Gängige Formate für Anwendungen der Virtual Reality und Augmented Reality sind *.USDZ und *.glTF.

Für den 3D-Druck ist *.STL und für die Webvisualisierung sind *.X3D und *.GLB weitverbreitet. 

Die Liste der 3D-Formate ist nicht vollständig, da 3D-Modelle für unterschiedliche Einsatzzwecke erstellt werden und mit diesen entsprechende optimierte Formate einhergehen. Ein wichtiges Kriterium für die angeführten 3D-Formate ist der Zugang zu 3D-Inhalten in Industriestandardformaten, die von den Nutzern angezeigt werden können, ohne dass sie zusätzliche Software installieren müssen. Das Einbetten von 3D-Inhalten in PDF-Dokumenten wird nicht empfohlen.

Literaturhinweise:

Weitere Ressourcen zu Datenformaten

Weitere allgemeine Ressourcen zu Dateiformaten: