GSB 7.1 Standardlösung

AG Formaterkennung

Die nestor-AG Formaterkennung sammelt und präsentiert grundlegende Informationen zu den Themen Formaterkennung, Charakterisierung und Validierung. Die Ergebnisse der AG sollen als erste Anlaufstelle für alle Personen dienen, die sich mit der Risikobewertung in der Bestandserhaltung befassen.

Ziele und Aufgaben

Mission Statement

Ausreichend detaillierte Kenntnisse zu Datei- und Datenträgerformaten bilden die Grundlage der Risikoabschätzung und Bestandserhaltung für die digitale Langzeitverfügbarkeit. Wegen der Fülle von Formaten weisen die vorhandenen Hilfsmittel jedoch große Lücken auf. Gleichzeitig ist es schwierig, einen Überblick über die Vielfalt bewährter und neu entstehender Werkzeuge zu behalten.

Die nestor-AG Formaterkennung zielt deshalb darauf ab, grundlegende Informationen zu den Themen Formaterkennung, Charakterisierung und Validierung zu sammeln und zu präsentieren. Die AG leistet einen Beitrag zur Verbesserung der Formaterkennung und zum Ausbau der bestehenden Formatdatenbanken (Format Registries). Sie richtet sich an alle Personen und Institutionen, die sich mit der Langzeitverfügbarkeit und -archivierung beschäftigen (v.a. Archive, Bibliotheken, Forschungseinrichtungen und Museen). Diesen Gruppen soll der Einstieg in das Thema Formaterkennung erleichtert werden. Weiterführende Links und Literaturangaben sollen zudem eine vertiefende Beschäftigung mit Fragen der Formaterkennung ermöglichen. Zu diesem Zweck wird die AG auf bereits bestehende Informationsangebote verweisen, wie etwa Tool-Sammlungen (z.B. COPTR) und Dateisammlungen zu verschiedenen Formaten (wie z.B. von Archivematica und dem ArchiveTeam), und möchte dazu anregen, sich am weiteren Ausbau existierender Sammlungen mit eigenen Beiträgen oder Aktualisierungen zu beteiligen. Obsoleszente aber noch funktionstüchtige Abspielumgebungen und Speichermedien der beteiligten Institutionen werden verzeichnet und Erfahrungen darüber ausgetauscht. Die Vernetzung mit anderen nestor-AGs (insbesondere AGs E-Akte, AV-Materialien, Digitale Bestandserhaltung) wird dort angestrebt, wo inhaltliche Schnittpunkte zu erwarten sind.

Aufgaben

Die nestor-AG Formaterkennung sammelt und präsentiert grundlegende Informationen zu den Themen Formaterkennung, Charakterisierung und Validierung. Die Ergebnisse der AG sollen als erste Anlaufstelle für alle Personen dienen, die sich mit der Risikobewertung in der Bestandserhaltung befassen.

Die AG wird bereits vorhandenen Infrastrukturen wie der Toolsammlung COPTR (Community Owned digital Preservation Tool Registry) zuarbeiten und eine Dateisammlung ausgewählter Formate erstellen. Ein Verzeichnis von verfügbaren Abspielumgebungen für obsoleszente Speichermedien wird aufgebaut und der Erfahrungsaustausch gefördert. Die Vernetzung mit anderen nestor-AGs ist bei Querschnittsthemen geplant.

laufende Arbeitspakte der nestor AG

AP1: Tool Registries

Das Arbeitspaket strebt die Erarbeitung einer Liste vorhandener Formaterkennungs-, Formatvalidierungs- und Formatcharakterisierungstools an, einerseits um Einsteigern einen schnellen Überblick über Werkzeuge zu geben, andererseits um auf neue bzw. unbekanntere Tools aufmerksam zu machen. Da es bereits Tool Registries wie COPTR gibt, soll keine eigene Seite mit Toolbeschreibungen aufgebaut werden, sondern vielmehr die vorhandene Tool Registry COPTR durch Zuarbeiten der nestor-AG unterstützt werden. Die hier nachfolgende Übersicht dient nur dem zentralen Einstieg in das Arbeitspaket und der Dokumentation der Arbeitsergebnisse. Das Arbeitspaket wird federführend von Claire Roethlisberger-Jourdan betreut; Zuarbeiten erfolgen auch durch weitere Mitglieder der AG.

AP 2: Testsuites

Ziel dieses AP ist, ein öffentlich publizierbares Sample für Dateiformate zu erstellen, das für Tests und Tests von Tools genutzt werden kann. Wenn möglich können offen publizierbare Beispiele für Dateiformate hinzugefügt werden. Federführend ist Andre Müller, die Zuarbeit erfolgt auch durch weitere Mitglieder der AG.

AP 3: Register und Kontaktbörse
für obsoleszente Speichertechniken (»R.O.S.T.«)

siehe Unterseite

AP 4: Format Registries

Dieses Arbeitspaket umfasst die praktische Zuarbeit zu Format Registries wie beispielsweise PRONOM. Die AG wird durch eigene Beiträge die Datenbestände der Format Registries erweitern. Zudem wird sie eine deutschsprachige Anleitung zur Erstellung von Formatsignaturen für PRONOM erarbeiten, um so die Kenntnisse und die Motivation zur Mitarbeit auch außerhalb der AG zu stärken. Federführend ist Martin Hoppenheit vom LA NRW.

AP 5: Formatvalidierung

Der Fokus dieses Arbeitspakets wird zurzeit geschärft. Federführend sind Yvonne Friese (ZBW) und Stefan Hein (DNB).

AP 6: Best Practices in der Identifizierung

Das Arbeitspaket strebt die Erarbeitung verschiedener Best Practices bei der Identifizierung an, einerseits um Einsteigern einen schnellen Überblick über die verschiedenen Szenarien zu geben, andererseits um auf Probleme und Lösungsmöglichkeiten aufmerksam zu machen. Das genaue Profil wird zurzeit geschärft.

laufende Aktivitäten der nestor AG

  • Kooperation mit der Open Preservation Foundation (OPF) Document Interest Group (DIG)
  • Umfrage im deutschsprachigen Raum: Welche Identifizierungs- und Validierungstools werden verwendet?
  • Aufbau und Ausbau eines Registers und Kontaktbörse für obsoleszente Speichertechniken (»R.O.S.T.«)

Ansprechpartner

Yvonne Tunnat, ZBW