omeka2dsp

Omeka–DaSCH-Transfer-Pipeline

Autor:innen
Zugehörigkeiten

Nico Görlich

Universität Basel

Moritz Mähr

Universität Basel

Universität Bern

Moritz Twente

Universität Basel

Geändert

26. September 2025

Langzeitarchivierung für Stadt.Geschichte.Basel

Die Forschungsdaten aus dem Projekt Stadt.Geschichte.Basel werden auf der Forschungsdatenplattform annotiert zur Verfügung gestellt. Die Metadaten dafür wurden mit einer von der Universität Bern bereitgestellten Omeka-S-Instanz kuratiert und verwaltet. Die Daten werden für die Forschungsdatenplattform zur Anzeige mit CollectionBuilder vom Omeka-Server extrahiert. Diese Konfiguration birgt jedoch erhebliche Risiken für die langfristige Verfügbarkeit:

  • Omeka unterliegt nicht unserer institutionellen Kontrolle und wird möglicherweise nicht dauerhaft finanziert.
  • GitHub Pages ist nicht für die Bereitstellung großer Dateien oder die Gewährleistung der Persistenz geeignet.
  • CollectionBuilder bietet keine integrierte Unterstützung für Versionierung und persistente Identifikatoren auf dem Niveau, das von Forschungsdateninfrastrukturen gefordert wird.

Um diesen Herausforderungen zu begegnen, implementieren wir eine Übergangspipeline zur Archivierung aller Metadaten und zugehörigen Dateien mit DaSCH, wobei wir dessen Infrastruktur für die versionierte, dauerhafte und FAIR-konforme Veröffentlichung von Forschungsdaten nutzen.

TippCode und Dokumentation

Der Code ist auf GitHub verfügbar, die Funktionalität der Pipeline und das Datenmodell sind ausführlich dokumentiert. Moritz Mähr und Moritz Twente präsentieren das Projekt auf der DaSCHCon 2025.

Die neue Pipeline umfasst:

  1. Erfassung und Umwandlung von Metadaten aus Omeka in das DaSCH-Datenmodell.
  2. Automatisierte Ablage- und Aktualisierungsroutinen unter Verwendung der DaSCH-REST-API, einschließlich Unterstützung für die Versionierung bestehender Datensätze.
  3. Zurückschreiben stabiler DaSCH-Identifikatoren und Zugriffs-URLs auf unsere öffentlich zugängliche Plattform, um Transparenz und Zitierfähigkeit zu gewährleisten.
  4. Erhaltung hierarchischer Beziehungen und Medienmetadaten in Übereinstimmung mit unserem benutzerdefinierten Metadatenmodell, das die Grundsätze antidiskriminierender Beschreibungspraktiken berücksichtigt.

System Architecture

graph LR
    A[Omeka API] --> B[Data Extraction]
    B --> C[Data Transformation]
    C --> D[DSP Upload]
    D --> E[DSP API]

    F[Configuration] --> B
    F --> C
    F --> D

    style A fill:#86bbd8,color:#000
    style E fill:#dbfe87,color:#000
    style B fill:#ffe880,color:#000
    style C fill:#ffe880,color:#000
    style D fill:#ffe880,color:#000
    style F color:#000

Wichtigste Komponenten

graph LR
    A[Omeka API] --> B[data_2_dasch.py]
    B --> C[DSP API]
    B --> D[File Storage]
    
    E[process_data_from_omeka.py] --> B
    F[Configuration] --> B
    
    style A fill:#86bbd8,color:#000
    style C fill:#dbfe87,color:#000
    style B fill:#ffe880,color:#000
    style D color:#000
    style E color:#000
    style F color:#000

Zurück nach oben