Informationspraxis mitgestalten?
Hier steht, wie's geht!
DOI: https://doi.org/10.11588/ip.2019.1.54291
Sabine THÄNERT, Marina UNGER
Linked Data in der iDAI.world - am Beispiel des Projekts „Gelehrte, Ausgräber und Kunsthändler: Die Korrespondenz des Instituto di Corrispondenza Archeologica als Wissensquelle und Netzwerkindikator“ am Deutschen Archäologischen Institut
Zusammenfassung
Anhand des DFG-Projektes "Gelehrte, Ausgräber und Kunsthändler: Die Korrespondenz des Instituto di Corrispondenza Archeologica als Wissensquelle und Netzwerkindikator" diskutiert der Beitrag Aspekte von Linked Data in den Infrastrukturen der iDAI.world und darüber hinaus. Die Dokumentbasis bilden die sogenannten Gelehrtenbriefe aus den Archiven des DAI Rom und der Zentrale in Berlin, die im Rahmen des Projekts erfasst, digitalisiert und weiterverarbeitet werden. Die Autographe sind zum einen einzigartige Quellen archäologischen und fachhistorischen Wissens, zum anderen zeugen sie von einem dichten Netzwerk, das sich um das Institut Archäologischer Korrespondenz im Laufe des 19. Jahrhunderts gebildet hatte. Im Fokus des Beitrags stehen neben Themen wie Metadaten- und Normdatengenerierung auch die Publikation der Briefe als Linked Data, die inhaltliche Aufarbeitung mittels Methoden des Text-Mining sowie der Netzwerkvisualisierung.
Schlüsselwörter
Linked Data; Netzwerk; iDAI.world
Abstract
Aspects of Linked Data within the infrastructure of the iDAI.world, exemplified by the DFG funded project "Scholars, Excavators and Art Dealers: The Correspondence of the Instituto di Corrispondenza Archeologica as a Source of Knowledge and Network Indicator", are discussed in this contribution. The basis for this project consists of the so called "Gelehrtenbriefe" preserved in the archives of the Rome department and the headquarter of the DAI in Berlin, which are recorded, digitized and analyzed within the project. The autographs are on the one hand a unique sources of archaeological knowledge; on the other hand, they are evidence of the dense network of scholars, which formed around the Institute of Archaeological Correspondence during the 19th century. The focus of this contribution lies, in addition to subjects such as metadata and authority records and the publication of the letters as Linked Data, also on the analysis of the letter's contents using network visualization and text-based approaches.
Keywords
Linked data; network; iDAI.world
Inhalt
1 Einleitung
Die Archivbestände der sogenannten Gelehrtenbriefe der Abteilung Rom und der Zentrale in Berlin des Deutschen Archäologischen Instituts (DAI) bilden wertvolle Quellen für weitgefächerte Fragestellungen zu archäologischen und fachhistorischen Themen sowie darüber hinaus (Abb. 1). Einen neuen Blick auf das Material bietet die Visualisierung der Netzwerke, die sich in den Briefen manifestieren. Dieser Aspekt steht, neben der Digitalisierung der Briefe und Erfassung ihrer Metadaten, im Fokus des, von der Deutschen Forschungsgemeinschaft (DFG) geförderten Projekts „Gelehrte, Ausgräber und Kunsthändler: Die Korrespondenz des Instituto di Corrispondenza Archeologica als Wissensquelle und Netzwerkindikator“, welches seit 2017 an den beiden Abteilungen durchgeführt wird1.
Abb. 1: Brief von Emil Braun an Eduard Gerhard (D-DAI-ROM-A-A-II-BraE-GerE-126)
Das Instituto di Corrispondenza Archeologica oder Institut Archäologischer Korrespondenz, die Vorgängerinstitution des DAI, wurde 1829 als privater Verein in Rom gegründet2. Über ein Korrespondentennetzwerk mit Zentren zunächst v.a. in Rom und Paris sowie später in Berlin sollten archäologische Neuigkeiten zusammengetragen und publiziert werden. Die Wissensvermittlung verlief in brieflicher Form zwischen den korrespondierenden Mitgliedern und den Sekretären des Instituts, die als Informationsknoten- und Verteilerpunkte fungierten und dieses Wissen in den Zeitschriften des Instituts veröffentlichten3.
Im Rahmen des Projekts ist es beabsichtigt, das Netzwerk, das in der handschriftlichen Korrespondenz zum Ausdruck kommt, in die digitalen Infrastrukturen des DAI – die iDAI.world – zu übertragen und mithilfe von Konzepten wie Linked Data zu publizieren und somit der wissenschaftlichen Öffentlichkeit nicht nur frei zugänglich zu machen, sondern auch mit weiteren, in bestehenden Systemen vorhandenen, Informationen anzureichern.
Am Institut in Rom wurden die Briefe von Beginn an systematisch abgelegt, wodurch ein alphabetisch nach Autoren gegliedertes Briefarchiv entstand. Dieser geschlossene Bestand mit einer Laufzeit von beinahe einem Jahrhundert ist heute als „Serie II Gelehrtenbriefe“ Teil des Archivs der Abteilung Rom4. Während die Tradition des Korrespondentennetzwerks mit der entsprechenden Archivbildung in Rom bis ins anfängliche 20. Jahrhundert aufrechterhalten wurde, kam es an der Zentrale in Berlin erst 1929 anlässlich der Hundertjahrfeier des Instituts zur Gründung eines „Gelehrtenarchivs“, das als „Archiv zur Geschichte der Archäologie“ ins Leben gerufen wurde. Den Grundstein bildete der Briefnachlass eines der Institutsgründer Eduard Gerhard (1795–1867) und einiger seiner Zeitgenossen. Inzwischen umfasst der Bestand des Archivs der Zentrale ca. 250 Nachlässe, von denen, neben Gerhards Briefen, eine passende Auswahl für das Projekt getroffen wurde5.
2 iDAI.world und Linked Data
Das DAI hat mit der „iDAI.world“ im Verlauf der letzten Jahre eine Infrastruktur von Fachsystemen zur Datenpublikation etabliert, die den Linked Data-Gedanken verfolgt – „link your data to other data to provide context“ (Abb. 2)6.
Abb. 2: Systeme der iDAI.world (https://idai.world)
Der Verbund von Fachanwendungen bietet einerseits auf die jeweilige Fachdomäne abgestimmte Oberflächen und Schnittstellen zur Datenverwaltung und Recherche an. Andererseits wird die Verknüpfung unterschiedlicher Datenbestände innerhalb der und zwischen den Systemen durch Linked Data-Mechanismen sichergestellt. Oberste Priorität hat dabei die Verwendung von stabilen URIs für dieVerknüpfung von Datensätzen, wobei die Wahl der Formate von Nutzungsgesichtspunkten abhängt.
So werden beispielsweise annotierte Texte als XML (TEI und METS/MODS), Objektdaten als JSON und Geodaten im iDAI.gazetteer u.a. in GeoJSON oder als Shapefiles veröffentlicht. Alle Ressourcen besitzen stabile URIs, die zur Referenzierung verwendet werden. Außerdem werden Daten und Metadaten über Web-Schnittstellen (REST-APIs) in offenen Formaten zur Verfügung gestellt. Einige Fachsysteme bieten zudem auch einen RDF-Export, der in der praktischen Nutzung jedoch erfahrungsgemäß eine untergeordnete Rolle spielt. So existiert für iDAI.objects/Arachne beispielweise ein Mapping auf das CIDOC-CRM.
Durch die Nutzung der Fachsysteme der iDAI.world im hier vorgestellten DFG-Projekt „Gelehrte, Ausgräber und Kunsthändler: Die Korrespondenz des Instituto di Corrispondenza Archeologica als Wissensquelle und Netzwerkindikator“ sind somit alle im Projekt erstellten Daten als Linked Data publiziert. Durch die heterogene Natur der Ausgangsdaten und den hohen Grad der Kontextualisierung kommt dem Projekt dabei eine Vorreiterrolle zu. Vor allem die inhaltliche Tiefenerschließung textueller Quellen erzeugt dabei ein besonders engmaschiges Informationsnetz.
2 Metadatengenerierung und Normdaten
Die einzigartigen Briefbestände wurden für die Primärerschließung und Digitalisierung ausgewählt, da mit deren Onlinestellung und Aufbereitung ein effizienter Zugang weltweit für die Wissenschaft ermöglicht wird.
Ein Großteil des römischen Bestandes war bislang nur durch summarische Listen auf Autorenebene aus den 1970er und 1980er Jahren erfasst, während die Berliner Briefe zu gleicher Zeit auf Briefebene zusammengefasst wurden. Im Rahmen des Projektes erfolgt nun für beide Bestände (Rom und Berlin) eine digitale Einzelbrieferfassung. Diese Primärerschließung erfolgt in Kalliope, dem überregionalen Verbund und nationalen Nachweisinstrument für Nachlässe, Autographen und Verlagsarchive7. Auch Kalliope bietet die Möglichkeit zur Verlinkung externer Datenquellen über URIs. Wesentlich für das hier vorgestellte Projekt ist der Verweis auf das Digitalisat in iDAI.objects (Abb. 3)8. Mit der Primärerfassung der Einzelbriefe in Kalliope wird gleichzeitig die Gemeinsame Normdatei (GND) der Deutschen Nationalbibliothek (DNB)9 genutzt.
Abb. 3: Briefdatensatz im Kalliope-Verbund (http://kalliope-verbund.info/DE-611-HS-3317397)
Da es sich bei den Briefen um historische Autographen handelt, ist die Identifizierung der Personen eine der größeren Recherche-Herausforderungen. Dies betrifft sowohl die aktiven Korrespondenten des Instituto di Corrispondenza als auch dritte, in den Briefen erwähnte, Personen. Der Personenkreis reicht von bedeutenden internationalen Archäologen und Altertumswissenschaftlern bis zu Lokalgelehrten und an der Antike interessierten Amateuren. Insgesamt schließt er über 2.000 Individuen des 19. und frühen 20. Jahrhunderts ein. Auch prominente Sammler waren unter den Mitgliedern, darunter der berühmtberüchtigte Gian Pietro Campana –Kunstsammler, Antikenkenner und Autodidakt der Archäologie –, der mit etwa 10.000 Objekten die größte private Sammlung des 19. Jahrhunderts zusammentrug, bevor er wegen Veruntreuung verhaftet wurde und schließlich ins Exil gehen musste10. Neben bekannten Persönlichkeiten treten auch fast vollkommen unbekannte Menschen in Erscheinung, die in kleinen Provinzstädten archäologisch tätig waren und das Institut über ihre Entdeckungen in den Briefen unterrichteten. Dieser sehr weit gestreute und zugleich sehr spezifische Personenkreis ist nur teilweise in den Normdatenbanken abgedeckt und erfordert deshalb weiterführende Nachforschungen, um die Personen zu identifizieren. Da es sich um einen internationalen Personenkreis handelt, wird auch VIAF, das Virtual International Authority File, konsultiert11. In einigen Fällen konnten mit den genannten Ressourcen jedoch zu dem bereits bekannten Namen keine weiteren Informationen ermittelt werden.
Die zum Teil historischen Bezeichnungen und altertümlichen Schreibweisen der Orte erforderten ebenfalls oftmals zusätzliche Recherchen. Neben den Briefen selbst, werden archäologische Fachlexika, aber auch die historischen Zeitschriftenbände des Instituts zu Rate zogen12. Für Orte wird neben GND und VIAF vor allem der am DAI entwickelte iDAI.gazetteer, der die spezifisch archäologischen Ortsdaten verwaltet, herangezogen13. Personen und Orte werden durch die Verwendung von Normdaten eindeutig identifiziert und sind mit stabilen URIs mit den im Projekt verwendeten Ressourcen inner- und außerhalb der iDAI.world verlinkt. Die in den Normdaten bisher fehlenden Personen und Orte, die im Rahmen des Projektes eindeutig identifiziert werden könnten, werden in der GND nacherfasst und dadurch der Nachnutzung zur Verfügung gestellt.
Abb. 4: Briefdatensatz in iDAI.objects (https://arachne.dainst.org/entity/6427240)
3 Publikation als Linked Data
Die Digitalisate der Korrespondenzen werden durch Importroutinen in die Objektdatenbank des DAI iDAI.objects integriert (Abb. 4). Jeder digitalisierte Brief ist durch einen Identifier in der Dateibenennung eindeutig. Die passenden Metadaten enthalten ebenfalls den Identifier und können auf diese Weise dem digitalisierten Brief zugeordnet werden. In iDAI.objects werden die Datensätze der Briefe mit weiteren Entitäten innerhalb der Datenbank sowie mit Ressourcen inner- und außerhalb der iDAI.world verlinkt. Angezeigt sind unter anderem Links zum DFG-Viewer, der die Meta- und ggf. Strukturdaten über OAI-PMH-Schnittstellen erhält14 sowie zu iDAI.bibliography/Zenon15, wo die Metadaten der Gelehrtenbriefe ebenfalls nachgewiesen sind. Über iDAI.bibliography werden die Briefe zudem in Propylaeum, dem Fachinformationsdienst für die Altertumswissenschaften, integriert16.
Die Orte sind mit dem iDAI.gazetteer, der normierten, digitalen Ortsverwaltung des DAI verbunden, der die Ortsdaten der im DAI vorhandenen Informationsobjekte vereinheitlicht17. Über den iDAI.gazetteer erhalten die Orte eine eindeutige Identifizierung. Zugleich fungiert der iDAI.gazetteer als Schnittstelle zwischen den verschiedenen iDAI.world-Diensten und ermöglicht somit ortsbasierte Suchen über mehrere Informationssysteme hinweg, etwa über iDAI.objects und iDAI.bibliography, und bindet diese zunehmend in die weltweiten Ortsdatensysteme ein (Abb. 5). Der iDAI.gazetteer ist speziell auf archäologische und bauhistorische Bedürfnisse zugeschnitten. Die feingranulare Erfassung der modernen und antiken Orte bis auf Gebäudeebene ist für die Verwendung bspw. in Ausgrabungskontexten unerlässlich und geht damit über die Erfassungstiefe der Dienste wie Geonames18, das sich auf moderne Ortsnamen und administrative Einheiten spezialisiert oder Pleiades19 bzw. Pelagios20, die sich auf antike Orte konzentrieren, hinaus21.
Abb. 5: Ortsdatensatz der Stadt Verona im iDAI.gazetteer (https://gazetteer.dainst.org/place/2338753)
Durch automatisierte Mappingverfahren referenziert der iDAI.gazetteer auf andere Ortsdatenbanken wie Geonames, GND22 oder Pelagios. Und auch Pelagios verweist in seiner Beta-Suchversion Peripleo u.a. auf die Datensätze im iDAI.gazetteer. Dort wird über den Linked Data View die Vernetzung mit anderen Datenbanken anschaulich visualisiert23.
4 Visualisierung der Netzwerke
Abgesehen von der Publikation der Digitalisate, eingebettet in die Linked Data-Umgebung der iDAI.world, wird an der Entwicklung von Tools gearbeitet, mit deren Hilfe die Netzwerke visualisiert werden können. So sollen beispielsweise Fragestellungen wie „Wer schrieb wem, wie oft“ oder auch „Wer schrieb von wo nach wo“ anhand der erfassten Metadaten beantwortet werden. Für die Netzwerk-Visualisierung werden sowohl die EAD-Daten aus Kalliope als auch die Normdaten24 aus GND, VIAF und iDAI.gazetteer herangezogen. Im Konzept des Briefes und damit in den Metadaten sind im Regelfall Ortsdaten, die auf einer Karte lokalisiert werden können, sowie Personen- und Zeitangaben enthalten. Die Visualisierung befindet sich derzeit im Teststadium und kann daher an dieser Stelle als „Werkstattbericht“ gezeigt werden (Abb. 6).
Personen-, Zeit- und Geoinformationen, basierend auf den bisher generierten Metadaten, werden verarbeitet und interaktiv visualisiert. In der kartenbasierten Visualisierung erfolgt eine Lokalisierung der Briefe auf Stadtebene und eine Auswertung ihrer Anzahl (Größe der Kreise). Es wird zudem zwischen ein- und ausgehenden Kommunikationsverbindungen unterschieden (Farben Rot für aus- und blau für eingehend) sowie die Intensität der Korrespondenz zwischen den Städten angezeigt (Stärke der Verbindungslinien). Eine Eingrenzung der angezeigten Daten/Briefe ist auch über die zeitliche Komponente, also das Verfassungsdatum der Briefe, die in Form einer Timeline visualisiert wird, möglich25. Basierend auf der vorherigen Auswahl, erfolgt in einem Chord-Diagramm gleichzeitig die Veranschaulichung der quantifizierten Verbindungen zwischen den Korrespondenten, wobei diese bei großen Datenmengen auf die Top 10 der Briefautoren und Empfänger begrenzt werden. In die Visualisierung sind Links zu den Ortseinträgen im iDAI.gazetteer bereits integriert. Verknüpfungen zu den Datensätzen in iDAI.objects sowie beispielsweise zur GND und Kalliope folgen.
Abb. 6: Visualisierung des Korrespondentennetzwerks mit Verona als Knotenpunkt (Testversion)
5 Text-Mining
Für einen Teil der Briefe aus dem römischen Bestand liegen maschinenschriftliche Abschriften vor. Bei der Erstellung dieser Transkripte in den 1970er und 1980er Jahren wurde der Korrespondenz zwischen den Sekretären des Instituts Vorrang gegeben. Die Abschriften wurden im Rahmen des ebenfalls DFG-geförderten und 2015 abgeschlossenen Projektes „Die Antike in Zeichnung, Plan und Bauaufnahme: primäre Dokumentationsmaterialien des 19. und 20. Jahrhunderts im Deutschen Archäologischen Institut Rom“, digitalisiert26. Diese Digitalisate liegen als OCR-fähige PDFs vor, die durch Methoden des Machine Learning und der Named Entity Recognition (NER) analysiert und weiterverarbeitet werden (Abb. 7)27.
Abb. 7: Abschrift des Briefes mit Annotationen in WebAnno
Die Auswertung der Texte erfolgt hinsichtlich der erwähnten Personen, Orte sowie archäologischen Objekten und wird mit den iDAI.world-Systemen, wie dem iDAI.gazetteer bzw. den Normdatendiensten GND und VIAF verlinkt. Durch die Verlinkung der Digitalisate der Originalbriefe mit den digitalisierten Briefabschriften und den damit verbundenen Normdaten werden diese um eine Vielzahl zusätzlicher Daten angereichert und in ein noch engmaschigeres Informationennetz eingebettet. Durch die digitale Erfassung der historischen Briefbestände des DAI und die Publikation der Digitalisate und Metadaten mithilfe von Konzepten wie Linked Data in Infrastrukturen der iDAI.world und darüber hinaus, erscheinen die Korrespondenzen und dadurch das archäologische Netzwerk des Instituto di Corrispondenza Archeologica in neuem Licht und eröffnen neue Möglichkeiten der wissenschaftlichen Analyse der Bestände.
Literaturverzeichnis
A. Borbein, Geschichte – Kunst – Altertum. Das römische Institut und die Geschichte der Klassischen Archäologie, in: Mitteilungen des Deutschen Archäologischen Instituts, Römische Abteilung 111 (2004), 7‒31.
S. Cuy, Connecting Cultural Heritage Data: The Syrian Heritage Project in the IT Infrastructure of the German Archaeological Institute, CAA 2015 – Keep the revolution going. Proceedings of the 43rd annual Conference on Computer Applications and Quantitative Methods in Archaeology (Oxford 2016), 251–257.
S. Cuy et. al., iDAI.gazetteer – ein Referenzsystem für altertumswissenschaftliche Ortsinformationen als Teil einer digitalen Forschungsinfrastruktur, Kölner und Bonner Archaeologica 4 (2014), 203–212.
AutorInnen
Sabine THÄNERT
Deutsches Archäologisches Institut
Podbielskiallee 69-71
D- 14195 Berlin
sabine.thaenert@dainst.de
https://www.dainst.org
Marina UNGER
Deutsches Archäologisches Institut
Podbielskiallee 69-71
D- 14195 Berlin
marina.unger@dainst.de
https://www.dainst.org
1 Informationen zum Projekt finden sich auf den Seiten der DFG und des DAI: http://gepris.dfg.de/gepris/projekt/318512975, https://www.dainst.org/project/2671113, https://arachne.dainst.org/project/gelehrtenbriefe?lang=de/.
2 Zu Gründung und Geschichte des DAI vgl. Borbein (2004), 7‒31.
3 Die historischen Zeitschriften des Instituto di Corrispondenza wurden im Rahmen des DFG-geförderten Projektes „Rezeption der Antike als Semantisches Netz: Buch, Bild und Objekt“ digitalisiert und sind über iDAI.object sowie über die Propylaeum-Search verfügbar: Bullettino dell’Instituto (https://www.propylaeum.de/themen/rezeption-der-antike/zeitschriften/bullettino-dellinstituto-di-corrispondenza-archeologica-bulletin-de-linstitut-de-correspondence-archeologique/#c563), Annali dell’Instituto (https://www.propylaeum.de/themen/rezeption-der-antike/zeitschriften/annali-dellinstituto-di-corrispondenza-archeologica/#c562) und Monumenti Inediti (https://www.propylaeum.de/themen/rezeption-der-antike/zeitschriften/monumenti-inediti-monuments-inedits/#c569). 1886 wurden diese Reihen von den Mitteilungen des Archäologischen Instituts, die heute als Römische Mitteilungen erscheinen, abgelöst (https://www.propylaeum.de/themen/rezeption-der-antike/zeitschriften/mitteilungen-des-kaiserlich-deutschen-archaeologischen-instituts-roemische-abteilung/#c566).
4Archiv der Abteilung Rom des DAI:https://www.dainst.org/standort/rom/archiv
5 Archiv der Zentrale des DAI in Berlin: https://www.dainst.org/standort/zentrale/archiv
6 iDAI.world/iDAI.welt – Forschung digital am DAI: https://www.dainst.org/de/forschung/forschung-digital. Zu den digitalen Intrastrukturen vgl. auch S. Cuy, Connecting Cultural Heritage Data: The Syrian Heritage Project in the IT Infrastructure of the German Archaeological Institute, CAA 2015 – Keep the revolution going. Proceedings of the 43rd annual Conference on Computer Applications and Quantitative Methods in Archaeology (Oxford 2016), 251–257.
7 Kalliope Verbundkatalog: http://kalliope-verbund.info
8 iDAI.objects/Arachne: https://arachne.dainst.org
9 Gemeinsame Normdatei der Deutschen Nationalbibliothek: http://www.dnb.de/DE/Standardisierung/GND/gnd_node.html
10 Die 32 Briefe, die Campana an verschiedene Akteure des Instituto im Laufe von etwa 35 Jahren schrieb und die im Archiv des DAI Rom aufbewahrt werden, befinden sich derzeit im Digitalisierungsprozess.
11 Virtual International Authority File: https://viaf.org
12 Vgl. Anm. 3.
13 iDAI.gazetteer: https://gazetteer.dainst.org
14 DFG-Viewer: http://dfg-viewer.de/show/?set[mets]=http%3A%2F%2Farachne.uni-koeln.de%2FMetsDocuments%2Foai_arachne.uni-koeln.de_buch-2337.xml
15 iDAI.bibliography/ZENON: https://zenon.dainst.org/
16 Propylaeum: https://www.propylaeum.de. Siehe auch Anm. 3.
17 Vgl. zum iDAI.gazetteer S. Cuy et. al. (2014), S. 203–212.
18 Geonames: http://www.geonames.org
19 Pleiades: https://pleiades.stoa.org
20 Pelagios: http://commons.pelagios.org
21 Vgl. dazu Cuy et. al. 2014, 204.
22 Im Rahmen des DFG-Projektes FID Altertumswissenschaften
23 Peripleo: http://peripleo.pelagios.org, Beispiel: Lucca: http://peripleo.pelagios.org/ui#q=lucca
24 Die EAD-Daten enthalten URIs der Normdaten der GND.
25 In einigen Fällen kennen wir auch weitere Daten wie Poststempel und Eingangsdatum bekannt, diese werden aber für die Netzwerk-Visualisierung derzeit nicht ausgewertet.
26 Projektseite auf der Homepage des DAI: https://www.dainst.org/project/39071.
27 Für manuelle Annotationen wird das Webannotationssystem verwendet: https://webanno.github.io.