EGOlink: Automatische Analyse und Erweiterung der internen und externen Linkstruktur in EGO
Anbindung: TU Darmstadt
Externer Partner: Leibniz-Institut für Europäische Geschichte, Mainz
Finanziert mit Mitteln des Projektträgers: Dez. 2015 – Nov. 2017 als Pilotprojekt
Projektmitarbeiter
- Dr. Ines Grund, Leibniz-Institut für Europäische Geschichte
- Dr. Hatem Mousselly-Sergieh, TU Darmstadt
Beschreibung
EGO (Europäische Geschichte Online) ist eine open-access Plattform die begutachtete akademische Artikel (in Deutsch und Englisch) zur transkulturellen Geschichte Europas beinhaltet. Im Gegensatz zu traditionellen Publikationen verfolgt EGO einen Publikationsstrategie die der Online Enzyklopädie Wikipedia ähnelt, indem sie die Artikel untereinander und mit externen Ressourcen wie Wissensdatenbanken und Multimedia Content verlinkt. Bislang werden diese Links manuell gesetzt durch die Autoren der Artikel. Ziel dieses Projekts ist eine Verringerung dieses Aufwands, mittels (teil-)automatisierter Methoden zur Anreicherung von existierenden Artikeln in EGO mit internen und externen Links. Außerdem sollen die Autoren neuer Artikel automatische Unterstützung zur Verlinkung ihrer Artikel bekommen.
Zu Beginn des Projekts soll die momentane Linkstruktur in EGO erfassen. Dazu werden die manuell erstellen Links sowie die Kozitationsmuster zwischen Artikeln statistisch analysiert und visualisiert. Dahinter steht die Absicht ungeeignete Strukturen aufzudecken, bspw. isolierte oder schwach verlinkte Artikel. In der nächsten EGOLink Projektphase wird die automatische Verlinkung von EGO Artikeln untereinander und zu externen Ressourcen wie Wikipedia angegangen. In diesem Prozess soll ein spezieller Fokus auf der evolutionären Natur von EGO liegen, d.h. neben der Verlinkung existierender Artikel sollen auch neu erscheinende Artikel berücksichtigt werden. Die zwei Hauptaspekte dieser Phase werden liegen auf 1) der automatischen Identifikation und dem Ranking von potenziellen Ankern in EGO Artikeln und 2) dem Auffinden von geeigneten Linkzielen in anderen Artikeln und/oder externen Ressourcen. In der dritten Projektphase wird die erfolgreiche Umsetzung des Projekts evaluiert. Dazu soll eine Benutzerstudie unter Experten durchgeführt werden.
Ressourcen
Zur Analyse der Linkstruktur in englischen und deutschen Artikeln in der EGO Datenbank wurde das Tool EGO Analyzer entwickelt. Ein Prototyp ist hier einsehbar.
Publikationen
- Wolf, Konstantin: Entity Linking Annotation System for Historical Articles. Bachelor Thesis. Technische Universität Darmstadt, 2016.