Kuration

In der zweiten Phase des CEDIFOR führen wir die assoziierten Projekte fort und initiieren Kurationsprojekte, die durch direkte Betreuung und Beteiligung des CEDIFOR mittels der in den Pilotprojekten gewonnenen Expertise durchgeführt werden.

 

Referatorium für qualitative Forschungssoftware

Anbindung: Deutsches Institut für Internationale Pädagogische Forschung

Finanziert mit Mitteln des Projektträgers: Jan. 2018 – Dez. 2019

Projektmitarbeiter

Weitere Teilnehmer: Christoph Schindler (DIPF)

Beschreibung

Das Projekt beschäftigt sich mit der Sichtbarkeit und Wiederverwendung von Software für die qualitative Forschung. Der Fokus liegt hierbei auf der Implementierung der FAIR-Prinzipien, mit besonderen Fokus auf dem Aspekt der Auffindbarkeit. Es wird die Plattform Semantic MediaWiki verwendet, die einen partizipativen Ansatz sowohl für die Erstellung der Inhalte als auch für die Eingabemasken ermöglicht. Das Referatorium wird ergänzt mit Workflow-Beschreibungen, um die Anwendung einfacher und transparenter zu machen.

Ressourcen

Relevante Publikationen

 

Offene Daten für die Bildungsforschung

Anbindung: Deutsches Institut für Internationale Pädagogische Forschung

Finanziert mit Mitteln des Projektträgers: Jan. 2018 – Dez. 2019

Projektmitarbeiter

Weitere Teilnehmer: Christoph Schindler (DIPF)

Beschreibung

Offene Daten sind ein wachsendes Feld in Deutschland. Leider ist die Qualität der Daten stark unterschiedlich ja nach Bundesland oder Stadt. Dieses Projekt möchte die Potentiale und Grenzen der Nutzung offener Daten in der Bildungsforschung ausloten, hierfür werden für die Bildungsforschung relevante Daten gesammelt geprüft und verbunden. Ein weiteres Ziel des Projekts ist die Evaluierung des vorhandenen Datenbestand und die Potentiale für weitere Forschungsprojekte und Anwendungen.

Ressourcen

Relevante Publikationen

 

URLCoFi (Under-Ressourced Language Content Finder)

Anbindung: Goethe Universität

Finanziert mit Mitteln der zentralen eLearning Einrichtung der Goethe Uni: studiumdigitale – Aug. 2019

Projektmitarbeiter

 

  • Armin Hoenen (GU)

Kooperationspartner

studiumdigitale (Finanzierung, Aufsicht), verschiedene sprachwissenschaftliche Institute

Beschreibung

Das Projekt widmet sich der Auffindung von Internet-Inhalten in Sprachen für die wenig elektronische Ressourcen vorhanden und die die vorhanden schwer auffindbar sind. Das primäre Ziel des Projektes ist die Ausarbeitung eines Flipped Classroom Kurses. Daneben entsteht auch eine Softwarelösung, die anhand bestimmter Parameter einer Nutzeranfrage besonders erfolgversprechende Wortgruppen und Wortkombinationen empfliehlt.

Ressourcen

Relevante Publikationen

 

Motivanalyse-Toolkit für textbasierte Graphen

Anbindung: TU Darmstadt

Projektmitarbeiter

Dr. Thomas Arnold, UKP Lab, TU Darmstadt

Kooperationspartner

Pascal Jürgens, Institut für Publizistik, Johannes Gutenberg Universität, Mainz

Beschreibung

Motivanalyse zählt die Anzahl von wiederkehrenden Mustern (auch Motive genannt) in einem Graphen und setzt diese statistischen Zahlen mit der intrinsischen Semantik des Graphen in Verbindung. Die Zusammensetzung der verschiedenen Motive in einem Text ergibt eine Motivsignatur. In zahlreichen Experimenten wurden Zusammenhänge dieser Signaturen mit Eigenschaften der zugrunde liegenden Texte nachgewiesen, unter Anderem verschiedene Facetten der Textqualität.

Um diese Analysen zugänglich und komfortabel bedienbar zu gestalten, wurden die einzelnen Schritte von unformatiertem Text bis zu statistischer Analyse der Motive in einem Motivanalyse Toolkit vereinigt. Dieses Toolkit bietet eine intuitive Benutzeroberfläche, zudem können alle Zwischenschritte dargestellt werden, so auch die Graphstruktur zur Visualisierung. Das Format der Eingabetexte, die Graphrepräsentation und auch die Motivsuche sind modular aufgebaut und können leicht erweitert werden.

In diesem Projekt wird die Funktionalität des Motivanalyse Toolkits auf verschiedenen Datensätzen politischer Reden und Diskussionen evaluiert. Dabei wird der Zusammenhang zwischen Motiven und verschiedenen Eigenschaften der Redner untersucht.

Ressourcen

Relevante Publikationen

 

Wissensdatenbankgestützte Annotation mit Inception

Anbindung: TU Darmstadt

Projektmitarbeiter

Dr. Thomas Arnold, UKP Lab, TU Darmstadt

Kooperationspartner

Markus Schäfer, Kommunikationswissenschaft, Johannes Gutenberg Universität, Mainz

Beschreibung

Das Bedürfnis nach semantisch annotierten Textcorpora ist größer denn je. Gefragt sind „smarte“, flexible und wiederverwendbare Annotationswerkzeuge, um auf möglichst kostengünstigem Wege zu annotierten Daten  zu gelangen. Mit INCEpTION möchten wir ein Annotationsframework aufbauen, die alle damit verbundenen Aufgaben in eine gemeinsame webbasierte Plattform integriert.

Dies grundlegende Funktionalität besteht darin, Annotationen auf Textebene durchzuführen. Um diese Aufgabe sinnvoll zu unterstützen, bietet INCEpTION Möglichkeiten zu Anbindung und Erweiterung von Wissensdatenbanken. Die Wissensbasis ermöglicht die Erstellung von dokumentenübergreifenden Verknüpfungen, um beispielsweise Personen, Orte oder andere Entitäten im Text mit den Einträgen einer gewählten Datenbank zu verbinden. Wir zielen speziell auf strukturiertes Wissen ab – d. h. nicht nur flache oder hierarchische Annotationen, sondern Entitätsklassen und Entitäten, die Eigenschaften haben und auch miteinander verknüpft sein können.

Ressourcen

Relevante Publikationen

 

Multitask Learning Framework

Anbindung: TU Darmstadt

Projektmitarbeiter

Erik-Lân Do Dinh, UKP Lab, TU Darmstadt

Kooperationspartner

 

Beschreibung

Im diesem Projekt wird ein Multitask Learning Ansatz aus einem konkreten Anwendungsfall in ein allgemein anwendbares Framework umgesetzt und somit einer breiten Nutzerbasis zur Verfügung gestellt. Multitask Learning verfolgt die Idee, ein neuronales Netzwerk gleichzeitig auf mehreren Aufgaben zu trainieren. Ein gemeinsamer Teil des Netzwerks wird gleichzeitig für alle zu lösenden Aufgaben optimiert, wodurch Synergieeffekte entstehen. Auf diese Weise konnten in zahlreichen Experimenten signifikante Verbesserungen erzielt werden. In diesem Projekt wird auf ein Multitask Setup aufgebaut, in dem mehrere Aufgaben zur Metapher-Erkennung in Deutsch und Englisch kombiniert wurden. Dies wird im Rahmen des KP in ein flexibles Framework generalisiert und auf neuen Problemstellungen angewandt.

Ressourcen

Relevante Publikationen