UfLexicc

UfLexicc – Extraktion von Beispielsätzen für Lexographen

Anbindung: TU Darmstadt

Assoziiert seit: Dezember 2016

Kurzbeschreibung

Ziel dieses Projekts ist es, Lexikographen darin zu unterstützen, Sätze zu finden, welche als Beispiele für die verschiedenen Verwendungsarten/Bedeutungen von Wörtern dienen können, und diese zu kategorisieren. Eine Kombination aus überwachten und unüberwachten maschinellen Lernmethoden wird dazu verwendet, Daten aus einem großen Textkorpus zu verarbeiten. Resultat dieses Ansatzes ist eine Liste von Vorschlägen für Beispielsätze. Eine der Herausforderungen in diesem Projekt ist die interaktive Unterstützung der Disambiguierung von Beispielsätzen bezogen auf die Bedeutung von Wörtern. Eine andere bildet die Bestimmung des passenden Kontextes zum jeweiligen gesuchten Wort, die auch vom Benutzer gesteuert wird.

Verschiedene State-of-the-Art Techniken wie Clustering und Klassifikationsmethoden werden in diesem Projekt genutzt. Benutzer-Feedback ist Teil der Wortdisambiguierung und der Auswahl einzelner Beispiele für bestimmte Wortbedeutungen.

CEDIFOR Projektbeteiligte

CEDIFOR-Partners:

Publikationen

  • Boullosa, Beto; Eckart de Castilho, Richard; Geyken, Alexander; Lemnitzer, Lothar; Gurevych, Iryna: A tool for extracting sense-disambiguated example sentences through user feedback. In Proceedings of the Software Demonstrations of the 15th Conference of the European Chapter of the Association for Computational Linguistics, p. 69-72, Valencia, Spain, 2017.

Ressourcen

Assoziierte Softwareprodukte: