Compuerlinguistik Forschung

In der Computerlinguistik verfolgen wir die folgenden Forschungsschwerpunkte:

Framesemantik

Im SFB 991 gehen wir davon aus, dass Frames ein universelles Beschreibungsmittel für kognitive Konzepte sind. In unserer Forschung geht es um die formale Modellierung von Frames sowie um die Verwendung von Frames bei der Repräsentation von Konzepten mit sprachlichen Ausdrücken. 

Parsing

Unser Fokus hier ist die Untersuchung und Weiterentwicklung von schwach kontextsensitiven Grammatikformalismen, also Formalismen, die eine größere Auswahl an formellen Sprachen erfassen als kontextfreie Grammatiken, ohne dabei exponentielle Laufzeiten zu benötigen. Die untersuchten Formalismen sind insbesondere TAG, LCFRS und RCG. Ein Kernpunkt ist das Open Source Projekt TuLiPA. 

Finite State Methoden

Die Einsatzmöglichkeiten von endliche Automaten in der maschinellen Sprachverarbeitung sind fast unbegrenzt. Wir verwenden sie bei der Konstruktion von Lemmatisierern und bei der Identifikation von Possessivkonstruktionen in Dependenzbäumen. 

Korpusbasierte Methoden

Annotierte Korpora sind eine Quelle für maschinelles Lernen. Wir sammeln und konstruieren Korpora für verschieden Projekte im SFB 991 und verwenden sie in der eigenen Forschung. 

Grammatikformalismen

Hier beschäftigen wir uns insbesondere mit Tree Adjoining Grammars (TAG) und Linear Context Free Rewriting Systems (LCFRS). 

Grammar engineering

Unser Ziel ist es, umfassende linguistische/grammatische Ressourcen zu entwickeln. eXtensible MetaGrammar eröffnet die Möglichkeit, Ressourcen wie Grammatiken, Lexika etc. auf eine sehr kompakte Art zu beschreiben, indem, indem sie verschiedene Ebenen der linguistischen Analyse benutzt (z.B. Morphology, Syntax, Semantik)

Maschinelle Übersetzung

Hier untersuchen wir Wort Alignment Verfahren und die Kombination von Grammatikformalismen und maschineller Übersetzung (sogenannte baumbasierte Verfahren). 

Formalisierung der Astadhyayi

Wir vergleichen die über 2000 Jahre alten phonologischen Beschreibungssysteme Paninis mit moderen merkmalsbasierten Ansätzen im Blick auf ihre Adäquatheit. 

Verantwortlich für den Inhalt: E-Mail sendenRedaktionsteam Institut für Sprache und Information