Hauptregion der Seite anspringen

Vanda

Maschinelle Übersetzung, z.B. durch Google Translate, ist inzwischen allgegenwärtig. Die kontinuierliche Verbesserung der Übersetzungsqualität wird durch eine florierende Forschergemeinschaft angetrieben. Forschungssysteme, wie zum Beispiel Moses, sind üblicherweise aus mehreren Programmen und Skripten aufgebaut die zusammenarbeiten müssen, damit das System ordnungsgemäß funktioniert. Die Benutzeroberflächen dieser Programme und Skripte sind heterogen und stellen daher eine erhebliche Hürde für das Verständnis der zugrundeliegenden Ideen und der Implementierung von neuen Ideen dar.

Mit Vanda verfolgen wir eine modulare Herangehensweise an Maschinelle Übersetzung die sich auf konzeptuelle Klarheit und rasche Entwicklung von Ideen konzentriert. Diese Herangehensweise stützt sich auf zwei Säulen:

  • Vanda-Haskell: Eine Bibliothek von Datenstrukturen und Algorithmen zusammen mit einem einfach zu nutzenden Kommandozeileninterface für die Ausführung von typischen Aufgaben in der maschinellen Übersetzung. Zu den aktuell verfügbaren Features gehören: die Anwendung von string-to-tree Transducern; Extraktion, Training, und Parsing von probabilistischen kontextfreien Grammatiken; Extraktion, State-Merging, und Parsing von bottom-up deterministischen probabilistischen Baumautomaten; Extraktion, Binarisierung, und Parsing von Linear Context-Free Rewriting Systems; und Training and Anwendung von n-Gramm Modellen. Der Quellcode von Vanda-Haskell ist auf github unter der Lizenz BSD3 verfügbar: https://github.com/tud-fop/vanda-haskell.

  • Vanda-Studio: Eine integrierte Entwicklungsumgebung, die die rasche, inkrementelle Entwicklung von kleinen Experimenten der Maschinellen Übersetzung ermöglicht. In Vanda-Studio wird ein Experiment durch einen sogenannten Workflow beschrieben (siehe dem untigen Screenshot). Vanda-Studio behält alle für den Ablauf des Experiments notwendigen Daten im Auge und bietet Visualisierungen für viele Datentypen an, z.B. Wort-Alignments, Syntaxbäume, und Grammatiken. Zusätzlich zu den von Vanda-Haskell bereitgestellten Tools verfügt Vanda-Studio über ein wachsendes Repertoire von Tools Dritter und ermöglicht die leichte Integration neuer Tools. Weitere Informationen zu Vanda-Studio finden sich in unserem Manuscript. Der Quellcode von Vanda-Studio ist auf github unter der Lizenz BSD3 verfügbar: https://github.com/tud-fop/vanda-studio.

Screenshot Vanda Studio

An Vanda mitarbeiten

Im Laufe ihres Studiums haben Studenten mehrere Möglichkeiten, an Vanda mitzuarbeiten: studentische Arbeiten (Bachelor, Master, Diplom, Beleg), Praktika und Projekte, etc. Besuchen Sie unsere Lehre-Seiten, um sich über geeignete Veranstaltungen zu informieren, oder fragen Sie Ihren Übungsleiter nach einem Thema für eine studentische Arbeit.

Kontakt

Stand: 13.10.2020 15:56 Uhr