Hauptregion der Seite anspringen

Seminar Natural Language Processing im Wintersemester 2015/2016

Allgemeine Informationen

Themengebiete

Verschiedene Themen zur maschinellen Verarbeitung natürlicher Sprachen, z. B.
  • Formalismen zwischen kontextfreien und kontextsensitiven Grammatiken
  • Regelgewinnung aus Baumkorpora
  • Parsing von Dependenzstrukturen

Zielgruppen

engagierte Studenten folgender Studiengänge
  • Bachelor Informatik: Module INF-B-510 (Proseminar), INF-B-520 (Proseminar), INF-B-610 (Proseminar)
  • Master Informatik: Modul INF-AQUA (Seminar)
  • Diplom Informatik: Module INF-D-520 (Proseminar), INF-D-940 (Seminar)
  • Diplom Informatik (Studienordnung 2004 oder älter): Hauptseminar, Fachgebiet Theorie der Programmierung

Voraussetzungen für die Teilnahme

  • Bachelor Informatik: Modul INF-B-290 (Theoretische Informatik und Logik)
  • Master Informatik: keine; Grundlagenwissen über die Themengebiete wird empfohlen
  • Diplom Informatik: Modul INF-D-330 (Theoretische Informatik und Logik)
  • Diplom Informatik (Studienordnung 2004 oder älter): Grundlagen der Theoretischen Informatik

Voraussetzungen für das Bestehen

  • fristgerecht und eigenständig Termine mit den Betreuern verabreden (mindestens 1 Woche im Voraus) sowie die geforderten Materialien abgeben
  • (nicht für Proseminar) Seminararbeit von 12–15 Seiten, mit Titel, Autor, Einleitung (mind. 1 Seite), vollständigen Referenzen, begrifflich und notationell in sich abgeschlossen, Inhalte mit Beispielen und Bildern anschaulich gemacht; davon eine Vorabversion: inhaltlich vollständig, aber in der Darstellung noch rudimentär
  • (nur für Proseminar) Handout 1–2 Seiten (nur ein Blatt!)
  • (für alle) Vortrag von 30–35 Minuten, durch Medien geeignet unterstützt: Beamer-Folien, Tafel, physische Folien, Handout etc.; von allem eine Vorabversion: inhaltlich vollständig, aber in der Darstellung noch rudimentär
  • Anwesenheit bei allen Vorträgen, aktive Teilnahme an den Diskussionen
  • bei Einbringen in eine mündliche Prüfung: Übersichtswissen über die Seminarbeiträge (Kernthesen)

Terminplan

Datum Ereignis
42. KW, Donnerstag, 15. Oktober 2015, 11:10 Uhr erstes Treffen und Themenvergabe im Raum APB/3027 (Fakultät Informatik)
bis 45. KW, 5. November 2015 Termine mit Betreuern (rechtzeitig verabreden!); Ziel: in der Lage sein, dem Betreuer das Problem und die beschriebenen Ansätze zu skizzieren und auf Nachfragen zu reagieren; Fragen an den Betreuer müssen ganz konkret formuliert werden.
bis 48. KW, 27. November 2015 Vorabversion der Seminararbeit abgeben, Termine zur Besprechung machen
bis 51. KW, 18. Dezember 2015 fertige Seminararbeit abgeben
bis 2. KW, 15. Januar 2016 Vorabversion der Vortragsmaterialien abgeben, Termine zur Besprechung machen
bis 4. KW, 29. Januar 2016 fertige Vortragsmaterialien abgeben
Donnerstag, 04.02.2016 13:00 Uhr Vorträge im Raum APB/E009

Themen

Das Thema des Seminars wird in diesem Semester syntaktisches Parsing sein. Unter syntaktischem Parsing versteht man das Vorhersagen der syntaktischen Struktur eines Satzes. Die syntaktische Struktur kann als Phrasenstruktur oder als Dependenzstruktur verstanden werden. Zum Parsing können unter anderem probabilistische Erweiterungen kontextfreier Grammatiken und mild-kontextsensitiver Formalismen, aber auch Transitionssysteme, von Markovprozessen inspirierte Modelle und Neuronale Netze verwendet werden. Im Seminar werden wir eine Auswahl von Publikationen zu syntaktischem Parsing lesen. Die Einführungsfolien sind aus dem Uninetz abrufbar.

Thema Literatur Verwendung Anmerkungen Student
Probabilistic models for
constituent parsing
[Col97]
[Cha00]
SEM
Unlexicalized PCFG parsing [KM03] PRO
Latent variables for PCFG [MMT05] SEM
State splitting and merging [Pet+06] PRO Sebastian Döring
Dependency Model with Valence [KM04]
[Kle05]
SEM In der Formel für P_STOP(...) auf S. 5 sind Zähler und Nenner vertauscht. Es soll nur der DMV-Teil bearbeitet werden; aber das EM-Training sollte anhand von [Kle05] vollständig dargestellt werden.
Transition-based Dependency Parsing [Niv03] PRO Markus Reichert
Joint dependency parsing
and POS-tagging
[BN12] SEM
Graph-based projective dependency parsing [MCP05]
[KMN09, Sec. 4.2.3]
PRO Eine Gegenüberstellung von CYK-Parsing und Eisners Algorithmus ist in [KMN09] zu finden.
Graph-based non-projective dependency parsing and the hashing trick [McD+05]
[Boh10]
SEM A complete description of the Chu-Liu-Edmonds algorithm in Fig. 3 of [McD+05] can be found in [McD06, p. 38].
An explaination of MIRA can be found in [MCP05, Sec. 2.3.1].
Markus Napierkowski
Constituent and dependency parsing with LCFRSs [MK10]
[Mai13, Chp. 8]
PRO Man beachte die Errata zu [MK10] und [Kuh13] für eine formale Beschreibung der LCFRS Regelextraktion.
Dependency parsing with
(deep learned) neural networks
[CM14]
([Wei+15])
SEM Sebastian Mielke

Literatur

Einige Downloads sind nur aus dem Universitätsnetz erlaubt. Falls Sie gerade keinen direkten Zugang zum Universitätsnetz haben, können Sie auf das VPN der TU Dresden zurückgreifen.

Wird noch ergänzt.

Hilfsangebote

Wir haben einige Hinweise zum Verfassen schriftlicher Arbeiten online zur Verfügung gestellt. Zögern Sie nicht sich bei Fragen an Ihren Betreuer zu wenden. Je eher ein Problem angesprochen wird, desto einfacher wird seine Lösung ausfallen.

Außerdem möchten wir noch einen Blog-Eintrag zur Vorbereitung und Gestaltung von (wissenschaftlichen) Vorträgen empfehlen. Wichtig ist uns die anschauliche (beispielgetriebene) Darstellung der zentralen Inhalte/ Ideen des bearbeiteten Themas. Die Folien sollten nicht überladen sein. Sie können mit Präsentationsprogrammen oder LaTeX Beamer erstellt werden, sollten aber als PDF abgegeben werden.

Stand: 16.10.2017 12:49 Uhr