Hauptregion der Seite anspringen

Seminar Natural Language Processing im Wintersemester 2014/2015

Allgemeine Informationen

Themengebiete

Verschiedene Themen zur maschinellen Verarbeitung natürlicher Sprachen, z. B.
  • Formalismen zwischen kontextfreien und kontextsensitiven Grammatiken
  • Regelgewinnung aus Baumkorpora
  • Parsing von Dependenzstrukturen

Zielgruppen

engagierte Studenten folgender Studiengänge
  • Bachelor Informatik: Module INF-B-510 (Proseminar), INF-B-520 (Proseminar), INF-B-610 (Proseminar)
  • Master Informatik: Modul INF-AQUA (Seminar)
  • Diplom Informatik: Module INF-D-520 (Proseminar), INF-D-940 (Seminar)
  • Diplom Informatik (Studienordnung 2004 oder älter): Hauptseminar, Fachgebiet Theorie der Programmierung

Voraussetzungen für die Teilnahme

  • Bachelor Informatik: Modul INF-B-290 (Theoretische Informatik und Logik)
  • Master Informatik: keine; Grundlagenwissen über die Themengebiete wird empfohlen
  • Diplom Informatik: Modul INF-D-330 (Theoretische Informatik und Logik)
  • Diplom Informatik (Studienordnung 2004 oder älter): Grundlagen der Theoretischen Informatik

Voraussetzungen für das Bestehen

  • fristgerecht und eigenständig Termine mit den Betreuern verabreden (mindestens 1 Woche im Voraus) sowie die geforderten Materialien abgeben
  • (nicht für Proseminar) Seminararbeit von 12–15 Seiten, mit Titel, Autor, Einleitung (mind. 1 Seite), vollständigen Referenzen, begrifflich und notationell in sich abgeschlossen, Inhalte mit Beispielen und Bildern anschaulich gemacht; davon eine Vorabversion: inhaltlich vollständig, aber in der Darstellung noch rudimentär
  • (nur für Proseminar) Handout 1–2 Seiten (nur ein Blatt!)
  • (für alle) Vortrag von 30–35 Minuten, durch Medien geeignet unterstützt: Beamer-Folien, Tafel, physische Folien, Handout etc.; von allem eine Vorabversion: inhaltlich vollständig, aber in der Darstellung noch rudimentär
  • Anwesenheit bei allen Vorträgen, aktive Teilnahme an den Diskussionen
  • bei Einbringen in eine mündliche Prüfung: Übersichtswissen über die Seminarbeiträge (Kernthesen)

Terminplan

Datum Ereignis
42. KW, Mittwoch, 15. Oktober 2014, 13:00 Uhr erstes Treffen und Themenvergabe im Raum APB/3027 (Fakultät Informatik)
bis 45. KW, Mittwoch, 5. November 2014 Termine mit Betreuern (rechtzeitig verabreden!); Ziel: in der Lage sein, dem Betreuer das Problem und die beschriebenen Ansätze zu skizzieren und auf Nachfragen zu reagieren; Fragen an den Betreuer müssen ganz konkret formuliert werden.
bis 47. KW, Sonntag, 23. November 2014 Vorabversion der Seminararbeit abgeben, Termine zur Besprechung machen
bis 50. KW, Sonntag, 14. Dezember 2014 fertige Seminararbeit abgeben
bis 3. KW, Mittwoch, 14. Januar 2015 Vorabversion der Vortragsmaterialien abgeben, Termine zur Besprechung machen
bis 5. KW, Sonntag, 1. Februar 2015 fertige Vortragsmaterialien abgeben
6. KW, Mittwoch, 4. Februar 2015, 08:00–11:00 Uhr Vorträge im Raum APB/3027

Themen

Folien zur Themenvorstellung (nur aus dem Universitätsnetz abrufbar)

Thema Literatur Student Material
LCFRS [VWJ87] Thomas Ruprecht Handout, Vortragsfolien, Overheadfolien
Synchronous LCFRS [Kae13] Marie-Christin Kloß Handout, Vortragsfolien
Relation of MCFG, LCFRS, and simple RCG [Sek+91; Bou98]
Parsing MCFG and SRCG [Kal10, Ch. 7]
Probabilistic LCFRS and prefix probabilities [NS13; NS11]
Simple RCG rule extraction [MS08] Oliver Groth Seminararbeit, Vortragsfolien, Overheadfolie, Extraktionsalgorithmus
LCFRS binarisation [Góm+09]
Dependency parsing [Kuh13] Anja Reusch (Sommersemester 2015) Handout, Vortragsfolien, Overheadfolie

Weitere VortrÄge

  • Kilian Gebhardt: Parsing algorithms for linear context-free rewriting systems. (Folien)

Literatur

Einige Downloads sind nur aus dem Universitätsnetz erlaubt. Falls Sie gerade keinen direkten Zugang zum Universitätsnetz haben, können Sie auf das VPN der TU Dresden zurückgreifen.

[VWJ87] Vijay-Shanker, K., David J. Weir, and Aravind K. Joshi. 1987. “Characterizing Structural Descriptions Produced by Various Grammatical Formalisms.” In Proceedings of the 25th Annual Meeting on Association for Computational Linguistics, 104–111. ACL ’87. Stroudsburg, PA, USA: Association for Computational Linguistics. doi:10.3115/981175.981190.
[Kae13] Kaeshammer, Miriam. 2013. “Synchronous Linear Context-Free Rewriting Systems for Machine Translation.” Syntax, Semantics and Structure in Statistical Translation: 68. http://www.aclweb.org/anthology/W13-0808.
[Sek+91] Seki, Hiroyuki, Takashi Matsumura, Mamoru Fujii, and Tadao Kasami. 1991. “On Multiple Context-Free Grammars.” Theoretical Computer Science 88 (2): 191–229. doi:10.1016/0304-3975(91)90374-B.
[Bou98] Boullier, Pierre. 1998. “Proposal for a Natural Language Processing Syntactic Backbone.” Rapport de recherche RR-3342. INRIA. http://hal.inria.fr/inria-00073347.
[Kal10] Kallmeyer, Laura. 2010. Parsing Beyond Context-Free Grammars. Springer.
[NS13] Nederhof, Mark-Jan, and Giorgio Satta. 2013. “Prefix Probabilities for Linear Context-Free Rewriting Systems.” Journal of Logic and Computation. doi:10.1093/logcom/exs081.
[NS11] Nederhof, Mark-Jan, and Giorgio Satta. 2011. “Prefix Probabilities for Linear Context-Free Rewriting Systems.” In Proceedings of the 12th International Conference on Parsing Technologies, 151–162. IWPT ’11. Stroudsburg, PA, USA: Association for Computational Linguistics. http://dl.acm.org/citation.cfm?id=2206329.2206348.
[MS08] Maier, Wolfgang, and Anders Søgaard. 2008. “Treebanks and Mild Context-Sensitivity.” In Proceedings of Formal Grammar, 61. http://web.stanford.edu/group/cslipublications/cslipublications/FG/2008/maier.pdf.
[Góm+09] Gómez-Rodríguez, Carlos, Marco Kuhlmann, Giorgio Satta, and David Weir. 2009. “Optimal Reduction of Rule Length in Linear Context-Free Rewriting Systems.” In Proceedings of Human Language Technologies: The 2009 Annual Conference of the North American Chapter of the Association for Computational Linguistics, 539–547. NAACL ’09. Stroudsburg, PA, USA: Association for Computational Linguistics. http://dl.acm.org/citation.cfm?id=1620754.1620833.
[Kuh13] Kuhlmann, Marco. 2013. “Mildly Non-Projective Dependency Grammar.” Computational Linguistics 39. doi:10.1162/COLI_a_00125.
[Eva11] Evang, Kilian. 2011. “Parsing discontinuous constituents in English.” Master’s thesis, University of Tübingen. http://kilian.evang.name/publications/mathesis.pdf.

Hilfsangebote

Wir haben einige Hinweise zum Verfassen schriftlicher Arbeiten online zur Verfügung gestellt. Zögern Sie nicht sich bei Fragen an Ihren Betreuer zu wenden. Je eher ein Problem angesprochen wird, desto einfacher wird seine Lösung ausfallen.

Stand: 19.10.2017 12:36 Uhr