Inhalte

Beim maschinellen Übersetzen von Texten in einer natürlichen Sprache in eine andere kommen verschiedene Formalismen wie Grammatiken und Automaten zum Einsatz. Diese Vorlesung gibt einen Überblick, wie man solche Formalismen zur Modellierung von natürlichsprachlichen Übersetzungen nutzen kann und wie man ein so modelliertes Übersetzungssystem anhand von Beispielen trainiert.

Termine

Die Vorlesungen beginnen am 13. Oktober 2014 (siehe Stundenplan).

Am 27. November 2014 findet keine Vorlesung und keine Übung statt.

Übungsaufgaben

Materialien

Materialen werden im Laufe der Vorlesung zur Verfügung gestellt. Sie können sich vorab anhand des vorherigen Vorlesungsdurchlaufes einen Überblick verschaffen.

Literatur

  1. Kevin Knight, 1997. Automating Knowledge Acquisition for Machine Translation. In: AI Magazine 18.4. S. 81–96.
  2. Adam Lopez, 2008. Statistical Machine Translation. In: ACM Computing Surveys 40.3. S. 1–49.
  3. Peter F. Brown, Vincent J. Della Pietra, Stephen A. Della Pietra und Robert L. Mercer, 1993. The Mathematics of Statistical Machine Translation: Parameter Estimation. In: Computational Linguistics 19.2. S. 263–311.
  4. Ye-Yi Wang und Alex Waibel, 1997. Decoding Algorithm in Statistical Machine Translation. In: Proceedings of the 35th Annual Meeting of the ACL. Association for Computational Linguistics. S. 366–372.
  5. Kevin Knight, 1999. Squibs and Discussions: Decoding Complexity in Word-Replacement Translation Models. In: Computional Linguistics 25(4), S. 607–615.
  6. Kenji Yamada und Kevin Knight, 2001. A Syntax-Based Statistical Translation Model. In: Proceedings of the 39th Annual Meeting of the ACL. Association for Computational Linguistics. S. 523–530.
  7. Kenji Yamada und Kevin Knight, 2002. A Decoder for Syntax-Based Statistical MT. In: Proceedings of the 40th Annual Meeting of the ACL. Association for Computational Linguistics. S. 303–310.
  8. Torsten Stüber, 2012. Consistency of Probabilistic Context-Free Grammars, Dresden, Germany, Technischer Bericht TUD-FI12-04-März 2012, Technische Universität Dresden.
  9. Mark-Jan Nederhof und Giorgio Satta, 2008. Computing Partition Functions of PCFGs. In: Research on Language and Computation 2(6), S. 139–162.
  10. Donald E. Knuth, 1977. A generalization of Dijkstra’s algorithm. In: Information Processing Letters 6(1), S. 1–5.
  11. Liang Huang und David Chiang, 2005. Better k-best parsing. In: Proceedings of the Ninth International Workshop on Parsing Technology, S. 53–64.
  12. Slav Petrov, Leon Barrett, Romain Thibaux und Dan Klein, 2006. Learning accurate, compact, and interpretable tree annotation. In: Proceedings of the 21st International Conference on Computational Linguistics and the 44th annual meeting of the Association for Computational Linguistics, Association for Computational Linguistics, S. 433–440
  13. Mark-Jan Nederhof und Giorgio Satta, 2011. Splittability of Bilexical Context-free Grammars is Undecidable. In: Computational Linguistics 37(4), MIT Press, S. 867–879. DOI: 10.1162/COLI_a_00079.
  14. Mark-Jan Nederhof, 2005. Nederhof A General Technique to Train Language Models on Language Models. In: Computational Linguistics 31(2), MIT Press, S. 173–186. DOI: 10.1162/0891201054223986.
  15. Anna Corazza und Giorgio Satta, 2007. Probabilistic Context-Free Grammars Estimated from Infinite Distributions. In: IEEE Transactions on Pattern Analysis and Machine Intelligence 29(8), S. 1379–1393. DOI: 10.1109/TPAMI.2007.1065.
  16. David Chiang, 2007. Hierarchical Phrase-Based Translation. In: Computational Linguistics 33(2), S. 201–228.
  17. Philip M. Lewis II und Richard Edwin Stearns, 1968. Syntax-Directed Transduction. In: Journal of the ACM 15(3), S. 465–488. DOI: 10.1145/321466.321477.
  18. Franz Josef Och und Hermann Ney, 2003. A systematic comparison of various statistical alignment models. Computational Linguistics 29(1), MIT Press, S. 19–51. DOI: 10.1162/089120103321337421.
  19. Michel Galley, Mark Hopkins, Kevin Knight und Daniel Marcu, 2004. What’s in a translation rule? In: Proceedings of HLT-NAACL 2004. Association for Computational Linguistics. S. 273–280.
  20. Jonathan Graehl und Kevin Knight, 2004. Training tree transducers. In: Proc. Human Language Technologies and North American ACL, Association for Computational Linguistics. S. 105–112.
  21. Jonathan Graehl, Kevin Knight und Jonathan May, 2008. Training Tree Transducers. In: Computational Linguistics 34(3). S. 391–427.
  22. Detlef Prescher, 2005. A Tutorial on the Expectation-Maximization Algorithm Including Maximum-Likelihood Estimation and EM Training of Probabilistic Context-Free Grammars. Technischer Bericht. 15th European Summer School in Logic, Language, und Information.

weiterführende Literatur: ACL Anthology – “over 21,200 papers on the study of computational linguistics and natural language processing”

Stand: 19.10.2017 12:36 Uhr