Information Retrieval und Natural Language Processing (WS 2017/2018)
Inhalt
Einführung und Überblick über die Gebiete:- Information Retrieval
- Natural Language Processing
- Natural Language Processing Pipeline
- Sprachidentifikation
- Segmentierung
- POS-Tagging
- Stamm- und Grundformreduktion
- Dependenzen
- Stoppworteliminierung
- Thesaurus
- Fortgeschrittenere Werkzeuge
- Hidden Markov Modelle
- Named Entity Recognition
- Phonetische Algorithmen
- Information Retrieval
- Evaluationsmaße
- Grundlegende formale Modelle
- Retrieval Modelle
- Boolsches Retrieval
- Fuzzy-Set Modell
- Latent Semantic Indexing (LSI)
- Explicit Semantic Analysis (ESA)
- Anwendungsgebiete
- Plagiatserkennung
- Sentiment Analysis, Opinion Mining
- ...?
Organisation
- Umfang: 2 SWS (Vorlesung) + 2 SWS (Übung)
- Vorlesung: Prof. Dr. Stefan Conrad
- Übung: Julia Romberg
- Beginn der Vorlesung: Mo. 9.10.2017
- Beginn der Übung: organisatorische Übung: Do. 12.10.2017
Veranstaltung | Zeit | Ort |
Vorlesung | Mo, 14:30 - 16 Uhr | Hörsaal 5H |
Übung | Do, 14:30 - 16 Uhr | Raum 25.12.02.33 |
Übung
Begleitend zur Vorlesung soll in der Übung von und mit den Studierenden ein Projekt umgesetzt werden, welches sowohl auf grundlegende Bausteine einer Natural Language Pipeline eingeht, als auch die Problematiken und Herangehensweisen von Datenannotationen thematisiert. Die erfolgreiche Umsetzung des Projekts soll den Studenten das selbstständige und praxisorientierte Arbeiten mit NLP-Ressourcen näher bringen.
Das Projekt gliedert sich in 3 Teile auf, welche jeweils zu bestehen sind. Programmieraufgaben sind in Python umzusetzen.
Folien / Skript
Zu der Vorlesung gibt es eine umfangreiche Sammlung von Folien, die im Laufe des Semesters sukzessive (möglichst rechtzeitig vor der jeweiligen Vorlesungsstunde) in Ilias zur Verfügung gestellt werden.
Literatur
Eine Auswahl:- A. Henrich: Information Retrieval 1 - Grundlagen, Modelle und Anwendungen, eBook (Creative Commons), http://www.uni-bamberg.de/?id=23516, 2008
- R. Baeza-Yates, B. Ribeiro-Neto: Modern Information Retrieval, Addison-Wesley, Boston, 1999
- C. Manning, H. Schütze: Foundations of Statistical Natural Language Processing, MIT Press, Cambridge, 1999