Erster Veranstaltungstag:
Mittwoch, 22. Oktober 2008, 10:15 in Raum 0443
Ort und Zeit:
Mittwochs, 10.15 h – 11.45 h, in Raum 0443.
Übungen:
Donnerstags, 8.15 h – 9.45 h, in Raum 0443. Beginn 30. Oktober.
Vorkenntnisse:
Informatik Grundstudium
Angesprochener HörerInnenkreis:
Inf. 4. Sem., Math. NF Inf.
Leistungsnachweis:
mündliche Prüfung oder Klausur, je nach Teilnehmerzahl
Veranstalter:
Dr. Andreas Hotho, Prof. Dr. Gerd Stumme
Inhalt:
Die Vorlesung gibt einen Überblick über Verfahren zur Wissensgewinnung aus strukturierten Daten und Texten. Behandelt werden
- Techniken zur Vorverarbeitung und Integration von Datenbeständen, wozu das Konzept des Data Warehouse gehört,
- OLAP-Techniken für die interaktive Analyse großer Datenbestände,
- (halb-)automatische Verfahrung zur Gewinnung neuen Wissens aus strukturierten Daten und Methoden zur Wissensextraktion aus Texten.
Der Schwerpunkt der Vorlesung liegt auf den maschinellen Lernverfahren, deren Anwendung an konkreten Beispielen aufgezeigt wird.
Die Vorlesung kann bei Interesse durch die Teilnahme am im folgenden Semester angebotenen Data Mining Cup (Projektseminar, 4 SWS) ergänzt werden.
Literatur:
- M. Ester und J. Sander: Knowledge Discovery in Databases: Springer-Verlag, 2000.
- U. M. Fayyad, G. Piatetsky-Shapiro, P. Smyth and R. Uthurasamy: Advances in Knowledge Discovery and Data Mining. Cambridge , London . MIT Press, 1996.
- CRoss Industry Standard Process for Data Mining (CRISP-DM)
- Weitere Links und Referenzen zur KDD-Vorlesung in BibSonomy
Folien:
- Einführung
- Kap2_Grundlagen.pdf
- Kap3_Teil1_Clustering.pdf
- Kap3_Teil2_Clustering.pdf
- Kap3_Teil3_Begriffsverbaende.pdf
- Kap4_Assoziationsregeln.pdf
- Kap4_Teil2_Begriffsverbaende2.pdf
- Kap5_Klassifikation.pdf
- Kap5_Teil2_SVM.pdf
- Kap6_Vorverarbeitung.pdf
- Kap7_AndereParadigmen.pdf
- Kap8_BesondereDatentypen.pdf
Übungsaufgaben:
Hinweise zur Installation von RapidMiner sowie für die Praxisübungen benötigte Dateien finden Sie auf dieser Seite
Die Praxisübungen finden nicht als Teil des regulären Übungsbetriebes statt, sondern sind selbständig zu Hause zu lösen.
- 1. Übung — Lösungsvorschlag
- 2. Übung (Praxisübung mit RapidMiner)
- 3. Übung — Lösungsvorschlag
- Praxisübung zur 3. Übung
- 4. Übung — Lösungsvorschlag
- 5. Übung — Lösungsvorschlag
- 6. Übung — Lösungsvorschlag
- 7. Übung — Lösungsvorschlag
- Praxisübung zur 7. Übung
- 8. Übung — Lösungsvorschlag
- Praxisübung zur 8. Übung
- 9. Übung — Lösungsvorschlag
- 10. Übung — Lösungsvorschlag
- Praxisübung zur 10. Übung
- 11. Übung — Lösungsvorschlag
- 12. Übung — Lösungsvorschlag