Anmeldung beim Gforce-Projekt “KDD_Übung” zur Teilnahme an der praktischen Übungsaufgabe.
Und hier findet man den Gforge Server und hier das Projekt KDD_Übung für die Übung. So ich habe eine Mailman-Liste angelegt, mit dem Namen kddss2005-discuss. Bitte tragt Euch dort ein.
Erster Veranstaltungstag:
Dienstag, 13. April 2005 (Übungen ab Dienstag 26. April) in Raum 0443
Vorlesungen:
Mittwochs, 14.00 h – 15.30 h, in Raum 0443
Übungen:
Dienstag, 12.30 h – 14.00 h, in Raum 0443
Vorkenntnisse:
Informatik Grundstudium
Angesprochener HörerInnenkreis:
Inf. Hauptstudium, Math. NF Inf. Hauptstudium
Leistungsnachweis:
mündliche Prüfung oder Klausur, je nach Teilnehmerzahl
Veranstalter:
Inhalt:
Die Vorlesung gibt einen Überblick über Verfahren zur Wissensgewinnung aus strukturierten Daten und Texten. Behandelt werden
- Techniken zur Vorverarbeitung und Integration von Datenbeständen, wozu das Konzept des Data Warehouse gehört,
- OLAP-Techniken für die interaktive Analyse großer Datenbestände,
- (halb-)automatische Verfahrung zur Gewinnung neuen Wissens aus strukturierten Daten und
- Methoden zur Wissensextraktion aus Texten.
Der Schwerpunkt der Vorlesung liegt auf den maschinellen Lernverfahren, deren Anwendung an konkreten Beispielen aufgezeigt wird.
Literatur:
- M. Ester und J. Sander: Knowledge Discovery in Databases: Springer-Verlag, 2000.
- U. M. Fayyad, G. Piatetsky-Shapiro, P. Smyth and R. Uthurasamy: Advances in Knowledge Discovery and Data Mining. Cambridge, London. MIT Press, 1996.
- T.M. Mitchell. Machine Learning. McGraw-Hill. 1997.
- Berthold M., Hand D. J. (eds.), „Intelligent Data Analysis: An Introduction“, Springer Verlag, Heidelberg, 1999.
- Witten I. H., Frank E., „Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations“, Morgan Kaufmann Publishers, 2000.
- D. Pyle. Data Preparation for Data Mining. Morgan Kaufmann. 1999.
- S. Chaudhuri and U. Dayal: An Overview of Data Warehousing and OLAP Technology. in: SIGMOD Record, Vol. 26, No. 1, March 1997. S.65-74.
- CRoss Industry Standard Process for Data Mining (CRISP-DM)
- Die Folien zur Vorlesung basieren zum großen Teil auf den Informationen der Seite: Weitere Informationen zum Lehrbuch “Knowledge Discovery in Databases”
- Die Folien (Kap5.6) zur Einführung der SVM wurden der Vorlesung “Maschinelles Lernen und Data Mining” von Katharina Morik entnommen.
Folien:
- Kap1.pdf
- Kap2.pdf
- Kap3.pdf
- Kap4.pdf
- Kap5.pdf
- Kap4-Ergaenzung-FBA.pdf
- Kap5_6_SVM.pdf
- Kap6.pdf
- Kap7.pdf
Übungsaufgaben:
Weitere Informationen:
Das Material der letzten KDD-Vorlesung ist zu finden unter /lehre/ss2004/kdd/