Anmeldung beim Gforce-Projekt “KDD_Übung” zur Teilnahme an der praktischen Übungsaufgabe.

Und hier findet man den Gforge Server und hier das Projekt KDD_Übung für die Übung. So ich habe eine Mailman-Liste angelegt, mit dem Namen kddss2005-discuss. Bitte tragt Euch dort ein.

Erster Veranstaltungstag:

Dienstag, 13. April 2005 (Übungen ab Dienstag 26. April) in Raum 0443

Vorlesungen:

Mittwochs, 14.00 h – 15.30 h, in Raum 0443

Übungen:

Dienstag, 12.30 h – 14.00 h, in Raum 0443

Vorkenntnisse:

Informatik Grundstudium

Angesprochener HörerInnenkreis:

Inf. Hauptstudium, Math. NF Inf. Hauptstudium

Leistungsnachweis:

mündliche Prüfung oder Klausur, je nach Teilnehmerzahl

Veranstalter:

Dr. Andreas Hotho

Inhalt:

Die Vorlesung gibt einen Überblick über Verfahren zur Wissensgewinnung aus strukturierten Daten und Texten. Behandelt werden

  • Techniken zur Vorverarbeitung und Integration von Datenbeständen, wozu das Konzept des Data Warehouse gehört,
  • OLAP-Techniken für die interaktive Analyse großer Datenbestände,
  • (halb-)automatische Verfahrung zur Gewinnung neuen Wissens aus strukturierten Daten und
  • Methoden zur Wissensextraktion aus Texten.

Der Schwerpunkt der Vorlesung liegt auf den maschinellen Lernverfahren, deren Anwendung an konkreten Beispielen aufgezeigt wird.

Literatur:

  • M. Ester und J. Sander: Knowledge Discovery in Databases: Springer-Verlag, 2000.
  • U. M. Fayyad, G. Piatetsky-Shapiro, P. Smyth and R. Uthurasamy: Advances in Knowledge Discovery and Data Mining. Cambridge, London. MIT Press, 1996.
  • T.M. Mitchell. Machine Learning. McGraw-Hill. 1997.
  • Berthold M., Hand D. J. (eds.), „Intelligent Data Analysis: An Introduction“, Springer Verlag, Heidelberg, 1999.
  • Witten I. H., Frank E., „Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations“, Morgan Kaufmann Publishers, 2000.
  • D. Pyle. Data Preparation for Data Mining. Morgan Kaufmann. 1999.
  • S. Chaudhuri and U. Dayal: An Overview of Data Warehousing and OLAP Technology. in: SIGMOD Record, Vol. 26, No. 1, March 1997. S.65-74.
  • CRoss Industry Standard Process for Data Mining (CRISP-DM)
  • Die Folien zur Vorlesung basieren zum großen Teil auf den Informationen der Seite: Weitere Informationen zum Lehrbuch “Knowledge Discovery in Databases”
  • Die Folien (Kap5.6) zur Einführung der SVM wurden der Vorlesung “Maschinelles Lernen und Data Mining” von Katharina Morik entnommen.

Folien:

  • Kap1.pdf PDF-Download PDF-Download (4 in 1)
  • Kap2.pdf PDF-Download PDF-Download (4 in 1)
  • Kap3.pdf PDF-Download PDF-Download (4 in 1)
  • Kap4.pdf PDF-Download PDF-Download (4 in 1)
  • Kap5.pdf PDF-Download PDF-Download (4 in 1)
  • Kap4-Ergaenzung-FBA.pdf PDF-Download PDF-Download (4 in 1)
  • Kap5_6_SVM.pdf PDF-Download PDF-Download (4 in 1)
  • Kap6.pdf PDF-Download PDF-Download (4 in 1)
  • Kap7.pdf PDF-Download PDF-Download (4 in 1)

Übungsaufgaben:

Weitere Informationen:

Das Material der letzten KDD-Vorlesung ist zu finden unter /lehre/ss2004/kdd/