Hier finden Sie die für die Praxisübungen benötigten Datensätze sowie Hinweise zur Installation von RapidMiner.
Installation von RapidMiner
Wir werden RapidMiner innerhalb der Java-Entwicklungsumgebung Eclipse
installieren und benutzen. Es wird vorausgesetzt, dass Sie Eclipse bereits installiert und sich mit der
Bedienung vertraut gemacht haben.
- Richten Sie ein neues Java-Projekt in Eclipse ein (File/New/Java Project) und geben Sie ihm den Namen RapidMiner
- Laden Sie die Datei rapidminer-4.2-community.zip
herunter und entpacken Sie sie in einem Verzeichnis (z.b. /tmp/rapidminer-4.2).
- Importieren Sie alle Dateien (Import/General/File System) aus dem Verzeichnis in ihr Projekt RapidMiner,
insbesondere auch die Dateien .project und .classpath.
- Eclipse baut das Projekt jetzt und es sollten keine Fehler (lediglich Warnungen) auftreten.
- Bevor wir fertig sind, müssen wir noch den Ant-Task copy-resources ausführen. Klicken Sie dazu mit der rechten Maustaste
auf die Datei build.xml im Projekt und wählen Sie Run As/Ant Build.... Aktivieren Sie im erscheinenden Dialog
das Target copy-resources und klicken Sie auf Run. Eclipse ruft jetzt Ant auf und danach könnten Sie RapidMiner schon
mittels der Klasse com.rapidminer.gui.RapidMinerGUI starten.
Um eigene Plugins entwickeln zu können, werden wir jetzt ein Projekt und ein Grundgerüst für ihre Plugins anlegen.
- Erstellen Sie ein neues Java-Projekt KDDUebung in Eclipse.
- Fügen Sie das Projekt RapidMiner zum BuildPath dieses Projektes hinzu (Properties/Java Build Path/Projects/Add).
- Erstellen Sie im src-Folder ein neues Paket de.unikassel.cs.kde.kdd (New/Package).
- Importieren Sie in dieses Paket die Klasse KDDKMeans.java.
In dieser Klasse werden Sie in der Übung den KMeans-Algorithmus implementieren.
- Erstellen Sie innerhalb ihres Projektes einen Ordner META-INF (New/Folder) und speichern Sie in diesem die
Dateien operators.xml und MANIFEST.MF.
- Importieren Sie die Datei kddexercise.jardesc ins Hauptverzeichnis des Projektes.
- Das Projekt KDDUebung sollte jetzt keine Fehler aufweisen und folgende Struktur haben:
KDDUebung
|_src
| |_ de
| |_ unikassel
| |_ cs
| |_ kde
| |_ kdd
| |_ KDDKMeans
|_ META-INF
| |_ MANIFEST.MF
| |_ operators.xml
|_ kddexercise.jardesc
- Nun packen wir das Plugin in ein JAR und speichern es im Plugin-Verzeichnis von Rapidminer. Klicken Sie dazu mit der rechten
Maustaste auf die Datei kddexercise.jardesc und wählen Sie
Open JAR Packager.... Ändern Sie im erscheinenden Dialog unter Select the export destination das Ziel-Verzeichnis
zum Plugin-Verzeichnis von RapidMiner (in ihrem Workspace RapidMiner/lib/plugins). Klicken Sie Finish. Das Plugin-JAR
sollte nun ohne Fehler gebaut werden. Beachten Sie, dass die Datei kddexercise.jardesc nur funktioniert, wenn ihr Projekt
KDDUebung heißt.
Jetzt können Sie RapidMiner starten, indem Sie die Klasse com.rapidminer.gui.RapidMinerGUI als Java Application
laufen lassen. Nachdem RapidMiner gestartet ist, können Sie darin ein neues Projekt erstellen und den Operator KDDExercise/KDDKMeans
mittels Rechtsklick und New Operator einfügen.
Algorithmen-Plugin-Gerüste
Datensätze