Dieses Projekt lässt sich als Bachelor- und als Masterprojekt anrechnen.

Projektvorbesprechung: Montag, 18.04.2016, 16.15 Uhr in Raum 0445/E (FG Wissensverarbeitung). Bei Interesse können Sie auch gerne vorab den jeweiligen Betreuer ansprechen.

Themen

Jeder Teilnehmer des Projektes bearbeitet eine individuelle Aufgabe im Umfeld unseres kooperativen Verschlagwortungssystems BibSonomy, sowie im Kontext des VENUS-Projekts mit Integration von RFID und sozialen Netzwerken.

Unter anderem stehen die folgenden Themen zur Auswahl:

(M = methodischer Schwerpunkt, T = technischer Schwerpunkt)

Filterung von Namen nach Geschlecht in Nameling T

Nameling ist eine Suchmaschine, für die sehr persönliche Aufgabe der Findung eines Babynamens. Zum leichteren Navigieren sollen nun die Geschlechtsinformationen der Namen genutzt werden.

Die Aufgabe besteht aus den folgenden Arbeitspaketen:

  • Zuweisung der Geschlechtsinformation zu allen gespeicherten Namen.
  • Erweiterung der WebApp um eine Filterfunktion nach Geschlecht.
  • Erweiterung der Suchfunktion für unbekannte Namen. Das Geschlecht soll geschätzt werden und dem Nutzer sollen darauf basierende Vorschlage zum Weiterklicken präsentiert werden.

Für die Durchführung dieser Aufgabe sind Kenntnisse in Java 6 und MySQL 5.5 zwingen erforderlich und Kenntnisse in HTML5, CSS3 und JavaServer Pages (JSP) erwünscht aber nebensächlich.

Informationen: Jürgen Müller

Implementierung einer API für Nameling T

Nameling ist eine Suchmaschine, für die sehr persönliche Aufgabe der Findung eines Babynamens. Zur leichteren Anbindung externer wie interner Dienste soll die Plattform um eine dokumentierte API erweitert werden. Sie soll dazu dienen, die Verschiedenen Ressourcen und Funktionen von Nameling anzufragen.

Die Aufgabe besteht aus den folgenden Arbeitspaketen:

  • Design der API-Struktur nach den Best Practices von Apigee.
  • Implementierung der Funktionalität selbst.
  • Dokumentation der API in HTML.

Für die Durchführung dieser Aufgabe sind Kenntnisse in Java 6 und MySQL 5.5 zwingen erforderlich und Kenntnisse in HTML5, CSS3 und JavaServer Pages

Informationen: Jürgen Müller

Vergleich von Anomaly Detection-Verfahren T,M

Anomaly Detection bezeichnet das Finden von Mustern in Daten, die stark von der gewöhnlichen Verteilung abweichen. In der Literatur werden verschiedene Verfahren beschrieben, mit denen diese Ausreißer erkannt werden können.

Am Anfang des Projekts steht eine Literatur-Recherche, um geeignete Verfahren für die Anomaly Detection zu identifizieren. Anschließend sollen einige Verfahren ausgewählt und exemplarisch an einem Beispieldatensatz evaluiert werden.

Informationen: Andreas Schmidt

Big Data-Frameworks für Data Mining T,M

Charakteristische Eigenschaften von Big Data sind u.a. ein großes Datenvolumen und eine hohe Geschwindigkeit mit der neue Daten entstehen. Dies stellt besondere Herausforderungen an die Data Mining-Algorithmen, da beispielsweise bei der Modellbildung nicht alle Daten im Speicher gehalten werden können. Erste Machine Learning-Frameworks wie Apache Mahout lösen dieses Problem nur bedingt, da das Map Reduce-Programmiermodell nicht für iterative Algorithmen ausgelegt ist. Es entstehen jedoch immer mehr Big Data-Frameworks, die sich dieser Herausforderung annehmen.

Am Anfang des Projekts soll eine Übersicht existierender Big Data-Frameworks für Data Mining erstellt werden. Anschließend werden mehrere Frameworks ausgewählt und ein Analyse-Workflow mit den gewählten Frameworks umgesetzt. Ziel des Projektes ist es Vor- und Nachteile der Frameworks zu vergleichen sowie Best Practices herauszuarbeiten.

Informationen: Andreas Schmidt

Auswertung der RFID-Daten und ihrer Qualität T,M

Die vom SocioPatterns Konsortium entwickelte RFID-Technologie ermöglicht die Lokalisierung von Menschen sowie die Bereitstellung von Informationen über deren soziale Kontakte. Die Daten sind aber nicht immer vollständig. Dies kann mehrere Gründe haben: Distanz zum RFID-Reader, hohe Luftfeuchtigkeit, etc.

Ziel dieser Arbeit ist die Auswertung der vorliegenden RFID-Daten anhand gegebener Fotos (wo soziale Interaktionen aufgezeichnet sind) und eine qualitative Bewertung der mittels RFID aufgezeichneten Kontakte.

Informationen: Mark Kibanov

Conferator-Infrastrukturaufbau durch Einsatz von Mini-Computern T

Conferator ist ein soziales System zur Unterstützung von Konferenzen, insbesondere der Planung sowie Verbesserung sozialer Interaktionen. Conferator nutzt aktive RFID Tags (entwickelt vom SocioPatterns Konsortium) um Konferenzteilnehmer zu lokalisieren und Informationen zu deren Konferenzkontakte bereitzustellen. Die RFID-Reader und ein zentraler Server müssen immer vor Ort installiert werden um ein Conferator-Einsatz zu ermöglichen.

Ziel dieser Arbeit ist die Untersuchung und gegebenfalls technische Umsetzung einer verteilten Lösung bestehend aus mehreren Mini-Computern (z. B. Raspberry Pi oder Arduino).

Informationen: Mark Kibanov

Aufgabenstellung und Termin:

Nach Absprache mit dem jeweiligen Betreuer. Je nach Thema kann die Aufgabe in Kleingruppen oder einzeln bearbeitet werden.

Vorkenntnisse:

Informatik Grundstudium

Angesprochener HörerInnenkreis:

Inf. Hauptstudium Bachelor und Diplom I, Master, Math. NF Inf. Hauptstudium

Umfang:

6 oder 12 Credits im Bachelor, bzw. 8 Credits im Master

Leistungsnachweis:

Implementierung, schriftliche Ausarbeitung und zwei Vorträge (bei 6 Credits 20 min, bei 8/12 Credits 30 min, jeweils zzgl. ca 15 min Diskussion)

Veranstalter:

Prof. Dr. Gerd Stumme, PD Dr. Martin Atzmüller, Dipl.-Math. Tom Hanika, Dipl.-Inform. Mark Kibanov, M.Sc. Jürgen Müller und M.Sc. Andreas Schmidt.

Ablauf:

In der Regel sollte die Projektarbeit mit Semesterbeginn begonnen werden. Nach 4-6 Wochen findet eine Zwischenpräsentation statt, in der der Stand der Projektarbeit vorgestellt wird. In der Regel in der ersten Vorlesungswoche des folgenden Semesters werden dann die Endergebnisse vorgestellt. Eine kurze Beschreibung der Arbeit (5 Seiten) ist 3 Tage vor dem Vortrag einzureichen.

Eine Woche nach der Annahme des Themas gibt der Student eine einseitige Beschreibung der Aufgabe, sowie einen Arbeitsplan für das Semester ab. Zur besseren Koordination und Kommunikation wird erwartet, dass der Student bei einem 6(8-12) Credits-Projekt regelmäßig an einem (zwei) Tagen in der Softwarewerkstatt anwesend ist. Der genaue Tag ist in Absprache mit dem Betreuer festzulegen.

Als Richtlinie für die Erstellung einer guten Ausarbeitung wird das Buch

Markus Deininger and Horst Lichter and Jochen Ludewig and Kurt Schneider. Studien-Arbeiten: ein Leitfaden zur Vorbereitung, Durchführung und Betreuung von Studien-, Diplom- Abschluss- und Doktorarbeiten am Beispiel Informatik. 5. Auflage. vdf Hochschulverlag, Zürich, 2005.

empfohlen, welches in der Bibliothek im Semesterapparat des Fachgebiets Wissensverarbeitung ausliegt, und welches auch in einigen Exemplaren ausleihbar ist. Wir empfehlen die Anschaffung dieses Buchs (9,50 €), da es Sie bis zur Masterarbeit (und weiter) begleiten kann.

Alle verwendeten Referenzen sind zusätzlich zum Literaturverzeichnis der Ausarbeitung in BibSonomy einzugeben, mit den Tags “projekt kde < laufendes Semester in der Form ss08 bzw ww08 > ” und weiteren sinnvollen Tags.