Themen

Soziale Lesezeichensysteme erlauben das einfache, zentrale Speichern von Bookmarks/Lesezeichen auf einem Server und stellen einen Bereich der neuen Web 2.0 System dar. Sie bieten daher nicht nur für den menschlichen Nutzer einen Mehrwert durch die zentrale Verfügbarkeit der Lesezeichen oder die Möglichkeit in solchen Systemen nach anderen interessanten Webseiten zu suchen, sondern stellen auch einen interessanten Ansatz zur sehr einfachen Wissenrepresentation dar. BibSonomy, welches vom Fachgebiert entwickelt wurde, erlaub nicht nur das Speichern von Bookmarks, sondern auch von Literaturreferenzen. Viele moderne Techniken kommen bereits in BibSonomy zum Einsatz und neue sollen in Form von Bachelor-, Diplom- und Masterarbeiten erarbeitet und häufig auch in BibSonomy integriert werden.

bibsonomy.jpg

Viele Aufgabenstellungen beschäftigen sich daher mit der Implementierung verschiedener Komponenten des BibSonomy-Systems oder mit der Analyse der in einem solchen System vorhanden Daten. Ziel ist es im allgemeinen die Nutzbarkeit des System durch Dienste mit Mehrwert zu erhöhen. Darüber hinaus, werden weitere Themen angeboten, die in der Regel einen inhaltlichen Bezug zu aktuellen Forschungsprojekten des Fachgebiets Wissensverarbeitung haben, beispielsweise im Kontext des VENUS Projekts mit Integration von RFID und sozialen Netzwerken.

Die Themenstellung erfolgt in Absprache mit dem Studierenden; der Umfang der Arbeit richtet sich nach dem jeweils angestrebten Anschluss.

Zu folgenden Themengebieten können wir Arbeiten anbieten; zu konkreten Themen können die jeweiligen Betreuer genauere Auskunft geben.

(M = methodischer Schwerpunkt, T = technischer Schwerpunkt)

Filterung von Namen nach Geschlecht in Nameling T

Nameling ist eine Suchmaschine, für die sehr persönliche Aufgabe der Findung eines Babynamens. Zum leichteren Navigieren sollen nun die Geschlechtsinformationen der Namen genutzt werden.

Die Aufgabe besteht aus den folgenden Arbeitspaketen:

  • Zuweisung der Geschlechtsinformation zu allen gespeicherten Namen.
  • Erweiterung der WebApp um eine Filterfunktion nach Geschlecht.
  • Erweiterung der Suchfunktion für unbekannte Namen. Das Geschlecht soll geschätzt werden und dem Nutzer sollen darauf basierende Vorschlage zum Weiterklicken präsentiert werden.

Für die Durchführung dieser Aufgabe sind Kenntnisse in Java 6 und MySQL 5.5 zwingen erforderlich und Kenntnisse in HTML5, CSS3 und JavaServer Pages (JSP) erwünscht aber nebensächlich.

Informationen: Jürgen Müller

Implementierung einer API für Nameling T

Nameling ist eine Suchmaschine, für die sehr persönliche Aufgabe der Findung eines Babynamens. Zur leichteren Anbindung externer wie interner Dienste soll die Plattform um eine dokumentierte API erweitert werden. Sie soll dazu dienen, die Verschiedenen Ressourcen und Funktionen von Nameling anzufragen.

Die Aufgabe besteht aus den folgenden Arbeitspaketen:

  • Design der API-Struktur nach den Best Practices von Apigee.
  • Implementierung der Funktionalität selbst.
  • Dokumentation der API in HTML.

Für die Durchführung dieser Aufgabe sind Kenntnisse in Java 6 und MySQL 5.5 zwingen erforderlich und Kenntnisse in HTML5, CSS3 und JavaServer Pages

Informationen: Jürgen Müller

Vergleich von Anomaly Detection-Verfahren T,M

Anomaly Detection bezeichnet das Finden von Mustern in Daten, die stark von der gewöhnlichen Verteilung abweichen. In der Literatur werden verschiedene Verfahren beschrieben, mit denen diese Ausreißer erkannt werden können.

Am Anfang des Projekts steht eine Literatur-Recherche, um geeignete Verfahren für die Anomaly Detection zu identifizieren. Anschließend sollen einige Verfahren ausgewählt und exemplarisch an einem Beispieldatensatz evaluiert werden.

Informationen: Andreas Schmidt

Big Data-Frameworks für Data Mining T,M

Charakteristische Eigenschaften von Big Data sind u.a. ein großes Datenvolumen und eine hohe Geschwindigkeit mit der neue Daten entstehen. Dies stellt besondere Herausforderungen an die Data Mining-Algorithmen, da beispielsweise bei der Modellbildung nicht alle Daten im Speicher gehalten werden können. Erste Machine Learning-Frameworks wie Apache Mahout lösen dieses Problem nur bedingt, da das Map Reduce-Programmiermodell nicht für iterative Algorithmen ausgelegt ist. Es entstehen jedoch immer mehr Big Data-Frameworks, die sich dieser Herausforderung annehmen.

Am Anfang des Projekts soll eine Übersicht existierender Big Data-Frameworks für Data Mining erstellt werden. Anschließend werden mehrere Frameworks ausgewählt und ein Analyse-Workflow mit den gewählten Frameworks umgesetzt. Ziel des Projektes ist es Vor- und Nachteile der Frameworks zu vergleichen sowie Best Practices herauszuarbeiten.

Informationen: Andreas Schmidt

Auswertung der RFID-Daten und ihrer Qualität T,M

Die vom SocioPatterns Konsortium entwickelte RFID-Technologie ermöglicht die Lokalisierung von Menschen sowie die Bereitstellung von Informationen über deren soziale Kontakte. Die Daten sind aber nicht immer vollständig. Dies kann mehrere Gründe haben: Distanz zum RFID-Reader, hohe Luftfeuchtigkeit, etc.

Ziel dieser Arbeit ist die Auswertung der vorliegenden RFID-Daten anhand gegebener Fotos (wo soziale Interaktionen aufgezeichnet sind) und eine qualitative Bewertung der mittels RFID aufgezeichneten Kontakte.

Informationen: Mark Kibanov

Conferator-Infrastrukturaufbau durch Einsatz von Mini-Computern T

Conferator ist ein soziales System zur Unterstützung von Konferenzen, insbesondere der Planung sowie Verbesserung sozialer Interaktionen. Conferator nutzt aktive RFID Tags (entwickelt vom SocioPatterns Konsortium) um Konferenzteilnehmer zu lokalisieren und Informationen zu deren Konferenzkontakte bereitzustellen. Die RFID-Reader und ein zentraler Server müssen immer vor Ort installiert werden um ein Conferator-Einsatz zu ermöglichen.

Ziel dieser Arbeit ist die Untersuchung und gegebenfalls technische Umsetzung einer verteilten Lösung bestehend aus mehreren Mini-Computern (z. B. Raspberry Pi oder Arduino).

Informationen: Mark Kibanov

Aufgabenstellung und Termin:

nach Absprache mit dem jeweiligen Betreuer

Vorkenntnisse:

Informatik Grundstudium bzw. 30 absolvierte Credits des Masterstudiums

Angesprochener Teilnehmerkreis:

Bachelor-, Diplom- und Masterstudierende Informatik, Math. NF Inf. Hauptstudium

Leistungsnachweis:

in der Regel Implementierung, schriftliche Ausarbeitung und zwei Vorträge (jeweils 30 min zzgl. ca 15 min Diskussion)

Umfang:

9 Wochen für Bachelor, 3 Monate für Diplom I und 6 Monate für Master und Diplom II

Veranstalter:

PD Dr. Martin Atzmüller, Dipl.-Math. Stephan Doerfel, Dipl.-Inform. M.Sc. Jens Illig, Dipl.-Inform. Mark Kibanov, Dipl.-Inform. Björn-Elmar Macek, M.Sc. Jürgen Müller, M.Sc. Andreas Schmidt, M.Sc. Christoph Scholz