Themen
Soziale Lesezeichensysteme erlauben das einfache, zentrale Speichern von Bookmarks/Lesezeichen auf einem Server und stellen einen Bereich der neuen Web 2.0 System dar. Sie bieten daher nicht nur für den menschlichen Nutzer einen Mehrwert durch die zentrale Verfügbarkeit der Lesezeichen oder die Möglichkeit in solchen Systemen nach anderen interessanten Webseiten zu suchen, sondern stellen auch einen interessanten Ansatz zur sehr einfachen Wissenrepresentation dar. BibSonomy, welches vom Fachgebiert entwickelt wurde, erlaub nicht nur das Speichern von Bookmarks, sondern auch von Literaturreferenzen. Viele moderne Techniken kommen bereits in BibSonomy zum Einsatz und neue sollen in Form von Bachelor-, Diplom- und Masterarbeiten erarbeitet und häufig auch in BibSonomy integriert werden.
Viele Aufgabenstellungen beschäftigen sich daher mit der Implementierung verschiedener Komponenten des BibSonomy-Systems oder mit der Analyse der in einem solchen System vorhanden Daten. Ziel ist es im allgemeinen die Nutzbarkeit des System durch Dienste mit Mehrwert zu erhöhen. Darüber hinaus, werden weitere Themen angeboten, die in der Regel einen inhaltlichen Bezug zu aktuellen Forschungsprojekten des Fachgebiets Wissensverarbeitung haben, beispielsweise im Kontext des VENUS Projekts mit Integration von RFID und sozialen Netzwerken.
Die Themenstellung erfolgt in Absprache mit dem Studierenden; der Umfang der Arbeit richtet sich nach dem jeweils angestrebten Anschluss.
Zu folgenden Themengebieten können wir Arbeiten anbieten; zu konkreten Themen können die jeweiligen Betreuer genauere Auskunft geben.
(M = methodischer Schwerpunkt, T = technischer Schwerpunkt)
Which paper should I read, which website must I visit? Ressource-Recommendation in folksonomies. M,T
Beim Schreiben einer wissenschaftlichen Arbeit, bei bei der Auswahl von Filmen oder Musik oder einfach beim Surfen im Netz stellt sich immer wieder die Frage, welche Ressourcen (Paper/Webseiten/…) von persönlichem Interesse sein könnten. Oft gibt es zu viele Ressourcen um alle auch nur kurz zu betrachten. Außerdem haben verschiedene Personen sehr verschiedene Interessen. Recommender sind Algorithmen, die dem Anwender bei der Suche nach interessanten Inhalten helfen, indem Sie Ihm potentiell interessante Ressourcen vorschlagen. Gute Algorithmen schlagen viele Ressourcen vor, die dann tatsächlich für den Nutzer interessant sind. Als Eingabe dienen dabei die Profil-Daten der Benutzer, deren Interaktionsverhalten mit dem System etc.
In das Web-System BibSonomy sollen nun aktuelle Recommender-Algorithmen zum Vorschlagen von Webseiten und von wissenschaftlichen Publikationen eingebaut und dort evaluiert werden. Die Algorithmen müssen dafür verstanden, implementiert, getestet und angepasst werden um möglichst viele vorhandene Daten berücksichtigen zu können.
Je nach Bedarf kann die Arbeit als Projekt-, Bachelor- oder Masterarbeit bearbeitet werden: Der Schwierigkeitsgrad und der Umfang der Arbeit werden durch die Auswahl und die Anzahl der Algorithmen bzw. durch verschiedene Evaluationstechniken für die produzierten Vorschläge entsprechend angepasst.
Informationen: Stephan Doerfel
Opinion Dynamics in Social Networks M,T
Bei Opinion Dynamics wird versucht die subjektive Meinung eines Individuums zu einer gefragten Sache zu ermitteln und ihren Lauf zu verfolgen. Dieses Forschungsgebiet ist noch recht neu, profitiert jedoch wunderbar von der Sentiment Analysis. Im Rahmen diese Arbeit ist zu ergründen, wie gut sich bestehende Methoden der Sentiment Analysis für Opinion Dynamics in Social Networks anwenden lassen. Dazu werden Daten aus einem frei wählbaren Social Network (Twitter, Facebook, et cetera) extrahiert und anschließend diesen Methoden unterzogen. Am Ende soll eine Aussage über die Vor- und Nachteile dieser Verfahren getroffen werden.
Im Falle einer Projektarbeit kann dieses Thema gerne in einer folgenden Abschlussarbeit weiter vertieft werden.
Informationen: Juergen Mueller
Framework für System-Tags in BibSonomy T
Das Web 2.0-Portal BibSonomy dient der Verwaltung Ihrer Web-Lesezeichen und Publikationen. Im Gegensatz zu den Lesezeichen und Favoriten im Browser sind die Einträge bei „BibSonomy“ von jedem beliebigem Ort aufrufbar und lassen sich mit Freunden und anderen Benutzern austauschen. Ein integraler Bestandteil beim Arbeiten mit diesem System sind frei wählbare Schlagwörter (Tags). System-Tags sind besondere Tags, die spezielle Funktionen haben oder auslösen. Durch hinzufügen eines solchen Tags kann z. B. ein Lesezeichen an einen anderen Benutzer geschickt werden, ein wissenschaftlicher Artikel als eigene Arbeit gekennzeichnet oder für den Lebenslauf in BibSonomy markiert werden etc. Um dieser Sonderrolle bestimmter Tags im System gerecht zu werden soll das bestehende Handling der System-Tags in eine leicht erweiterbares und konfigurierbares Framework umgewandelt werden.
Informationen: Stephan Doerfel
Learning to rank in BibSonomy M,T
Beim Suchen in unserem Social Bookmarking System BibSonomy werden Suchergebnisse derzeit im Wesentlichen nach Datum gerankt. Vorstellbar sind hier aber verschiedene Rankingverfahren. Ziel der Arbeit ist, ein Framework zu bauen, dass Verschiedene Ranking-Algorithmen zur Anordnung der Suchergebnisse einbinden kann. Dazu soll es eine Vergleichssicht geben, in der zu einer Suche mittels verschiedener Verfahren unterschiedliche geordnete Suchergebnisse präsentiert werden. Das Verhalten der Benutzer (Auswahl des Suchergebnisses) etc. kann dann verwendet werden, um die benutzten Ranking-Verfahren zu beurteilen. Grundkenntnisse in Information Retrieval (z. B. Vorlesung Internet Suchmaschinen) sind von Vorteil, jedoch keine strikte Voraussetzung.
Informationen: Stephan Doerfel
Science-Crawler T
In diesem Projekt geht es darum, Volltexte wissenschaftlicher Arbeiten im Netz zu finden. Viel wissenschaftliche Literatur ist in Form von pdf-Dateien (o.ä.) im Netz (teilweise) frei verfügbar – z. B. über wissenschaftlichen Portale (CiteULike), auf Verlagsseiten, auf den Institutsseiten der Autoren oder über spezielle Suchmaschinen (Google Scholar, Microsoft Academic Search). Projektziel ist, einen Crawler zu designen und zu implementieren, der selbständig, schnell und gezielt wissenschaftliche Publikationen im pdf-Format findet und offline zu einem Korpus zusammenstellt. Grundkenntnisse in Information Retrieval (z. B. Vorlesung Internet Suchmaschinen) sind von Vorteil, jedoch keine strikte Voraussetzung.
Informationen: Stephan Doerfel
Import-Assistent für BibSonomy T
Anwender, die BibSonomy benutzen möchten, haben oft schon relevante Daten auf ihrer Platte liegen bzw. bei anderen Diensten gespeichert. Ein Import-Assistent kann den Anwendern helfen, die Daten in BibSonomy einzufügen. Der Assistent durchsucht dazu die Festplatte nach BibTeX- oder EndNote-Dateien, nach Browser-Lesezeichen und fragt andere Services (wie Delicious oder CiteULike) nach den Daten des Nutzers ab. Danach kann der Benutzer diese Daten aufbereiten, auswählen und in BibSonomy einfügen. Ziel des Projektes ist die Implementierung eines solchen Assistenten.
Informationen: Stephan Doerfel
Tag-Empfehlungen in BibSonomy T,M
Zur Vereinfachung der Klassifikation und Verwaltung von Resourcen haben sich im Bereich von Social Bookmarking verschiedene Empfehlungssysteme (Recommender) etabliert. Die häufigste Anwendung von Empfehlungssystemen ist die Empfehlung von Tags für aktuell zu taggende Resourcen. Durch die Präsentation der Tags während des Verschlagwortens, kann der Nutzer leicht vorgeschlagene Tags auswählen bzw. übernehmen. Tippfehler und unterschiedliche Schreibweisen können auf diese Weise reduziert werden und führen zur Vereinheitlichung und der Konvergenz des verwendeten Vokabulars. In BibSonomy existiert ein Framework zur einheitlichen Evaluation verschiedener Tag-Empfehlungssysteme. Im Rahmen dieser Projektarbeit wird das Framework weiterentwickelt und erweitert. Dabei sind vielfältige Herausforderungen zu meistern, z.B.:
- Entwicklung und Implementierung eines Scheduling-Algorithmuses zur Anfrage von verschiedenen Empfehlungssystemen
- Performance-Optimierung der Datenbankzugriffe
- Implementierung dynamischer Tag-Empfehlungen mittels AJAX
- …
Informationen: Folke Mitzlaff
Themenbasierte Graphische Suche in BibSonomy T,M
Zur Zeit erfolgt die Navigation und Suche in BibSonomy im wesentlichen via Tags und Volltext-Suche. Im Rahmen dieser Projektarbeit wird BibSonomy um ein graphisches Suchinterface erweitert, welches es erlaubt, visuell die Suche einzuschränken. Dabei entspricht eine Suchanfrage der Gewichtung von Themen, welche automatisch aus der FolkSonomy extrahiert werden. Dies entspricht einer Suchanfrage der Art: “Ich interessiere mich für Einträge, die viel mit Politik zu tun haben, etwas mit Internet und ein wenig mit Medizin”.
Informationen: Folke Mitzlaff
Visualisierung von User-Ähnlichkeiten T,M
Seit einiger Zeit wird in BibSonomy die Ähnlichkeit zwischen Benutzern berechnet um z.B. auf Benutzer mit ähnlichen Interessen hinzuweisen. Gegenstand dieser Projektarbeit ist die Konzeption und Implementierung einer graphischen Darstellung von Benutzer-Empfehlungen, um zum die Navigation durch die FolkSonomy entlang ähnlicher Benutzer intuitiver zu gestalten.
Informationen: Folke Mitzlaff
Social Network Aggregator M,T
Das VENUS-Projekt untersucht die soziale Vernetzung, und analysiert dabei unter anderem die Nutzungsdaten in sensorgestützten (RFID, Handy) Systemen in Verbindung mit sozialen Netzwerken. Hierbei ist die Einbindung von Facebook, StudiVZ, XING, LinkedIn, u.a. Systemen über entsprechende Schnittstellen (Facebook-API, OpenSocial) relevant, um die freigegebenen Daten im Ubicon-Framework einzubetten, das zur Einbindung von Sensordaten und der Verknüpfung mit sozialen Daten dient. Ziel dieses Projekts ist die Implementierung einer Social Network Aggregationskomponente in Java.
Informationen: Martin Atzmüller
Android und IOS: Intelligente ubiquitäre Sensorerfassung T,M
Das VENUS-Projekt untersucht die soziale Vernetzung, und analysiert dabei unter anderem die Nutzungsdaten in sensorgestützten (RFID, Handy) Systemen. Hierbei ist die Sensor- und Kontexterfassung wichtig, um ubiquitäre Daten, etwa zur Lokalisierung, oder zur Erfassung und Anzeige von Standorten von Freunden, falls sichtbar. Ziel dieses Projekts ist die Implementierung einer konfigurierbaren ubiquitären Sensorkomponente auf Android/IOS Mobilgeräten.
Informationen: Christoph Scholz, Martin Atzmüller
Google Map/Reduce: Effizientes Pattern Mining im Web 2.0 T
In Web 2.0 Umgebungen ebenso wie in ubiquitären Systemen fallen extrem große Datenmengen an, deren effiziente automatische Analyse eine Herausforderung darstellt. Das von Google entwickelte Map/Reduce-Framework stellt einen attraktiven Ansatz zur effizienten Umsetzung verschiedenster Verfahren dar. Ziel dieses Projekts ist die Implementierung verschiedener Pattern Mining Verfahren in Java mittels Map/Reduce, bzw. in der freien Implementierung hadoop.
Informationen: Martin Atzmüller
Komponenten für Explanation-Aware Mining im Social Web M,T
In Web 2.0 Umgebungen ebenso wie in ubiquitären Systemen fallen extrem große Datenmengen an, deren Analyse in einer für Anwender verständlichen Form eine Herausforderung darstellt. Das Explanation-Aware Software Design ist eine Möglichkeit, beliebige Softwaresystem mit Erklärungsfähigkeit(en) auszustatten. Ziel dieses Projekts ist die Implementierung verschiedener Komponenten und Verfahren in Java, um Erklärungen entsprechend der Prinzipien des Explanation-Aware Software Design im Social Web umzusetzen.
Informationen: Martin Atzmüller
Implementierung eines Eclipse Plugins zur Unterstützung von Wissenstransfer in OpenSource Development Teams T
In großen Entwicklungsteams, in denen viele Programmierer über große Distanzen hinweg zusammen an ein und demselben System schreiben, ergibt sich häufig die Frage, wer mit welchem Code oder Bibliothek am vertrautesten ist und am leichtesten bei Fragen Hilfestellung geben kann. Ziel soll es sein, ein Plugin für die weit verbreitete Entwicklungsumgebung Eclipse zu schreiben, das anhand der gesammelten Daten, die bei der Benutzung von Eclipse erzeugt werden, dem Hilfesuchenden eine Liste von Leuten vorschlägt, die ihm bei seinem Problem helfen können.
Informationen: Björn-Elmar Macek
Linguistische Analyse von kollaborativen Schlagworten M
In vielen web-basierten kollaborativen Anwendungen haben sich Schlagworte oder Tags als eine effiziente Art der Wissensorganisation erwiesen. Einige Methoden, die ursprünglich aus dem Bereich Linguistik (besonders Computational Linguistics) stammen, haben sich bereits als nützlich erwiesen, um beispielsweise semantische Beziehungen zwischen Tags automatisch zu extrahieren. Ziel dieser Arbeit ist es, weitere linguistische Methoden hinsichtlich ihrer Eignung zur Anwendung im Tagging-Bereich zu analysieren; mögliche Ansatzpunkte sind hier:
(1) Sprache ermitteln (2) Lemmatisation (d.h. die Rückführung verschiedener grammatischer Formen eines Worts auf eine gemeinsame Wurzel) (3) Mapping der Tags in externe Systeme wie z.B. WordNet oder Wikipedia in der richtigen Sprache (4) Suche im WWW nach semantisch verwandten Worten.
Hierbei können auch einzelne Methoden zur Anwendung im Tagging-Bereich angepasst / optimiert werden.
Informationen: Dominik Benz, Andreas Hotho
Aufgabenstellung und Termin:
nach Absprache mit dem jeweiligen Betreuer
Vorkenntnisse:
Informatik Grundstudium bzw. 30 absolvierte Credits des Masterstudiums
Angesprochener Teilnehmerkreis:
Bachelor-, Diplom- und Masterstudierende Informatik, Math. NF Inf. Hauptstudium
Leistungsnachweis:
in der Regel Implementierung, schriftliche Ausarbeitung und zwei Vorträge (jeweils 30 min zzgl. ca 15 min Diskussion)
Umfang:
9 Wochen für Bachelor, 3 Monate für Diplom I und 6 Monate für Master und Diplom II
Veranstalter:
Prof. Dr. Gerd Stumme, Dr. Martin Atzmüller, Dipl.-Math. Stephan Doerfel, Dipl.-Inform. M.Sc. Jens Illig, Dipl.-Inform. Mark Kibanov, Dipl.-Inform. Björn-Elmar Macek, Dipl.-Inform. Folke Mitzlaff, M.Sc. Juergen Mueller, M.Sc. Christoph Scholz