Bachelor-, Diplom- und Masterarbeiten – KDE – FB 16

Themen:

Soziale Lesezeichensysteme erlauben das einfache, zentrale Speichern von Bookmarks/Lesezeichen auf einem Server und stellen einen Bereich der neuen Web 2.0 Systeme dar. Sie bieten daher nicht nur für den menschlichen Nutzer einen Mehrwert durch die zentrale Verfügbarkeit der Lesezeichen oder die Möglichkeit in solchen Systemen nach anderen interessanten Webseiten zu suchen, sondern stellen auch einen interessanten Ansatz zur sehr einfachen Wissensrepräsentation dar. BibSonomy, welches vom Fachgebiet entwickelt wurde, erlaubt nicht nur das Speichern von Bookmarks, sondern auch von Literaturreferenzen. Viele moderne Techniken kommen bereits in BibSonomy zum Einsatz, und neue sollen in Form von Bachelor-, Diplom- und Masterarbeiten erarbeitet und häufig auch in BibSonomy integriert werden.

Viele Aufgabenstellungen beschäftigen sich daher mit der Implementierung verschiedener Komponenten des BibSonomy-Systems oder mit der Analyse der in einem solchen System vorhanden Daten. Ziel ist es im allgemeinen, die Nutzbarkeit des System durch Dienste mit Mehrwert zu erhöhen. Darüber hinaus werden weitere Themen angeboten, die in der Regel einen inhaltlichen Bezug zu aktuellen Forschungsprojekten des Fachgebiets Wissensverarbeitung haben.

Die Themenstellung erfolgt in Absprache mit dem Studierenden; der Umfang der Arbeit richtet sich nach dem jeweils angestrebten Anschluss.

Zu folgenden Themengebieten können wir Arbeiten anbieten; zu konkreten Themen können die jeweiligen Betreuer genauere Auskunft geben.

Lernen von Ontologien mittels Tagging-Systemen

Das “flache” Organisationsprinzip von Tagging-Systemen, das auf kollaborativer Verschlagwortung mittels eines unkontrollierten Vokabulars durch alle Benutzer basiert, wurde oft als konträrer Ansatz zu eher traditionellen (zentral kontrollierten, oft hierarchisch strukturierten) Organisations-Schemata wie z.B. Taxonomien oder Ontologien gesehen. Nähere Untersuchungen weisen darauf hin, dass die Vor- und Nachteile beider Paradigmen interessanterweise in einem inversen Verhältnis zu stehen scheinen: Tagging ist vergleichweise “einfach”, aber das unkontrolierte Vokabular führt genau zu den Problemen, für die z.B. Ontologien Lösungen anbieten (z.B. Mehrdeutigkeit, Synonymie, …).

Ziel dieser Arbeit ist es, automatische Verfahren zum Erlernen von semantischen Beziehungen zwischen Tags einer Folksonomy zu analysieren und weiterzuentwickeln. Die gelernten Beziehungen sollen als Grundlagen für einen Ontologie-Lernprozess dienen. Ein weiterer wichtiger Aspekt sind Evaluierungsmethoden der erarbeiteten Lernverfahren.

Informationen: Andreas Hotho, Dominik Benz

Integration of Terrier into BibSonomy

Terrier is a modular platform for the development of large-scale Information Retrieval applications. To improve search in BibSonomy we consider integrating Terrier into BibSonomy. Starting points are the indexing of documents and the experimentation with different ranking algorithms. The project can be conducted in cooperation with the Terrier group at the University of Glasgow, so that a stay abroad (with a program such as Erasmus) is possible. The Glasgow team is interested in integrating BibSonomy into Terrier and will announce a (summer) student project as well.

Information: Andreas Hotho, Beate Krause

Erstellung einer JavaScript-basierten Navigationshilfe für BibSonomy

Zur Dokumentation des URL-Schemas von BibSonomy ist ein JavaScript-basiertes Formular zu erstellen. Dieses soll dem Benutzer erlauben, bestimmte Parameter (Tags, Benutzername, Ausgabeformat, Anzahl Items, etc.) komfortabel auszuwählen und sich somit die gewünscht URL per Mausklick zu konfigurieren. Insbesondere soll die Navigationshilfe schwer erreichbare bzw. wenig dokumentierte Funktionen von BibSonomy leichter zugänglich machen. Bei der Erstellung der Seite ist auf Mehrsprachigkeit, leichte Erweiterbarkeit sowie gute Dokumentation zu achten.

Informationen: Robert Jäschke

Visualisierung von Tri-Verbänden

Triadische Begriffsanalyse stellt eine Erweiterung der formalen Begriffsanalyse um eine dritte Dimension dar und kann als dreidimensionales hierarchisches Clusterverfahren verstanden werden. Mittels des TRIAS-Algorithmus können wir effizient Tri-Begriffe mit minimalen Support-Bedingungen auf grossen Datensätzen berechnen.

Ziel des Projektes ist, geeignete Visualisierungsmöglichkeiten für Tri-Verbände zu untersuchen und zu implementieren.

Informationen: Robert Jäschke

Implementation des Titanic-Algorithmus

Der Algorithmus Titanic ist ein effizientes Verfahren zur Berechnung häufiger Itemsets, ähnlich dem Apriori-Algorithmus. Letzterer ist beispielsweise in der Datamining-Software Weka in Java implementiert.

Ziel des Projektes ist die Implementierung des Titanic-Algorithmus, basierend auf der vorhandenen Java-Implementierung des Apriori-Algorithmus. Des weiteren sollen zwei Verfahren zur Berechnung von Basen für Assoziationsregeln (Luxemburger und Duquenne/Guigues) untersucht und ebenfalls zur Verwendung in Weka implementiert werden.

Informationen: Robert Jäschke

Verteilte Implementierung des Trias-Algorithmus

Der Trias-Algorithmus ermöglicht das Finden von Tupeln (U,T,R) in Folksonomy-Systemen, wobei U eine Menge von Benutzern, T eine Menge von Tags und R eine Menge von Ressourcen ist, so dass alle Benutzer aus U alle Ressourcen aus R mit allen Tags aus T annotiert haben.

Ziel des Projektes ist die Parallelisierung der vorhandenen Java-Implementierung sowie der Test des Algorithmus auf großen Datenmengen.

Informationen: Robert Jäschke

Erweiterung von BibSonomy um Barcode-Funktionalitäten

Barcodes z.B. von Büchern kann man mittels in heutigen Notebooks enthaltenen Kameras einlesen. Darüber hinaus sind Libraries zum automatischen Erzeugen und Verarbeiten von Barcodes wie barcode4j frei verfügbar. Dies eröffnet interessante Perspektiven für BibSonomy:

Über den Barcode können weiter Informationen z.B. zu einem Buch im Internet abgerufen werden. Damit erhält man Metadaten wie Titel, Autor, etc. Diese Daten kann man nun in BibSonomy posten und somit auf einfache Weise seine Büchersammlung verschlagworten oder sich interessante geliehene Bücher merken.
Um die Verbindung zwischen ausgedrucken Papers und ihren Entsprechungen in BibSonomy zu erleichtern, wäre ein ausgedruckter Barcode (z.B. in Form eines Aufklebers) sehr hilfreich. Durch das Einlesen des Barcodes könnten weitere Metadaten abgerufen werden und die Verbindung zu anderen Papers hergestellt werden.

Ziel des Projektes ist die Entwicklung eines Prototypen für einen der beiden Anwendungsfälle.

Informationen: Robert Jäschke, Dominik Benz

Aktives Lernen für das Extrahieren von Metadaten aus Referenzen

Referenzen aus Publikationslisten enthalten wichtige Metadaten, die zur Erstellung von Zitationsgraphen, zur Verlinkung von Publikationen und zu deren Verwaltung verwendet werden. Die Erstellung dieser Metadaten aus gegegebenen Referenzen ist sehr mühsam und aufwendig. Ansätze, die Extraktion zu automatisieren, liefern erste Ergebnisse, sind aber noch nicht befriedigend. Ein grundlegendes Problem ist die Vielfältigkeit mit der Referenzen dargestellt werden. Um dieser Varietät zu begegnen, wird entweder ein großer Trainingsdatensatz benötigt, oder der Trainingsdatensatz muss automatisch erweitert werden. Der zweite Ansatz soll in diesem Projekt behandelt werden. Dabei kann ein bestehender Algorithmus so erweitert werden, dass er automatisch aus neuen Referenzeingaben lernt.

Informationen: Beate Krause

Weiterentwicklung des Firefox Plugin für BibSonomy

Die aktuelle Version des Firefox Plugins für BibSonomy unterstützt die grundlegenden Funktionen, wie das Speichern von Bookmarks sowie deren Anzeige. Dieses Projekt soll die Funktionalität des Plugins um weitere Funktionen ergänzen und insbesondere eine Anbindung der Publikationsdaten schaffen.

Informationen: Andreas Hotho

Referenz Extraktion aus PDFs / Einbettung von Metadaten

Publikationen enthalten in der Regel eine Menge von Referenzen auf andere Publikationen. Leider können diese Referenzen zur Zeit noch nicht in BibSonomy abgespeichert werden. Ziel dieses Projektes ist es BibSonomy um eine Zitationsverwaltung zu erweitern. Im zweiten Schritt sind diese aus PDFs mit Hilfe von Informationsextraktionsmethoden automatisch zu extrahieren.

Mit der Extensible Metadata Platform (XMP) bietet Adobe einen Standard zur Einbettung von Metadaten in PDF-Dokumente an, der auch schon von Reference-Mangement-Lösungen wie JabRef verwendet wird. Ein weiteres mögliches Ziel dieser Arbeit ist die Erweiterung von BibSonomy um die Funktionalität, Metadaten zu hochgeladenen PDFs hinzuzufügen, bzw. diese auszulesen.

Informationen: Andreas Hotho, Dominik Benz

Optimierung des Workflows beim wissenschaftlichen Arbeiten / Schreiben mit BibSonomy

Ein wesentliches Ziel von BibSonomy ist es, die alltägliche Arbeit von Wissenschaftlern zu erleichtern. Ein wichtiger Teil davon ist das Sammeln und Organisieren von Literatur, sowie das Einbinden / Zitieren der Literatur in eigene Arbeiten. BibSonomy in seiner jetzigen Form unterstützt die verschiedenen Phasen dieses Prozesses auf verschiedene Weise: Das Sammeln und Strukturieren wird z.B. sehr gut durch Scraper und Verschlagwortung unterstützt, während die Einbindung in den Paper-Produktions-Prozess noch weitestgehend manuell (z.B. Export des BibTeX-Dateien) stattfindet.

Ziel dieser Arbeit ist es, zunächst mögliche Workflows mit verschiedenen System- und Textverarbeitungs-umgebungen (Windows / Linux, Word / Latex, …) auszuarbeiten. Nach Auswahl eines geeigneten Workflows sollen dann alle benötigten Systemkomponeten angepasst / implementiert werden, um diesen optimal zu unterstützen.

Informationen: Dominik Benz

Implementierung des FolkRank-Algorithmus mittels Hadoop oder auf Graphikkarten

Der FolkRank-Algorithmus bietet ein Ranking in allen drei Dimensionen einer Folksonomie. Für unser kollaboratives Verschlagwortungssystem BibSonomy benötigen wir eine schnelle Implementierung dieses Ranking-Verfahrens.

In diesem Projekt sollen zwei Varianten ausgelotet werden: die Implementierung auf Graphikkarten-Prozessoren und die verteilte Implementierung mittels des Hadoop-Frameworks.

Informationen: Robert Jäschke, Andreas Hotho

MetaTaggingService

Bei diesem Mashup-Projekt werden Informationen verschiedener bekannter Tagging Dienste zusammengetragen. Die gesammelten Informationen sollen im nächsten Schritt zusammengefaßt und aufbereitet werden, so dass neben einer großen TagWolke, auch z.B der zeitliche Verlauf der Tags und aufkommende Themen ansprechend im System dargestellt werden.

Informationen: Andreas Hotho

Erkennung von Autoren/Journalen in BibSonomy

Ein zentrales Problem in BibSonomy ist die Erkennung und Identifikation von Objekten wie Autoren, Editoren aber auch Büchern. In der Literatur finden sich vielfältige Ansätze der manuellen oder automatischen Zuordnung von Bezeichnern zu den passenden Objekten. Auch Lernansätze sind dort beschrieben. Ziel des Projektes ist die Entwicklung und Umsetzung eines Konzeptes für BibSonomy, das auf der einen Seite die interne Objektrepresentation neu implementiert und die Zuordnung zwischen Objekt und im Text gefunden Bezeichnern automatisch lernt.

Informationen: Andreas Hotho

Verknüpfung des MediaWikis mit BibSonomy

Die von der Wikipedia genutzte Software MediaWiki ist eine der bekanntesten Wiki-Implementierungen. Häufig werden auf Wikiseiten Bücher oder Fachartikel zitiert. In diesem Projekt soll ein Plugin für MediaWiki entwickelt werden, das das einfache Zitieren von in BibSonomy vorhandener Literatur erlaubt. Dabei soll der Nutzer mit typischen Ajax-Techniken unterstützt werden.

Informationen: Andreas Hotho

Integration von BibSonomy in Zotero

Zotero ist ein Firefox-Plugin zum Verwalten von Bookmarks und Publikationsmetadaten. Allerdings sind alle Daten im Gegensatz zu BibSonomy im Browser des Nutzers abgelegt. Hier bietet sich die Integration mit einem Serverdienst wie BibSonomy an. Die Anbindung von Zotero soll mittels der in BibSonomy vorhanden API erfolgen.

Informationen: Andreas Hotho

Import-Assistent für BibSonomy

Anwender, die BibSonomy benutzen möchten, haben oft schon relevante Daten auf ihrer Platte liegen bzw. bei anderen Diensten gespeichert. Ein Import-Assistent kann den Anwendern helfen, die Daten in BibSonomy einzufügen. Der Assistent durchsucht dazu die Festplatte nach BibTeX- oder EndNote-Dateien, nach Browser-Lesezeichen und fragt andere Services (wie del.icio.us oder CiteULike) nach den Daten des Nutzers ab. Danach kann der Benutzer diese Daten aufbereiten, auswählen und in BibSonomy einfügen. Ziel des Projektes ist die Implementierung eines solchen Assistenten.

Informationen: Robert Jäschke

Webapplikation zur Offline-Berechnung von Datenbank-Tabellen

Zahlreiche Tabellen der BibSonomy-Datenbank werden “offline” – im Hintergrund – berechnet. Dazu zählen beispielsweise die Tabellen für die popular-Seite oder auch die Tabellen für die Suchfunktion. In diesem Projekt soll eine Webapplikation erstellt werden, die die verschiedenen Berechnungsskripte vereint und mittels einer Weboberfläche steuerbar macht.

Informationen: Andreas Hotho

Rankingalgorithmen für BibSonomy

Es gibt verschiedene Methoden, um Suchergebnisse für einen Benutzer zu ordnen. Diese Methoden lassen sich auf das Ranking in Social Bookmarking Systemen übertragen. In diesem Projekt sollen mehrere Methoden ausgewählt, implementiert und miteinander verglichen werden. Beispiele für diese Methoden sind das Vektorraummodel, probabilistische Modelle und Modelle aus dem Bereich der Linkanalyse. Die für das Ranking zu verwendenden Daten stammen aus dem Bookmarking System BibSonomy. Ein Vergleich der Ergebnisse kann durch eine (kleine) Benutzerstudie erstellt werden.

Informationen: Beate Krause

Publikationsranking in BibSonomy

Ziel des Projektes ist, Benutzern in BibSonomy Empfehlungen für Publikationen auszusprechen. Diese Empfehlungen können durch ähnliche Benutzer im System erstellt werden. Die Ähnlichkeit kann auf einer Nutzung der gleichen Tags, Publikationen, Autoren, Konferenzen etc. beruhen. Ein Verfahren basierend auf Link-Analyse (zB. FolkRank) kann verwendet werden, um Empfehlungen zu errechnen.

Informationen: Beate Krause

Automatisches Lernen / Vorschlagen von Tag-Beziehungen

Das Organisationsprinzip in BibSonomy basiert hauptsächlich auf der flachen Struktur von Tags. Mit zunehmender Grösse der eigenen Sammlung an Referenzen hilft es dem Benutzer, diese Tags mithilfe von Relationen und Konzepten zusammenzugefassen. BibSonomy bietet hier die Möglichkeit, beides manuell zu erstellen und zu verwalten (z.B. auf dieser Seite, wenn man eingeloggt ist). Ziel dieses Projektes ist, diesen Prozess durch automatische Unterstützung zu vereinfachen. Dies könnte z.B. in der Form von Relationen-Vorschlägen, semantischen Visualisierungen oder intelligenten Relationen-Editoren geschehen. Hierbei können statistische Verfahren zur Entdeckung von zusammengehörigen Tags zum Einatz kommen (z.B. Association Rule Mining) oder hier am Lehrstuhl erforschte semantische Ähnlichkeitsmaße für Tags.

Informationen: Dominik Benz

Aufgabenstellung und Termin:

nach Absprache mit dem jeweiligen Betreuer

Vorkenntnisse:

Informatik Grundstudium bzw. 30 absolvierte Credits des Masterstudiums

Angesprochener Teilnehmerkreis:

Bachelor-, Diplom- und Masterstudierende Informatik, Math. NF Inf. Hauptstudium

Leistungsnachweis:

in der Regel Implementierung, schriftliche Ausarbeitung und Vortrag

Umfang:

9 Wochen für Bachelor, 3 Monate für Diplom I und 6 Monate für Master und Diplom II

Veranstalter:

Dipl.-Inform. Dominik Benz, Dr. Andreas Hotho, Dipl.-Math. Robert Jäschke, Dipl.-Inform. Beate Krause, Prof. Dr. Gerd Stumme