Translations: en

Projekte

Hier finden Sie eine Liste meiner Projekte. Einige Projekte entstanden im Rahmen meines Studiums, andere aufgrund persönlicher Bedürfnisse. Mehr Software finden Sie auf meinem GitHub account.

Masterarbeit 2014

Meine Master-Arbeit:

"Weakly Supervised Learning for Compositional Sentiment Recognition"

Meine Master-Arbeit wurde von Dr. Yannick Versley betreut, mit Prof. Dr. Anette Frank als Zweitprüfer. Genauere Informationen befinden sich auf einer eigenen Seite zu meiner Master-Arbeit.

Ressourcen

Bachelor-Arbeit 2011

Meine Bachelor-Arbeit:

"Analyse von Netzwerken zwischen Pharma-Firmen sowie von klinischen Studien auf die Frage, ob befreundete Firmen noch ihre Produkte gegeneinander testen"

Meine Bachelorarbeit wurde von Prof. Dr. Stefan Riezler und Prof. Dr. Gerhard Reinelt betreut. Die Arbeit entstand in der Juniorforschungsgruppe "Network Analysis and Graph Theory" von Dr. Nina Zweig am Interdisziplinären Zentrum für wissenschaftliches Rechnen der Universität Heidelberg.

Ressourcen

Projekte Studium

Die meisten dieser Projekte entstanden als Hausarbeiten und sind nicht als fertige, ready-to-run Lösungen gedacht, sondern als Machbarkeitsstudien für Design und Implementierung der Algorithmen.

Multimodale Distributionelle Semantik 2013

Traditionelle distributionelle Modelle der Semantik basieren auf Statistiken über großen Textkorpora. Viele Bedeutungsfacetten werden in Texten allerdings nicht berücksichtigt. Dieser traditionelle Ansatz der Bedeutungsrepräsentation ist daher ein wenig, wie "Radio zu hören, um Bedeutung zu lernen" (McClelland). Durch Integration anderer Modalitäten wie beispielsweise Bilder können wir die Modelle allerdings verbessern.

In diesem Projekt versuche Ich, die Vorhersage semantischer Relationen zwischen Kopf einer Nominalphrase und ihres Modifikators zu verbessern. Das geschieht durch Integration von Bilddaten aus ImageNet. Zum Beispiel ist QUALITY die semantische Relation für "brick house". Durch Integration von Bild-Features für "brick" und "house" in das semantische Model will ich die Performance des Systems verbessern. Bild-Features werden über die SIFT-Implementierung des OpenCV-Frameworks extrahiert. Das Projekt ist in C++ und Python implementiert.

Diese Hausarbeit entstand für den Kurs "Distributionelle Semantik jenseits der Wortbedeutung". Der multimodale Ansatz ist inspiriert durch Präsentation aus dem Seminar "Multimodale Semantik".

Ressourcen

Twitter Sentiment Analysis 2013

Die Überwachung und Beobachtung sozialer Medien wie Twitter ist ein wichtiger Forschungsbereich geworden. Anwendungen umfassen Reputationsmonitoring für Unternehmen bis hin zur Früherkennung von Erdbeben.

In diesem Projekt erweitern wir bestehende Ansätze zur Sentiment-Analyse auf die deutsche Sprache mit dem Ziel, die Polarität des Sentiments von deutschen Tweets in positiv, negativ oder neutral zu klassifizieren. Ein grundlegender Anwendungsfall wäre die Überwachung der Stimmung bezüglich trending topics wie #tatort.

Dieses Projekt ist noch nicht abgeschlossen. Bearbeitet wird es von Tilman Wittl und mir als Hausarbeit für den Kurs "Text Mining".

Ressourcen

Distributed Web Crawler 2012

Ein verteilter Crawler und Indizierer für das Web, geschrieben in Hadoop. Ausgehend von einer initialen Liste von Websites vergrößert der Crawler iterativ seinen Index. Ein boolsches Abfragemodell wird unterstützt.

Dieses Projekt entstand als Hausarbeit für den Kurs "Advanced Programming".

Ressourcen

GIVE-2: Natural Language Generation in Virtual Environments 2010

Ziel der GIVE-2-Challenge ist die Erzeugung von Navigationsanweisungen in einer virtuellen 3D-Umgebung, die den Benutzer zu einer versteckten Trophäe lotsen. Die Anweisungen werden in natürlicher Sprache ausgehend von einem abstrakten Plan des GIVE-Frameworks erzeugt.

Dieses Projekt wurde erarbeitet von Eric Hildebrand, Elftherios Matios und mir als Hausarbeit für den Kurs "Natural Language Generation for Virtual Environments".

Ressourcen

RECIPE: Recipe Event Chain Imperative Processing Engine 2010

Geschichten und Erzählungen enthalten Ketten von Ereignissen. Das RECIPE-Projekt extrahiert häufige Ereignisketten aus Kochrezepten ausgehend von einer Logik-Repräsentation der Instruktionen.

Dieses Projekt wurde als Softwareprojekt von Hiko Schamoni, Tilman Wittl, Britta Zeller und mir erarbeitet. Das Softwareprojekt ist Bestandteil des Curriculums B.A Computerlinguistik an der Universität Heidelberg.

Ressourcen

Software

Leechi 2012

Leechi ist eine kleine Bibliothek für Python. Ziel ist, automatische Downloads von Webservern so zu gestalten, dass nicht zu viel Last erzeugt wird. So wird unnötige Erregung von Aufmerksamkeit vermieden.

Leechi wurde im Rahmen meiner Arbeit am Forschungsdaten Service Center entwickelt.

Ressources

Tutorials

Screen Scraping & BeautifulSoup 2013

Ich habe eine Präsentation zum Thema Informationsextraktion aus Websites mit Python und BeautifulSoup gegeben. Die Präsentation entstand im Rahmen meiner Arbeit am Forschungsdaten Service Center.

Folien und Quelltext sind verfügbar.

Ressourcen

Valid CSS! HTML5 Powered

social