Clustering & Classification
Clustering, also das unüberwachte Kategorisieren von Daten, ist ein Prozess, der in vielen Bereichen der Informatik Anwendung findet - die reine Datenanalyse ist dabei nur der offensichtlichste. Viele verschiedene Klassen von Clusteringalgorithmen existieren heutzutage, die alle mehr oder weniger gut auf verschiedenen Arten von Daten funktionieren. Das Verständnis, was ein Cluster eigentlich ist, unterscheidet sich dabei von einem zum anderen Verfahren teilweise ebenso deutlich wie die Menge und Art von Vorwissen über die Daten, die als Parameter an den jeweiligen Algorithmus übergeben werden müssen.

Klassifikation hingegen ist ein Teilbereich der intelligenten Datenanalyse, bei dem das Ziel ist, anhand von Trainingsbeispielen ein Modell zu erlernen. Solch ein Modell soll dann in der Lage sein, neue und unbekannte Objekte korrekt in die bekannten Klassen einzuordnen. Hierfür existieren viele verschiedene Verfahren, die Strukturinformationen aus den vorhandenen Daten unterschiedlich ausnutzen, um zu einem Ergebnis zu kommen.

In diesem Seminar sollen in der Gruppe verschiedene Clustering- und Klassifikationsalgorithmen erarbeitet und beschrieben werden, sowie anhand von Beispielen Stärken und Schwächen der Algorithmen aufgezeigt werden. Dabei werden wir versuchen sowohl auf verschiedene Arten von Daten (statische, dynamische, ... ) einzugehen sowie verschiedene Klassen von Clustering (prototypenbasiert, probabilistisch, dichtebasiert, hierarchisch, ...) und Klassifikationsalgorithmen (überwacht, teilüberwacht, ...) vorzustellen.
Lecturer:
Dr. Christian Braune
Additional Information:
> Lecture website <