Eigenschaften - Clustering nach k-means ist Gauss‘sches Clustering (symmetrische Streuung)
- Aufteilung des Raumes: Voronoi Tesselation
- Mögliche Probleme:
- Lokale Minima (bei schlechter Initialisierung)
- Verzerrung durch Ausreisser
Gaussian Mixtures als Clustering - Clustering wird als Dichteschätzung betrachtet
- Anschreibbar wie Klassifikationsproblem:
- EM-Algorithmus (max. Likelihood):
- Gewichteter Mittelwert, analog zu k-means
Vorteile der GMM - Vorteile:
- Probabilitischer Rahmen
- Zugehörigkeit zu Clustern angebbar (Posterior)
- Ausgeprägtheit von Clustern bestimmbar
- Modellauswahl möglich (anhand der Likelihood) k-means: optimale Anzahl der Clusters nicht leicht bestimmbar
Do'stlaringiz bilan baham: |