Abbildung 26 zeigt eine Reihe verschiedener Parameterkombinationen und die jeweilig daraus resultierende Slight Silhouette der Clusterlosung. Die 2-Cluster-Losung scheint sehr stabil zu sein, da sich nicht nur jedes Mal dieselbe Losung mit einem Optimum von zwei Clustern mit ahnlichen oder gleichen Auspragungen ergibt, sondern sogar die Slight Silhouette nur wenig bis gar nicht voneinander abweicht, was fur eine konsistente Zuordnung der meisten Elementen zu den ermittelten Clustern spricht. Eine Anpassung der Startpunkte bei Verwendung der euklidischen Distanz (in Abbildung 26 mit dem Wert 2 fur DISTANCE TYPE reprasentiert) scheint keinerlei Ein uss zu haben, da jedes Mal exakt derselbe Wert fur die Slight Silhouette der Losung ermittelt wird. Dies hangt vermutlich mit der Kombination der Anzahl an Iterationen und des Schwellenwerts zum vorzeitigen Abbruch der Iterationen zusammen. Diese scheinen zu so vielen Iterationen zu fuhren, dass am Ende des Algorithmus immer dieselben Elemente denselben Clustern zugeordnet werden. Auch eine testweise Erhohung beider Parameter zugunsten der Prazision (Erhohung der Iterationen von 10000 auf 100000 und Verringerung des Schwellenwertes auf 0.00000001) bringt keinen Unterschied mehr. Die Nutzung eines anderen, in Abschnitt 4.1.6 als ungeeignet identifizierten,

Abb. 26: Verschiedene Parameterkombinationen fur die erste Iteration der Clusteranalyse und die daraus resultierenden Werte der Slight Silhouette der jeweiligen Clusterlosung

Distanzmaes verandert das Ergebnis ebenfalls nicht signifikant. Bei der Nutzung der Manhattan-Distanz ergibt sich ein ahnliches Bild, die Clusterlosung resultiert ebenfalls in zwei Clustern und einer Slight Silhouette, die sich bei einem Wert zwischen 0.7 und 0.8 befindet. Bei der Nutzung dieser Distanz macht die Auswahl der Startpunkte zumindest einen kleinen Unterschied, was mit der erwahnten Qualitat der Distanzmae zusammenhangen kann17. Bei Nutzung der Minkowski-Distanz befindet sich die Slight Silhouette im selben Bereich und andert sich auch nicht durch eine andere Initialisierungsmethode der Startpunkte fur die Cluster. Da die unterschiedlichen Initialisierungsmethoden der Startpunkte jedoch teils auf einer zufalligen Auswahl basieren, ist es notwendig, hier mehrere Durchfuhrungen der Analyse durchzufuhren, um zu uberprufen, ob unterschiedliche Startpunkte zur selben Clusterlosung fuhren. Im Rahmen dieser Untersuchung wird jedes Mal, wenn nicht anders angegeben, die Durchfuhrung mit einem Parametersatz mehrmals durchgefuhrt. Falls die Werte innerhalb verschiedener Durchfuhrungen nennenswerte Unterschiede aufweisen, wird dies angemerkt, anderenfalls kann davon ausgegangen werden, dass die Werte stabil waren. Wird zu Kontrollzwecken mit den definierten Variablen und Parametern dieser Analyse fur k = 3 durchgefuhrt, ergibt sich erwartungsgema ein niedrigerer Slight Silhouette-Wert von 0.55, fur k = 4 ein Wert von 0.44 und fur k = 5 ein Wert von 0.35. Die Entscheidung wird von der PAL-Implementierung korrekt getroffen, denn die Slight Silhouette der der Clusterlosung scheint mit steigendem k zu sinken.Auch wenn das Spektrum moglicher ks bei selben Parametern auf bis zu 50 erhoht wird, stellt sich die 2-Cluster-Losung als die beste Losung heraus. Dementsprechend scheint diese Losung trotz inhaltlicher Unzulanglichkeit ziemlich stabil zu sein.