Fur eine solche clusteranalytische Untersuchung ist es notwendig, die Modellanpassung zu uberprufen, um zwischen guten und schlechten Clusterlosungen zu unterscheiden. Dies wird ublicherweise mit Mazahlen untersucht, die die Qualitat der Clusterlosung hinsichtlich in Abschnitt 2.2 angeschnittenen Qualitatskriterien evaluieren. Da allerdings die Implementierung des k-Means-Algorithmus in der Predictive Analysis Library bereits auf Basis einer solchen Mazahl die beste Clusterlosung fur ein Spektrum moglicher ks ermittelt, wird gewahrleistet, dass zumindest hinsichtlich der Slight Silhouette die Clusterlosung mit der besten Modellanpassung ausgewahlt wird. In dieser Iteration besitzt die Slight Silhouette der ermittelten Losung fur das ‘beste’ k einen Wert von 0.718, dies bedeutet eine gute Modellanpassung. In Abschnitt 4.1.13 wird detaillierter auf diesen Aspekt eingegangen, da in dem Kontext der richtige Silhouettenkoeffizient dieser Losung berechnet wird, anstelle der angenaherten Slight Silhouette. Eine Reihe moglicher Mazahlen zur internen Gultigkeitsprufung einer Clusterlosung wird von Liu et al. in [Liu et al., 2010] vorgestellt, der im Rahmen der Predictive Analysis Library verwendete Silhouettenkoeffizient ist einer davon.

Abb. 24: Auszug der Werte der Ergebnistabelle #PAL CENTERS TABLE zur Veranschaulichung der Attributsauspragungen der Clusterzentren der ersten Iteration der Clusteranalyse (Screenshot aus der Java-IDE “Eclipse” aus der SAP HANA Modeler Perspective)