Der k-Means-Algorithmus ist im WIkipedia so beschrieben: “Ein k-Means-Algorithmus ist ein Verfahren zur Vektorquantisierung, das auch zur Clusteranalyse verwendet wird. Dabei wird aus einer Menge von ähnlichen Objekten eine vorher bekannte Anzahl von k Gruppen gebildet. Der Algorithmus ist eine der am häufigsten verwendeten Techniken zur Gruppierung von Objekten, da er schnell die Zentren der Cluster findet. Dabei bevorzugt der Algorithmus Gruppen mit geringer Varianz und ähnlicher Größe.” [1]. Etwas anschaulicher erklärt es David Thol auf Youtube [2].
Ich habe es mal in QGIS getestet:
- Ausgangsgeometrie ist die Stadtgrenze von Halle (Saale).
- 10000 Zufallspunkte innerhalb der Stadtgrenze erzeugt,
- “k-mean” in der Toolbox gesucht und
- mit diesem Werkzeug je einmal 10 Cluster und 100 Cluster berechnen lassen und nach der CLUSTER-ID symbolisiert.
[1] … https://de.wikipedia.org/wiki/K-Means-Algorithmus
[2] … https://www.youtube.com/watch?v=AQ1nAiaYBIc