1
2
您可以使用簇质心和标签索引到簇质心中,以获得每个示例所表示的内容。然后可以分别计算每个示例的失真。回想一下,K-Means聚类结果的失真或惯性只是示例与其对应的代表质心之间的平方差之和。要计算各个畸变值,只需找到每个示例的代表性质心,然后找到组件的平方差之和。总失真是所有这些值的总和。 因此:
第一行代码访问已安装的K-means模型的群集中心。第二行代码使用拟合结果输出的标签获取每个示例的代表性质心。对于最后一行,您可以通过将输入的每一行或示例与其代表的质心分量相减,将每个元素平方,然后沿每一行求和来计算失真。 可以方便地在一行中执行此操作,而不需要临时变量:
现在,这将为您提供每个示例的计算失真。具体而言,
要进行验证,可以检查
作为一个可复制的示例:
请注意,值的尾端有一些细微的差异,这是由于数值精度的原因,但您可以确信,我们已经分别计算了每个示例的失真。 一旦有了扭曲的数组,就可以在数据帧中添加一个额外的列来表示这些扭曲,并且可以根据需要定位哪一行的扭曲最大或最小。 |
Alexander · 分组数据中的kmeans聚类 6 年前 |
Behzad · K-均值聚类R-树boost 6 年前 |
Sir1 · 考虑中心顺序的kmean结果中重新标记样本 7 年前 |
havakok · 二次MATLAB主元分析中新点的投影 7 年前 |
Laurent Magon · 如何找到k均值聚类的数值区间? 7 年前 |