代码之家 › 专栏 › 技术社区 › Jack Armstrong

基于clvalid函数的模糊c-均值聚类

fuzzy cluster-analysis

Jack Armstrong · 技术社区 · 6 年前

我正在使用clvalid包中的函数clvalid,并使用 fanny 争论。

intvalid <- clValid(clust, 2:10, clMethods=c("fanny"),
            validation="internal", metric='euclidean', maxitems = 1000)

但是,我想用 SqEuclidean ,因此使用模糊c均值聚类而不是模糊聚类。我知道 屁股 clvalid中的算法来自群集包。我知道只有三种选择是欧几里德、相关和曼哈顿,因此没有办法将距离设置为 SqEuclidean.

如何使用模糊c-均值聚类执行clvalid?或者我误解了 metric clvalid中fanny函数的参数?

指定用于计算观测值之间差异的度量的字符串。选项有“euclidean”(默认)、“manhattan”和“sqeuclidean”。欧几里德距离是差平方根和,曼哈顿距离是绝对差平方和,而“sqeucliden”,平方欧几里德距离是差平方和。使用最后一个选项相当于(但有点慢)计算所谓的模糊c-均值。如果x已经是一个不同的矩阵,那么这个参数将被忽略。

数据

library(dplyr)
library(cluster)
library(clValid)
df<-iris[,-5] # I do not use iris, but to make reproducible
clust<-sapply(df,scale)

0 回复 | 直到 6 年前

推荐文章

Mike Williamson · 将Python kmodes集群模型保存到磁盘的方法?

6 年前

psysky · 将属于集群的观察结果保留在R中

6 年前

Annalix · 如何在应用DBSCAN之前将时间戳、数据时间转换为数字

7 年前

Papea · 标称、序数和度量数据的聚类分析

7 年前

Pedro Pereira da Silva · KeyError:“['Value''标志']不在索引中”

7 年前

Vitaly Galaychuk · 图像搜索引擎中基于聚类的颜色特征提取

7 年前

user2205916 · PySpark ML:获取KMeans集群统计信息

7 年前

Ram · 使用Spark的集群中的“java.lang.NullPointerException”

7 年前

Earl. Fojas · K-Medoid(PAM)算法的缺点

7 年前

Srikar Murali · 从另一个数据帧向数据帧添加行

7 年前