代码之家  ›  专栏  ›  技术社区  ›  patrick

了解Scikit Learn中桦树集群的设置

  •  1
  • patrick  · 技术社区  · 8 年前

    我正在测试 Birch clustering 在Scikit-Learn中实现的算法。我对手册中的一句话有点困惑;关于参数 n_clusters ,它声明

    n_clusters : int, instance of sklearn.cluster model, default None
    

    另一方面,算法的初始描述如下:

    class sklearn.cluster.Birch(阈值=0.5,branching_factor=50, n个簇=3 ,compute_labels=True,copy=True)

    我会这么认为的 n簇 默认设置为 3. 没有一个 这也是我运行它时它似乎在做的事情。

    我读错了吗?这背后的逻辑是什么?

    (我想,我不能百分之百地确定这个设置实际上做了什么也无济于事;我理解它是将一种额外的精细聚类应用到Birch方法的结果中。)

    非常感谢您的帮助!

    1 回复  |  直到 8 年前
        1
  •  1
  •   Community CDub    4 年前

    是的,你是对的。默认值应为3而不是None。

    什么时候 n_clusters = integer ,模型拟合变为 Agglomerative Clustering 谁的 n_clusters 设置为该值 integer .

    什么时候 n_clusters = None 则不会执行进一步的聚类步骤,子聚类将按以前的方式返回。

    See #6635 github issue