![]() |
1
2
http://en.wikipedia.org/wiki/Word_wrap )使不良分数之和最小化。badness函数将允许您在最小化集群数量(较大的常量项)和平衡集群数量(偏离平均项目数的惩罚较大)之间进行权衡。 |
![]() |
2
1
你的问题没有明确说明。 问题是您试图优化结果数据的两个不同属性,而这些属性可能相互对立。对于给定的一组数据,可能是最均匀的分布有许多簇,而最小数目的簇具有非常不均匀的分布。
最均匀分布为[([a],1),([b],1),([c],1),([d],1),([e],1)] 但最小的团簇数是[([a,b],2),([c,d],2),([e],1)] 一个算法应该如何知道你想要哪一个(或者它们之间的哪一个聚类)?你得想办法 您愿意接受的集群数量和分布均匀性之间的权衡。
编辑: 此外,“均匀度”本身并不是一个明确的概念。您是否希望最大限度地减少聚类间的绝对权重差异,或权重的平均差异,或权重的中位数差异,或权重的标准差? |
![]() |
danial · 如何在多个字符串的每个位置找到最频繁的字符 2 年前 |
![]() |
shekharsabale · 从列表元素捕获子字符串 2 年前 |
![]() |
The Great · 拆分并存储数据帧,但名称基于特定列中的唯一值 2 年前 |
![]() |
Klimt865 · Python中的列表列表 2 年前 |
![]() |
Klimt865 · 在Python中将数组列表转换为列表列表 2 年前 |