代码之家  ›  专栏  ›  技术社区  ›  bluesummers

海伯恩的箱状胡须意味着

  •  0
  • bluesummers  · 技术社区  · 6 年前

    我在和 seaborn 的方框图,而我似乎无法在默认设置中计算出胡须的位置。

    看着 seaborn.boxplot docs 我看到了 whis=1.5 我想这意味着胡须 UPPER_QUARTILE + IQR*1.5 LOWER_QUARTILE - IQR*1.5 .

    但即使是在文档中,观察胡须,我们也可以看到它们与上/下四分位数有不同的间隙长度

    docs

    很容易看出盒子两边到胡须的长度不相等,所以我的假设显然是错误的。

    那么,默认的胡须是如何放置的呢?或者我不明白盒子情节的本质?

    1 回复  |  直到 6 年前
        1
  •  1
  •   andrew_reece    6 年前

    IIRC,晶须延伸到最低(最高)数据点,仍然在较低(较高)四分位数的1.5 IQR范围内。因此,根据数据点的实际位置,两边的胡须长度不一定相同。

    Matplotlib文件 docs 对于 whis 论证 boxplot() (西伯恩建在上面)似乎证实了这一点:

    whis:float、sequence或string(默认值为1.5) 作为一个浮子,确定晶须到达第一和第三个四分位之外的距离。换句话说,如果IQR是四分位范围(Q3-Q1),则上部晶须将延伸到小于Q3+whis*IQR的最后一个基准。同样,较低的晶须将延伸到大于Q1-whis*IQR的第一个基准。在晶须之外,数据被视为异常值,并被绘制为单独的点。