代码之家  ›  专栏  ›  技术社区  ›  Sharedobe

计算一个样本中某一比例的置信区间

  •  0
  • Sharedobe  · 技术社区  · 6 年前

    当样本量很小,甚至样本量为1时,计算某一比例的置信区间(CI)的更好方法是什么?

    我目前正在计算一个样本中某个比例的CI/: enter image description here

    但是,我的样本量很小,有时甚至是1。我也试过了 enter image description here

    具体来说,我试图实现这两个公式来计算比例的CI。如下图所示,在2018-Q1,蓝色组没有CI,因为在2018-Q1有1/1的ppl选择该项目。如果使用有限总体校正(FPC),则当N为1时,它不会校正CI。

    enter image description here

    • 如果您能用python提供一个包来计算它,那会很好吗?谢谢!
    1 回复  |  直到 6 年前
        1
  •  1
  •   Kelvin    6 年前

    尝试 statsmodels.stats.property.property懔

    http://www.statsmodels.org/devel/generated/statsmodels.stats.proportion.proportion_confint.html

    根据他们的文档,您可以这样使用它:

    ci_low, ci_upp = proportion_confint(count, nobs, alpha=0.05, method='normal')
    

    其中参数为:

    • count(int或array_-array_like)成功数,可以是pandas系列或DataFrame
    • α(浮动(0,1))显著性水平,默认为0.05
    • 方法(['normal']中的字符串)用于置信区间的方法,当前可用的方法:

      • 阿格雷斯蒂库尔:阿格雷斯蒂库尔间隔
      • 贝塔:基于贝塔分布的氯珀-皮尔逊区间
      • 威尔逊:威尔逊分数区间
      • 杰弗里斯:杰弗里斯贝叶斯区间
      • binom_检验:实验,binom_检验的反演