代码之家  ›  专栏  ›  技术社区  ›  Denver Dang

通过自举的置信区间

  •  0
  • Denver Dang  · 技术社区  · 6 年前

    基本上,我观察到的数据是二进制数据,所以1或0。正是从这些数据(放入一个有三个参数的模型中),我试图估计参数值。

    假设我的组群是500,我从我的组群中取一个样本,可能是100,然后再把样本乘以5倍,再把它扩大到500,然后再运行一次模拟,这会产生一些新的参数估计,然后再做1000-2000次,得到一系列的参数值,然后可以使用哪个来定义CI?

    还是我在这里遗漏了什么?

    1 回复  |  直到 4 年前
        1
  •  3
  •   Denziloe    6 年前

    这个问题与Python无关。我想你需要读一篇引导的介绍。”《统计学习导论》提供了一个很好的例子。我们的想法不是抽样100个——你必须抽样 替换 拿着 相同样本大小 (500). 是的,然后多次重新估计参数。然后有几种方法可以把所有这些估计值转换成一个置信区间。例如,可以使用它们来估计标准误差(采样分布的标准偏差),然后使用+/-2*se。